來源:@華夏時報微博
華夏時報記者 石飛月 北京報道
訓練和推理是AI大模型的兩個核心能力,如果說2023年廠商們都在訓練模型上競技,那麽近幾個月,大模型已經進入推理模型的比拚階段。1月15日和1月16日,與階躍星辰前後腳推出其推理模型,不久前,月之暗麵、DeepSeek和智譜AI也紛紛上線了自家的推理模型。
毫無疑問,大模型賽道的領跑者仍然是OpenAI,無論語言大模型、文生視頻模型還是推理模型,該公司都走在最前沿,值得慶幸的是,業內人士指出,雖然美國對華在AI芯片出口上的限製力度越來越大,國產廠商已經慢慢摸索到了更加節省算力的方式,並將大模型進行商業化變現。以科大訊飛為例,該公司一直走全國產化路線,2024年中標金額和中標數量均位列國內第一。
推理模型紮堆上線
科大訊飛這次推出的是訊飛星火深度推理模型X1,這一模型已落地教育、醫療等多個真實場景。科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現,訊飛星火X1不僅給出了這些題目的準確答案,還對解題思路和步驟進行了詳細拆解。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。
階躍星辰自研的推理模型Step Reasoner mini,是該公司Step係列模型家族的首個推理模型,擅長主動進行規劃、嚐試和反思,能通過慢思考和反複驗證的邏輯機製,為用戶提供準確可靠的回複。它既擅長通過超長推理能力,解決邏輯推理、代碼和數學等複雜問題,也能兼顧文學創作等通用領域。
自從ChatGPT在全球火出圈,國內AI廠商便沒有停止追趕OpenAI的步伐,一開始是對標GPT大語言模型,之後是視頻模型Sora,去年9月OpenAI推出旗下首款具備“推理”能力模型o1,這些AI廠商又有了新目標。
有幾家廠商的速度更快。去年11月,月之暗麵上線了趨近OpenAI o1係列水平的新一代數學推理模型k0-math,以及引入搜索意圖增強、信源分析和鏈式思考三大推理能力的全新Kimi探索版;同樣在去年11月,DeepSeek研發的推理模型 DeepSeek-R1-Lite 預覽版正式上線;2024年的最後一天,智譜AI發布了該公司首個基於擴展強化學習技術訓練的推理模型,即GLM-Zero的初代版本GLM-Zero-Preview,該模型擅長處理數理邏輯、代碼和需要深度推理的複雜問題。
什麽是推理模型?“在大模型的發展過程中,推理模型就像大腦的邏輯思維部分,是體現智商水平的。它能讓大模型更聰明地解決問題,更好地服務實際應用,還幫助企業提升競爭力,是大模型走向高級智能的重要一步。” 深度科技研究院院長張孝榮對《華夏時報》記者表示。
在文淵智庫創始人王超看來,從近期國產廠商的發布情況來看,中國的追趕速度是非常快的,即便美國持續加大對華在AI芯片上的限製力度,英偉達對華供應的改良芯片性能和速率也有所下降。“我們已經找到了一條新的路子,不用太多芯片,不需要堆積特別多的算力,也能達到類似的效果。當然在最尖端的模型上,我們與國際領先水平還有一定的差距,但這不是問題。”
不過國產廠商接下來還要繼續努力,去年12月,OpenAI已經發布了新一代推理模型o3。OpenAI表示,o3模型在某些條件下可以接近實現通用人工智能(AGI),即能完成人類所能完成的任何任務的人工智能。
大模型變現能力增強
在這些發布了推理模型的中國AI廠商中,科大訊飛並不是最早的,其特別之處在於,訊飛星火X1是國內首個基於全國產算力平台訓練的具備深度思考和推理能力的大模型。
科大訊飛一直走全國產化路線,與華為深度合作:2023年10月,雙方聯合發布首個國產萬卡算力集群“飛星一號”;一年後,科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平台“飛星二號”正式啟動。在此基礎上,訊飛星火4.0Turbo底座能力也再次迎來升級,圖文、數學和長文本能力顯著提升,並首發混域知識搜索技術,進一步解決行業、企業痛點。
此外,科大訊飛還推出了業界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型,最快語音同傳時延小於5秒。運用AI輸入能力,科大訊飛“蹭”了一下這幾天小紅書“收留TikTok難民”的熱度。1月16日,科大訊飛表示,用訊飛輸入法可以實現一鍵發送中英雙語文案、中文語音輸入一鍵轉英文等功能,方便中外網友無障礙溝通。
自2023年5月星火認知大模型麵世以來,科大訊飛一直保持著穩定的更新節奏:2023年6月,星火認知大模型升級到了1.5版本;2023年8月升至2.0版本;2023年10月帶來對標ChatGPT的星火認知大模型V3.0;一年前發布訊飛星火V3.5,多項能力直接對標GPT-4;去年6月,訊飛星火大模型V4.0正式發布,七大核心能力可全麵對標GPT-4 Turbo;去年10月推出訊飛星火大模型4.0 Turbo,多項能力的比較對象已經是GPT-4o,甚至開始預測追趕o1水平的時間。
在大模型上的投入和迭代,以及具備的國產算力優勢,讓科大訊飛在B端市場越來越吃香。據科大訊飛去年三季報披露的信息,該公司成為去年上半年大模型中標數最多的市場化玩家,且8月單月中標金額突破1.5億元,行業排名第一。科大訊飛董秘幾天前還透露,該公司2024年已成為當前央國企大模型的第一選擇,中標金額和中標數量均位列第一。
這些項目為科大訊飛帶來不錯的收益。科大訊飛公布的2024年三季度財報顯示,營收為55.25億元,同比增長15.77%;歸母淨利潤為5696萬元,同比增長120.87%。至於四季度的業績情況,科大訊飛回應《華夏時報》記者稱:“按照往年的財報規律,公司營收和經營性現金流在第四季度的表現最好。”
責任編輯:黃興利 主編:寒豐
本文由隔壁老李于2022-12-21发表在极致时空,如有疑问,请联系我们。
本文链接:http://www.bibition.icu/Z3dw1j/802.html
有话要说...