- +1
國產(chǎn)大模型迎來“諸神之戰(zhàn)”!智譜、MiniMax、字節(jié)跳動春節(jié)前夕齊“炸街”
春節(jié)將至,國產(chǎn)大模型再次迎來上新熱潮。
2月13日,MiniMax正式上線新一代文本模型MiniMax M2.5,再次引爆春節(jié)前的AI“沖刺賽”,加入這場被業(yè)界稱為“AI諸神之戰(zhàn)”的競爭。
近期,包括智譜、字節(jié)跳動、阿里巴巴等多家科技大廠已經(jīng)推出各自的“王牌產(chǎn)品”,2月12日,智譜正式上線并開源其新一代旗艦?zāi)P虶LM-5,這個新模型正是此前在全球模型服務(wù)平臺OpenRouter登頂熱度榜首、引發(fā)圈內(nèi)瘋狂猜測的神秘模型“Pony Alpha”。
此前字節(jié)跳動旗下AI視頻生成模型Seedance2.0更是憑借多模態(tài)輸入、文本/圖片生成電影級視頻等出色能力引爆網(wǎng)絡(luò),吸引全球關(guān)注。馬斯克轉(zhuǎn)發(fā)評論Seedance 2.0相關(guān)推文,并表示:模型發(fā)展速度太快(It's happening fast),導演賈樟柯在社交平臺發(fā)文表示:“Seedance 2.0確實厲害,我準備用它做個短片?!?/p>
Seedance2.0
2月13日,MiniMax開盤報642港元,漲超9%,年內(nèi)漲幅超56%;智譜報492港元,漲超20%,年內(nèi)漲幅達90%。
MiniMax:輸出速度達到主流模型兩倍
澎湃新聞記者了解到,在編程能力方面,M2.5在權(quán)威榜單SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,較上一代顯著提升;在Multi-SWE-Bench等多語言復雜環(huán)境中超越Opus 4.6,達到行業(yè)最好的水平。更重要的是,模型展現(xiàn)出“原生Spec能力”——在編碼前主動拆解架構(gòu)與功能規(guī)劃,更接近真實架構(gòu)師的工作模式。

工具調(diào)用和搜索能力方面,模型能夠自動處理復雜任務(wù),在BrowseComp、Wide Search等多項Agent任務(wù)中以更低的輪次消耗取得更優(yōu)的效果,相較于上一代模型表現(xiàn)提升20%,達到行業(yè)頂尖水平。
性能之外,M2.5另一核心亮點在于推理速度與成本控制。
M2.5-lightning版本支持100 TPS以上輸出速度,是主流模型的2倍左右;輸入價格約0.3美元/百萬Token,輸出約2.4美元/百萬Token。按每秒輸出100 Token計算,連續(xù)運行一小時成本約1美元;若按50 Token計算,成本約0.3美元。這意味著1萬美元理論上可支持4個Agent連續(xù)工作一年。
M2.5已于2月12日在MiniMax Agent上線,并于13日全球開源支持本地化部署。不到一天,來自全世界的用戶已經(jīng)在MiniMax Agent上構(gòu)建了1萬多個專家,且仍在快速增長。
MiniMax方面向記者表示,希望在持續(xù)提升模型能力的同時,構(gòu)建一個可持續(xù)擴展的生態(tài)——當模型能力、泛化性和成本都不再是瓶頸,Agent滲透到工作和生活的各個角落,從編程、辦公到創(chuàng)作、娛樂,將大幅促進應(yīng)用進一步發(fā)展。
國產(chǎn)大模型節(jié)前集體上新
2月12日,智譜AI正式上線并開源其新一代旗艦?zāi)P虶LM-5。作為“大模型第一股”,智譜迅速引爆了資本市場,2月12日收盤,智譜股價大漲28.68%,創(chuàng)下歷史新高,總市值達到1792億港元,市值較前一日增加400億港元。
據(jù)智譜方面表示,GLM-5 全新基座從355B(激活 32B)擴展至744B(激活 40B),預訓練數(shù)據(jù)從23T提升至28.5T,更大規(guī)模的預訓練算力顯著提升了模型的通用智能水平。

在編程能力上實現(xiàn)對齊Claude Opus 4.5,在業(yè)內(nèi)公認的主流基準測試中取得開源模型SOTA。在SWE-bench-Verified和Terminal Bench 2.0中分別獲得77.8和56.2的開源模型最高分數(shù),性能超過Gemini 3 Pro。
智譜方面向澎湃新聞記者表示,今年大模型將會從“會寫”走到“會做事”,尤其是端到端完成大型任務(wù)。GLM-5相當于“系統(tǒng)架構(gòu)師”,將為AI行業(yè)的發(fā)展提供更大的想象空間。
此外,記者了解到,2月14日,火山引擎將正式發(fā)布豆包大模型2.0。此前,豆包視頻生成模型Seedance 2.0、豆包圖像創(chuàng)作模型Seedream 5.0 Lite已分別開啟內(nèi)測。豆包大模型2.0是字節(jié)跳動最新推出的多模態(tài)Agent模型,也是豆包大模型自2024年5月正式發(fā)布以來首次大版本的跨代升級,在多模態(tài)感知、高精度文字提取、圖表理解、空間理解、運動理解、視覺知識和推理、長視頻理解等方面表現(xiàn)出色。
此外,模型能更好支持對技能(Skills)的理解和應(yīng)用,F(xiàn)unction Call、多輪指令遵循、搜索和工具調(diào)用能力顯著增強,格式輸出更穩(wěn)定,支持靈活的上下文管理,更好地支持企業(yè)級復雜、長程任務(wù),在數(shù)據(jù)分析和客服Agent等企業(yè)場景中表現(xiàn)出色。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




