- +1
大模型春節(jié)檔:Seedance之后,豆包大模型2.0接棒
過(guò)去“春節(jié)檔”屬于電影行業(yè)的黃金時(shí)間窗口,如今大模型廠商也開(kāi)辟了屬于自己的“春節(jié)檔”,成為技術(shù)與產(chǎn)品集中亮相的“發(fā)布季”。
先把時(shí)間撥回到過(guò)去幾天,看看都有哪些發(fā)布內(nèi)容。
2月10日,阿里發(fā)布新一代圖像生成及編輯模型Qwen-Image-2.0,支持1K token的超長(zhǎng)文字輸入和2K高分辨率,是千問(wèn)大模型的圖像生成模型底座。
2月11日,智譜發(fā)布新一代旗艦?zāi)P虶LM-5,被官方定義為“Agentic Engineering時(shí)代最好的模型”。其核心突破在于?編程能力與智能體任務(wù)執(zhí)行能力?,在真實(shí)編程場(chǎng)景中的體驗(yàn)已逼近Claude Opus 4.5,尤其擅長(zhǎng)復(fù)雜系統(tǒng)工程和長(zhǎng)程任務(wù)。
2月12日,字節(jié)跳動(dòng)上線新一代AI視頻生成模型Seedance 2.0,并接入旗下生成式AI創(chuàng)作平臺(tái)“即夢(mèng)”以及豆包App、電腦端和網(wǎng)頁(yè)版。該視頻生成模型支持?原聲音畫(huà)同步、多鏡頭長(zhǎng)敘事和多模態(tài)可控生成?。連埃隆·馬斯克都在社交平臺(tái)X上轉(zhuǎn)發(fā)評(píng)論Seedance 2.0的相關(guān)推文,說(shuō)道:發(fā)展得太快了!
同日,MiniMax正式上線最新旗艦編程模型MiniMax M2.5,定位為“為Agent場(chǎng)景原生設(shè)計(jì)的生產(chǎn)級(jí)模型”,直接對(duì)標(biāo)Claude Opus 4.6。其亮點(diǎn)在于“小而美”,僅10B激活參數(shù)即可支持100 TPS的高吞吐量,在推理能效上優(yōu)勢(shì)顯著。?
2月14日,字節(jié)跳動(dòng)推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0針對(duì)大規(guī)模生產(chǎn)環(huán)境的使用需求進(jìn)行系統(tǒng)性優(yōu)化,旨在更好地完成真實(shí)世界的復(fù)雜任務(wù)。
目前,豆包2.0 Pro已在豆包App、電腦客戶端和網(wǎng)頁(yè)版上線,用戶選擇「專家」模式即可對(duì)話體驗(yàn)?;鹕揭嬉惨焉暇€豆包2.0系列模型API服務(wù)。所謂專家模式,核心是面向具備專業(yè)知識(shí)的用戶群體,減少基礎(chǔ)引導(dǎo)與冗余交互,提供更靈活的操作空間,適配專業(yè)分析、參數(shù)調(diào)試與復(fù)雜任務(wù)場(chǎng)景。
模型能力開(kāi)始逼近真實(shí)任務(wù)門檻
模型能力競(jìng)爭(zhēng)仍然離不開(kāi)基礎(chǔ)指標(biāo),從公開(kāi)測(cè)試成績(jī)看,豆包2.0旗艦版本Pro在數(shù)學(xué)和推理能力方面取得了較高水平。在IMO、CMO數(shù)學(xué)競(jìng)賽以及ICPC編程競(jìng)賽相關(guān)評(píng)測(cè)中達(dá)到金牌成績(jī),并在Putnam基準(zhǔn)測(cè)試中超過(guò)同類模型。
官方數(shù)據(jù)顯示,豆包2.0在長(zhǎng)尾知識(shí)領(lǐng)域進(jìn)行了擴(kuò)展,在SuperGPQA等公開(kāi)測(cè)試集中的科學(xué)領(lǐng)域成績(jī)與主流頂級(jí)模型處于同一水平,在跨學(xué)科知識(shí)應(yīng)用排名中也處于前列。
多模態(tài)能力也是此次升級(jí)的重要部分,視覺(jué)推理、空間感知以及長(zhǎng)上下文理解能力均有所提升,可以處理圖表、復(fù)雜文檔以及視頻內(nèi)容。這類能力在教育、辦公和內(nèi)容生產(chǎn)場(chǎng)景中都有著較高的需求。
模型對(duì)動(dòng)態(tài)環(huán)境的理解能力也有所增強(qiáng),包括時(shí)間序列分析與運(yùn)動(dòng)感知。官方展示的應(yīng)用場(chǎng)景涵蓋實(shí)時(shí)視頻分析、環(huán)境感知以及交互輔助,例如健身指導(dǎo)、穿搭建議和陪伴場(chǎng)景。
測(cè)試數(shù)據(jù)顯示,豆包2.0 Pro在指令遵循、工具調(diào)用以及Search Agent評(píng)測(cè)中達(dá)到較高水平,在HLE-Text測(cè)試中取得54.2分。這類能力關(guān)系到模型在多步驟任務(wù)中的執(zhí)行表現(xiàn)。
大模型能力正在出現(xiàn)一個(gè)明顯轉(zhuǎn)折,早期競(jìng)爭(zhēng)集中在知識(shí)覆蓋與語(yǔ)言流暢度,如今更多廠商開(kāi)始圍繞任務(wù)完成率、穩(wěn)定性與執(zhí)行成本優(yōu)化。
成本下降正在重塑企業(yè)采用曲線
過(guò)去兩年,大模型價(jià)格持續(xù)下降已成為行業(yè)普遍現(xiàn)象,大家也都非常關(guān)心新模型的價(jià)格。
豆包2.0 Pro在32k輸入范圍內(nèi),輸入價(jià)格為3.2元/百萬(wàn)tokens,輸出價(jià)格為16元/百萬(wàn)tokens。Lite版本價(jià)格更低,百萬(wàn)tokens輸入價(jià)格為0.6元,同時(shí)綜合性能已經(jīng)超過(guò)兩個(gè)月前發(fā)布的上一代主力模型豆包1.8。
多家廠商公開(kāi)定價(jià)顯示,相比早期階段,部分模型調(diào)用成本下降數(shù)倍,一些場(chǎng)景的推理費(fèi)用降至早期水平的三分之一甚至更低。價(jià)格變化直接影響企業(yè)采用意愿,也推動(dòng)應(yīng)用規(guī)模擴(kuò)大。
IDC預(yù)測(cè),中國(guó)生成式AI市場(chǎng)規(guī)模預(yù)計(jì)將在2027年達(dá)到約140億美元,2023年至2027年的年復(fù)合增長(zhǎng)率接近70%。企業(yè)級(jí)應(yīng)用被普遍認(rèn)為將占據(jù)主要商業(yè)收入來(lái)源,包括智能客服、營(yíng)銷自動(dòng)化、辦公協(xié)同以及行業(yè)解決方案等方向。
目前,模型更新節(jié)奏明顯加快,能力測(cè)試成績(jī)?nèi)匀恢匾?,但商業(yè)收入、客戶數(shù)量以及成本控制能力越來(lái)越受到重視。能夠證明商業(yè)化路徑的公司,更容易獲得長(zhǎng)期支持。
用戶入口到企業(yè)場(chǎng)景,全都要
去年騰訊元寶宣布接入DeepSeek后,便開(kāi)始在各個(gè)渠道大力宣傳投放廣告,囊括了騰訊系A(chǔ)pp在內(nèi)的所有平臺(tái),當(dāng)時(shí)也讓元寶用戶量級(jí)直接起飛。
相比之下,豆包則主要依賴持續(xù)、分散、可復(fù)制的用戶UGC內(nèi)容擴(kuò)散。例如用豆包批改作業(yè)、識(shí)別寵物、搭配穿搭建議等。與此同時(shí),擬人化名稱與頭像設(shè)計(jì)強(qiáng)化了產(chǎn)品記憶點(diǎn),在用戶心智中逐漸形成穩(wěn)定認(rèn)知。
還有之前初代豆包手機(jī)一上市就迅速售罄,通過(guò)對(duì)話就可以完成所有操作,二手市場(chǎng)一度被炒至3萬(wàn)元以上,但很快微信、支付寶、美團(tuán)、部分銀行App等主流應(yīng)用也開(kāi)始集體反制。
最近,千問(wèn)APP投入30億元啟動(dòng)“AI請(qǐng)客”活動(dòng),每個(gè)注冊(cè)用戶都會(huì)獲得一張價(jià)值25元的無(wú)門檻抵扣券,通過(guò)對(duì)話“幫我點(diǎn)杯奶茶”,就能自動(dòng)匹配店家和產(chǎn)品,不超過(guò)25元即可1分錢下單。當(dāng)日下午4點(diǎn),千問(wèn)APP的AI生成訂單已突破1000萬(wàn)單,千問(wèn)也超越元寶和豆包,登頂蘋(píng)果App Store免費(fèi)榜第一。
臨近春節(jié),春晚合作、紅包活動(dòng)等資源位也成為競(jìng)爭(zhēng)焦點(diǎn),幾家大廠也是紛紛下場(chǎng),流量爭(zhēng)奪戰(zhàn)一觸即發(fā)。
當(dāng)然,未來(lái)的大模型時(shí)代的超級(jí)入口目前還沒(méi)有定論,但是現(xiàn)在各家也是兩手抓,C 端帶來(lái)規(guī)模與數(shù)據(jù),B 端帶來(lái)收入與場(chǎng)景深度,兩條路徑互相支撐。
春節(jié)檔發(fā)布,看似只是時(shí)間節(jié)點(diǎn)的選擇,背后卻展現(xiàn)了模型競(jìng)爭(zhēng)已進(jìn)入第二階段,圍繞真實(shí)世界生產(chǎn)力,并形成穩(wěn)定的商業(yè)價(jià)值。
豆包2.0也落在“執(zhí)行力”這一點(diǎn)上。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




