- +1
DeepSeek V3.1再更新:緩解中英文混雜,智能體輸出更穩(wěn)定
DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。
9月22日晚間,據(jù)DeepSeek介紹,此次更新在保持模型原有能力的基礎(chǔ)上,針對(duì)用戶反饋的問題進(jìn)行了改進(jìn),包括:語言一致性:緩解中英文混雜、偶發(fā)異常字符等情況。在Agent(智能體)能力方面,進(jìn)一步優(yōu)化Code Agent與Search Agent的表現(xiàn),DeepSeek-V3.1-Terminus的輸出效果相比前一版本更加穩(wěn)定。
目前,官方App、網(wǎng)頁端、小程序與DeepSeek API模型均已同步更新為DeepSeek-V3.1-Terminus。不過,記者看到這款大模型名為Terminus,意思是“終極版”,或許這也是V3.1最后一次更新。外界觀望下一次大版本更新到底是V4還是R2的到來。

在公開的基準(zhǔn)測(cè)試成績(jī)中,V3.1-Terminus整體較V3.1有所提升,不過其中部分分?jǐn)?shù)也有下滑,不過在“人類最后考試”(Humanity’s Last Exam)基準(zhǔn)上進(jìn)步較為突出,分?jǐn)?shù)從 15.9大幅提升至21.7,根據(jù)官網(wǎng)數(shù)據(jù),這一成績(jī)僅次于 Grok 4(25.4)和GPT-5(25.3),并略微超越 Gemini 2.5 Pro(21.6)。
值得注意的是,DeepSeek在中英文混雜方面的改進(jìn)尤為受到歡迎。澎湃新聞?dòng)浾咴谏缃幻襟w上看到,不少用戶點(diǎn)贊:“中英文混雜問題在思考時(shí)間很長(zhǎng)的時(shí)候確實(shí)會(huì)出現(xiàn),遇到過幾次,還在想這是什么問題,這下子正好給解決了?!?/p>
資深A(yù)I投資人郭濤向澎湃新聞?dòng)浾叻治龇Q,本次DeepSeek-V3.1-Terminus版本更新聚焦工程化落地與場(chǎng)景適配,核心突破體現(xiàn)在兩大核心競(jìng)爭(zhēng)提升:一方面,通過語義層降噪技術(shù)顯著改善語言一致性,有效抑制中英文混雜、異常字符等干擾,提升文本生成純凈度;另一方面,深度重構(gòu)Agent執(zhí)行框架,針對(duì)Code Agent的語法解析精度、Search Agent的信息檢索召回率進(jìn)行專項(xiàng)優(yōu)化,使智能體輸出穩(wěn)定性提升。
此次全渠道(App/網(wǎng)頁/小程序/API)同步升級(jí),展現(xiàn)國產(chǎn)大模型從算法創(chuàng)新向工程可靠性演進(jìn)的關(guān)鍵跨越,標(biāo)志著國產(chǎn)模型在復(fù)雜任務(wù)處理、多模態(tài)協(xié)同等工業(yè)化應(yīng)用層面邁出重要一步,為后續(xù)垂直領(lǐng)域深度賦能奠定更堅(jiān)實(shí)基礎(chǔ)。
作為國產(chǎn)大模型的風(fēng)向標(biāo),DeepSeek的動(dòng)態(tài)都廣泛被外界關(guān)注。
此前9月18日,梁文鋒帶著DeepSeek-R1的研究,登上最新一期國際頂級(jí)期刊《自然》(Nature)封面。
今年1月份,國產(chǎn)大模型公司深度求索(DeepSeek)在預(yù)印本平臺(tái)arxiv公布論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,創(chuàng)始人梁文鋒位于署名之列。
《自然》雜志指出,如此總結(jié)DeepSeek-R1帶來的進(jìn)步:如果訓(xùn)練出的大模型能夠規(guī)劃解決問題所需的步驟,那么它們往往能夠更好地解決問題。這種“推理”與人類處理更復(fù)雜問題的方式類似,但這對(duì)人工智能有極大挑戰(zhàn),需要人工干預(yù)來添加標(biāo)簽和注釋。
DeepSeek的研究人員揭示了他們?nèi)绾文軌蛟跇O少的人工輸入下訓(xùn)練一個(gè)模型,并使其進(jìn)行推理。DeepSeek-R1模型采用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練。在這種學(xué)習(xí)中,模型正確解答數(shù)學(xué)問題時(shí)會(huì)獲得高分獎(jiǎng)勵(lì),答錯(cuò)則會(huì)受到懲罰。
DeepSeek團(tuán)隊(duì)也首次對(duì)外回應(yīng)“蒸餾”相關(guān)質(zhì)疑。論文中表示,對(duì)于深度求索V3基礎(chǔ)版(DeepSeek-V3-Base)的訓(xùn)練數(shù)據(jù)僅使用普通網(wǎng)頁和電子書,未納入任何合成數(shù)據(jù),“不過,我們注意到部分網(wǎng)頁包含大量由OpenAI模型生成的答案,這可能會(huì)讓基礎(chǔ)模型間接地從其他強(qiáng)大模型獲取知識(shí)。但在預(yù)訓(xùn)練冷卻階段,我們并未刻意加入由OpenAI生成的合成數(shù)據(jù);該階段使用的所有數(shù)據(jù)都是通過網(wǎng)絡(luò)爬取自然獲取的。預(yù)訓(xùn)練數(shù)據(jù)集包含大量與數(shù)學(xué)和代碼相關(guān)的內(nèi)容,這表明深度求索V3基礎(chǔ)版接觸到大量的推理軌跡數(shù)據(jù)。”
今年1月20日,中國AI初創(chuàng)公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行業(yè),作為一款開源模型,R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能能夠比肩OpenAIo1模型正式版,并采用MIT許可協(xié)議,支持免費(fèi)商用、任意修改和衍生開發(fā)等。春節(jié)假期后,國內(nèi)多個(gè)行業(yè)龍頭公司均宣布接入DeepSeek。
伴隨AI大模型行業(yè)的日新月異,DeepSeek已經(jīng)更新出R1以外的新版本,但萬眾期待的R2尚未面世。此前8月21日DeepSeek正式發(fā)布DeepSeek-V3.1,稱其為“邁向Agent(智能體)時(shí)代的第一步”。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




