DeepSeek V3.1再更新：緩解中英文混雜，智能體輸出更穩(wěn)定

澎湃新聞記者范佳來

2025-09-23 10:25

來源：澎湃新聞

? 10%公司 >

聽全文

DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。

9月22日晚間，據(jù)DeepSeek介紹，此次更新在保持模型原有能力的基礎(chǔ)上，針對用戶反饋的問題進行了改進，包括：語言一致性：緩解中英文混雜、偶發(fā)異常字符等情況。在Agent（智能體）能力方面，進一步優(yōu)化Code Agent與Search Agent的表現(xiàn)，DeepSeek-V3.1-Terminus的輸出效果相比前一版本更加穩(wěn)定。

目前，官方App、網(wǎng)頁端、小程序與DeepSeek API模型均已同步更新為DeepSeek-V3.1-Terminus。不過，記者看到這款大模型名為Terminus，意思是“終極版”，或許這也是V3.1最后一次更新。外界觀望下一次大版本更新到底是V4還是R2的到來。

在公開的基準測試成績中，V3.1-Terminus整體較V3.1有所提升，不過其中部分分數(shù)也有下滑，不過在“人類最后考試”（Humanity’s Last Exam）基準上進步較為突出，分數(shù)從 15.9大幅提升至21.7，根據(jù)官網(wǎng)數(shù)據(jù)，這一成績僅次于 Grok 4（25.4）和GPT-5（25.3），并略微超越 Gemini 2.5 Pro（21.6）。

值得注意的是，DeepSeek在中英文混雜方面的改進尤為受到歡迎。澎湃新聞記者在社交媒體上看到，不少用戶點贊：“中英文混雜問題在思考時間很長的時候確實會出現(xiàn)，遇到過幾次，還在想這是什么問題，這下子正好給解決了。”

資深A(yù)I投資人郭濤向澎湃新聞記者分析稱，本次DeepSeek-V3.1-Terminus版本更新聚焦工程化落地與場景適配，核心突破體現(xiàn)在兩大核心競爭提升：一方面，通過語義層降噪技術(shù)顯著改善語言一致性，有效抑制中英文混雜、異常字符等干擾，提升文本生成純凈度；另一方面，深度重構(gòu)Agent執(zhí)行框架，針對Code Agent的語法解析精度、Search Agent的信息檢索召回率進行專項優(yōu)化，使智能體輸出穩(wěn)定性提升。

此次全渠道（App/網(wǎng)頁/小程序/API）同步升級，展現(xiàn)國產(chǎn)大模型從算法創(chuàng)新向工程可靠性演進的關(guān)鍵跨越，標志著國產(chǎn)模型在復(fù)雜任務(wù)處理、多模態(tài)協(xié)同等工業(yè)化應(yīng)用層面邁出重要一步，為后續(xù)垂直領(lǐng)域深度賦能奠定更堅實基礎(chǔ)。

作為國產(chǎn)大模型的風向標，DeepSeek的動態(tài)都廣泛被外界關(guān)注。

此前9月18日，梁文鋒帶著DeepSeek-R1的研究，登上最新一期國際頂級期刊《自然》（Nature）封面。

今年1月份，國產(chǎn)大模型公司深度求索（DeepSeek）在預(yù)印本平臺arxiv公布論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》，創(chuàng)始人梁文鋒位于署名之列。

《自然》雜志指出，如此總結(jié)DeepSeek-R1帶來的進步：如果訓(xùn)練出的大模型能夠規(guī)劃解決問題所需的步驟，那么它們往往能夠更好地解決問題。這種“推理”與人類處理更復(fù)雜問題的方式類似，但這對人工智能有極大挑戰(zhàn)，需要人工干預(yù)來添加標簽和注釋。

DeepSeek的研究人員揭示了他們?nèi)绾文軌蛟跇O少的人工輸入下訓(xùn)練一個模型，并使其進行推理。DeepSeek-R1模型采用強化學習進行訓(xùn)練。在這種學習中，模型正確解答數(shù)學問題時會獲得高分獎勵，答錯則會受到懲罰。

DeepSeek團隊也首次對外回應(yīng)“蒸餾”相關(guān)質(zhì)疑。論文中表示，對于深度求索V3基礎(chǔ)版（DeepSeek-V3-Base）的訓(xùn)練數(shù)據(jù)僅使用普通網(wǎng)頁和電子書，未納入任何合成數(shù)據(jù)，“不過，我們注意到部分網(wǎng)頁包含大量由OpenAI模型生成的答案，這可能會讓基礎(chǔ)模型間接地從其他強大模型獲取知識。但在預(yù)訓(xùn)練冷卻階段，我們并未刻意加入由OpenAI生成的合成數(shù)據(jù)；該階段使用的所有數(shù)據(jù)都是通過網(wǎng)絡(luò)爬取自然獲取的。預(yù)訓(xùn)練數(shù)據(jù)集包含大量與數(shù)學和代碼相關(guān)的內(nèi)容，這表明深度求索V3基礎(chǔ)版接觸到大量的推理軌跡數(shù)據(jù)?！?/p>

今年1月20日，中國AI初創(chuàng)公司深度求索（DeepSeek）推出大模型DeepSeek-R1引爆AI行業(yè)，作為一款開源模型，R1在數(shù)學、代碼、自然語言推理等任務(wù)上的性能能夠比肩OpenAIo1模型正式版，并采用MIT許可協(xié)議，支持免費商用、任意修改和衍生開發(fā)等。春節(jié)假期后，國內(nèi)多個行業(yè)龍頭公司均宣布接入DeepSeek。

伴隨AI大模型行業(yè)的日新月異，DeepSeek已經(jīng)更新出R1以外的新版本，但萬眾期待的R2尚未面世。此前8月21日DeepSeek正式發(fā)布DeepSeek-V3.1，稱其為“邁向Agent（智能體）時代的第一步”。

責任編輯：孫扶

圖片編輯：樂浴峰

澎湃新聞報料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報

#DeepSeeK #大模型 #更新