欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

遠超外界預(yù)期?谷歌最新大模型Gemini 3橫掃各大榜單,馬斯克、奧特曼接連點贊

澎湃新聞記者 胡含嫣
2025-11-19 21:01
來源:澎湃新聞
? 10%公司 >
字號

備受期待的谷歌旗下大模型Gemini 3終于面世,沒有讓人失望。

當(dāng)?shù)貢r間11月18日,谷歌母公司Alphabet正式發(fā)布新一代多模態(tài)AI模型Gemini 3,包括Gemini 3 Pro和增強型推理模式Gemini 3 Deep Think兩個版本,還帶來了全新AI agent(助理)開發(fā)平臺Google Antigravity。

谷歌CEO桑達爾·皮查伊(Sundar Pichai)表示,Gemini 3“具備最先進的推理能力,能夠理解深層次內(nèi)容與細(xì)微差別——無論是感知創(chuàng)意中細(xì)微的線索,還是剖析復(fù)雜難題中相互交織的結(jié)構(gòu)維度”。

據(jù)介紹,Gemini 3在核心能力上實現(xiàn)顯著突破。該模型基于谷歌TPU進行訓(xùn)練,支持100萬個token的上下文窗口,適用于需要以下功能的應(yīng)用:Agent、高級編程、長上下文、多模態(tài)理解、算法開發(fā)。

目前,Gemini 3 Pro已經(jīng)登頂國際權(quán)威評測平臺LMArena排行榜。同時,該模型在用來檢測AI事實準(zhǔn)確性的SimpleQA Verified基準(zhǔn)測試中斬獲了當(dāng)前最高的72.1%得分。

在用來測試AI系統(tǒng)是否具備博士級推理能力的“人類最后的考試”(Humanity's Last Exam)中,Gemini 3在不使用任何工具的情況下達到了37.5%的準(zhǔn)確率;而在考察研究生水平科學(xué)問題理解能力的GPQA Diamond基準(zhǔn)測試中,它的得分更是高達91.9%。

Gemini 3 Pro的基準(zhǔn)測試成績。來源:谷歌

此次發(fā)布距離上一代Gemini 2.5過去了8個月,離Gemini 2.0的發(fā)布過去了11個月。皮查伊在公司博客文章中寫道:“現(xiàn)在,每月有20億用戶使用AI概覽(谷歌搜索的AI Overviews功能)。Gemini app的月用戶量已突破6.5億......令人驚嘆的是,僅僅用了兩年時間,AI已經(jīng)從單純的文本和圖像識別,發(fā)展到能夠‘洞察語境’?!?/p>

谷歌實驗室與Gemini副總裁JoshWoodward表示,Gemini 3是谷歌有史以來“最棒的氛圍編程(vibe coding)模型”,讓軟件開發(fā)者能夠通過提示詞生成代碼。谷歌方面還強調(diào),Gemini 3 Pro的回復(fù)“智能、簡潔、直接,用真知灼見取代了陳詞濫調(diào)和奉承”。

分析指出,隨著Gemini 3的發(fā)布,谷歌與OpenAI之間的競爭愈演愈烈。

Gemini 3發(fā)布后,OpenAI聯(lián)合創(chuàng)始人兼CEO山姆·奧特曼(Sam Altman)和xAI創(chuàng)始人、CEO埃隆·馬斯克(Elon Musk)都發(fā)來“賀信”。奧特曼在X(原推特)平臺上評價稱“Gemini 3看起來很不錯”,而馬斯克在表示祝賀的同時還寫道:“看來我們要抓緊發(fā)布Grok 4.20了?!?/p>

有趣的是,硅谷科技播客主持人約翰·庫根(John Coogan)指出,面對Gemini 3帶來的挑戰(zhàn),其競爭對手的反應(yīng)各不相同:Anthropic在當(dāng)天宣布和英偉達、微軟達成新的合作協(xié)議,三家一起“抱團取暖”;以前最喜歡在谷歌發(fā)布會前“搞事情”的OpenAI這次卻顯得格外沉默,而馬斯克則代表xAI直接說出了心中的焦慮。

交易公司Jones Trading的首席市場策略師Mike O'Rourke表示:“鑒于谷歌的規(guī)模、影響力以及在搜索領(lǐng)域的先發(fā)優(yōu)勢,Gemini可能會搶占市場份額,導(dǎo)致OpenAI等公司落后?!彼赋觯@種向Gemini的轉(zhuǎn)變可能會波及整個市場,引發(fā)甲骨文(Oracle)和微軟等OpenAI合作伙伴的擔(dān)憂。

在模型的質(zhì)量方面,許多業(yè)內(nèi)人士稱Gemini 3符合乃至超出期待。例如,沃頓商學(xué)院教授伊桑·莫利克(Ethan Mollick)指出:“Gemini 3是一款非常優(yōu)秀、速度極快的模型,并展示出了從聊天機器人到agent(助理)的轉(zhuǎn)變......如果我們將‘博士級智力’定義為能像合格的研究生那樣干活,那么它確實做到了?!?/p>

不過,也有業(yè)內(nèi)人士指出,Gemini 3的事實準(zhǔn)確率依然有待提高。例如,AI初創(chuàng)公司Oumi的聯(lián)合創(chuàng)始人Manos Koukoumidis指出:“如果人們指望谷歌把他們從‘藍色超鏈接’的海洋中拯救出來并替他們完成工作,目前的水平還遠遠不夠?!?/p>

18日當(dāng)天,谷歌(Nasdaq:GOOGL)跌0.26%收于每股284.28美元,總市值3.43萬億美元,盤后漲超1.6%。

谷歌母公司Alphabet發(fā)布的截至9月30日的2025年第三季度財報顯示,谷歌第三季度實現(xiàn)營收1023.46億美元,同比增長16%;非美國通用會計準(zhǔn)則下(Non-GAAP)凈利潤為349.79億美元,同比增長33%。同時,谷歌年內(nèi)第二次上調(diào)預(yù)期,預(yù)計2025年的資本支出將在910億美元至930億美元之間。

    責(zé)任編輯:劉秀浩
    圖片編輯:朱偉輝
    校對:劉威
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司