欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

<del id="k00i0"><abbr id="k00i0"></abbr></del>

<cite id="k00i0"></cite>

<button id="k00i0"></button>

<button id="k00i0"></button>

<button id="kmuck"></button>

<button id="kmuck"></button>

下載客戶端

登錄

+1

今年的天才少女“有點(diǎn)多”

2024-12-31 07:28

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

聽(tīng)全文

最近幾天，Deepseek在AI圈子里太火了。

12月26日，Deepseek宣布全新系列模型DeepSeek-V3首個(gè)版本上線并同步開(kāi)源。

官方稱，DeepSeek-V3多項(xiàng)評(píng)測(cè)成績(jī)超越了Qwen2.5-72B和Llama-3.1-405B等其他開(kāi)源模型，并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

此外，官方技術(shù)論文還披露，v3模型的總訓(xùn)練成本為557.6萬(wàn)美元，GPT-4o等模型的訓(xùn)練成本約為1億美元。

隨后，Deepseek開(kāi)始刷屏。

12月27日，有媒體報(bào)道了羅福莉?qū)⒓尤胄∶滓皇?，并將羅福莉稱為95后“天才少女”。而這個(gè)“天才少女”，也來(lái)自Deepseek。

之后，雷軍千萬(wàn)年薪挖角天才少女的報(bào)道也刷屏了。

事實(shí)上，早在12月20日就有媒體報(bào)道過(guò)DeepSeek羅福莉?qū)⒓尤胄∶滓皇?，但?dāng)時(shí)的報(bào)道中并沒(méi)有將羅福莉稱為天才少女。該消息也沒(méi)有刷屏。

而最近幾天，兩個(gè)刷屏的事都很突然，而且?guī)缀跏峭瑫r(shí)，到底啥情況？

DeepSeek-V3好評(píng)眾多

但給自己挖了個(gè)坑

媒體文章再現(xiàn)“震驚體”

DeepSeek-V3一經(jīng)發(fā)布，便收獲無(wú)數(shù)好評(píng)。

一方面，是有多項(xiàng)數(shù)據(jù)顯示，其在多個(gè)評(píng)測(cè)中取得高分。另一方面，則是其低廉的訓(xùn)練成本。

很多大佬也對(duì)DeepSeek-V3給出了高度評(píng)價(jià)。

比如，Meta科學(xué)家田淵棟稱，DeepSeek-V3的訓(xùn)練看上去是“黑科技”，這是非常偉大的工作。

Menlo Venture的投資人表示：“53頁(yè)的技術(shù)論文是黃金?！?/p>

不過(guò)，DeepSeek-V3也給自己挖了一個(gè)坑。

很快就有人發(fā)現(xiàn)，當(dāng)用英文“what model are you”向DeepSeek-V3提問(wèn)它是哪家大模型時(shí)，它卻給出了“ChatGPT”的答案。

而用中文或給“what model are you”加上問(wèn)號(hào)，DeepSeek-V3則能夠正確回答。

不過(guò)，DeepSeek官方還未對(duì)此做出回應(yīng)。

有分析認(rèn)為，之所以會(huì)出現(xiàn)這一幕，或許是因?yàn)镈eepSeek-V3的訓(xùn)練數(shù)據(jù)中可能包含了大量ChatGPT生成的文本，導(dǎo)致它“記住了”ChatGPT的某些輸出，并錯(cuò)誤地將自己識(shí)別為ChatGPT。

今日，三言測(cè)試發(fā)現(xiàn)，該BUG已修復(fù)。

三言還測(cè)試了幾個(gè)此前曾讓眾多大模型翻車(chē)的問(wèn)題。

1、1個(gè)籠子里裝著免子和雞，一共有20個(gè)頭，45只腳，請(qǐng)問(wèn)免子和雞各有多少只?

這個(gè)問(wèn)題其實(shí)是無(wú)解的。日前，三言在測(cè)試另一款大模型時(shí)，對(duì)方給出了錯(cuò)誤的答案。

DeepSeek-V3則是先通過(guò)設(shè)方程，解出兔子的數(shù)量為2.5只，雞的數(shù)量為17.5只。

然后又指出，動(dòng)物的數(shù)量應(yīng)該是整數(shù)，這表明題目中給出的數(shù)據(jù)可能有誤，或者問(wèn)題本身存在矛盾。

2、9.11和9.9哪個(gè)數(shù)字大？

這個(gè)問(wèn)題曾讓一眾大模型打臉。

DeepSeek-V3給出了正確的答案。

3、蒸一個(gè)包子需要5分鐘，蒸10個(gè)包子需要幾分鐘？

這個(gè)問(wèn)題也曾讓某大模型出糗，該大模型不知道包子可以同時(shí)蒸，得出了需要50分鐘的錯(cuò)誤答案。

DeepSeek-V3也給出了正確答案。

4、為什么爸媽結(jié)婚沒(méi)叫我參加婚禮？

這個(gè)問(wèn)題DeepSeek-V3分析給出了四種原因。

5、麻辣螺絲釘怎么做？

日前，三言測(cè)試另一款大模型時(shí)，這個(gè)問(wèn)題也讓它翻車(chē)了。該大模型一本正經(jīng)的給出了做法。

而DeepSeek-V3指出了螺絲釘不能食用，并給出了“麻辣螺螄”的做法。

從回答這些問(wèn)題來(lái)看，DeepSeek-V3的能力確實(shí)還不錯(cuò)。

據(jù)悉，DeepSeek還被稱為“AI界拼多多”。

這源于今年5月，DeepSeek V2開(kāi)源模型發(fā)布，將推理成本被降到每百萬(wàn)token僅 1塊錢(qián)，約等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

當(dāng)時(shí)，DeepSeek就被冠以“AI界拼多多”之稱。

據(jù)悉，這背后是DeepSeek提出了一種嶄新的MLA架構(gòu)，把顯存占用降到了過(guò)去最常用的MHA架構(gòu)的5%-13%，同時(shí)，DeepSeek獨(dú)創(chuàng)的DeepSeekMoESparse結(jié)構(gòu)，也把計(jì)算量大幅降低。

這也是DeepSeek的過(guò)人之處。

不過(guò)，從這次刷屏的媒體文章來(lái)看，標(biāo)題中充斥著“震驚全球”、“AI界拼多多”等標(biāo)簽。不知道是媒體的一貫做法，還是有意這么標(biāo)簽化定位。

并且，“震驚體”在AI界實(shí)在是太常見(jiàn)了。好多大模型發(fā)布時(shí)，都“震驚”過(guò)。但是“震驚”過(guò)后，很快就褪去熱度。

羅福莉能力到底如何？

從電子專業(yè)轉(zhuǎn)到計(jì)算機(jī)專業(yè)

第一年對(duì)編程沒(méi)有任何認(rèn)知

從連python都不會(huì)，4個(gè)月就投了論文

8篇ACL論文有2篇是一作

公開(kāi)信息顯示，羅福莉本科就讀于北京師范大學(xué)計(jì)算機(jī)專業(yè)，碩士（保研）畢業(yè)于北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所，研二時(shí)在自然語(yǔ)言處理領(lǐng)域頂級(jí)會(huì)議ACL 2019上發(fā)表8篇論文，其中兩篇為一作。畢業(yè)后，羅福莉加入阿里達(dá)摩院機(jī)器智能實(shí)驗(yàn)室。期間，她主導(dǎo)開(kāi)發(fā)的多語(yǔ)言預(yù)訓(xùn)練模型VECO，被納入阿里達(dá)摩院深度語(yǔ)言模型體系A(chǔ)liceMind。此外，她還主導(dǎo)了AliceMind的開(kāi)源工作。

2022年，羅福莉離開(kāi)阿里，在DeepSeek擔(dān)任深度學(xué)習(xí)研究員，參與了DeepSeek的MoE大模型DeepSeek-V2的開(kāi)發(fā)。

羅福莉的百度百科已經(jīng)更新為小米AI實(shí)驗(yàn)室負(fù)責(zé)人，盡管上了兩天熱搜和刷屏，小米方面卻遲遲未回應(yīng)天才少女加盟的事。

從“羅福莉”詞條的編輯歷史來(lái)看，12月28日才有了該詞條，并且是由多位不同的網(wǎng)友編輯而來(lái)。

據(jù)悉，羅福莉在ACL 2019上發(fā)表8篇論文一事曾登上知乎熱搜。

當(dāng)時(shí)，羅福莉在知乎發(fā)文回應(yīng)稱，當(dāng)年ACL她投了一長(zhǎng)一短，然后都中了，其他paper都只是部分參與了實(shí)驗(yàn)室同學(xué)的research。

羅福莉還表示，其朋友圈不乏ACL中了兩篇一作長(zhǎng)文的人。其次，這次投稿ACL paper是其近一年的產(chǎn)出，所以她為自己是付出了足夠的努力的，當(dāng)然也可能也有運(yùn)氣成分加持。

2021年6月，羅福莉曾在其公眾號(hào)的一篇文章中寫(xiě)道：“這一年我收獲了人生中大多數(shù)人認(rèn)識(shí)我的標(biāo)簽——8篇頂會(huì)文章(并非全一作)，并因此被網(wǎng)友‘掛’上了知乎，‘榮獲’(被黑)什么天才AI美少女蘿莉的稱號(hào)。”

之后，羅福莉還曾在其公眾號(hào)的文章中透露過(guò)自己的保研經(jīng)歷。

羅福莉稱，自己的保研經(jīng)歷跟一般保研完全不同，她是在三月份就積極聯(lián)系各個(gè)學(xué)校的導(dǎo)師，發(fā)郵件給他們，附加簡(jiǎn)歷，介紹我自己（包括績(jī)點(diǎn)和個(gè)人做過(guò)的項(xiàng)目經(jīng)歷以及科研成果），然后詢問(wèn)老師是否有保研名額，并且表示自己可以去實(shí)習(xí)。

此外，羅福莉還曾在訪談視頻中透露，她并非本來(lái)就是計(jì)算機(jī)專業(yè)的，而是電子專業(yè)。一次偶然的機(jī)會(huì)，她轉(zhuǎn)到了計(jì)算機(jī)專業(yè)。

羅福莉稱，她在計(jì)算機(jī)專業(yè)第一年對(duì)編程沒(méi)有任何認(rèn)知，別人三分鐘解出來(lái)的課題，她要花三個(gè)小時(shí)。

但她的進(jìn)步也是相當(dāng)快的。

羅福莉稱，她大三的時(shí)候就開(kāi)始聯(lián)系北大各個(gè)方向的老師，去他們組內(nèi)實(shí)習(xí)，她從連python都不會(huì)的一個(gè)人，4個(gè)月以后就投了自然語(yǔ)言處理頂會(huì)論文。

她還曾表示，論聰明程度來(lái)說(shuō)，她應(yīng)該是中下水平的。自己平時(shí)做事很傻，丟三落四，經(jīng)常出門(mén)忘帶鑰匙、走迷路、坐過(guò)電梯等等。

值得一提的是，羅福莉的訪談視頻，都是達(dá)某院拍的。

從以上內(nèi)容來(lái)看，羅福莉可能并沒(méi)有那么神乎其神。

她自己也證實(shí)，所謂的8篇ACL論文，有6篇是部分參與。

雖然網(wǎng)絡(luò)上有一些羅福莉往日的相關(guān)信息，但在小米挖角之前，羅福莉確實(shí)沒(méi)什么名氣。

三言以“羅福莉”為關(guān)鍵詞搜索百度資訊，相關(guān)內(nèi)容只有兩頁(yè)，發(fā)布最早的是10天前。

如今突然刷屏，不知道算不算是營(yíng)銷(xiāo)行為。從其轉(zhuǎn)專業(yè)第一年不熟悉編程，后來(lái)就成績(jī)名列前茅，不會(huì)python，4個(gè)月就投了論文來(lái)看，確實(shí)是天才。

今年的天才少女“有點(diǎn)多”

這次的天才少女羅福莉也有不同尋常的經(jīng)歷，相信她有相應(yīng)的實(shí)力。小米也應(yīng)該盡快回應(yīng)，到底加入沒(méi)加入。

在此之前，文生視頻大模型Pika發(fā)布時(shí)，其開(kāi)發(fā)團(tuán)隊(duì)創(chuàng)始人之一的郭文景也被稱為“天才少女”。

但也是很快，Pika和郭文景就沒(méi)了聲音。

這次的“天才少女”，還疊加了“Deepseek”和“雷軍”兩個(gè)buff，至于這兩個(gè)buff有沒(méi)有額外的屬性加成，還需要讓子彈飛一會(huì)兒。

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

+1

收藏

我要舉報(bào)

查看更多

掃碼下載澎湃新聞客戶端

關(guān)于澎湃

聯(lián)系我們

澎湃矩陣

澎湃新聞微博
澎湃新聞公眾號(hào)
澎湃新聞抖音號(hào)
派生萬(wàn)物開(kāi)放平臺(tái)
IP SHANGHAI
SIXTH TONE

新聞報(bào)料

報(bào)料熱線: 021-962866
報(bào)料郵箱: news@thepaper.cn

滬ICP備14003370號(hào)

滬公網(wǎng)安備31010602000299號(hào)

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：31120170006

增值電信業(yè)務(wù)經(jīng)營(yíng)許可證：滬B2-2017116

? 2014-2026 上海東方報(bào)業(yè)有限公司

反饋

<button id="awiuk"></button><del id="awiuk"><abbr id="awiuk"></abbr></del>

<del id="awiuk"><abbr id="awiuk"></abbr></del>