2023年屬于Llama和開源AI

2023-11-09 15:56

來源：澎湃新聞·澎湃號·湃客

Meta打造的Llama大語言模型今年2月席卷了整個AI研究領(lǐng)域，隨后是7月的商業(yè)版Llama 2和8月的Code Llama……而這，就是我心目中的“AI王者”。

其實想象得到，肯定有不少讀者捏緊了拳頭，想要替生成式AI領(lǐng)域真正的大明星發(fā)聲：“說什么鬼話？真相只有一個，那就是ChatGPT，它才是2023年AI的絕對王者！”沒錯，OpenAI的ChatGPT于2022年11月30日首度亮相，到今年2月已經(jīng)擁有1億用戶，并成功將生成式AI帶入主流社會。這一切，都是客觀事實。

但我仍然有話要說，以我這位科技編輯的拙見，ChatGPT確實是生成式AI游戲規(guī)則的改變者，正如Forrester分析師Rowan Curran所說，它代表著“點燃生成式AI燎原大勢的星星之火?！钡珡慕衲?月起，隨著Meta Llama的出現(xiàn)，首個免費“開源”大語言模型（之所以加上引號，是因為按照傳統(tǒng)許可定義，Llama和Llama 2并不屬于純開放項目）讓開源AI開始嶄露頭角，并掀起一股新的浪潮，由此引發(fā)的激烈討論直到現(xiàn)在也沒有平息。盡管其他科技巨頭、大模型廠商和政策制定者紛紛對開源代碼和AI模型權(quán)重等安全問題提出質(zhì)疑，同時認(rèn)為高昂的計算成本正在令整個生態(tài)系統(tǒng)陷入困境，但開源AI前進(jìn)的腳步一刻也沒有放慢。

根據(jù)Meta的介紹，自Llama模型發(fā)布以來，開源AI社區(qū)已經(jīng)在Hugging Face平臺上微調(diào)并發(fā)布了7000多個Llama衍生模型，其中包括Koala、Vicuna、Alpaca、Dolly以及RedPajama等知名成果。雖然其他開源模型也所在多有，包括Mistral、Hugging Face和Falcon等，但Llama的確是首個由Meta這家科技巨頭提供數(shù)據(jù)與資源支持的開放模型。

換言之，我認(rèn)為ChatGPT就像是2023年的現(xiàn)象級電影《芭比》，而Llama及其開源AI陣營則類似于漫威宇宙。后者明顯擁有過場的衍生空間和分支體系，累積起來將對AI領(lǐng)域產(chǎn)生最巨大、最深遠(yuǎn)的長期影響。

Domino數(shù)據(jù)實驗室數(shù)據(jù)科學(xué)戰(zhàn)略與傳播主管Kjell Carlsson也抱類似的觀點，認(rèn)為Llama將帶來“更真實、更具影響力的生成式AI應(yīng)用，并為未來的生成式AI奠定堅實的開源基礎(chǔ)。”

開源AI——承載最大、最深遠(yuǎn)的長期影響

從某種意義上講，封閉、專有的AI模型時代就是從ChatGPT開始的。OpenAI成立于2015年，當(dāng)初曾是一家強調(diào)開源、開放研究的組織。但在2023年，OpenAI聯(lián)合創(chuàng)始人兼首席科學(xué)家Ilya Sutskever在采訪中已經(jīng)明確表示，考慮到競爭和安全等問題，當(dāng)初就不該分享自己的研究成果。

另一方面，Meta公司首席AI科學(xué)家Yann LeCun則積極推動Llama 2連同模型權(quán)重一同通過商業(yè)許可進(jìn)行發(fā)布。他在今年9月的AI Native大會上表示：“我在內(nèi)部一直提倡這條路線，我認(rèn)為開放才是必然的道路。因為大語言模型將成為人人倚仗的基礎(chǔ)設(shè)施，所以必須是開放的。”

公平地講，我個人把ChatGPT跟Llama直接比較其實有點錯位。Carlsson認(rèn)為Llama 2是一套改變游戲規(guī)則的模型，它的特色在于開源、提供商業(yè)使用許可、允許進(jìn)行微調(diào)、能夠在本地運行，而且體量小巧可以大規(guī)模推廣。

但ChatGPT代表的則是“一種顛覆性的體驗，真正將大語言模型的力量呈現(xiàn)在公眾面前。最重要的是，它讓人們相信AI技術(shù)具備商業(yè)潛力?！辈贿^他也堅持認(rèn)為，將GPT 3.5和GPT 4兩套模型作為ChatGPT底層技術(shù)確實不太明智：“就目前的情況看，除非有特殊需求，否則它們只能算是處于概念驗證階段?！?/p>

人工智能寫作產(chǎn)品HyperWrite開發(fā)商Otherside AI的CEO Matt Shumer指出，如果當(dāng)初沒有ChatGPT的開拓，Llama可能無法獲得如今的反響和社會影響力。但他也同意，Llama帶來的深遠(yuǎn)影響將持續(xù)多年：“如果沒有Llama以及之后衍生出的各種新方案，就不可能有如今興旺發(fā)達(dá)、大量年輕力量不斷涌現(xiàn)的生成式AI社區(qū)?！?/p>

Neeva前CEO、數(shù)據(jù)云廠商Snowfalke高級副總裁Sridhar Ramaswamy則認(rèn)為：“Llama 2百分之百稱得上是游戲規(guī)則改變者——它是第一套真正具備實用能力的開源AI模型?！绷硪环矫?，ChatGPT則更多是在重復(fù)云服務(wù)領(lǐng)域的故事，“少數(shù)行業(yè)巨頭掌控強大的模型，到時候用戶不管做什么都得先向他們付費?！?/p>

而Meta，卻選擇了公開Llama。

早期Llama泄露，衍生出一系列開源大語言模型

第一套Llama模型亮相于今年2月，它之所以能夠脫穎而出，憑借的就是靈活的體量選項——從70億參數(shù)到650億參數(shù)。Llama開發(fā)者報告稱，其中13B參數(shù)模型在大多數(shù)自然語言處理（NLP）基準(zhǔn)測試中的性能，已經(jīng)超越了體量更大的GPT-3（175B參數(shù)），而其最大模型甚至能夠與PaLM和Chinchilla等最先進(jìn)的方案一較高下。Meta還根據(jù)具體情況向?qū)W者和研究人員公開了Llama的模型權(quán)重，其中包括斯坦福大學(xué)的Alpaca項目。

但不久之后，Llama的權(quán)重在4chan論壇上泄露，于是世界各地的開發(fā)人員首次接觸到GPT級別的大語言模型，并很快催生出一系列衍生成果。到今年7月，Meta免費向企業(yè)發(fā)布了可供商業(yè)使用的Llama 2，微軟也在自家Azure云服務(wù)上提供Llama 2模型選項。

與此同時，美國國會開始激烈討論該如何對AI發(fā)展施以監(jiān)管。今年6月，兩位美國參議員致信Meta公司CEO扎克伯格，對Llama泄露事件提出質(zhì)疑，表示擔(dān)心“AI可能被用于生成垃圾郵件、網(wǎng)絡(luò)欺詐、惡意軟件、侵犯隱私、騷擾以及其他不當(dāng)行為與傷害活動?！?/p>

但Meta卻始終在開源AI貢獻(xiàn)方面立場堅定。在今年6月的一次內(nèi)部全體會議上，扎克伯格表示Meta正在將生成式AI引入公司所有產(chǎn)品當(dāng)中，并重申了Meta對于AI研究應(yīng)秉持“開放科學(xué)精神”的承諾。

長期以來，Meta一直是開放研究的倡導(dǎo)者

與其他科技巨頭相比，Meta長期以來一直是開放研究的擁護(hù)者，特別是圍繞其PyTorch框架建立開源生態(tài)系統(tǒng)。隨著2023年逐漸接近尾聲，Meta也將慶祝其FAIR（基礎(chǔ)AI研究院）成立10周年。10年之前的2013年12月9日，F(xiàn)acebook宣布紐約大學(xué)教授Yann LeCun將正式領(lǐng)導(dǎo)FAIR，該組織希望“通過開放研究推動AI的發(fā)展水平，進(jìn)而造福全人類?！?/p>

Meta公司AI研究副總裁Joelle Pineau曾在采訪中回憶道，她在2017年加入Meta，當(dāng)時打動她的正是FAIR對于開放研究和技術(shù)透明的堅定承諾。

“我之所以接受了Facebook的邀請，就是看中了他們對于開放科學(xué)的承諾。像我這樣被吸引來的研究人員還有很多，這種氣質(zhì)早已成為研究院DNA中的一部分。”

但她同時補充稱，現(xiàn)在進(jìn)行開放研究的原因已經(jīng)有所轉(zhuǎn)變?！?017年那會，選擇開放主要是為了改善質(zhì)量、設(shè)定更高的實現(xiàn)標(biāo)準(zhǔn)。但如今的新情況在于，開放對于整個生態(tài)系統(tǒng)的生產(chǎn)力擁有更強的推動作用，也將有很多初創(chuàng)企業(yè)從中獲益、得到一條不同于專有方案的替代路線?！?/p>

她同時強調(diào)，Meta對于各個版本的態(tài)度也會隨時調(diào)整。“我們不會承諾在任何情況下都始終開放所有內(nèi)容，每個版本都需要根據(jù)優(yōu)勢和風(fēng)險做具體分析?！?/p>

回顧Llama：做的只是一堆小事，但卻做得很好

Meta FAIR研究科學(xué)家Angela Fan曾經(jīng)參與過最初的Llama項目，后續(xù)也為Llama 2貢獻(xiàn)了力量，并努力將這些模型轉(zhuǎn)化為Meta在上個月Connect開發(fā)者大會上公布的面向用戶產(chǎn)品和功能。

她在采訪當(dāng)中表示：“回顧整個歷程，當(dāng)時這項技術(shù)在行業(yè)當(dāng)中仍處于萌芽階段而且相當(dāng)孱弱，但已經(jīng)足夠讓我們構(gòu)建一些真正有趣的東西。于是我們開始嘗試整合，讓所有應(yīng)用都獲得比較一致的運作效果。”

她還補充道，Meta公司也在積極從開發(fā)者社區(qū)以及用Llama開發(fā)各類程序的初創(chuàng)生態(tài)圈那邊尋求反饋?！拔覀兿Ｍ私獯蠹覍lama 2有什么看法，思考接下來該在Llama 3中加入什么新內(nèi)容。”

在她看來，Llama成功的秘訣就是“在很長一段時間里只做一堆小事，但要把事做好、把事做對。”她回憶道，Llama的誕生其實是一系列具體步驟的集合，比如正確獲取原始數(shù)據(jù)集、正確計算參數(shù)規(guī)模，以及按照正確的學(xué)習(xí)率對模型進(jìn)行預(yù)訓(xùn)練。

“我們從這么多的小實驗里學(xué)到了寶貴的經(jīng)驗?！彼€提到，對于不太了解AI研究的朋友們來說，整個過程“就像一個瘋狂的科學(xué)家坐在屏幕里按來按去。但是，其間確實需要付出很多努力?！?/p>

用實際行動保護(hù)開源AI

Together公司聯(lián)合創(chuàng)始人Vipul Ved Prakash表示，建立起廣泛且實用的大規(guī)模開源生態(tài)系統(tǒng)一直是“我們的追求”。作為一家初創(chuàng)公司，Together憑借今年4月建立的RedPajama數(shù)據(jù)集而備受關(guān)注。這套數(shù)據(jù)集重現(xiàn)了Llama數(shù)據(jù)集，并為更多初創(chuàng)企業(yè)和開發(fā)人員提供全棧平臺和云服務(wù)支持，供其構(gòu)建新的開源AI——包括在Llama 2基礎(chǔ)之上做延伸性開發(fā)。

Prakash同樣將Llama和開源AI視為2023年真正的游戲規(guī)則改變者。他解釋稱，這背后蘊藏著開發(fā)高質(zhì)量實用模型、并以此為基礎(chǔ)建立商業(yè)與組織網(wǎng)絡(luò)的重大意義。

“成本將分布在整個網(wǎng)絡(luò)當(dāng)中，就是說如果你只需要微調(diào)或者推理，那就不用承擔(dān)模型構(gòu)建的前期成本?！?/p>

但目前，開源AI支持者也認(rèn)同應(yīng)該在監(jiān)管機構(gòu)的關(guān)注之下，逐步推動對大語言模型的訪問保護(hù)。在本周于英國召開的AI安全峰會上，全球各方就共同討論了開源AI可能引發(fā)的極端情況——先進(jìn)AI系統(tǒng)落入壞人手中，最終被用于消滅全人類。

但由LeCun和Google Brain聯(lián)合創(chuàng)始人吳恩達(dá)主導(dǎo)的開源AI團(tuán)體仍簽署了一份由Mozilla代為發(fā)布的聯(lián)合聲明，強調(diào)開放AI“是解藥，而不是毒藥”。

Andreessen Horowitz公司普通合伙人Sriram Krishnan也發(fā)布推文，表示支持Llama與開源AI：

“一定要意識到 @ylecun 及其團(tuán)隊發(fā)布Llama 2的重要意義。第一，未來可能再也沒有這種合法發(fā)布開源AI模型的機會；第二，如果沒有Llama 2開辟的可能性，開源AI恐怕永遠(yuǎn)無從談起，最終大模型的力量可能被掌握在少數(shù)幾家巨頭企業(yè)手中?！?/p>

Llama與ChatGPT之間的爭論仍在繼續(xù)

關(guān)于Llama與ChatGPT，以及開源與閉源之間的爭論，肯定還會繼續(xù)下去。而且在聯(lián)系多位專家并征求他們的意見之后，ChatGPT仍然擁有觀念優(yōu)勢。

RelationalAI公司機器學(xué)習(xí)研究副總裁Nikolaos Vasiloglou評論道，“放心，ChatGPT，肯定選你。它改變游戲規(guī)則的原因不僅在于其出色的AI功能，更在于其背后深厚的工程技術(shù)積累和無與倫比的運營成本?！?/p>

TravelAI公司CEO John Lyotier也認(rèn)為，“毫無疑問，ChatGPT就是最終贏家。它在公眾心目中成為AI的代表性形象，激發(fā)那些毫無技術(shù)背景的人們也愿意接納并使用，并通過ChatGPT向自己的親朋好友介紹AI技術(shù)。ChatGPT，就是‘獻(xiàn)給普通人的AI’。”

3D生成式AI平臺Atlas的CEO Ben James則指出，Llama正以ChatGPT做不到的方式重新點燃了技術(shù)界的研究熱情，這將帶來更強大、也更深遠(yuǎn)的影響。

“ChatGPT當(dāng)然是2023年最令人矚目的游戲規(guī)則改變者，但Llama將要改變的是未來的游戲規(guī)則?！?/p>

而我始終堅持自己的觀點，哪怕是著眼于2023年，贏家也仍然是Llama和開源AI，因為這會對2024年乃至更久遠(yuǎn)的未來產(chǎn)生影響。Forrester的Curran也抱有相同的看法，“即使沒有ChatGPT，2023年的生成式AI浪潮也已經(jīng)成型，只是也許沒有現(xiàn)在這么戲劇性。但一切已經(jīng)發(fā)生，而且與歷史上的其他前沿技術(shù)相比，現(xiàn)在有機會與這些先進(jìn)工具進(jìn)行交互、上手體驗的人數(shù)確實相當(dāng)驚人。”

他還強調(diào)，開源模型，特別是像Llama 2這類已經(jīng)得到企業(yè)開發(fā)者廣泛采用的模型，正在為生成式AI的實地開發(fā)與進(jìn)步提供源源不斷的動力。

Curran表示，從長遠(yuǎn)來看，專有模型和開源模型都將在市場上擁有一席之地。但如果沒有開源社區(qū)，那么生成式AI將只是個不太先進(jìn)、小眾化風(fēng)格強烈的市場，而不足以成為具有顛覆性潛力的技術(shù)。換言之，開源讓生成式AI真正能夠?qū)ζ胀ㄈ说墓ぷ骱蜕町a(chǎn)生方方面面的影響。

“開源社區(qū)已經(jīng)成為諸多深遠(yuǎn)影響的真正源頭，開源社區(qū)也必將決定生成式AI的未來命運?！?/p>

特別聲明

本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機構(gòu)觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#Llama