- +1
2023年屬于Llama和開源AI
Meta打造的Llama大語言模型今年2月席卷了整個AI研究領(lǐng)域,隨后是7月的商業(yè)版Llama 2和8月的Code Llama……而這,就是我心目中的“AI王者”。
其實想象得到,肯定有不少讀者捏緊了拳頭,想要替生成式AI領(lǐng)域真正的大明星發(fā)聲:“說什么鬼話?真相只有一個,那就是ChatGPT,它才是2023年AI的絕對王者!”沒錯,OpenAI的ChatGPT于2022年11月30日首度亮相,到今年2月已經(jīng)擁有1億用戶,并成功將生成式AI帶入主流社會。這一切,都是客觀事實。
但我仍然有話要說,以我這位科技編輯的拙見,ChatGPT確實是生成式AI游戲規(guī)則的改變者,正如Forrester分析師Rowan Curran所說,它代表著“點燃生成式AI燎原大勢的星星之火?!钡珡慕衲?月起,隨著Meta Llama的出現(xiàn),首個免費“開源”大語言模型(之所以加上引號,是因為按照傳統(tǒng)許可定義,Llama和Llama 2并不屬于純開放項目)讓開源AI開始嶄露頭角,并掀起一股新的浪潮,由此引發(fā)的激烈討論直到現(xiàn)在也沒有平息。盡管其他科技巨頭、大模型廠商和政策制定者紛紛對開源代碼和AI模型權(quán)重等安全問題提出質(zhì)疑,同時認(rèn)為高昂的計算成本正在令整個生態(tài)系統(tǒng)陷入困境,但開源AI前進(jìn)的腳步一刻也沒有放慢。
根據(jù)Meta的介紹,自Llama模型發(fā)布以來,開源AI社區(qū)已經(jīng)在Hugging Face平臺上微調(diào)并發(fā)布了7000多個Llama衍生模型,其中包括Koala、Vicuna、Alpaca、Dolly以及RedPajama等知名成果。雖然其他開源模型也所在多有,包括Mistral、Hugging Face和Falcon等,但Llama的確是首個由Meta這家科技巨頭提供數(shù)據(jù)與資源支持的開放模型。
換言之,我認(rèn)為ChatGPT就像是2023年的現(xiàn)象級電影《芭比》,而Llama及其開源AI陣營則類似于漫威宇宙。后者明顯擁有過場的衍生空間和分支體系,累積起來將對AI領(lǐng)域產(chǎn)生最巨大、最深遠(yuǎn)的長期影響。
Domino數(shù)據(jù)實驗室數(shù)據(jù)科學(xué)戰(zhàn)略與傳播主管Kjell Carlsson也抱類似的觀點,認(rèn)為Llama將帶來“更真實、更具影響力的生成式AI應(yīng)用,并為未來的生成式AI奠定堅實的開源基礎(chǔ)。”
開源AI——承載最大、最深遠(yuǎn)的長期影響
從某種意義上講,封閉、專有的AI模型時代就是從ChatGPT開始的。OpenAI成立于2015年,當(dāng)初曾是一家強調(diào)開源、開放研究的組織。但在2023年,OpenAI聯(lián)合創(chuàng)始人兼首席科學(xué)家Ilya Sutskever在采訪中已經(jīng)明確表示,考慮到競爭和安全等問題,當(dāng)初就不該分享自己的研究成果。
另一方面,Meta公司首席AI科學(xué)家Yann LeCun則積極推動Llama 2連同模型權(quán)重一同通過商業(yè)許可進(jìn)行發(fā)布。他在今年9月的AI Native大會上表示:“我在內(nèi)部一直提倡這條路線,我認(rèn)為開放才是必然的道路。因為大語言模型將成為人人倚仗的基礎(chǔ)設(shè)施,所以必須是開放的。”
公平地講,我個人把ChatGPT跟Llama直接比較其實有點錯位。Carlsson認(rèn)為Llama 2是一套改變游戲規(guī)則的模型,它的特色在于開源、提供商業(yè)使用許可、允許進(jìn)行微調(diào)、能夠在本地運行,而且體量小巧可以大規(guī)模推廣。
但ChatGPT代表的則是“一種顛覆性的體驗,真正將大語言模型的力量呈現(xiàn)在公眾面前。最重要的是,它讓人們相信AI技術(shù)具備商業(yè)潛力?!辈贿^他也堅持認(rèn)為,將GPT 3.5和GPT 4兩套模型作為ChatGPT底層技術(shù)確實不太明智:“就目前的情況看,除非有特殊需求,否則它們只能算是處于概念驗證階段?!?/p>
人工智能寫作產(chǎn)品HyperWrite開發(fā)商Otherside AI的CEO Matt Shumer指出,如果當(dāng)初沒有ChatGPT的開拓,Llama可能無法獲得如今的反響和社會影響力。但他也同意,Llama帶來的深遠(yuǎn)影響將持續(xù)多年:“如果沒有Llama以及之后衍生出的各種新方案,就不可能有如今興旺發(fā)達(dá)、大量年輕力量不斷涌現(xiàn)的生成式AI社區(qū)?!?/p>
Neeva前CEO、數(shù)據(jù)云廠商Snowfalke高級副總裁Sridhar Ramaswamy則認(rèn)為:“Llama 2百分之百稱得上是游戲規(guī)則改變者——它是第一套真正具備實用能力的開源AI模型?!绷硪环矫?,ChatGPT則更多是在重復(fù)云服務(wù)領(lǐng)域的故事,“少數(shù)行業(yè)巨頭掌控強大的模型,到時候用戶不管做什么都得先向他們付費?!?/p>
而Meta,卻選擇了公開Llama。
早期Llama泄露,衍生出一系列開源大語言模型
第一套Llama模型亮相于今年2月,它之所以能夠脫穎而出,憑借的就是靈活的體量選項——從70億參數(shù)到650億參數(shù)。Llama開發(fā)者報告稱,其中13B參數(shù)模型在大多數(shù)自然語言處理(NLP)基準(zhǔn)測試中的性能,已經(jīng)超越了體量更大的GPT-3(175B參數(shù)),而其最大模型甚至能夠與PaLM和Chinchilla等最先進(jìn)的方案一較高下。Meta還根據(jù)具體情況向?qū)W者和研究人員公開了Llama的模型權(quán)重,其中包括斯坦福大學(xué)的Alpaca項目。
但不久之后,Llama的權(quán)重在4chan論壇上泄露,于是世界各地的開發(fā)人員首次接觸到GPT級別的大語言模型,并很快催生出一系列衍生成果。到今年7月,Meta免費向企業(yè)發(fā)布了可供商業(yè)使用的Llama 2,微軟也在自家Azure云服務(wù)上提供Llama 2模型選項。
與此同時,美國國會開始激烈討論該如何對AI發(fā)展施以監(jiān)管。今年6月,兩位美國參議員致信Meta公司CEO扎克伯格,對Llama泄露事件提出質(zhì)疑,表示擔(dān)心“AI可能被用于生成垃圾郵件、網(wǎng)絡(luò)欺詐、惡意軟件、侵犯隱私、騷擾以及其他不當(dāng)行為與傷害活動?!?/p>
但Meta卻始終在開源AI貢獻(xiàn)方面立場堅定。在今年6月的一次內(nèi)部全體會議上,扎克伯格表示Meta正在將生成式AI引入公司所有產(chǎn)品當(dāng)中,并重申了Meta對于AI研究應(yīng)秉持“開放科學(xué)精神”的承諾。
長期以來,Meta一直是開放研究的倡導(dǎo)者
與其他科技巨頭相比,Meta長期以來一直是開放研究的擁護(hù)者,特別是圍繞其PyTorch框架建立開源生態(tài)系統(tǒng)。隨著2023年逐漸接近尾聲,Meta也將慶祝其FAIR(基礎(chǔ)AI研究院)成立10周年。10年之前的2013年12月9日,F(xiàn)acebook宣布紐約大學(xué)教授Yann LeCun將正式領(lǐng)導(dǎo)FAIR,該組織希望“通過開放研究推動AI的發(fā)展水平,進(jìn)而造福全人類?!?/p>
Meta公司AI研究副總裁Joelle Pineau曾在采訪中回憶道,她在2017年加入Meta,當(dāng)時打動她的正是FAIR對于開放研究和技術(shù)透明的堅定承諾。
“我之所以接受了Facebook的邀請,就是看中了他們對于開放科學(xué)的承諾。像我這樣被吸引來的研究人員還有很多,這種氣質(zhì)早已成為研究院DNA中的一部分。”
但她同時補充稱,現(xiàn)在進(jìn)行開放研究的原因已經(jīng)有所轉(zhuǎn)變?!?017年那會,選擇開放主要是為了改善質(zhì)量、設(shè)定更高的實現(xiàn)標(biāo)準(zhǔn)。但如今的新情況在于,開放對于整個生態(tài)系統(tǒng)的生產(chǎn)力擁有更強的推動作用,也將有很多初創(chuàng)企業(yè)從中獲益、得到一條不同于專有方案的替代路線?!?/p>
她同時強調(diào),Meta對于各個版本的態(tài)度也會隨時調(diào)整。“我們不會承諾在任何情況下都始終開放所有內(nèi)容,每個版本都需要根據(jù)優(yōu)勢和風(fēng)險做具體分析?!?/p>
回顧Llama:做的只是一堆小事,但卻做得很好
Meta FAIR研究科學(xué)家Angela Fan曾經(jīng)參與過最初的Llama項目,后續(xù)也為Llama 2貢獻(xiàn)了力量,并努力將這些模型轉(zhuǎn)化為Meta在上個月Connect開發(fā)者大會上公布的面向用戶產(chǎn)品和功能。
她在采訪當(dāng)中表示:“回顧整個歷程,當(dāng)時這項技術(shù)在行業(yè)當(dāng)中仍處于萌芽階段而且相當(dāng)孱弱,但已經(jīng)足夠讓我們構(gòu)建一些真正有趣的東西。于是我們開始嘗試整合,讓所有應(yīng)用都獲得比較一致的運作效果。”
她還補充道,Meta公司也在積極從開發(fā)者社區(qū)以及用Llama開發(fā)各類程序的初創(chuàng)生態(tài)圈那邊尋求反饋?!拔覀兿M私獯蠹覍lama 2有什么看法,思考接下來該在Llama 3中加入什么新內(nèi)容。”
在她看來,Llama成功的秘訣就是“在很長一段時間里只做一堆小事,但要把事做好、把事做對。”她回憶道,Llama的誕生其實是一系列具體步驟的集合,比如正確獲取原始數(shù)據(jù)集、正確計算參數(shù)規(guī)模,以及按照正確的學(xué)習(xí)率對模型進(jìn)行預(yù)訓(xùn)練。
“我們從這么多的小實驗里學(xué)到了寶貴的經(jīng)驗?!彼€提到,對于不太了解AI研究的朋友們來說,整個過程“就像一個瘋狂的科學(xué)家坐在屏幕里按來按去。但是,其間確實需要付出很多努力?!?/p>
用實際行動保護(hù)開源AI
Together公司聯(lián)合創(chuàng)始人Vipul Ved Prakash表示,建立起廣泛且實用的大規(guī)模開源生態(tài)系統(tǒng)一直是“我們的追求”。作為一家初創(chuàng)公司,Together憑借今年4月建立的RedPajama數(shù)據(jù)集而備受關(guān)注。這套數(shù)據(jù)集重現(xiàn)了Llama數(shù)據(jù)集,并為更多初創(chuàng)企業(yè)和開發(fā)人員提供全棧平臺和云服務(wù)支持,供其構(gòu)建新的開源AI——包括在Llama 2基礎(chǔ)之上做延伸性開發(fā)。
Prakash同樣將Llama和開源AI視為2023年真正的游戲規(guī)則改變者。他解釋稱,這背后蘊藏著開發(fā)高質(zhì)量實用模型、并以此為基礎(chǔ)建立商業(yè)與組織網(wǎng)絡(luò)的重大意義。
“成本將分布在整個網(wǎng)絡(luò)當(dāng)中,就是說如果你只需要微調(diào)或者推理,那就不用承擔(dān)模型構(gòu)建的前期成本?!?/p>
但目前,開源AI支持者也認(rèn)同應(yīng)該在監(jiān)管機構(gòu)的關(guān)注之下,逐步推動對大語言模型的訪問保護(hù)。在本周于英國召開的AI安全峰會上,全球各方就共同討論了開源AI可能引發(fā)的極端情況——先進(jìn)AI系統(tǒng)落入壞人手中,最終被用于消滅全人類。
但由LeCun和Google Brain聯(lián)合創(chuàng)始人吳恩達(dá)主導(dǎo)的開源AI團(tuán)體仍簽署了一份由Mozilla代為發(fā)布的聯(lián)合聲明,強調(diào)開放AI“是解藥,而不是毒藥”。
Andreessen Horowitz公司普通合伙人Sriram Krishnan也發(fā)布推文,表示支持Llama與開源AI:
“一定要意識到 @ylecun 及其團(tuán)隊發(fā)布Llama 2的重要意義。第一,未來可能再也沒有這種合法發(fā)布開源AI模型的機會;第二,如果沒有Llama 2開辟的可能性,開源AI恐怕永遠(yuǎn)無從談起,最終大模型的力量可能被掌握在少數(shù)幾家巨頭企業(yè)手中?!?/p>
Llama與ChatGPT之間的爭論仍在繼續(xù)
關(guān)于Llama與ChatGPT,以及開源與閉源之間的爭論,肯定還會繼續(xù)下去。而且在聯(lián)系多位專家并征求他們的意見之后,ChatGPT仍然擁有觀念優(yōu)勢。
RelationalAI公司機器學(xué)習(xí)研究副總裁Nikolaos Vasiloglou評論道,“放心,ChatGPT,肯定選你。它改變游戲規(guī)則的原因不僅在于其出色的AI功能,更在于其背后深厚的工程技術(shù)積累和無與倫比的運營成本?!?/p>
TravelAI公司CEO John Lyotier也認(rèn)為,“毫無疑問,ChatGPT就是最終贏家。它在公眾心目中成為AI的代表性形象,激發(fā)那些毫無技術(shù)背景的人們也愿意接納并使用,并通過ChatGPT向自己的親朋好友介紹AI技術(shù)。ChatGPT,就是‘獻(xiàn)給普通人的AI’。”
3D生成式AI平臺Atlas的CEO Ben James則指出,Llama正以ChatGPT做不到的方式重新點燃了技術(shù)界的研究熱情,這將帶來更強大、也更深遠(yuǎn)的影響。
“ChatGPT當(dāng)然是2023年最令人矚目的游戲規(guī)則改變者,但Llama將要改變的是未來的游戲規(guī)則?!?/p>
而我始終堅持自己的觀點,哪怕是著眼于2023年,贏家也仍然是Llama和開源AI,因為這會對2024年乃至更久遠(yuǎn)的未來產(chǎn)生影響。Forrester的Curran也抱有相同的看法,“即使沒有ChatGPT,2023年的生成式AI浪潮也已經(jīng)成型,只是也許沒有現(xiàn)在這么戲劇性。但一切已經(jīng)發(fā)生,而且與歷史上的其他前沿技術(shù)相比,現(xiàn)在有機會與這些先進(jìn)工具進(jìn)行交互、上手體驗的人數(shù)確實相當(dāng)驚人。”
他還強調(diào),開源模型,特別是像Llama 2這類已經(jīng)得到企業(yè)開發(fā)者廣泛采用的模型,正在為生成式AI的實地開發(fā)與進(jìn)步提供源源不斷的動力。
Curran表示,從長遠(yuǎn)來看,專有模型和開源模型都將在市場上擁有一席之地。但如果沒有開源社區(qū),那么生成式AI將只是個不太先進(jìn)、小眾化風(fēng)格強烈的市場,而不足以成為具有顛覆性潛力的技術(shù)。換言之,開源讓生成式AI真正能夠?qū)ζ胀ㄈ说墓ぷ骱蜕町a(chǎn)生方方面面的影響。
“開源社區(qū)已經(jīng)成為諸多深遠(yuǎn)影響的真正源頭,開源社區(qū)也必將決定生成式AI的未來命運?!?/p>
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




