欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

MIT最新研究:多個(gè)AI協(xié)作有助提高大模型推理能力和準(zhǔn)確性

澎湃新聞?dòng)浾?邵文
2023-09-20 07:19
來(lái)源:澎湃新聞
? 未來(lái)2% >
字號(hào)

·麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)研究團(tuán)隊(duì)發(fā)現(xiàn),多個(gè)語(yǔ)言模型協(xié)同工作勝過(guò)單一模型,多個(gè)AI協(xié)作有助于提高大型語(yǔ)言模型的推理能力和事實(shí)準(zhǔn)確性。

·每個(gè)語(yǔ)言模型都生成對(duì)給定問(wèn)題的回答,然后整合來(lái)自其他代理的反饋,以更新自己的回應(yīng)。最終,多個(gè)模型的解決方案通過(guò)投票達(dá)成一致的最終輸出。這一過(guò)程有點(diǎn)像小組討論。

一種新穎的方法允許多種語(yǔ)言模型進(jìn)行協(xié)作,經(jīng)過(guò)多輪辯論,最終得出統(tǒng)一且精確的響應(yīng)。
圖片來(lái)源:Alex Shipps/MIT CSAIL,來(lái)自Midjourney

當(dāng)?shù)貢r(shí)間9月18日,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的團(tuán)隊(duì)在其官網(wǎng)更新了一項(xiàng)研究:發(fā)現(xiàn)多個(gè)語(yǔ)言模型協(xié)同工作勝過(guò)單一模型,多個(gè)AI協(xié)作有助于提高大型語(yǔ)言模型的推理能力和事實(shí)準(zhǔn)確性。

俗話說(shuō)“三個(gè)臭皮匠,頂個(gè)諸葛亮”。簡(jiǎn)單而言,這項(xiàng)研究利用多個(gè)AI系統(tǒng)互相協(xié)作,以協(xié)商、辯論的方式以達(dá)成對(duì)給定問(wèn)題的最佳答案。這種方法提高了大語(yǔ)言模型對(duì)事實(shí)數(shù)據(jù)的依從性和改進(jìn)決策的能力。

大型語(yǔ)言模型(LLM)長(zhǎng)期存在的問(wèn)題之一是,其生成的回答不一致,可能有不準(zhǔn)確和錯(cuò)誤的推理。而新方法允許每個(gè)智能體(agent)積極評(píng)估其他智能體的回答,并利用這些集體反饋來(lái)完善自己的回答。

這一過(guò)程包括多輪的回應(yīng)生成和批判,每個(gè)語(yǔ)言模型都生成對(duì)給定問(wèn)題的回答,然后整合來(lái)自其他代理的反饋,以更新自己的回應(yīng)。最終,多個(gè)模型的解決方案通過(guò)投票達(dá)成一致的最終輸出。這一過(guò)程有點(diǎn)像小組討論,個(gè)體一起努力達(dá)成一致和合理的結(jié)論。

這一技術(shù)的一個(gè)顯著優(yōu)點(diǎn)在于,它可以無(wú)縫應(yīng)用于現(xiàn)有的“黑匣子”模型(指難以知曉其內(nèi)部運(yùn)行過(guò)程),因?yàn)檫@個(gè)方法基于生成出的文本,而無(wú)需明晰其內(nèi)部工作原理。CSAIL團(tuán)隊(duì)表示,這種簡(jiǎn)化可以幫助研究人員和開發(fā)者改進(jìn)各種語(yǔ)言模型輸出的一致性和事實(shí)準(zhǔn)確性。

“我們不僅僅依賴于單一的AI模型來(lái)提供答案,相反,我們讓眾多的AI模型參與,每個(gè)模型都帶來(lái)獨(dú)特的見(jiàn)解以解決問(wèn)題。盡管它們的初始回應(yīng)可能顯得簡(jiǎn)單或包含錯(cuò)誤,但這些模型可以通過(guò)審查其同行提供的回應(yīng)來(lái)改進(jìn)和提高自己的回答?!甭槭±砉W(xué)院電氣工程和計(jì)算機(jī)科學(xué)博士生、CSAIL附屬成員以及論文的首席作者之一Yilun Du說(shuō)道。

根據(jù)Yilun Du的個(gè)人主頁(yè),他目前正在攻讀博士,此前已獲得麻省理工學(xué)院學(xué)士學(xué)位,曾在ChatGPT的開發(fā)機(jī)構(gòu)OpenAI擔(dān)任研究員,在Facebook人工智能研究所(FAIR)和Google Deepmind擔(dān)任實(shí)習(xí)生和訪問(wèn)研究員,并在國(guó)際生物奧林匹克競(jìng)賽中獲得金牌。有趣的是,他曾在TED發(fā)表題為《為什么機(jī)器人需要夢(mèng)想》的演講。

“當(dāng)這些AI模型參與對(duì)話和思考時(shí),它們更能夠識(shí)別和糾正問(wèn)題,增強(qiáng)解決問(wèn)題的能力,并更好地驗(yàn)證其回應(yīng)的準(zhǔn)確性?;旧希覀冋趧?chuàng)造一種迫使它們深入問(wèn)題核心的環(huán)境。這與單一的孤立的AI模型形成對(duì)比,后者經(jīng)常復(fù)制互聯(lián)網(wǎng)上找到的內(nèi)容。然而,我們的方法積極刺激了AI模型制定更準(zhǔn)確和全面解決方案的能力?!盰ilun Du說(shuō)。

此項(xiàng)研究涉及數(shù)學(xué)問(wèn)題的解決,包括小學(xué)和初高中的數(shù)學(xué)問(wèn)題,并通過(guò)多智能體辯論顯著提高了性能。該方法還可以幫助解決經(jīng)常困擾大語(yǔ)言模型的“幻覺(jué)”問(wèn)題。通過(guò)設(shè)計(jì)這樣的環(huán)境,智能體之間可以批判對(duì)方的回應(yīng),更有動(dòng)力避免隨機(jī)生成信息并優(yōu)先考慮事實(shí)準(zhǔn)確性。

除了應(yīng)用于語(yǔ)言模型,該方法還可以用于整合具有專門能力的不同模型。通過(guò)建立一個(gè)多智能體相互交互和辯論的去中心化系統(tǒng),它們可以潛在地在語(yǔ)音、視頻或文本等各種模式下提高問(wèn)題解決能力。不過(guò)研究人員表示,當(dāng)處理非常長(zhǎng)的上下文時(shí),現(xiàn)有的語(yǔ)言模型可能面臨挑戰(zhàn),批判能力可能表現(xiàn)得不如預(yù)期。

此外,多智能體辯論形式尚未包括有助于智能集體決策的更復(fù)雜形式的討論。據(jù)研究團(tuán)隊(duì)透露,這正將是未來(lái)探索的關(guān)鍵領(lǐng)域。推進(jìn)這項(xiàng)技術(shù)可能需要更深入地了解人類辯論和討論背后的計(jì)算基礎(chǔ),并使用這些模型來(lái)增強(qiáng)或補(bǔ)充現(xiàn)有的大語(yǔ)言模型。

Yilun Du認(rèn)為,隨著研究人員繼續(xù)完善和探索這種方法,人們可以更接近一個(gè)未來(lái),在這個(gè)未來(lái),語(yǔ)言模型不僅模仿人類語(yǔ)言,還表現(xiàn)出更系統(tǒng)化和可靠的思維,開創(chuàng)語(yǔ)言理解和應(yīng)用的新時(shí)代。

“利用審議過(guò)程來(lái)改善模型的整體輸出非常有道理,這是從思維鏈的提示中邁出的一大步。”加利福尼亞大學(xué)伯克利分校電氣工程與計(jì)算機(jī)科學(xué)系副教授、未參與該項(xiàng)工作的安卡·德拉甘說(shuō),“我對(duì)接下來(lái)的發(fā)展感到興奮。當(dāng)人們看到辯論時(shí),他們是否能更好地判斷大語(yǔ)言模型的答案?人們是否通過(guò)自己與大語(yǔ)言模型辯論來(lái)得出更好的答案?是否可以使用類似的思想來(lái)幫助用戶審查大語(yǔ)言模型給出的答案,以得出更好的答案?”

    責(zé)任編輯:鄭潔
    校對(duì):劉威
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司