智庫百人會 | 藍(lán)云：關(guān)于AI的三個(gè)層面思考、八句真話

2024-04-11 12:20

來源：澎湃新聞·澎湃號·政務(wù)

編者按：3月23日下午，由馬洪基金會主辦的“智庫百人會春茗會”在銀湖CDI大廈舉辦。以下廣東省互聯(lián)網(wǎng)+大數(shù)據(jù)發(fā)展研究中心主任，北江區(qū)塊鏈人工智能研究院院長、教授藍(lán)云現(xiàn)場發(fā)言內(nèi)容整理以饗讀者。

各位智者、賢友，我專門從廣州過來，我為什么要來？因?yàn)楝F(xiàn)在很多城市都號稱在打造智慧型的城市，但是可能真正的“智”的含量不高。我們深圳有智者交流平臺，所以我跟秘書處的同志講，我一定要來。今天圍繞著人工智能AI，我主要圍繞三個(gè)層面講八句話，人類的未來、國際博弈及國家民族的未來、每個(gè)機(jī)構(gòu)及每個(gè)個(gè)體的未來。我將結(jié)合國家的“新質(zhì)生產(chǎn)力”戰(zhàn)略部署、廣東的“打造AI第一省”工作計(jì)劃，簡要講解。

（一）AI相當(dāng)于30年前的互聯(lián)網(wǎng)

AI是什么？AI是當(dāng)下最具顛覆性、最全面、最深入、最具影響力的技術(shù)變革，沒有之一。一定有一天，AI就像電、像蒸汽機(jī)、像互聯(lián)網(wǎng)一樣，將會改變所有人的生活。中國是1994年4月全面接入國際互聯(lián)網(wǎng)的，之后發(fā)生了什么、互聯(lián)網(wǎng)改變了我們什么，大家心知肚明。現(xiàn)在的AI，就是1994年、1995時(shí)的互聯(lián)網(wǎng)。1995年10月的北京深秋，在“中國硅谷”北京海淀中關(guān)村，突然矗立起了一塊視覺反差強(qiáng)烈的巨大廣告牌，上面寫著：“中國人離信息高速公路還有多遠(yuǎn)？向北1500米”。那么現(xiàn)在中國人離AI有多遠(yuǎn)？我的答案是：50厘米。也就是你的手指與你手機(jī)的距離。這是第一句話。

（二）“人類的群星閃耀時(shí)”

最近AI發(fā)生了一件什么事情？開源。往常大家都把大模型、參數(shù)、算法當(dāng)做寶貝，保險(xiǎn)柜里頭起碼要10把鎖、20把鎖鎖起來。但是有一些“反人類的行為”，2024年3月17日馬斯克開源3140億參數(shù)的Grok大模型。請注意，馬斯克旗下公司很多，他是Open AIAI公司的第一批投資股東，后來他和奧特曼分道揚(yáng)鑣了。開源是一種軟件開發(fā)和發(fā)布的模式，它指的是軟件的源代碼可以被任何人免費(fèi)獲取、修改和使用，而不受版權(quán)或?qū)＠南拗?。硅谷巨頭的開源將帶來多種的外部性影響，正負(fù)的影響，近期全球多個(gè)區(qū)域新注冊的AI公司井噴，其中的道理大家都明白。

實(shí)事求是地說，馬斯克作為企業(yè)家、創(chuàng)業(yè)家、發(fā)明家、慈善家和未來主義者，這個(gè)人很有個(gè)性，也干了也一些不太好的事情，但是他至少有這么幾件事情很值得地球人類驕傲：開源特斯拉技術(shù)、開源SpaceX星鏈衛(wèi)星互聯(lián)網(wǎng)項(xiàng)目代碼、開源Neuralink腦機(jī)接口項(xiàng)目的部分代碼、探索火星等，還有這一次Grok大模型開源。很多時(shí)候我都會想起茨威格那本書，《人類的群星閃耀時(shí)》。這是第二句話。

（三）AI創(chuàng)新，關(guān)鍵在高端人才

第三句話，最近大半年來，很多朋友都在問我：藍(lán)云你現(xiàn)在也是大數(shù)據(jù)專家了，你說一說ChatGPT為什么不能誕生在我們中國，一定要說出真實(shí)的原因。我說你不要著急，你先看看ChatGPT是誰搞出來的，三個(gè)關(guān)鍵的人物，三個(gè)男人。第一個(gè)是Altman（奧特曼），1985年出生，猶太裔；第二個(gè)是馬斯克，第一批的投資方，就是奧特曼的金主，剛開始大家認(rèn)為說這個(gè)事情干不了，但是馬斯克毅然投了，馬斯克是1971年出生在南非；AI數(shù)據(jù)處理需要GPU、芯片，第三個(gè)男人就是黃仁勛，1963年出生在中國臺灣，9歲去了美國，后來創(chuàng)辦了英偉達(dá)。這三個(gè)人，看看這三個(gè)人的國籍跟區(qū)域等特點(diǎn)，照國內(nèi)一些專家的觀點(diǎn)是美國雖然整體上在沒落，但是它確實(shí)還在“聚天下英才而用之”，就這一點(diǎn)其他各個(gè)國家、區(qū)域目前都無法比擬，這就是我對這個(gè)問題很簡要的回答。

這個(gè)問題，引申出兩個(gè)思考。第一，中央領(lǐng)導(dǎo)對高端人才的重要性看得非常清楚，已經(jīng)出臺了多項(xiàng)戰(zhàn)略聚攏英才，顏寧院士在深圳開創(chuàng)醫(yī)學(xué)科學(xué)院就是一件值得祝賀的事情。第二，經(jīng)歷新冠疫情，美國爆發(fā)出了ChatGPT，上一次經(jīng)歷2008全球金融危機(jī)后，美國爆發(fā)了比特幣、區(qū)塊鏈。為什么每一次重大社會或經(jīng)濟(jì)危機(jī)后，美國會有一次重大科技創(chuàng)新？對于這個(gè)問題，我還沒有完全想清楚，歡迎大家賜教。

（四）大模型的核心是基于概率的數(shù)理統(tǒng)計(jì)

第四句話，ChatGPT這么牛，到底是什么樣的技術(shù)原理？這有點(diǎn)復(fù)雜，我用一兩分鐘簡單的科普一下，GPT（Generative Pre-Trained）就是一套生成式預(yù)訓(xùn)練系統(tǒng)，它的數(shù)據(jù)庫、模型都是已經(jīng)生成好的，訓(xùn)練好的，訓(xùn)練有素的大模型，大數(shù)據(jù)庫的系統(tǒng)。它模仿的是人的生物神經(jīng)網(wǎng)絡(luò)，就是這種輸入、輸出，中間大腦的結(jié)構(gòu)過程你是不知道的。比如，門口來了一只“貓”，我們?nèi)藨{什么認(rèn)定它是貓？我們小的時(shí)候認(rèn)貓是怎么認(rèn)的？經(jīng)過無數(shù)次的失敗的訓(xùn)練，大人、老師、身邊的朋友，反正我也不知道我怎么判斷它是貓，我只知道那就是貓，就是這種無數(shù)次的訓(xùn)練，對了就獎勵你，不對的話“啪”一個(gè)巴掌懲罰，大模型就是通過模仿人類深度的神經(jīng)網(wǎng)絡(luò)，里頭的線條很長，非常長，橫的倒過來就成了“深度”了。這是它模仿的生物的神經(jīng)網(wǎng)絡(luò)，“人工智能”這個(gè)概念1956年誕生，但中間走了很多彎路，后來發(fā)現(xiàn)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)這條路能走通了，中間很多曲曲折折。

現(xiàn)在AI也會寫文章，寫文章背后是什么？基于概率學(xué)的數(shù)學(xué)算法。比如說“中國的首都”，下文接什么？它會通過上下文進(jìn)行判斷，多個(gè)選項(xiàng)中“很美麗、在北方、有天安門、是北京”，通過上下文進(jìn)行判斷，分析說哪個(gè)概率高，就把它蹦出來。我們以現(xiàn)場的李羅力理事長為例，上文是“大家今天見到的理事長”，下文有多個(gè)選項(xiàng)“很帥、在聽報(bào)告、在主持、笑了”，這里頭每個(gè)東西、每個(gè)選項(xiàng)它怎么蹦出來？根據(jù)上下文?？茨愕哪欠N語境，還有你的模型結(jié)果，綜合其他的要素。這里頭都是大數(shù)據(jù)的分析，每個(gè)都是基于概率寫的。詞語接龍而已，因?yàn)樗俣瓤?，你認(rèn)為它在寫文章，其實(shí)它在詞語接龍。

很多人說大模型到底“大”在哪里？一個(gè)小事例。馬車多少個(gè)零件？幾十個(gè)。汽車多少個(gè)零件？幾萬個(gè)。航天飛機(jī)多少個(gè)零件？250萬個(gè)。剛剛我們講過，Grok 大模型3000多億的參數(shù)，GPT3.5是2000多億個(gè)參數(shù)。大家就能知道它里頭大模型的這種復(fù)雜度，以及它背后牽扯到的算法、模型，也知道說很多東西為什么只有美國科技巨頭、科技狂人才搞得出來。

（五）基辛格博士、倪光南院士的思考

AI已經(jīng)把全世界搞得大亂了，基本上每個(gè)人都在談?wù)撨@個(gè)事情，我們很熟知的中國人的老朋友基辛格博士。他的最后的遺作，講的就是《人工智能時(shí)代與人類的未來》，這本書400多頁，有點(diǎn)長，書的核心意思就是一句話：就是人類還沒有完全準(zhǔn)備好，AI已經(jīng)來了。政治沒有準(zhǔn)備好，外交沒有準(zhǔn)備好，技術(shù)沒有準(zhǔn)備好，倫理也沒有準(zhǔn)備好，法律也沒有準(zhǔn)備好，社會環(huán)境也沒有準(zhǔn)備好，家庭也沒準(zhǔn)備好……AI已經(jīng)來了。老爺子講的就是這個(gè)意思。

全球很多有識之士呼吁對人工智能（AI）進(jìn)行緊急監(jiān)管，將其當(dāng)作“與瘟疫和核武器一樣的全球優(yōu)先事項(xiàng)”，以避免人工智能“帶來滅絕風(fēng)險(xiǎn)”它。現(xiàn)在歐盟已經(jīng)出臺了管控AI的全球首部法律。這個(gè)問題2018年的時(shí)候我在廣州南沙請教過倪光南院士。倪院士跟我講AI可以代替普通人的工作，但是天才很難代替，“尤其是類似愛因斯坦的天才，AI很難代替”。倪院士站得高，望得遠(yuǎn)，我們都很尊敬他。

Sora生成的與自然界迥異的圖片。圖左來自互聯(lián)網(wǎng)，四腳螞蟻。圖右由藍(lán)云獨(dú)家提供，后腦勺在前的男子。（摘自藍(lán)云課件）

（六）Sora能不能模擬全世界？

第六，Sora能不能能模擬全世界，能不能搞平行時(shí)空？奧特曼的OpenAI公司有三大產(chǎn)品，除了對話大模型ChatGPT、繪圖大模型DALL·E，另一個(gè)就是后來推出文生視頻大模型Sora。對于號稱“世界模擬器”的Sora，業(yè)界有一些不同的觀點(diǎn)，基于大模型它會產(chǎn)生一些認(rèn)知的悖論、可能基于系統(tǒng)先天缺陷的悖論。大家看一下這張圖，螞蟻有多少條腿，都知道是六條腿，但是Sora生成的螞蟻是四條腿。另外一張，這是我獨(dú)家生成的圖片，后腦勺在前的男子，這就是Sora做出來的。所以Sora能不能模擬世界，其實(shí)是一個(gè)有待深入討論、有疑義的話題。圖靈獎得主楊立昆（Yann LeCun）對Sora的局限性，有深入分析，大家可以找來看看。需要說明的是，AI還在快速迭代中。

（七）中美大模型之間的博弈問題

第七句話，是中美大模型之間的博弈問題，這種差距會不會拉的越來越遠(yuǎn)？有段時(shí)間我比較悲觀，但是有一天我明白了，美國科技的井噴，它有兩三年的快速成長期，這兩三年快速成長期你是干不了什么事的，你只能跟著，但是它不可能年年都有快速井噴期，它會經(jīng)歷一段時(shí)間的醞釀平整期，后續(xù)10、20年是我們中國大量的機(jī)會。這張圖“LY-AI曲線”我跟大家報(bào)告一下，是我原創(chuàng)的，也是為了今天的活動，有一天洗澡的時(shí)候我想出來的，在“3+20”時(shí)間周期里面有中國產(chǎn)業(yè)的大把機(jī)會，這就是中國的機(jī)會。包括互聯(lián)網(wǎng)也是這樣的，互聯(lián)網(wǎng)也是美國人發(fā)明的，中國后來快速應(yīng)用，但是我們應(yīng)用得比別人好，應(yīng)用出了特色，應(yīng)用出了風(fēng)格，應(yīng)用出了中華的魅力。

（八）大模型的垂直化、行業(yè)應(yīng)用，“小模型”

最后一句話。對于現(xiàn)在黨政機(jī)構(gòu)，我勸他們都不要搞大模型，大模型都是死路一條，沒法跟美國硅谷巨頭直接競爭。要干什么？要干“小模型”。我?guī)韮蓚€(gè)案例，廣州有個(gè)區(qū)用AI來寫公文，黨政的公文，這種大模型是干不了的，為什么？因?yàn)榇竽Ｐ蜎]有語料去喂它，去訓(xùn)練它的模型，這是黨政部門的優(yōu)勢，因?yàn)辄h政的公文系統(tǒng)不可能向ChatGPT開放，那你要怎么干？我自己搞個(gè)大模型，自己訓(xùn)練，模型部署在自己的服務(wù)器，自己來用。另外，廣州市越秀區(qū)有一個(gè)AI社交的機(jī)器人也是部署在自己的小模型上，這是全省第一個(gè)AI私聊政務(wù)機(jī)器人，精準(zhǔn)服務(wù)市民，獲得了第二屆“粵有數(shù)”數(shù)字化治理優(yōu)秀案例獎。

面對AI潮流，對于個(gè)人來說是怎么辦？早點(diǎn)學(xué)，主動學(xué)，快點(diǎn)學(xué)，全面學(xué)，翻譯成互聯(lián)網(wǎng)話語就是：早死早投胎，早學(xué)早解放。對于當(dāng)下的小朋友教育，大家不用過度擔(dān)心，只要身體好、心理素質(zhì)好、有創(chuàng)新能力，其他不用太多擔(dān)心，有AI、腦機(jī)接口等給我們服務(wù)。

我就講這些，謝謝大家。

特別聲明

本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報(bào)

#AI #Sora #春茗會 #智庫百人會