- +1
智庫百人會 | 藍(lán)云:關(guān)于AI的三個(gè)層面思考、八句真話
編者按:3月23日下午,由馬洪基金會主辦的“智庫百人會春茗會”在銀湖CDI大廈舉辦。以下廣東省互聯(lián)網(wǎng)+大數(shù)據(jù)發(fā)展研究中心主任,北江區(qū)塊鏈人工智能研究院院長、教授藍(lán)云現(xiàn)場發(fā)言內(nèi)容整理以饗讀者。
各位智者、賢友,我專門從廣州過來,我為什么要來?因?yàn)楝F(xiàn)在很多城市都號稱在打造智慧型的城市,但是可能真正的“智”的含量不高。我們深圳有智者交流平臺,所以我跟秘書處的同志講,我一定要來。今天圍繞著人工智能AI,我主要圍繞三個(gè)層面講八句話,人類的未來、國際博弈及國家民族的未來、每個(gè)機(jī)構(gòu)及每個(gè)個(gè)體的未來。我將結(jié)合國家的“新質(zhì)生產(chǎn)力”戰(zhàn)略部署、廣東的“打造AI第一省”工作計(jì)劃,簡要講解。
(一)AI相當(dāng)于30年前的互聯(lián)網(wǎng)
AI是什么?AI是當(dāng)下最具顛覆性、最全面、最深入、最具影響力的技術(shù)變革,沒有之一。一定有一天,AI就像電、像蒸汽機(jī)、像互聯(lián)網(wǎng)一樣,將會改變所有人的生活。中國是1994年4月全面接入國際互聯(lián)網(wǎng)的,之后發(fā)生了什么、互聯(lián)網(wǎng)改變了我們什么,大家心知肚明。現(xiàn)在的AI,就是1994年、1995時(shí)的互聯(lián)網(wǎng)。1995年10月的北京深秋,在“中國硅谷”北京海淀中關(guān)村,突然矗立起了一塊視覺反差強(qiáng)烈的巨大廣告牌,上面寫著:“中國人離信息高速公路還有多遠(yuǎn)?向北1500米”。那么現(xiàn)在中國人離AI有多遠(yuǎn)?我的答案是:50厘米。也就是你的手指與你手機(jī)的距離。這是第一句話。
(二)“人類的群星閃耀時(shí)”
最近AI發(fā)生了一件什么事情?開源。往常大家都把大模型、參數(shù)、算法當(dāng)做寶貝,保險(xiǎn)柜里頭起碼要10把鎖、20把鎖鎖起來。但是有一些“反人類的行為”,2024年3月17日馬斯克開源3140億參數(shù)的Grok大模型。請注意,馬斯克旗下公司很多,他是Open AIAI公司的第一批投資股東,后來他和奧特曼分道揚(yáng)鑣了。開源是一種軟件開發(fā)和發(fā)布的模式,它指的是軟件的源代碼可以被任何人免費(fèi)獲取、修改和使用,而不受版權(quán)或?qū)@南拗?。硅谷巨頭的開源將帶來多種的外部性影響,正負(fù)的影響,近期全球多個(gè)區(qū)域新注冊的AI公司井噴,其中的道理大家都明白。
實(shí)事求是地說,馬斯克作為企業(yè)家、創(chuàng)業(yè)家、發(fā)明家、慈善家和未來主義者,這個(gè)人很有個(gè)性,也干了也一些不太好的事情,但是他至少有這么幾件事情很值得地球人類驕傲:開源特斯拉技術(shù)、開源SpaceX星鏈衛(wèi)星互聯(lián)網(wǎng)項(xiàng)目代碼、開源Neuralink腦機(jī)接口項(xiàng)目的部分代碼、探索火星等,還有這一次Grok大模型開源。很多時(shí)候我都會想起茨威格那本書,《人類的群星閃耀時(shí)》。這是第二句話。
(三)AI創(chuàng)新,關(guān)鍵在高端人才
第三句話,最近大半年來,很多朋友都在問我:藍(lán)云你現(xiàn)在也是大數(shù)據(jù)專家了,你說一說ChatGPT為什么不能誕生在我們中國,一定要說出真實(shí)的原因。我說你不要著急,你先看看ChatGPT是誰搞出來的,三個(gè)關(guān)鍵的人物,三個(gè)男人。第一個(gè)是Altman(奧特曼),1985年出生,猶太裔;第二個(gè)是馬斯克,第一批的投資方,就是奧特曼的金主,剛開始大家認(rèn)為說這個(gè)事情干不了,但是馬斯克毅然投了,馬斯克是1971年出生在南非;AI數(shù)據(jù)處理需要GPU、芯片,第三個(gè)男人就是黃仁勛,1963年出生在中國臺灣,9歲去了美國,后來創(chuàng)辦了英偉達(dá)。這三個(gè)人,看看這三個(gè)人的國籍跟區(qū)域等特點(diǎn),照國內(nèi)一些專家的觀點(diǎn)是美國雖然整體上在沒落,但是它確實(shí)還在“聚天下英才而用之”,就這一點(diǎn)其他各個(gè)國家、區(qū)域目前都無法比擬,這就是我對這個(gè)問題很簡要的回答。
這個(gè)問題,引申出兩個(gè)思考。第一,中央領(lǐng)導(dǎo)對高端人才的重要性看得非常清楚,已經(jīng)出臺了多項(xiàng)戰(zhàn)略聚攏英才,顏寧院士在深圳開創(chuàng)醫(yī)學(xué)科學(xué)院就是一件值得祝賀的事情。第二,經(jīng)歷新冠疫情,美國爆發(fā)出了ChatGPT,上一次經(jīng)歷2008全球金融危機(jī)后,美國爆發(fā)了比特幣、區(qū)塊鏈。為什么每一次重大社會或經(jīng)濟(jì)危機(jī)后,美國會有一次重大科技創(chuàng)新?對于這個(gè)問題,我還沒有完全想清楚,歡迎大家賜教。
(四)大模型的核心是基于概率的數(shù)理統(tǒng)計(jì)
第四句話,ChatGPT這么牛,到底是什么樣的技術(shù)原理?這有點(diǎn)復(fù)雜,我用一兩分鐘簡單的科普一下,GPT(Generative Pre-Trained)就是一套生成式預(yù)訓(xùn)練系統(tǒng),它的數(shù)據(jù)庫、模型都是已經(jīng)生成好的,訓(xùn)練好的,訓(xùn)練有素的大模型,大數(shù)據(jù)庫的系統(tǒng)。它模仿的是人的生物神經(jīng)網(wǎng)絡(luò),就是這種輸入、輸出,中間大腦的結(jié)構(gòu)過程你是不知道的。比如,門口來了一只“貓”,我們?nèi)藨{什么認(rèn)定它是貓?我們小的時(shí)候認(rèn)貓是怎么認(rèn)的?經(jīng)過無數(shù)次的失敗的訓(xùn)練,大人、老師、身邊的朋友,反正我也不知道我怎么判斷它是貓,我只知道那就是貓,就是這種無數(shù)次的訓(xùn)練,對了就獎勵你,不對的話“啪”一個(gè)巴掌懲罰,大模型就是通過模仿人類深度的神經(jīng)網(wǎng)絡(luò),里頭的線條很長,非常長,橫的倒過來就成了“深度”了。這是它模仿的生物的神經(jīng)網(wǎng)絡(luò),“人工智能”這個(gè)概念1956年誕生,但中間走了很多彎路,后來發(fā)現(xiàn)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)這條路能走通了,中間很多曲曲折折。
現(xiàn)在AI也會寫文章,寫文章背后是什么?基于概率學(xué)的數(shù)學(xué)算法。比如說“中國的首都”,下文接什么?它會通過上下文進(jìn)行判斷,多個(gè)選項(xiàng)中“很美麗、在北方、有天安門、是北京”,通過上下文進(jìn)行判斷,分析說哪個(gè)概率高,就把它蹦出來。我們以現(xiàn)場的李羅力理事長為例,上文是“大家今天見到的理事長”,下文有多個(gè)選項(xiàng)“很帥、在聽報(bào)告、在主持、笑了”,這里頭每個(gè)東西、每個(gè)選項(xiàng)它怎么蹦出來?根據(jù)上下文??茨愕哪欠N語境,還有你的模型結(jié)果,綜合其他的要素。這里頭都是大數(shù)據(jù)的分析,每個(gè)都是基于概率寫的。詞語接龍而已,因?yàn)樗俣瓤?,你認(rèn)為它在寫文章,其實(shí)它在詞語接龍。
很多人說大模型到底“大”在哪里?一個(gè)小事例。馬車多少個(gè)零件?幾十個(gè)。汽車多少個(gè)零件?幾萬個(gè)。航天飛機(jī)多少個(gè)零件?250萬個(gè)。剛剛我們講過,Grok 大模型3000多億的參數(shù),GPT3.5是2000多億個(gè)參數(shù)。大家就能知道它里頭大模型的這種復(fù)雜度,以及它背后牽扯到的算法、模型,也知道說很多東西為什么只有美國科技巨頭、科技狂人才搞得出來。
(五)基辛格博士、倪光南院士的思考
AI已經(jīng)把全世界搞得大亂了,基本上每個(gè)人都在談?wù)撨@個(gè)事情,我們很熟知的中國人的老朋友基辛格博士。他的最后的遺作,講的就是《人工智能時(shí)代與人類的未來》,這本書400多頁,有點(diǎn)長,書的核心意思就是一句話:就是人類還沒有完全準(zhǔn)備好,AI已經(jīng)來了。政治沒有準(zhǔn)備好,外交沒有準(zhǔn)備好,技術(shù)沒有準(zhǔn)備好,倫理也沒有準(zhǔn)備好,法律也沒有準(zhǔn)備好,社會環(huán)境也沒有準(zhǔn)備好,家庭也沒準(zhǔn)備好……AI已經(jīng)來了。老爺子講的就是這個(gè)意思。
全球很多有識之士呼吁對人工智能(AI)進(jìn)行緊急監(jiān)管,將其當(dāng)作“與瘟疫和核武器一樣的全球優(yōu)先事項(xiàng)”,以避免人工智能“帶來滅絕風(fēng)險(xiǎn)”它。現(xiàn)在歐盟已經(jīng)出臺了管控AI的全球首部法律。這個(gè)問題2018年的時(shí)候我在廣州南沙請教過倪光南院士。倪院士跟我講AI可以代替普通人的工作,但是天才很難代替,“尤其是類似愛因斯坦的天才,AI很難代替”。倪院士站得高,望得遠(yuǎn),我們都很尊敬他。
Sora生成的與自然界迥異的圖片。圖左來自互聯(lián)網(wǎng),四腳螞蟻。圖右由藍(lán)云獨(dú)家提供,后腦勺在前的男子。(摘自藍(lán)云課件)
(六)Sora能不能模擬全世界?
第六,Sora能不能能模擬全世界,能不能搞平行時(shí)空?奧特曼的OpenAI公司有三大產(chǎn)品,除了對話大模型ChatGPT、繪圖大模型DALL·E,另一個(gè)就是后來推出文生視頻大模型Sora。對于號稱“世界模擬器”的Sora,業(yè)界有一些不同的觀點(diǎn),基于大模型它會產(chǎn)生一些認(rèn)知的悖論、可能基于系統(tǒng)先天缺陷的悖論。大家看一下這張圖,螞蟻有多少條腿,都知道是六條腿,但是Sora生成的螞蟻是四條腿。另外一張,這是我獨(dú)家生成的圖片,后腦勺在前的男子,這就是Sora做出來的。所以Sora能不能模擬世界,其實(shí)是一個(gè)有待深入討論、有疑義的話題。圖靈獎得主楊立昆(Yann LeCun)對Sora的局限性,有深入分析,大家可以找來看看。需要說明的是,AI還在快速迭代中。
(七)中美大模型之間的博弈問題
第七句話,是中美大模型之間的博弈問題,這種差距會不會拉的越來越遠(yuǎn)?有段時(shí)間我比較悲觀,但是有一天我明白了,美國科技的井噴,它有兩三年的快速成長期,這兩三年快速成長期你是干不了什么事的,你只能跟著,但是它不可能年年都有快速井噴期,它會經(jīng)歷一段時(shí)間的醞釀平整期,后續(xù)10、20年是我們中國大量的機(jī)會。這張圖“LY-AI曲線”我跟大家報(bào)告一下,是我原創(chuàng)的,也是為了今天的活動,有一天洗澡的時(shí)候我想出來的,在“3+20”時(shí)間周期里面有中國產(chǎn)業(yè)的大把機(jī)會,這就是中國的機(jī)會。包括互聯(lián)網(wǎng)也是這樣的,互聯(lián)網(wǎng)也是美國人發(fā)明的,中國后來快速應(yīng)用,但是我們應(yīng)用得比別人好,應(yīng)用出了特色,應(yīng)用出了風(fēng)格,應(yīng)用出了中華的魅力。
(八)大模型的垂直化、行業(yè)應(yīng)用,“小模型”
最后一句話。對于現(xiàn)在黨政機(jī)構(gòu),我勸他們都不要搞大模型,大模型都是死路一條,沒法跟美國硅谷巨頭直接競爭。要干什么?要干“小模型”。我?guī)韮蓚€(gè)案例,廣州有個(gè)區(qū)用AI來寫公文,黨政的公文,這種大模型是干不了的,為什么?因?yàn)榇竽P蜎]有語料去喂它,去訓(xùn)練它的模型,這是黨政部門的優(yōu)勢,因?yàn)辄h政的公文系統(tǒng)不可能向ChatGPT開放,那你要怎么干?我自己搞個(gè)大模型,自己訓(xùn)練,模型部署在自己的服務(wù)器,自己來用。另外,廣州市越秀區(qū)有一個(gè)AI社交的機(jī)器人也是部署在自己的小模型上,這是全省第一個(gè)AI私聊政務(wù)機(jī)器人,精準(zhǔn)服務(wù)市民,獲得了第二屆“粵有數(shù)”數(shù)字化治理優(yōu)秀案例獎。
面對AI潮流,對于個(gè)人來說是怎么辦?早點(diǎn)學(xué),主動學(xué),快點(diǎn)學(xué),全面學(xué),翻譯成互聯(lián)網(wǎng)話語就是:早死早投胎,早學(xué)早解放。對于當(dāng)下的小朋友教育,大家不用過度擔(dān)心,只要身體好、心理素質(zhì)好、有創(chuàng)新能力,其他不用太多擔(dān)心,有AI、腦機(jī)接口等給我們服務(wù)。
我就講這些,謝謝大家。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




