- +1
AIGC和智能數(shù)字化新時(shí)代:媲美新石器時(shí)代的文明范式轉(zhuǎn)型

《AIGC:智能創(chuàng)作時(shí)代》,杜雨、張孜銘 著,中譯出版社2023年2月出版
2022年,在集群式和聚變式的科技革命中,人工智能生成內(nèi)容(AIGC,AI Generated Content)后來居上,以超出人們預(yù)期的速度成為科技革命歷史上的重大事件,迅速催生了全新的科技革命系統(tǒng)、格局和生態(tài),進(jìn)而深刻改變了思想、經(jīng)濟(jì)、政治和社會(huì)的演進(jìn)模式。
第一,AIGC的意義是實(shí)現(xiàn)人工智能“內(nèi)容”生成。人們主觀的感覺、認(rèn)知、思想、創(chuàng)造和表達(dá),以及人文科學(xué)、藝術(shù)和自然科學(xué)都要以具有實(shí)質(zhì)性的內(nèi)容作為基礎(chǔ)和前提。所以,沒有內(nèi)容就沒有人類文明。進(jìn)入互聯(lián)網(wǎng)時(shí)代后,產(chǎn)生了所謂專業(yè)生成內(nèi)容(PGC),也出現(xiàn)了以此作為職業(yè)獲得報(bào)酬的職業(yè)生成內(nèi)容(OGC)。與此同時(shí),“用戶生成內(nèi)容”(UGC)的概念和技術(shù)也逐漸發(fā)展,由此形成了用戶內(nèi)容生態(tài)。
內(nèi)容生產(chǎn)賦予了Web2.0的成熟和Web3.0時(shí)代的來臨。相較于PGC和OGC、UGC,AIGC通過人工智能技術(shù)實(shí)現(xiàn)內(nèi)容生成,并在生成中注入了“創(chuàng)作”,意味著自然智能所“獨(dú)有”和“壟斷”的寫作、繪畫、音樂、教育等創(chuàng)造性工作的歷史走向終結(jié)。內(nèi)容生成的四個(gè)階段如圖0-1所示。

圖0-1 內(nèi)容生成的四個(gè)階段
第二,AIGC的核心技術(shù)價(jià)值是實(shí)現(xiàn)了“自然語言”與人工智能的融合。自然語言是一個(gè)包括詞法、詞性、句法、語義的體系,也是不斷演進(jìn)的動(dòng)態(tài)體系。代表AIGC最新進(jìn)展的是由OpenAI公司開發(fā)的ChatGPT(Chat Generative Pre-trained Transformer)。它完成了機(jī)器學(xué)習(xí)算法發(fā)展中,自然語言處理領(lǐng)域的歷史性跨越,即通過大規(guī)模預(yù)訓(xùn)練模型,形成人工智能技術(shù)理解自然語言和文本生成能力,可以生成文字、語音、代碼、圖像、視頻,且能完成腳本編寫、文案撰寫、翻譯等任務(wù)。這是人類文明史上翻天覆地的革命,開啟了任何階層、任何職業(yè)都可以以任何自然語言和人工智能交流,并且生產(chǎn)出從美術(shù)作品到學(xué)術(shù)論文的多樣化內(nèi)容產(chǎn)品。在這樣的過程中,AIGC“異化”為一種理解、超越和生成各種自然語言文本的超級(jí)“系統(tǒng)”。
第三,AIGC的絕對(duì)優(yōu)勢(shì)是其邏輯能力。是否存在可以逐漸發(fā)展的邏輯推理能力,是人工智能與生俱來的挑戰(zhàn)。AIGC之所以迅速發(fā)展,是因?yàn)锳IGC基于代碼、云計(jì)算、技術(shù)操控?cái)?shù)據(jù)、模式識(shí)別,以及通過機(jī)器對(duì)文本內(nèi)容進(jìn)行描述、分辨、分類和解釋,實(shí)現(xiàn)了基于語言模型提示學(xué)習(xí)的推理,甚至是知識(shí)增強(qiáng)的推理,構(gòu)建了堅(jiān)實(shí)的“底層邏輯”。不僅如此,AIGC具備基于準(zhǔn)確和規(guī)模化數(shù)據(jù),形成包括學(xué)習(xí)、抉擇、嘗試、修正、推理,甚至根據(jù)環(huán)境反饋調(diào)整并修正自己行為的能力;它可以突破線性思維框架并實(shí)現(xiàn)非線性推理,也可以通過歸納、演繹、分析,實(shí)現(xiàn)對(duì)復(fù)雜邏輯關(guān)系的描述??梢院敛豢鋸埖卣f,AIGC已經(jīng)并繼續(xù)改變著21世紀(jì)邏輯學(xué)的面貌。
第四,AIGC實(shí)現(xiàn)了機(jī)器學(xué)習(xí)的集大成。21世紀(jì)的機(jī)器學(xué)習(xí)演化到了深度學(xué)習(xí)(Deep learning)階段。深度學(xué)習(xí)可以更有效地利用數(shù)據(jù)特征,形成深度學(xué)習(xí)算法,解決更為復(fù)雜的場(chǎng)景挑戰(zhàn)。2014年生成對(duì)抗網(wǎng)絡(luò)(GAN)的出現(xiàn),加速了深度學(xué)習(xí)在AIGC領(lǐng)域的應(yīng)用。AIGC實(shí)現(xiàn)了機(jī)器學(xué)習(xí)的集大成(圖0-2)。

圖0-2 機(jī)器學(xué)習(xí)常用算法
資料來源:程序員zhenguo(2023),“梳理機(jī)器學(xué)習(xí)常用算法(含深度學(xué)習(xí))”
第五,AIGC開創(chuàng)了“模型”主導(dǎo)內(nèi)容生成的時(shí)代。人類將跑步進(jìn)入傳統(tǒng)人類內(nèi)容創(chuàng)作和人工智能內(nèi)容生成并行的時(shí)代,進(jìn)而進(jìn)入后者逐漸走向主導(dǎo)位置的時(shí)代。這意味著傳統(tǒng)人類內(nèi)容創(chuàng)作互動(dòng)模式轉(zhuǎn)換為AIGC模型互動(dòng)模式。2022年是重要的歷史拐點(diǎn)(圖0-3)。

圖0-3 人類生成內(nèi)容向AIGC轉(zhuǎn)換趨勢(shì)
在自然語言處理(NLP)系統(tǒng)中,“Transformer”是一種融入注意力機(jī)制和神經(jīng)網(wǎng)絡(luò)模型領(lǐng)域的主流模型和關(guān)鍵技術(shù)。Transformer具有將所處理的任何文字和句子“向量”或者“矢量”化,最大限度反映精準(zhǔn)意義的能力。
總之,沒有Transformer,就沒有NLP的突破;沒有大模型化的AIGC,ChatGPT升級(jí)就沒有可能。多種重要、高效的Transformer的集合如圖0-4所示。

圖0-4 多種重要、高效的Transformer的集合模型
資料來源:Tay et al (2022), “Efficient Transformers: A Survey”, doi: 10.48550/arXiv.2009.06732
第六,AIGC開放性創(chuàng)造力的重要來源是擴(kuò)散(Diffusion)模型。擴(kuò)散模型的概念,最早在2015年的論文《利用非均衡熱力學(xué)的深度非監(jiān)督學(xué)習(xí)》(Deep Unsupervised Learning Using Nonequilibrium Thermodynamics)中被提出。2020年,論文《去噪擴(kuò)散概率模型》(Denoising Diffusion Probabilistic Models)中提出DDPM模型用于圖像生成。從技術(shù)的角度來看,擴(kuò)散模型是一個(gè)潛在變量(Latent Variable)模型,通過馬爾可夫鏈(Markov chain)映射到潛在空間。一般來說,AIGC因?yàn)槲{和依賴擴(kuò)散模型,而擁有開放性創(chuàng)造力。
2021年8月,斯坦福大學(xué)聯(lián)合眾多學(xué)者撰寫論文,將基于 Transformer架構(gòu)等的模型稱為“基礎(chǔ)模型”(Foundation model),也常譯作大模型。Transformer推動(dòng)了AI整個(gè)范式的轉(zhuǎn)變(圖0-5)。

圖0-5 基礎(chǔ)模型“transformer”
資料來源:Bommasani et al (2022), "On the Opportunities and Risks of Foundation Models", doi: 10.48550/arXiv.2108.07258
第七, AIGC的進(jìn)化是參數(shù)以幾何級(jí)數(shù)擴(kuò)展為基礎(chǔ)。AIGC的訓(xùn)練過程,就是調(diào)整變量和優(yōu)化參數(shù)的過程。所以,參數(shù)的規(guī)模是重要前提。聊天機(jī)器人ChatGPT的問世,標(biāo)志著AIGC形成以Transformer為架構(gòu)的大型語言模型(Large Language Model,簡稱LLM)機(jī)器學(xué)習(xí)系統(tǒng),通過自主地從數(shù)據(jù)中學(xué)習(xí),在對(duì)大量的文本數(shù)據(jù)集進(jìn)行訓(xùn)練后,可以輸出復(fù)雜的、類人的作品。
AIGC形成的學(xué)習(xí)能力取決于參數(shù)的規(guī)模。GPT-2大約有15億個(gè)參數(shù),而GPT-3最大的模型有1750億個(gè)參數(shù),上升了兩個(gè)數(shù)量級(jí)。而且,它不僅參數(shù)規(guī)模更大,訓(xùn)練所需的數(shù)據(jù)也更多。根據(jù)媒體報(bào)道但還未被證實(shí)的消息,GPT-4的參數(shù)可能將達(dá)到100萬億規(guī)模(圖0-6)。

圖0-6 GPT-4的參數(shù)規(guī)模
根據(jù)學(xué)界經(jīng)驗(yàn),深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和模型的參數(shù)規(guī)模呈正相關(guān)。人類的大腦皮層有140多億個(gè)神經(jīng)細(xì)胞,每個(gè)神經(jīng)細(xì)胞又有3萬多個(gè)突觸。所以,大腦皮層的突觸總數(shù)超過100萬億個(gè)。所謂的神經(jīng)細(xì)胞就是通過這些突觸相互建立聯(lián)系。假設(shè)GPT-4實(shí)現(xiàn)100萬億參數(shù)規(guī)模,堪比人的大腦,意味著它達(dá)到與人類大腦神經(jīng)觸點(diǎn)規(guī)模的同等水平。
第八,AIGC的算力需求呈現(xiàn)顯著增長。數(shù)據(jù)、算法、算力是人工智能的穩(wěn)定三要素。根據(jù)OpenAI分析,自2012年以來,6年間AI算力需求增長約30萬倍(圖0-7):

圖0-7 從AlexNet到AlphaGo Zero:30萬倍的運(yùn)算量增長
資料來源:OpenAI (2018),“AI and Compute”, https://openai.com/blog/ai-and-compute/
在可以預(yù)見的未來,在摩爾定律(Moore's Law)已走向失效的情況下,AI模型所需算力被預(yù)測(cè)每100天翻一倍,也就是“5年后AI所需算力超100萬倍”。造成這樣需求的根本原因是AI的算力不再是傳統(tǒng)算力,而是“智能算力”,是以多維度的“向量”集合作為算力基本單位。
第九,AIGC和硬技術(shù)相輔相成。從廣義上講,AIGC的硬技術(shù)是AI芯片,而且是經(jīng)過特殊設(shè)計(jì)和定制的AI芯片。AI芯片需要實(shí)現(xiàn)CPU、GPU、FPGA和DSP共存。隨著AIGC的發(fā)展, 計(jì)算技術(shù)的發(fā)展不再僅僅依靠通用芯片在制程工藝上的創(chuàng)新,而是結(jié)合多種創(chuàng)新方式,形成智能計(jì)算和計(jì)算智能技術(shù)。例如,根據(jù)應(yīng)用需求重新審視芯片、硬件和軟件的協(xié)同創(chuàng)新,即思考和探索新的計(jì)算架構(gòu),滿足日益巨大、復(fù)雜、多元的各種計(jì)算場(chǎng)景。其間,量子計(jì)算會(huì)得到突破性發(fā)展。
第十,AIGC將為區(qū)塊鏈、NFT、Web3.0和元宇宙帶來深層改變。AIGC不可枯竭的創(chuàng)造資源和能力,將從根本上改變目前的NFT概念生態(tài)。Web3.0結(jié)合區(qū)塊鏈、智能合約、加密貨幣等技術(shù),實(shí)現(xiàn)去中心化理念,而AIGC是滿足這個(gè)目標(biāo)的最佳工具和模式。
沒有懸念,在Web3.0環(huán)境下,AIGC內(nèi)容將出現(xiàn)指數(shù)級(jí)增長。元宇宙的本質(zhì)是社會(huì)系統(tǒng)、信息系統(tǒng)、物理環(huán)境形態(tài)通過數(shù)字構(gòu)成了一個(gè)動(dòng)態(tài)耦合的大系統(tǒng),需要大量的數(shù)字內(nèi)容來支撐,人工設(shè)計(jì)和開發(fā)根本無法滿足需求,AIGC可以最終完善元宇宙生態(tài)的底層基礎(chǔ)設(shè)施。隨著AIGC技術(shù)的逐漸成熟,傳統(tǒng)人類形態(tài)不可能進(jìn)入元宇宙這樣的虛擬世界。未來的元宇宙主體將是虛擬人,即經(jīng)過AIGC技術(shù),特別融合ChatGPT技術(shù),以代碼形式呈現(xiàn)的模型化的虛擬人。
簡言之,區(qū)塊鏈、NFT、Web3.0,將賦予AIGC進(jìn)化的契機(jī)。AIGC的進(jìn)化,將加速廣義數(shù)字孿生形態(tài)與物理形態(tài)的平行世界形成。
第十一,AIGC催生出全新的產(chǎn)業(yè)體系和商業(yè)化特征。AIGC利用人工智能學(xué)習(xí)各類數(shù)據(jù)自動(dòng)生成內(nèi)容,不僅能幫助提高內(nèi)容生成的效率,還能提高內(nèi)容的多樣性。文字生成、圖片繪制、視頻剪輯、游戲內(nèi)容生成皆可由AI替代,并正在加速實(shí)現(xiàn),使得AIGC進(jìn)而滲透和改造傳統(tǒng)產(chǎn)業(yè)結(jié)構(gòu)。在產(chǎn)業(yè)生態(tài)方面,AIGC領(lǐng)域正在加速形成三層產(chǎn)業(yè)生態(tài)并持續(xù)創(chuàng)新發(fā)展,正走向模型即服務(wù)(MaaS)的未來(圖0-8)。

圖0-8 AIGC產(chǎn)業(yè)結(jié)構(gòu)
資料來源:騰訊《AIGC發(fā)展趨勢(shì)報(bào)告》,2023年1月31日發(fā)布
伴隨AIGC生成算法的優(yōu)化與改進(jìn),AIGC對(duì)于普通人來說也不再是一門遙不可及的尖端技術(shù)。AIGC在文字、圖像、音頻、游戲和代碼生成中的商業(yè)模型漸顯。2B(to Business的簡稱)將是AIGC的主要商業(yè)模式,因?yàn)樗兄贐端提高效率和降低成本,以填補(bǔ)數(shù)字鴻溝。但可以預(yù)見,由于AIGC“原住民”的成長,2C(to Consumer的簡稱)的商業(yè)模式將接踵而來。根據(jù)有關(guān)機(jī)構(gòu)預(yù)測(cè),2030年的AIGC市場(chǎng)規(guī)模將超過萬億人民幣,其產(chǎn)業(yè)規(guī)模生態(tài)如圖0-9所示。

圖0-9 AIGC產(chǎn)業(yè)規(guī)模生態(tài)分布
資料來源:陳李,張良衛(wèi)(2023),“ChatGPT:又一個(gè)“人形機(jī)器人”,東吳證券https://www.nxny.com/report/view_5185573.html
現(xiàn)在,AIGC,特別是在語言模型領(lǐng)域的全方位競(jìng)爭(zhēng)已經(jīng)開始。所以,發(fā)生了微軟對(duì)OpenAI的大規(guī)模投資,因?yàn)橛羞@樣一種說法:“微軟下個(gè)十年的想象力,藏在ChatGPT里?!苯?,谷歌宣布推出基于“對(duì)話應(yīng)用語言模型”(LaMDA)的Bard,實(shí)現(xiàn)其搜索引擎將包括人工智能驅(qū)動(dòng)功能。ChatGPT刺激谷歌開始“創(chuàng)新者困境”突圍。未來很可能出現(xiàn)Bard和ChatGPT的對(duì)決或共存,也就是LaMDA和GPT-3.5的對(duì)決和共存,構(gòu)成AIGC競(jìng)爭(zhēng)和自然壟斷的新生態(tài)。
在這樣的新興產(chǎn)業(yè)構(gòu)造和商業(yè)模式下,就業(yè)市場(chǎng)將會(huì)發(fā)生根本性改變:其一,專業(yè)職場(chǎng)重組,相當(dāng)多的職業(yè)可能衰落和消亡;其二,原本支持IT和AI產(chǎn)業(yè)的碼農(nóng)隊(duì)伍面臨嚴(yán)重萎縮。因?yàn)锳IGC將極大地刺激全球外包模式并取代碼農(nóng)。
第十二,AIGC的法律影響和監(jiān)管。雖然AIGC這樣的新技術(shù)提供了很多希望,但也會(huì)給法律、社會(huì)和監(jiān)管帶來挑戰(zhàn)。在中國,繼2022年1月國家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部、國家市場(chǎng)監(jiān)督管理總局聯(lián)合發(fā)布《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》后,2022年11月,國家互聯(lián)網(wǎng)信息辦公室再次會(huì)同工業(yè)和信息化部、公安部聯(lián)合發(fā)布《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》。該規(guī)定的第五章第二十三條,對(duì)“深度合成技術(shù)”內(nèi)涵做了規(guī)定:“利用深度學(xué)習(xí)、虛擬現(xiàn)實(shí)等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場(chǎng)景等網(wǎng)絡(luò)信息的技術(shù)?!钡梢灶A(yù)見,由于AIGC的技術(shù)日趨復(fù)雜,并將得到高速發(fā)展,國家很難避免監(jiān)管缺乏專業(yè)性和滯后性。
第十三,AIGC正在引領(lǐng)人類加速逼近“科技奇點(diǎn)”。現(xiàn)在,人工智能已經(jīng)接管世界;世界正在經(jīng)歷一波人工智能驅(qū)動(dòng)的全球思想、文化、經(jīng)濟(jì)、社會(huì)和政治的轉(zhuǎn)型浪潮。AIGC呈現(xiàn)指數(shù)級(jí)的發(fā)展增速,開始重塑各個(gè)行業(yè)乃至全球的“數(shù)字化轉(zhuǎn)型”。說到底,這就是以AIGC為代表,以ChatGPT為標(biāo)志的轉(zhuǎn)型。這一切,在2023年會(huì)有長足的發(fā)展,特別是在資本和財(cái)富效益領(lǐng)域。
如果說,2022年8月的AI繪畫作品《太空歌劇院》(Théatre D’opéra Spatial)推動(dòng)AIGC進(jìn)入大眾視野,那么,ChatGPT的底層模型GPT-3.5是一個(gè)劃時(shí)代的產(chǎn)物。它與之前常見的語言模型(BERT/ BART/ T5)的區(qū)別幾乎是導(dǎo)彈與弓箭的區(qū)別。現(xiàn)在,呼之欲出的GPT-4,很可能通過圖靈測(cè)試。如果是這樣,不僅意味著GPT-4系統(tǒng)可以改造人類的思想和創(chuàng)作能力,形成人工智能超越專業(yè)化族群和大眾化趨勢(shì),而且意味著這個(gè)系統(tǒng)開始具備人類思維能力,并有可能在某些方面和越來越多的方面替代人類。
特別值得關(guān)注的是被稱為“人工智能激進(jìn)變革先鋒”的BLOOM(大型開放科學(xué)獲取多語言模型)的誕生。從2021年3月11日到2022年7月6日,60個(gè)國家和250多個(gè)機(jī)構(gòu)的1000多名研究人員,在法國巴黎南部的超級(jí)計(jì)算機(jī)上整整訓(xùn)練了117天,創(chuàng)造了BLOOM。這無疑是一場(chǎng)意義深遠(yuǎn)的歷史變革的前奏。
斯坦福大學(xué)心理學(xué)和計(jì)算機(jī)科學(xué)助理教授丹尼爾·亞明斯(Daniel Yamins)說過:“人工智能網(wǎng)絡(luò)并沒有直接模仿大腦,但最終看起來卻像大腦一樣,這在某種意義上表明,人工智能和自然之間似乎發(fā)生了某種趨同演化?!?/p>
2005年,雷·庫茨維爾(Ray Kurzweil,1948-)的巨著《奇點(diǎn)臨近:當(dāng)計(jì)算機(jī)智能超越人類》(The Singularity Is Near: When Humans Transcend Biology)出版。該書通過推算奇異點(diǎn)指數(shù)方程,得出了這樣一個(gè)結(jié)論: “在2045年左右,世界會(huì)出現(xiàn)一個(gè)奇異點(diǎn)。這件事必然是人類在某項(xiàng)重要科技上,突然有了爆炸性的突破,而這項(xiàng)科技將完全顛覆現(xiàn)有的人類社會(huì)。它不是像手機(jī)這種小的奇異點(diǎn),而是可以和人類誕生對(duì)等的超大奇異點(diǎn),甚至大到可以改變整個(gè)地球所有生命的運(yùn)作模式?!?/p>
現(xiàn)在處于狂飆發(fā)展?fàn)顟B(tài)的AIGC,一方面已經(jīng)開始呈指數(shù)形式膨脹,另一方面其“溢出效應(yīng)”正在改變?nèi)祟惐旧怼T谶@個(gè)過程中,所有原本看來離散和隨機(jī)的科技創(chuàng)新和科技革命成果,都開始了向AIGC技術(shù)的收斂,人工智能正在形成自我發(fā)育其和完善的內(nèi)在機(jī)制,
加速人類社會(huì)超越數(shù)字化時(shí)代,進(jìn)入智能數(shù)字化時(shí)代,逼近可能發(fā)生在2045年的“科技奇點(diǎn)”。
(作者朱嘉明為知名經(jīng)濟(jì)學(xué)家,橫琴數(shù)鏈數(shù)字金融研究院學(xué)術(shù)與技術(shù)委員會(huì)主席,本文為《AIGC:智能創(chuàng)作時(shí)代》一書代序,澎湃科技獲授權(quán)刊發(fā)。)





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




