- +1
暴雪皮克斯老兵的AI社交實(shí)驗(yàn):用聲音匹配,MAU破260萬,估值1.5億美金
允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
AI正在殺死社交,但有人想用AI救回它。
想象一下:你在社交App刷到一張近乎完美的頭像,點(diǎn)開主頁,自我介紹幽默且真誠。
你發(fā)去消息,對(duì)方秒回,字里行間恰到好處。
但這種“完美”背后,隱約透著一絲冷意,不禁產(chǎn)生質(zhì)疑:這張臉是生成的嗎?這段話是Agent代寫的嗎?
照片可以P、視頻可以合成、文字可以由AI實(shí)時(shí)潤色,社交產(chǎn)品的底層假設(shè)——“信息可信度”正在全面崩塌。
在這一背景下,一款名為森森(Gensen)的產(chǎn)品給出了一個(gè)反直覺的答案。今年春節(jié),這款主打“聲音匹配”的產(chǎn)品殺入iOS社交榜前20,MAU突破260萬。

它的締造者李哲羽曾在暴雪娛樂參與《魔獸世界》的開發(fā)工作,在皮克斯(Pixar)參與多個(gè)動(dòng)畫項(xiàng)目,發(fā)自內(nèi)心認(rèn)為:
唯有聲音,是無法被AI輕易代償?shù)摹白詈笳鎸?shí)信號(hào)”。
AI讓一切都可以偽裝,語音可能是最后的“真實(shí)信號(hào)”
現(xiàn)在AI讓“自我呈現(xiàn)”這件事變得越來越容易。
照片可以P,視頻可以合成,文字可以由AI助手實(shí)時(shí)生成。你在社交App上看到的那個(gè)人,也可能不是真的。
過去十年,社交產(chǎn)品的匹配邏輯經(jīng)歷了幾次迭代:陌陌用位置,Tinder用照片,Soul用標(biāo)簽。
但不管形式怎么變,它們都建立在同一個(gè)假設(shè)上:用戶提供的信息是可信的。
然而,這個(gè)假設(shè)正在崩塌。
因?yàn)榻裉?,這些信息載體正逐漸失去可信度。
于是一個(gè)問題開始浮現(xiàn):如果展示型信息越來越不可靠,社交匹配還能依賴哪些數(shù)據(jù)?
有一個(gè)產(chǎn)品給出了一個(gè)不同的答案:聲音。
語音社交產(chǎn)品森森(Gensen)今年春節(jié)期間進(jìn)入了iOS社交榜前20,最高觸及第17位,和Soul、陌陌、Uki等產(chǎn)品同榜,MAU突破260萬。
相比榜單成績,更值得關(guān)注的是它選擇的技術(shù)路徑。
在大多數(shù)產(chǎn)品用AI幫助用戶“包裝自己”的時(shí)候,森森做了一件相反的事:用AI去理解用戶。
這不是技術(shù)層面的判斷,而是產(chǎn)品哲學(xué)層面的選擇。
森森創(chuàng)始人李哲羽表示:
問卷測出來的是你想成為的人,聲音暴露的是你真正是什么人。我們選擇相信聲音。
森森的創(chuàng)始人李哲羽曾在暴雪娛樂參與《魔獸世界》 的開發(fā),在皮克斯(Pixar)參與多個(gè)動(dòng)畫項(xiàng)目。
他對(duì)“什么讓人與人產(chǎn)生真實(shí)連接”這個(gè)問題想了很久。他的答案是:不是“展示自己”,而是“一起經(jīng)歷一件事”。
而聲音,是這個(gè)“一起經(jīng)歷”過程中最真實(shí)、最豐富的信息載體。
一個(gè)人說話的語調(diào)、語速、停頓的時(shí)機(jī)、笑聲的頻率,這些信號(hào)比他本人說的內(nèi)容本身承載了更多關(guān)于“他是誰”的信息。而且這些信號(hào)是實(shí)時(shí)的,無法編輯,也無法讓AI代替。
森森的核心邏輯可以用一句話概括:
用游戲創(chuàng)造真實(shí)互動(dòng)場景,用聲音作為行為信號(hào),再用AI建模人格特征。
為什么是聲音?
因?yàn)樵贏I幾乎可以偽造一切的時(shí)代,語音仍然具有一個(gè)獨(dú)特特性:實(shí)時(shí)性。
照片可以生成,視頻可以合成,文字可以編輯。但當(dāng)兩個(gè)人在實(shí)時(shí)語音房間里交流時(shí),包括語調(diào)的起伏、停頓的節(jié)奏、笑聲的頻率、情緒的變化等,這些幾乎無法提前設(shè)計(jì),也很難偽裝。
這些信號(hào)在語言學(xué)中被稱為副語言信號(hào)(Paralinguistic signals)。它們往往比語言本身更能反映一個(gè)人的性格和情緒狀態(tài)。
年輕人在語音游戲里重新做回自己
如果你和今天的大學(xué)生聊社交,會(huì)聽到一個(gè)高頻詞:營業(yè)。
“又要開始營業(yè)了”,這是很多年輕人打開社交App時(shí)的心理狀態(tài)。
他們要精心挑選照片、編輯自我介紹、想一個(gè)不尷不尬的開場白、維持一段可能毫無營養(yǎng)的對(duì)話。
整個(gè)過程更像是在經(jīng)營一個(gè)理想人設(shè),而不是關(guān)注、了解、和沉浸在認(rèn)識(shí)一個(gè)人的過程。
這種疲勞感不是某一款產(chǎn)品的問題,而是整個(gè)“自我呈現(xiàn)式社交”的結(jié)構(gòu)性問題。
如果社交的前提是“展示自己”,它就不可避免地會(huì)變成一種勞動(dòng)。而在AI時(shí)代,這種勞動(dòng)變得更荒謬。因?yàn)槟憔慕?jīng)營的人設(shè),對(duì)面也是精心經(jīng)營的人設(shè),可能還有AI的輔助加持。
然而,年輕人并非不想社交,他們只是厭倦了“表演式社交”。
你會(huì)發(fā)現(xiàn)一個(gè)有趣的現(xiàn)象:同樣一群在社交App和工作軟件上懶得回消息的年輕人,在線下劇本殺、狼人殺、派對(duì)游戲里可以開心地玩一個(gè)晚上,結(jié)束后加一堆微信好友。為什么?因?yàn)樵谟螒蚶锬悴恍枰盃I業(yè)”,你只需要做你自己。
森森做的事情很簡單:用戶無需“展示”自己,只提供一個(gè)場景讓他們?nèi)ァ白鲎约骸薄?/p>
用戶在森森任意進(jìn)入一個(gè)3D語音派對(duì)房間,和陌生人一起玩游戲——森森酒館、海龜湯、電波同頻和星卡大亂斗……
這些游戲有一個(gè)共同特點(diǎn):它們都需要你開口說話,都需要你隨時(shí)表達(dá)觀點(diǎn)、做出判斷、展示情緒。
注意,這里的“展示”和社交App所說的“展示”本質(zhì)不同。
在社交App上,你展示的是你想讓別人看到的樣子。
而在游戲里,你展示的是你本能的反應(yīng),例如:玩海龜湯時(shí)你的推理方式,玩森森酒館時(shí)你撒謊被抓包時(shí)的表演策略,玩電波同頻時(shí)你對(duì)一個(gè)詞的直覺感受。你沒時(shí)間也沒必要“演”,因?yàn)橛螒虮旧砭驮谝竽阕稣鎸?shí)的反應(yīng)。
而這一切都發(fā)生在語音環(huán)境中。

AI在后臺(tái)做什么
有意思的是,森森并沒有回避技術(shù),它把AI用在了一個(gè)完全不同的方向上。
許多產(chǎn)品用AI幫助用戶“包裝自己”,比如AI修圖、AI生成開場白、AI代寫回復(fù)。而森森更關(guān)注的是如何利用技術(shù)提升互動(dòng)本身的匹配效率。

在用戶授權(quán)和隱私保護(hù)機(jī)制下,當(dāng)用戶在語音房間參與游戲互動(dòng)時(shí),系統(tǒng)會(huì)對(duì)語音交流中的一些匿名化特征信號(hào)進(jìn)行統(tǒng)計(jì)建模,主要包括兩個(gè)維度:
第一類是表達(dá)方式相關(guān)的聲學(xué)特征,例如語調(diào)變化、語速節(jié)奏、情緒波動(dòng)等。這些信號(hào)能夠反映人與人溝通時(shí)的表達(dá)風(fēng)格。
第二類是語言表達(dá)模式,例如用詞習(xí)慣、表達(dá)邏輯和互動(dòng)方式。這些信息更多體現(xiàn)溝通風(fēng)格和互動(dòng)偏好。
系統(tǒng)會(huì)在不涉及具體語音內(nèi)容存儲(chǔ)的情況下,對(duì)這些特征進(jìn)行模型訓(xùn)練與分析,從而形成更加貼近真實(shí)互動(dòng)風(fēng)格的匹配參考。
對(duì)于用戶來說,整個(gè)過程并不需要額外操作,你無需填寫復(fù)雜問卷,也無需做性格測試。用戶只是參與游戲互動(dòng),系統(tǒng)則在后臺(tái)不斷優(yōu)化匹配體驗(yàn),幫助用戶更容易遇到聊得來的人。
李哲羽表示,“我們不是在做語音聊天室加小游戲。我們?cè)谟肁I理解人的聲音,用游戲暴露人的性格,用性格來匹配連接對(duì)的人?!?/p>
游戲成為社交的“自然實(shí)驗(yàn)室”
來看一個(gè)具體的用戶場景,想象一局海龜湯游戲。
出題者說:“有一匹馬去餐館點(diǎn)了一碗魚湯,它喝完湯就哭了,為什么?”房間里有5個(gè)陌生人,開始通過語音提問。
有人上來就問:“他是不是之前在海上遇過險(xiǎn)?”——這個(gè)人思維跳躍,喜歡直達(dá)結(jié)論。
有人從細(xì)節(jié)入手:“馬不會(huì)說話,他是怎么點(diǎn)湯的?”——這個(gè)人嚴(yán)謹(jǐn)、習(xí)慣建立完整邊界。
還有人說:“這個(gè)湯好喝嗎?”——全場爆笑,氣氛瞬間輕松下來。
短短十分鐘,5個(gè)陌生人的思維方式、表達(dá)風(fēng)格、社交性格已經(jīng)自然呈現(xiàn)。這就是森森想做的事情:游戲提供場景,讓用戶盡情做自己。
這套邏輯是否成立?用戶已經(jīng)用腳投了票。
春節(jié)期間社交榜17、MAU 260萬、估值1.5億美元、累計(jì)融資超4500萬美金(約3.1億元人民幣),A16Z和騰訊已表達(dá)投資意向。
目前,森森在上海和Palo Alto設(shè)有雙總部,美國版Gensen正在做最后的上線準(zhǔn)備。
但更值得關(guān)注的不是數(shù)字本身,而是這些數(shù)字反映的產(chǎn)品結(jié)構(gòu)。
派對(duì)游戲是天然的裂變場景,一個(gè)人玩不起來,必須拉朋友一起。語音互動(dòng)讓“弱關(guān)系”到“強(qiáng)關(guān)系”的轉(zhuǎn)化路徑大幅縮短,AI匹配讓你遇到的人真的聊得來。
三者組合,形成了產(chǎn)品的有機(jī)增長飛輪。
回到最初的問題:如果AI讓照片、視頻、文字都失去了可信度,社交還剩下什么?
在AI越來越擅長“生成內(nèi)容”的時(shí)代,理解真實(shí)行為或許會(huì)成為下一代社交產(chǎn)品的關(guān)鍵能力。
聲音,可能是這件事的入口,也許這才是社交本來該有的樣子。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




