- +1
中國學(xué)霸隊(duì)迎戰(zhàn)美國德?lián)銩I,李開復(fù)稱這是人類最后獲勝機(jī)會(huì)
“雖然人類只有10%左右的勝率,但是10%其實(shí)挺高的了??聺崒?duì)陣阿爾法狗,勝率是0。所以不要去看圍棋了,還是看我們的德?lián)浒?,希望這次我們?nèi)祟惸茏詈笠淮螒?zhàn)勝人工智能”,4月5日,創(chuàng)新工場(chǎng)CEO李開復(fù)在北京創(chuàng)新工場(chǎng)總部舉行的德州撲克人機(jī)大戰(zhàn)表演賽賽前發(fā)布會(huì)上說道。
而李開復(fù)口中的這個(gè)勝率達(dá)到90%的大BOSS,名叫Libratus,是一個(gè)擅長打德州撲克的美國AI。今年1月份,它在匹茲堡的大河賭場(chǎng)對(duì)陣4名頂尖職業(yè)玩家大殺特殺,加冕AI賭神。這次,它將來到中國“踢館”,和6位中國高手過過招,并取了一個(gè)武俠風(fēng)的中文名字——“冷撲大師”。
這6名中國頂尖德州撲克玩家組成的中國“龍之隊(duì)”,由2016年獲得世界撲克系列賽WSOP冠軍的隊(duì)長杜悅領(lǐng)銜。杜悅在發(fā)布會(huì)上回答澎湃新聞(www.xinlihui.cn)的提問時(shí)表示,龍之隊(duì)在清明小長假期間做了非常充分的準(zhǔn)備工作,“基于我們對(duì)于人工智能的了解,我們相信,雖然說冷撲大師是AI在德?lián)漕I(lǐng)域的巔峰之作,應(yīng)該是取得了非常大的成就,但是離計(jì)算機(jī)科學(xué)和人工智能能夠達(dá)成的理論水平,還有一定的距離。就像李開復(fù)老師講的,AI超越人類是遲早的事,不是這一次就是下一次。我們只是有個(gè)小小的夢(mèng)想,希望中國龍之隊(duì)是最后一支戰(zhàn)勝AI的團(tuán)隊(duì)。”

200萬元獎(jiǎng)金,36000手牌
冷撲大師將于4月6日到10日間在海南澄邁生態(tài)科技園與中國“龍之隊(duì)”進(jìn)行一場(chǎng)德州撲克人機(jī)大戰(zhàn)表演賽,而主辦方為此項(xiàng)賽事開出的獎(jiǎng)金是200萬元人民幣。
在為期5天的比賽中,龍之隊(duì)的6名玩家將每天進(jìn)行上下兩場(chǎng)共計(jì)10個(gè)小時(shí)、1200手牌的高強(qiáng)度比賽,且每次同時(shí)玩兩手牌。而對(duì)“冷撲大師”來說,就是同時(shí)處理12手牌。在36000局比賽后,主辦方通過統(tǒng)計(jì)玩家累積的總籌碼來判決勝負(fù)。

值得一提的是,為了降低發(fā)牌中的運(yùn)氣因素,比賽將采用復(fù)式對(duì)稱發(fā)牌的方式。6名人類玩家兩兩配對(duì),被拆分為兩組,在兩個(gè)獨(dú)立的房間中與AI對(duì)陣。每一名人類玩家和AI對(duì)陣的手牌,都會(huì)對(duì)調(diào)為其配對(duì)人類玩家比賽時(shí)AI的手牌。
“冷撲大師”的必殺技在殘局
“冷撲大師”的開發(fā)者是美國卡內(nèi)基梅隆大學(xué)(CMU)的計(jì)算機(jī)系教授托馬斯?桑德霍姆(Tuomas Sandholm)和其研究生諾姆?布朗(Noam Brown)。它的拉丁語名字Libratus意為“均衡的”。這是因?yàn)榧{什均衡為Libratus的算法提供了重要源泉。
今年1月10日到1月30日,在為期20天、共計(jì)12萬手的一對(duì)一無限注德州撲克比賽中,Libratus壓過Jason Lee、Dong Kim、Daniel McAulay 和Jimmy Chou這4名CMU精心遴選出的頂尖高手,共計(jì)贏得176萬美元籌碼。
不過冷撲大師這次雖然“身”在中國,“心”卻仍在匹茲堡。同在大河賭場(chǎng)的比賽一樣,匹茲堡超算中心會(huì)繼續(xù)承擔(dān)AI的計(jì)算處理任務(wù)。
雖已加冕AI賭神,桑德霍姆團(tuán)隊(duì)目前還沒有揭曉“冷撲大師”的全部秘密?,F(xiàn)在有限的信息是,它在牌局初期會(huì)采用近似轉(zhuǎn)化的方法來減少計(jì)算量,而殘局階段才是Libratus真正發(fā)威的時(shí)候:殘局階段計(jì)算量更少,計(jì)算機(jī)可以做到實(shí)時(shí)計(jì)算。
以納什均衡為代表的博弈論是德?lián)渌惴ǖ暮诵?,即AI的目標(biāo)是找到一個(gè)無論對(duì)方走哪一步,自己都不會(huì)產(chǎn)生損失的策略。在博弈論中,像一對(duì)一撲克這種零和游戲永遠(yuǎn)存在這樣的最優(yōu)解,就像在經(jīng)典的博弈論模型“囚徒困境”中,招認(rèn)罪行就是一個(gè)無論對(duì)方招認(rèn)不招認(rèn)都最優(yōu)的策略。人類高手可能會(huì)利用對(duì)手的犯錯(cuò)來獲得更大的利益,但對(duì)AI就毫無辦法。因?yàn)锳I只會(huì)按計(jì)算所得的最優(yōu)策略決策,不受對(duì)手的干擾。
這也解釋了與其交手過的人類玩家對(duì)AI的一個(gè)評(píng)價(jià):Libratus在比賽中表現(xiàn)出了高水平的詐唬和反詐唬。畢竟,AI對(duì)人類對(duì)手的“演技”可是視而不見的,它們“滿腦子”都是數(shù)學(xué)。對(duì)AI來說,詐唬只是一種讓對(duì)手猜不透自己手牌的數(shù)學(xué)手段。
如果說阿爾法狗是IQ天才,冷撲大師就是EQ專家
擁有CMU雙博士的李開復(fù)在看到Libratus的消息后立馬萌生了邀請(qǐng)德?lián)銩I來華比賽的想法。他說道,從1983年起,他就開始做人機(jī)對(duì)弈。1988年,CMU開發(fā)的“奧賽羅”擊敗了黑白棋世界冠軍,其中就有李開復(fù)的貢獻(xiàn)。
“我覺得我比較懶,我花了一個(gè)暑假做了這個(gè)東西,我?guī)熜只?5年做出了‘深藍(lán)’,這就是我和這個(gè)領(lǐng)域的淵源和故事”,李開復(fù)回憶道。1997年,IBM的計(jì)算機(jī)“深藍(lán)”擊敗了國際象棋棋壇神話卡斯帕羅夫。

此后,人類見證了人工智能在棋類領(lǐng)域上的所向披靡,而在過去的一年間挑落中日韓三國頂尖圍棋手的阿爾法狗無疑奏響了最強(qiáng)音。這些被人工智能攻克的棋類都是“完美信息”游戲,所有玩家在游戲中能獲得的確定性信息是對(duì)稱的。人工智能掌握這些游戲的難度,主要取決于游戲的決策樹(decision tree)上的決策點(diǎn)(decision points)數(shù)量,這決定了計(jì)算機(jī)在決策樹上的搜索強(qiáng)度。圍棋是上述幾種棋類中決策點(diǎn)數(shù)量最多的,因而也是最后被人工智能掌握的。
“奧賽羅是第一個(gè)打敗世界冠軍的人機(jī)對(duì)弈系統(tǒng),搜索難度是10的十幾次方;到了深藍(lán)是10的四十幾次方,這是30個(gè)數(shù)量級(jí)的提升,從計(jì)算機(jī)的角度來說了不得。大家當(dāng)時(shí)都說圍棋(的搜索量)是10的172次方,這要再提升140個(gè)數(shù)量級(jí),至少是25年之后的事”,李開復(fù)說道。
盡管最終阿爾法狗的橫空出世沒有花上25年,但李開復(fù)認(rèn)為,圍棋在本質(zhì)上依然是一個(gè)純粹的搜索問題,這種前提下人類早就沒有贏的希望,只是時(shí)間的問題。但撲克是完全不同的。
德州撲克是一種更接近現(xiàn)實(shí)世界的“非完美信息”游戲,玩家只掌握不對(duì)稱的信息,他不知道對(duì)手手中是什么牌,不知道五張公共牌會(huì)開出怎樣的結(jié)果,也不知道對(duì)手猜測(cè)自己握有怎樣的手牌。這些問題在計(jì)算范圍之內(nèi)。
這與我們?cè)诂F(xiàn)實(shí)生活中遇到的很多問題類似:商業(yè)談判、網(wǎng)絡(luò)安全、出租車自動(dòng)駕駛、機(jī)器人規(guī)劃、醫(yī)療規(guī)劃等。這些問題都需要在 “不完美信息”情景中做出決策,打“心理戰(zhàn)”。
“如果說阿爾法狗是一個(gè)IQ超級(jí)天才,冷撲大師其實(shí)在一定程度上是一個(gè)EQ專家。不能說它比阿爾法狗更難,阿爾法狗肯定是搜索空間更大、速度更快。但冷撲大師來到了另一個(gè)游戲?qū)哟巍睦碛螒虻膶哟巍?,李開復(fù)總結(jié)道。
“學(xué)霸”組成的中國龍之隊(duì)
雖然冷撲大師在美國完勝4名頂尖高手,但李開復(fù)認(rèn)為這次中國龍之隊(duì)比起美國團(tuán)隊(duì)有一個(gè)獨(dú)特的優(yōu)勢(shì):4名美國高手是以德?lián)渲\生的職業(yè)玩家,而中國龍之隊(duì)的成員大多具有金融和計(jì)算機(jī)背景,可以說是一支“知己知彼”的“學(xué)霸”戰(zhàn)隊(duì)。
澎湃新聞(www.xinlihui.cn)梳理中國龍之隊(duì)隊(duì)員的基本信息如下:
隊(duì)長杜悅:畢業(yè)于清華大學(xué)計(jì)算機(jī)系,現(xiàn)任常春藤資本基金合伙人,曾任人人集團(tuán)副總裁,2016年獲得世界撲克系列賽WSOP冠軍;
許朝軍:畢業(yè)于清華大學(xué)計(jì)算機(jī)系,點(diǎn)點(diǎn)網(wǎng)、啪啪創(chuàng)始人兼CEO,曾任搜狐技術(shù)總監(jiān)、盛大在線首席運(yùn)營官。北京國際撲克學(xué)校創(chuàng)始人及校長;
張淮:畢業(yè)于清華大學(xué)計(jì)算機(jī)系,甲骨文公司高級(jí)工程師,德?lián)渖疃妊芯空撸?/p>
童舟:北京千山劇影視傳媒有限公司董事長兼總經(jīng)理,2016年WPT China豪客賽第4名;
朱亞希:2012年畢業(yè)于浙江大學(xué),被稱為“德?lián)渑瘛保?2016年獲得德州撲克澳門百萬賽中國冠軍賽冠軍;
王天建:2006年創(chuàng)辦中國撲克網(wǎng),2013年帶隊(duì)參加國際撲克聯(lián)盟(IFP)復(fù)式德州亞洲國家杯,最終獲得亞洲國家杯冠軍。

除了表演賽正賽之外,4月10日賽事最后一天晚間,各路名人大咖將齊聚海南展開一場(chǎng)別開生面的“冷撲大師名人體驗(yàn)賽”。負(fù)責(zé)名人體驗(yàn)賽的協(xié)辦方春光里創(chuàng)始合伙人楚小白介紹,來自科技圈、投資圈、媒體圈等共36位名人嘉賓將參與其中,組成六支名人戰(zhàn)隊(duì)來挑戰(zhàn)冷撲大師。創(chuàng)新工場(chǎng)CEO李開復(fù)、天神娛樂董事長朱曄、豐厚資本創(chuàng)始合伙人暨春光里創(chuàng)始人楊守彬、知名電視主持人許戈輝、極客公園創(chuàng)始人張鵬、Xtecher創(chuàng)始人戚宗超、知名媒體人陽淼等嘉賓都將悉數(shù)到場(chǎng),親自體驗(yàn)與機(jī)器對(duì)打撲克。
上次阿爾法狗大戰(zhàn)韓國棋手李世石時(shí),相信大多數(shù)不懂圍棋的觀眾看著棋盤上的黑白交錯(cuò)宛如看天書。而德?lián)洳煌?,比起圍棋的“陽春白雪”,它的上手門檻非常低。只要記住不到10種牌型及它們相互之間的大小關(guān)系,大家就能搬起小板凳、嗑起瓜子,輕松欣賞這場(chǎng)德?lián)淙藱C(jī)大戰(zhàn)表演賽了。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




