- +1
重度選擇困難癥患者?博弈論讓你不再做后悔的決定
原創(chuàng) 羅數(shù)君 羅博深數(shù)學(xué)

博弈論和我們?nèi)粘5纳钜灿胁恍〉年P(guān)系,我們?cè)谧鰶Q定的時(shí)候,對(duì)博弈論的了解能夠幫助我們更好地了解對(duì)方的狀況、分析身邊的處境,從而作出更優(yōu)決定。那么到底什么是博弈論?如何應(yīng)用博弈論?相信這篇文章中一定有你想要的答案。
作者 | Jason
全文字?jǐn)?shù) | 3562 閱讀時(shí)間 | 9分鐘
博弈論(Game Theory),又被稱為對(duì)策論或賽局理論,是經(jīng)濟(jì)學(xué)中一個(gè)非常重要的分支。博弈論通過數(shù)學(xué)模型來分析理性決策者(rational decision-makers)的策略互動(dòng)行為(strategic interaction),并幫助人作出最優(yōu)決定。
1944年,約翰諾伊曼與摩根斯特恩合著《博弈論與經(jīng)濟(jì)行為》一書,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的初步形成。自此博弈論被廣泛認(rèn)為是20世紀(jì)經(jīng)濟(jì)學(xué)最偉大的成果之一。博弈論不僅在經(jīng)濟(jì)學(xué)的發(fā)展中起到舉足輕重的作用,還在生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他學(xué)科有著廣泛的應(yīng)用。
博弈論和我們?nèi)粘5纳钜灿胁恍〉年P(guān)系,我們?cè)谧鰶Q定的時(shí)候,對(duì)博弈論的了解能夠幫助我們更好地分析身邊的處境,從而作出更優(yōu)決定。在博弈論的分析中,我們不僅要依靠數(shù)學(xué)邏輯思維,很多時(shí)候,對(duì)于人性的了解也極其關(guān)鍵。接下來,讓我們通過一些經(jīng)典的博弈游戲,來更好的了解博弈論的神奇。

最后通牒賽局的規(guī)則十分簡(jiǎn)單,參加比賽的兩個(gè)人分別是提議者和響應(yīng)者。提議者和響應(yīng)者兩人會(huì)一起分配一些固定的資源(10元),提議者將提出一種分配方法,例如提議者5元,響應(yīng)者5元;或提議者8元,響應(yīng)者2元。面對(duì)提議者提出的分配方法,如果響應(yīng)者同意,這兩個(gè)人就會(huì)按照提議者提出的分配方法來分配這10元。但是,如果響應(yīng)者不同意提出的分配方法,兩個(gè)人則什么都得不到。
通過簡(jiǎn)單的思考,我們可以了解到,對(duì)于完全理性的響應(yīng)者來說,不同意提出的分配方法對(duì)自己沒有任何好處。也就是說,提議者提出的分配方法里所給予響應(yīng)者的任何資源(1元),響應(yīng)者都應(yīng)該接受。這樣,對(duì)于完全理性的提議者來說,如果知道響應(yīng)者會(huì)接受任何分配,那么為了利益的最大化,他就應(yīng)該提出給予響應(yīng)者最少資源的分配方法,也就是給予響應(yīng)者1元。這樣,賽局的結(jié)果即是提議者給予自己9元,給響應(yīng)者1元,而且響應(yīng)者同意這樣的分配方法。
然而,大多數(shù)人都不是完全理性的。最后通牒賽局在不同的國(guó)家與不同的時(shí)期被研究者反復(fù)試驗(yàn),而賽局的結(jié)果也遠(yuǎn)遠(yuǎn)不同于上述完全理性者得到的理想結(jié)果。平均下來,提議者提出的分配方式給予響應(yīng)者4-5元,且大多數(shù)的參賽者給予了響應(yīng)者5元。而在那些少于2元的分配方式中,有一半的響應(yīng)者拒絕了分配方式,并放棄了自己可以得到的資源。
有趣的是,最后通牒賽局在世界不同的地區(qū)都被實(shí)驗(yàn)過,所得到的結(jié)果也大不相同。在美國(guó),提議者的分配方法往往都比較公平,而響應(yīng)者的拒絕率也相對(duì)較高。而在蒙古國(guó),提議者平均只分配給響應(yīng)者2元,令人驚奇的是,響應(yīng)者的拒絕率卻非常低,甚至少于百分之5。由此可見,在不同的文化背景下,人們對(duì)公平的理解也多少有些不同。

在最后通牒賽局中,通過人們的真實(shí)表現(xiàn),我們看出了他們對(duì)公平的向往,人們雖然有機(jī)會(huì)得到更多的資源,卻在很多時(shí)候無私地給予他人資源。而在獨(dú)裁者賽局中,研究者想了解的是,人到底是不是真正的無私。
獨(dú)裁者賽局的規(guī)則相比于最后通牒賽局更加簡(jiǎn)單。參加比賽的兩個(gè)人分別是獨(dú)裁者和接受者。獨(dú)裁者可以隨意分配所有的資源(10元)。而接受者只能接受獨(dú)裁者的分配方法。
我們可以清楚的看到,獨(dú)裁者在這里享有絕對(duì)的權(quán)力,若獨(dú)裁者完全理性并追求利益最大化,他大可全盤收下所有資源,完全不顧及接受者的利益。然而,在這個(gè)實(shí)驗(yàn)中,獨(dú)裁者平均給予接受者資源的20%。實(shí)驗(yàn)的結(jié)果讓人感到些許欣慰,獨(dú)裁者的分配讓我們看到大多數(shù)參賽者還是懷有一顆無私的心,愿意與接受者分配資源。
然而,人真的都是無私的嗎?很多社會(huì)學(xué)家認(rèn)為人們的無私很多時(shí)候建立在對(duì)未來回報(bào)的期望之上。同時(shí),很多人也認(rèn)為人們無私的行為是為了讓他們看起來不那么自私。社會(huì)學(xué)家在獨(dú)裁者賽局的條件上增加了一個(gè)“悄悄離開(quit exit)”的選項(xiàng)。如果獨(dú)裁者在游戲中選擇了這個(gè)選項(xiàng),他們所做的選擇則不會(huì)被人知道。而“悄悄離開”的選項(xiàng)只需要獨(dú)裁者花費(fèi)1元。在擁有“悄悄離開(quit exit)”選項(xiàng)的獨(dú)裁者賽局中,有28%的參與者選擇了“悄悄離開”,而這些選擇“悄悄離開”的參與者則不出所料地將所有的資源都收入囊中。由此看來人們所表現(xiàn)出來的無私行為的動(dòng)機(jī)也許不總是那么純粹。

參加信任游戲的兩個(gè)人分別為投資者與受托人。投資人會(huì)先得到10元的資產(chǎn),它可以選擇將這些資產(chǎn)的一部分交給受托人,受托人則將會(huì)得到這部分資產(chǎn)的三倍,然后受托人可以選擇將得到資產(chǎn)的任何一部分還給投資人。
這個(gè)游戲相比前兩個(gè)游戲稍微復(fù)雜一些,但是如果我們仔細(xì)分析,仍不難得理解。若想讓兩人受益最大化,投資人與受托人必須互相信任,投資人應(yīng)該將所有的資產(chǎn)(10元)交給受托人,當(dāng)受托人得到3倍資產(chǎn)的時(shí)候(3*10 = 30元),他將其中一半的資產(chǎn)還給投資人。這樣兩人各拿15元,皆大歡喜。然而,若參加游戲的兩人都是完全理性的,投資人若將所有的資產(chǎn)都交給受托人,得到三倍資產(chǎn)的受托人則不會(huì)需要將這些資產(chǎn)還給投資人。這樣,無論投資人給予了受托人多少資產(chǎn),這些資產(chǎn)都是無法被收回的,完全理性的投資人則不會(huì)給予受托人一分錢。
在真實(shí)的實(shí)驗(yàn)中,我們可以看到投資人與受托人給予對(duì)方的資產(chǎn)大不相同,一些參與者攬下全部的資產(chǎn),一些參與者則非常相信對(duì)方,將大部分資產(chǎn)給予給了對(duì)方。值得注意的是,投資者從受托人所得到的資產(chǎn)往往都小于他們所給予的。

囚徒困境是博弈論中非常著名的問題。游戲的規(guī)則是這樣的,兩個(gè)囚徒同時(shí)被逮捕了,在被審訊的時(shí)候,兩個(gè)囚徒被關(guān)在了不同的房間里且不知道對(duì)方的回答是什么。囚徒可以選擇坦白自己的罪行,也可以選擇死不承認(rèn)。若兩個(gè)囚徒同時(shí)坦白,兩個(gè)歹徒將同時(shí)獲得六年的牢獄之災(zāi)。若兩個(gè)都選擇死不承認(rèn),兩人將被同時(shí)關(guān)押一年。若兩人中一個(gè)人坦白,一個(gè)人死不承認(rèn),那么坦白的囚徒將被釋放,而沒有坦白的囚徒則需要在牢房中度過10年。通過下面的圖可以我們可以更直觀的了解游戲的規(guī)則:

“我”在牢房的時(shí)間

但是,在現(xiàn)實(shí)的游戲中,坦白真的能夠給你帶來最少的坐牢時(shí)間嗎?若兩人都不坦白,得到的結(jié)果對(duì)兩人來說不是更好么?在1980年的時(shí)候,來自密歇根大學(xué)的政治學(xué)教授羅伯特阿克賽爾羅德舉辦了阿克賽爾羅德比賽,在比賽中,兩個(gè)玩家不斷的進(jìn)行囚徒困境游戲,但是玩家的策略可以不斷的變化,以更了解對(duì)手。阿克賽爾羅德想知道怎樣的策略能夠換來最少的牢房的總時(shí)間。這個(gè)比賽吸引了來自世界各地知名的策略學(xué)家。比賽中的策略不僅包括了坦白或不坦白策略之外,也囊括了馬科夫過程,貝葉斯推理等復(fù)雜的策略。經(jīng)過多輪的比賽,阿克賽爾羅德發(fā)現(xiàn)針鋒相對(duì)策略(tic for tat)是最成功的,針鋒相對(duì)的策略即是重復(fù)對(duì)手上一輪的策略。這個(gè)策略有四大優(yōu)點(diǎn):
友好:不在對(duì)手坦白之前坦白
有一定報(bào)復(fù)性:當(dāng)對(duì)手開始占便宜的時(shí)候需要適當(dāng)報(bào)復(fù)對(duì)手
寬恕性:當(dāng)對(duì)手愿意繼續(xù)合作時(shí),不會(huì)記仇,愿意重新合作
不嫉妒:只在乎最后的結(jié)果,而不在乎是否戰(zhàn)勝對(duì)方
這四大優(yōu)點(diǎn)似乎也在很大的程度上告訴了我們?cè)诓┺挠螒蛑兴x擇怎么樣的策略。

在面對(duì)這些難題的時(shí)候,我們不能盲目地通過理論選擇來尋找最優(yōu)解決方法,因?yàn)槟愕膶?duì)手在很大程度上并不是完全理性的,但是為了得到更優(yōu)的結(jié)果,我們需要通過換位思考,通過預(yù)判他人的決定來作出最終自己的決定。
博弈游戲從來都不是僅僅與數(shù)學(xué)的博弈,也不僅僅是與人性的博弈,將兩者綜合在一起,你才能最終笑傲江湖。
*圖片來源于pexel。文章內(nèi)容屬羅博深數(shù)學(xué)及其母公司Expii Inc所有,轉(zhuǎn)載需注明作者及來自“羅博深數(shù)學(xué)”公眾號(hào)。歡迎轉(zhuǎn)發(fā)本文與全世界的朋友分享數(shù)學(xué)、教育的樂趣。
原標(biāo)題:《重度選擇困難癥患者?博弈論讓你不再做后悔的決定!》
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




