- +1
心理學的危機:為什么超六成的實驗無法重復?

研究心理學為什么需要做實驗?
行為科學(Behavioral Science)主要指代研究人或動物行為的學科。而其中,關(guān)于人的行為的研究,主要關(guān)注人內(nèi)部或者人與人之間的思維過程及其外顯表現(xiàn),例如:決策、判斷、人際交流,以及做出行動上的選擇。其中,心理學(為簡化闡述,此處只討論人類心理學)是一種典型的行為科學。學術(shù)意義上的心理學并不等同于民間傳說中的“讀心術(shù)”或者“面相學”,而是一門以科學手段探索人類認知、情緒、人格與行為的學科。
與經(jīng)濟學、社會學等其他社會科學學科類似,心理學采用定性(qualitative)與定量(quantified)結(jié)合的手段。在定量研究方法中,行為實驗(Behavioral Experiment)又是心理學的主要研究方法之一。
行為實驗的目的,在于證明因果關(guān)系。例如,有些研究需要探明喝咖啡對于人認知功能(如:注意力)的影響。最直接的辦法就是比較喝咖啡的人和不喝咖啡的人在要求集中注意力的任務(wù)(如:計算、分類整理資料)上的表現(xiàn)差異。此處,我們將喝咖啡與否稱為自變量(Independent Variable),這代表了我們想要探索的“起因” (IV),而人在任務(wù)中的表現(xiàn),則被稱為因變量(Dependent Variable),這代表了我們想要探索的“結(jié)果”(DV)。這個因果關(guān)系如下所示:
(3)在自變量到因變量的因果鏈條中,需要排除其他混淆因素對因變量的影響(排他定律)
如何設(shè)計一個實驗來驗證這個因果關(guān)系呢?我們需要一群實驗參與者,然后把他們隨機分配在兩組中。在第一組(實驗組)中,我們讓實驗參與者喝更多的咖啡。而在另一組(對照組)中,我們讓參與者不喝咖啡。接下來對所有的實驗參與者,我們考察他們在同樣的任務(wù)上的表現(xiàn)差異。在這個實驗中,通過人為讓一組人多喝,一組人少喝,再測量他們的任務(wù)表現(xiàn),我們控制了因果鏈條中的時間關(guān)系(自變量發(fā)生在因變量之前)。而通過比較兩組的任務(wù)差異,我們觀察到了自變量(喝咖啡量)和因變量(任務(wù)表現(xiàn))之間的關(guān)系。最后,把參與者隨機分配到兩組,則最大可能地降低或平衡了其他因素(如:性別、年齡、飲食習慣)對他們?nèi)蝿?wù)表現(xiàn)的影響(排除混淆因素的作用)。
心理學實驗中的“可重復性”問題有多嚴重?
如上文所述,一個嚴謹?shù)男睦韺W實驗,旨在通過巧妙的實驗設(shè)計來驗證自變量到因變量的因果關(guān)系。過去幾十年間,一系列精彩的實驗研究,極大地推動了心理學的繁榮與發(fā)展。
學術(shù)研究是一個承前啟后的過程,前人可能會通過實驗發(fā)現(xiàn)一些獨特的現(xiàn)象,而后人則會在前人研究的基礎(chǔ)上延伸出一些新的研究想法,這就對前人研究的真實性和可靠性提出了更高的要求。所以,越來越多的研究者希望看到前人的研究可以被重復。畢竟,如果一個研究能被越多人重復,就越證明這個發(fā)現(xiàn)的穩(wěn)健和可靠。
近年來,一些研究機構(gòu)和個體開始向之前發(fā)表文章的原作者索要實驗材料,然后試圖在與原作近似的實驗條件下重現(xiàn)前人的發(fā)現(xiàn)。然而,不重復不知道,一重復嚇一跳。一系列的重復研究紛紛顯示,不少心理學實驗正在遭遇“不可重復質(zhì)疑”。
網(wǎng)站“開放科學架構(gòu)”(Open Science Framework)在2013年對心理學中的一些重要效應(yīng)進行了重復實驗, 結(jié)果顯示一些經(jīng)典的行為決策研究結(jié)果具有較穩(wěn)定的效應(yīng),但是一些社會認知領(lǐng)域的經(jīng)典效應(yīng)則被發(fā)現(xiàn)難以重復[2]。
《自然》期刊(Nature)在2015年發(fā)表了一篇對于100個發(fā)表在心理學期刊上的研究進行重復研究的報告 [3]。結(jié)果顯示,只有39個研究很好地重復了前人的發(fā)現(xiàn),而在剩下61個研究中,有部分研究顯示了和原作相似(但不等同)的結(jié)果,甚至還有一部分研究結(jié)果則與原作幾乎完全不同。
除了機構(gòu)的參與,一些個體研究者也陸續(xù)向?qū)η叭说慕?jīng)典研究發(fā)難,導致一系列曾經(jīng)讓人興奮不已的研究紛紛中槍。其中最受詬病的領(lǐng)域來自于社會認知中的啟動效應(yīng)(Priming Effect)和具身認知(Embodied Cognition)。
以啟動效應(yīng)為例,啟動效應(yīng)指的是人在上一個情境中接觸到的實驗刺激會影響到他們在接下來另一個情境中的判斷和行為。其中一個經(jīng)典(但又在今天飽受爭議)的例子來自于耶魯大學約翰巴奇(John Bargh)的研究[4]。在巴奇最初的研究中,他們讓實驗參與者先玩一個重新排列打亂的字母以組成正確單詞的任務(wù)。其中一半實驗參與者(實驗組)需要重排的這些單詞恰恰可以被用來描述與“老人”相關(guān)的情景,而對照組的實驗參與者則排列一些更加中性的單詞。那么根據(jù)巴奇的理論,當人們在玩這個游戲的時候,相對于對照組,實驗組中的參與者已經(jīng)在不知不覺中受到這些單詞的影響。接下來研究員要求所有實驗參與者走到一個特定的地方,并同時暗中記錄下他們步行到目的地的時間。實驗結(jié)果顯示,實驗組中的研究參與者走得比對照組更慢,說明他們受到了“老人”這個概念的影響。然而近年來,這篇引用率達數(shù)千之巨的經(jīng)典著作卻遭遇了挑戰(zhàn)。其他研究者的一些重復研究陸續(xù)發(fā)現(xiàn)這一社會認知中的經(jīng)典效應(yīng)不能被重復[5]。由于巴奇的這篇論文堪稱是社會認知的經(jīng)典之作,這一挑戰(zhàn)無疑對社會認知領(lǐng)域產(chǎn)生了極大的沖擊。
事實上,對“心理學實驗的可重復性”的憂心甚至延伸到其他采用行為實驗方法的社會學科。自從赫伯特西蒙和卡尼曼開始挑戰(zhàn)經(jīng)濟學的“理性人”假設(shè)以來,行為經(jīng)濟學成為冉冉上升的明星。在經(jīng)濟學領(lǐng)域的頂級期刊美國經(jīng)濟評論(The American Economic Review,AER)和經(jīng)濟學季刊(The Quarterly Journal of Economics,QJE)中也出現(xiàn)了更多的行為經(jīng)濟學實驗。而最近加州大學伯克利分校的何德華教授(Teck-Hua Ho)等人就計劃對2011-2014年間發(fā)表在AER和QJE上的18個行為經(jīng)濟學實驗進行重復檢驗,至于結(jié)果,就讓我們拭目以待吧。
實驗不能被重復等同于學術(shù)不端嗎?
越來越多的研究者、期刊和媒體開始關(guān)注心理學實驗的重復性問題,并有不少人稱之為心理學的道德危機。不過,這一說法本身值得商榷。
首先,實驗的無法被重復并不一定等同于學術(shù)造假。一個實驗無法被重復,除了學術(shù)造假,可能還有其他因素:首先,重復實驗的操作與情景本身可能會對一些研究結(jié)果造成影響;其次,參加重復實驗與原始實驗的樣本本身也存在差異;這些不同樣本之間的個體差異(如文化、年齡、經(jīng)濟水平、教育背景)也可能對實驗結(jié)果產(chǎn)生影響,此外,人的進化、社會環(huán)境的變化,也可能使那些多年前發(fā)現(xiàn)的效應(yīng)不再穩(wěn)健。行為科學的最大魅力在于,人和社會都是動態(tài)變化的有機體,因此新的理論出現(xiàn),舊的理論消失或者不再適用,都是有可能的。
另一個可能被忽視的情況是,由于近幾年一些社會心理學領(lǐng)域的知名教授被發(fā)現(xiàn)數(shù)據(jù)造假,當“一些人造假”與“另一些人實驗無法重復”的新聞消息同時占據(jù)版面,讀者就往往會自然而然地把兩者聯(lián)系在一起。但事實上,前者是明顯的學術(shù)不端,但是如果因此就把實驗無法重復和學術(shù)不端等同起來,就很可能犯了心理學所說的判斷謬誤,即誤認為同時出現(xiàn)的兩件事一定是相關(guān)甚至是存在因果聯(lián)系的。
盡管實驗無法重復并不等同于學術(shù)不端,但是這場風波也確實應(yīng)該讓心理學研究者與學術(shù)期刊警醒。例如,為了盡可能減少因為“學術(shù)不端”而造成的實驗無法重復,期刊需要采納更加嚴格的審稿體系,要求研究者提交原始數(shù)據(jù)、原始研究材料以及分析方法。再者,近些年來心理學研究越來越向追求“問題新奇”的方向發(fā)展。雖然這會給這一領(lǐng)域帶來更多樂趣和聚焦,但是這種獵奇心一旦過了頭,研究者就可能更多去追求熱鬧,而忽視對一些真正接近人類思維本質(zhì)的問題的研究。事實上,只有從“搞個大新聞”到回歸踏實做研究,才能催生更多經(jīng)得起檢驗的研究成果,也才能推動整個學科的前進。
從研究的方法論上看,研究者自身也應(yīng)該爭取在一篇論文中重復自己的結(jié)果?,F(xiàn)如今優(yōu)秀的心理學雜志往往要求4個及以上的重復實驗。而為了進一步證實自己研究的可推廣性和可重復性,研究者應(yīng)該考慮在一篇文章中融入多種情景(更替實驗材料)和多種方法論(實驗室實驗、真實生活中的田野實驗、二手數(shù)據(jù)、甚至是像經(jīng)濟學一樣的理論模型),這本身也是一個自我檢驗和取信于人的過程。
總而言之,盡管心理學實驗的可重復性問題對心理學造成了巨大沖擊,但是這本身并不意味著心理學的危機或者末路,反而為這一學科的規(guī)范化和嚴謹化提供了方向。而對于心理學研究者而言,最應(yīng)該保持的態(tài)度還是“清者自清”,拋開那些浮華但是經(jīng)不起檢驗的議題,去真正探索值得研究的基本理論問題。
[1] Science 28 August 2015: Vol. 349 no. 6251 aac4716
[2] Investigating Variation in Replicability: A “Many Labs” Replication Project https://osf.io/wx7ck/
[3] First results from psychology’s largest reproducibility test http://www.nature.com/news/first-results-from-psychology-s-largest-reproducibility-test-1.17433
[4]Bargh, J. A., Chen, M., & Burrows, L. (1996). Automaticity of Social Behavior: Direct Effects of Trait Construct and Stereotype Activation on Action. Journal of Personality and Social Psychology, 71(2), 230-244.
[5]Behavioral Priming: It's All in the Mind, but Whose Mind? http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0029081





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




