欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

“理解選擇”之六:分類思維,簡單的決策可能勝過復雜的選項

2025-03-12 11:56
來源:澎湃新聞·澎湃號·湃客
聽全文
字號

說到選擇或者決策,我們大都把注意力放在“選”這個動作以及選擇過后所產生的結果上,很容易忽略掉構成選擇的關鍵要素——選項。有的時候,選項顯而易見,就像菜單上的小吃和甜點,但大部分生活中的選項都隱藏在伊西斯的面紗之下,而這些選項是自然給我們設下的陷阱還是憑人類自身的理智所構建出來的路徑的區(qū)別,也是困擾了哲學家多年的決定論與自由意志之爭。

姑且放下形而上的爭執(zhí),如今越來越多的人認識到好的問題比答案更重要,也可以由此擴展到,好的選項比選擇本身更關鍵。那么什么又是洞見選項的基本能力呢?說起來并不復雜,它就跟我們日常的生活緊緊的關聯在一起,那就是——分類。

想要將某個人歸入某一類別(朋友或敵人:值得信任或不值得信任)是人類與生俱來的天性,對事情的歸類也是如此,這種渴求為智力發(fā)展提供了基礎。如果我們不去構成類別,我們就只能注意到個例,而觸及不到任何總體性思考。

可以設想,如果一個常人缺乏分類的能力,他就會迷失在浩如煙海的日常事務中——他無法識別朋友和敵人,甚至都不會構建“朋友”這樣的詞語,他身邊只能是一個個獨特的個體;他也無法識別蘋果,他只能認識到一個個長得略有不同的能吃的東西。以此類推,在在他的頭腦里,是無法想象“人類”、“世界”、“宇宙”這樣的存在的,因為只有分類,才能讓我們借由個體達到總體。

從形式上看,選項就是在某一些規(guī)則之下的分類。所以在做選擇之前,學會更好的分類,可能比在選項之間比來比去更加重要。在《分類思維:不確定情境中合理決策的科學與藝術》這本書中,作者就將最佳選擇的探索延伸到分類上,探究在不確定的世界里構建一種好的分類方式以獲得優(yōu)秀決策的方法。

“分類是指根據線索使用分類規(guī)則將個體分配到各個類別”。不過分類并不是看起來這么簡單,當我們深入去體會這個概念,即可找到分類的兩種層次動作:一種是構建分類規(guī)則,另一種是根據分類規(guī)則將具體的事物分配到各個類別當中。很明顯,構建分類規(guī)則相對來說更基礎,也更重要。

如果我們能夠找到最佳分類方法,那么就可以避免掉大多數因為選項錯誤所導致的決策失誤。比如,如果我們希望車輛可以在紅綠燈前面自動決策的話。那就要根據紅綠燈的規(guī)則來構建一系列的決策分類,這個相對來說比較簡單,考慮到直行、左轉和右轉在三個燈下的狀態(tài),無非也就是九種分類而已。但問題在于現實世界中任何一個路口,都不會僅僅只有紅綠燈,還有著眾多的交通參與者,這樣規(guī)則就變得復雜起來,即便不考慮所有情況,規(guī)則也會乘法級的增長。

所以近些年自動駕駛的研發(fā)逐漸放棄了規(guī)則算法,轉而尋找適應性更強的方式。本質上就是在現實情境中,未來可能以不可預知的方式不同于過去,最佳分類規(guī)則是不可知的。在一個穩(wěn)定、可控的世界中,根據過往的經驗進行微調的規(guī)則很可能會成功。微調往往會導致統(tǒng)計數據和機器學習的標準庫提供復雜的分類規(guī)則。相反,在動態(tài)、不穩(wěn)定的現實環(huán)境中,變化可能會突然發(fā)生,對過往經驗進行微調可能會導致巨大的預測錯誤。在這里,規(guī)則的復雜性可能需要在一定程度上減少而不是增加:現實情境中,簡單規(guī)則表現良好。

在分類思維這本書中,就提出了一個鮮明的觀點:簡單規(guī)則反而在現實情境中表現良好。在國際象棋、圍棋或人臉識別等穩(wěn)定的情況下,如果有大量數據可用,復雜算法的表現優(yōu)于快速節(jié)儉啟發(fā)式。相比之下,在現實情境中,未來是不確定的,而且未來可能以一種不可預測的方式不同于過去,無論可用數據規(guī)模是大是小,簡單的啟發(fā)式都可以勝過復雜的方法,并稱此為“不穩(wěn)定世界原則”。

“啟發(fā)式”這個詞源自于古希臘,意思是“積極主動地發(fā)現或探索”。18世紀被引入到英語中,是指代解決那些難以用邏輯和概率論加以處理的問題、有用甚至不可缺少的認知過程。分類思維這本書關注兩類啟發(fā)式,這兩類啟發(fā)式開發(fā)了人類智力的兩個核心能力:計數和排序。計數啟發(fā)式只計算將個體分配至某一類別的原因。快速節(jié)儉樹對原因進行排序,并使得使用者基于其中一個或幾個原因就能做出快速決策。

這聽起來可能有些學術,可以通過例子來分別理解計數法和快速節(jié)儉樹。

看一個快速節(jié)儉樹的例子。在美國快速的HIV篩查一般分為三步,先做一次酶免疫測試,陰性則停止,并確認無HIV,陽性則繼續(xù)再做一次酶免疫測試,陰性則確認無HIV,陽性則再進行一次蛋白質測試,陰性則確認無HIV,陽性則確認HIV感染。

其實這并不是一種“最佳”的規(guī)則,如果“最佳”的定義是最大化的檢測出HIV感染者以及最小化誤診。因為第一次酶免疫測試,一定有一些沒有被檢測出來的HIV感染者,最后被宣布無HIV。但是,因為這個概率比較低,如果為了找出那些遺漏的HIV感染者,將會耗費大量的人力物力。所以最終采用了一種更為“節(jié)儉”的決策樹。

如果用符號K表示線索(檢測次數)的數量,這里K等于3。如果一條線索只有兩個值,如“正/負”(即陰性陽性),則這條線索稱為二元線索??焖俟?jié)儉樹中,可以進行分類的空間稱為“出口”,一個快速節(jié)儉樹正好有K+1個出口,跟完整決策樹的檢索出口數量即2的K次方相比,當K大于2的時候,節(jié)儉樹就有優(yōu)勢,K越大,優(yōu)勢越大。所以使用快速節(jié)儉樹來替代完整決策樹?可以大大減少檢測上的時間,減少醫(yī)療系統(tǒng)所承受的負擔,同時可以用相對較少的漏報為代價保護大量個體不被誤診。

在此補充一些醫(yī)療檢測當中的關鍵定義。首先大前提是,任何一種針對性的檢測,都不是百分之百準確的,這意味著有一部分真實的病人未被檢測出來,同時還有一部分健康的人被誤診。所以針對真實陽性和真實陰性情況,對應檢查出來陽性和陰性,就會有四種情況:

真實陽性被檢測出陽性稱為命中,也叫做真陽性;真實陽性被檢查出來陰性則成為漏報,也叫做偽陰性。命中與命中和漏報的總和的比稱為命中率或靈敏度。真實陰性被檢查出陰性稱為正確拒絕,也叫做真陰性;真事陰性被檢查出陽性稱為誤報,也叫做偽陽性。誤報與誤報和正確拒絕之和的比例被稱為誤報率。

當我們再聽到,比如一個乳腺癌檢測命中率為75%時,先不要著急下結論說這個檢測很管用,看看它的誤報率,比如平均誤報率為46%,意味著大約每隔一個人就會出現沒有患乳腺癌的女性被該測試診斷為患有乳腺癌的情況。這種高命中率的代價是將更多的為患病的人誤報作為基礎的。相比之下,正常的乳房X光檢測篩查的命中率約為80%,但誤報率在10%以下。

這是一個小小的題外話,分類思維這本書,核心就要告訴我們的是,真實世界中存在著線索的不確定性,線索權重的不確定性以及最佳分類規(guī)則的不確定性。因此,如果去構建一個“最佳”分類規(guī)則去盡可能準確地描述過往的分類,就可能會引起錯誤的判斷,于此相反,我們認為,簡單啟發(fā)式(例如計數和快速節(jié)儉樹)可以在現實情境中表現良好,因為它們依賴于穩(wěn)定的原則來減少錯誤。

快速節(jié)儉分類最典型的特征是簡單。簡單是由兩種方式實現的:首先,分類使用的線索相對較少;其次,各條線索以簡單的方式組合。因此,分類可以快速進行,要理解和解釋分類背后的邏輯推理也很簡單,考察了兩種最簡潔的方法,第一種方法稱為“計數”,在同一時間使用各條線索,賦予他們相等的權重。第二種方法稱為“快速節(jié)儉樹”,按順序使用各條線索,一次使用一個,對線索施加優(yōu)先級順序。

雖然這本書中陸續(xù)介紹了很多計數法和快速節(jié)儉樹的構建方法,但很多都需要過硬的數學功底和相應的計算工具的輔助,對程序開發(fā)可能有比較大的幫助,但對于普通人來說,只需要記住,它反對了一種普遍的觀念,即復雜的分類方法總是更好,更多的數據總是導致更高的準確性,盡管在確定的和完全控制的情況下(未來和過去相似),這種觀念是正確的,但是在不確定的和缺乏控制的情況下,這種觀念就不見得成立了。在這樣的情況下,簡單的規(guī)則可以根據較少的信息進行更準確的預測,并且,簡單的規(guī)則更加透明、更易懂,以便啟動操作。

    本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業(yè)務經營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司