【讀者分享】投名狀的博奕論 (Patreon)
Content
記得行為學之中,有一個博奕實驗(忘記了報導或論文名稱),招請一批實驗參與者,首先教導佢哋遊戲規則。基本上,「重覆地進行囚犯困境」博奕(Repeated Game of Prisoner Dilemma),參與者唔會有任何直接溝通(non-cooperative game),只會於每一round完結時,得知對手行動選擇及結果。
跟住,教佢哋做簡單嘅programming,因為參與者唔係每一個round去親自作出決定,而係要為呢一場博奕,列出自己嘅回應規則。呢個實驗目的唔係睇參與者即場反應,而係評估佢哋嘅策略。
以下括符(、),係指於每一round嘅博奕之中,分別係(自己、對手)嘅行動選擇。
實驗結果嘅成功例子有兩個規則。
基本上,大家不斷(合作、合作),係會得到最大共同利益,然而一旦被對方出賣(合作、篤灰),回應方式就係永遠出賣對方 — triggering / punishment 係重覆博奕之中嘅標準策略。
(篤灰、篤灰)以2019年之後嘅香港人用語,即係『攬炒』。一般呢個策略係有阻嚇,去維持合作關係。然而在現實之中,究竟有無呢種雙方權力平衡,又或者對手係咪有利益盤算嘅理性,係另一回事。
但係,永遠『攬炒』係死路一條,所以實驗結果另一個成功例子,就係隨機作出『原諒』,蝕抵一個Round之後(合作、篤灰),睇吓對方下一個round會唔會正面回應,回復大家一齊有著數嘅情況(合作、合作)。
如果總結以上兩點,可以以reciprocity嚟形容。所以教授呢篇文章,都算係有博奕論基礎,不過當中差異在於,實際時空嘅『原諒』,時機係十分之重要,唔似得實驗中作出隨機原諒。
The game may have the following payoffs (numbers here is an example, they may vary as long as the Prisoner Dilemma structure is maintained):
(合作、合作) 5, 5
(合作、篤灰)-5, 10
(篤灰、合作)10,- 5
(篤灰、篤灰)-5, -5 [one shot Nash Equilibrium]
▶️ 馮智政:留下來的人,被掏空靈魂,下一步怎辦?(下)
https://www.youtube.com/watch?v=ojlhK1WzzvE