Paul's Blog: 博弈論中的囚徒困境 Prisoner's dilemma in Game Theory

經典的囚徒困境如下：警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯，並向雙方提供以下相同的選擇：
- 若一人認罪並作證檢舉對方（相關術語稱「背叛」對方），而對方保持沉默，此人將即時獲釋，沉默者將判監10年。
- 若二人都保持沉默（相關術語稱互相「合作」），則二人同樣判監半年。
- 若二人都互相檢舉（互相「背叛」），則二人同樣判監2年。

囚徒困境假定每個參與者（即「囚徒」）都是利己的，即都尋求最大自身利益，而不關心另一參與者的利益。兩名囚徒由於隔絕監禁，並不知道對方選擇；而即使他們能交談，還是未必能夠盡信對方不會反口。試設想困境中兩名理性囚徒會如何作出選擇：
- 若對方沉默：背叛會讓我獲釋，所以會選擇背叛。
- 若對方背叛指控我：我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。

二人面對的情況一樣，所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此，這場博弈中唯一可能達到的均衡（所謂「納什均衡」 Nash Equilibrium），就是雙方參與者都背叛對方，結果二人同樣服刑2年。

單次發生的囚徒困境，和多次重複的囚徒困境結果不會一樣。在重複的囚徒困境中，每個參與者都有機會去「懲罰」另一個參與者前一回合的不合作行為。這時，合作可能會作為均衡的結果出現。欺騙的動機這時可能被受到懲罰的威脅所克服，從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量，納什均衡趨向於帕累托最優。

Paul's Blog

Saturday, July 29, 2006

博弈論中的囚徒困境 Prisoner's dilemma in Game Theory

1 Comments:

About Me

Current Time

Previous Posts