Paul's Blog

This is my first blog. 希望每日也有一些事可記錄下來,否則那日就好像是白過。

Saturday, July 29, 2006

博弈論中的囚徒困境 Prisoner's dilemma in Game Theory

經典的囚徒困境如下:警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯,並向雙方提供以下相同的選擇:
- 若一人認罪並作證檢舉對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。
- 若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。
- 若二人都互相檢舉(互相「背叛」),則二人同樣判監2年。

囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。試設想困境中兩名理性囚徒會如何作出選擇:
- 若對方沉默:背叛會讓我獲釋,所以會選擇背叛。
- 若對方背叛指控我:我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。

二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的均衡(所謂「納什均衡」 Nash Equilibrium),就是雙方參與者都背叛對方,結果二人同樣服刑2年。

單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。在重複的囚徒困境中,每個參與者都有機會去「懲罰」另一個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量,納什均衡趨向於帕累托最優。

1 Comments:

At 2:56 AM, Anonymous Anonymous said...

This site is one of the best I have ever seen, wish I had one like this.
»

 

Post a Comment

<< Home