囚徒困境是一個由 Merrill Flood 和 Melvin Dresher 於 1950 年在蘭德公司構思的悖論。後來由加拿大數學家 Albert William Tucker 正式化並命名。囚徒困境基本上提供了一個理解如何在合作與競爭之間取得平衡的框架,這些概念有時也能成為策略決策的有用工具。因此,它在商業、金融、經濟、政治科學甚至哲學、心理學、生物學和社會學等多個領域都有應用。### 主要重點* 囚徒困境描述了一個情境,根據博弈論,兩個自私行事的玩家最終都會做出對雙方都非最佳的選擇。* 囚徒困境也告訴我們,僅僅合作並不總是符合個人最大利益。* 在現實世界中,囚徒困境的經典例子是兩個競爭者在市場上激烈角逐時的情況。* 在商業中,理解某些決策結構為囚徒困境,可以帶來更有利的結果。* 這種設置允許在競爭與合作之間取得平衡,以達到雙贏。### Investopedia 解答 提問 VioletaStoimenova / Getty Images理解囚徒困境 ----------------------------------------囚徒困境的情境如下:兩名嫌疑人在警察局被逮捕,分別在不同的房間,無法相互溝通。檢察官分別告訴他們以下內容:* 如果你認罪並同意作證指控另一名嫌疑人,而他不認罪,你的指控將被撤銷,你將獲得自由,而另一名嫌疑人將服三年徒刑。* 如果你不認罪,但另一名嫌疑人認罪,你將被判刑三年,而他將獲得自由。* 如果你們都認罪,你們都將被判兩年監禁。* 如果你們都不認罪,你們都將被控以輕罪,判一年監禁。嫌疑人應該怎麼做?這就是囚徒困境的核心。囚徒困境的基本概念 --------------------------------------------要使囚徒困境悖論成立,必須具備一些基本概念,包括:* **必須有兩個玩家。** 這個情境涉及兩個個人或實體,他們共同牽涉在一個情境中,例如共同犯罪或面臨共同決策。* **決策是在同一時間做出的。** 兩個玩家在不知道對方選擇的情況下做出決定。這種同步決策是困境的關鍵,因為每一方都必須在不考慮對方決策的情況下做出選擇。* **必須有多種結果組合。** 獎勵矩陣是一個表格,列出雙方可能的選擇組合及其對應的獎勵或結果,幫助可視化不同決策的後果。稍後我們會詳細討論獎勵矩陣。* **可以是互相合作或互相背叛。** 玩家可以選擇合作(追求雙贏結果)或背叛(追求個人利益最大化)。囚徒困境的張力來自個人利益與集體利益之間的衝突。* **每個玩家都有一個優勢策略。** 這個策略是對該玩家來說最有利的選擇,不論對方的決策如何。這個優勢策略通常是理性的選擇,但當雙方都採用時,會導致非最佳結果。* **假設玩家是理性決策者。** 這意味著人們傾向於最大化自己的利益。這個假設是博弈論和理性選擇模型的基本前提,驅動著選擇之間的衝突。評估最佳行動方案 ------------------------------------讓我們先建立一個獎勵矩陣,如下表所示。這裡的“獎勵”以監禁時間長短來衡量(用負號表示,數字越大越好)。“合作”和“背叛”分別代表嫌疑人合作(例如都不認罪)或背叛(即一方認罪另一方不認罪)。格子(a)到(d)中的第一個數字是嫌疑人A的獎勵,第二個數字是嫌疑人B的獎勵。| **囚徒困境 – 獎勵矩陣** || --- || || || || || **嫌疑人B** || || || || || **合作** | **背叛** || **嫌疑人A** || **合作** | (a) -1, -1 | (c) -3, 0 || | | || **背叛** | (b) 0, -3 | (d) -2, -2 |對於玩家來說,優勢策略是能帶來最佳結果的策略,不論對方採用何種策略。這裡的優勢策略是每個玩家都背叛(認罪),因為認罪能最小化監禁時間的平均長度。以下是可能的結果:* 如果A和B都合作(都不認罪),都判一年(格子(a))。* 如果A認罪但B不認罪,A獲得自由,B判三年(格子(b))。* 如果A不認罪但B認罪,A判三年,B獲得自由(格子(c))。* 如果兩人都認罪,兩人都判兩年(格子(d))。因此,如果A認罪,他們可能獲得自由或兩年監禁;如果不認罪,則可能獲得一年或三年監禁。B面臨的情況完全相同。囚徒困境的啟示 --------------------------------------囚徒困境巧妙地展示了:當每個人都追求自己的利益時,結果往往比雙方合作的結果更糟。在上述例子中,合作(雙方都保持沉默,不認罪)會讓兩名嫌疑人都只判一年。其他結果則可能是兩年或三年的判刑。理性的人若只追求最大利益,通常會選擇背叛而非合作。如果雙方都假設對方不會背叛,結果會是雙方都背叛(格子(d)),各判兩年,這比合作的結果更差。在囚徒的例子中,合作(與另一嫌疑人保持沉默)會得到不可避免的一年判刑,而認罪則可能在最好的情況下獲得自由,最壞則判兩年。然而,不認罪的最大風險是被判三年,如果A相信B會保持沉默但B卻認罪(或反之),就會面臨最高的三年刑期。這種激勵背叛(不合作)但合作可能帶來最佳結果的矛盾,廣泛存在於商業和經濟的多個層面。### 快速事實Albert Tucker 於 1950 年首次向史丹佛大學的研究生心理學學生展示囚徒困境,作為博弈論的範例。### 商業應用 --------------------------------------------在現實中,囚徒困境的經典例子是兩個競爭者在市場上的激烈競爭。許多行業中,主要有兩個對手。例如,在美國,可口可樂(KO)與百事可樂(PEP)在軟飲市場激烈對抗,家得寶(HD)與勞氏(LOW)在建材市場的競爭。這些競爭案例在商學院中被廣泛研究。其他激烈的對抗還包括加拿大的星巴克(SBUX)與 Tim Horton’s(QSR),以及全球手機市場的蘋果(AAPL)與三星。以可口可樂與百事可樂為例,假設前者考慮降低其標誌性汽水的價格。如果這樣做,百事可能別無選擇,只能跟進以維持市場份額。這可能導致雙方利潤大幅下降。任何一方降價都可視為背叛,因為這打破了保持高價和最大化利潤的默契協議。因此,如果可口可樂降價而百事保持高價,前者就算背叛,後者則合作(遵守默契)。在這種情況下,可口可樂可能藉由增加銷售量來獲得市場份額和額外利潤。獎勵矩陣 -----------------假設可口可樂和百事的額外利潤如下:* 兩者都保持高價,利潤各增加5億美元(由於需求正常增長)。* 一方降價(背叛),另一方不降(合作),前者利潤增加7.5億美元,因為市場份額擴大,後者利潤不變。* 兩者都降價,飲料銷量增加抵消降價帶來的利潤損失,雙方利潤各增加2.5億美元。獎勵矩陣如下(數字以百萬美元為單位):| **可口可樂 vs. 百事可樂 – 獎勵矩陣** || --- || || || || || **百事可樂** || || || || || **合作** | **背叛** || **可口可樂** || **合作** | 500, 500 | 0, 750 || | | || **背叛** | 750, 0 | 250, 250 |其他常見的囚徒困境例子包括新產品或技術開發,以及公司在廣告和市場推廣上的投入。例如,兩家公司若有默契在某年保持廣告預算不變,則其淨收入可能保持在較高水平。但若其中一家公司背叛,增加廣告預算,則可能藉由更高的銷售額獲得更大利潤,儘管增加的廣告費用會抵消部分收益。然而,若雙方都增加預算,則彼此的努力可能相互抵銷,導致效果不佳,反而降低利潤(由於廣告費用增加),比保持預算不變更有利。### 經濟中的應用 --------------------------------------------美國民主黨與共和黨之間的債務僵局,是囚徒困境的經典例子。假設解決美國債務問題的效益是下一次選舉的選票支持。合作意味著雙方願意維持現狀,控制不斷擴大的預算赤字;背叛則是採取更保守的措施,縮減開支。如果雙方都合作,經濟能較順利運行,選票也會增加。但如果A黨試圖積極解決債務問題,而B黨不合作,B可能因此失去選票,轉而支持A。反之,若雙方都選擇激烈對抗,經濟可能陷入動盪(股市下跌、信用評級下調、政府關門),導致雙方的選票都受損。如何運用? -----------------------囚徒困境可以用來幫助個人在生活中的決策,例如買車、薪資談判等。假設你打算買新車,走進經銷商。你的“獎勵”是滿意度(非數值屬性),你希望以最優惠的價格、最滿意的車輛條件成交,而銷售員則希望賣出最高價以獲取最大佣金。合作意味著不議價,直接接受標價(銷售員滿意),然後帶走車。背叛則是議價,想要更低的價格,而銷售員則想要更高的價格。假設滿意度用0到10的數值表示,10代表完全滿意,0代表完全不滿意,獎勵矩陣如下:| **買家 vs. 銷售員 – 獎勵矩陣** || --- || || || || || **銷售員** || || || || || **合作** | **背叛** || **買家** || **合作** | (7,7) | (0,10) || | | || **背叛** | (10,0) | (3,3) |這個矩陣告訴我們什麼?如果你強硬議價,成功獲得大幅折扣,會讓你非常滿意(滿意度10),但銷售員可能不滿(滿意度較低,格子(b))。反之,如果銷售員堅持原價,你可能不滿(格子(c)),而銷售員則滿意。如果你直接接受標價(格子(a)),滿意度較低,銷售員也可能不太滿意,因為你可能讓他懷疑是否能賣出更貴的車或多加配備來賺取更多佣金。格子(d)則是雙方都激烈議價,最終可能達成勉強的折衷,雙方都不太滿意。類似地,在薪資談判中,接受第一個提議可能看似簡單,但可能會損失一些薪資空間。議價爭取更高薪資,則可能拿到更豐厚的待遇,但如果雇主不願意,則可能不滿意最終結果。理想情況是雙方都能合作,避免惡化談判氛圍,達到雙贏。經濟中的囚徒困境範例 ----------------------------------------------最後,我們來談談囚徒困境在經濟中的應用。一個宏觀經濟的例子是政府在經濟衰退時的財政政策。當經濟衰退時,各國政府面臨是否採取擴張性財政政策來刺激經濟的抉擇。這些政策的效果取決於其他國家的行動。假設所有國家都同時採取擴張性政策,全球經濟將受益於需求增加,可能促成復甦。但如果某個國家選擇保守策略,實行緊縮或削減預算,短期內可能較為穩定,但全球影響可能不利。這就像囚徒困境:每個政府都必須決定是合作(共同推行擴張政策)還是背叛(採取緊縮措施)。如果所有國家都合作,全球經濟能更有效復甦;若某些國家背叛,追求最大個人利益,則整體復甦會受阻,結果對所有國家都不理想。囚徒困境的解答? --------------------------------------------沒有絕對正確的答案。它展示了個人決策如何影響整體結果。簡單來說,兩個囚徒面臨是否認罪或保持沉默的選擇,彼此的決定會互相影響。若一方認罪而另一方不認罪,認罪者獲得自由,另一方則判較長刑期;雙方都保持沉默,則都判較短刑期;雙方都認罪,則都判中等刑期。博弈論預測,通常人們會選擇對自己最有利的選項。囚徒困境的最佳策略? -----------------------------------------------------其實,囚徒困境並沒有一個“最佳策略”或“答案”。它主要展示了:兩個自利行事的實體,並不會產生雙方都最優的結果。結論 -------------------囚徒困境告訴我們,追求個人利益並不總是帶來最佳結果。企業、政府和個人在行動時,應該考慮合作可能帶來的正面影響,以達到更理想的整體結果。
商業與經濟中的囚徒困境
囚徒困境是一個由 Merrill Flood 和 Melvin Dresher 於 1950 年在蘭德公司構思的悖論。後來由加拿大數學家 Albert William Tucker 正式化並命名。
囚徒困境基本上提供了一個理解如何在合作與競爭之間取得平衡的框架,這些概念有時也能成為策略決策的有用工具。因此,它在商業、金融、經濟、政治科學甚至哲學、心理學、生物學和社會學等多個領域都有應用。
主要重點
Investopedia 解答
提問
VioletaStoimenova / Getty Images
理解囚徒困境
囚徒困境的情境如下:兩名嫌疑人在警察局被逮捕,分別在不同的房間,無法相互溝通。檢察官分別告訴他們以下內容:
嫌疑人應該怎麼做?這就是囚徒困境的核心。
囚徒困境的基本概念
要使囚徒困境悖論成立,必須具備一些基本概念,包括:
評估最佳行動方案
讓我們先建立一個獎勵矩陣,如下表所示。這裡的“獎勵”以監禁時間長短來衡量(用負號表示,數字越大越好)。“合作”和“背叛”分別代表嫌疑人合作(例如都不認罪)或背叛(即一方認罪另一方不認罪)。格子(a)到(d)中的第一個數字是嫌疑人A的獎勵,第二個數字是嫌疑人B的獎勵。
對於玩家來說,優勢策略是能帶來最佳結果的策略,不論對方採用何種策略。這裡的優勢策略是每個玩家都背叛(認罪),因為認罪能最小化監禁時間的平均長度。以下是可能的結果:
因此,如果A認罪,他們可能獲得自由或兩年監禁;如果不認罪,則可能獲得一年或三年監禁。B面臨的情況完全相同。
囚徒困境的啟示
囚徒困境巧妙地展示了:當每個人都追求自己的利益時,結果往往比雙方合作的結果更糟。在上述例子中,合作(雙方都保持沉默,不認罪)會讓兩名嫌疑人都只判一年。其他結果則可能是兩年或三年的判刑。
理性的人若只追求最大利益,通常會選擇背叛而非合作。如果雙方都假設對方不會背叛,結果會是雙方都背叛(格子(d)),各判兩年,這比合作的結果更差。
在囚徒的例子中,合作(與另一嫌疑人保持沉默)會得到不可避免的一年判刑,而認罪則可能在最好的情況下獲得自由,最壞則判兩年。然而,不認罪的最大風險是被判三年,如果A相信B會保持沉默但B卻認罪(或反之),就會面臨最高的三年刑期。
這種激勵背叛(不合作)但合作可能帶來最佳結果的矛盾,廣泛存在於商業和經濟的多個層面。
快速事實
Albert Tucker 於 1950 年首次向史丹佛大學的研究生心理學學生展示囚徒困境,作為博弈論的範例。
商業應用
在現實中,囚徒困境的經典例子是兩個競爭者在市場上的激烈競爭。許多行業中,主要有兩個對手。例如,在美國,可口可樂(KO)與百事可樂(PEP)在軟飲市場激烈對抗,家得寶(HD)與勞氏(LOW)在建材市場的競爭。這些競爭案例在商學院中被廣泛研究。其他激烈的對抗還包括加拿大的星巴克(SBUX)與 Tim Horton’s(QSR),以及全球手機市場的蘋果(AAPL)與三星。
以可口可樂與百事可樂為例,假設前者考慮降低其標誌性汽水的價格。如果這樣做,百事可能別無選擇,只能跟進以維持市場份額。這可能導致雙方利潤大幅下降。
任何一方降價都可視為背叛,因為這打破了保持高價和最大化利潤的默契協議。因此,如果可口可樂降價而百事保持高價,前者就算背叛,後者則合作(遵守默契)。在這種情況下,可口可樂可能藉由增加銷售量來獲得市場份額和額外利潤。
獎勵矩陣
假設可口可樂和百事的額外利潤如下:
獎勵矩陣如下(數字以百萬美元為單位):
其他常見的囚徒困境例子包括新產品或技術開發,以及公司在廣告和市場推廣上的投入。
例如,兩家公司若有默契在某年保持廣告預算不變,則其淨收入可能保持在較高水平。但若其中一家公司背叛,增加廣告預算,則可能藉由更高的銷售額獲得更大利潤,儘管增加的廣告費用會抵消部分收益。然而,若雙方都增加預算,則彼此的努力可能相互抵銷,導致效果不佳,反而降低利潤(由於廣告費用增加),比保持預算不變更有利。
經濟中的應用
美國民主黨與共和黨之間的債務僵局,是囚徒困境的經典例子。
假設解決美國債務問題的效益是下一次選舉的選票支持。合作意味著雙方願意維持現狀,控制不斷擴大的預算赤字;背叛則是採取更保守的措施,縮減開支。
如果雙方都合作,經濟能較順利運行,選票也會增加。但如果A黨試圖積極解決債務問題,而B黨不合作,B可能因此失去選票,轉而支持A。
反之,若雙方都選擇激烈對抗,經濟可能陷入動盪(股市下跌、信用評級下調、政府關門),導致雙方的選票都受損。
如何運用?
囚徒困境可以用來幫助個人在生活中的決策,例如買車、薪資談判等。
假設你打算買新車,走進經銷商。你的“獎勵”是滿意度(非數值屬性),你希望以最優惠的價格、最滿意的車輛條件成交,而銷售員則希望賣出最高價以獲取最大佣金。
合作意味著不議價,直接接受標價(銷售員滿意),然後帶走車。背叛則是議價,想要更低的價格,而銷售員則想要更高的價格。假設滿意度用0到10的數值表示,10代表完全滿意,0代表完全不滿意,獎勵矩陣如下:
這個矩陣告訴我們什麼?如果你強硬議價,成功獲得大幅折扣,會讓你非常滿意(滿意度10),但銷售員可能不滿(滿意度較低,格子(b))。反之,如果銷售員堅持原價,你可能不滿(格子(c)),而銷售員則滿意。
如果你直接接受標價(格子(a)),滿意度較低,銷售員也可能不太滿意,因為你可能讓他懷疑是否能賣出更貴的車或多加配備來賺取更多佣金。
格子(d)則是雙方都激烈議價,最終可能達成勉強的折衷,雙方都不太滿意。
類似地,在薪資談判中,接受第一個提議可能看似簡單,但可能會損失一些薪資空間。議價爭取更高薪資,則可能拿到更豐厚的待遇,但如果雇主不願意,則可能不滿意最終結果。
理想情況是雙方都能合作,避免惡化談判氛圍,達到雙贏。
經濟中的囚徒困境範例
最後,我們來談談囚徒困境在經濟中的應用。一個宏觀經濟的例子是政府在經濟衰退時的財政政策。
當經濟衰退時,各國政府面臨是否採取擴張性財政政策來刺激經濟的抉擇。這些政策的效果取決於其他國家的行動。
假設所有國家都同時採取擴張性政策,全球經濟將受益於需求增加,可能促成復甦。但如果某個國家選擇保守策略,實行緊縮或削減預算,短期內可能較為穩定,但全球影響可能不利。
這就像囚徒困境:每個政府都必須決定是合作(共同推行擴張政策)還是背叛(採取緊縮措施)。如果所有國家都合作,全球經濟能更有效復甦;若某些國家背叛,追求最大個人利益,則整體復甦會受阻,結果對所有國家都不理想。
囚徒困境的解答?
沒有絕對正確的答案。它展示了個人決策如何影響整體結果。
簡單來說,兩個囚徒面臨是否認罪或保持沉默的選擇,彼此的決定會互相影響。若一方認罪而另一方不認罪,認罪者獲得自由,另一方則判較長刑期;雙方都保持沉默,則都判較短刑期;雙方都認罪,則都判中等刑期。博弈論預測,通常人們會選擇對自己最有利的選項。
囚徒困境的最佳策略?
其實,囚徒困境並沒有一個“最佳策略”或“答案”。它主要展示了:兩個自利行事的實體,並不會產生雙方都最優的結果。
結論
囚徒困境告訴我們,追求個人利益並不總是帶來最佳結果。企業、政府和個人在行動時,應該考慮合作可能帶來的正面影響,以達到更理想的整體結果。