商业与经济中的囚徒困境

囚徒困境是由梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷舍(Melvin Dresher)于1950年在兰德公司提出的一个悖论概念。后来由加拿大数学家艾伯特·威廉·塔克(Albert William Tucker)正式化并命名。

囚徒困境基本上提供了一个理解合作与竞争之间平衡的框架,这些概念有时也可以成为战略决策的有用工具。因此,它在商业、金融、经济学、政治学乃至哲学、心理学、生物学和社会学等多个领域都有应用。

主要要点

  • 囚徒困境描述了在博弈论中,两个自私行动的玩家最终会导致双方都处于次优选择的情形。
  • 囚徒困境也告诉我们,单纯的合作并不总是符合个人最大利益。
  • 在现实世界中,囚徒困境的经典例子是两个竞争者在市场中的激烈角逐。
  • 在商业中,理解某些决策结构为囚徒困境,可以带来更有利的结果。
  • 这种设置允许在竞争与合作之间取得平衡,实现共同利益。

Investopedia解答

提问

VioletaStoimenova / Getty Images

理解囚徒困境

囚徒困境的情境如下:两名嫌疑人在警方局中被捕,分别关在不同的房间里,无法相互沟通。检察官分别告诉他们以下内容:

  • 如果你认罪并同意作证指控另一名嫌疑人,而他不认罪,你的指控将被撤销,你将获释,而另一名嫌疑人将服三年刑期。
  • 如果你不认罪,但对方认罪,你将被判刑三年,而对方获释。
  • 如果你们都认罪,你们都将被判两年。
  • 如果你们都不认罪,你们都将被控轻罪,判一年。

嫌疑人们应该怎么做?这就是囚徒困境的核心。

囚徒困境的基本概念

要使囚徒困境悖论成立,必须具备一些基本概念。这些包括:

  • **必须有两个玩家。**情境涉及两个个体或实体,他们共同涉及某个事件,比如共同犯罪或面临共同决策。
  • **决策同时进行。**两名玩家在不知道对方选择的情况下做出决定。这种同时决策是困境的关键,每一方都必须在不了解对方选择的情况下做出决定。
  • **必须存在多种结果组合。**收益矩阵是一张表,列出双方可能的选择组合及对应的收益或结果,帮助可视化不同决策的后果。稍后我们会详细介绍收益矩阵。
  • **可以是互相合作或互相背叛。**玩家可以选择合作(追求互利的结果)或背叛(追求自我利益最大化)。囚徒困境的张力来自个人利益与集体利益之间的冲突。
  • **每个玩家都有一个优势策略。**该策略是无论对方选择什么,都能带来最佳结果的选项。这种优势策略通常是理性的选择,但当双方都采取时,可能导致次优结果。
  • **假设玩家是理性决策者。**意味着人们倾向于最大化自身利益。这是博弈论和理性选择模型的基本假设,驱动着选项之间的冲突。

评估最佳行动方案

让我们先构建一个收益矩阵,如下表所示。这里的“收益”以服刑时间的长短(用负号表示,数字越大越好)来衡量。“合作”和“背叛”指嫌疑人合作(例如都不认罪)或背叛(即一方认罪另一方不认罪)。单元格(a)到(d)中的第一个数字代表嫌疑人A的收益,第二个数字代表嫌疑人B的收益。

囚徒困境——收益矩阵
嫌疑人B
合作
嫌疑人A
合作
背叛

对于玩家来说,优势策略是无论对方采取什么行动,都能带来最佳结果的策略。这里的优势策略是双方都选择背叛(认罪),因为认罪可以最小化平均服刑时间。可能的结果包括:

  • 如果A和B都合作(不认罪),都判一年(单元格a)。
  • 如果A认罪但B不认罪,A获释,B判三年(单元格b)。
  • 如果A不认罪但B认罪,A判三年,B获释(单元格c)。
  • 如果双方都认罪,双方都判两年(单元格d)。

因此,如果A认罪,他们要么获释,要么判两年。若不认罪,则可能获一年或三年。B的情况完全相同。

囚徒困境的影响

囚徒困境巧妙地展示了:当每个人都追求自身利益时,结果往往比合作更糟。在上述例子中,合作(双方都保持沉默,不认罪)可以让两人都只判一年。其他结果可能导致两到三年的判刑。

实际上,一个只关心最大利益的理性人通常会选择背叛,而不是合作。如果双方都假设对方不会背叛,选择背叛(认罪),最终会导致双方都判两年(单元格d),而不是他们原本希望的单元格b或c。

在囚徒的例子中,合作(保持沉默)意味着一人判一年,而认罪可能带来自由或两年判刑。而不认罪的最大风险是三年判刑(如果对方认罪且自己不认罪)。这种激励背叛(不合作)但合作可能带来最佳结果的矛盾,在商业和经济中表现得淋漓尽致。

快速事实

艾伯特·塔克(Albert Tucker)于1950年首次向斯坦福大学的研究生心理学学生介绍囚徒困境,作为博弈论的一个例子。

商业中的应用

在现实中,囚徒困境的经典例子是两个竞争者在市场中的激烈竞争。许多行业中存在两个主要对手。例如,在美国,可口可乐(KO)与百事可乐(PEP)在软饮料市场的竞争,家得宝(HD)与洛威(LOW)在建材市场的竞争。这些竞争成为商学院的众多案例研究对象。其他激烈的竞争还包括加拿大的星巴克(SBUX)与Tim Horton’s(QSR),以及全球手机市场的苹果(AAPL)与三星。

以可口可乐与百事可乐为例,假设前者考虑降低其标志性汽水的价格。如果降价,百事可能不得不跟进以保持市场份额。这可能导致两家公司利润大幅下降。

任何一方降价都可视为背叛,因为这打破了保持价格高位、最大化利润的隐性协议。如果可口可乐降价而百事保持高价,前者可能赢得更多市场份额和额外利润;反之亦然。

收益矩阵

假设可口可乐和百事的额外利润如下:

  • 双方都保持高价,利润各增加5亿美元(正常需求增长)。
  • 一方降价(背叛),另一方不变(合作),前者利润增加7.5亿美元,后者不变。
  • 双方都降价,软饮料销量增加,利润各增加2.5亿美元。

收益矩阵如下(数字代表以百万元为单位的额外利润):

可口可乐 vs. 百事可乐——收益矩阵
百事可乐
合作
可口可乐
合作
背叛

其他常见的囚徒困境例子还包括新产品或技术开发、广告和市场营销支出等方面。

经济中的应用

美国两党在债务问题上的僵局,是囚徒困境的经典例子。

假设解决美国债务问题的益处是下一次选举中的选票。合作意味着双方愿意维持现状,控制不断上升的预算赤字;背叛则意味着采取措施缩减赤字。

如果双方都合作,经济平稳运行,选票会有所增加。但如果A党试图主动解决债务问题,而B党不合作,B可能会失去选票,转而支持A。

如果双方都不合作,采取强硬措施,可能引发市场动荡、信用评级下调甚至政府关门,最终都可能失去选票。

你能怎么用它?

囚徒困境可以帮助个人在生活中的多种决策中,比如买车、薪资谈判等。

比如,你打算买新车,走进一家经销商。你的“收益”是对交易的满意度(非数字化指标)。你希望以最低价格、最优配置买到车,而销售员希望以最高价格赚取最大提成。

合作意味着不讨价还价,直接接受标价(销售员满意),带着新车离开。背叛意味着讨价还价,争取更低价格。用10表示完全满意,0表示完全不满意,收益矩阵如下:

买家 vs. 销售员——收益矩阵
销售员
合作
买家
合作
背叛

这个矩阵告诉我们什么?如果你强硬讨价还价,获得大幅降价,你会非常满意,但销售员可能不满意(失去提成)。反之,如果销售员坚持不让步,你可能不满意,但销售员会很满意。

如果你直接支付全价(单元格a),你的满意度较低,销售员也可能不太满意,因为你愿意付全款可能让他觉得可以“引导”你买更贵的车型或加装配件赚更多提成。

单纯讨价还价(单元格d)会导致双方都不满意,因为长时间的讨价还价可能最终达成一个勉强接受的价格。类似地,薪资谈判中,接受第一个报价可能看似简单,但可能会少拿一些钱。争取更高薪资(背叛)可能会带来更高收入,但如果雇主不愿意加薪,你可能会不满意。

希望薪资谈判不要变得激烈,否则会降低你的满意度和雇主的满意度。前述买卖收益矩阵也可以扩展到求职者与雇主的满意度。

经济学中的囚徒困境例子

我们最后讨论一下囚徒困境在经济中的表现。宏观经济中的例子是政府财政政策在经济衰退时的表现。

当经济衰退时,各国政府面临是否采取扩张性财政政策以刺激经济增长的选择。然而,这些政策的效果取决于其他国家的行动。

假设所有国家同时采取扩张性政策,全球需求增加,可能实现复苏。但如果某个国家选择采取紧缩措施(如削减预算),短期内可能稳定,但对全球经济不利。

这类似囚徒困境:每个政府都必须决定是合作(共同实施扩张政策)还是背叛(采取紧缩措施)。如果所有国家合作,全球经济更有可能复苏;如果某些国家背叛,追求最大个人利益,整体复苏将受阻,结果对所有国家都不利。

囚徒困境的答案是什么?

没有绝对正确的答案。它展示了个人决策如何影响整体结果,是一种悖论。

用简单的话说

两个囚犯面对是否认罪或保持沉默的选择,不能沟通。每个人的选择影响对方。如果一方认罪,另一方不认罪,认罪者获释,另一人判长刑;如果都保持沉默,双方都判较短的刑期;如果都认罪,双方都判中等刑期。博弈论预测,通常人们会选择对自己最有利的选项。

最佳策略是什么?

囚徒困境不是关于“最佳策略”或“答案”,而是展示两个个体追求自身利益时,难以实现双赢的最优结果。

总结

囚徒困境告诉我们,追求个人利益并不总能带来最优的集体结果。企业、政府和个人在行动时,应考虑合作可能带来的积极影响,而非单纯追求短期利益。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论