Maktub_Wiki Maktub_Wiki
主站 (opens new window)
  • 服务搭建
  • 网络服务
  • 开源框架
  • 操作系统
  • iOS/MacOS
  • 算法导论(Python)
  • Leetcode
  • 线性代数
  • 经济周期笔记
主站 (opens new window)
  • 服务搭建
  • 网络服务
  • 开源框架
  • 操作系统
  • iOS/MacOS
  • 算法导论(Python)
  • Leetcode
  • 线性代数
  • 经济周期笔记
  • 第1章 策略式博弈和纳什均衡

    • 1.1 囚徒困境
  • 博弈论
  • 第1章 策略式博弈和纳什均衡
Maktub_小明
2025-11-15

1.1 囚徒困境

在著名的“囚徒困境”博弈中,一轮删除严格劣势策略就提供了唯一答案,这一博弈展现在图1–7中。博弈背后的故事是,两个人因为一桩罪行而被捕。警方缺少充分的证据来对两个嫌疑犯定罪,因此需要他们做出供供证词。警方让两人被处于不同房间以防止他们串供。警方告诉每个嫌疑犯,如果他证另一个嫌疑犯有罪(不与另一方合作),在另一方没有提供任何证明时他会获得释放,并得到作证的奖励。如果两个人都不提供证词,则由于证据不足,两个人都将释放,也不会得到奖励。如果一个人作证,则另一方会被判入狱;如果两个人均作证,那么他们都入狱,但同时也会得到作证的奖励。在这个博弈中,两个参与人同时在两个行动中选择。如果两个参与人采用合作 (C,表示不作证),他们每人得到 1。如果他们均表现为不合作 (D,表示背叛),他们得到 0。如果一方合作另一方不合作,则后者获得奖励 (得到 2) 而前者受罚 (得到 -1)。尽管合作会为每个参与人提供收益 1,但自利行为导致收益为 0 的无效率结果。(对于认为这一结论不合理的读者来说,我们的反应是,他们的直觉可能涉及的是不同的博弈——其中可能多人在作出背叛时“有罪恶感”,或者他们害怕背叛会带来未来的不利后果。如果这里的博弈重复运行,其他结果可以成为均衡)

图 1–7 的收益矩阵如下:

C D
C 1, 1 −1, 2
D 2, −1 0, 0

囚徒困境的许多版本出现在社会科学领域。一个例子是团队中的道德风险行为。假设存在两个工人,i = 1, 2,每个人可以“工作” (si = 1) 或 “偷懒” (si = 0)。团队的总产出是 4(si + s2),并在两个工人中平均分配。每个人在工作时承担私人成本为 3,在偷懒时私人成本为 0。用 C 表示“工作”,D 表示“偷懒”,那么这种团队中的道德风险行为的收益矩阵就是图 1–7,而“工作”对每个参与人来说都是一个严格劣势策略。

上次更新: 2025/11/17, 13:01:13
Theme by Vdoing | Copyright © 2021-2025 Maktub_小明 | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式