博弈论
第1章策略式博弈和纳什均衡

1.1 囚徒困境

在著名的“囚徒困境”博弈中，一轮删除严格劣势策略就提供了唯一答案，这一博弈展现在图1–7中。博弈背后的故事是，两个人因为一桩罪行而被捕。警方缺少充分的证据来对两个嫌疑犯定罪，因此需要他们做出供供证词。警方让两人被处于不同房间以防止他们串供。警方告诉每个嫌疑犯，如果他证另一个嫌疑犯有罪（不与另一方合作），在另一方没有提供任何证明时他会获得释放，并得到作证的奖励。如果两个人都不提供证词，则由于证据不足，两个人都将释放，也不会得到奖励。如果一个人作证，则另一方会被判入狱；如果两个人均作证，那么他们都入狱，但同时也会得到作证的奖励。在这个博弈中，两个参与人同时在两个行动中选择。如果两个参与人采用合作 (C，表示不作证)，他们每人得到 1。如果他们均表现为不合作 (D，表示背叛)，他们得到 0。如果一方合作另一方不合作，则后者获得奖励 (得到 2) 而前者受罚 (得到 -1)。尽管合作会为每个参与人提供收益 1，但自利行为导致收益为 0 的无效率结果。（对于认为这一结论不合理的读者来说，我们的反应是，他们的直觉可能涉及的是不同的博弈——其中可能多人在作出背叛时“有罪恶感”，或者他们害怕背叛会带来未来的不利后果。如果这里的博弈重复运行，其他结果可以成为均衡）

图 1–7 的收益矩阵如下：

	C	D
C	1, 1	−1, 2
D	2, −1	0, 0

囚徒困境的许多版本出现在社会科学领域。一个例子是团队中的道德风险行为。假设存在两个工人，i = 1, 2，每个人可以“工作” (si = 1) 或 “偷懒” (si = 0)。团队的总产出是 4(si + s2)，并在两个工人中平均分配。每个人在工作时承担私人成本为 3，在偷懒时私人成本为 0。用 C 表示“工作”，D 表示“偷懒”，那么这种团队中的道德风险行为的收益矩阵就是图 1–7，而“工作”对每个参与人来说都是一个严格劣势策略。

上次更新: 2026/02/23, 04:13:25