1.1 囚徒困境
在著名的“囚徒困境”博弈中,一轮删除严格劣势策略就提供了唯一答案,这一博弈展现在图1–7中。博弈背后的故事是,两个人因为一桩罪行而被捕。警方缺少充分的证据来对两个嫌疑犯定罪,因此需要他们做出供供证词。警方让两人被处于不同房间以防止他们串供。警方告诉每个嫌疑犯,如果他证另一个嫌疑犯有罪(不与另一方合作),在另一方没有提供任何证明时他会获得释放,并得到作证的奖励。如果两个人都不提供证词,则由于证据不足,两个人都将释放,也不会得到奖励。如果一个人作证,则另一方会被判入狱;如果两个人均作证,那么他们都入狱,但同时也会得到作证的奖励。在这个博弈中,两个参与人同时在两个行动中选择。如果两个参与人采用合作 (C,表示不作证),他们每人得到 1。如果他们均表现为不合作 (D,表示背叛),他们得到 0。如果一方合作另一方不合作,则后者获得奖励 (得到 2) 而前者受罚 (得到 -1)。尽管合作会为每个参与人提供收益 1,但自利行为导致收益为 0 的无效率结果。(对于认为这一结论不合理的读者来说,我们的反应是,他们的直觉可能涉及的是不同的博弈——其中可能多人在作出背叛时“有罪恶感”,或者他们害怕背叛会带来未来的不利后果。如果这里的博弈重复运行,其他结果可以成为均衡)
图 1–7 的收益矩阵如下:
| C | D | |
|---|---|---|
| C | 1, 1 | −1, 2 |
| D | 2, −1 | 0, 0 |
囚徒困境的许多版本出现在社会科学领域。一个例子是团队中的道德风险行为。假设存在两个工人,i = 1, 2,每个人可以“工作” (si = 1) 或 “偷懒” (si = 0)。团队的总产出是 4(si + s2),并在两个工人中平均分配。每个人在工作时承担私人成本为 3,在偷懒时私人成本为 0。用 C 表示“工作”,D 表示“偷懒”,那么这种团队中的道德风险行为的收益矩阵就是图 1–7,而“工作”对每个参与人来说都是一个严格劣势策略。