如何逃离囚徒困境

在以前的文章中我介绍过囚徒困境，并且介绍了 Tit for Tat 策略，这种策略可以在多轮囚徒困境中不至于受益太差。那么，假如囚徒困境的游戏只有一轮呢？有什么好的方法可以达到左上角那个双赢状态而不是左下角那个对两者都不是最优的状态呢？

囚徒困境是一个纯博弈论的模型，这个模型里面的赋值就直接决定了想要最大化自己利益的局中人必然会陷入困境，这是模型无法避免的。所以想要跳出这个困境，只能靠博弈论之外的手段。所幸的是，我们人类早就发现了这两种方法，并且都在实践中尝试过了这样两种方法。第一种方法可以看成是直接的斩草除根法，即直接剥夺两个局中人选择“不合作”这个选项的自由，让他们都只有一个合作的选项。这种政治学方法的优缺点在此我们不做讨论，我们关心的是第二种方法，一种经济学的方法–通过改变游戏受益矩阵，在新的游戏中，让局中人偏好合作。在宏观经济的实践中，第二种的一般实现方法则是通过道德和法律手段对选择不合作的进行惩罚，对选择合作的实施奖励，以期改变整个收益矩阵，让这个收益矩阵不再满足囚徒困境的条件。因为道德手段不确定太多，我们只考虑现代社会的最普遍手段，即法律手段。具体来说，就是让局中人构建合同，并通过合同法等立法手段保护这个合同的实行，从而改变收益矩阵。

从博弈论的角度理解合同的话，通过订立合同，规定合同和法律效力，调控局中人不合作所获得的收益，使得局中人不再偏好”不守约定”选项。具体的做法也很简单，估计聪明的各位早就想到了：

假定双方都选择合作则收益为 a, 而甲方合作，乙方背叛的时候，甲的收益是 b, 而乙的收益是 c。按照我们的囚徒困境假设，背叛的收益 c 要大于合作的收益 a，这样乙才会偏好背叛。现在我们假设甲乙事先签订一个合同，规定背叛的一方要向合作（没有背叛）的一方支付损失。我们假设这个值为 r。显然的，现在乙背叛之后的收益就变成了 c-r，而甲合作的收益就是 b+r。对于乙来说，我们的目的是要让他偏好合作，所以我们一定要让 a 大于等于 c-r。最极限的情况就是 a = c-r，于是， r = c-a。这样，乙的收益变成了 a，而甲的收益变成了 b+c-a，乙即使背叛也占不到好处，而甲也收到了合作的回报。

当然我这里说的是一个简化的模型。不同的司法实践可能会取不同的 r 值，但是法的精神都是一样的，法律本身不限制你的选择，只是通过合理的奖励和惩罚，让理性的人自然的做出符合自己利益的选择。

从经济学角度来说，人类社会的运行中必然会有这样那样的博弈，尤其是市场经济发达的现代社会，可以说博弈无处不在，而避免如囚徒困境这样的博弈情景也是社会效率所必须的。如果单纯地剥夺局中人的选择权，通过”下一盘很大的棋”的方式去掉博弈选项，逃避囚徒困境，那么局中人就可能不能完成充分博弈，利益得不到最大化。而事实也证明，这种方法在实践中效率不够高，因为人类社会运行这盘旗完全复杂到任何人都不能全盘掌控，而且很容易就造成哈耶克说的”通向奴役之路”。而法律为我们提供了另一种截然不同的思路，即仍然保持博弈，但调控收益矩阵，这样，仍然保证了合同双方的博弈选择自由。在合同法和自由的关系的阐述上，西方学者马克思韦伯曾经说过一段著名的话: “规范合同双方的那些法律的发展，以及在规范的框架下允许自由意志的法律的充分发展，往往被视为个人自由发展的标志[1]“。通过对囚徒困境的解决方法和韦伯的这句话，应该不难理解为什么市场经济发达的国家恰好就法律制度健全，且恰好有较多的个人自由。

—-

[1] 这个自由具体来说叫做 Freedom of Contract, 有兴趣的读者可以阅读 “Max Weber on Law in Economy and Society”