悦享书萃|(三十)湘潭司法行政青年陈菲尔与你一起分享《博弈论基础》
湘潭市司法局 xtsf.xiangtan.gov.cn 发布时间:2024-05-08 08:22
大家好!今天我要给各位书友分享的书是《博弈论基础》。博弈论是经济学中一门十分重要的理论,它被用来分析多人决策,无论是在经济学还是经济学以外的领域的应用都十分广泛。我将以书中提到的一个重要的案例“囚徒困境”为例,与大家分享我的思考和感悟。

“两个犯罪嫌疑人被捕并受到指控,但除非至少一个人招认犯罪,警方并无充足证据将其按罪判刑。警方把他们关入不同牢室,并对他们说明不同行动带来的后果。如果两人都不坦白,将均被判为轻度犯罪,入狱一个月;如果双方都坦白招认,都将被判入狱六个月;最后,如果一人招认而另一人拒不坦白,招认的一方将马上获释,而另一人将被判入狱九个月————所犯罪行六个月,干扰司法加判三个月。”
两个犯罪嫌疑人的策略(即他们可以选择的行动)及收益如下图所示。

在囚徒困境中,博弈的两个参与人的收益取决于自己和对方选择的策略,所以对于其中一个参与人而言,要根据对方可能的策略选择对自己有利的策略。
可以看到,在囚徒2选择“沉默”时,囚徒1选择“沉默”的收益是-1,即被判入狱一个月,囚徒1选择“招认”的收益是0,即被立即释放。所以此时选择“招认”更为有利。同样,在囚徒2选择“招认”时,囚徒1选择“沉默”的收益是-9,即被判入狱九个月,囚徒1选择“招认”的收益是-6,即被判入狱六个月。所以此时选择“招认”更为有利。结果,无论囚徒2选择“沉默”还是“招认”,囚徒1选择“招认”都是更为有利的。从囚徒2的视角来看,同样是选择“招认”更有利。于是最后的结果是两人都招认犯罪,均被判入狱6个月。
这里出现了一个令常人难以理解的疑点:明明两个犯罪嫌疑人不约而同地选择“沉默”比都选择“招认”对双方都更有利,为什么他们最后还是选择了对双方更不利的局面?
从这个疑点出发,我们可以想出几个解释,这些解释揭示了一些事实或者道理。
一、“合作”缺乏约束机制
让我们姑且将二人不约而同选择“沉默”称为囚犯之间的一种“合作”,因为这有利于他们整体的利益。表面上看,双方都有足够的动机去维持这个“合作”的局面,即保持沉默,直到超过办案期限。这样他们两人只需要坐一个月的牢,相比于六个月甚至九个月要轻得多。但事实上,两个囚犯的合作很容易破裂,因为存在着一个巨大的漏洞——违约不但不要付出代价,反而还有额外的收益。这也是警方设计这个局面的用意所在。可以看到,如果一方守约,保持沉默,而另一方违约,选择招认,那么另一方会得到比双方合作更大的利益,即被立即释放;守约的一方反而会因为约定的存在干扰司法而被从重判刑。双方在守约的过程中发现了约定本身的约束力之小,而违约的利益之大,自然会倾向于选择违约。因此,现实中的合作,双方往往会约定违约责任,以约束双方不因订立约定后出现更大的利益诱惑而违约。
二、只考虑个人利益
第一种解释看似合理,但隐含着一个前提:双方都以个人利益为重,集体利益次之。博弈论研究的前提之一正是“理性人”假设,即假定博弈的参与者都只会做出对自己更有利的选择,而不会因为其他原因退而求其次。在经济学的领域中,因为商事主体参与经济活动的目的就是获取经济利益,所以产生“理性人”的概念理所应当;但是在现实中,人们往往并不一味地以个人利益为重,而是适当地考虑集体利益与他人的利益,这样才能实现“双赢”“多赢”,才能赢得别人的信赖和尊重。在囚徒困境中,两个囚徒正是因为只考虑自己的利益,而不考虑整体的利益,才会掉进警方设计的陷阱中,双双招认,锒铛入狱。如果任意一方冒着被背叛的风险选择沉默,结局也许是合作的成功(虽然这并不符合社会对囚犯的期待,但也的确是一种“诚信”的体现)。
三、双方掌握的信息有限
让我们从这个博弈局面本身来看,让两个囚徒绞尽脑汁猜测对方的策略、计算自己的得失的,正是信息的缺乏。因为二人被分开关押且能接触到的只有警方,所以他们并不能通过协商达成更稳固的“合作”(如出狱后报答对方等),也不能想出其他的策略选择(如部分招认、做虚假陈述等)。由此可以看出,信息的缺乏导致双方策略的有限,也导致了“囚徒困境”这一格局的形成。现实中,对信息的掌握决定着个人的生活选择,也广泛影响着经济、政治等领域中参与者的选择。人们往往说“要抓住机会”,认识到“机会”的存在,了解抓住机会的方法,靠的就是人们掌握的信息。当获得更多的信息,可以作出的选择自然也会增加。机会的重要性不言而喻。
“囚徒困境”是博弈论中较为经典也较为简单的一个案例,在整个博弈论的理论中,还会说到决策的参与者有先后顺序的决策,以及在多轮博弈中的决策,十分精彩,令人很受启发。希望大家也能对博弈论产生兴趣,进而去了解这门理论,为自己的人生增添更多智慧。
- 全部留言
- /
- 评论
- 有用()