科学家家 跳过导航链接
博客首页
给我留言
我的博客
注册
上一篇: 你不知道的神秘点球 下一篇: 美国各专业本硕博收入一览
直觉,固执,谋杀:三则故事

最近在学习贝叶斯理论,遇到以下三则有趣的故事,花了不少时间思考。对于这些故事,每个人可能都有不同的解读,所以这里我主要讲故事,只附上简短的评论。

故事一:直觉

有个问题是这样的:某女,31岁,单身,外向,聪明伶俐。大学时主修哲学。做学生期间,极度关注种族歧视和社会不公正问题,并参与了“反核游行”。以下八种对该女的描述中,你认为哪一种最可能对(概率最高)?请按照这可能性由高到低排序。

A 她是小学老师; B 她在书店工作,平时还练瑜伽; C 她是活跃的女权主义者

D 她是社工,做心理辅导; E 她是“女性投票者联盟”的成员;

F 她是银行出纳; G 她是卖保险的

H 她是银行出纳,并且是活跃的女权主义者。

在很多人的答案中,H项排在了F项前面,但是没人把H项排在C项前面。

这是个很奇怪的现象,因为H项不过是F项和C项的合并,逻辑上,“既是银行出纳又是活跃的女权主义者”的H项概率绝不可能大于F项,“银行出纳”。

在日常生活中也有类似的现象。当某人向你讲述一件事时,他讲的细节越多,你越容易相信他讲的是真的。但是,细节越多,可能意味着这些细节同时发生的可能性越小,所以他讲的事越不可能是真的(当然,这些细节必须相互联系,你才会信以为真。所以他们之间不是互不相干“相互独立”的,但是这些联系是你做为听者自己加进去的)。

简评:这则故事被用来说明古典概率论无法解释人类的决策过程,在起点和直觉上就可能错的离谱。这个实验是Tversky Kahneman 1974年做的,后者后来得了诺贝尔经济学奖,前者本来应该分享这一殊荣,可惜没能活到得奖那天。这里的表述转引自以色列教授Itzhak Gilboa的著作《Theory of Decision under Uncertainty,  这本书极好。

 

故事二:固执

某人不知道电视机的工作原理,他相信那个小盒子里肯定有许许多多小人儿,不停地高速运动来更换图像。这时候来了个工程师,一点点向他解释电视机的工作原理,频谱啊,发射接收啊,信号扩大啊等等。工程师讲得生动浅显,这个人也听得很认真,每一步都使劲儿点头。最后,这人说他很满意,完全明白了这工作原理。然后他问:“但是我觉得说来说去,也就是说那小盒子里其实只有很少几个小人儿,对吧?”

简评:这个故事更像个笑话,不过它揭示了个道理:第一印象是很难改变的。第一印象一旦形成就很难彻底消除,以后就算接受了新信息,也往往不过是基于这第一印象进行调整。用现在流行的术语,这叫“锚效果”,第一印象就像一只锚,一旦抛下,很难撼动根本。用贝叶斯的理论说,如果这第一印象(先验概率)很强的话,要消除它或者大幅度的修正它,需要很多很强的新信息。

举个例子,法庭在进行审判的时候,如果犯罪嫌疑人面相凶狠,给法官和陪审团留下了很不好的第一印象,辩方要翻案的困难就会加倍。所以诉方通常一上来的策略就是把嫌疑人描述成一个恶棍。嫌疑人要正装出庭,不止是尊重法律的意思,也是尽量消除在外表上的差异,避免偏差的第一印象。

这个故事据说来自Douglas Adams, Richard Dawkins转述。 这里的描述来自理论物理学家Garrett List的小文章《We Are Inefficient Inference Engines.

 

故事三:谋杀

在审理谋杀案时要庭审大量证据,很多时候要利用逻辑推理来建立因果链条,也要用统计数据来增加说服力,而用错数据和推理,结果可能是致命的。

九十年代,辛普森杀妻案轰动美国,各种证据都似乎证明凶手就是辛普森,而最后辛普森的“梦幻律师团”帮助他成功脱罪。林达曾用了半本书来讲这个故事,极生动,主要讲这个案子的审理程序,想说明当国家机器想给个体定罪是多么容易,个体是多么无助,所以这些必要的程序每一步都疏忽不得。

但是林达没有讲下面这个故事。

为了证明辛普森有罪并给陪审团留下他杀妻的印象,检方举证说辛普森之前有家庭暴力行为,而“扇耳光是谋杀的前奏”。但辛普森的辩护律师说,检方不过是在误导陪审团。辩护律师说:截至1992年,美国每年有400万女性被丈夫或男友打过,但是根据FBI的报告,其中只有1432人被丈夫或男友杀死,这概率大概2800分之一。怎么能用这么小的概率来推理呢?

这个辩护看起来很有说服力,但实际上完全与案件无关。问题根本不在于打过女人的男人有多大可能性杀死这女人(这概率,如上所述,是2800分之一),而在于被打过且被杀死的女人中,有多少死于打过她的人之手?这后者的概率,根据1993年的美国犯罪报告,是90%。在辛普森案中,检方从来没提起过90%这个数字,显然中了辩方的招。

简评:我做过两学期初等概率论和统计学的助教,讲辅导课时,条件概率和贝叶斯定理很难教。我相信这些概念和推理是合乎逻辑的,但我也相信它们和人类直觉相悖,人通常不这么思考问题,人很容易被愚弄。

这个故事来自加州理工的教授Leonard Mlodinow的畅销书《The Drunkard’s Walk: How Randomness Rules Our Lives》。

 

尾声

当辛普森脱罪之后,几乎所有的老百姓都认定他就是杀人犯,因为证据实在太多了,但大众也都尊重法律,接受陪审团对他无罪的判决。林达认为这是文明社会的表现。而对研究人类“决策行为”的Itzhak Gilboa而言,类似的事件有不同的解读:每个人都坚信嫌疑人有罪,而每个人又都接受法庭判处嫌疑人无罪,并认为这判决遵守程序而合理,这个区别,类似于贝叶斯决策和经典统计学的区别,也是为什么在贝叶斯理论大行其道的今天,我们依然要学习那个经典的大数定律。

 

 

 

© 所有媒体不得转载,个人随便转载。
240
一对一定制课程
上一篇: 你不知道的神秘点球 下一篇: 美国各专业本硕博收入一览

评论(13) 按反序排列
447英里 [71.206.186.*] @ 2010-7-6 23:03:12
你丫东西真是越写越水了。。。
看了两本书又咋样呢,有写这种东西的大段时间好好捣鼓捣鼓自己的论文不好么?

就这么点儿出息。
反对 14
4 支持

北京棋迷 [12.47.208.*] @ 2010-7-6 23:32:27
这是我个人认为骗银同学这半年以来最引人入胜的一篇了。

向骗银致敬。

北京棋迷 [206.230.48.*] @ 2010-7-6 23:47:58
关于辛普森那个打老婆和杀妻概率的关系,控方和辨方的思路不同。

控方如果没有忽略这个概率的话,相当于是以辛妻被杀这个事实作前提,来反推有多少可能她死于辛普森之手,假设她只挨过辛普森的打(由此排除很难缠的干扰因素),那么考虑到她已经被杀这个事实,她死于辛普森之手的概率是90%。

辨方的诡辩在于, 如骗银指出的, 打过老婆的人只有1/2800最后会杀老婆, 这只说明在辛普森老婆没有被杀的前提下估计将来辛普森有多大概率会最终杀了老婆 -- 1/2800. 但现在辛普森的老婆已经被杀了, 再用1/2800这个概率来估算辛普森杀妻的可能性显然是错了, 这个时侯应该用90%的概率来估算辛普森杀妻的概率.

自然语言中, 二者说出来都是"辛普森杀妻的概率", 但其前提(限定条件)其实根本就不一样, 但除非受过严格训练的人, 一般人是很难精确的理解"先验概率"和"后验概率"这些概念的.

辛普森的这个概率就是一个典型的"执果寻因"的概率问题, 由于和人们的常识有距离, 公众特别容易被人以混淆先验后验概率的方式来忽悠.

henrymak [128.197.82.*] @ 2010-7-7 0:19:34
Philosophy and the practice of Bayesian statistics

Andrew Gelman
Department of Statistics and Department of Political Science, Columbia University
Cosma Rohilla Shalizi
Statistics Department, Carnegie Mellon University
Santa Fe Institute

http://www.stat.columbia.edu/~gelman/research/unpublished/philosophy.pdf

li1985d [77.1.166.*] @ 2010-7-7 6:02:36
在故事一后面,凡是会把H排到C和F前面的,和他们讲道理都是浪费时间。

悲观理想自由 [80.13.110.*] @ 2010-7-7 8:13:12
楼上过分了,这种错误很多人都会不经意的犯。我记得初中时数学老师问“3大于等于2,对不对”,绝大多数同学都说不对。

li1985d [77.1.166.*] @ 2010-7-7 8:43:41
楼上啊,你的例子并不妥贴恰当。说3大于等于2不对的,那是没搞清楚“大于等于”的概念,稍一解释就能解决;但将H排到C和F前面的,其错误程度更接近宣布2大于等于3,足令人哭笑不得。

grasssheart [65.49.2.*] @ 2010-7-7 12:30:20
通过概率来推断辛普森杀人有用吗?即便按概率他有99%的可能性杀人了,没有证据,也不应定罪,否则有可能让一个无罪者坐上电椅。既然不能这样定罪,在这件事上讨论概率岂不是很荒唐

泡沫板砖 [178.18.17.*] @ 2010-7-7 12:48:19
呵呵,楼上傻气冒出来了。
“大于等于”就是两个并列条件和H选项是由C和F合并组成一样,“大于等于”就是“大于”和“等于”合并。
这个例子举的非常好。也说明人们在进行严密的思考时候会屏蔽直觉的干扰。

泡沫板砖 [178.18.17.*] @ 2010-7-7 12:56:11
不是根据概率推断杀人,中国传统讲的铁证如山是指人证物证俱在,可这是不严谨的,人证和物证不一定有关联性。《肖申克救赎》里面主角案件就是人证物证不具有关联,但是如果律师可以严谨的把他们关联起来,就可以定罪。
这里的概率问题其实就是对关联性讨论。

li1985d [77.1.166.*] @ 2010-7-7 22:59:11
呵呵,楼上傻气冒出来了。
“大于等于”就是两个并列条件和H选项是由C和F合并组成一样,“大于等于”就是“大于”和“等于”合并。
_________________________________
到底谁在冒傻气? A“大于”且“等于”B是不可能的,这跟案例一中H系由C和F合并而成完全不同。你的留言恰恰证明你也会犯悲观理想自由所描述的错误。

为了便于理解,不妨把“大于等于”想象成“或”的关系,而H之于C、F则是“和”的关系。

相信你只是聪明一世,糊涂一时。

悲观理想自由 [80.13.207.*] @ 2010-7-10 5:55:05
楼上朋友说的对,两者一个是“或”,一个是“和”,并不完全一样,而且“或”貌似比“和”要难一些。我的例子并不完全恰当。
但我还是觉得两种错误都是可以理解的,所以朋友说“和他们讲道理都是浪费时间”是过分了,呵呵。

我倒觉得,如果说这样的错误在生活中大量出现,说明我们的数学教育实在是不怎么样,最基本的逻辑能力没有培养好。

JS
JS [128.148.196.*] @ 2010-7-12 23:57:04
Airbender 电影出来了,看了吗?好看吗?
我还犹豫要不要去

发表评论
登录 后发表评论。