为什么 8.7分
读书笔记 《为什么》第三章 贝叶斯法则
Melissa

若一位40岁的女性做了乳房X光检查以检测乳腺癌,其得到的检测结果为阳性。这位女性非常六神无主,问医生,这个数据可靠吗?我得了乳腺癌吗?医生说不一定啊,不过根据乳腺癌检测联合会(BCSC)的数据,对于40岁的患有乳腺癌的女性来说,乳房X光检查结果为阳性的概率为73%。若你为这位女性的家属,请问,在多大程度上她会患乳腺癌?她应该做手术吗?

或许你会说既然是73%的概率那么赶紧做吧!都这个时候了,宁愿信其有也不信其无啊!

其实,你这是走入了一个惯性推断误区。按照贝叶斯法则,这是一个典型的将前向概率混淆为逆概率的例子。

前向概率指的是,假设你的确患有乳腺癌,检测结果为阳性的概率:P(检测|疾病);逆概率指的是假定检测结果为阳性,检测者确实得了乳腺癌的概率为多大?也就是P(疾病|检测)。上述例子中的73%只是前向概率,它考察的是检测技术的灵敏性或准确度,这根本不是我们要关心的问题。显然,逆概率才是我们关心的问题,也就是根据检测结果推断疾病的概率。

那么,这个概率到底多大?这当然与患者本人的条件如是否有家族疾病史等有很大关系。但当我们不去考虑这些极端情况,只从普遍意义上考虑这个问题,那么这个逆概率就与先验概率(健康女性下一年患乳腺癌的概率)有关了。来,让我们看一看这个美丽的推导过程。(友情提示:前方高能,较为烧脑,可略过过程直接看结果)

假设D(代表疾病)指得癌症,证据T(代表检测)指乳房X光检测结果。那么P(疾病|检测)可以表示为:

P(D|T)= P(T|D)/ P(T)×(D的先验概率)

其中P(T|D)/ P(T)用一个新术语表达为似然比,它衡量的是该疾病的患者得到阳性检测结果的概率比一般群体要高多少?

已知:P(T|D)为73%, D的先验概率为1/700;(来自权威机构BCSC的统计数据)

P(T)的估算比较棘手。因为,T既可能来自患这种病的检查者也可能来自没有患这种病的检查者。因此,P(T)应该是P(T|D)(患病者检测结果为阳性的概率)和P(T|~D)(未患病者结果为阳性的概率)的加权平均。其中,P(T|~D)一般称为假阳性率,根据BCSC统计其数值为12%。为什么要加权平均值?因为健康女性(~D)的数量要远多于患乳腺癌的女性(D):699:1。

P(T)=(1/700)×(73%)+(699/700)×(12%)≈12.1%

按照逆概率方程式,我们可以得出:

P(D|T)= (73%/12.1%)×(1/700)≈ 0.0086

换言之,在拿到阳性检测结果的前提下,这名检查者的确患有癌症的概率还不到1%!!!

相信这一结果让许多人惊掉了下巴。所以,下一次如果你的检查结果为阳性时,先不必惊慌,启动一下大脑的系统二,考虑一下逆概率,到底多大可能性上我患有该疾病呢?

生活中还有许多类似的案例,均源于我们对前向概率和逆概率的认知偏差,即颠倒了因果关系或者混淆了因果与非因果关系。

教科书教我们对科学方法的描述为:(1)提出一个假设;(2)推断假设的可检验结果;(3)进行实验并收集证据;(4)更新对假设的信念。通常,教科书涉及的只是简单的正确与错误两种结果,证据要么证实了假设,要么驳斥了假设。但是生活和科学从来就不会那么简单!所有的证据都包含一定程度的不确定性。贝叶斯法则引导我们去思考的正是如何更新对假设的信念,也即反事实或者逆向思维。当有原因时很容易推断出结果,但从结果到原因就要复杂的多。

夏洛克·福尔摩斯的高明之处就在于,看起来,他在演绎推理,从假设到结论,事实上,他的拿手好戏恰恰与演绎相反,是从证据到假设,即从结果到原因的归纳思考。

“当你排除了所有不可能的 ,剩下的那个无论多么不可思议,都一定是真相。”

0
《为什么》的全部笔记 37篇
豆瓣
免费下载 iOS / Android 版客户端