条件概率是指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为 P (A|B),读作“在B条件下A的概率”。
条件概率的谬论是假设 P (A|B)大致等于 P (B|A)。
例1: 假设人群中有1%的人患有某重大疾病,而其他人是健康的。我们随机选出任一个个体,并将患病以disease、健康以well表示,阳性以positive、阴性以negative表示。
P (disease)=1%=0.01
P (well)=99%=0.99
假设检验动作实施在未患病的人身上时,有1%的概率其结果为假阳性(如果没有患病的99人被测试,那么,根据1%的错判率,其中大约有1人将被错判为有病)。即:
P (positive|well)=1%
P (negative|well)=99%
再假设检验动作实施在患病的人身上时,有1%的概率其结果为假阴性(阴性以negative表示)。即
P (negative|disease)=1%
P (positive|disease)=99%(如果你真得了病,而被检出为阳性的条件概率)
分析: 由计算可知,100人中测试为阳性的2个人中,只有1个人是确实患病的。也即,你被检出为阳性,而你实际上真得了病的条件概率 P (disease|positive)=50%。
由本例中所选的数字,最终结果可能令人难以接受:被测定为阳性者,其中的半数实际上是假阳性。所以,在这种情况下,如果在一次体检中被检测出有病,也别过于苦恼,因为有一半的可能是假阳性,你应该进一步做重复检测,再次确认是否真的患病。
例2: 一种检测假币的仪器在检测到假币时灯会亮,制造商称该仪器将真币误认为是假币的可能性只有0.1%。因此,该仪器在1000次亮起红灯时有999次会发现假币。
分析: 上述在讨论百分比时实际偷换了数据概念,该仪器将真币误认为是假币的可能性只有0.1%,是指“在检测一千次真币时红灯会亮一次”,而不是“在一千次亮起红灯时有九百九十九次会发现假币”。
例3: 在对100个没有使用过毒品的人进行吸毒检验时,平均只有5人的检验结果为阳性。相反,对100个吸过毒的人进行检验的结果有99人为阳性。所以,如果对随便挑选的人进行此项检验,绝大多数结果呈阳性的人都是用过毒品的人。
分析: 上述论证中的推理是错误的,因为这则论证没有考虑到使用毒品的人在总人口中所占的比例。如果使用毒品的人在总人口中所占的比例极小,那么随便挑选的人进行此项检验,可能里面根本就没有吸过毒的人,但有可能有一些人检验结果为阳性,这样题干结论就不成立了。
例4: 一种为机场安全而设计的扫描仪在遇到行李中藏有易爆品时会发出警报,扫描仪把没有易爆品的行李误认为有易爆品的可能性只有百分之一。因此,在一百次报警中有九十九次会发现易爆品。
分析: 上述论证的推理是错误的,因为在讨论百分比时替换了一组数据的概念。从“把没有易爆品误报为有易爆品的可能性只有百分之一”中推不出“在一百次报警中有九十九次会发现易爆品”。“把没有易爆品误报为有易爆品的可能性只有百分之一”的意思是,若连续检验10000件没有易爆品的行李,扫描仪可能会发出100次报警,而这100次警报可能都是假的。而“一百次报警中有九十九次会发现易爆品”的情况属于“把有易爆品的行李误认为没有易爆品的可能性只有百分之一”。可见,题干对“把没有易爆品误报为有易爆品的可能性只有百分之一”误解为“把有易爆品的行李误认为没有易爆品的可能性只有百分之一”。