Noisy-channel and Ba...
疾病检测不仅是教材中介绍贝叶斯定理的经典例子,在实际生活中也有着广泛的应用。本文以一个简化过的疾病检测为例子,通过类比的方法,期望建立贝叶斯推理(这里指用到了贝叶斯定理)和二元对称噪音信道模型的关系。
1. 疾病检测例子的问题描述
“John每个月都会去疾控中心体检,其中一项是A疾病检测。当下A检测的可靠性是95%,即得A疾病的情况下检测结果是阳性的概率是95%(也意味着在没得A的情况下检测结果是阴性的概率也是95%)。经过长期的医疗实践,发现A患者的比例是1%。这个月John检测的结果是阳性,医生告诉他检测结果的可靠性是95%,他凭感觉认为他得A疾病的概率因此也是95%,是这样的吗?”
- 对上述问题形式化如下。
A = 1 表示患疾病A; A = 0 表示没有得疾病A
B = 1 表示检测结果为阳性; B = 0 表示检测结果为阴性
- 由题意可得如下已知概率。
P(A=1) = 0.01 P(A=0) = 0.99
P(B=1|A=1) = 0.95 P(B=1|A=0) = 0.05
P(B=0|A=1) = 0.05 P(B=0|A=0) = 0.95
- John所关心的概率是:P(A=1|B=1)
2. 二元对称噪音信道模型
二元对称噪音信道如下图所示。
源端输入是A,取两个值0和1;目的端输出是B,取两个值0和1;噪音信道的噪音层级 f = 0.05,即A通过该噪音信道时有5%的概率会改变A的值(从0改为1与从1改为0的概率都是相等的且为0.05)。
3. 噪音信道模型和贝叶斯定理
上述二元噪音信道模型可以刻画疾病检测的例子。
“携带有是否患有疾病信息的源信号A,经过不可靠性为5%的噪音信道,得到检测结果为B=1的目的端信号值。John关心的问题:P(A=1|B=1),就是求在目的端接收到B=1的情况下源端发送A=1的概率,即解码问题。”
【这里,源端发送A=0和A=1的概率是事先已知的,分别是P(A=1) = 0.01,P(A=0) = 0.99】
4. 疾病检测例子的解答
由贝叶斯定理:
P(A=1|B=1) = P(A=1) * P(B=1|A=1) / ( P(A=1)*P(B=1|A=1) + P(A=0)*P(B=1|A=0) )
= 0.01 * 0.95 / (0.01*0.95 + 0.99*0.05)
= 0.16
因此尽管John的检测结果是阳性,他确实得A疾病的概率是16%,远小于95%(该疾病是少见的),但也远大于1%(检测结果支撑了是得疾病的原因)
(完)
留下你的评论