检验前概率、肺癌筛查与医生信心

来源:百度文库 编辑:超级军网 时间:2024/04/29 07:21:34


做医生的人选择检查时往往会去了解一个检查项目的敏感性、特异性。很多医生朋友把这个数值看做是检验的预测值。虽然说,理论上检查的敏感性和特异性越高,该检查的预测价值越大。但很可惜的是,如果患者的检验前概率很低,哪怕该检查的理论敏感性和特异性达到99%,该检查也不具有很高的预测性。


假阳性率=假阳性数量/(假阳性数量+真阴性数量)。它也等于1-特异性。

假阴性率=假阴性数量/(假阴性数量+真阳性数量)。它也等于1-敏感性。



中国的近年来的数据显示,中国的男性肺癌发病率约为10万分之50。假设高分辨率CT的敏感性和特异性都达到99%。那么一个人做高分辨率CT的结果是阳性的,请问,你有多大把握认定他是肺癌呢?


我们首先来看阳性预测值,即CT发现有问题的人里有多少是肺癌的。我们知道10万人里有50个是肺癌,那么真阴性人数是99950人。假设假阳性人数是X,则为X/(X+99950)=1%(1-99%),求X≈1009.6,也就是说在检验前概率只有10万分之50的情况下,你做完CT,会有1009个左右的假阳性肺癌人数----他们不是肺癌,却被你怀疑是肺癌。而这其中其实约只有50个人是肺癌。这里面仅仅约4.9%的人是肺癌。


再看看阴性预测值呢?即CT发现没问题的人里有多少是真正无肺癌的。我们知道真阳性人数是50个人,那么计算数值是X/(X+50)=1%,X≈0.505。也就是说,在检验前概率只有10万分之50人的情况下,你做完CT,会有0.5个人是假阴性肺癌----他们是肺癌却被你认为不是肺癌。他的阴性预测值是99.999%。也就是说,在这个情况下,CT检查是阴性,你可以很肯定的告诉他几乎不可能是肺癌。


我们发现一点,这种很低概率的疾病下,哪怕检查非常好,如果你是阳性的,也不能证明你有这个病,但如果检查是阴性的,倒是可以肯定你没这个病。


实际上医学上很多检查并不是为了预测他是否有病,而是用来肯定他没病。比如手术前的艾滋病、梅毒等等检查。这个检查其实不能预测他是否有病,但可以预测他没病。

在临床工作中,医生会根据病人的症状体征来挑选检查项目。这样做的好处就是提高了检验前概率。那么问题出来了,如果检验概率提高了很多,这个检查的预测值如何呢?

比如肺癌,医生根据症状、家族史、体征等等判断,他得肺癌的概率是50%。这个时候再来做这个CT呢?

我们先看阳性预测值。100个人里有50个人是肺癌(即检验前概率),那么假阳性数量是X,X/(X+50)=1%(1-99%),求X=0.505。50/50+0.505=99%,也就是说99%是有肺癌的。反过来说,阴性预测值也将是99%。

这说明,医生的对患者的判断非常重要。如果医生判断患者的检验前概率很高,那么做这个检查可以很好的预测他到底是不是这个病。

而且,这样的检查对医生的信心提升也是非常巨大的。在检查前完全模拟棱两可的情况下,你做完检查就可以给出很大概率的判断,这种信心指数提升是(99%-50%)/50%≈100%。

同样来说,虽然说检验前概率很低的疾病如果检查是阴性的,可以进一步肯定阴性可能。但实际上对信心的提升并不高。实际上也不过是从99.95%不是肺癌变成了99.9995%不是肺癌。

也就是说,检验前概率高,做检查对检验后的信心提高是很肯定的。一些检验前概率很低的情况下做某些检查并不是为了提升医生的信心,而是为了避免一些风险。这样的风险规避是否有意义,这不是科学问题而是社会问题。

做医生的人选择检查时往往会去了解一个检查项目的敏感性、特异性。很多医生朋友把这个数值看做是检验的预测值。虽然说,理论上检查的敏感性和特异性越高,该检查的预测价值越大。但很可惜的是,如果患者的检验前概率很低,哪怕该检查的理论敏感性和特异性达到99%,该检查也不具有很高的预测性。


假阳性率=假阳性数量/(假阳性数量+真阴性数量)。它也等于1-特异性。

假阴性率=假阴性数量/(假阴性数量+真阳性数量)。它也等于1-敏感性。



中国的近年来的数据显示,中国的男性肺癌发病率约为10万分之50。假设高分辨率CT的敏感性和特异性都达到99%。那么一个人做高分辨率CT的结果是阳性的,请问,你有多大把握认定他是肺癌呢?


我们首先来看阳性预测值,即CT发现有问题的人里有多少是肺癌的。我们知道10万人里有50个是肺癌,那么真阴性人数是99950人。假设假阳性人数是X,则为X/(X+99950)=1%(1-99%),求X≈1009.6,也就是说在检验前概率只有10万分之50的情况下,你做完CT,会有1009个左右的假阳性肺癌人数----他们不是肺癌,却被你怀疑是肺癌。而这其中其实约只有50个人是肺癌。这里面仅仅约4.9%的人是肺癌。


再看看阴性预测值呢?即CT发现没问题的人里有多少是真正无肺癌的。我们知道真阳性人数是50个人,那么计算数值是X/(X+50)=1%,X≈0.505。也就是说,在检验前概率只有10万分之50人的情况下,你做完CT,会有0.5个人是假阴性肺癌----他们是肺癌却被你认为不是肺癌。他的阴性预测值是99.999%。也就是说,在这个情况下,CT检查是阴性,你可以很肯定的告诉他几乎不可能是肺癌。


我们发现一点,这种很低概率的疾病下,哪怕检查非常好,如果你是阳性的,也不能证明你有这个病,但如果检查是阴性的,倒是可以肯定你没这个病。


实际上医学上很多检查并不是为了预测他是否有病,而是用来肯定他没病。比如手术前的艾滋病、梅毒等等检查。这个检查其实不能预测他是否有病,但可以预测他没病。

在临床工作中,医生会根据病人的症状体征来挑选检查项目。这样做的好处就是提高了检验前概率。那么问题出来了,如果检验概率提高了很多,这个检查的预测值如何呢?

比如肺癌,医生根据症状、家族史、体征等等判断,他得肺癌的概率是50%。这个时候再来做这个CT呢?

我们先看阳性预测值。100个人里有50个人是肺癌(即检验前概率),那么假阳性数量是X,X/(X+50)=1%(1-99%),求X=0.505。50/50+0.505=99%,也就是说99%是有肺癌的。反过来说,阴性预测值也将是99%。

这说明,医生的对患者的判断非常重要。如果医生判断患者的检验前概率很高,那么做这个检查可以很好的预测他到底是不是这个病。

而且,这样的检查对医生的信心提升也是非常巨大的。在检查前完全模拟棱两可的情况下,你做完检查就可以给出很大概率的判断,这种信心指数提升是(99%-50%)/50%≈100%。

同样来说,虽然说检验前概率很低的疾病如果检查是阴性的,可以进一步肯定阴性可能。但实际上对信心的提升并不高。实际上也不过是从99.95%不是肺癌变成了99.9995%不是肺癌。

也就是说,检验前概率高,做检查对检验后的信心提高是很肯定的。一些检验前概率很低的情况下做某些检查并不是为了提升医生的信心,而是为了避免一些风险。这样的风险规避是否有意义,这不是科学问题而是社会问题。
作者:田吉顺
链接:https://zhuanlan.zhihu.com/p/21487150
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

在上一篇专栏中,提到不推荐孕期做TORCH筛查。有不少人提出了异议,遗憾的是都只有论点没有论据。尤其是我已经在文中明确写出包括中国在内很多国家相关指南规范的内容,仍然在根据经验或者「我觉得」来反对。对于这样的异议都没有必要一一解释,但是有一个概念倒是应该讲一下,那就是筛查。
我们都知道,很多严重疾病,在发病早期是没有任何感觉的,而等到发现时通常治疗又很棘手。所以,人们都希望在自己毫无任何不适的时候,就可以把隐藏在身体里的问题查出来。于是,医学上提出了「筛查」这个概念。

筛查就是针对要筛查的目标人群,不加区分的进行检查,然后把结果异常的人挑出来,做更进一步的检查和处理。

这听上去是非常美好的一件事——只要把所有可能的严重疾病都给我筛查一遍,看下我有哪些问题,然后再进一步做有针对性的检查,从而尽早把那些可怕的疾病查出来。这样,我就可以在最早期接受相应治疗,从而获得最好的治疗结局了。

对于这种想法,我只能说,想得美!

倒不是说我们缺乏检查手段,以目前医学发展水平,非常多的疾病还是有手段查出来的。但最大的问题有两个——

检查手段没有100%的准确率;
以全人群为基数,大多数值得筛查的疾病发病率都很低。
为了说明这两点的重要性,需要举个例子。

列纳德·蒙洛迪诺(Leonard Mlodinow)是一位物理学家,曾和霍金合著《新时间简史》,另外他还创作了《星际迷航》的剧本。他曾在《醉汉的脚步》中描述过自己的这样一次经历。

1989年的时候,他为了申请保险,接受了一次抽血检查,检查项目是HIV,也就是导致艾滋病的那种病毒。很不幸的是,他的这项检查结果是阳性的。医生告诉他,这个结果意味着,他有999‰的概率得了艾滋病,并且会在10年内死去(当时是1989年,现在艾滋病的死亡率已经明显降低了。)

我想,几乎所有人听到这样的结果,应该都会感到无比的痛苦和沮丧;但是,Leonard并没有,毕竟他是位物理学家,他懂贝叶斯定理,所以,他知道医生其实犯了个错误。

医生之所以说他有999‰的概率得病了,是因为这项检查的阳性预测值是999‰,也就是说每1000个检查结果阳性的人中,有999个是患者——换句话说,也就意味着,每1000个结果阳性的人中,会有1个人是假阳性的,也就是根本没有得病。

不过,1‰的概率实在太小了,没有人会对这个小概率抱有多大希望。

但是,Leonard知道,以这种算法给出的概率是不对的,因为它忽略了艾滋病的人群发病率。

Leonard是异性恋,不用毒品,在当时的美国,这样的白人男性得艾滋病的人群发病率是万分之一,也就是每10000个人里,有一个是艾滋病患者。现在我们假设给这10000个人都做了HIV的检查,根据检查1‰的假阳性率,会有10个健康人被错查出来得了艾滋病。假设那一个真正的艾滋病患者也同样被查出来阳性,那么这10000个人里,有9989个人查出来结果阴性,11个结果阳性。因此,从概率上讲,这11个被查出来阳性的人中,只有1/11的几率是真正的患者。

也就是说,如果在没有危险因素的全人群中筛查,即使结果阳性,也有超过90%(10/11)的概率,其实你并没有得病。

这么计算过之后,Leonard表示情绪稳定,而且最终事实证明,他确实没有感染HIV。

Leonard没有得艾滋病当然是好事,但是这反映出一个重要的问题,那就是,当人群发病率低的时候,检查的准确度再高,只要不是100%,它所带来的假阳性结果就不容小觑。

同样的检查,患者就诊做检查,和对没有症状的人群做筛查,意义大不相同。

如果检查前就有症状表现,那么相当于提高了检查前的先验概率,也就是说,这个将要做检查的人所处的人群并不是普通人群,而是有症状人群,对于有症状人群来说,「发病率」是明显增高的。这时候再配合检查结果阳性,那么判断得病的概率就要明显高很多。因此,对于有症状来就诊的患者来说,进行相关检查是有意义的。而对于没有任何症状的人来说,他的发病率相当于人群发病率,是低的,这时候,就像前面讲到的那样,检查结果阳性的意义也就大打折扣了。

或许有人会说,就算有假阳性,毕竟还是可以把真阳性筛出来嘛;而且那些阴性的人不就可以安心了吗?一定程度上确实如此。比如临床上,我们对于手术的病人术前会常规筛查HIV,如果阴性结果我们就会放心了;而如果是阳性,医生的态度也不会就定义这个人是艾滋病患者,而是需要再做进一步检查明确。这种做法确实没什么大影响,即使发生假阳性,最多吓一跳,进一步复查排除了也就没事了。

但是,有的时候发生假阳性就没那么简单了,因为对于筛查阳性的进一步检查本身,可能也是有潜在风险的。

比如说乳腺癌筛查。

乳腺癌是女性最常见的癌症,而且随着社会的关注度提高,大家对乳腺癌的重视程度也在提高,因此要求做乳腺癌筛查的需求非常大。既然是筛查,也就是要面对所有女性,即使没有发现乳房上有包块,没有乳腺癌家族病史的高危人群,也都接受筛查,这时候,就要面临前面说的假阳性问题了。

我们考察某种癌症筛查效果的指标,很重要的一个,是看用了这种筛查之后,某种癌症的死亡率有没有下降;或者说,某种筛查方法,减少了多少人因为这种癌症的死亡。对于乳腺癌来说,最常用的筛查方法就是乳腺钼靶检查。这项筛查手段用了几十年,积累了大量数据,在分析了这些数据之后,人们发现,使用乳腺钼靶检查筛查乳腺癌,假阳性问题不容忽视。

2014年,在国际权威的JAMA杂志上一篇文献显示,对于40岁女性,如果每年进行乳腺钼靶检查筛查乳腺癌,这样持续10年,那么每1000人中可以最多减少1.6个人死于乳腺癌。或许你会说,千分之1.6也不错啊,毕竟人口基数足够大的话,就有更多的人因此而获得好处。但是,如果考察同样方法所带来的假阳性结果,可能结论就不那么绝对了。

使用同样的筛查方法,由于检查的假阳性,每1000人中最多会有80人因为假阳性而接受穿刺活检,会有11人因为过度诊断而接受不必要的手术甚至是放化疗。

由于和艾滋病相比,癌症诊断的更加复杂,使得癌症筛查中假阳性所造成的影响也要大很多。从数据来看,对于40岁的女性,每通过筛查减少1个人的死亡,需要付出大约7个人因为同样筛查而接受不必要手术的代价。

而40岁以下的女性,得乳腺癌的概率更低,假阳性的风险更大。

因此,虽然乳腺癌的筛查在一定程度上确实可以降低乳腺癌的死亡率,但是从概率上来讲,太早接受筛查的话,你所得到的可能不是降低死亡率的获益,而更有可能是被过度处理的风险。

所以,在汇总过大量数据之后,各国相关医学组织都建议:

除非有相关高危因素存在,否则不建议40岁以下的女性常规接受乳腺钼靶检查筛查乳腺癌。
这里不是说女性不应该接受钼靶检查,如果你有症状、有包块,接受钼靶检查是很有必要的;但是,如果没有任何问题,只是做筛查的话,40岁前就不应该做了。

对于女性来说,除了乳腺癌,另一个可以筛查的就是宫颈癌。

宫颈癌的筛查手段更加方便,但同样也面临假阳性问题。而且,和钼靶检查相比,宫颈癌筛查手段中TCT和HPV又各有其特殊性。比如HPV感染很多都是一过性,多数都可以自体清除;比如一些宫颈癌的癌前病变也都是可以自行消退的,所以宫颈癌筛查又会涉及其他的过度处理。

而宫颈癌筛查的过度处理所带来的影响,除了过度治疗本身的手术风险之外,还可能对以后的妊娠分娩造成影响。比如宫颈癌前病变的一些治疗,可能增加宫颈狭窄的风险,增加中孕期胚胎丢失的风险,增加足月前胎膜早破的风险,增加早产风险,进而增加了围产儿的死亡率。

所以,当你因为担心宫颈癌,而做了更加过度的筛查或者处理时,或许可以降低一点宫颈癌的风险;但是同时,你也付出了增加其他风险的代价。

因此,宫颈癌的筛查策略建议:

对于21岁之前的女性,不管什么时候开始有性生活,都不需要接受宫颈癌筛查;

对于30岁之前的女性,不需要接受HPV的检查;

对于21-30岁的女性,不需要每年检查,如果检查结果正常的话,只要每3年检查TCT就可以了;

对于30岁以上女性,如果检查结果都正常,只要每5年检查TCT+HPV就可以了;

并不是所有的宫颈癌前病变都要手术治疗,需要结合病变级别、年龄等因素,采取不同处理方案。

我们很担心得癌症,但是,目前真正可以筛查的癌症却不多,因为这需要同时满足发病率相对更高,以及有更加准确的筛查方法。

当我们因为恐惧而一门心思想要阻止某件事情发生时,需要警惕,我们可能忽略了正在某个其他方面付出代价,而且,这个代价有可能比你要阻止的事情更严重。
好文,现在似乎很多国家已经不再推荐健康人群体检年检了。
keeperx1 发表于 2016-7-21 11:39
好文,现在似乎很多国家已经不再推荐健康人群体检年检了。
不是。对于健康人群也需要做体检。但我们需要筛选恰当的人群,这样就可以提高它的检验前概率。
另外
“2014年,在国际权威的JAMA杂志上一篇文献显示,对于40岁女性,如果每年进行乳腺钼靶检查筛查乳腺癌,这样持续10年,那么每1000人中可以最多减少1.6个人死于乳腺癌。或许你会说,千分之1.6也不错啊,毕竟人口基数足够大的话,就有更多的人因此而获得好处。但是,如果考察同样方法所带来的假阳性结果,可能结论就不那么绝对了。

使用同样的筛查方法,由于检查的假阳性,每1000人中最多会有80人因为假阳性而接受穿刺活检,会有11人因为过度诊断而接受不必要的手术甚至是放化疗。”

^^^^^^^^^^^^^^^^^^^^^^^^^

是否可以多次乳腺钼靶检查来降低false positive,而不必要做活检呢?
keeperx1 发表于 2016-7-22 00:20
另外
“2014年,在国际权威的JAMA杂志上一篇文献显示,对于40岁女性,如果每年进行乳腺钼靶检查筛查乳腺癌 ...
不能。因为一旦怀疑乳腺癌,等待本身的风险也比较大。同时乳腺活检的结果本身也可以预测未来乳腺癌风险。
很多诊断都是多指标共同判断
不会单凭一个指标去诊断
这楼专家多哦
有病要看 发表于 2016-7-22 09:53
很多诊断都是多指标共同判断
不会单凭一个指标去诊断
对。但显然这样的成本很高。
对。但显然这样的成本很高。
一辆20w的车去4s店保养多少钱?
你觉得你身体值多少钱?
有病要看 发表于 2016-7-22 11:33
一辆20w的车去4s店保养多少钱?
你觉得你身体值多少钱?
这不仅仅是钱,还有检查相关的副反应。
梅毒的筛查假阳性的更多!这类患者也羞于说出去,经常就去了小广告的诊所!哎

梦想去飞翔 发表于 2016-7-22 11:46
这不仅仅是钱,还有检查相关的副反应。


科研水平就这样。。不愿意你可以拒绝啊。。命握在自己手里,又没人逼你检查。

现在对中晚期癌症基本是束手无策。人品好早期发现还能切掉。而影像学检查效果不好的地方,比如胃,发现的时候基本上。。赶紧出去浪吧别治了。
梦想去飞翔 发表于 2016-7-22 11:46
这不仅仅是钱,还有检查相关的副反应。


科研水平就这样。。不愿意你可以拒绝啊。。命握在自己手里,又没人逼你检查。

现在对中晚期癌症基本是束手无策。人品好早期发现还能切掉。而影像学检查效果不好的地方,比如胃,发现的时候基本上。。赶紧出去浪吧别治了。

少年阿滋猫 发表于 2016-7-22 12:09
梅毒的筛查假阳性的更多!这类患者也羞于说出去,经常就去了小广告的诊所!哎


梅毒是终生阳性的。治好了还是阳性。
少年阿滋猫 发表于 2016-7-22 12:09
梅毒的筛查假阳性的更多!这类患者也羞于说出去,经常就去了小广告的诊所!哎


梅毒是终生阳性的。治好了还是阳性。
楼主的贴终于开始正常了
梦中闲人 发表于 2016-7-22 12:12
科研水平就这样。。不愿意你可以拒绝啊。。命握在自己手里,又没人逼你检查。

现在对中晚期癌症基本 ...
可以根据各种因素做人群筛查。比如肺癌筛查,设定吸烟人群,设定足够年龄,足够吸烟时间,这样就可以增加检验前概率。
梦想去飞翔 发表于 2016-7-22 12:32
可以根据各种因素做人群筛查。比如肺癌筛查,设定吸烟人群,设定足够年龄,足够吸烟时间,这样就可以增加 ...
我觉得真正的问题是false negative。
false positive高点,无非成本高点,但是第一次检查阳性的,实际上positive的概率提高了2个数量级,第二次做同样的检查准确概率就很高了。
keeperx1 发表于 2016-7-22 13:43
我觉得真正的问题是false negative。
false positive高点,无非成本高点,但是第一次检查阳性的,实际上 ...
成本不仅仅是钱,还有心理压力、检查和治疗相关的副反应等等。