COVID-19 可能没有季节性流感那么恐怖。这个根据美国抗体研究得出的结论,引起一片哗然。近日,众多统计学家、流行病学家指出,网上广为流传的“可靠数据”存在着重大缺陷——不仅对样本的选择不具有足够的公平性,用于抗体测试的产品参考价值也可以说是非常差。 “防护措施完全不合理”
早在当地时间 2020 年 3 月 17 日,斯坦福大学人口健康研究人员 John Ioannidis 就通过美国生物医学新闻媒体 STAT 发声: COVID-19 的死亡率可能远低于预期,因此当前的一些防护政策完全不合理。
一周后,斯坦福大学卫生政策研究人员 Eran Bendavid 和 Jay Bhattacharya 于 3 月 24 日在《华尔街日报》上也发表了类似的观点。在题为 Is the Coronavirus as Deadly as They Say?(新冠病毒有他们说的那么致命吗?)的评论中,二人认为此前对 COVID-19 的死亡率估值(2%-4%)“存在严重缺陷”。 到了 4 月,两项新研究也提出了类似的观点。 2020 年 4 月 17 日,斯坦福大学研究团队(成员包括上文提到的三位科研人员)题为 COVID-19 Antibody Seroprevalence in Santa Clara County, California(加州圣克拉拉县新冠肺炎抗体血清流行病学调查)的论文在线发表于预印本平台 medRxiv。 该研究检测了 3330 名成人和儿童血液中的抗体,其中 50 份血样(1.5%)呈阳性。 为使试验样本与当地人口统计数据更好地匹配,研究人员调整了妇女和白人的比例,经此调整,阳性率从 1.5% 升至 2.8%。 随后,研究人员根据敏感性、特异性两个标准,又重新进行了评估,最终得到的真实患病率在 2.49% 和 4.16% 之间,这表明当地约 48000-81000 感染,而截止预印本论文在线发表时,当地确诊病例仅为 956,因此感染估计数比确诊的病例高 50-85 倍。 基于此,研究人员估计 COVID-19 感染致死率(IFR)为 0.12%-0.2%,而季节性流感致死率为 0.1%。 2020 年 4 月 20 日,加州洛杉矶县公共卫生部门在其官网宣布,与南加州大学合作进行了一项研究,研究成果题为Seroprevalence of SARS-CoV-2 Specific Antibodies Among Adults in Los Angeles County(洛杉矶县成人中新型冠状病毒特异性抗体的血清流行病学研究)。 研究人员估计,洛杉矶约 4.1% 的成年人有抗体,2.8%-5.6% 的成年人具有对新冠病毒抗体,也就是说,洛杉矶约有 221000-442000 成年人感染了新冠病毒,这一数据比 4 月初报告的 7994 例确诊病例数高 28-55 倍。与圣克拉拉研究一样,这项研究表明COVID-19 感染致死率处于 0.3%-0.13%,接近季节性流感致死率。 两大严重缺陷 这两项研究通过评估 COVID-19 分别在美国加州圣克拉拉和洛杉矶的真实传播情况———其出发点毫无疑问是正确的。通过研究,明确新冠疫情在当地的真实感染程度,自然有利于出台政策、措施,对控制疫情的传播作出努力,同时也能更好地评估疾病的严重程度与死亡率。 由于美国的诊断测试非常有限,许多病例症状轻微、甚至是无症状感染,因此研究人员预计圣克拉拉和洛杉矶的新冠病毒感染人数都超出了预期,这一点不存在争议。 真正存在争议的是——研究者表示,COVID-19 的致命性远不及预期,而由于死亡人数增长变化不大,COVID-19 与季节性流感的死亡率相近。而且,COVID-19 可能没有季节性流感那么致命,并且目前采取的缓解措施无济于事、没有必要。 由于加州洛杉矶县公共卫生部门提供的数据不多,也几乎没有披露统计和方法方面的细节,因此学界主要分析的是圣克拉拉研究,不过多数人认为洛杉矶研究也可能存在相似的缺陷。 且先不论上述研究结论,学术界认为,圣克拉拉研究存在基本的计算错误和选取样本、统计数据时出现的偏差,主要有两方面问题: 第一,圣克拉拉研究对样本的选择不具有足够的公平性: 研究是通过 Facebook 广告召集志愿者的,这就把测试样本仅仅限定为 Facebook 用户; 对样本的检测也都是通过设置驾车直通测试站点进行的(如下),这就把测试样本仅仅限定为方便驾驶的人群; 志愿者们通过自荐的方式参与测验,而招募广告也带有一种“参与检测就能知道您的健康状况,让您和家人更安心”的意味,所以说积极参与测验的志愿者可能都迫切地想知道自己是否感染上新冠病毒,这可能也会增加阳性的比例,所以新冠肺炎的潜在确诊数将会比实际情况更多。
更有甚者,据外媒 Buzzfeed News 披露,论文作者之一 Jay Bhattacharya 的妻子此前通过邮件,利用高中学生的名单招募其父母参与实验,这可能会进一步使得结果产生偏差。而其研究团队对此也不予置评。 第二,学界最大的担忧也许是,研究人员用于两项研究的抗体测试并不准确。 由于新冠疫情肆虐,美国食品药品监督管理局(FDA)允许厂商在没有常规审查的情况下,在市场上出售检验产品,研究团队使用的 Premier 检验产品便是其中之一,并未经过彻底的准确性审查。实际上,FDA 此前甚至警告过相关人士要注意其局限性。 Premier 此前公开了对阳性、阴性样品进行测试从而确定其敏感性和特异性的方法,但研究人员在斯坦福大学进行了自己的测试: 据 Premier 的方法,检验产品正确地识别了共 37 个已知阳性样本中的 25 个阳性样本。在斯坦福大学的测试中,产品在测试中正确识别了 160 个已知阳性样本中的 153 个,因此敏感度最有可能约为 80%(可能在 72.1%-87%)。 据Premier 的方法,检验产品将 30 个已知阴性样本全部正确识别出来。在斯坦福大学的测试中,该产品只能正确识别 371 个已知阴性样品中的 369 个,因此认为特异性约 99.5%(可能在 98.3%-99.9%)。
根据其对特异性的估计,只有 0.5% 的检测为假阳性,但实际上该产品仍存在高达 1.7% 假阳性的可能性。如此说来,上述圣克拉拉研究得到的 1.5% 阳性率(3330 份样本中发现 50 例阳性)意味着他们测出的阳性结果有可能全部都是假阳性,就算不是全部,其参考价值也可以说非常差。 面对统计方法方面的质疑,研究团队表示,目前正在重新进行统计分析,并将很快发布结果。 “作者欠我们一个道歉” 当前,这两项研究在美国学术界饱受批评,从推特到博客都不乏争议。 哥伦比亚大学统计学家 Andrew Gelman 以很长的篇幅提出了圣克拉拉研究存在的问题,并在博客中直言: 我认为该论文的作者们应该向我们道歉,因为读这篇论文本质上就是在浪费时间和精力。它的主要卖点是一些数字,而这些数字都是错误的统计结果。如果是无意搞砸了,那不需要道歉;但犯了原本可以避免的错,就必须道歉。
18 世纪,英国统计学家 Thomas Bayes 将归纳推理法用于概率论基础理论,创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献。 面对上述研究,瑞士巴塞尔大学(University of Basel)计算系统生物学家 Erik van Nimwegen 实验室更是发推特称: 贝叶斯的墓碑下传来了哭声。
美国旧金山州立大学进化生物学家 Pleuni Pennings 针对圣克拉拉研究,在博客中犀利地指出: 我们常说,非常的主张需要非常的证据。然而,这篇论文的主张很独特,而证据不是。而且,即使一篇研究论文出自名校,也不能保证这项研究就是靠谱的。
值得注意的是,学术论文在正式发表前,首先需要发表预印本,经过严格的同行评审流程后,最终会正式发表。因此,预印本的研究结论不具有完全的可信度(即便是正式发表的论文也可能存在争议)。 特殊时期涌现出的研究,很可能会让我们无意间就掉进了陷阱。对此,哈佛大学流行病学家 William Hanage 也建议: 不要轻信所谓的专业数据,要注重数据来源,辨别相关论文究竟是预印本,还是已在知名期刊上正式发表。
|