专家访谈专家访谈
![]() |
── 众所周知,当您使用 Google 或 Facebook 时,您的数据会被收集并添加到您的个人资料中,但我认为您的医疗数据会被隔离和保护。
它没有得到很好的保护。在美国,有一项名为HIPAA(健康保险流通与责任法案)的医疗隐私法,要求医疗机构和保险公司遵守。因此,这可能不是数据经纪人获取信息的地方。政府数据库也是匿名的。然而,专家表示,只要知道性别、邮政编码和出生日期这三件事,80-90%的人口就可以被识别。如果将其与匿名政府数据、某人在某处发生车祸而截肢的消息以及在药店购买非处方药等购买数据结合起来,就很容易识别个人身份。许多这样的重新识别技术也是可用的。
── 这是否意味着医疗大数据除了用于研究之外还有其他重要的方面?
そうです。我们需要关注各类医疗大数据,包括营销。有一个著名的案例,互联网比她的父亲更早知道一个女孩怀孕的消息。当她使用互联网时,她看到很多婴儿用品的广告。当父亲觉得这样有冒犯性,向广告商的百货商店投诉说他的女儿只有14岁时,结果发现算法是根据女孩的购买历史来确定的。商店回复说:“你应该和这位年轻女士谈谈。”
── 感觉已经没有什么可隐瞒的了。
隐私是一个大问题,但偏见和准确性也是一个大问题。这意味着原始数据是否足够准确以得出结果。作为偏见的一个例子,我在耶鲁大学最近的一次会议上看到了很多研究。但是,在像耶鲁大学医院这样吸引受过良好教育的富裕患者的地方进行的研究结果可以适用于较贫穷、受教育程度较低地区的患者吗?我们必须警惕此类偏见。这意味着我们必须利用真正基于多样性的数据。准确性下降的另一个例子是我之前提到的医生的压力。在考试期间,您必须填写并单击许多字段。因为错误率有时会达到两位数,所以直接用它来研究得出结论是危险的。此外,虽然AI现在能够诊断X射线图像,但还存在执行诊断的AI学习的数据是否准确的问题。
── 大数据的研究成果实际上使用了什么样的数据,目前尚不清楚。
不良数据的例子有很多。此外,在很多情况下,不仅仅是大数据,研究本身的设计也存在问题。我立即想到的是研究表明堕胎会增加自杀念头等心理问题。反堕胎倡导者已将这种情况推向极端,以至于一些州甚至通过了法律,要求医生在进行堕胎前发出警告。然而,后来透露,这项研究并没有排除已有心理健康状况的受试者。还有一项研究发现“麻疹和腮腺炎疫苗会导致自闭症”,但这是基于非常有限的数据。这些有争议的研究结果导致反对疫苗的家长数量增加,导致学校麻疹疫情暴发。









