英特尔实验室和宾夕法尼亚大学医学院的佩雷尔曼( Perelman)医学院已经共同合作完成了一项研究,使用联合学习(Federated Learning),一种分布式机器学习(ML)的人工智能(AI)方法来帮助国际医疗保健和研究机构识别恶性脑肿瘤。该项目是迄今为止规模最大的医学联合学习研究,使用了前所未有的来自六大洲71个机构的全球数据集,将脑瘤检测能力提高33%。
英特尔实验室的首席工程师Jason Martin说:“联合学习在许多领域都有巨大的潜力,特别是在医疗保健领域,正如我们与宾夕法尼亚医学院的研究成果所显示的那样。”“它对于保护敏感信息和数据的能力为未来的研究和合作打开了大门,特别是在数据集无法访问的情况下。我们与宾夕法尼亚医学院的合作有可能对全球的患者产生积极影响,我们期待着继续探索联合学习的前景。”
由于各国数据隐私法律,包括美国《健康保险可携带性和责任法案》(HIPAA),数据可访问性长期以来一直是医疗保健领域的一个问题。因此,在不损害患者健康信息隐私的情况下,几乎不可能实现大规模的医学研究和数据共享。英特尔的联合学习硬件和软件符合数据隐私问题,并通过机密计算保护数据完整性、隐私性和安全性。
宾夕法尼亚医学院和英特尔的研究成果是通过使用英特尔联合学习技术和英特尔®软件保护扩展(SGX)在去中心化系统中处理大量数据实现的,SGX消除了传统上阻碍癌症和疾病研究合作的数据共享障碍。该系统将原始数据保存在数据持有者的计算基础设施中,只允许经过本地模型进行数据计算,再将结果发送到中央服务器或聚合器,而不是数据本身,从而解决了许多数据隐私问题。
联合学习架构
专家称,如果没有足够的数据可以分析,世界上所有的计算能力都做不了什么。这种无法分析已经捕捉到的数据的能力大大推迟了人工智能有望实现的大规模医学突破。这项联合学习的研究为人工智能进步和实现其潜力提供了一条可行的道路,它是我们对抗最棘手疾病的最强大工具。
资深作者、佩雷尔曼医学院病理学、实验室医学和放射学助理教授Spyridon Bakas博士说:“在这项研究中,联合学习显示了其在确保多机构合作方面的范式转变的潜力。我们向机器学习模型输入的数据越多,它们就越准确,可以提高我们理解和治疗罕见疾病的能力。例如胶质母细胞瘤,人工智能模型可以访问最大和最多样化的胶质母细胞瘤患者数据集,而所有数据始终保留在每个机构内。”
为了推进疾病的治疗,研究人员必须访问大量的医疗数据——在大多数情况下,数据集超过了一个设施所能产生的阈值。该研究证明了大规模联合学习的有效性,以及在解锁多站点数据竖井时,医疗保健行业可以实现的潜在好处,包括疾病的早期发现,这可以改善患者的生活质量或延长寿命。
2020年,英特尔和宾夕法尼亚大学医学院宣布合作并使用联合学习来改善一种罕见癌症——胶质母细胞瘤(GBM)的肿瘤检测和治疗效果。胶质母细胞瘤是最常见和致命的成人脑瘤,标准治疗后的中位生存期仅为14个月。在过去的20年里,虽然治疗方案得到了扩展,但总体生存率并没有改善。该研究由美国国立卫生研究院国家癌症研究所的信息技术癌症研究项目资助。
宾夕法尼亚医学院和71个国际医疗保健/研究机构使用英特尔的联合学习硬件和软件来改进罕见癌症边界的检测。放射科医生使用了一种名为联合肿瘤分割(FeTS)的最新AI软件平台来确定肿瘤的边界,并改进了对肿瘤“可操作区域”或“肿瘤核心”的识别。放射科医生对他们的数据进行注释,并使用开放联合学习(OpenFL)(一种用于训练机器学习算法的开源框架)来运行联合训练。该平台使用了来自六大洲6314名GBM患者的370万张图像进行训练,这是迄今为止最大的脑瘤数据集。
通过这个项目,英特尔实验室和宾夕法尼亚医学院已经创建了一个使用联合学习从数据中获取知识的概念证明。解决方案可以显著影响医疗保健和其他研究领域,特别是在其他类型的癌症研究中。
英特尔开发了OpenFL开源项目,以使客户能够采用真实世界的跨部门联合学习,并将其部署到英特尔SGX上。此外,新的FeTS计划建立成一个协作网络,为正在进行的开发提供一个平台,并鼓励与FeTS平台和英特尔的OpenFL开源工具包的合作,这两个平台都可以在GitHub上获得。