研究人员开发了一种自动化模型,可以评估乳房X线照片中的致密乳房组织-这是乳腺癌的独立危险因素-与专家放射科医生一样可靠。据研究人员称,这标志着这类深度学习模型首次成功应用于真实患者的诊所。通过广泛实施,研究人员希望该模型可以帮助提高全国乳腺密度评估的可靠性。
 
据估计,超过40%的美国女性患有致密的乳腺组织,仅此一项就会增加患乳腺癌的风险。此外,致密组织可以掩盖乳房X线照片上的癌症,使筛查更加困难。因此,美国30个州规定,如果乳房X线照片显示乳房密集,必须通知女性。
 
但乳房密度评估依赖于主观的人体评估。由于许多因素,放射科医师的结果有所不同-有时是显着的。麻省理工学院和MGH研究人员根据专家评估,对成千上万的高质量数字乳房X线照片进行了深度学习模型,以学习区分不同类型的乳房组织,从脂肪到极度密集。给定一个新的乳房X线照片,该模型可以识别密度测量值,与专家意见密切配合。
 
“乳房密度是一个独立的风险因素,推动我们如何与女性沟通他们的癌症风险。我们的动机是创建一个准确和一致的工具,可以在医疗保健系统中共享和使用,”第二作者Adam Yala说,麻省理工学院计算机科学与人工智能实验室(CSAIL)的博士生。
 
其他共同作者是第一作者,哈佛医学院放射学教授,MGH乳房成像主任Constance Lehman;高级作者Regina Barzilay,CSAIL的Delta Electronics教授和麻省理工学院的电子工程和计算机科学系。
 
映射密度
 
该模型建立在卷积神经网络(CNN)上,该网络也用于计算机视觉任务。研究人员对来自2009年至2011年期间筛查的39,000多名女性的58,000多个随机选择的乳房X线照片的数据集进行了训练和测试。他们使用了大约41,000个乳房X线照片,并进行了大约8,600个乳房X光检查。
 
数据集中的每个乳房X线照片都具有标准的乳房成像报告和数据系统(BI-RADS)乳房密度评级,分为四类:脂肪,散在(散在密度),异质(大多数密集)和密集。在训练和测试乳房X线照片中,大约40%被评估为异质和密集。
 
在训练过程中,给模型随机乳房X线照片进行分析。它学会将乳房X线照片与专家放射科医师密度等级进行映射。例如,致密的乳房含有腺体和纤维结缔组织,它们看起来像粗白线和坚实的白色斑块的紧密网络。脂肪组织网络显得更薄,整个灰色区域。在测试中,模型观察新的乳房X线照片并预测最可能的密度类别。
 
匹配评估
 
该模型在MGH的乳房成像部门实施。在传统的工作流程中,当拍摄乳房X线照片时,将其发送到工作站供放射科医师评估。研究人员的模型安装在一台单独的机器上,该机器在扫描到达放射科医师之前拦截扫描,并为每个乳房X线照片分配密度等级。当放射科医师在他们的工作站上进行扫描时,他们会看到模型的指定等级,然后他们接受或拒绝。
 
“每张图片只需不到一秒钟......[并且可以]在整个医院中轻松便宜地扩展。”亚拉说。
 
在今年1月至5月的MGH超过10,000张乳房X线照片上,该模型在医院的放射科医生中进行了二元测试达成了94%的协议-确定乳房是异质和密集,还是脂肪和散在。在所有四个BI-RADS类别中,它与放射科医师的评估相匹配,达到90%。“MGH是一个顶级乳房成像中心,具有很高的放射科医师协议,这个高质量的数据集使我们能够开发出强大的模型,”Yala说。
 
在使用原始数据集的一般测试中,该模型在四个BI-RADS类别中与77%的原始人类专家解释相匹配,并且在二进制测试中,将解释与87%相匹配。
 
与传统的预测模型相比,研究人员使用了一种称为kappa分数的度量标准,其中1表示预测每次都一致,而任何更低的预测都表示协议实例更少。市售自动密度评估模型的Kappa评分最高约为0.6。在临床应用中,研究人员的模型得分为0.85 kappa评分,在测试中得分为0.67。这意味着该模型比传统模型做出更好的预测。
 
在另一项实验中,研究人员用来自500名随机测试乳房X线照片的5名MGH放射科医师的共识测试了该模型的一致性。放射科医师将乳房密度分配到乳房X线照片,而不知道原始评估,或他们的同伴或模型的评估。在该实验中,该模型与放射科医师达成一致,达到0.78的kappa评分。
 
接下来,研究人员的目标是将模型扩展到其他医院。“基于这种转化经验,我们将探索如何将麻省理工学院开发的机器学习算法转变为使数百万患者受益的诊所,”Barzilay说。“这是麻省理工学院新中心的一个章程-麻省理工学院健康机器学习的Abdul Latif Jameel诊所-最近推出。我们很高兴这个中心开辟了新的机会。”