随着技术的进步,人工智能(AI)在医疗领域的应用引起越来越多的关注,尤其是在乳腺癌筛查方面。
一些欧洲的前瞻性试验表明,某些AI工具的癌症检测能力超过了单靠放射科医师的检查。
但许多成像中心及其放射科医师仍然持怀疑态度。
马萨诸塞州总医院的乳腺放射科医师Manisha Bahl表示:“我们需要时间才能真正建立起对这项技术的信任与信心。”
该医院目前正在进行多项AI工具在乳腺X光检查中的对比研究。
在瑞典的一项大型前瞻性试验中,该研究首次发表于2023年,展示了信任对患者结果的重大影响。
该试验对斯德哥尔摩的一家医院的55,000名患者的乳腺X光进行研究,发现将两名放射科医师中的一名替换成AI,癌症检测率提高了4%。
在欧洲,乳腺X光通常由两名独立的读片医师进行评估,而在美国通常只由一名。
但是,最近对该试验的延伸研究显示,放射科医师并不总是相信AI的结果,这对他们的决策产生了显著影响。
当AI标记的乳腺X光病例存在潜在癌症风险时,放射科医师会显著减少对患者后续检查的呼叫,尤其是当人类放射科医师标记时。
数据显示,如果人机组合的两个标记均为潜在恶性病例,只有39%的患者会被召回;如果是两名放射科医师标记,则召回率飙升至57%。
该研究使用了来自韩国开发商Lunit的技术,Lunit部分资助了该研究。
Beth Israel Deaconess Medical Center的临床推理研究员Adam Rodman表示:“提供一款性能优越的算法并不一定能改善人类的表现。”
“这项研究很好地解释了原因,那就是信任。”
许多乳腺放射科医师常常表达对新技术的谨慎态度。
计算机辅助检测工具自1980年代起成为标准,但长期来看,它们并未提高癌症检测或召回率。
美国放射学会首席研究官Etta Pisano在12月的美国放射学会会议上表示:“我们在AI投入使用后必须小心行事。”
AI在乳腺癌检测中的性能,通常基于其在经过人类放射科医师筛查的旧X光图像数据库中识别癌症的准确性来进行报告。
然而,在实际应用中,这种性能可能在不同的中心和放射科医师之间显著差异。
放射科医师的信任程度、软件在其工作流程中的集成方式、用于解读的X光图像质量以及触发警报的阈值等因素都可以影响AI的准确性以及它对患者护理的影响。
那么,放射科医师如何确保以最有效的方式使用AI?
Rodman表示:“答案是,没有人知道。”
通常,Bahl在解读乳腺X光时,会先独立解读图像,然后再激活任何基于AI的图像处理。
这种做法旨在减少过度依赖机器的风险。
这种方法适合那些对自己的专业判断更有信心的放射科医师,也与调查显示病人通常希望由医生最终确认影像分析的结果相一致。
而这种做法可能并未实现AI所承诺的另一主要优势:效率的提升。
“如果这样做,可能效率稍微低一些,”Aneja说。
在放射科医师短缺的情况下,AI可以帮助他们更聪明和迅速地工作,这意味着需要先查看算法的输出。
在更积极采用乳腺X光AI的放射科实践中,Lunit北美销售总监Chris McKinney表示:“放射科医师的信心增加,开始更早地查看过程中的结果。”
然而,只有当放射科医师经常与新系统练习时,这种舒适感才能建立起来;但工具的采用并不一致,因为它们没有被保险公司报销。
相反,大多数采用这些工具的放射科实践要求患者支付40到90美元的现金费用作为AI附加服务。在Rezolut内部的一家顶级实践中,约40%的患者选择支付。
美国放射学会乳腺影像委员会主席Stamatia Destounis表示:“每位放射科医师都必须通过使用AI产品来获得更多的信心,然后根据自身情况灵活运用。”
“我不认为每个人都会以相同的方式使用它。”
然而,对于许多AI研究者和医生来说,“实践出真知”的做法并不足够,他们希望在这些工具越来越广泛使用的情况下,能够得到更明确的指导。
Aneja表示:“问题在于,很多这些设备在投放市场时几乎没有任何安全防护。”
医学影像质量在放射科实践中差异显著。
“很少有算法会说,‘这张图像质量差,无法评估。’”Aneja表示,“我们希望算法能够明确表明其不确定的地方。”
来自意大利的肿瘤学家Chiara Corti呼吁增加关于那些用于训练AI工具的患者的种族和民族信息的披露,以确保不同群体的准确性。
(美国放射学会的AI数据库包含关于训练和验证数据集的制造商提供的信息。)
黑女性更可能拥有密度较高的乳腺组织,这增加了乳腺癌的风险。同时,虽然一些AI工具被用于评估乳腺密度,但尚无标准来规定如何将其与其他算法结合使用。
AI工具的表现和相对价值还依赖于使用它的放射科医师。
不是每个放射科医师都是解读乳腺X光的专家,Aneja强调:“AI的一个最大好处是能够传播那种知识水平。”
为了确保放射科实践能够以驱动更好癌症结果的方式使用这一新一代算法,亟需在美国进行更多真实世界的前瞻性研究。
Destounis表示:“我们需要看到这些人机交互。”
“从过去的研究中推断出每位放射科医师如何在日常实践中与AI系统互动是不可能的。”
Bahl共同撰写的一项2024年关于六种FDA批准的乳腺筛查AI工具的已发布证据的调查显示,仅有两项小型临床研究涉及真实世界的实施,尽管目前的证据基础在迅速增长。
“能够在现实生活中获取我们需要的AI工具将非常重要,”Destounis表示,且确保这些工具具备足够的后续跟踪期。
如果没有这些,无法判断AI是否会导致对临床上不显著的癌症进行回召,从而造成过度治疗及相关的医疗费用,而对癌症死亡的影响却微乎其微。
这种真实世界证据是“推进临床试验准备”的ARPA-H项目的目标之一。
Pisano作为该项目的主任,在12月的RSNA会议上表示,ACTR计划在全国各地的成像中心进行真实世界的务实试验,最有可能从乳腺癌筛查算法试验开始,预计将涉及数十万例乳腺X光。
她当时表示,这些试验计划在春季开始,目前尚未宣布。
图片源于:https://www.bostonglobe.com/2025/05/30/business/ai-mammography-mgh/