引言:成像异质性的挑战
光学相干断层扫描(OCT)彻底改变了眼科领域,提供了对视网膜的高分辨率、横截面可视化图像,这些图像对于黄斑疾病的诊断和管理至关重要。然而,OCT技术的迅速普及导致了成像硬件的碎片化。不同的制造商,如海德堡工程公司(Spectralis)和蔡司(Cirrus),采用了不同的光学设置和处理算法,导致图像对比度、噪声水平和空间分辨率的差异。对于人工智能(AI)和深度学习(DL)模型而言,这种异质性构成了一个重大障碍,称为域迁移。一个在某一供应商图像上训练的模型在应用于另一供应商的图像时往往表现不佳,限制了AI在多样化医疗环境中的可扩展性和临床实用性。
在发表于《美国医学会杂志·眼科学》的一项里程碑式研究中,唐及其同事通过开发和验证一种用于供应商无关的多疾病检测的域迁移AI技术,解决了这一挑战。通过利用先进的无监督测试时间域适应技术,研究人员旨在创建一个能够在不同硬件平台和临床环境中保持高性能的稳健诊断工具。
亮点
跨供应商的高诊断准确性
尽管模型是在单一制造商的数据上进行训练的,但其在不同OCT供应商上的表现依然稳健(AUROC高达0.999)。
安全第一的分诊
所有测试数据集的阴性预测值(NPV)均超过97.5%,确保了临床分诊场景中低漏诊率。
管理未知情况
引入不确定类别使模型能够识别并标记罕见或之前未见过的黄斑疾病,具有高特异性。
域适应成功
使用Test Entropy作为无监督适应方法有效弥合了不同成像域之间的差距,无需大量重新训练。
研究设计与方法
这项多中心回顾性队列研究利用了一个庞大的数据集,包括来自6,005名患者的18,992张OCT扫描图像。数据来源广泛,包括香港和越南的三级眼科医院、私人中心和开放数据库。研究期间从2008年1月持续至2022年9月,模型开发和分析则在2022年至2024年间进行。
该技术的核心是一个三维残差神经网络(ResNet)模型。与许多专注于二维切片(B-scan)的先前模型不同,该架构分析整个三维体积,捕捉黄斑病变的完整空间背景。为了满足供应商无关的要求,研究人员采用了一种名为Test Entropy的无监督测试时间域适应方法。该技术允许模型根据传入测试数据的统计特性实时调整其内部参数,有效地规范化来自供应商1(Spectralis)和供应商2(Cirrus)的图像之间的差异。
模型仅在供应商1的三维扫描图像上进行训练。然后,它接受了针对九个数据集的严格外部测试,包括来自供应商1、供应商2的三维扫描图像,甚至二维扫描图像以测试其通用性。一个关键创新是分诊模块,该模块根据检测到的病理将扫描图像分为紧急、半紧急和常规类别,并为分布外(OOD)案例设定了不确定类别。
结果:性能与临床可靠性
主要测量指标包括受试者工作特征曲线下面积(AUROC)、阳性预测值(PPV)和阴性预测值(NPV)。结果始终很高。
对于供应商1的三维扫描图像,AUROC范围为0.779至0.999。更令人印象深刻的是,当模型应用于从未在训练中见过的供应商2的三维扫描图像时,AUROC仍然很强,范围为0.754至0.991。当应用于二维扫描图像时,模型仍能达到0.801至0.950的AUROC,突显了其适应能力。
从临床安全性的角度来看,NPV或许是最重要的指标。所有微平均NPV均超过97.5%。这意味着如果AI将扫描图像标记为正常或常规,则极有可能没有遗漏重要疾病。就分诊而言,对于紧急病例(如活动性新生血管性年龄相关性黄斑变性),供应商1的漏诊率为6.16%,供应商2为6.70%。对于半紧急病例,漏诊率分别为4.41%和8.67%。
应对不确定:OOD挑战
临床AI面临的最大风险之一是模型无法识别的情况。如果模型被迫将罕见条件归类为预定义类别,可能会产生错误的确诊。唐等人通过引入不确定类别解决了这一问题。该模块在外部数据集中的特异性大于95.0%,准确性大于92.7%。虽然该类别的敏感性有所变化,但其存在作为一个重要的安全阀门,可以标记复杂或罕见病例供人工审查,而不是提供错误的自动诊断。
专家评论:弥合实施差距
域迁移技术的成功代表了眼科AI的重要进展。目前大多数AI解决方案都是本地化或专有的,在特定诊所使用特定机器时表现良好,但在现实世界中硬件多样化的环境中却失败了。通过证明可以在一个供应商上训练并在另一个供应商上成功部署的模型,研究人员为更可扩展的AI实施提供了蓝图。
然而,仍有几个考虑因素。尽管NPV表现优异,但PPV(范围为46.0%至72.0%)表明仍会有一些假阳性,需要临床医生监督以防止不必要的转诊。此外,作为一项回顾性研究,其对临床工作流程和患者结果的真实影响必须在前瞻性、真实世界的试验中得到验证。不确定类别的敏感性变化也表明,虽然模型在避免错误方面表现出色,但可能尚未完全识别每一种罕见条件。
机制上,使用Test Entropy是一种解决域迁移问题的复杂方法。它将适应负担从训练阶段转移到推理阶段,使模型更加动态,能够响应当前分析图像的具体特征。这反映了AI研究向更灵活、情境感知系统的更广泛趋势。
结论:通向通用诊断之路
唐等人的研究突显了供应商无关的深度学习模型在现代眼科领域的变革潜力。通过克服特定硬件训练的局限性,这项技术为在多样化的眼科护理环境中广泛应用铺平了道路,从初级护理筛查到三级医院分诊。这些系统可以显著简化黄斑疾病的检测,确保紧急状况的患者得到优先处理,并减轻眼科专业人员的整体负担。
未来的研究应集中在将这项技术整合到电子健康记录中,并探索其在疾病进展纵向监测中的应用。随着AI的不断成熟,重点可能会从纯粹的诊断准确性转向本多中心队列研究所展示的无缝跨平台集成。
参考文献
1. 唐志庆, 张玉红, 潘安瑞, 等. 域迁移AI技术用于供应商无关的多黄斑疾病检测的3D OCT扫描. JAMA Ophthalmol. 2026 年 2 月 26 日. doi: 10.1001/jamaophthalmol.2026.0029.
2. 施密特-埃夫富特 U, 沃尔德斯坦 SM. 光学相干断层扫描的技术更新. Invest Ophthalmol Vis Sci. 2014;55(12):8459-8476.
3. 丁大伟 SW, 彭 L, 瓦拉达拉詹 AV, 等. 深度学习在眼科的应用:走向临床. Nat Med. 2019;25(2):251-256.

