全球甲状腺超声风险分层系统的比较诊断性能:结节大小和术语标准化的影响

全球甲状腺超声风险分层系统的比较诊断性能:结节大小和术语标准化的影响

亮点

  • 在结节分类和恶性风险估计方面,五大主要甲状腺风险分层系统(RSS)存在显著异质性。
  • 美国甲状腺协会(ATA)和欧盟-TIRADS优先考虑敏感性,导致所有结节大小的不必要活检率较高。
  • 美国放射学会(ACR)TI-RADS保持最低的不必要活检率(UBR),但与其他国际系统相比,敏感性较低。
  • 结节大小(>2 cm vs. ≤2 cm)是诊断性能的关键决定因素,韩国-TIRADS在不同大小组之间的敏感性有显著变化。

背景

甲状腺结节的管理因超声(US)风险分层系统(RSS)的发展而发生了变革,这些系统通常被称为甲状腺影像报告和数据系统(TIRADS)。虽然这些系统旨在标准化甲状腺结节的管理并减少不必要的干预措施,但来自美国放射学会(ACR)、美国甲状腺协会(ATA)、欧洲(EU)、韩国(K)和中国(C)等不同学会的指南激增,导致了临床异质性的局面。

临床实践中面临的主要挑战之一是缺乏统一的术语和不同的细针穿刺活检(FNAB)尺寸阈值。这种异质性往往导致对同一结节的不同系统应用时推荐意见的差异。最近,国际专家共识提出了标准化的US术语,以弥合这些差距。了解这些系统相对于彼此的性能,特别是按结节大小分类,对于改进临床决策和朝着全球统一的RSS迈进至关重要。

主要内容

方法框架和标准化术语

在2017年3月至2024年2月的全面回顾分析中,研究人员评估了3,774个大于1厘米的甲状腺结节。该研究使用标准化的US术语,根据ATA、EU-TIRADS、K-TIRADS、ACR TI-RADS和C-TIRADS的具体标准对结节进行回顾性分类。这种方法允许直接比较各系统的内在逻辑,而不受不同描述术语的干扰。

比较分布和恶性风险

研究表明,不同系统在风险类别中的结节分布存在显著差异。系统间的一致性高度可变,kappa (κ) 值从低至0.05到高至0.85不等。这表明,虽然某些系统在高风险特征上高度一致,但它们对中间和低风险结节的处理方式根本不同。具体而言,看似相似的类别(例如,“高度怀疑”与“TIRADS 5”)在五个系统中的恶性风险关联显著不同(p < 0.001)。

按结节大小的诊断性能

研究将队列分为小结节(≤ 2 cm)和大结节(> 2 cm),以评估大小对活检标准性能的影响:

  • ATA和EU-TIRADS: 这些系统在小结节和大结节中都表现出最高的敏感性。然而,这种高敏感性伴随着显著更高的不必要活检率(UBR)。对于临床医生来说,这代表了一种权衡:错过恶性肿瘤的可能性较低,但低收益侵入性程序的负担较高。
  • ACR TI-RADS: 相反,ACR系统表现出最低的敏感性,但也是两个大小组中UBR最低的。ACR的基于点数的系统和较高的活检尺寸阈值有效地过滤了许多其他系统会针对FNAB的良性结节。
  • K-TIRADS: 韩国系统表现出独特的大小依赖性能变化。对于小结节,其敏感性和UBR最低。然而,对于大结节,其敏感性和UBR显著增加,更接近ATA和EU-TIRADS。
  • C-TIRADS: 中国系统的敏感性与ACR TI-RADS相似,但UBR较高,表明其内部的风险分配标准可能对良性标志物的特异性较低。

大结节的挑战

数据显示,大结节(>2 cm)的管理中表现差异最大。诊断性能的差异主要源于活检尺寸阈值的变化以及用于指定“无需活检”状态的具体US标准。缺乏高度可疑特征(如微钙化或非平行方向)的大结节在五个系统中的处理方式非常不同,导致观察到的UBR差异。

专家评论

这一大规模比较的结果强调了甲状腺肿瘤学中的一个基本矛盾:诊断敏感性和防止过度诊断和过度治疗之间的平衡。ATA和EU-TIRADS系统中观察到的高UBR反映了旨在捕捉尽可能多的恶性肿瘤的保守方法。然而,在许多甲状腺癌(如乳头状甲状腺微癌)惰性的情况下,ACR TI-RADS优先考虑特异性的方法可能更符合减少医疗浪费和患者焦虑的现代目标。

K-TIRADS的大小依赖性能特别引人注目。它表明,传统上与恶性肿瘤相关的US特征可能随着结节的增长而不同地表现出来,或者具有不同的预测权重。这突显了需要一种大小调整或“动态”的风险分层模型。此外,尽管在本研究中使用了标准化的US术语,但系统间的广泛一致性(κ = 0.05-0.85)证明我们距离甲状腺US的“通用语言”还有很长的路要走。这些差异不仅仅是语义上的;它们嵌入在US特征的权重和选定的干预尺寸阈值中。

结论

对ATA、EU-、K-、ACR-和C-TIRADS系统的比较分析表明,它们不是可以互换的。选择哪个RSS显著影响了活检数量和检测甲状腺恶性肿瘤的敏感性。特别是,由于小结节的活检尺寸阈值和大结节的US标准差异,诊断性能的差异最为明显。未来建立统一的国际TIRADS的努力必须集中在优化大结节的风险分层和协调活检阈值上。在实现这一统一系统之前,临床医生应了解所使用系统的优势和局限性——在ATA/EU系统的高敏感性和ACR TI-RADS的高特异性和效率之间找到平衡。

参考文献

  • Na DG, Noh BJ, Kim WJ, et al. 甲状腺恶性肿瘤的五大学会超声风险分层系统的诊断性能:按结节大小比较使用标准化超声术语。Thyroid. 2026; doi:10.1089/thy.2024.xxxx. PMID: 41789443.
  • Tessler FN, Middleton WD, Grant EG, et al. 美国放射学会甲状腺影像报告和数据系统(TI-RADS):美国放射学会TI-RADS委员会白皮书。J Am Coll Radiol. 2017;14(5):587-595.
  • Haugen BR, Alexander EK, Bible KC, et al. 2015年美国甲状腺协会成人甲状腺结节和分化型甲状腺癌管理指南。Thyroid. 2016;26(1):1-133.

Comments

No comments yet. Why don’t you start the discussion?

发表回复