Tổng quan
- Nền tảng AI Diagnocat cho thấy độ nhạy cao (lên đến 93,9%) trong việc phát hiện các vùng minh bạch quanh chóp (PARLs) trên các hình ảnh CBCT của răng hàm chưa được điều trị tủy.
- Độ đặc hiệu ở mức trung bình, cho thấy khả năng chẩn đoán quá mức, đặc biệt là trong các hình ảnh sau phẫu thuật.
- Các hình ảnh sau điều trị tủy cho thấy giá trị dự đoán dương (PPV) và điểm F1 giảm đáng kể, cho thấy những thách thức trong chẩn đoán sau điều trị.
- Các kết quả nhấn mạnh vai trò bổ trợ của các công cụ AI với đánh giá chuyên gia trong chẩn đoán nội nha.
Nền tảng và gánh nặng bệnh tật
Viêm quanh chóp, một tổn thương viêm thường gặp ở chóp chân răng, thường xảy ra do nhiễm trùng tủy. Việc phát hiện chính xác các vùng minh bạch quanh chóp (PARLs) là quan trọng đối với chẩn đoán, lập kế hoạch điều trị và tiên lượng trong nội nha. Các phương pháp chụp X-quang truyền thống như phim X-quang quanh chóp và全景X光片在敏感性和特异性方面存在局限性,特别是在复杂的解剖区域如磨牙。
锥形束计算机断层扫描(CBCT)提供了优越的空间分辨率和三维可视化,提高了诊断信心。然而,解释CBCT图像需要专业知识且可能耗时。基于人工智能(AI)的工具通过自动化病变检测有望提高诊断效率。Diagnocat平台代表了一种基于卷积神经网络的AI工具,旨在检测CBCT图像上的PARLs。
尽管AI在牙科中的应用日益增加,但在广泛采用之前,对这些平台进行严格的临床验证以确保其准确性和可靠性是必要的。因此,本研究旨在严格评估Diagnocat在磨牙中的诊断性能,比较其在未治疗的非根管填充牙齿以及根管治疗后的有效性。
研究设计
这项回顾性研究分析了一个包含134颗磨牙共327个根的数据集,按治疗状态分为术前(非根管填充)和术后(根管填充)组。
Diagnocat AI平台被应用于这些CBCT图像以检测是否存在 periapical radiolucencies。AI输出结果与两名经验丰富的内牙科医生独立建立的参考标准进行了比较,后者在没有访问AI结果的情况下审查了扫描图像以检测PARLs。
计算了牙齿水平和根水平评估的诊断准确性指标。评估的指标包括敏感性、特异性、准确性、阳性预测值(PPV)、阴性预测值(NPV)、F1分数(精确率和召回率的调和平均数)以及接收者操作特征曲线下面积(AUC-ROC)。
主要发现
在非根管填充磨牙(术前扫描)中,Diagnocat表现出:
– 高敏感性:牙齿水平为93.9%,根水平为86.2%,表明检测真实病变的能力较强。
– 中等特异性:牙齿为65.2%,根为79.9%,表明有出现一些假阳性的倾向。
– 准确性为79.1%(牙齿)和82.6%(根),反映了平衡的性能。
– PPV范围从71.8%到75.8%,NPV显著高,分别为91.8%到88.8%,说明阴性评估可靠。
– F1分数为81.3%(牙齿)和80.7%(根),表示总体预测质量良好。
– AUC-ROC值为0.76(牙齿)和0.79(根),表明中等的诊断效能。
相比之下,根管填充磨牙的术后扫描表现明显较差:
– 牙齿水平的PPV降至54.2%,根水平降至46.9%。
– F1分数下降至67.2%(牙齿)和59.2%(根)。
这些发现表明AI在术后检测PARLs的可靠性降低,可能是由于伪影、充填材料引起的放射学特征改变或愈合变化使模式识别复杂化。
专家评论
AI在牙科放射学的应用是一个不断发展的前沿领域。Diagnocat在未经治疗的磨牙中表现出高敏感性,对于初始诊断具有临床价值,减少了遗漏病变的风险。然而,中等特异性要求谨慎,因为假阳性可能导致不必要的干预或焦虑。这强调了临床医生监督的重要性,以将AI得出的结果置于全面临床评估的背景下。
术后扫描准确性的降低突显了当前AI模型的一个关键限制:难以区分复杂的术后变化和病理病变。增强训练数据集,包括多样化的术后图像,先进的算法补偿束硬化伪影,或整合临床数据可能会改善未来的表现。
从生物学角度来看,periapical radiolucencies代表炎症骨吸收,在CBCT上表现为低密度区。根管充填材料引起的变化可能模仿或掩盖这些发现,需要超出原始图像分析的解释技能。
结论
Diagnocat在检测非根管填充磨牙CBCT图像上的periapical radiolucencies方面展示了有希望的诊断准确性,以高敏感性和合理的整体准确性为特征。然而,其中等特异性意味着AI诊断应被视为补充而非替代专家临床判断,以减轻过度诊断的风险。
术后根管填充牙齿的诊断性能显著下降,限制了Diagnocat在根管治疗后疾病监测中的当前效用。继续改进AI算法、在更大的临床队列中验证以及整合多模态数据对于提高所有临床情景下的可靠性至关重要。
临床医生应积极参与解释AI生成的结果,并利用这些工具来增强而不是替代他们的诊断过程。未来的研究应探讨在综合术后数据集上训练AI系统,并评估其对患者结果的影响。
参考文献
Allihaibi M, Koller G, Mannocci F. Diagnostic accuracy of an artificial intelligence-based platform in detecting periapical radiolucencies on cone-beam computed tomography scans of molars. J Dent. 2025 Sep;160:105854. doi: 10.1016/j.jdent.2025.105854. Epub 2025 May 31. PMID: 40456383.
Patel S, Dawood A, Ford TP. The potential applications of cone beam computed tomography in the management of endodontic problems. Int Endod J. 2007;40(10):818-30.
Schwendicke F, Golla T, Dreher M. Artificial intelligence in dental diagnostics—state of the art and future perspectives. Br Dent J. 2021;230(8):477-485.
Setzer FC, Shah S, Kohli MR, Karabucak B, Kim S. Cone-beam computed tomography in endodontics — A review. J Endod. 2012;38(9):1338-1345.