ChatGPT-4o与妇科肿瘤医生在子宫内膜癌患者沟通中的对比研究:一项前瞻性比较研究

ChatGPT-4o与妇科肿瘤医生在子宫内膜癌患者沟通中的对比研究:一项前瞻性比较研究

研究背景及疾病负担

子宫内膜癌是全球最常见的妇科恶性肿瘤之一,其发病率增加主要归因于人口老龄化和肥胖率上升。有效的患者沟通对于优化患者预后和生活质量至关重要,包括风险因素、预防策略、诊断程序和治疗选项的沟通。然而,临床就诊时间限制和沟通技能的差异可能会限制彻底的患者教育。这一未满足的需求为探索人工智能(AI)应用,如ChatGPT-4o,以补充临床互动并改善患者理解和支持提供了机会。通过比较AI与专业妇科肿瘤医生在回答患者关于子宫内膜癌问题时的表现,本研究为AI在不断发展的肿瘤学护理领域中的作用提供了及时的见解。

研究设计

这项前瞻性比较研究使用了一组经过验证的100个以患者为中心的问题,涉及子宫内膜癌,这些问题被均等分为两个领域:初级保健(侧重于风险因素和预防)和二级保健(侧重于诊断和治疗)。这些问题由专家仔细选择和审查,以确保临床相关性,并代表常见的患者关切。

每个问题由ChatGPT-4o和一位获得认证的妇科肿瘤医生独立回答。随后,两位独立的肿瘤医生使用标准化的4点Likert量表(分数越高表示表现越好)对答案的准确性、同理心和完整性进行评估。额外的指标包括字数分析和可读性评分,以评估答案的长度和可理解性。统计比较用于确定观察到的差异的显著性。

主要发现

ChatGPT-4o在所有评估领域中显著优于妇科肿瘤医生。具体而言,其准确性的平均得分为3.86,而医生的得分为3.36(p < 0.001),表明其正确性和事实可靠性更高。

在同理心方面,这是传统上对AI具有挑战性的领域,ChatGPT-4o得分3.47,明显高于医生的1.66(p < 0.001)。这表明AI生成的回答更具敏感性和以患者为中心,可能增强情感支持。

在完整性评估中,ChatGPT-4o的回答更为全面(3.00 vs. 1.97;p < 0.001)。AI提供了涵盖每个问题多个方面的详细解释,而医生的回答则较为简洁但不够详细。

值得注意的是,ChatGPT-4o的回答字数显著多于医生(平均403.51字 vs. 平均25.06字),尽管这有助于完整性,但也可能使一些患者感到信息过载。可读性分析显示,AI和医生的文本都需要较高的识字水平,表明在提供易于理解的信息方面仍存在挑战。

次级分析比较初级保健和二级保健问题时,ChatGPT-4o表现出一致的优越性,表明其在整个护理过程中的有效性。

专家评论

这些发现挑战了关于AI在临床沟通中局限性的先入之见,特别是在同理心方面。ChatGPT-4o能够模拟同情语言并提供详细准确的医疗信息,在肿瘤学实践中具有重要意义。

然而,AI生成的较长回答可能被视为过于复杂或冗长,可能阻碍患者的理解。这强调了需要优化AI算法,平衡细节与清晰度以及患者识字水平的考虑。

此外,将AI工具与人类临床医生结合使用,特别是经常提供患者教育和心理社会支持的肿瘤学护士,可以提高护理质量而不取代关键的人类判断。专家指出,AI的作用应作为辅助手段来丰富沟通,而不是替代医患关系。

局限性包括研究中的单一肿瘤医生对照组和对静态书面回答的评估,而非互动对话。未来多中心、患者参与的研究评估实际应用和接受度是必要的。

结论

这项前瞻性比较研究表明,ChatGPT-4o在回答子宫内膜癌患者问题时的准确性、同理心和完整性方面优于妇科肿瘤医生。虽然其冗长的回答带来挑战,但这些发现表明AI在补充肿瘤学护理和患者教育方面具有前景,有助于改善支持性护理。

为了最大化临床适用性,未来的AI改进必须优先平衡信息深度与可读性,并根据个体患者需求定制沟通方式。持续研究应关注在多学科护理框架中整合AI驱动的工具,以优化患者参与和子宫内膜癌管理的结果。

参考文献

İnan SA, İnan M, Türkmen O. ChatGPT-4o vs. oncologists in addressing endometrial cancer patient inquiries: A prospective comparative study in primary and secondary care. Eur J Oncol Nurs. 2025 Aug;77:102930. doi: 10.1016/j.ejon.2025.102930. Epub 2025 Jul 17. PMID: 40706414.

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注