引言与背景
新冠后遗症 (PCC),通常称为“长期新冠”,自疫情急性期以来已成为一个持续的公共卫生和临床挑战。患者报告多系统症状——疲劳、呼吸困难、认知障碍、疼痛、睡眠障碍和心理健康问题——这些症状可能持续数月,影响生活质量和功能。旨在治疗 PCC 的临床试验和干预研究激增,但由于所测量的结局、评估时间和测量方法的异质性,难以比较结果、综合证据和加速有效护理策略。
为此,Pang 等人召集了多方利益相关者,并发表了《新冠后遗症临床试验的核心结局指标集:“测量什么、何时测量和如何测量”》(《循证医学杂志》,2025年)。该工作的主要成果是 COS-PCC:一个共识驱动的、实用的核心结局指标集和推荐的测量工具。本文总结了 COS-PCC,解释了其必要性,详细说明了选定的结局和工具,并讨论了对临床医生、试验者和政策制定者的意义和剩余争议。
关键背景参考包括世界卫生组织关于 PCC 的临床病例定义(德尔菲共识,2021年)和国家指南,如 NICE 关于管理新冠长期效应的指南(NG188)。COS 开发遵循了 COMET 计划推广的公认核心集方法和报告标准(例如,COS-STAR/COS-STAD 指南)。
参考资料:WHO(2021);NICE(2020/2021);COMET 计划;Kirkham 等人,《试验》,2016年;Williamson 等人,《试验》,2012年。
新指南亮点
Pang 等人采用了一种系统的方法:文献回顾和测量方法映射;临床医生和患者的调查;两轮德尔菲法,多利益相关者参与;最终共识会议。从最初涵盖七个类别的 52 个结局和 206 种测量方法中,该组优先选择了四个领域和九个核心结局及其指定的测量工具。共识还支持 16 种可选测量方法以补充试验。
九个核心结局及其推荐的主要工具是:
– 呼吸困难——改良的医学研究委员会(mMRC)呼吸困难量表
– 咳嗽——莱斯特咳嗽问卷(LCQ)
– 运动能力——6 分钟步行测试(6MWT)
– 疲劳——疲劳严重程度量表(FSS)
– 疼痛——数字评分量表(NRS)
– 睡眠障碍——匹兹堡睡眠质量指数(PSQI)
– 焦虑——广泛性焦虑障碍量表-7(GAD-7)
– 抑郁——患者健康问卷-9(PHQ-9)
– 健康状况/生活质量——36 项简明健康调查(SF-36)
主要主题和要点
– 实用性和可行性推动了工具选择:优先选择广泛使用、经过验证且在门诊试验环境中可行的工具。
– 患者和临床医生的意见至关重要:症状负担和功能影响共同决定了结局选择。
– COS 聚焦于常见、对患者重要的可测量领域,并可能因干预而改变。
– COS 不排除其他结局;它设定了跨试验可比性的最低标准。
更新建议和关键变化
COS-PCC 相对于先前指导的新增内容
– 在 COS-PCC 之前,指导(WHO、NICE)描述了定义并推荐了临床评估方法,但未具体规定试验中的最小标准化结局集及其工具。COS-PCC 填补了这一空白,详细说明了 PCC 试验中“测量什么、何时测量和如何测量”。
– COS-PCC 强调症状严重程度和功能状态(例如,6MWT 和 SF-36),反映了向患者和监管机构关心的结局转变:功能和健康相关生活质量,而不仅仅是症状。
– 选定的工具经过验证并在全球范围内使用,这应比以前使用的多样、通常是单一研究特定的措施改善数据协调和跨试验荟萃分析。
推动更新的证据
– 选择基于 PCC 队列中症状频率和影响的文献、候选工具的已建立心理测量属性以及利益相关者的偏好。WHO 临床病例定义(症状 ≥3 个月)提供了评估许多结局的时间框架。
分主题建议
方法和利益相关者意见
– 库存:通过文献回顾和调查确定了 52 个结局和 206 种测量方法。
– 德尔菲法:两轮;第一轮有 60 名参与者完成(涵盖患者、临床医生、研究人员、方法学家和监管者),第二轮有 41 名参与者完成。
– 共识会议:36 名代表最终确定了 COS。
– 标准:开发遵循了 COS 开发(COMET 原则)和报告指导的公认方法。
核心结局、工具和理由(详细)
– 呼吸困难——mMRC 呼吸困难量表
– 理由:简单、经过验证、广泛使用的量表,与功能限制相关。适用于大型门诊试验,符合呼吸科临床实践(Mahler & Wells 风格的 mMRC 描述符)。
– 咳嗽——莱斯特咳嗽问卷(LCQ)
– 理由:特定于症状的、经过验证的健康状况测量工具,对咳嗽的变化敏感。
– 运动能力——6 分钟步行测试(6MWT)
– 理由:在肺部和康复试验中广泛使用的客观功能测量工具;提供具体的步行距离终点(ATS 6MWT 陈述提供了标准化程序)。
– 疲劳——疲劳严重程度量表(FSS)
– 理由:在慢性疾病中广泛使用的经过验证的量表,对临床上有意义的疲劳变化敏感。
– 疼痛——数字评分量表(NRS)
– 理由:简单、经过验证、广泛用于疼痛强度测量;易于重复使用。
– 睡眠障碍——匹兹堡睡眠质量指数(PSQI)
– 理由:一个月内的整体睡眠质量和障碍测量工具;经过验证,常用于研究。
– 焦虑——GAD-7;抑郁——PHQ-9
– 理由:简短、经过验证的筛查工具,可以量化症状严重程度,便于临床和研究比较。
– 健康状况——SF-36
– 理由:涵盖身体和心理领域的广泛健康相关生活质量测量工具,使不同条件下的比较和经济评估成为可能。
可选测量方法
– 小组同意了 16 种可选工具以补充核心集;这些包括更详细的认知测试、自主功能评估、PROMIS 测量和客观生物标志物或活动监测方法。当试验范围、资源或特定干预需要更深入的表型时,建议使用这些可选措施。
时间:“何时”测量
– COS-PCC 强调测量短期和长期阶段,与临床相关性和 WHO 的 PCC 定义一致。工作组优先考虑捕捉早期持续性(急性感染后约 3 个月)和更长期轨迹(6-12 个月或更长时间)的评估,但认识到确切的时间点应与试验假设和干预时间一致。
– 实际建议:包括基线(干预前)、早期干预后检查、与预期效果一致的主要时间点(通常为 3-6 个月)以及可行的更长期随访(≥12 个月),以捕捉持续性或恢复情况。
特殊人群和适应
– COS-PCC 旨在具有广泛的适用性,但作者指出,需要对工具进行文化和语言适应,以及为儿童、孕妇和已有残疾的人群提供可能的替代或额外措施。
专家评论和见解
委员会观点
– 优势:COS 平衡了临床相关性、患者优先事项和方法学严谨性。它优先选择经过验证、实用的措施,这些措施在各种试验环境中可能是可行的。
– 谨慎:小组承认局限性——一些重要的 PCC 表现(如劳累后症状加重 [PESE] 或自主功能障碍)难以用现有的简短工具捕捉,可能需要专门的评估,这些评估仍然是可选的而非核心的。
– 灵活性:COS-PCC 设定了最低的共同标准;试验可以并且应该收集针对干预和研究的病理生理学定制的其他结局。
关键争议
– 认知功能障碍:尽管“脑雾”在患者报告中很突出,但认知结局在试验中难以标准化。COS 包括了焦虑/抑郁和一个全面的健康工具(SF-36),但将详细的认知测试作为可选项。
– 客观生物标志物和远程监测:工作组在是否将客观生理标志物或数字生物标志物作为核心措施方面存在分歧,因为它们的可用性、标准化和可解释性存在差异。这些仍然是未来版本 COS 的有前途的补充。
– 全球适用性:像 SF-36 和 PSQI 这样的工具已在多种语言中得到验证,但并非普遍适用。低资源环境中的实施可能需要翻译、文化适应或选择简化的工具。
未来趋势和研究需求
– 测量时间的协调和 PCC 人群的最小临床重要差异(MCIDs)。
– 开发和验证针对 PCC 特定表型敏感的标准认知和自主测量工具。
– 整合数字和生理标志物(例如,活动监测器、心肺运动测试)作为可选但规范化的补充。
实际影响
对于试验者
– 最小数据集:将九个核心结局及其工具纳入试验方案,以实现结果的可比性和汇总。
– 样本量和终点:使用选定工具的测量属性和已建立的 MCIDs(如有)来确定样本量。
– 报告:在预设时间点一致报告核心结局,并遵循 COMET/COS-STAR 报告指南。
对于临床医生和指南开发者
– 证据综合:如果主要研究使用 COS-PCC,未来的系统综述和指南更新将更加稳健,能够综合功能和生活质量的效果以及症状。
– 临床试验和实践的一致性:选定的工具已经为许多临床医生所熟悉(例如,PHQ-9、GAD-7、mMRC),这有助于将试验结果转化为实践。
对于患者和资助者
– 以患者为中心的测量:COS 反映了患者的优先事项(症状负担和功能),提高了试验结果对 PCC 患者有意义的可能性。
– 资助决策:资助者可以要求或强烈鼓励在 PCC 试验提案中包含 COS,以确保可比性和资金效益。
示例案例:在试验中应用 COS
约翰·戴维斯,48 岁,六个月前感染了新冠,目前仍有劳力性呼吸困难、疲劳和睡眠不良。他符合一项康复计划随机试验的资格。根据 COS-PCC,试验收集了基线 mMRC、LCQ、6MWT、FSS、NRS(疼痛)、PSQI、GAD-7、PHQ-9 和 SF-36;重复评估安排在 3 个月(主要终点)和 12 个月(长期结果)。这些标准化措施将使康复试验与其他使用 COS-PCC 工具的试验进行比较和合并。
结论
COS-PCC 是一个实用的、共识驱动的新冠后遗症临床试验最低结局集。通过指定九个核心结局并推荐经过验证、可行的工具,它解决了证据综合的一个主要障碍:结局选择和测量的异质性。在未来的试验中实施 COS-PCC 应加速对有效干预的知识,提高试验的可比性,并确保结果集中在对患者重要的结局上——症状、功能和生活质量。
作者承认 COS-PCC 是一个初步框架:随着 PCC 科学的发展,新的生物标志物、认知评估和数字措施可能会被添加,该集将需要更新——这一过程应保持迭代和包容性。
参考文献
– Pang B, Wang K, Liu Q, et al. A Core Outcome Set for Clinical Trials on Post COVID-19 Condition: “What,” “When,” and “How” to Measure. J Evid Based Med. 2025 Nov 22:e70082. doi: 10.1111/jebm.70082.
– World Health Organization. A clinical case definition of post COVID-19 condition by a Delphi consensus, 6 October 2021. WHO. https://www.who.int/publications/i/item/WHO-2019-nCoV-Post_COVID-19_condition-Clinical_case_definition-2021.1
– National Institute for Health and Care Excellence (NICE). COVID-19 rapid guideline: managing the long-term effects of COVID-19. NG188. 2020 (updated). https://www.nice.org.uk/guidance/ng188
– COMET Initiative. Core Outcome Measures in Effectiveness Trials. https://www.comet-initiative.org
– Kirkham JJ, Gorst S, Altman DG, et al. Core Outcome Set–STAndards for Reporting: The COS-STAR statement. Trials. 2016;17:345.
– Williamson PR, Altman DG, Blazeby JM, et al. Developing core outcome sets for clinical trials: issues to consider. Trials. 2012;13:132.
– Mahler DA, Wells CK. Evaluation of clinical methods for rating dyspnea. Chest. 1988;93(3):580-586. (mMRC 呼吸困难量表改编)
– Birring SS, Prudon B, Carr AJ, et al. Development of a symptom-specific health status measure for patients with chronic cough: the Leicester Cough Questionnaire (LCQ). Thorax. 2003;58(4):339-343.
– ATS Committee on Proficiency Standards for Clinical Pulmonary Function Laboratories. ATS statement: guidelines for the six-minute walk test. Am J Respir Crit Care Med. 2002;166(1):111-117.
– Krupp LB, LaRocca NG, Muir-Nash J, Steinberg AD. The Fatigue Severity Scale. Arch Neurol. 1989;46(10):1121-1123.
– Buysse DJ, Reynolds CF 3rd, Monk TH, Berman SR, Kupfer DJ. The Pittsburgh Sleep Quality Index: a new instrument for psychiatric practice and research. Psychiatry Res. 1989;28(2):193-213.
– Spitzer RL, Kroenke K, Williams JB, Löwe B. A brief measure for assessing generalized anxiety disorder: the GAD-7. Arch Intern Med. 2006;166(10):1092-1097.
– Kroenke K, Spitzer RL, Williams JB. The PHQ-9: validity of a brief depression severity measure. J Gen Intern Med. 2001;16(9):606-613.
– Ware JE Jr, Sherbourne CD. The MOS 36-item Short-Form Health Survey (SF-36). Med Care. 1992;30(6):473-483.

