超越P值：腹股沟疝修补术文献中的临床相关性评估

研究背景与疾病负担

腹股沟疝修补术（IHR）仍然是全球最常见的普通外科手术之一，对患者的生活质量和医疗资源有重要影响。选择开放、腹腔镜或机器人手术方法受多种因素的影响，包括外科医生的经验、患者特征以及复发率、术后疼痛和伤口并发症等方面的预期益处。当代外科文献高度依赖循证医学原则；然而，在仅根据统计显著性（P值 < 0.05）解释结果时，一个关键挑战出现了，即没有伴随定义临床相关性的内容。这一差距可能导致关于技术优越性的误导性结论，从而影响临床实践和患者预后。鉴于此背景，评估IHR比较研究中临床相关性截止值的报告对于改善研究发现向有意义的临床决策的转化至关重要。

研究设计

Balthazar da Silveira等人的研究涉及系统回顾2018年以后发表在主要外科期刊上的文章——《Hernia》、《Surgical Endoscopy》、《Annals of Surgery》、《Surgery》、《World Journal of Surgery》和《JAMA Surgery》。搜索重点是比较开放、腹腔镜和机器人IHR方法的研究。排除了仅关注非临床结果（如成本效益）的文章。两名独立评审员筛选了文章，明确界定了与统计显著性相关的临床相关性截止值，并分析了这些研究是否仅基于P值而声称技术优越性，而未考虑临床重要性。

主要发现

从最初的62篇文章中，54篇符合纳入标准。大多数（85.2%）是比较队列研究，只有14.8%是随机对照试验（RCT）。没有一项研究报告了与所评估结果相关的预设临床相关性截止值。这一明显的缺失强调了在IHR外科文献中广泛存在的遗漏。

只有6项研究（11.1%）明确承认统计显著性结果可能不具有临床相关性。然而，其中50%的研究仍然仅基于P值建议手术方法的优越性，而其余50%尽管具有统计显著性但并未提出此类主张。值得注意的是，29.6%的研究在IHR方法之间未发现统计显著性差异，但其中12.5%的研究仍无统计支持地建议技术优越性。

在8项RCT中，只有一项承认其发现可能缺乏临床相关性，另一项则在缺乏统计显著性的情况下建议了益处。这些数据表明，即使设计严谨的试验也未能充分解决统计显著性和临床显著性之间的关键区别。

疝修补术中主要的临床重要结果——如复发率、术后疼痛严重程度和伤口相关并发症——在没有预先定义的阈值的情况下进行分析，无法确定观察到的差异是否对患者或实践产生有意义的影响。

专家评论

对外科研究和循证医学中过度依赖P值而不考虑临床相关性的问题反映了更广泛的问题。虽然P值提供了偶然发现的概率度量，但它们不能传达效应大小或以患者为中心的重要性。缺乏最小临床重要差异（MCIDs）或类似基准阻碍了临床医生判断统计显著性发现是否需要改变手术方法或患者管理的能力。

领先的外科专家和方法学家倡导在设计试验和解释结果时整合统计和临床相关性阈值，特别是在疝修补术等领域，相对较小的结果差异可能具有不同的患者中心意义。不考虑临床相关性的解释会夸大统计发现的价值并误导临床实践。

未来的研究应优先建立IHR关键结果的共识MCIDs，例如减少多少复发或疼痛才被认为是有意义的，以证明选择一种方法优于另一种。这些基准将使统计和临床显著性的透明披露成为可能，从而改善指南制定和共享决策过程。

结论

Balthazar da Silveira等人的全面文献评估突显了IHR研究中的一个关键差距：未能定义和结合临床相关性阈值与统计显著性指标。即使是被视为临床证据黄金标准的随机对照试验，通常也忽视了这一区别。

为了提高疝手术证据的可靠性和适用性，外科研究界必须承诺明确定义关键结果的临床相关性截止值并据此解释结果。强调临床相关性将最终完善循证外科决策，优化以患者为中心的护理，并促进开放、腹腔镜和机器人腹股沟疝修补术方法的强有力比较有效性数据的生成。

参考文献

1. Balthazar da Silveira CA, Rasador ACD, Nogueira R, Lansing S, Melvin WS, Nikolian V, Camacho D, Cavazzola LT, Lima DL. Cutting through the p-value: evaluating clinical relevance in surgical literature analyzing the approaches for inguinal hernia repair. Surg Endosc. 2025 Sep 24. doi: 10.1007/s00464-025-12213-2. Epub ahead of print. PMID: 40991045.

2. Moore CG, Carter RE, Nietert PJ, Stewart PW. Recommendations for planning pilot studies in clinical and translational research. Clin Transl Sci. 2011;4(5):332-7.

3. Jaeschke R, Singer J, Guyatt GH. Measurement of health status. Ascertaining the minimal clinically important difference. Control Clin Trials. 1989;10(4):407-15.

4. Ioannidis JP. Why most published research findings are false. PLoS Med. 2005;2(8):e124.

5. Chalmers I, Glasziou P. Avoidable waste in the production and reporting of research evidence. Lancet. 2009;374(9683):86-9.

超越P值：腹股沟疝修补术文献中的临床相关性评估

研究背景与疾病负担

研究设计

主要发现

专家评论

结论

参考文献

Comments

发表回复取消回复

研究背景与疾病负担

研究设计

主要发现

专家评论

结论

参考文献

Comments

发表回复 取消回复

发表回复取消回复