性感染症および肛門外性皮膚疾患の診断に人工知能を活用:系統的レビューとメタ分析からの洞察

性感染症および肛門外性皮膚疾患の診断に人工知能を活用:系統的レビューとメタ分析からの洞察

ハイライト

この包括的なレビューは、特に性感染症(STI)に焦点を当てた、AIを基盤とする診断ツールに関する証拠を統合し、研究の質が異なり、臨床検証が限られているにもかかわらず、有望な集約診断精度を明らかにしました。

AIによるモポックス検出は、最も高い集約感度と特異度を示し、次いで生殖器ヘルペス、イボ、乾癬、疥癬が続き、AIが性的健康診断における潜在的な役割を示しています。

現在の制限点には、偏りのリスクが高いこと、オープンソースデータセットへの依存、外部検証が最小限であること、広範な評価のための利用可能なモデルがないことが含まれ、厳密な将来の研究の必要性を強調しています。

研究の背景と疾患負担

性感染症(STI)と肛門外性皮膚疾患は、世界的な健康負担を代表し、著しい病態、心理社会的影響、経済コストを引き起こしています。肛門外性疾患の診断には、しばしば専門的な皮膚科または感染症の評価が必要であり、これがすべての場所で容易に利用可能ではない場合、診断と治療が遅れる可能性があります。

特に深層学習を応用したAIは、一般的な皮膚疾患の診断に革命をもたらしましたが、STIや肛門外性皮膚疾患の文脈での効果と範囲はまだ明確ではありません。これらの疾患の多くが視覚的なものであることを考慮に入れると、AIは特にリソースが制約されている環境で、より速く正確な検出を促進することができます。

研究設計

この系統的レビューとメタ分析では、IEEE Xplore、Embase、Scopus、Medline、Web of Science、CINAHLの6つの主要データベースを介して2010年1月1日から2024年4月12日に公開された研究を評価しました。対象の研究では、AIアルゴリズムがSTIや皮膚疾患に関連する肛門外性皮膚疾患を検出するために臨床画像に適用されました。

対象となる研究は、AIを基盤とする診断手法を使用し、感度や特異度などの性能指標を報告し、肛門外性疾患に焦点を当てていました。非AI診断手法、性能データのない研究、非肛門外性皮膚疾患は除外されました。

データ抽出は2人の独立したレビュアーによって行われ、方法論的厳密さと報告品質を評価するために修正されたQUADAS-2ツールとCLEAR Dermチェックリストが使用されました。3つ以上の適合研究がある疾患については、感度と特異度の推定値を集約するために二変量ランダム効果モデルを使用したメタ分析が実施されました。

主要な知見

5381件のスクリーニング記事の中から140件の研究が包含基準を満たしました。そのうち、大多数(78.6%)はモポックスに焦点を当てており、生殖器ヘルペス、生殖器イボ、疥癬、伝染性軟属腫、乾癬についても研究が行われました。

メタ分析結果は、主要な疾患に対するAIの診断性能が強く示されました。モポックス検出は、感度0.96(95% CI, 0.93–0.97)、特異度0.98(95% CI, 0.97–0.99)を示しました。単純ヘルペスウイルスの同定は、感度0.91(95% CI, 0.71–0.98)、特異度0.97(95% CI, 0.94–0.98)を示しました。生殖器イボ、乾癬、疥癬は、感度が0.87〜0.90、特異度が約0.98でした。

有望な精度にもかかわらず、研究の質はばらつきがありました。主に対象群の選択(76.1%)と基準標準(76.1%)において偏りのリスクが高かったことが示され、症例の代表性和診断確認に関する懸念が示されました。5分の1の研究では、指数テストの偏りのリスクが見られました。

ほとんどのAIモデル(86.4%)は、オープンソースの画像データセットで訓練またはテストされており、臨床集団の代表性的データセットの問題が提起されています。外部検証が報告されたのは12.1%の研究のみで、汎化可能性を確立する上で重要です。ほぼすべての研究(99.3%)は概念実証フェーズに限定されており、実世界の臨床設定や公的に利用可能なAIモデルへの展開はありませんでした。

専門家のコメント

これらの知見は、専門家が不足している地域で、AIがSTIや肛門外性皮膚疾患の診断を補完する上で大きな可能性を持っていることを示しています。高い診断指標は、早期検出と症例発見の改善に貢献するAIの能力を示唆しています。

しかし、専門家は、現行の証拠が主にキュレーションされたデータセットを使用した後方解析から得られており、実世界の臨床変動を捉えていない可能性があることを警告しています。外部検証や前向き臨床検証の欠如は、異なる集団や画像条件でのAIの性能に対する信頼性を制限します。

さらに、偏りのリスクの高さと公開データセットへの依存は、データ収集、注釈付け、アルゴリズム訓練の標準化手続きの必要性を示しています。モデルが透明性があり、解釈可能で、外部評価のために利用可能であることが、臨床統合のためには不可欠です。

この分野は、多施設、前向き研究により、異なる患者集団を対象とし、鑑別診断と臨床メタデータを組み込み、臨床ワークフロー内のAIツールを評価することで、利益を得ることができます。

結論

人工知能は、肛門外性臨床画像からモポックス、生殖器ヘルペス、生殖器イボ、乾癬、疥癬を特定する上で、従来の診断経路の補完として有望な精度を示しており、性的健康診断において有望な手段となっています。

ただし、臨床導入の前に、データセットの品質と代表性的を向上させ、厳密な外部検証を行い、概念実証から実世界の評価へ移行し、透明性と利用可能性のあるAIツールを開発するなど、重要な研究ギャップを解決する必要があります。

今後の努力は、未研究のSTIや肛門外性皮膚疾患を取り入れ、包括的な鑑別診断を組み込むことで、診断の精度を向上させるべきです。AIを日常的な性的健康管理に統合することは、慎重に検証され、倫理的に展開された場合、早期検出、患者アウトカム、医療資源の利用の改善につながる可能性があります。

参考文献

Soe NN, Kusnandar II, Latt PM, Fairley CK, Chow EPF, Maatouk I, Johnson CC, Shah P, Peters RPH, Subissi L, Zhang L, Ong JJ. 性感染症および肛門外性皮膚疾患の診断におけるAIの利用:系統的レビューとメタ分析. JAMA Netw Open. 2025年10月1日;8(10):e2533512. doi: 10.1001/jamanetworkopen.2025.33512. PMID: 41042514.

Esteva A, Kuprel B, Novoa RA, et al. 深層ニューラルネットワークを使用した皮膚癌の皮膚科医レベルの分類. Nature. 2017;542(7639):115-118.

World Health Organization. 性感染症(STI). WHO Fact Sheet. 2022.

Rajpurkar P, Hannun AY, Haghpanahi M, Bourn C, Ng AY. 組み込み型ニューラルネットワークを使用した心房細動の心臓専門医レベルの検出. Nat Med. 2019;25(1):65-69.

Comments

No comments yet. Why don’t you start the discussion?

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です