Tiêu chuẩn hóa việc giải thích sinh thiết gan trong các thử nghiệm MASH: Các tuyên bố đồng thuận chính từ Nhóm Bệnh lý Quốc tế MASLD

Tiêu chuẩn hóa việc giải thích sinh thiết gan trong các thử nghiệm MASH: Các tuyên bố đồng thuận chính từ Nhóm Bệnh lý Quốc tế MASLD

Giới thiệu và Bối cảnh

Rối loạn chuyển hóa liên quan đến viêm gan nhiễm mỡ (MASH), nằm trong phạm vi mới được xác định của rối loạn chuyển hóa liên quan đến bệnh gan nhiễm mỡ (MASLD), vẫn là chỉ định hàng đầu cho các biến chứng liên quan đến gan ở người lớn mắc béo phì và đái tháo đường tuýp 2. Đánh giá mô học của sinh thiết gan — phân loại hoạt động viêm hoại tử và giai đoạn xơ gan — vẫn là tiêu chuẩn vàng để lựa chọn bệnh nhân và điểm kết thúc chính trong hầu hết các thử nghiệm lâm sàng điều trị. Tuy nhiên, sự biến đổi trong cách các bác sĩ bệnh lý định nghĩa và đánh giá các đặc điểm mô học cốt lõi (như phồng tế bào gan, viêm tiểu thùy, và phân bố của xơ gan) tạo ra những vấn đề lớn: sự biến đổi cao giữa và trong các nhà quan sát, sự không nhất quán trong việc đăng ký thử nghiệm (thất bại trong quá trình sàng lọc), và tỷ lệ đáp ứng giả dược biến đổi có thể che giấu hiệu quả của điều trị.

Để giải quyết những vấn đề này, Nhóm Bệnh lý Quốc tế MASLD (IMPG), một nhóm gồm 25 chuyên gia bệnh lý gan và một thống kê viên, đã phát triển các tuyên bố vị trí đồng thuận để tiêu chuẩn hóa các định nghĩa mô học, cách xử lý mẫu, sử dụng đánh giá, và quy trình làm việc của người đọc, cụ thể cho các thử nghiệm lâm sàng MASH. Công việc của họ, được công bố trong J Hepatol (Lackner et al., 2025), đã sử dụng quy trình Delphi đa giai đoạn để đưa ra một bộ khuyến nghị mạnh mẽ nhằm cải thiện tính tái tạo, hỗ trợ các thử nghiệm đa trung tâm, và hỗ trợ tạo ra các tập dữ liệu được chú thích chất lượng cao cho học máy.

Những Điểm Mới Chính

Các điểm chính từ sự đồng thuận của IMPG:

– Một cách tiếp cận nghiêm ngặt, tiêu chuẩn hóa đối với việc xử lý, nhuộm màu, và báo cáo sinh thiết giảm thiểu sự biến đổi và cải thiện tính toàn vẹn của thử nghiệm.
– Định nghĩa rõ ràng, vận hành được cho các đặc điểm mô học cốt lõi (tích mỡ, phồng tế bào gan, viêm tiểu thùy và cửa gan, cơ thể Mallory-Denk, và mô hình xơ hóa) đã được ủng hộ để giảm sự biến đổi trong việc diễn giải giữa các bác sĩ bệnh lý.
– Hướng dẫn về việc áp dụng nhất quán các hệ thống đánh giá hiện tại (Mạng Nghiên cứu Lâm sàng NASH [NASH-CRN] và SAF/FLIP) và cách điều chỉnh chúng với các điểm kết thúc của thử nghiệm đã được cung cấp.
– Khuyến nghị nhấn mạnh các mô hình đọc tập trung (hai người đọc độc lập bị mù với việc giải quyết), đào tạo/cân chỉnh được định trước, và kiểm soát chất lượng liên tục.
– Các tuyên bố được thiết kế để sẵn sàng cho AI: các nhãn tiêu chuẩn, tiêu chuẩn số hóa, quy ước chú thích, và siêu dữ liệu được chỉ định để cho phép học máy giám sát có thể tái tạo.

Các kết quả số học quan trọng của quá trình Delphi: các nhóm làm việc IMPG đã tạo ra 278 tuyên bố chính. Trong vòng Delphi đầu tiên, 162 tuyên bố đạt được ≥80% sự đồng ý. Sau khi sửa đổi và thảo luận, vòng thứ hai đã mang lại 192 tuyên bố cuối cùng với ≥80% sự đồng ý.

Lời Khuyên Cập Nhật và Những Thay Đổi Chính

Các tuyên bố của IMPG không thay thế các hướng dẫn lâm sàng về quản lý MASLD mà cung cấp các thủ tục và định nghĩa bệnh lý tiêu chuẩn hóa cho các thử nghiệm lâm sàng. Những điểm mới hoặc được làm rõ so với các cách tiếp cận ít chính thức hơn trước đây bao gồm:

– Tiêu chí chất lượng sinh thiết tối thiểu rõ ràng cho việc bao gồm và báo cáo thử nghiệm (xử lý mẫu, cố định, chiều dài, và khuyến nghị về số lượng ống dẫn).
– Định nghĩa vận hành được cho phồng tế bào gan và viêm tiểu thùy để giảm sự biến đổi chủ quan.
– Hướng dẫn rõ ràng về việc sử dụng các thuốc nhuộm (H&E cộng với thuốc nhuộm mô liên kết) và khi nào cần sử dụng miễn dịch hóa học hoặc thuốc nhuộm đặc biệt.
– Hướng dẫn tiêu chuẩn cho việc sử dụng các hệ thống đánh giá đã được thiết lập (NAS của Mạng Nghiên cứu Lâm sàng NASH, SAF) và cách diễn giải các điểm kết hợp (ví dụ, giải quyết viêm gan nhiễm mỡ so với hồi phục xơ gan).
– Lời khuyên chi tiết về quy trình làm việc của người đọc tập trung, các bài tập cân chỉnh, và ngưỡng đồng thuận cho việc giải quyết.
– Một khung để tạo ra các tập dữ liệu tương thích AI: tiêu chuẩn số hóa bản kính, mức độ chi tiết chú thích, và các trường siêu dữ liệu cần thiết.

Những khuyến nghị đồng thuận này dựa trên các hệ thống đánh giá nền tảng trước đó (Kleiner et al. 2005 NASH-CRN; Bedossa et al. 2012 SAF) và hướng dẫn lâm sàng từ các hội lớn (AASLD 2018; EASL 2016), bằng cách tập trung chặt chẽ vào tiêu chuẩn hóa và tái tạo bệnh lý liên quan đến thử nghiệm.

Lời Khuyên Theo Chủ Đề

Dưới đây là các khuyến nghị thực tế, được nhóm chấp nhận, tổ chức theo chủ đề. Khi IMPG sử dụng cách tiếp cận đồng thuận (Delphi), ngưỡng đồng thuận của nhóm (≥80%) được ghi thay vì đánh giá bằng chứng truyền thống.

Thu thập và xử lý sinh thiết
– Tiêu chí chất lượng tối thiểu (đồng thuận): khuyến nghị mục tiêu chiều dài lõi tối thiểu 15–20 mm khi có thể, với việc ghi nhận số lượng ống dẫn. Lưu ý: các thử nghiệm nên xác định trước chiều dài mẫu chấp nhận được và kế hoạch cho việc lấy mẫu lại hoặc loại trừ nếu dưới ngưỡng. (≥80%)
– Cố định và xử lý: đặt ngay vào formalin trung tính 10%, nhúng parafin thông thường, và cắt toàn bộ. Ghi thời gian thiếu máu lạnh và thời gian cố định trong siêu dữ liệu. (≥80%)
– Thuốc nhuộm: bắt buộc H&E và một thuốc nhuộm mô liên kết (Masson trichrome hoặc Sirius Red). Các thuốc nhuộm bổ sung (ví dụ, CK8/18, ubiquitin) chỉ khi cần thiết cho việc giải quyết điểm kết thúc cụ thể. (≥80%)

Định nghĩa các đặc điểm mô học
– Tích mỡ: được đánh giá theo phần trăm tế bào gan có tích mỡ vĩ thể (các thùng chuẩn: 66%), nhất quán với các hệ thống đánh giá trước đây. (≥80%)
– Phồng tế bào gan: nhóm ủng hộ các mô tả vận hành (tăng kích thước, loãng hóa chất cytoplasma, hình dạng tế bào tròn) và cung cấp các ví dụ ảnh hiển vi cho các tập huấn luyện. Nhóm nhấn mạnh việc phân biệt phồng tế bào gan từ nhân glycogen hoặc hiện tượng phụ. (≥80%)
– Viêm tiểu thùy: được định nghĩa là số lượng và loại tiêu điểm viêm mỗi trường 200x, với hướng dẫn về phương pháp đếm và phân biệt với viêm cửa gan. (≥80%)
– Cơ thể Mallory-Denk và các cơ thể apoptosis: khuyến nghị ghi rõ khi có mặt; sự có mặt của chúng đóng góp vào điểm hoạt động theo quy trình thử nghiệm. (≥80%)

Giai đoạn xơ hóa và báo cáo
– Phân biệt hoạt động (đánh giá) và xơ hóa (giai đoạn) — xơ hóa phải được giai đoạn độc lập với điểm hoạt động. (≥80%)
– Sử dụng các mốc giai đoạn đã được xác nhận: nhóm khuyến nghị tiếp tục sử dụng các thang đo xơ hóa thứ tự đã được xác minh (ví dụ, các giai đoạn 0–4 của Mạng Nghiên cứu Lâm sàng NASH hoặc giai đoạn xơ hóa SAF), với các định nghĩa rõ ràng cho xơ hóa quanh xoang (khu vực 3), cửa gan, cầu nối, và xơ gan. (≥80%)
– Ghi cả mô hình và giai đoạn (ví dụ, “giai đoạn 2 xơ hóa quanh xoang và cửa gan”) để hỗ trợ diễn giải cơ chế. (≥80%)

Hệ thống đánh giá và điểm kết thúc thử nghiệm
– Khuyến nghị rằng các quy trình thử nghiệm nên xác định trước hệ thống đánh giá sẽ được sử dụng (NASH-CRN hoặc SAF) và cách thức vận hành các điểm kết hợp (ví dụ, “giải quyết viêm gan nhiễm mỡ mà không làm xấu đi xơ hóa” hoặc “cải thiện ≥1 giai đoạn xơ hóa”). (≥80%)
– Tránh trộn lẫn các hệ thống đánh giá giữa các người đọc mà không có bản đồ tương tác được xác định trước. (≥80%)
– Đối với các điểm kết thúc xơ hóa, yêu cầu giai đoạn lại các sinh thiết ghép đôi bởi cùng các người đọc và các khoảng thời gian chuẩn hóa để giảm sự biến đổi. (≥80%)

Đọc tập trung, đào tạo người đọc, và giải quyết
– Đọc tập trung được khuyến nghị cho các thử nghiệm giai đoạn II/III. Mô hình ưu tiên: hai người đọc chuyên gia độc lập bị mù với đường dẫn giải quyết đã được xác định trước (người đọc thứ ba hoặc hội nghị đồng thuận) cho các trường hợp không đồng lòng vượt quá ngưỡng đã xác định. (≥80%)
– Buộc phải có các phiên cân chỉnh trước thử nghiệm sử dụng các bản kính đã được chú thích và kiểm soát chất lượng liên tục với việc theo dõi đồng thuận trong thử nghiệm. (≥80%)
– Xác định các tiêu chí đồng thuận chấp nhận được trước (ví dụ, ngưỡng kappa hoặc tỷ lệ đồng ý) và kích hoạt tự động để đào tạo lại hoặc giải quyết nếu đồng thuận giảm dưới ngưỡng. (≥80%)

Số hóa, chú thích, và sẵn sàng cho AI
– Khuyến nghị số hóa toàn bộ bản kính ở độ phân giải chẩn đoán; siêu dữ liệu phải bao gồm loại máy quét, độ phóng đại mục tiêu, và định dạng tệp. (≥80%)
– Quy ước chú thích tiêu chuẩn: đánh dấu các vùng tích mỡ, phồng tế bào gan, viêm, và xơ hóa; bao gồm cả nhãn cấp độ pixel và vùng khi có thể. (≥80%)
– Khuyến khích chia sẻ các tập dữ liệu đã được chú thích và không xác định danh tính với giấy phép rõ ràng cho việc phát triển mô hình và xác minh độc lập. (≥80%)

Trường hợp đặc biệt và lưu ý
– Các sinh thiết có sự vỡ vụn đáng kể, cố định kém, hoặc hiện tượng phụ rõ ràng nên được ghi chú như vậy và — nếu dưới ngưỡng chất lượng đã xác định trước — loại trừ khỏi các phân tích hiệu quả chính theo quy trình. (≥80%)
– Đối với các mô học hiếm gặp (ví dụ, các đặc điểm tự miễn, các mô hình ứ mật, các hội chứng chồng chéo), khuyến nghị thêm sự liên quan lâm sàng và, khi phù hợp, loại trừ khỏi các điểm kết thúc MASH tiêu chuẩn trừ khi được quy trình thử nghiệm cho phép rõ ràng. (≥80%)

Bình luận và Nhận xét của Chuyên Gia

Sự đồng thuận của IMPG được định hình bởi các bác sĩ bệnh lý gan có kinh nghiệm và phản ánh cả sự đồng ý rộng rãi và sự công nhận về các tranh cãi còn tồn tại.

Các lĩnh vực có sự đồng thuận mạnh mẽ
– Việc định nghĩa hài hòa, vận hành giảm thiểu sự biến đổi giữa các nhà quan sát và cải thiện hiệu suất thử nghiệm.
– Đọc tập trung với đào tạo/cân chỉnh được xác định trước là thiết yếu cho các thử nghiệm đa trung tâm.
– AI sẽ đóng vai trò ngày càng quan trọng nhưng yêu cầu dữ liệu được gắn nhãn chất lượng cao và tiêu chuẩn hóa.

Các lĩnh vực tranh cãi đang diễn ra
– Ngưỡng hình thái chính xác cho việc cấu thành phồng tế bào gan vẫn khó khăn trong một số trường hợp; các atlas ảnh và các bản kính huấn luyện được nhấn mạnh để giảm thiểu.
– Tiếp cận liên tục (định lượng) so với thứ tự (bán định lượng) cho việc đánh giá xơ hóa: mặc dù các biện pháp định lượng kỹ thuật số hứa hẹn, nhóm công nhận sự phụ thuộc quy định và lịch sử vào các giai đoạn thứ tự và do đó khuyến nghị các tiếp cận song song khi có thể.
– Chiều dài sinh thiết tối thiểu: mặc dù các lõi dài hơn giảm lỗi mẫu, các hạn chế thực tế trong các thử nghiệm đa trung tâm (độ chịu đựng của bệnh nhân, kỹ năng của người thực hiện) có thể khiến việc áp dụng các giới hạn cứng nhắc khó khăn. Các thử nghiệm nên xác định trước các phạm vi chấp nhận được và cách xử lý các lõi không đủ tiêu chuẩn.

Các xu hướng tương lai được nhóm xác định bao gồm việc sử dụng rộng rãi hơn của bệnh lý số hóa, phát triển các thuật toán phân tích hình ảnh đã được xác minh để định lượng cả hoạt động và xơ hóa, và nỗ lực quốc tế để tổng hợp các tập dữ liệu đã được chú thích để tăng tốc xác minh AI.

Sự Ảnh Hưởng Thực Tế đối với Bác Sĩ Lâm Sàng, Nhà Tài Trợ, và Bác Sĩ Bệnh Lý

Đối với các nhà tài trợ và nhà nghiên cứu thử nghiệm
– Xây dựng các khuyến nghị của IMPG vào các phụ lục quy trình: quy trình thu thập sinh thiết, quy trình làm việc của người đọc tập trung, kế hoạch cân chỉnh, và ngưỡng chất lượng sinh thiết.
– Dự kiến tỷ lệ thất bại trong sàng lọc do sự không nhất quán về mô học sẽ giảm nếu sử dụng xử lý mẫu tiêu chuẩn hóa và đọc tập trung.

Đối với các bác sĩ bệnh lý và người đọc tập trung
– Tham gia các buổi cân chỉnh và sử dụng các ví dụ ảnh hiển vi và quy ước chú thích của IMPG để đồng bộ hóa các diễn giải.
– Ghi rõ và báo cáo độ đủ của mẫu và các hiện tượng phụ kỹ thuật; các mục này quan trọng đối với các điểm kết thúc quy định.

Đối với các phòng khám tuyển bệnh nhân
– Phối hợp với các bác sĩ can thiệp để ưu tiên thu được một lõi đủ (chiều dài, quy trình cố định) và đảm bảo xử lý nhanh chóng và ghi siêu dữ liệu cho việc bao gồm thử nghiệm.

Vignette bệnh nhân (minh họa)
John, một người đàn ông 52 tuổi mắc béo phì và đái tháo đường tuýp 2, đồng ý sàng lọc cho một thử nghiệm MASH giai đoạn 3. Một sinh thiết gan qua da được thu thập và đo được 18 mm; nó được cố định ngay lập tức và nộp kèm siêu dữ liệu của người thực hiện. Đọc tập trung bởi hai bác sĩ bệnh lý bị mù (đã được cân chỉnh trên tập huấn luyện của thử nghiệm) báo cáo: tích mỡ 34–66% (điểm 2), phồng tế bào gan rõ ràng (điểm 1), viêm tiểu thùy 2 tiêu điểm/200x (điểm 1), NAS = 4, giai đoạn xơ hóa 2 quanh xoang và cửa gan. Điểm bao gồm đã được xác định trước của thử nghiệm yêu cầu NAS ≥4 và giai đoạn xơ hóa 2–3; John được tuyển chọn. Sinh thiết ghép đôi sau 52 tuần được xử lý theo các SOP tương tự và đọc bởi cùng các người đọc để tối đa hóa khả năng so sánh.

Tài liệu tham khảo

1. Lackner C, Gouw ASH, Alves V, et al. Consensus position statements for the standardized application of histological grading and staging systems in MASH clinical trials. J Hepatol. 2025 Oct 8. doi:10.1016/j.jhep.2025.09.019. (Epub ahead of print)
2. Kleiner DE, Brunt EM, Van Natta M, et al. Design and validation of a histological scoring system for nonalcoholic fatty liver disease. Hepatology. 2005;41(6):1313–1321.
3. Bedossa P, Poitou C, Veyrie N, et al. Histopathological algorithm and scoring system for evaluation of liver lesions in patients with NAFLD. Hepatology. 2012;56(5):1751–1760.
4. Chalasani N, Younossi Z, Lavine JE, et al. The diagnosis and management of nonalcoholic fatty liver disease: Practice guidance from the American Association for the Study of Liver Diseases. Hepatology. 2018;67(1):328–357.
5. European Association for the Study of the Liver (EASL), European Association for the Study of Diabetes (EASD), European Association for the Study of Obesity (EASO). EASL–EASD–EASO Clinical Practice Guidelines for the management of non-alcoholic fatty liver disease. J Hepatol. 2016;64(6):1388–1402.

Kết luận

Các tuyên bố đồng thuận của IMPG là một bước tiến lớn hướng tới các điểm kết thúc mô học nghiêm ngặt và tái tạo trong các thử nghiệm lâm sàng MASH. Bằng cách tiêu chuẩn hóa cách xử lý mẫu, hòa hợp các định nghĩa, tối ưu hóa quy trình làm việc của người đọc tập trung, và cung cấp các khung chú thích sẵn sàng cho AI, các khuyến nghị này nên giảm sự biến đổi, cải thiện khả năng phát hiện tín hiệu thử nghiệm, và tăng tốc phát triển thuốc đáng tin cậy cho MASLD/MASH.

Comments

No comments yet. Why don’t you start the discussion?

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *