MedicHub - Nền tảng y tế số

Ứng dụng học sâu trong chẩn đoán X-quang ngực nhi khoa: Tái định hướng một công cụ thương mại phát triển cho người lớn

Tác giả Prerana Agarwal¹, Alexander Rau¹, Helen Ngo¹, Ambika Seth², Fabian Bamberg¹, Elmar Kotter¹, Jakob Weiss¹

Tóm tắt

Bối cảnh
Số lượng các công cụ trí tuệ nhân tạo (AI) thương mại hỗ trợ quy trình chẩn đoán hình ảnh ngày càng tăng, tuy nhiên các giải pháp dành riêng cho bệnh nhi hầu như chưa có sẵn.

Mục tiêu
Đánh giá hiệu năng của một thuật toán AI trong việc phát hiện và định vị các ung thư khoảng trống (interval cancers) trên X-quang ngực (CXR) sàng lọc ở trẻ em, thông qua tái định hướng một công cụ phát triển cho người lớn (Lunit INSIGHT CXR), và xác thực ngưỡng chẩn đoán bằng cách so sánh hiệu suất trên các trường hợp ung thư khoảng trống, dương tính thực, âm tính thực và dương tính giả.

Vật liệu và phương pháp
958 phim X-quang ngực thẳng liên tiếp của trẻ từ 2–14 tuổi được đưa vào phân tích bằng công cụ AI thương mại. Chuẩn vàng tham chiếu được xác định bởi bác sĩ chẩn đoán hình ảnh có chứng chỉ hành nghề và kinh nghiệm trong X-quang ngực nhi khoa. Các báo cáo gốc được kiểm định bởi bác sĩ X-quang nhi khoa chuyên sâu được xem là đọc lần hai. Những điểm bất đồng được thảo luận và thống nhất. Hiệu năng chẩn đoán của công cụ AI được đánh giá bằng các chỉ số chuẩn về độ chính xác. Đầu ra liên tục (0–100) của AI được nhị phân hóa bằng ngưỡng khuyến cáo dành cho người lớn, đồng thời tối ưu hóa lại ngưỡng dành cho bệnh nhi. Các tổn thương quan trọng bao gồm: đông đặc, xẹp phổi, nốt, tim to, giãn trung thất do khối, tràn dịch màng phổi và tràn khí màng phổi. Trong đó, 200 phim (20,9%) phát hiện ít nhất một bệnh lý có ý nghĩa.

Kết quả
Với ngưỡng người lớn, công cụ AI đạt diện tích dưới đường cong ROC (AUC) 0,94 (95% CI: 0,92–0,95). Ở nhóm phân tích theo tuổi, trẻ lớn (7–14 tuổi) cho kết quả vượt trội hơn so với trẻ nhỏ (2–6 tuổi), với AUC 0,96 (95% CI: 0,94–0,98), độ nhạy 87,5% và độ đặc hiệu 82,3% (p<0,001). Khi áp dụng ngưỡng tối ưu hóa riêng cho bệnh nhi, độ đặc hiệu và giá trị tiên đoán dương tính cải thiện rõ rệt.

Kết luận
Tái sử dụng các công cụ AI phát triển cho người lớn trong chẩn đoán X-quang ngực ở trẻ em có thể hỗ trợ quy trình lâm sàng một cách hiệu quả cho đến khi các giải pháp dành riêng cho bệnh nhi được phát triển.

Giới thiệu

X-quang ngực là một trong những xét nghiệm hình ảnh phổ biến nhất trong lâm sàng nhi khoa, đóng vai trò quan trọng trong chẩn đoán nhiều bệnh lý liên quan đến phổi, trung thất và thành ngực. Trong những năm gần đây, các công cụ AI thương mại hỗ trợ quy trình chẩn đoán hình ảnh phát triển mạnh mẽ, đặc biệt trong lĩnh vực X-quang ngực với nhiều ứng dụng: phát hiện nốt, viêm phổi, sàng lọc lao, phân loại ưu tiên và tối ưu hóa luồng công việc.

Tuy nhiên, phần lớn các công cụ này tập trung cho dân số người lớn; các giải pháp dành riêng cho trẻ em còn hạn chế. Hiện chưa có công cụ hỗ trợ chẩn đoán (CAD) nào được FDA phê duyệt dành riêng cho nhi khoa. Nguyên nhân bao gồm khó khăn trong việc thu thập bộ dữ liệu X-quang nhi khoa mở, hạn chế số lượng bác sĩ X-quang nhi để gán nhãn chính xác, yêu cầu khắt khe hơn trong nghiên cứu nhi khoa, thị trường nhỏ hơn, và sự đa dạng giải phẫu cũng như bệnh lý theo độ tuổi.

Trong bối cảnh này, việc tái định hướng công cụ AI từ người lớn sang nhi khoa có thể giúp cải thiện quy trình lâm sàng, hỗ trợ quyết định chẩn đoán và điều trị trong điều kiện hạn chế nguồn lực. Các nghiên cứu gần đây đã thử nghiệm điều chỉnh thuật toán AI X-quang ngực người lớn cho bệnh nhi bằng cách loại bỏ trẻ <2 tuổi, bỏ qua một số dấu hiệu (như tim to), và tối ưu ngưỡng hoạt động. Tuy nhiên, cần có những nghiên cứu kiểm định nghiêm ngặt để đánh giá hiệu quả và giới hạn.

Nghiên cứu này nhằm đánh giá hiệu năng chẩn đoán của công cụ AI thương mại (Lunit INSIGHT CXR) phát triển cho người lớn, khi áp dụng trên dữ liệu X-quang ngực nhi khoa (2–14 tuổi) trong thực tế lâm sàng.

Phương pháp

Mẫu bệnh nhân

Nghiên cứu hồi cứu, đơn trung tâm, bao gồm 1000 phim X-quang ngực thẳng của trẻ 2–14 tuổi được chỉ định lâm sàng tại bệnh viện tuyến cuối từ 01/2021 đến 04/2022. Sau loại trừ 42 trường hợp chất lượng kém, 958 phim được đưa vào phân tích. Trẻ <2 tuổi bị loại trừ do khác biệt rõ về giải phẫu và bệnh lý.

Nghiên cứu tuân thủ Tuyên ngôn Helsinki, được Hội đồng Đạo đức Đại học Freiburg phê duyệt (22–1184-retro), miễn yêu cầu đồng thuận.

Hình ảnh X-quang ngực

Tất cả phim được thu nhận trong thực hành thường quy, lưu trữ dưới định dạng DICOM từ PACS, chụp bằng nhiều hệ thống khác nhau (Siemens, Philips, Samsung). Mỗi bệnh nhân chỉ lấy một phim duy nhất.

Chuẩn vàng tham chiếu

Bác sĩ chẩn đoán hình ảnh chuyên sâu về ngực và có kinh nghiệm nhi khoa (10 năm) đọc phim trong phiên đọc chuyên biệt, xác định và gán nhãn các tổn thương quan trọng: đông đặc, xẹp phổi, nốt, tim to, giãn trung thất do khối, tràn dịch và tràn khí màng phổi. Các báo cáo gốc được bác sĩ X-quang nhi khoa xác thực được sử dụng như đọc lần hai. Các bất đồng được thảo luận và thống nhất.

Thuật toán AI

Sử dụng Lunit INSIGHT CXR (phiên bản 3.1.4.4), công cụ AI thương mại phát triển cho người lớn, huấn luyện từ 262.445 phim X-quang ngực người lớn. AI phát hiện 10 loại tổn thương, xuất kết quả dưới dạng heatmap hoặc grayscale map kèm xác suất (0–100). Ngưỡng mặc định: 15% (tối ưu cho người lớn).

Phân tích thống kê

Dữ liệu được kiểm tra phân phối chuẩn bằng Shapiro–Wilk. Các biến liên tục được trình bày dưới dạng trung bình ± SD hoặc trung vị (IQR), biến phân loại dưới dạng tần số và tỷ lệ. Hiệu năng chẩn đoán được đánh giá theo STARD, tính AUC, độ nhạy, đặc hiệu, giá trị tiên đoán dương (PPV), âm (NPV). Ngoài ngưỡng 15% cho người lớn, ngưỡng tối ưu cho bệnh nhi được xác định bằng cách tối đa hóa tổng độ nhạy và đặc hiệu.

Kết quả

Đặc điểm mẫu

958 trẻ (524 nam, tuổi trung bình 6,75 ± 3,6), trong đó 200 phim (20,9%) có ít nhất một bệnh lý quan trọng.

Hiệu năng thuật toán

Với ngưỡng người lớn (15%), AI đạt AUC 0,94 (95% CI: 0,92–0,95), độ nhạy 87,5%, đặc hiệu 82,3%, PPV 56,6%, NPV 96,1%. Với nhóm bệnh lý nhu mô – màng phổi, AUC 0,94, độ chính xác 85,3%. Với nhóm trung thất, AUC 0,94, độ chính xác 89%.

Phân tích theo nhóm tuổi

Trẻ 2–6 tuổi: AUC 0,91, độ chính xác 78%, độ nhạy 88,1%, đặc hiệu 74%.
Trẻ 7–14 tuổi: AUC 0,96, độ chính xác 89,7%, độ nhạy 86,2%, đặc hiệu 90,3% (p<0,001 so với nhóm nhỏ tuổi).

Ngưỡng tối ưu cho bệnh nhi

Ngưỡng tối ưu xác định cho nhóm nhi khoa là 44,5, cho kết quả AUC 0,93, độ chính xác 89,8%, độ nhạy 80%, đặc hiệu 92,4%. So với ngưỡng người lớn, ngưỡng này cải thiện đáng kể độ đặc hiệu và PPV, phù hợp hơn cho ứng dụng lâm sàng ở trẻ.

Kết luận

Công cụ AI X-quang ngực phát triển cho người lớn (Lunit INSIGHT CXR) có thể được tái định hướng để áp dụng hiệu quả trên bệnh nhi, đặc biệt với nhóm tuổi lớn. Việc tối ưu hóa ngưỡng dành riêng cho trẻ giúp cải thiện hiệu năng, tăng độ an toàn khi ứng dụng trong lâm sàng. Đây có thể là giải pháp hỗ trợ tạm thời hữu ích cho quy trình chẩn đoán hình ảnh nhi khoa, trong khi chờ đợi các công cụ chuyên biệt dành riêng cho trẻ em được phát triển và phê duyệt.

👉 Đọc toàn bộ

¹Department of Diagnostic and Interventional Radiology, Medical Center ‐ University of Freiburg, Freiburg, Germany 

²Lunit, 7F, 374, Gangnam-daero, Gangnam-gu, Seoul, Korea