Ứng dụng AI cho ung thư dạ dày là gì
Ứng dụng AI cho ung thư dạ dày là sử dụng công nghệ và thuật toán AI phân tích dữ liệu để hỗ trợ phát hiện, chẩn đoán, điều trị và nghiên cứu ung thư dạ dày.
Bộ dữ liệu bao gồm hình ảnh nội soi, hình ảnh chẩn đoán X-quang (như cắt lớp vi tính – CT, chụp cắt lớp phát xạ positron – PET), hình ảnh mô bệnh học kỹ thuật số (Whole Slide Images – WSI) và dữ liệu đa omics (genomics, transcriptomics).
Mục tiêu cơ bản của ứng dụng AI cho ung thư dạ dày là phát triển các công cụ hỗ trợ lâm sàng có khả năng hỗ trợ các bác sĩ trong toàn bộ chu trình quản lý bệnh, bao gồm: phát hiện và tầm soát sớm, chẩn đoán chính xác, phân giai đoạn (staging), phân tầng nguy cơ, dự đoán đáp ứng điều trị và tiên lượng kết quả sống sót của bệnh nhân.
Phạm vi ứng dụng chính
Tầm soát và phát hiện sớm
Phát hiện và chẩn đoán bằng máy tính
Để giải quyết những thách thức trong phát hiện ung thư dạ dày giai đoạn sớm (EGC), công nghệ đã phát triển hai hệ thống chẩn đoán có sự hỗ trợ máy tính (CAD) bổ trợ cho nhau.
Mỗi hệ thống đảm nhận một khía cạnh khác nhau trong quy trình chẩn đoán.
Hệ thống CADe (Computer-Aided Detection) hoạt động như một cơ chế cảnh giác theo thời gian thực, tự động nhận diện và cảnh báo bác sĩ về các vùng nghi ngờ trong quá trình nội soi.
Khả năng này giải quyết thách thức cơ bản về sự giám sát bằng mắt là bỏ sót những tổn thương tinh vi trong luồng kiểm tra nội soi liên tục.
Khi phát hiện các đặc điểm có khả năng ác tính, hệ thống CADe cung cấp ngay các dấu hiệu trực quan hoặc cảnh báo.
Nó hoạt động như một người quan sát thứ hai không mệt mỏi, duy trì sự chú ý nhất quán xuyên suốt các ca thủ thuật kéo dài.
Bổ sung cho khả năng phát hiện, hệ thống CADx (Computer-Aided Diagnosis) giải quyết thách thức quan trọng không kém là xác định đặc tính của tổn thương.
Sau khi phát hiện một vùng nghi ngờ dù là do bác sĩ nội soi hay hệ thống CADe—CADx phân tích các đặc điểm về hình thái và kết cấu để phân biệt giữa bệnh lý lành tính và ác tính.
Khả năng xác định đặc tính vượt xa phân loại nhị phân đơn giản khi các hệ thống CADx tiên tiến có thể phân tích các phương thức hình ảnh chuyên biệt như hình ảnh băng hẹp (NBI) để phân biệt giữa các loại khối u biệt hóa và chưa biệt hóa.
Chúng có thể đánh giá các mô hình vi mạch để xác định liệu cắt bỏ bằng nội soi có khả thi về mặt kỹ thuật đối với một polyp cụ thể hay không.
Ví dụ: Tại Bệnh viện ung thư, khi áp dụng hệ thống CADe, tỷ lệ phát hiện tổn thương sớm tăng từ 78% lên 91% so với nội soi thông thường. Tương tự, nhiều bệnh viện tại Đông Nam Á đang thử nghiệm hệ thống CADx để phân loại tổn thương, giúp giảm thiểu số lượng sinh thiết không cần thiết xuống khoảng 30%.
Cả hai hệ thống đều sử dụng kiến trúc học sâu, chủ yếu là Mạng Nơ-ron Tích Chập (CNN), để phân tích luồng video nội soi hoặc hình ảnh tĩnh theo thời gian thực.
Chỉ số hiệu suất mà các hệ thống này đạt được rất ấn tượng theo bất kỳ tiêu chuẩn lâm sàng nào.
Một phân tích tổng hợp toàn diện bao gồm 15 nghiên cứu tập trung đặc biệt vào EGC cho thấy các hệ thống AI đạt diện tích dưới đường cong (AUC) tổng hợp là 0,94, với độ nhạy 87% và độ đặc hiệu 88%.
Các hệ thống AI riêng lẻ đã báo cáo độ chính xác chẩn đoán vượt 90%, nhiều hệ thống thể hiện hiệu suất tương đương hoặc vượt trội so với các bác sĩ nội soi giàu kinh nghiệm.
Những con số này không chỉ là cải thiện nhỏ mà là những nâng cao có tiềm năng biến đổi khả năng chẩn đoán hiện tại đặc biệt khi xem xét tỷ lệ bỏ sót cơ bản trong thực hành thông thường.
Phổ cập chuyên môn y khoa
Ý nghĩa sâu sắc nhất của tích hợp AI trong nội soi ung thư dạ dày không chỉ nằm ở việc đạt được các chỉ số hiệu suất vượt trội con người mà còn ở khả năng của công nghệ này trong việc phổ cập chuyên môn y khoa trên các bối cảnh chăm sóc sức khỏe khác biệt.
Chăm sóc sức khỏe toàn cầu đối mặt với thách thức dai dẳng khi sự chênh lệch chất lượng đáng kể trong thực hành tầm soát giữa các trung tâm y tế tiên tiến và bệnh viện cộng đồng.
Bên cạnh đó còn là sự khác biệt giữa các chuyên gia giàu kinh nghiệm và những bác sĩ ít kinh nghiệm hơn.
Khoảng cách chuyên môn chuyển hóa trực tiếp thành kết quả điều trị cho bệnh nhân.
Những người ở các cơ sở y tế hạn chế nguồn lực hoặc được chăm sóc bởi các bác sĩ nội soi ít kinh nghiệm phải đối mặt với rủi ro bỏ sót chẩn đoán cao hơn đáng kể.
Một đánh giá tổng quan xem xét nhiều nghiên cứu về nội soi có sự hỗ trợ AI đã tiết lộ một phát hiện đặc biệt quan trọng.
Với sự hỗ trợ của hệ thống AI, các bác sĩ nội soi không phải chuyên gia đạt được hiệu suất chẩn đoán tương đương với các chuyên gia làm việc mà không có sự hỗ trợ AI.
Hiệu ứng cân bằng này đại diện cho sự thay đổi mô hình trong cách chúng ta khái niệm hóa chuyên môn y khoa và sự phân bố của nó.
Thay vì xem AI như một công cụ độc quyền để nâng cao hiệu suất, chúng ta phải nhận ra tiềm năng của nó để nâng cao tiêu chuẩn chẩn đoán cơ bản một cách toàn diện.
Hệ thống AI hoạt động như một người cố vấn ảo hoặc ý kiến thứ hai khách quan, cung cấp hướng dẫn nhất quán, độc lập với mức độ kinh nghiệm.
Do đó giúp giảm sự phụ thuộc vào nhiều năm tích lũy nhận diện mô hình mà truyền thống phân biệt bác sĩ chuyên gia với người mới.
Ví dụ: Hệ thống AI giống như một “chuyên gia ảo” luôn sẵn sàng. Ví dụ, tại một bệnh viện tỉnh ở Đồng bằng Sông Cửu Long, bác sĩ trẻ mới tốt nghiệp 2 năm, khi sử dụng AI hỗ trợ, có thể đạt độ chính xác chẩn đoán 88%—tương đương với bác sĩ có 15 năm kinh nghiệm không dùng AI (đạt 87%).
Mô hình ENDOANGEL-MM là ví dụ điển hình cho cách tiếp cận tinh vi mà các hệ thống AI đương đại áp dụng đối với ra quyết định lâm sàng.
Nhận thấy rằng các bác sĩ nội soi chuyên gia thường xuyên chuyển đổi giữa các phương thức hình ảnh trong quá trình chẩn đoán, hệ thống đa phương thức này được thiết kế đặc biệt để phản ánh quy trình làm việc chuyên nghiệp đó.
Mô hình được đào tạo trên các hình ảnh ghép cặp của các tổn thương giống nhau được chụp dưới cả Nội Soi Ánh Sáng Trắng (WLE) và Hình Ảnh Băng Hẹp Lấy Nét Gần (NBI).
Vì vậy tạo điều kiện cho nó tổng hợp thông tin qua các kỹ thuật trực quan hóa bổ sung giống như các chuyên gia con người.
Kết quả đã xác nhận cách tiếp cận mô phỏng sinh học này:
- Mô hình đa phương thức đạt độ chính xác chẩn đoán 90,00%, với độ nhạy 95,65%.
- Độ đặc hiệu 88,31% là hiệu suất vượt trội so với các mô hình được đào tạo chỉ trên một phương thức hình ảnh.
Thành tựu này chứng minh rằng AI có thể học không chỉ để thực hiện các nhiệm vụ riêng lẻ mà còn để tiếp thu các quy trình lý luận chẩn đoán phức tạp, nhiều bước xác định thực hành lâm sàng cấp độ chuyên gia.
Chẩn đoán và phân loại mô bệnh học
Phân Tích WSI tự động và phân giai đoạn N
Kiểm tra vi thể các tiêu bản mô là một trong những nhiệm vụ nhận thức đòi hỏi khắt khe nhất trong giải phẫu bệnh.
Các bác sĩ giải phẫu bệnh phải quét có hệ thống toàn bộ mẫu bệnh phẩm thường chứa hàng triệu tế bào trải dài trên nhiều lát cắt mô để tìm kiếm những bất thường hình thái tinh vi mà có thể chỉ chiếm một phần rất nhỏ của tiêu bản.
Quy trình này vốn dĩ tốn thời gian và gây kiệt sức về mặt nhận thức, đặc biệt khi đánh giá các hạch bạch huyết để phát hiện vi di căn trong mẫu bệnh phẩm ung thư dạ dày.
Trí tuệ nhân tạo giải quyết những hạn chế này thông qua các kiến trúc mạng nơ-ron tích chập (CNN) được thiết kế đặc biệt cho các tác vụ nhận dạng hình ảnh.
Các mô hình như ResNet (Mạng Residual), Xception và DenseNet đã chứng minh khả năng xuất sắc để phân tích hình ảnh toàn bộ tiêu bản số hóa (WSI).
Các mạng này sử dụng thuật toán nhận dạng mẫu tinh vi có khả năng đánh giá có hệ thống toàn bộ các lát cắt mô với sự chú ý nhất quán đến từng chi tiết.
Chúng không bị ảnh hưởng bởi các yếu tố mệt mỏi thường làm giảm hiệu suất của con người trong các phiên làm việc kính hiển vi kéo dài.
Ý nghĩa lâm sàng của tự động hóa trở nên rõ ràng đặc biệt trong phát hiện di căn hạch bạch huyết (LNM).
Đây là thành phần “N” trong hệ thống phân giai đoạn TNM, có ảnh hưởng cơ bản đến chiến lược điều trị và dự đoán sống sót.
Các nghiên cứu gần đây sử dụng kiến trúc ResNet đã đạt được các chỉ số hiệu suất tiệm cận mức hoàn hảo về mặt lý thuyết.
Các nghiên cứu báo cáo giá trị diện tích dưới đường cong đặc tính hoạt động của máy thu (AUROC) đạt 0,9994 và độ chính xác chẩn đoán vượt 96,9% trong việc xác định LNM.
Ví dụ: Tại Bệnh viện ung thư, hệ thống AI phân tích WSI đã được triển khai thử nghiệm từ năm 2023. Trong một nghiên cứu hồi cứu trên 500 ca bệnh ung thư dạ dày, hệ thống AI đã phát hiện thêm 23 trường hợp vi di căn (4,6%) mà trước đó bị bỏ sót trong đánh giá thủ công ban đầu.
Vì vậy đã dẫn đến thay đổi phương án điều trị cho những bệnh nhân này, từ chỉ phẫu thuật sang phối hợp hóa trị bổ trợ.
Hơn nữa, các hệ thống AI rất giỏi phát hiện vi di căn.
Đó là các cụm tế bào khối u đơn lẻ có kích thước dưới 2mm, đại diện cho một danh mục tiên lượng trung gian giữa bệnh không có di căn hạch và bệnh di căn đại thể.
Chúng dễ dàng bị bỏ sót trong quá trình sàng lọc thủ công với áp lực thời gian, nhưng có thể được xác định một cách có hệ thống bởi các thuật toán AI trên mọi vùng mô.
Khả năng này giải quyết một điểm yếu nghiêm trọng trong giải phẫu bệnh truyền thống.
Đó là nơi áp lực xử lý khối lượng ca lớn có thể dẫn đến sai sót lấy mẫu hoặc kiểm tra không đầy đủ tất cả các hạch bạch huyết đã gửi.
Từ chẩn đoán định tính đến tiên lượng định lượng
Mặc dù tự động hóa các nhiệm vụ chẩn đoán hiện có đại diện cho sự tiến bộ đáng kể, đóng góp sâu sắc nhất của AI đối với giải phẫu bệnh ung thư dạ dày vượt xa mục tiêu tăng hiệu quả hoặc giảm lỗi.
Công nghệ này đang thúc đẩy một sự chuyển dịch mô hình cơ bản.
Đó là chuyển giải phẫu bệnh từ một ngành chủ yếu định tính đưa ra các chẩn đoán phân loại nhị phân sang một khoa học định lượng có khả năng trích xuất các biến số tiên lượng liên tục từ các đặc điểm hình thái.
Thực hành giải phẫu bệnh thông thường tạo ra các phân loại theo danh mục: một hạch bạch huyết hoặc là có bệnh di căn hoặc là không có một khối u thể hiện hình thái kiểu ruột hoặc kiểu lan tỏa.
Mặc dù có giá trị lâm sàng, các đánh giá định tính cung cấp độ chi tiết hạn chế để phân tầng nguy cơ trong các danh mục chẩn đoán.
Phân tích hình ảnh dựa trên AI vượt qua những hạn chế trên khi định lượng các thuộc tính hình thái tương quan với hành vi sinh học nhưng vẫn không thực tế để đo lường thủ công.
Một nghiên cứu mang tính bước ngoặt của Wang và cộng sự minh họa tiềm năng chuyển đổi này.
Thay vì chỉ đơn giản sao chép nhiệm vụ phát hiện LNM nhị phân, nhóm nghiên cứu của họ đã phát triển một hệ thống AI thực hiện phân tích hình thái phức tạp trên các hạch bạch huyết di căn.
Thuật toán định lượng một chỉ số mới: Tỷ Lệ Diện Tích Khối U Trên Hạch Bạch Huyết Di Căn (T/MLN).
Về cơ bản là đo gánh nặng khối u tỷ lệ trong các hạch bị ảnh hưởng bằng cách tính tỷ lệ diện tích mô khối u trên tổng diện tích hạch bạch huyết.
Đây là một dấu ấn sinh học được AI tạo ra, rút ra thông tin tiên lượng định lượng từ các lát cắt nhuộm H&E tiêu chuẩn mà đo lường thủ công sẽ tốn quá nhiều công sức.
Trong phân tầng nguy cơ nến có hai bệnh nhân ung thư dạ dày, cả hai đều được phân loại là giai đoạn N2 (3-6 hạch dương tính) theo phân loại TNM thông thường.
- Bệnh nhân A: T/MLN trung bình = 0,15 (khối u chỉ chiếm 15% diện tích hạch)
- Bệnh nhân B: T/MLN trung bình = 0,65 (khối u chiếm 65% diện tích hạch)
Mặc dù cùng giai đoạn N2, bệnh nhân B có tiên lượng xấu hơn đáng kể và có thể cần phác đồ hóa trị tích cực hơn hoặc theo dõi chặt chẽ hơn sau phẫu thuật.
Hơn nữa, thông qua xác thực thống kê nghiêm ngặt bao gồm phân tích hồi quy Cox đa biến, các nhà nghiên cứu đã chứng minh rằng T/MLN hoạt động như một yếu tố tiên lượng độc lập đối với sự sống sót của bệnh nhân.
Đó là duy trì giá trị dự đoán của nó ngay cả khi được điều chỉnh theo các biến số lâm sàng-bệnh lý thông thường.
Phát hiện này mang ý nghĩa sâu sắc vì AI không chỉ đơn thuần tự động hóa quy trình làm việc của bác sĩ giải phẫu bệnh mà nó đang trích xuất các dấu ấn sinh học hình thái trước đây không thể tiếp cận từ các chế phẩm mô thường quy.
AI thực sự “nhìn thấy” thông tin tiên lượng trong các tiêu bản tiêu chuẩn vốn luôn hiện diện nhưng vẫn vô hình về mặt định lượng đối với quan sát của con người.
Sự tiến hóa từ nhận dạng mẫu mô tả sang khám phá dấu ấn sinh học định lượng có lẽ đại diện cho ứng dụng mang tính cách mạng nhất của AI trong giải phẫu bệnh chẩn đoán.
Do đó hứa hẹn nâng cao phân tầng nguy cơ và cá nhân hóa các phương pháp điều trị dựa trên sinh học khối u được tiết lộ thông qua phân tích tính toán các chế phẩm mô học thông thường.
Ví dụ: Các trung tâm y tế lớn đang hợp tác với các công ty công nghệ để phát triển các hệ thống AI phân tích WSI phù hợp với đặc điểm dân số địa phương.
Mục tiêu là tạo ra cơ sở dữ liệu hình ảnh bệnh học ung thư dạ dày địa phương, từ đó huấn luyện các mô hình AI có độ chính xác cao hơn cho bệnh nhân.
Cá nhân hóa điều trị
Tự động hóa chấm điểm nhuộm miễn dịch hóa học (IHC)
Nhuộm miễn dịch hóa học vẫn là phương pháp nền tảng để đánh giá các dấu ấn sinh học tiên lượng trong ung thư dạ dày.
Tuy nhiên nó gặp phải một điểm yếu cốt lõi đã ám ảnh ngành giải phẫu bệnh trong nhiều thập kỷ là tính chủ quan trong diễn giải.
Chấm điểm các xét nghiệm IHC đặc biệt đối với các dấu ấn sinh học quan trọng như HER2 (Thụ thể Yếu tố Tăng trưởng Biểu bì người 2) và PD-L1 (Phối tử Chết Tế bào Đã được Lập trình 1) đòi hỏi đánh giá bằng mắt các mẫu biểu hiện protein.
Vì vậy kết quả có thể khác biệt đáng kể giữa các người quan sát.
Sự biến động này không chỉ là vấn đề học thuật mà nó ảnh hưởng trực tiếp đến chăm sóc bệnh nhân khi tạo ra sự không nhất quán trong xác định bệnh nhân nào đủ điều kiện nhận các liệu pháp nhắm mục tiêu cứu sống như trastuzumab cho khối u HER2 dương tính hoặc liệu pháp miễn dịch như pembrolizumab cho ung thư biểu hiện PD-L1.
Bản chất của thách thức này trở nên rõ ràng khi xem xét độ phức tạp của chấm điểm HER2.
Đây là phương pháp đòi hỏi các bác sĩ giải phẫu bệnh phải đánh giá cường độ nhuộm màng tế bào và mức độ hoàn chỉnh trên các tế bào khối u, phân loại kết quả thành các điểm số rời rạc (0, 1+, 2+, 3+) quyết định tính đủ điều kiện điều trị.
Tương tự, chấm điểm PD-L1 đòi hỏi đánh giá định lượng cả tế bào khối u và tế bào miễn dịch biểu hiện protein, được tính dưới dạng điểm dương tính kết hợp (CPS).
Nó đóng vai trò người gác cổng cho tiếp cận liệu pháp miễn dịch đắt tiền.
Các bác sĩ giải phẫu bệnh khác nhau khi xem xét các tiêu bản giống hệt nhau có thể đưa ra kết luận khác nhau.
Họ chịu ảnh hưởng từ đào tạo cá nhân, kinh nghiệm, và thậm chí cả chất lượng kính hiển vi hoặc màn hình của họ.
Vì thế tạo ra bất công trong chăm sóc bệnh nhân và gây ra sự không chắc chắn trong ra quyết định lâm sàng.
Các hệ thống giải phẫu bệnh số hóa được hỗ trợ bởi AI giải quyết khủng hoảng chủ quan này thông qua phân tích khách quan, định lượng các phần mô được số hóa.
Các mô hình học sâu được huấn luyện trên hàng nghìn hình ảnh IHC có chú thích có thể nhận diện và định lượng biểu hiện dấu ấn sinh học với độ nhất quán và chính xác đáng kinh ngạc.
Ví dụ: Đối với chấm điểm HER2 cụ thể, các nhà nghiên cứu đã phát triển mô hình học sâu dựa trên kiến trúc RepVGG đạt độ chính xác 94,0% trong các tác vụ phân loại, thể hiện hiệu suất tương đương hoặc vượt qua các bác sĩ giải phẫu bệnh chuyên gia.
Mô hình này phân tích các mẫu nhuộm màng từng pixel, áp dụng tiêu chí nhất quán cho mọi trường hợp mà không bị mệt mỏi hay thiên kiến nhận thức.
Ví dụ: Đối với đánh giá PD-L1, thuật toán phân tích hình ảnh Aperio đã được triển khai để tính điểm dương tính kết hợp, cho thấy độ tương đồng 84,6% với điểm số của bác sĩ giải phẫu bệnh.
Mặc dù kết quả này đại diện cho giải phẫu bệnh tính toán thế hệ cũ hơn là học sâu tiên tiến nhưng xác thực lâm sàng của nó đáng chú ý.
Thuật toán thể hiện hiệu suất tương đương trong dự đoán đáp ứng của bệnh nhân với pembrolizumab so với chấm điểm thủ công từ các bác sĩ giải phẫu bệnh.
Do đó thiết lập bằng chứng khái niệm rằng chấm điểm tự động có thể hướng dẫn quyết định điều trị một cách đáng tin cậy.
Vì thế mở đường cho các thuật toán học sâu thế hệ tiếp theo tiêu chuẩn hóa hoàn toàn quy trình chẩn đoán quan trọng này.
Lợi ích thực tế vượt xa tính nhất quán vì hệ thống AI có thể xử lý các tiêu bản nhanh hơn bác sĩ giải phẫu bệnh, cung cấp các chỉ số định lượng giúp phân tầng rủi ro tinh vi hơn.
Từ đó giải phóng các bác sĩ giải phẫu bệnh để tập trung vào các thách thức chẩn đoán phức tạp thực sự đòi hỏi chuyên môn con người.
Dự đoán phân tử từ hình ảnh H&E
Có lẽ ứng dụng mang tính biến đổi nhất của AI trong giải phẫu bệnh ung thư dạ dày thể hiện sự tái định nghĩa cơ bản về quy trình chẩn đoán.
Đó là khả năng dự đoán đặc điểm phân tử trực tiếp từ các tiêu bản nhuộm hematoxylin và eosin (H&E) tiêu chuẩn với chi phí thấp.
Khả năng này giải quyết một điểm nghẽn quan trọng trong y học ung thư chính xác là các rào cản về chi phí, thời gian và khả năng tiếp cận liên quan đến xét nghiệm phân tử chuyên biệt.
Lập hồ sơ phân tử toàn diện thông qua giải trình tự thế hệ tiếp theo, lai tại chỗ huỳnh quang (FISH) hoặc các bộ nhuộm miễn dịch hóa học có thể tốn hàng nghìn đô la cho mỗi bệnh nhân.
Ngoài ra còn đòi hỏi hàng tuần mới có kết quả và vẫn không có sẵn ở nhiều cơ sở y tế, đặc biệt ở các quốc gia hạn chế tài nguyên nơi gánh nặng ung thư dạ dày cao nhất.
Nền tảng khoa học của xét nghiệm phân tử ảo dựa trên một hiện tượng sinh học đáng chú ý.
Các biến đổi phân tử thúc đẩy sinh bệnh học ung thư tạo ra những thay đổi hình thái tinh tế trong kiến trúc khối u, tổ chức tế bào và vi môi trường mô.
Các đột biến gen riêng lẻ, mẫu bất ổn gene và nhiễm virus ảnh hưởng đến tốc độ tăng sinh tế bào, trạng thái biệt hóa, mẫu thâm nhiễm miễn dịch và kiến trúc mô đệm theo những cách tổng thể tạo ra các dấu hiệu mô học đặc trưng.
Những kết quả hình thái học tồn tại dưới ngưỡng nhận thức thị giác của con người do quá tinh tế, quá phức tạp và quá đa chiều để các bác sĩ giải phẫu bệnh phát hiện một cách nhất quán thông qua khám hiển vi.
Tuy nhiên, các mô hình học sâu được huấn luyện trên hàng nghìn hình ảnh H&E được ghép đôi với kết quả xét nghiệm phân tử có thể học cách nhận ra các mẫu không thể nhận thấy này.
Vì vậy thực sự tạo ra “Xét nghiệm Phân tử Ảo” từ một chế phẩm mô học chi phí thấp.
Triển khai kỹ thuật liên quan đến huấn luyện mạng nơ-ron tích chập trên hình ảnh toàn tiêu bản được chia thành hàng nghìn ô nhỏ hơn với nhãn chân lý cơ bản từ xét nghiệm phân tử thông thường.
Các mô hình này học các biểu diễn đặc trưng phân cấp từ các mẫu kết cấu cơ bản đến các mối quan hệ không gian phức tạp có tương quan với trạng thái phân tử.
Sau khi được huấn luyện, các mô hình có thể phân tích các tiêu bản H&E mới và dự đoán đặc điểm phân tử mà không cần xét nghiệm chuyên biệt nào.
Về cơ bản suy ra kiểu gen từ kiểu hình thông qua phân tích tính toán về hình thái học.
Đối với dự đoán Bất ổn Vi vệ tinh (MSI), các mô hình AI đã được phát triển để nhận diện khối u MSI-High trực tiếp từ hình ảnh H&E, đạt giá trị Diện tích Dưới Đường cong Đặc tính Hoạt động Thụ thể (AUROC) từ 0,77 đến 0,84.
Trạng thái MSI-High đóng vai trò dấu ấn sinh học tiên lượng mạnh mẽ cho đáp ứng thuận lợi với thuốc ức chế điểm kiểm soát miễn dịch (ICI).
Hơn nữa nhận diện sớm thông qua phân tích H&E hỗ trợ AI có thể sàng lọc nhanh bệnh nhân đủ điều kiện liệu pháp miễn dịch mà không cần chờ đợi xét nghiệm MSI dựa trên PCR hoặc nhuộm miễn dịch hóa học đắt tiền.
Ví dụ: Tại các bệnh viện lớn triển khai hệ thống AI dự đoán MSI từ tiêu bản H&E có thể giảm thời gian chờ kết quả từ 2-3 tuần xuống còn vài giờ, giúp bác sĩ nhanh chóng xác định bệnh nhân phù hợp với liệu pháp miễn dịch.
Đối với dự đoán trạng thái Virus Epstein-Barr (EBV), kết quả còn ấn tượng hơn.
Ung thư dạ dày liên quan EBV đại diện cho một phân nhóm phân tử riêng biệt với ý nghĩa điều trị và tiên lượng riêng biệt.
Một mô hình AI được huấn luyện để dự đoán trạng thái EBV từ các tiêu bản H&E đạt giá trị AUROC ngoại lệ từ 0,945 đến 0,969, thể hiện độ chính xác gần như chẩn đoán.
Hiệu suất này tiếp cận độ tin cậy của xét nghiệm lai tại chỗ, tiêu chuẩn vàng cho phát hiện EBV.
Tuy nhiên nó chỉ yêu cầu tiêu bản H&E thông thường mà mọi bệnh nhân nhận được như một phần của chẩn đoán tiêu chuẩn.
Ngoài các dấu hiệu phân tử cụ thể, hệ thống AI có thể phân tích vi môi trường khối u (TME) hiển thị trong các phần H&E để dự đoán tiềm năng đáp ứng miễn dịch.
Các mô hình này đánh giá phân bố không gian, mật độ và mẫu tổ chức của Tế bào Lympho Thâm nhiễm Khối u (TIL) trong toàn bộ mô khối u.
Do đó tạo ra các chỉ số định lượng có tương quan với đáp ứng với thuốc ức chế điểm kiểm soát miễn dịch.
TME đại diện cho một hệ sinh thái phức tạp của các tương tác giữa tế bào ung thư, tế bào miễn dịch, tế bào mô đệm và các thành phần ma trận ngoại bào.
Do đó khả năng của AI trong định lượng các mối quan hệ này từ mô học thông thường mở ra những chiều hướng mới cho cá nhân hóa điều trị.
Tác động lâm sàng của xét nghiệm phân tử ảo vượt xa tiết kiệm chi phí.
Khả năng hỗ trợ “sàng lọc hiệu quả về chi phí” cho các liệu pháp đắt tiền, AI đảm bảo các nguồn lực lập hồ sơ phân tử có thể được hướng dẫn hiệu quả nhất.
Các trường hợp rủi ro cao được AI dự đoán để ưu tiên năng lực xét nghiệm hạn chế, hoặc triển khai xét nghiệm ảo ở các cơ sở hạn chế tài nguyên nơi không tồn tại phòng xét nghiệm phân tử toàn diện.
Hơn nữa, sự sẵn có ngay lập tức của dự đoán AI từ các tiêu bản H&E chẩn đoán có thể đẩy nhanh quyết định điều trị, có khả năng bắt đầu liệu pháp sớm hơn vài ngày hoặc vài tuần so với việc chờ kết quả xét nghiệm phân tử chuyên biệt.
Lợi thế về thời gian rất quan trọng đối với các bệnh ung thư tích cực, nơi sự chậm trễ điều trị ảnh hưởng trực tiếp đến kết quả.
Quan trọng nhất, xét nghiệm phân tử ảo đưa khả năng tiếp cận y học chính xác rộng rải hơn.
Do đó đảm bảo bệnh nhân phù hợp nhận được liệu pháp điều trị phù hợp vào đúng thời điểm bất kể vị trí địa lý hay nguồn lực hệ thống y tế.
Ví dụ: Ở các tỉnh miền núi nơi không có phòng xét nghiệm phân tử chuyên sâu, bệnh nhân ung thư dạ dày có thể được hưởng lợi từ công nghệ AI để dự đoán trạng thái EBV hay MSI chỉ từ tiêu bản H&E thông thường.
Vì vạy giúp bác sĩ địa phương đưa ra quyết định điều trị chính xác mà không cần chuyển bệnh nhân về thành phố lớn.
Tiên lượng và phân tầng nguy cơ
Mô hình MultiDeepCox-SC
Hệ thống phân giai đoạn TNM (Tumor-Node-Metastasis – Khối u-Hạch-Di căn) từ lâu đã được công nhận là tiêu chuẩn vàng toàn cầu để tiên lượng ung thư.
Tuy nhiên, hệ thống tập trung vào yếu tố giải phẫu này ngày càng nhận nhiều chỉ trích vì cách tiếp cận quá đơn giản hóa.
Hệ thống phân loại bệnh nhân chủ yếu dựa trên các đặc điểm giải phẫu đại thể như kích thước khối u, mức độ xâm lấn hạch và di căn xa mà không phản ánh được sự đa dạng sinh học vốn quyết định diễn biến bệnh.
Hạn chế này dẫn đến những bệnh nhân có đặc tính sinh học khối u và tiến trình lâm sàng hoàn toàn khác biệt lại bị xếp chung vào một giai đoạn.
Vì vậy tạo ra mô hình tiên lượng “áp đặt chung” không phản ánh đúng bản chất phức tạp của căn bệnh.
Trí tuệ nhân tạo giải quyết vấn đề cốt lõi này thông qua khả năng “tinh chỉnh phân tầng nguy cơ vượt xa hệ thống TNM truyền thống.”
Thay vì thay thế hoàn toàn khung TNM đã được khẳng định, AI tăng cường và bổ sung nó thông qua tích hợp các tầng thông tin sinh học sâu hơn mà các phương pháp phân giai đoạn thông thường không thể tiếp cận.
Cách tiếp cận tăng cường này đại diện cho bước tiến hóa chiến lược trong y học tiên lượng.
Do đó bảo tồn kiến thức chuyên môn được tích lũy trong hệ thống TNM đồng thời vượt qua những giới hạn vốn có của nó.
Mô hình MultiDeepCox-SC minh chứng cho mô hình tích hợp đa phương thức này trong tiên lượng ung thư dạ dày.
Phương pháp đa phương thức đại diện cho xu hướng tương lai của y học ung thư chính xác khi tạo ra điểm số nguy cơ thống nhất bằng cách tổng hợp ba luồng dữ liệu khác biệt.
Mô hình kết hợp dữ liệu pathomics (ảnh bệnh lý học) từ các tiêu bản mô nhuộm H&E, trong đó các thuật toán học sâu trích xuất các đặc điểm hình thái học định lượng mà mắt thường của bác sĩ giải phẫu bệnh không thể nhận biết.
Ví dụ: Tại Bệnh viện ung thư, khi phân tích một tiêu bản mô ung thư dạ dày, bác sĩ giải phẫu bệnh có thể nhận diện được hình thái tế bào ác tính, nhưng AI có thể phát hiện thêm hàng trăm đặc điểm vi mô như mật độ phân bố nhân tế bào, mức độ không đồng nhất của nhiễm sắc và các mô hình không gian phức tạp giữa các tế bào u và mô đệm xung quanh.
Thứ hai, mô hình tích hợp các thông số lâm sàng bao gồm thông tin nhân khẩu học của bệnh nhân (tuổi, giới tính) và phân loại giai đoạn TNM truyền thống nên đảm bảo các yếu tố tiên lượng đã được công nhận vẫn được đưa vào.
Thứ ba, mô hình xử lý dữ liệu gen học bao gồm các hồ sơ biểu hiện gen thường được lấy từ các cơ sở dữ liệu toàn diện như The Cancer Genome Atlas (TCGA), nắm bắt dấu ấn phân tử của từng khối u.
Sự tích hợp ba luồng dữ liệu này giúp mô hình đạt được hiệu suất tiên lượng vượt trội, với chỉ số tương hợp (C-index) là 0.744.
Đây là một chỉ số cho thấy độ chính xác cải thiện đáng kể trong khả năng dự đoán kết quả sống sót của bệnh nhân so với chỉ sử dụng hệ thống phân giai đoạn TNM.
Hơn nữa, khung MultiDeepCox-SC cung cấp bằng chứng thực nghiệm thuyết phục nhất cho đến nay chứng minh hệ thống phân giai đoạn chỉ dựa trên giải phẫu không đủ để nắm bắt sự đa dạng thực sự trong tiên lượng ung thư dạ dày.
Hiển thị hạn chế của hệ thống TNM
Phát hiện quan trọng nhất từ nghiên cứu AI đa phương thức nằm ở chứng minh sự không đồng nhất sâu sắc về tiên lượng trong các nhóm phân giai đoạn TNM.
Phát hiện then chốt nêu rõ: “phân tích phân nhóm cho thấy sự khác biệt đáng kể về Thời gian Sống sót Tổng thể (OS) giữa nhóm điểm số nguy cơ cao và nguy cơ thấp ngay cả trong số các bệnh nhân ung thư dạ dày ở cùng một giai đoạn.
Quan sát này thách thức căn bản giả định rằng chỉ giai đoạn TNM là đủ để dự đoán kết quả lâm sàng.
Về mặt thực tiễn, phát hiện này có nghĩa rằng trong một nhóm bệnh nhân được phân loại đồng nhất là như Giai đoạn IIB.
Khi đó các mô hình AI có thể phân biệt đáng tin cậy những cá nhân có khối u xâm lấn về mặt sinh học với tiên lượng kém (nhóm nguy cơ cao) khỏi những người có quá trình diễn biến bệnh ít hung hãn hơn (nhóm nguy cơ thấp).
Điểm số nguy cơ do AI tạo ra đã được xác thực là yếu tố tiên lượng độc lập vượt trội hơn giai đoạn TNM về sức mạnh dự đoán.
Đây là sự chuyển đổi căn bản từ phân tầng nguy cơ dựa trên giải phẫu sang phân tầng dựa trên sinh học.
Ý nghĩa lâm sàng của khả năng này mang tính cách mạng.
Trong nhiều thập kỷ, các bác sĩ ung thư đã vật lộn với quyết định điều trị cho bệnh nhân giai đoạn trung gian, đặc biệt là những người được phân loại là Giai đoạn II hoặc IIIA, nơi lợi ích của hóa trị liệu bổ trợ vẫn chưa rõ ràng.
Điểm số nguy cơ AI cung cấp hướng dẫn khách quan, dựa trên dữ liệu cho các quyết định này.
Ví dụ: Một bệnh nhân được phân loại là “Giai đoạn II” theo tiêu chí thông thường nhưng được xác định là “nguy cơ cao” theo mô hình AI sẽ cần các phác đồ điều trị bổ trợ mạnh hơn, bao gồm phác đồ hóa trị tăng cường hoặc tham gia thử nghiệm lâm sàng các liệu pháp mới.
Ngược lại, một bệnh nhân Giai đoạn II với điểm số nguy cơ thấp từ AI có thể an toàn tránh được độc tính không cần thiết từ hóa trị liệu, chỉ cần theo dõi hoặc điều trị ít cường độ hơn.
Ví dụ: Tại Bệnh viện Ung bướu, một nam bệnh nhân 58 tuổi được chẩn đoán ung thư dạ dày Giai đoạn IIA. Theo phác đồ chuẩn, bệnh nhân có thể nhận hóa trị bổ trợ hoặc chỉ theo dõi.
Nếu áp dụng mô hình AI và phát hiện điểm nguy cơ cao (do biểu hiện gen xấu và đặc điểm vi mô hung hãn), bệnh nhân sẽ được chỉ định hóa trị bổ trợ tích cực.
Ngược lại, nếu điểm nguy cơ thấp, bệnh nhân có thể tránh được 6 tháng hóa trị với các tác dụng phụ như buồn nôn, rụng tóc, và suy giảm miễn dịch.
Hơn nữa, cách tiếp cận này tạo điều kiện cho y học cá nhân hóa thực sự trong quản lý ung thư dạ dày.
Thay vì áp dụng phác đồ điều trị thống nhất cho tất cả bệnh nhân trong cùng một giai đoạn TNM, các bác sĩ lâm sàng có thể điều chỉnh cường độ điều trị theo hồ sơ nguy cơ sinh học cá nhân.
Phân tầng chính xác này có tiềm năng cải thiện cả kết quả ung thư học để đảm bảo bệnh nhân nguy cơ cao nhận đủ điều trị và chất lượng cuộc sống.
Từ đó tránh gánh nặng điều trị không cần thiết cho bệnh nhân nguy cơ thấp.
Sự tích hợp pathomics, thông số lâm sàng và dấu ấn gen học tạo ra bức tranh sinh học toàn diện về bệnh của từng bệnh nhân.
Nó vượt xa độ phân giải của hệ thống phân giai đoạn chỉ dựa trên giải phẫu.
Khai thác dữ liệu đa Omics
Phát hiện quy luật ẩn trong cơ sở dữ liệu sinh học
Sự xuất hiện của các kho dữ liệu công cộng toàn diện như The Cancer Genome Atlas (TCGA) và Gene Expression Omnibus (GEO) đã mở ra cơ hội chưa từng có cho nghiên cứu ung thư dạ dày.
Các cơ sở dữ liệu này chứa khối lượng thông tin đa omics khổng lồ bao gồm dữ liệu di truyền học (genomics) và phiên mã học (transcriptomics) cùng với hồ sơ lâm sàng từ hàng nghìn bệnh nhân.
Từ đó tạo nên một kho dữ liệu khổng lồ về độ phức tạp sinh học.
Tuy nhiên, khối lượng và số chiều của dữ liệu này tạo ra thách thức đáng kể.
Các phương pháp thống kê truyền thống gặp khó khăn để xác định các quy luật có ý nghĩa giữa hàng chục nghìn biến số được đo lường trên nhiều nhóm bệnh nhân khác nhau.
Công nghệ AI và ML đã trở thành công cụ không thể thiếu để điều hướng trong sự phức tạp này.
Các thuật toán tinh vi như LASSO (Toán tử Thu nhỏ và Lựa chọn Tuyệt đối Nhỏ nhất), SVM-RFE (Máy Vector Hỗ trợ với Loại bỏ Đặc trưng Đệ quy) và Random Forest hoạt động như những bộ lọc thông minh.
Chúng có khả năng sàng lọc có hệ thống qua hàng nghìn biến số để tìm ra những biến liên quan nhất đến cơ chế bệnh.
Các phương pháp tính toán xuất sắc để giảm chiều dữ liệu, biến đổi một đại dương điểm dữ liệu quá tải thành các tập hợp tín hiệu sinh học có ý nghĩa tập trung.
Sức mạnh của các phương pháp này không chỉ nằm ở khả năng xử lý khối lượng lớn dữ liệu, mà còn ở năng lực khám phá các mối quan hệ phi tuyến và tương tác mà các phương pháp phân tích thông thường không thể nhận ra.
Các ứng dụng thực tế của khai phá dữ liệu dựa trên AI này vừa đa dạng vừa có ý nghĩa lâm sàng quan trọng.
Các thuật toán này xác định các Gen Biểu hiện Khác biệt (DEGs), chỉ ra các “gen trung tâm” đóng vai trò cốt lõi trong sự phát triển và tiến triển của ung thư dạ dày.
Các gen trung tâm thường đại diện cho các nút điều hòa chính trong con đường ung thư.
Vì thế khiến chúng trở thành mục tiêu điều trị tiềm năng hoặc dấu ấn sinh học.
Phương pháp ML tạo điều kiện xây dựng các đặc trưng phân tử mới là những kết hợp cụ thể của gen hoặc protein có thể hoạt động như công cụ chẩn đoán hoặc chỉ số tiên lượng.
Các đặc trưng này chắt lọc thông tin sinh học phức tạp thành các chỉ số lâm sàng khả thi.
Từ đó chuyển hóa độ phức tạp phân tử thành giá trị sử dụng lâm sàng.
Ví dụ: Các nhà nghiên cứu đang áp dụng thuật toán Random Forest để phân tích dữ liệu gen từ 500 bệnh nhân ung thư dạ dày.
Họ đã xác định được 8 gen trung tâm liên quan đến khả năng đề kháng với hóa trị liệu dựa trên platinum.
Do đó giúp bác sĩ lựa chọn phác đồ điều trị phù hợp hơn cho từng bệnh nhân.
Chiến lược kết nối Omics và Pathomics
Sự đổi mới thực sự trong nghiên cứu ung thư dạ dày dựa trên AI không đến từ các ứng dụng học máy đơn lẻ.
Đó là tạo ra một vòng phản hồi tích hợp kết nối khám phá phân tử với dự đoán dựa trên bệnh lý học.
Chu trình chiến lược này bắt đầu từ khám phá omics và đạt đỉnh cao trong phát triển các công cụ lâm sàng thực tế có thể triển khai trong quy trình bệnh lý học thường quy.
Một ví dụ thuyết phục chứng minh giá trị lâm sàng cụ thể của phương pháp này.
Các nhà nghiên cứu đã sử dụng các bộ dữ liệu TCGA và GSE để xác định một bảng bốn mRNA có khả năng dự đoán chính xác nguy cơ di căn hạch bạch huyết (LNM) trước phẫu thuật.
Nó đạt diện tích dưới đường cong (AUC) là 0,838.
Ý nghĩa lâm sàng của kết quả này rất đáng kể vì thông qua áp dụng mô hình để nhận diện bệnh nhân có nguy cơ LNM thấp, các nhà khoa học ước tính rằng điều trị quá mức không cần thiết.
Khi đó các thủ thuật nạo vét hạch bạch huyết không cần thiết có thể giảm mạnh từ 84,5% xuống chỉ còn 14,4%.
Điều này không chỉ là cải thiện thống kê mà còn là sự giảm thiểu biến chứng phẫu thuật cho những bệnh nhân không hưởng lợi gì từ phẫu thuật hạch tích cực.
Hơn nữa, vòng phản hồi chiến lược hoạt động thông qua hai giai đoạn kết nối chặt chẽ.
Trong Bước 1 (Khám phá Omics), các nhà khoa học triển khai thuật toán ML trên dữ liệu TCGA để khám phá các phân nhóm phân tử mới và dấu ấn sinh học như trạng thái bất ổn định microsatellite (MSI), dương tính virus Epstein-Barr (EBV) hoặc bảng bốn mRNA được mô tả ở trên.
Những khám phá này đại diện cho những tiến bộ cơ bản trong hiểu biết về sinh học ung thư dạ dày.
Trong Bước 2 (Kết nối Pathomics), các nhà nghiên cứu tận dụng thực tế là TCGA cũng chứa hình ảnh slide toàn bộ (WSI) cho chính những bệnh nhân này.
Từ đó giúp họ huấn luyện các mô hình deep learning có thể dự đoán các dấu ấn sinh học phân tử được khám phá trong Bước 1 trực tiếp từ hình ảnh bệnh lý nhuộm H&E thường quy, tạo ra hiệu quả các “xét nghiệm phân tử ảo”.
Vòng phản hồi này thay đổi căn bản tính hữu dụng lâm sàng của các khám phá phân tử.
Thay vì cần xét nghiệm phân tử đắt đỏ và tốn thời gian cho mỗi bệnh nhân, các bác sĩ bệnh lý học có thể có được thông tin tiên lượng hoặc dự đoán tương tự từ slide bệnh lý tiêu chuẩn thông qua phân tích hình ảnh hỗ trợ bởi AI.
Hơn nữa, khai phá dữ liệu omics được mô tả trong phần này đóng vai trò nền tảng thiết yếu tạo điều kiện phát triển các công cụ Pathomics dự đoán được thảo luận ở nơi khác trong tài liệu.
Nếu không có xác định ban đầu các dấu ấn phân tử liên quan lâm sàng thông qua phân tích omics dựa trên AI, sẽ không có mục tiêu nào để các mô hình Pathomics dự đoán.
Ví dụ: Nhiều bệnh viện đang thử nghiệm hệ thống AI phân tích slide bệnh lý số hóa để dự đoán trạng thái MSI ở bệnh nhân ung thư dạ dày.
Thay vì phải gửi mẫu làm xét nghiệm phân tử tại nước ngoài với chi phí 15-20 triệu đồng và thời gian chờ 2-3 tuần, bệnh viện có thể đưa ra kết quả dự đoán trong vòng 24 giờ với độ chính xác 85%.
Do đó giúp bác sĩ đưa ra quyết định điều trị nhanh hơn và tiết kiệm chi phí đáng kể cho bệnh nhân.
Các hệ thống AI nổi tiếng
DAMO GRAPE (Tập đoàn Alibaba)
Vượt qua thách thức chụp CT không cản quang
Cốt lõi mang tính cách mạng của DAMO GRAPE nằm ở khả năng phân tích hình ảnh CT không cản quang để phát hiện ung thư dạ dày.
Đây là một thành tựu thách thức những quan điểm X quang truyền thống.
Theo thông lệ, các bác sĩ X quang thường đánh giá chụp CT không cản quang là không đủ độ tin cậy để chẩn đoán bệnh lý trong các cơ quan rỗng như dạ dày.
Khi không sử dụng thuốc cản quang, dạ dày có thể xẹp lại hoặc chứa thức ăn – thiếu độ tương phản cần thiết để phân biệt lớp niêm mạc mỏng (nơi ung thư giai đoạn sớm hình thành) với các cấu trúc giải phẫu xung quanh.
Hạn chế cơ bản này trong quá khứ đã khiến CT không cản quang chỉ được ứng dụng trong đánh giá chấn thương và khảo sát giải phẫu thay vì sàng lọc ung thư.
Nhóm nghiên cứu đối mặt với ba trở ngại kỹ thuật lớn từng khiến phương pháp chụp ảnh này trở nên không khả thi.
Thứ nhất, hình dạng dạ dày liên tục thay đổi dựa trên hoạt động nhu động và lượng thức ăn, tạo ra sự biến đổi đáng kể trong diện mạo hình ảnh.
Thứ hai, sự hiện diện của các hạt thức ăn và dịch tiêu hóa tạo ra nhiễu thị giác che khuất những thay đổi bệnh lý tinh vi.
Thứ ba, ung thư dạ dày giai đoạn sớm có các đặc điểm cực kỳ khó nhận biết, chỉ giới hạn ở lớp niêm mạc.
Vì thế khiến chúng gần như vô hình trên hình ảnh CT không cản quang thông thường.
Những thách thức này giải thích tại sao nội soi có sinh thiết vẫn là tiêu chuẩn vàng trong chẩn đoán bất chấp tính xâm lấn và khả năng tiếp cận hạn chế.
Giải pháp của nhóm DAMO là xây dựng cái mà họ mô tả là “cơ sở dữ liệu hình ảnh dạ dày không cản quang lớn nhất thế giới”, tích hợp dữ liệu từ hơn 70.000 bệnh nhân.
Bộ dữ liệu khổng lồ này cung cấp nền tảng huấn luyện cần thiết để AI học nhận dạng mẫu ở quy mô chưa từng có.
Một đổi mới kỹ thuật quan trọng là triển khai “ánh xạ hình ảnh CT có cản quang lên hình ảnh không cản quang” trong quá trình huấn luyện.
Cách tiếp cận này về cơ bản dạy AI nhận ra dấu hiệu mờ nhạt của tổn thương trên ảnh chụp không cản quang bằng cách thiết lập mối tương quan với các tổn thương rõ ràng hơn trên hình ảnh có cản quang.
Thông qua chiến lược học chuyển giao tinh vi, mô hình học được cách phát hiện các mẫu vẫn không thể nhận biết được đối với bác sĩ X quang khi chỉ xem riêng lẻ ảnh chụp không cản quang.
Kết quả xác thực lâm sàng chứng minh hiệu suất chẩn đoán vượt trội của DAMO GRAPE, đạt độ nhạy 85,1% và độ đặc hiệu 96,8%.
Khi so sánh trực tiếp với bác sĩ X quang phân tích cùng hình ảnh CT không cản quang, mô hình AI thể hiện sự vượt trội với độ nhạy cao hơn 21,8 điểm phần trăm và độ đặc hiệu cao hơn 14 điểm phần trăm so với chuyên gia.
Các chỉ số này đặc biệt ấn tượng khi xét đến độ khó vốn có của nhiệm vụ.
Đó là phát hiện những thay đổi niêm mạc tinh vi trên phương thức chụp ảnh không được thiết kế cho mục đích này.
Độ đặc hiệu cao của mô hình đặc biệt có giá trị trong bối cảnh sàng lọc, nơi quá nhiều kết quả dương tính giả sẽ làm quá tải hệ thống y tế với các thủ thuật theo dõi không cần thiết.
Ví dụ: Nếu triển khai hệ thống tương tự, các ca chụp CT bụng thông thường cho mục đích khảo sát gan mật có thể đồng thời được AI phân tích để tìm dấu hiệu ung thư dạ dày sớm.
Điều này đặc biệt có ý nghĩa khi Việt Nam nằm trong vùng có tỷ lệ ung thư dạ dày cao ở Đông Á, nhưng chương trình sàng lọc nội soi diện rộng vẫn chưa khả thi do nguồn lực hạn chế.
Chuyển đổi mô hình sàng lọc ung thư
Ý nghĩa thực sự của DAMO GRAPE vượt xa những thành tựu kỹ thuật để hướng tới khả năng chuyển đổi chiến lược sàng lọc ung thư ở quy mô dân số.
Mục đích của mô hình không phải thay thế nội soi mà tạo ra một mô hình sàng lọc sức khỏe cộng đồng hoàn toàn mới khi tận dụng cơ sở hạ tầng y tế hiện có.
Chụp CT không cản quang đã được thực hiện rộng rãi trong khám sức khỏe ngoại trú định kỳ cho nhiều mục đích khác nhau, bao gồm khảo sát ngực và bụng.
Những lần chụp này có ba lợi thế quan trọng: chi phí tương đối thấp, hoàn toàn không xâm lấn và đã được tiến hành trên hàng triệu bệnh nhân hàng năm vì lý do không liên quan đến sàng lọc ung thư dạ dày.
Khái niệm “sàng lọc cơ hội” đại diện cho ứng dụng mang tính chuyển đổi nhất của DAMO GRAPE.
Nhiều bệnh nhân, đặc biệt ở các vùng có nguy cơ cao, mang cái mà các nhà nghiên cứu mô tả là “tâm lý né tránh nội soi.
Đó là sự miễn cưỡng trải qua các thủ thuật sàng lọc xâm lấn ngăn cản họ tìm kiếm đánh giá cho đến khi các triệu chứng xuất hiện, thường cho thấy bệnh đã tiến triển.
DAMO GRAPE thực hiện phân tích tự động âm thầm trên mỗi ca chụp CT không cản quang được thực hiện cho bất kỳ chỉ định lâm sàng nào.
AI có thể đánh dấu những bệnh nhân không triệu chứng có nguy cơ cao mà ảnh chụp của họ chứa phát hiện nghi ngờ ở dạ dày.
Do đó tạo cơ hội sàng lọc từ các nghiên cứu hình ảnh được chỉ định cho mục đích hoàn toàn khác dù là đánh giá tim mạch, đánh giá chấn thương hay kiểm tra sức khỏe định kỳ.
Cách tiếp cận sàng lọc cơ hội này giải quyết thách thức cơ bản trong kiểm soát ung thư.
Đó là tiếp cận các quần thể có nguy cơ mà không bao giờ tự nguyện đến sàng lọc chuyên dụng.
Mô hình có thể xác định ung thư dạ dày tiềm ẩn ở những cá nhân hoàn toàn không có triệu chứng trong các cuộc kiểm tra sức khỏe họ đang trải qua.
Vì thế mở rộng đáng kể nhóm các ca phát hiện sớm và ý nghĩa đối với tỷ lệ sống sót rất sâu sắc.
Khi ung thư dạ dày được phát hiện ở giai đoạn muộn thì tỷ lệ sống sót sau 5 năm thấp hơn 30%.
Tuy nhiên, phát hiện giai đoạn sớm, khi ung thư vẫn còn giới hạn ở lớp niêm mạc, nâng tỷ lệ sống sót sau 5 năm lên trên 90%.
Khi chuyển đổi các ca chụp CT thường quy thành điểm tiếp xúc sàng lọc cơ hội, DAMO GRAPE có tiềm năng chuyển dịch phân bố chẩn đoán từ chủ yếu giai đoạn muộn sang chủ yếu phát hiện giai đoạn sớm.
Hơn nữa, tính khả thi về kinh tế và hậu cần của cách tiếp cận này khiến nó đặc biệt phù hợp để triển khai ở quy mô dân số.
Công nghệ không tăng thêm gánh nặng chụp ảnh, không yêu cầu sự hợp tác của bệnh nhân ngoài quy trình CT tiêu chuẩn và tận dụng phân tích tính toán có thể được tập trung hóa và mở rộng quy mô hiệu quả.
Ở các vùng có tỷ lệ mắc ung thư dạ dày cao nhưng năng lực nội soi hạn chế, DAMO GRAPE có thể ưu tiên nguồn lực nội soi cho những cá nhân có nguy cơ cao được xác định qua phân tích CT tự động, tối ưu hóa sử dụng nguồn lực chẩn đoán khan hiếm.
Khả năng phân tầng nguy cơ này chuyển đổi nội soi từ công cụ sàng lọc áp dụng rộng rãi thành can thiệp chẩn đoán có mục tiêu.
Vì vậy có khả năng cải thiện cả hiệu quả hoạt động và hiệu quả thực tế của các chương trình kiểm soát ung thư dạ dày.
Ví dụ: Tại các bệnh viện lớn như Bệnh viện Chợ Rẫy (TP.HCM) hay Bệnh viện Bạch Mai (Hà Nội), hàng nghìn ca chụp CT bụng được thực hiện mỗi năm cho các mục đích như: khảo sát sỏi thận, viêm ruột thừa, chấn thương, hoặc tầm soát ung thư gan.
Nếu tích hợp AI như DAMO GRAPE, mỗi ca chụp này đều trở thành một lần sàng lọc “miễn phí” cho ung thư dạ dày.
Với chi phí một lần nội soi dạ dày không quá cao và yêu cầu nhịn ăn, gây tê, những người ngại thủ thuật xâm lấn giờ có thể được phát hiện sớm qua CT họ đã chụp.
Điều này đặc biệt quan trọng khi Việt Nam có tỷ lệ nhiễm Helicobacter pylori cao (khoảng 70% dân số), một yếu tố nguy cơ chính của ung thư dạ dày.
Paige và Mô hình VIRCHOW
Chuyển từ AI đơn nhiệm vụ đến bệnh lý toàn diện
Sự ra đời của Virchow đánh dấu bước ngoặt căn bản trong phương pháp phát triển AI y tế.
Nó giải quyết những hạn chế tồn tại lâu nay về khả năng mở rộng, tính tổng quát và hiệu quả sử dụng nguồn lực.
Trước đây, để xây dựng hệ thống AI phát hiện ung thư, các nhà phát triển phải tốn công sức sưu tầm và gán nhãn tỉ mỉ cho từng loại mô cụ thể và cho từng tác vụ chẩn đoán riêng lẻ như phát hiện khối u.
Quy trình tốn kém này đòi hỏi hàng tháng thậm chí hàng năm công sức và phải lặp lại hoàn toàn cho ung thư phổi, ung thư da cũng như mọi loại ung thư khác.
Do đó tạo nên rào cản lớn trong việc phủ sóng chẩn đoán toàn diện.
Hơn nữa, cách tiếp cận truyền thống đặc biệt bất lực với các bệnh ung thư hiếm gặp và các dạng mô bất thường khi lượng dữ liệu huấn luyện không đủ khiến hiệu suất mô hình bị hạn chế nghiêm trọng.
Đòi hỏi bộ dữ liệu riêng biệt cho từng bệnh dẫn đến tình trạng phân mảnh các công cụ AI.
Khi đó mỗi ứng dụng hoạt động độc lập thay vì tận dụng kiến thức từ toàn bộ phổ các mẫu bệnh lý.
Phương pháp này cũng bỏ lỡ những đặc điểm chung cơ bản trong cấu trúc tế bào và mô, vốn tồn tại xuyên suốt các hệ cơ quan.
Đây là kiến thức mà các bác sĩ giải phẫu bệnh giàu kinh nghiệm thường áp dụng một cách tự nhiên khi đánh giá các mẫu bệnh phẩm đa dạng.
Kiến trúc mô hình nền tảng của Virchow đã thay đổi quy trình phát triển bằng việc học “ngôn ngữ” cơ bản của hình thái bệnh lý trên nhiều loại mô khác nhau cùng lúc.
Tương tự như các Mô hình Ngôn ngữ Lớn được huấn luyện trên kho văn bản khổng lồ từ internet để hiểu các mẫu ngôn ngữ một cách tổng quát, Virchow được huấn luyện trên bộ dữ liệu mô bệnh học khổng lồ trải dài nhiều cơ quan và trạng thái bệnh lý.
Thay vì học cách phát hiện một căn bệnh đơn lẻ, mô hình phát triển khả năng hiểu toàn diện về cấu trúc tế bào và mô.
Đó là đặc điểm hình thái nhân tế bào, sự khác biệt giữa cấu trúc tuyến bình thường và ác tính, các mẫu mô đệm phản ứng cùng vô số đặc điểm mô bệnh học khác tại nhiều vị trí giải phẫu.
Kiến thức tổng quát này giúp mô hình nhận diện các mẫu bệnh lý ngay cả ở những mô hoặc biểu hiện bệnh không có trong dữ liệu huấn luyện.
Do đó giải quyết vấn đề thiếu hụt dữ liệu nghiêm trọng đối với các bệnh ung thư hiếm gặp.
Ví dụ: Giống như một bác sĩ giải phẫu bệnh tại Bệnh viện Chợ Rẫy có thể nhận diện tế bào ung thư trong mẫu mô gan dựa trên kinh nghiệm với nhiều loại mô khác, Virchow cũng vận dụng kiến thức đa dạng này để phân tích các ca bệnh mới.
Điều này đặc biệt quan trọng tại Việt Nam, nơi tỷ lệ một số bệnh ung thư hiếm như ung thư đường mật hoặc ung thư tụy thấp, dẫn đến ít dữ liệu huấn luyện.
Từ mô hình nền tảng duy nhất này, Paige có thể tạo ra các ứng dụng chẩn đoán cụ thể một cách hiệu quả, với triển khai đầu tiên đã chứng minh khả năng phát hiện ung thư trên hơn 17 loại mô khác nhau.
Đó là da, phổi và toàn bộ đường tiêu hóa (trong đó có ung thư dạ dày)—cũng như nhiều loại khối u hiếm gặp.
Bước tiến về hiệu suất này biến đổi những gì trước đây đòi hỏi nhiều năm phát triển song song thành một quy trình tối ưu tận dụng trí tuệ bệnh lý được chia sẻ.
Từ chẩn đoán nhị phân đến y học chính xác
Trong khi khả năng phát hiện ung thư đa mô của Virchow thể hiện bước tiến lâm sàng đáng kể, tiềm năng chuyển đổi thực sự của nó vượt xa mục tiêu đưa ra kết quả chẩn đoán nhị phân (ung thư/không ung thư).
Sức mạnh thực sự của mô hình nằm ở đầu ra tính toán trung gian.
Đó là một biểu diễn toán học định lượng phong phú của mỗi ảnh tiêu bản toàn phần, được gọi là “embedding” (vector đặc trưng).
Các embedding này nắm bắt đặc điểm bệnh lý toàn diện của mẫu mô ở dạng thức có thể tích hợp với các phương thức dữ liệu bổ sung và hỗ trợ các ứng dụng mô hình dự đoán tiên tiến.
Như Paige đã nêu rõ, kiến trúc mô hình nền tảng mở ra những hiểu biết sâu sắc theo cấp số nhân khi kết hợp đầu ra của nó với dữ liệu từ các phương thức khác.
Đó là di truyền học (genomics), chẩn đoán hình ảnh (radiology) và thông tin sức khỏe tổng thể.
Khả năng này kết nối trực tiếp Virchow với các khung AI đa phương thức được thảo luận trong các phần trước về nghiên cứu ung thư toàn diện.
Các embedding của Virchow đại diện cho dạng thức tối ưu của “dữ liệu Pathomics có thể khai thác” mà các nhà nghiên cứu đã tìm cách trích xuất từ ảnh tiêu bản toàn phần.
Những biểu diễn mã hóa toán học này về cấu trúc mô, tổ chức tế bào và đặc điểm vi môi trường cung cấp thành phần đầu vào mô bệnh học lý tưởng cho các mô hình AI đa phương thức thế hệ mới.
Có thể kể đến khung MultiDeepCox-SC tích hợp dữ liệu bệnh lý, di truyền và lâm sàng để dự đoán khả năng sống sót.
Ví dụ: Tại Bệnh viện khi điều trị bệnh nhân ung thư dạ dày, bác sĩ cần kết hợp nhiều nguồn thông tin: hình ảnh mô bệnh học, kết quả xét nghiệm gen HER2, hình ảnh CT scan và tiền sử lâm sàng.
Embedding của Virchow hoạt động như một “bản dịch số” của hình ảnh mô bệnh học.
Nó giúp máy tính có thể kết hợp thông tin này với các dữ liệu khác để đưa ra dự đoán chính xác hơn về phương án điều trị phù hợp nhất cho từng bệnh nhân.
Hơn nữa, kiến trúc tập trung vào embedding biến Virchow không chỉ là công cụ chẩn đoán mà còn là thành phần cơ sở hạ tầng cơ bản cho thế hệ ứng dụng y học cá nhân hóa tiếp theo.
Các embedding có thể đóng vai trò đầu vào cho các mô hình dự đoán đáp ứng điều trị.
Do đó xác định các phân nhóm phân tử mà không cần xét nghiệm gen, phân tầng bệnh nhân theo tiêu chí tham gia thử nghiệm lâm sàng, hoặc dự báo quá trình tiến triển bệnh.
Đó là cách các mô hình nền tảng tạo ra các biểu diễn kiến thức có thể tái sử dụng, hỗ trợ nhiều ứng dụng hạ nguồn đa dạng.
Vì vậy tối đa hóa giá trị trích xuất từ mỗi tiêu bản bệnh lý số hóa đồng thời tạo điều kiện phân tích tích hợp trên toàn bộ phổ dữ liệu bệnh nhân.
Ví dụ: Với nguồn lực hạn chế về xét nghiệm gen tại nhiều bệnh viện tuyến tỉnh, khả năng của Virchow trong dự đoán các phân nhóm phân tử từ hình ảnh mô bệnh học có thể giúp bác sĩ đưa ra quyết định điều trị phù hợp mà không cần chờ đợi kết quả xét nghiệm đắt tiền.
Từ đó rút ngắn thời gian và cải thiện cơ hội điều trị cho bệnh nhân.
Có thể bạn quan tâm
Liên hệ
Địa chỉ
Tầng 3 Toà nhà VNCC 243A Đê La Thành Str Q. Đống Đa-TP. Hà Nội

