Một tiếp cận xử lý dữ liệu lớn trong phát hiện các tổn thương gan dựa trên chỉ số hounsfield
Số trang: 9
Loại file: pdf
Dung lượng: 767.47 KB
Lượt xem: 11
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bệnh ung thư gan là một bệnh phổ biến hiện nay trên thế giới nói chung và ở nước ta nói riêng. Bài viết đề xuất phương pháp phát hiện tổn thương gan trên ảnh CT dựa trên chỉ số Hounsfield ứng dụng mô hình xử lý song song trong môi trường Spark để cải tiến độ chính xác và thời gian xử lý.
Nội dung trích xuất từ tài liệu:
Một tiếp cận xử lý dữ liệu lớn trong phát hiện các tổn thương gan dựa trên chỉ số hounsfieldKỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), TP. HCM, ngày 23-24/12/2021DOI: 10.15625/vap.2021.0056 MỘT TIẾP CẬN XỬ LÝ DỮ LIỆU LỚN TRONG PHÁT HIỆN CÁC TỔN THƯƠNG GAN DỰA TRÊN CHỈ SỐ HOUNSFIELD Phan Anh Cang1, Nguyễn Thị Kim Luông2, Phan Thượng Cang3 1 Khoa Công nghệ thông tin, Trường Đại học Sư phạm Kỹ thuật Vĩnh Long 2 Trường THPT Phạm Thành Trung, Cái Bè, Tiền Giang 3 Khoa Công nghệ thông tin và Truyền thông, Trường Đại học Cần Thơ cangpa@vlute.edu.vn, kimluongptt@gmail.com, ptcang@cit.ctu.edu.vn TÓM TẮT: Bệnh ung thư gan là một bệnh phổ biến hiện nay trên thế giới nói chung và ở nước ta nói riêng. Theo thống kêcủa WHO năm 2018 Việt Nam thuộc nhóm nước có tỉ lệ ung thư cao nhất trên thế giới và ung thư gan chiếm tỉ lệ cao nhất trong tấtcả các bệnh ung thư. Để chẩn đoán và phát hiện bệnh ung thư gan, các bác sĩ mất nhiều thời gian, công sức để xem xét các ảnh CTchụp cắt lớp gan. Tuy nhiên, công việc này đòi hỏi các bác sĩ phải có nhiều kinh nghiệm và xem xét một lượng lớn các ảnh CT thuđược qua các thì chụp trước và sau khi tiêm thuốc cản quang để theo dõi sự thay đổi đậm độ Hounsfield. Hầu hết các nghiên cứutrước đây tập trung vào các kỹ thuật rút trích đặc trưng và phân loại mà không quan tâm đến sự thay đổi đậm độ Hounsfield quacác thì chụp trong khi các chuyên gia y khoa rất quan tâm đến yếu tố này trên thực tế. Để giải quyết vấn đề trên, trong bài báo nàychúng tôi đề xuất phương pháp phát hiện tổn thương gan trên ảnh CT dựa trên chỉ số Hounsfield ứng dụng mô hình xử lý song songtrong môi trường Spark để cải tiến độ chính xác và thời gian xử lý. Dựa vào mạng nơron Single Short Multibox Detector (SSD),chúng tôi cài đặt phương pháp đề xuất trong môi trường Spark cho việc huấn luyện và phân loại tổn thương gan. Kết quả cho thấyphương pháp đề xuất có độ chính xác cao với độ đo mAP là 82%, trong khi thời gian xử lý nhanh hơn trường hợp không xử lý trongmôi trường Spark. Kết quả nghiên cứu hỗ trợ các bác sĩ phát hiện và phân loại tự động các bệnh về gan một cách chính xác, nhanhchóng giúp điều trị bệnh nhân kịp thời. Từ khóa: Xử lý dữ liệu lớn, Spark, SSD, chỉ số Houndsfield, tổn thương gan. I. GIỚI THIỆU Theo báo cáo của GLOBOCAN 2018 [1] về thực trạng ung thư thế giới có 18,1 triệu ca mắc mới và 9,6 triệu catử vong do ung thư trong năm 2018, Việt Nam thuộc nhóm nước có tỉ lệ ung thư cao nhất. Việt Nam với dân số gần96,5 triệu người (có 164.671 ca mắc mới, 114.871 ca tử vong do ung thư). Điều này báo động về tỷ lệ mắc ung thư ganở nước ta hiện nay. Ung thư gan khó sàng lọc vì giai đoạn sớm của bệnh thường không rõ ràng do đó cần có các chiếnlược phát hiện, phân loại sớm để đưa ra phương pháp điều trị nhằm kiểm soát căn bệnh này. Tuy nhiên bên cạnh độchính xác do số lượng ảnh CT thu được khi phát hiện tổn thương gan ở các thì chụp trước và sau khi tiêm thuốc cảnquang là rất lớn. Bên cạnh đó việc lưu trữ và quản lý kho dữ liệu ảnh về bệnh lý gan là một thách thức lớn cho lĩnh vựcy khoa. Để cải thiện điều này, trong những năm gần đây đã có rất nhiều nhà nghiên cứu đưa ra các phương pháp phânđoạn và phát hiện tổn thương ở gan. Nghiên cứu phân loại tự động các tổn thương gan khu trú dựa trên hình ảnh DCE-MRI và T2W trên lâm sàng [2] phương pháp của họ thực hiện trên hình ảnh MR tăng cường tương phản động T2W vàDCE được sử dụng để xác định năm loại tổn thương là u tuyến, u nang, u máu, HCC, di căn; thử nghiệm trên 43 bệnhnhân kết quả đạt là 74%. Phương pháp HOG-SVM [3] tự động phát hiện ung thư gan từ hình ảnh CT bụng và phânloại, thử nghiệm trên 27 bệnh nhân ung thư gan phân biệt hai loại là HCC và bệnh ung thư gan ác tính, độ chính xác đạt94%. Nghiên cứu [4] cải thiện đào tạo CNN bằng cách sử dụng Disentangement để phân loại tổn thương gan trong ảnhCT với tập dữ liệu gồm 239 ảnh CT 2-D cho phân loại bốn trường hợp u nang, di căn, u máu, nhu mô lành tính với độchính xác đạt 75%. Nghiên cứu tiếp theo [5] phân loại các tổn thương gan khu trú bằng cách sử dụng học sâu với Fine-Tuning (transfer learning) phân loại tổn thương trên 388 hình ảnh CT đa pha với bốn loại u nang, FNH, HCC, HEMvới độ chính xác đạt 91.22%. Từ các nghiên cứu trên cho thấy các tác giả đề xuất trên nhiều phương pháp khác nhaucho việc phân đoạn và phát hiện các tổn thương ở gan. Tuy nhiên, hầu hết các nghiên cứu trước đây tập trung vào cáckỹ thuật rút trích đặc trưng và phân loại mà không quan tâm đến sự thay đổi đậm độ Hounsfield qua các thì chụp trongkhi các chuyên gia y khoa rấ ...
Nội dung trích xuất từ tài liệu:
Một tiếp cận xử lý dữ liệu lớn trong phát hiện các tổn thương gan dựa trên chỉ số hounsfieldKỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), TP. HCM, ngày 23-24/12/2021DOI: 10.15625/vap.2021.0056 MỘT TIẾP CẬN XỬ LÝ DỮ LIỆU LỚN TRONG PHÁT HIỆN CÁC TỔN THƯƠNG GAN DỰA TRÊN CHỈ SỐ HOUNSFIELD Phan Anh Cang1, Nguyễn Thị Kim Luông2, Phan Thượng Cang3 1 Khoa Công nghệ thông tin, Trường Đại học Sư phạm Kỹ thuật Vĩnh Long 2 Trường THPT Phạm Thành Trung, Cái Bè, Tiền Giang 3 Khoa Công nghệ thông tin và Truyền thông, Trường Đại học Cần Thơ cangpa@vlute.edu.vn, kimluongptt@gmail.com, ptcang@cit.ctu.edu.vn TÓM TẮT: Bệnh ung thư gan là một bệnh phổ biến hiện nay trên thế giới nói chung và ở nước ta nói riêng. Theo thống kêcủa WHO năm 2018 Việt Nam thuộc nhóm nước có tỉ lệ ung thư cao nhất trên thế giới và ung thư gan chiếm tỉ lệ cao nhất trong tấtcả các bệnh ung thư. Để chẩn đoán và phát hiện bệnh ung thư gan, các bác sĩ mất nhiều thời gian, công sức để xem xét các ảnh CTchụp cắt lớp gan. Tuy nhiên, công việc này đòi hỏi các bác sĩ phải có nhiều kinh nghiệm và xem xét một lượng lớn các ảnh CT thuđược qua các thì chụp trước và sau khi tiêm thuốc cản quang để theo dõi sự thay đổi đậm độ Hounsfield. Hầu hết các nghiên cứutrước đây tập trung vào các kỹ thuật rút trích đặc trưng và phân loại mà không quan tâm đến sự thay đổi đậm độ Hounsfield quacác thì chụp trong khi các chuyên gia y khoa rất quan tâm đến yếu tố này trên thực tế. Để giải quyết vấn đề trên, trong bài báo nàychúng tôi đề xuất phương pháp phát hiện tổn thương gan trên ảnh CT dựa trên chỉ số Hounsfield ứng dụng mô hình xử lý song songtrong môi trường Spark để cải tiến độ chính xác và thời gian xử lý. Dựa vào mạng nơron Single Short Multibox Detector (SSD),chúng tôi cài đặt phương pháp đề xuất trong môi trường Spark cho việc huấn luyện và phân loại tổn thương gan. Kết quả cho thấyphương pháp đề xuất có độ chính xác cao với độ đo mAP là 82%, trong khi thời gian xử lý nhanh hơn trường hợp không xử lý trongmôi trường Spark. Kết quả nghiên cứu hỗ trợ các bác sĩ phát hiện và phân loại tự động các bệnh về gan một cách chính xác, nhanhchóng giúp điều trị bệnh nhân kịp thời. Từ khóa: Xử lý dữ liệu lớn, Spark, SSD, chỉ số Houndsfield, tổn thương gan. I. GIỚI THIỆU Theo báo cáo của GLOBOCAN 2018 [1] về thực trạng ung thư thế giới có 18,1 triệu ca mắc mới và 9,6 triệu catử vong do ung thư trong năm 2018, Việt Nam thuộc nhóm nước có tỉ lệ ung thư cao nhất. Việt Nam với dân số gần96,5 triệu người (có 164.671 ca mắc mới, 114.871 ca tử vong do ung thư). Điều này báo động về tỷ lệ mắc ung thư ganở nước ta hiện nay. Ung thư gan khó sàng lọc vì giai đoạn sớm của bệnh thường không rõ ràng do đó cần có các chiếnlược phát hiện, phân loại sớm để đưa ra phương pháp điều trị nhằm kiểm soát căn bệnh này. Tuy nhiên bên cạnh độchính xác do số lượng ảnh CT thu được khi phát hiện tổn thương gan ở các thì chụp trước và sau khi tiêm thuốc cảnquang là rất lớn. Bên cạnh đó việc lưu trữ và quản lý kho dữ liệu ảnh về bệnh lý gan là một thách thức lớn cho lĩnh vựcy khoa. Để cải thiện điều này, trong những năm gần đây đã có rất nhiều nhà nghiên cứu đưa ra các phương pháp phânđoạn và phát hiện tổn thương ở gan. Nghiên cứu phân loại tự động các tổn thương gan khu trú dựa trên hình ảnh DCE-MRI và T2W trên lâm sàng [2] phương pháp của họ thực hiện trên hình ảnh MR tăng cường tương phản động T2W vàDCE được sử dụng để xác định năm loại tổn thương là u tuyến, u nang, u máu, HCC, di căn; thử nghiệm trên 43 bệnhnhân kết quả đạt là 74%. Phương pháp HOG-SVM [3] tự động phát hiện ung thư gan từ hình ảnh CT bụng và phânloại, thử nghiệm trên 27 bệnh nhân ung thư gan phân biệt hai loại là HCC và bệnh ung thư gan ác tính, độ chính xác đạt94%. Nghiên cứu [4] cải thiện đào tạo CNN bằng cách sử dụng Disentangement để phân loại tổn thương gan trong ảnhCT với tập dữ liệu gồm 239 ảnh CT 2-D cho phân loại bốn trường hợp u nang, di căn, u máu, nhu mô lành tính với độchính xác đạt 75%. Nghiên cứu tiếp theo [5] phân loại các tổn thương gan khu trú bằng cách sử dụng học sâu với Fine-Tuning (transfer learning) phân loại tổn thương trên 388 hình ảnh CT đa pha với bốn loại u nang, FNH, HCC, HEMvới độ chính xác đạt 91.22%. Từ các nghiên cứu trên cho thấy các tác giả đề xuất trên nhiều phương pháp khác nhaucho việc phân đoạn và phát hiện các tổn thương ở gan. Tuy nhiên, hầu hết các nghiên cứu trước đây tập trung vào cáckỹ thuật rút trích đặc trưng và phân loại mà không quan tâm đến sự thay đổi đậm độ Hounsfield qua các thì chụp trongkhi các chuyên gia y khoa rấ ...
Tìm kiếm theo từ khóa liên quan:
Xử lý dữ liệu lớn Chỉ số Houndsfield Tổn thương gan Môi trường Spark Ung thư ganGợi ý tài liệu liên quan:
-
Phương pháp phòng và điều trị bệnh ung thư: Phần 1
126 trang 88 0 0 -
79 trang 33 0 0
-
Tối ưu hóa Join đệ quy trên tập dữ liệu lớn trong môi trường Spark
14 trang 30 0 0 -
Chi phí trực tiếp điều trị ung thư gan tại Việt Nam, năm 2019
5 trang 26 0 0 -
Cẩm nang cho cán bộ y tế về viêm gan B
17 trang 20 0 0 -
11 trang 20 0 0
-
Phân loại các tổn thương thường gặp ở gan dựa vào chỉ số Hounsfield và kỹ thuật học sâu
9 trang 19 0 0 -
8 trang 19 0 0
-
5 trang 18 0 0
-
7 trang 18 0 0