Danh mục

Xử lý mất cân bằng dữ liệu trong phân loại tổn thương da trên ảnh soi da

Số trang: 9      Loại file: pdf      Dung lượng: 838.24 KB      Lượt xem: 8      Lượt tải: 0    
Hoai.2512

Hỗ trợ phí lưu trữ khi tải xuống: 1,000 VND Tải xuống file đầy đủ (9 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Nghiên cứu này đề xuất một phương pháp mới là phương pháp gán trọng số động (Dynamic Classweight) nhằm mong muốn tạo nên một mô hình có khả năng thích nghi và không phụ thuộc vào tỷ lệ các lớp, hay là sự mất cân bằng dữ liệu
Nội dung trích xuất từ tài liệu:
Xử lý mất cân bằng dữ liệu trong phân loại tổn thương da trên ảnh soi daKỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020DOI: 10.15625/vap.2020.00238 XỬ LÝ MẤT CÂN BẰNG DỮ LIỆU TRONG PHÂN LOẠI TỔN THƯƠNG DA TRÊN ẢNH SOI DA Võ Minh Thiện1, Lê Minh Hưng1, Trần Kim Tâm2, Trần Văn Lăng3 1 Trường ĐH Công nghệ Thông tin - ĐHQG TP. HCM 2 Trường Đại học Giao thông Vận tải TP. HCM 3 Viện Hàn lâm Khoa học và Công nghệ Việt Nam 16521170@gm.uit.edu.vn, hunglm@uit.edu.vn, kimtam.tran@ut.edu.vn, langtv@vast.vn TÓM TẮT: Ung thư hắc tố là một bệnh lý ác tính về da, có khả năng di căn đến các cơ quan khác và tiên lượng rất nặngnếu chẩn đoán muộn. Ở giai đoạn sớm, các tổn thương ác tính này rất dễ nhầm lẫn với nốt ruồi lành tính nếu chỉ thăm khám bằngmắt thường. Để khắc phục thực trạng này, máy soi da - một thiết bị quang học đã được sử dụng tại các bệnh viện da liễu để hỗ trợcác bác sĩ trong thăm khám các lớp nông của da với độ phóng đại lớn, đồng thời kết hợp với một hệ thống chụp và lưu trữ hình ảnh.Cuộc thi International Skin Image Collaboration 2018 (ISIC2018) được tổ chức với nhiệm vụ phân loại ảnh tổn thương da để pháthiện sớm các bệnh lý, nhất là ung thư ác tính. Dữ liệu bao gồm 10,015 ảnh soi da của 7 loại bệnh tổn thương. Vấn đề chính đặt racủa bài toán này là việc mất cân bằng dữ liệu nghiêm trọng khi chênh lệch giữa lớp nhiều nhất và lớp ít nhất lên đến 60 lần. Để giảiquyết bài toán đặt ra, trong nghiên cứu này chúng tôi tiến hành thực hiện tinh chỉnh thông số có sẵn các mạng nơron tích chập sâu(Deep Convolutional Neural Network - DCNN) hiện đại, có thể kể đến như Inception, DenseNet. Với vấn đề mất cân bằng dữ liệu,nghiên cứu này đã thực nghiệm và so sánh các phương pháp phổ biến như cân bằng batch, gán trọng số trên lớp. Bên cạnh đó,nghiên cứu còn áp dụng một hàm mất mát đã mang lại những kết quả cải tiến đáng kể trong các bài toán phân loại ảnh là LargeMargin Cosine Loss (CosFace) để có thể phân loại đặc trưng các lớp tốt hơn. Đặc biệt, trong nghiên cứu này đề xuất một phươngpháp mới là phương pháp gán trọng số động (Dynamic Classweight) nhằm mong muốn tạo nên một mô hình có khả năng thích nghivà không phụ thuộc vào tỷ lệ các lớp, hay là sự mất cân bằng dữ liệu. Kết quả của phương pháp đề xuất cho thấy sự cải thiện tốt rõrệt với độ chính xác đạt 82,9 % so với khi không can thiệp vào hàm mất mát là 70,7 % trên hệ thống kiểm thử của cuộc thiISIC2018. Từ khóa: Ung thư da, ISIC2018, CosFace, Dynamic Classweight. I. GIỚI THIỆU Ung thư da là một trong những ung thư phổ biến ở Mỹ, với hơn 5 triệu trường hợp mắc phải được chẩn đoánhằng năm. Ung thư hắc tố là giai đoạn nguy hiểm nhất của ung thư da, với xấp xỉ 91.000 ca bệnh mắc mới mỗi năm ởMỹ và hơn 9.000 người chết. Điều trị ung thư hắc tố da tiêu tốn hơn 3 triệu đô la Mỹ mỗi năm chỉ tính riêng ở Mỹ. Ungthư da đặt ra vấn đề như là một mối đe dọa lớn đến với sức khỏe cộng đồng. Ở Úc, hơn 14.000 ca mắc bệnh mới củaung thư hắc tố được báo cáo hằng năm, gây ra 2.000 cái chết. Ở châu Âu, hơn 100.000 ca mắc ung thư hắc tố mới và22.000 cái chết liên quan đến ung thư hắc tố được báo cáo định kỳ hằng năm. Một điều đáng báo động là không giốngnhiều loại ung thư khác, tỷ lệ mắc bệnh của ung thư hắc tố đã tăng một cách đều đặn qua những thập kỷ gần trở lại đây,từ năm 1990 đến năm 2018, đã ghi nhận sự tăng lên đến 225 % ở Mỹ [1]. Trong quá khứ, phương thức chẩn đoán chính của ung thư hắc tố là thăm khám lâm sàng không có sự hỗ trợ,điều này làm cho độ chính xác bị giới hạn và biến động, dẫn đến những thách thức quan trọng trong phát hiện sớmbệnh lẫn hạn chế việc sinh thiết không cần thiết. Trong những năm gần đây, kỹ thuật soi da được ra đời, đây một kỹthuật hình ảnh có độ phân giải cao trên da cho phép sự hiển thị của các cấu trúc da sâu hơn bằng cách giảm phản xạ bềmặt, với độ phóng đại từ 10 đến 100 lần, điều này góp phần cải tiến khả năng chẩn đoán của các chuyên gia. Đây làmột tiến bộ mới trong chẩn đoán lâm sàng các thương tổn có sắc tố, cho phép gia tăng hiệu năng chẩn đoán so với quansát và thăm khám đơn thuần bằng mắt thường [2], hạn chế bỏ sót các tổn thương ung thư hắc tố ở giai đoạn sớm. Hình 1. Hình ảnh lâm sàng và ảnh soi da của một nốt ruồi lành tính Những năm trở lại đây, cùng với sự phát triển của khoa học kỹ thuật và công nghệ, các hệ thống máy tính hỗ trợphát hiện và chẩn đoán (Computer-Aided Detection And Diagnosis System - CAD/CADx) đã và đang hỗ trợ các nhàbệnh lý học, ...

Tài liệu được xem nhiều: