Thông tin tài liệu:
Bài viết Một hướng tiếp cận rút trích mối quan hệ y tế trình bày: Các phương pháp rút trích mối quan hệ trên văn bản y tế và trình bày một hướng tiếp cận bách khoa toàn thư mở Wikipedia chia sẻ thông được đề xuất để rút trích mối quan hệ trên một loại tin và hình ảnh y khoa. Càng ngày càng có nhiều mối quan hệ(template filling) cụ thể,... Mời các bạn cùng tham khảo bài viết.
Nội dung trích xuất từ tài liệu:
Một hướng tiếp cận rút trích mối quan hệ y tếTẠP CHÍ PHÁT TRIỂN KH & CN, TẬP 20, SỐ Q3 - 201751Một hướng tiếp cận rút trích mối quan hệ y tếHuỳnh Hữu Nghĩa, Hồ Bảo Quốc, Nguyễn An TếTóm tắt—Rút trích mối quan hệ giữa các kháiniệm y tế có ý nghĩa rất quan trọng trong lĩnh vực ytế. Các mối liên hệ biểu thị các sự kiện, các quan hệcó thể có giữa các khái niệm. Thông tin về các mốiquan hệ này giúp cho người dùng (bác sĩ, bệnhnhân, nhà nghiên cứu y tế, người chăm sóc bệnhnhân, … ) có một cái nhìn đầy đủ về vấn đề y tế.Điều này hỗ trợ cho các bác sĩ và những người chămsóc bệnh nhân đưa ra những quyết định hiệu quả vàhạn chế những sai sót trong quá trình điều trị. Bàibáo tổng hợp các phương pháp rút trích mối quanhệ trên văn bản y tế và trình bày một hướng tiếp cậnđược đề xuất để rút trích mối quan hệ trên một loạimối quan hệ (template filling) cụ thể. Hướng tiếpcận kết hợp các phương pháp gồm dựa trên tự điển,luật và máy học. Phương pháp dựa trên luật sửdụng mối quan hệ ngữ nghĩa phụ thuộc giữa cáckhái niệm để rút trích luật. Phương pháp máy họcsử dụng thuật toán SVM (Support Vector Machine)và tập đặc trưng. Kết quả của hướng tiếp cận đượcđánh giá hiệu quả dựa trên độ đo tính đúng(accuracy) là 0.849.Từ khóa—Rút trích mối quan hệ, rút trích thôngtin, khai thác thông tin lâm sàng, khai thác văn bản.1 GIỚI THIỆUIN học y tế (medical informatics) là lĩnh vựcứng dụng công nghệ thông tin vào y khoa vàchăm sóc sức khỏe. Mục đích của tin học y tế lànghiên cứu tìm kiếm các phương pháp tối ưu hóaviệc sử dụng thông tin nhằm cải thiện chất lượngchăm sóc y tế, giảm chi phí, cung cấp cho giáodục và nghiên cứu y khoa hiệu quả. Thời gianqua, lĩnh vực tin học y tế có những tiến bộ và pháttriển.Những tiến bộ trong tin học y tế như hồ sơbệnh án điện tử (EHR - Electronic HealthTBài nhận ngày 04 tháng 04 năm 2017, hoàn chỉnh sửa chữangày 02 tháng 06 năm 2017.Tác giả Huỳnh Hữu Nghĩa công tác tại Trường Đại học Laođộng – Xã hội (CSII) (email: huynhnghiavn@gmail.com)Tác giả Hồ Bảo Quốc công tác tại Trường Đại học Khoahọc Tự nhiên, ĐHQGHCM (email: hbquoc@fit.hcmus.edu.vn)Tác giả Nguyễn An Tế công tác tại Trường Đại học Kinh tếTP HCM (email: tena@ueh.edu.vn).Record), các hệ thống chăm sóc y tế và nhữngứng dụng trong y sinh học (biomedical) đã sinh rakhối lượng dữ liệu lớn được lưu trữ trong hàngtrăm cơ sở dữ liệu. Ngoài ra, việc số hóa dữ liệu ytế quan trọng như các báo cáo phòng thí nghiệm,tài liệu nghiên cứu và hình ảnh giải phẫu cũng đãtạo ra dữ liệu chăm sóc bệnh nhân khổng lồ đượclưu trữ trên máy tính. Sự phát triển của Internetcũng làm xuất hiện nhiều trang web tư vấn cáchchăm sóc sức khỏe và đặc biệt là sự phát triển củabách khoa toàn thư mở Wikipedia chia sẻ thôngtin và hình ảnh y khoa. Càng ngày càng có nhiềutạp chí y tế điện tử đăng tải những thành tựu khoahọc kỹ thuật y khoa. Đây là nguồn dữ liệu lớn cóthể cung cấp những thông tin bổ ích cho ngườidùng trong lĩnh vực y tế.Nhu cầu thông tin đối với người dùng tronglĩnh vực y tế là rất đa dạng. Bác sĩ cần thông tinhỗ trợ trong quá trình chẩn đoán và điều trị. Sinhviên và nhà nghiên cứu cần tài liệu huấn luyện,những trường hợp điều trị cụ thể đã thực hiện, kếtquả xét nghiệm và chẩn đoán, tạp chí, bài báohoặc sách có liên quan hay những tóm tắt thôngtin quan trọng. Bệnh nhân cần hiểu biết về nguyênnhân bệnh, điều kiện điều trị y khoa, hợp tác hỗtrợ việc điều trị, theo dõi quá trình điều trị. Mộtkhả năng ứng dụng khác như công ty bảo hiểmcần giám sát việc sử dụng các điều kiện điều trịvới chi phí thấp, kiểm soát rủi ro và hỗ trợ mứcdịch vụ tốt, xác minh các thủ tục chẩn đoán vàtheo dõi kết quả điều trị.Với lượng dữ liệu lớn và nhu cầu thông tin củangười dùng mang đến cho lĩnh vực tin học y tếnhiều thách thức. Các nhà quản lý đang tìm kiếmgiải pháp quản lý dữ liệu phù hợp và hiệu quả đểphục vụ điều trị. Các tổ chức chăm sóc y tế gặpkhó khăn khi đọc-hiểu đúng các thuật ngữ tronghồ sơ bệnh nhân liên quan đến những bệnh, cáctriệu chứng và nguyên nhân để điều trị hiệu quả.Dữ liệu y tế cũng có rất nhiều thách thức do hầuhết là dữ liệu văn bản không có cấu trúc. Các vănbản được định dạng khác nhau liên quan đến từngloại báo cáo, một số báo cáo chứa các bảng biểuvới các hình thức khác nhau và sự xuất hiện của52SCIENCE & TECHNOLOGY DEVELOPMENT, Vol 20, No Q3 - 2017rất nhiều ký tự/chữ viết tắt. Các ký tự/chữ viết tắtlà nguyên nhân rất lớn dẫn đến sự nhập nhằng vàtính mơ hồ trong việc hiểu nội dung của văn bản.Để hiểu rõ nội dung tài liệu người dùng phải tìmđọc nhiều tài liệu khác có liên quan.Hiện nay, người dùng tìm kiếm thông tin thôngqua một số nguồn trực tuyến phổ biến như cáccông cụ tìm kiếm thông thường (Google, Bing vàYahoo!), các cơ sở dữ liệu nghiên cứu y tế(PubMed) và Wikipedia. Kết quả tìm kiếm lànhững tài liệu liên quan đến nội dung tìm kiếm,người dùng phải tự đọc tất cả tài liệu có để nắmbắt thông tin cần thiết phục vụ cho nh ...