Danh mục

Tóm tắt Luận án Tiến sĩ Toán học: Rút gọn thuộc tính trong bảng quyết định không đầy đủ theo tiếp cận tập thô dung sai

Số trang: 27      Loại file: pdf      Dung lượng: 373.20 KB      Lượt xem: 4      Lượt tải: 0    
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Luận án trình bày về các nội dung: các khái niệm cơ bản về mô hình tập thô dung sai dựa trên quan hệ dung sai trong hệ thông tin không đầy đủ, phân nhóm và đánh giá các phương pháp rút gọn thuộc tính trong bảng quyết định không đầy đủ, đề xuất các phương pháp rút gọn thuộc tính trong bảng quyết định không đầy đủ. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án Tiến sĩ Toán học: Rút gọn thuộc tính trong bảng quyết định không đầy đủ theo tiếp cận tập thô dung sai1BỘ GIÁO DỤC VÀ ĐÀO TẠOVIỆN HÀN LÂM KHOA HỌCVÀ CÔNG NGHỆ VIỆT NAMHỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ……..….***…………VŨ VĂN ĐỊNHRÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNHKHÔNG ĐẦY ĐỦ THEO TIẾP CẬN TẬP THÔ DUNG SAIChuyên ngành: Cơ sở toán học cho tin họcMã số: 62.46.01.10TÓM TẮT NLUẬN ÁN TIẾN SĨ TOÁN HỌCHÀ NỘI - 20162Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ Viện Hàn lâm Khoa học và Công nghệ Việt NamNgười hướng dẫn khoa học 1: GS.TS Vũ Đức ThiNgười hướng dẫn khoa học 2: PGS.TS Ngô Quốc TạoPhản biện 1: …Phản biện 2: …Phản biện 3: ….Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tạiHọc viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Côngnghệ Việt Nam vào hồi … giờ .. ’, ngày … tháng … năm 2016Có thể tìm hiểu luận án tại:- Thư viện Học viện Khoa học và Công nghệ- Thư viện Quốc gia Việt Nam1MỞ ĐẦU1. Tính cấp thiết của luận ánLý thuyết tập thô do Pawlak đề xuất vào những năm đầu thập niên támmươi của thế kỷ hai mươi được xem là công cụ hữu hiệu để giải quyết cácbài toán phân lớp, phát hiện luật…chứa dữ liệu không đầy đủ, không chắcchắn. Trong các bài toán thực tế, các bảng quyết định thường thiếu giá trịtrên miền giá trị thuộc tính. Trên bảng quyết định không đầy đủ,Kryszkiewicz đã mở rộng quan hệ tương đương trong lý thuyết tập thôtruyền thống thành quan hệ dung sai và đề xuất mô hình tập thô dung sainhằm trích lọc luật trực tiếp không qua bước xử lý giá trị thiếu. Cácphương pháp rút gọn thuộc tính trong bảng quyết định không đầy đủ theotiếp cận tập thô dung sai trong những năm gần đây là: phương pháp dựatrên miền dương, phương pháp sử dụng hàm quyết định suy rộng, phươngpháp sử dụng lượng thông tin, phương pháp sử dụng metric, phương phápsử dụng hàm phân bố (distribution reduct), phương pháp sử dụng hàm ấnđịnh (assignment reduct), phương pháp sử dụng ma trận phân biệt, phươngpháp sử dụng ma trận dung sai. Trên cơ sở tổng kết các nghiên cứu liênquan đến các phương pháp rút gọn thuộc tính luận án đặt ra các vấn đề cầnnghiên cứu như sau: Có thể nói rằng tập rút gọn chính là kết quả của một phương pháp rútgọn thuộc tính. Trong bảng quyết định nhất quán, các công bố đã chỉ ratập rút gọn của phương pháp dựa trên miền dương, tập rút gọn của phươngpháp sử dụng hàm quyết định suy rộng, tập rút gọn sử dụng hàm phân bố,phương pháp sử dụng hàm ấn định, là có định nghĩa độ đo tương đươngnhau. Tuy nhiên trên bảng quyết định không nhất quán, các tập rút gọncủa các phương pháp là khác nhau và theo tài liệu hiện có mà tác giả biếtthì chưa có nghiên cứu liên quan đến việc so sánh các tập rút gọn làm cơsở để so sánh, đánh giá các phương pháp rút gọn thuộc tính. Việc so sánh, đánh giá các phương pháp rút gọn thuộc tính thườngdựa trên hai tiêu chuẩn: độ phức tạp thời gian của thuật toán heuristic tìmtập rút gọn và khả năng phân lớp của tập rút gọn. Từ việc tổng kết cácphương pháp rút gọn thuộc tính, tác giả thấy rằng nếu cùng sử dụng mộtđơn vị tính toán cơ sở trong tập thô dung sai (lực lượng các lớp dung sai)thì độ phức tạp thời gian các thuật toán heuristic của các phương pháp làgần như nhau (độ phức tạp thời gian đa thức). Do đó, việc so sánh, đánhgiá các phương pháp đều sử dụng tiêu chuẩn khả năng phân lớp (độ hỗ trợcủa tập luật) của tập rút gọn. Về mặt định tính, tập rút gọn bảo toàn khảnăng phân lớp của bảng quyết định. Về mặt định lượng, tập rút gọn bảo2toàn độ chắc chắn của tập luật quyết định. Tập rút gọn của phương phápnào có độ hỗ trợ của tập luật cao (luật quyết định phủ nhiều đối tượng) thìcó khả năng phân lớp cao. Do đó, khả năng phân lớp được tính bằng độ hỗtrợ của tập luật. Các tác giả đã đưa ra độ chắc chắn, độ nhất quán và độ hỗtrợ của tập luật quyết định trên bảng quyết định không đầy đủ. Tuy nhiên,các tác giả chưa nghiên cứu sự thay đổi của các độ đo này trên các tập rútgọn của các phương pháp rút gọn thuộc tính, do đó các độ đo này khôngđánh giá được khả năng phân lớp của tập rút gọn và đòi hỏi phải có độchắc chắn, độ hỗ trợ mới để đánh giá khả năng phân lớp của tập rút gọn,làm cơ sở để so sánh, đánh giá các phương pháp rút gọn thuộc tính. Hướng nghiên cứu rút gọn thuộc tính đã đạt được một số kết quả nhấtđịnh. Tuy nhiên, việc nghiên cứu và tìm kiếm các phương pháp mới vẫnđòi hỏi nhiều nỗ lực nghiên cứu nhằm phong phú thêm các phương pháprút gọn thuộc tính. Trên cơ sở đó, lựa chọn các phương pháp phù hợp đểgiải quyết các bài toán trong thực tiễn.2. Mục tiêu nghiên cứu của luận án1) Trong bảng quyết định nhất quán, các công bố đã chỉ ra tập rútgọn của phương pháp trên là tương đương nhau. Tuy nhiên trên bảngquyết định không nhất quán, các tập rút gọn của các phương pháp là khácnhau và theo tài liệu hiện có mà tác giả biết thì chưa có nghiên cứu liênquan đến việc so sánh các tập rút gọn để so sánh, đánh giá các phươngpháp rút gọn.2) Việc so sánh, đánh giá các phương pháp rút gọn thuộc tínhthường dựa trên hai tiêu chuẩn: độ phức tạp thời gian của thuật toánheuristic tìm tập rút gọn và khả năng phân lớp của tập rút gọn. Tác giảthấy rằng nếu cùng sử dụng một đơn vị tính toán cơ sở trong tập thô dungsai thì độ phức tạp thời gian các thuật toán heuristic của các phương pháplà như nhau (độ phức tạp thời gian đa thức). Do đó, việc so sánh, đánh giácác phương pháp đều sử dụng tiêu chuẩn khả năng phân lớp của tập rútgọn(độ hỗ trợ của tập luật). Về mặt định tính, tập rút gọn bảo toàn khảnăng phân lớp của bảng quyết định. Về mặt định lượng, tập rút gọn bảotoàn độ chắc chắn của tập luật quyết định. Tập rút gọn của phương phápnào có độ hỗ trợ của tập luật cao thì có khả năng phân lớp cao. Do đó, khảnăng phân lớp được tính bằng độ hỗ trợ của tập luật. Trong các nghiên cứutrước, các tác giả đã đưa ra độ chắc chắn, độ nhất quán và độ hỗ trợ củatập luật quyết định trên bảng quyết định không đầy đủ. Tu ...

Tài liệu được xem nhiều:

Tài liệu liên quan: