Đề tài ứng dụng tập thô trong lập luận từ dữ liệu
Số trang: 27
Loại file: doc
Dung lượng: 414.50 KB
Lượt xem: 9
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Các tập thô được xây dựng trên lý thuyết tập hợp. Ta thường sử dụng thêm một số thông tin về các phần tử của một tập tổng thể. Các phần tử có cùng thông tin là không phân biệt được và tạo thành một khối có thể được xem như là các hạt cơ bản của tri thức về tập tổng thể đó. Chẳng hạn, các bệnh nhân mắc phải một căn bệnh nào đó có cùng các triệu chứng là không phân biệt được và có thể được biểu diễn như một hạt (khối bệnh) trong tri thức...
Nội dung trích xuất từ tài liệu:
Đề tài ứng dụng tập thô trong lập luận từ dữ liệu ĐỀ TÀIỨNG DỤNG TẬP THÔTRONG LẬP LUẬN TỪ DỮ LIỆU 1 Sinh viên: Trịnh Văn Dương – Lớp KHMT4K51. MỞ ĐẦU ................................ ................................ ................................ .................. 31. MỞ ĐẦU ................................ ................................ ................................ .................. 32. VÍ DỤ ....................................................................................................................... 43. TẬP THÔ VÀ CÁC XẤP XỈ ..................................................................................... 54. CÁC TẬP THÔ VÀ HÀM THUỘC .......................................................................... 85. CÁC BẢNG QUYẾT ĐỊNH VÀ THUẬT GIẢI QUYẾT ĐỊNH ............................. 106. SỰ PHỤ THUỘC VÀO CÁC THUỘC TÍNH ................................ ......................... 117. THU GỌN CÁC THUỘC TÍNH ............................................................................. 138. CÁC HÀM VÀ MA TRẬN PHÂN BIỆT ................................................................ 199. ĐỘ QUAN TRỌNG CỦA CÁC THUỘC TÍNH VÀ CÁC THU GỌN XẤP XỈ ...... 2310. KẾT LUẬN ................................ ................................ ................................ ........... 26 2 Sinh viên: Trịnh Văn Dương – Lớp KHMT4K51. MỞ ĐẦU Các tập thô đư ợc xây dựng trên lý thuyết tập hợp. Ta thường sử dụngthêm một số thông tin về các phần tử của một tập tổng thể. Các phần tử có cùngthông tin là không phân biệt đ ược và tạo thành một khố i có thể được xem như làcác hạt cơ b ản của tri thức về tập tổng thể đó. Chẳng hạn, các bệnh nhân m ắcphải một căn bệnh n ào đó có cùng các triệu chứng là không phân biệt được và cóth ể được biểu diễn như một hạt (khối bệnh) trong tri thức y học. Những hạt nàyđược gọi là các tập phần tử cơ bản và có thể xem như là nh ững phần tử xây dựngn ên các khối tri thức. Phù hợp với tính chất hạt của tri th ức, các tập thô cũngđược mô tả bằng các tri thức có được. Do đó, với mỗi tập hợp khi không phânb iệt được các phần tử một cách chính xác thì ta gắn nó với hai tập hợp rõ đượcgọi là xấp xỉ trên và xấp xỉ dưới. Theo trực giác, xấp xỉ dưới của một tập chứa tấtcả các phần tử chắc chắn thuộc vào tập đó, còn xấp xỉ trên được tạo thành từ tấtcả các phần tử có thể thuộc vào tập này. Ph ần khác biệt giữa xấp xỉ trên và xấp xỉdưới gọi là vùng biên. Vùng biên chứa tất cả các phần tử không được phân lớpmột cách duy n hất thuộc vào một tập hợp hoặc phần bù của nó khi sử dụng cáctri th ức có được. Do đó, mỗi tập thô khác với tập thông thường là nó có vùngb iên thường khác rỗng. Bộ lý thuyết tập thô được xác định xấp xỉ. Thông báo, mà bộ thường đượcxác đ ịnh bởi các hàm thành viên. Bộ thô có thể được xác định bằng cách sửdụng, thay vì xấp xỉ, th ành viên chức năng, tuy nhiên hàm thành viên không phảilà một khái niệm nguyên th ủy trong cách tiếp cận này, và cả hai định nghĩa làkhông tương đương. Trong bài báo này chúng tôi định nghĩa các khái niệm cơ bản của lý thuyếttập thô dưới dạng dữ liệu. Các khái niệm này sẽ được áp dụng để th ực hiện lậplu ận từ dữ liệu. Các tập trong lý thuyết tập thô được định nghĩa bằng các xấp xỉdựa trên hàm thuộc. 3 Sinh viên: Trịnh Văn Dương – Lớp KHMT4K52. VÍ DỤ Trước tiên, chúng tôi trình bày một ví dụ đơn giản để mô tả phương phápmột cách trực quan. Dữ liệu đư ợc biểu diễn bằng một bảng, các cột là các thuộctính, các hàng là các đối tượng còn mỗi ô trong bảng là giá trị của thuộc tính củađối tượng tương ứng. Ví dụ trong một bảng có thông tin về các bệnh nhân nhiễmphải một căn bệnh nào đó, các đối tượng là các bệnh nhân, các thuộc tính có thểlà: huyết áp, nhiệt độ cơ th ể… Những bảng như vậy được gọi là các hệ thông tinhoặc các bảng thông tin. Dưới đây là m ột ví dụ về một bảng thông tin Giả sử chúng ta có dữ liệu về 6 bệnh nhân như trong bảng 1 dưới đây. Đau đầu Nhiệt độ Bệnh Đaucơ Bị bệnh cúm nhân (Muscle- (Flu) (Headache) (Temperature) (Patient) pain) p1 không có cao có p2 có không cao có rất cao p3 có có có bình thường p4 không có không p5 có không cao không rất cao p6 không có có Bảng 1 Các cột của bảng được gán nh ãn bởi các thuộc tính là các triệu chứng vàcác hàng là các đối tượng (các bệnh nhân). Do đó, các ô của bảng là giá trị củacác thuộc tính của các đ ối tượng. Mỗi hàng của bảng có thể được xem như thôngtin về một bệnh nhân n ào đó. Ví dụ bệnh nhân p2 được biểu diễn trong b ảng bởitập giá trị-thuộc tính như sau: (Đau đ ầu, có ), (Đau cơ, không), (Nhiệt độ, cao ),(Bị bệnh cúm, có ). 4 Sinh viên: Trịnh Văn Dương – Lớp KHMT4K5 Trong bảng 1 các bệnh nhân p 2, p3, và p5 là không phân biệt được vớithuộc tính đau đầu, các bệnh nhân p3 và p6 là không phân ...
Nội dung trích xuất từ tài liệu:
Đề tài ứng dụng tập thô trong lập luận từ dữ liệu ĐỀ TÀIỨNG DỤNG TẬP THÔTRONG LẬP LUẬN TỪ DỮ LIỆU 1 Sinh viên: Trịnh Văn Dương – Lớp KHMT4K51. MỞ ĐẦU ................................ ................................ ................................ .................. 31. MỞ ĐẦU ................................ ................................ ................................ .................. 32. VÍ DỤ ....................................................................................................................... 43. TẬP THÔ VÀ CÁC XẤP XỈ ..................................................................................... 54. CÁC TẬP THÔ VÀ HÀM THUỘC .......................................................................... 85. CÁC BẢNG QUYẾT ĐỊNH VÀ THUẬT GIẢI QUYẾT ĐỊNH ............................. 106. SỰ PHỤ THUỘC VÀO CÁC THUỘC TÍNH ................................ ......................... 117. THU GỌN CÁC THUỘC TÍNH ............................................................................. 138. CÁC HÀM VÀ MA TRẬN PHÂN BIỆT ................................................................ 199. ĐỘ QUAN TRỌNG CỦA CÁC THUỘC TÍNH VÀ CÁC THU GỌN XẤP XỈ ...... 2310. KẾT LUẬN ................................ ................................ ................................ ........... 26 2 Sinh viên: Trịnh Văn Dương – Lớp KHMT4K51. MỞ ĐẦU Các tập thô đư ợc xây dựng trên lý thuyết tập hợp. Ta thường sử dụngthêm một số thông tin về các phần tử của một tập tổng thể. Các phần tử có cùngthông tin là không phân biệt đ ược và tạo thành một khố i có thể được xem như làcác hạt cơ b ản của tri thức về tập tổng thể đó. Chẳng hạn, các bệnh nhân m ắcphải một căn bệnh n ào đó có cùng các triệu chứng là không phân biệt được và cóth ể được biểu diễn như một hạt (khối bệnh) trong tri thức y học. Những hạt nàyđược gọi là các tập phần tử cơ bản và có thể xem như là nh ững phần tử xây dựngn ên các khối tri thức. Phù hợp với tính chất hạt của tri th ức, các tập thô cũngđược mô tả bằng các tri thức có được. Do đó, với mỗi tập hợp khi không phânb iệt được các phần tử một cách chính xác thì ta gắn nó với hai tập hợp rõ đượcgọi là xấp xỉ trên và xấp xỉ dưới. Theo trực giác, xấp xỉ dưới của một tập chứa tấtcả các phần tử chắc chắn thuộc vào tập đó, còn xấp xỉ trên được tạo thành từ tấtcả các phần tử có thể thuộc vào tập này. Ph ần khác biệt giữa xấp xỉ trên và xấp xỉdưới gọi là vùng biên. Vùng biên chứa tất cả các phần tử không được phân lớpmột cách duy n hất thuộc vào một tập hợp hoặc phần bù của nó khi sử dụng cáctri th ức có được. Do đó, mỗi tập thô khác với tập thông thường là nó có vùngb iên thường khác rỗng. Bộ lý thuyết tập thô được xác định xấp xỉ. Thông báo, mà bộ thường đượcxác đ ịnh bởi các hàm thành viên. Bộ thô có thể được xác định bằng cách sửdụng, thay vì xấp xỉ, th ành viên chức năng, tuy nhiên hàm thành viên không phảilà một khái niệm nguyên th ủy trong cách tiếp cận này, và cả hai định nghĩa làkhông tương đương. Trong bài báo này chúng tôi định nghĩa các khái niệm cơ bản của lý thuyếttập thô dưới dạng dữ liệu. Các khái niệm này sẽ được áp dụng để th ực hiện lậplu ận từ dữ liệu. Các tập trong lý thuyết tập thô được định nghĩa bằng các xấp xỉdựa trên hàm thuộc. 3 Sinh viên: Trịnh Văn Dương – Lớp KHMT4K52. VÍ DỤ Trước tiên, chúng tôi trình bày một ví dụ đơn giản để mô tả phương phápmột cách trực quan. Dữ liệu đư ợc biểu diễn bằng một bảng, các cột là các thuộctính, các hàng là các đối tượng còn mỗi ô trong bảng là giá trị của thuộc tính củađối tượng tương ứng. Ví dụ trong một bảng có thông tin về các bệnh nhân nhiễmphải một căn bệnh nào đó, các đối tượng là các bệnh nhân, các thuộc tính có thểlà: huyết áp, nhiệt độ cơ th ể… Những bảng như vậy được gọi là các hệ thông tinhoặc các bảng thông tin. Dưới đây là m ột ví dụ về một bảng thông tin Giả sử chúng ta có dữ liệu về 6 bệnh nhân như trong bảng 1 dưới đây. Đau đầu Nhiệt độ Bệnh Đaucơ Bị bệnh cúm nhân (Muscle- (Flu) (Headache) (Temperature) (Patient) pain) p1 không có cao có p2 có không cao có rất cao p3 có có có bình thường p4 không có không p5 có không cao không rất cao p6 không có có Bảng 1 Các cột của bảng được gán nh ãn bởi các thuộc tính là các triệu chứng vàcác hàng là các đối tượng (các bệnh nhân). Do đó, các ô của bảng là giá trị củacác thuộc tính của các đ ối tượng. Mỗi hàng của bảng có thể được xem như thôngtin về một bệnh nhân n ào đó. Ví dụ bệnh nhân p2 được biểu diễn trong b ảng bởitập giá trị-thuộc tính như sau: (Đau đ ầu, có ), (Đau cơ, không), (Nhiệt độ, cao ),(Bị bệnh cúm, có ). 4 Sinh viên: Trịnh Văn Dương – Lớp KHMT4K5 Trong bảng 1 các bệnh nhân p 2, p3, và p5 là không phân biệt được vớithuộc tính đau đầu, các bệnh nhân p3 và p6 là không phân ...
Tìm kiếm theo từ khóa liên quan:
giá trị thuộc tính hệ thông tin các bản thông tin tập thô các xấp xỉ ma trận phân biệtTài liệu liên quan:
-
Luận văn: Luật kết hợp theo tiếp cận lý thuyết tập thô và khai phá dữ liệu song song
82 trang 23 0 0 -
Bài giảng CSS - Bài 14: CSS nâng cao
79 trang 18 0 0 -
Bài giảng môn Phân tích hệ thống thông tin
565 trang 17 0 0 -
BÁO CÁO HỆ THỐNG THÔNG TIN ĐỊA LÝ
12 trang 16 0 0 -
Bài giảng Hệ thống thông tin địa lý (GIS) trong lâm nghiệp: Bài 1 - ThS. Nguyễn Quốc Bình
18 trang 16 0 0 -
Bài giảng CSS - Bài 10: CSS Height/ Width
33 trang 15 0 0 -
Bài giảng CSS - Bài 12: Tổng hợp các bộ chọn trong CSS
8 trang 14 0 0 -
CHƯƠNG I: GIỚI THIỆU VỀ HỆ THỐNG VÀ HỆ THỐNG THÔNG TIN
36 trang 14 0 0 -
Một độ đo mới đo độ phụ thuộc thuộc tính
9 trang 14 0 0 -
Luận văn tốt nghiệp: Phát hiện luật bằng cách sử dụng siêu phằng tối ưu theo hướng tiếp cận thô
64 trang 12 0 0