Công nghệ tri thức và ứng dụng (GS.TSKH. Hoàng Kiếm) - Chương 6.Khám phá tri thức
Số trang: 71
Loại file: ppt
Dung lượng: 445.00 KB
Lượt xem: 14
Lượt tải: 0
Xem trước 8 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Thế nào là khám phá tri thức (knowledge discovery) ? Khám phá tri thức là tìm ra những tri thức tiềm ẩn, những tri thức mới (không phải là những tri thức kinh điển, kinh nghiệm, …)Thừa dữ liệu, thông tin nhưng thiếu tri thức.
Nội dung trích xuất từ tài liệu:
Công nghệ tri thức và ứng dụng (GS.TSKH. Hoàng Kiếm) - Chương 6.Khám phá tri thứcPhần III: Khai mỏ dữ liệu và khám phá tri thức Chương 6 Máy học và khám phá tri thức Tham khảo thêm: [1] GS.TSKH Hoàng Kiếm. Bài giảng cao học môn học cơ sở tri thức và ứng dụng. ĐHKHTN-TPHCM. [2] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998 I. Khái niệm máy học Thế nào là máy học (Learning Machine) ? Máy tính hay chương trình máy tính có khả năng tự hoàn thiệntừ “kinh nghiệm”. Máy học còn có nghĩa là việc mô hình hóa môi trường xungquanh hay khả năng một chương trình máy tính sinh ra một cấutrúc dữ liệu mới khác với cấu trúc hiện có. Chẳng hạn việc tìmra những luật If…then… từ tập dữ liệu đầu vào.(Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. DataMining Methods for Knowledge Discovery. Kluwer AcademicPublishers, 1998) II. Khám phá tri thứcThế nào là khám phá tri thức (knowledge discovery) ? Khám phá tri thức là tìm ra những tri thức tiềm ẩn, những trithức mới (không phải là những tri thức kinh điển, kinh nghiệm, …)Thừa dữ liệu, thông tin nhưng thiếu tri thức. TriMứ c đ ộ thức trừu Thông tintượng Dữ liệu Số lượng III. Phân loại máy họcPhân loại thô: Học giám sát (supervised learning) Học không giám sát (unsupervised learning)Phân loại theo 2 tiêu chuẩn cùng lúc: “cấp độ học” & “cách tiếp cận” Cấp độ học: Học vẹt (Rote learning) Học theo giải thích (by explanation) Học theo ví dụ, trường hợp (by examples, cases) Học khám phá (by discovering) III. Phân loại máy học (tt)Cách tiếp cận: Tiếp cận thống kê Tiếp cận toán tử logic Tiếp cận hình học (phân hoạch không gian, xây dựng cây định danh, …) Tiếp cận mạng Neural Tiếp cận khai mỏ dữ liệu … III.1 Tiếp cận thống kêVí dụ: Chương trình đoán ý nghĩ con người. Máy sẽ đoán ngườichơi nghĩ số 0 hay 1 trong đầu, người chơi sẽ phải trả lời chomáy biết là máy đã đoán đúng hay sai. Để từ đó máy tính sẽ họcqui luật suy nghĩa của người chơi. 1 Máy đoán sai Máy đoán là 0 III.1 Tiếp cận thống kê (tt)Ý tưởng cài đặt: hết sức đơn giản- Lưu trữ toàn bộ dãy số 0, 1 mà người chơi đã nghĩ ra.- Lấy 7 con số trước đó (người chơi đưa ra), tính xác suất xuất hiện của số 1 và số 0 sau dãy 7 con số này. Máy sẽ đoán sốcó xác suất xuất hiện cao hơn.Giả sử ở lần đoán thứ i, dãy số mà người dùng đã đoán như sau: …1101010000101000000100?Từ dữ liệu lưu trữ ở những lần đoán trước, giả sử số lần xuấthiện của 1 sau dãy 0 0 0 0 1 0 0 là 28 và số lần xuất hiện của số 0 là90Xác suất xuất hiện của số 1 sau dãy này là: 28/(28+90) = 23.7%Xác suất xuất hiện của số 0 sau dãy này là: 90/(28+90) = 76.3% III.1 Tiếp cận thống kê (tt)Nhận xét ví dụ: Ví dụ đã đưa ra là thuộc cấp độ học vẹt sử dụng cách tiếpcận thống kê. Máy không thể đoán đúng ngay được, nhưng càng về sau (vàitrăm lần đoán) máy càng trở nên chính xác một cách kinh ngạc(trung bình có thể lên đến 90%). Trên thực tế khi cài đặt chương trình này tác giả không chỉđoán qui luật từ dãy số của người chơi, máy còn sử dụng cả dãysố mà máy đã đoán III.2 Tiếp cận hình họcXét bài toán: cho tập các hình chữ nhật với kích thước (ngang & rộng)và màu sắc khác nhau (hình vẽ). Cho biết hình bên phải có màu gì? Ñoû Vaøng Cam Tía ? Xanh döông Ñoû Xanh laù caây Tím III.2 Tiếp cận hình học (tt)Giải quyết bài toán: Phản ứng tự nhiên củacon người: tìm khối có sẵn Ñoû Vaønggần giống để đoán màu 6 Tíacho khối chưa biết. Như Camthế nào là gần giống ? 4 U Biểu diễn 2 thuộc tínhchiều rộng & chiều cao Xanh döôngdưới dạng 1 điểm trên 2 Ñoû Xanh laù caâymặt phẳng 2 chiều. Tím Tính khoảng cách từkhối cần tìm đến tất cả 0 2 4 6các khối còn lại. (bài toánngười láng giềng gần nhấtvới độ phức tạp ...
Nội dung trích xuất từ tài liệu:
Công nghệ tri thức và ứng dụng (GS.TSKH. Hoàng Kiếm) - Chương 6.Khám phá tri thứcPhần III: Khai mỏ dữ liệu và khám phá tri thức Chương 6 Máy học và khám phá tri thức Tham khảo thêm: [1] GS.TSKH Hoàng Kiếm. Bài giảng cao học môn học cơ sở tri thức và ứng dụng. ĐHKHTN-TPHCM. [2] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998 I. Khái niệm máy học Thế nào là máy học (Learning Machine) ? Máy tính hay chương trình máy tính có khả năng tự hoàn thiệntừ “kinh nghiệm”. Máy học còn có nghĩa là việc mô hình hóa môi trường xungquanh hay khả năng một chương trình máy tính sinh ra một cấutrúc dữ liệu mới khác với cấu trúc hiện có. Chẳng hạn việc tìmra những luật If…then… từ tập dữ liệu đầu vào.(Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. DataMining Methods for Knowledge Discovery. Kluwer AcademicPublishers, 1998) II. Khám phá tri thứcThế nào là khám phá tri thức (knowledge discovery) ? Khám phá tri thức là tìm ra những tri thức tiềm ẩn, những trithức mới (không phải là những tri thức kinh điển, kinh nghiệm, …)Thừa dữ liệu, thông tin nhưng thiếu tri thức. TriMứ c đ ộ thức trừu Thông tintượng Dữ liệu Số lượng III. Phân loại máy họcPhân loại thô: Học giám sát (supervised learning) Học không giám sát (unsupervised learning)Phân loại theo 2 tiêu chuẩn cùng lúc: “cấp độ học” & “cách tiếp cận” Cấp độ học: Học vẹt (Rote learning) Học theo giải thích (by explanation) Học theo ví dụ, trường hợp (by examples, cases) Học khám phá (by discovering) III. Phân loại máy học (tt)Cách tiếp cận: Tiếp cận thống kê Tiếp cận toán tử logic Tiếp cận hình học (phân hoạch không gian, xây dựng cây định danh, …) Tiếp cận mạng Neural Tiếp cận khai mỏ dữ liệu … III.1 Tiếp cận thống kêVí dụ: Chương trình đoán ý nghĩ con người. Máy sẽ đoán ngườichơi nghĩ số 0 hay 1 trong đầu, người chơi sẽ phải trả lời chomáy biết là máy đã đoán đúng hay sai. Để từ đó máy tính sẽ họcqui luật suy nghĩa của người chơi. 1 Máy đoán sai Máy đoán là 0 III.1 Tiếp cận thống kê (tt)Ý tưởng cài đặt: hết sức đơn giản- Lưu trữ toàn bộ dãy số 0, 1 mà người chơi đã nghĩ ra.- Lấy 7 con số trước đó (người chơi đưa ra), tính xác suất xuất hiện của số 1 và số 0 sau dãy 7 con số này. Máy sẽ đoán sốcó xác suất xuất hiện cao hơn.Giả sử ở lần đoán thứ i, dãy số mà người dùng đã đoán như sau: …1101010000101000000100?Từ dữ liệu lưu trữ ở những lần đoán trước, giả sử số lần xuấthiện của 1 sau dãy 0 0 0 0 1 0 0 là 28 và số lần xuất hiện của số 0 là90Xác suất xuất hiện của số 1 sau dãy này là: 28/(28+90) = 23.7%Xác suất xuất hiện của số 0 sau dãy này là: 90/(28+90) = 76.3% III.1 Tiếp cận thống kê (tt)Nhận xét ví dụ: Ví dụ đã đưa ra là thuộc cấp độ học vẹt sử dụng cách tiếpcận thống kê. Máy không thể đoán đúng ngay được, nhưng càng về sau (vàitrăm lần đoán) máy càng trở nên chính xác một cách kinh ngạc(trung bình có thể lên đến 90%). Trên thực tế khi cài đặt chương trình này tác giả không chỉđoán qui luật từ dãy số của người chơi, máy còn sử dụng cả dãysố mà máy đã đoán III.2 Tiếp cận hình họcXét bài toán: cho tập các hình chữ nhật với kích thước (ngang & rộng)và màu sắc khác nhau (hình vẽ). Cho biết hình bên phải có màu gì? Ñoû Vaøng Cam Tía ? Xanh döông Ñoû Xanh laù caây Tím III.2 Tiếp cận hình học (tt)Giải quyết bài toán: Phản ứng tự nhiên củacon người: tìm khối có sẵn Ñoû Vaønggần giống để đoán màu 6 Tíacho khối chưa biết. Như Camthế nào là gần giống ? 4 U Biểu diễn 2 thuộc tínhchiều rộng & chiều cao Xanh döôngdưới dạng 1 điểm trên 2 Ñoû Xanh laù caâymặt phẳng 2 chiều. Tím Tính khoảng cách từkhối cần tìm đến tất cả 0 2 4 6các khối còn lại. (bài toánngười láng giềng gần nhấtvới độ phức tạp ...
Tìm kiếm theo từ khóa liên quan:
Khám phá tri thức bài giảng Khám phá tri thức tài liệu Khám phá tri thức cơ sở tri thức suy luận tri thức tri thức chuyên gia hệ tri thứcGợi ý tài liệu liên quan:
-
Xây dựng cơ sở tri thức cho thư viện các trường đại học - một yêu cầu cấp thiết
16 trang 34 0 0 -
Mô hình phát triển ứng dụng web ngữ nghĩa
3 trang 26 0 0 -
Luận văn tốt nghiệp: Khai mỏ dữ liệu và khám phá tri thức - ĐH Tây Đô
104 trang 26 0 0 -
Báo cáo các hệ tri thức - đề tài: giải trò sudoku
36 trang 25 0 0 -
Tìm hiểu Các hệ cơ sở tri thức
50 trang 25 0 0 -
Bài giảng Hệ cơ sở tri thức (Tuần 8)
3 trang 24 0 0 -
Bài giảng: Các hệ cơ sở tri thức - Trần Nguyên Hương
142 trang 23 0 0 -
Bài giảng Khai phá dữ liệu (Data mining) - Chương 1: Tổng quan về khai phá dữ liệu
60 trang 23 0 0 -
Bài giảng Khai phá dữ liệu - Chương 1: Tổng quan
14 trang 21 0 0 -
Bài giảng Trí tuệ nhân tạo: Bài 9 - Trương Xuân Nam
32 trang 21 0 0