Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớn
Số trang: 40
Loại file: pdf
Dung lượng: 1.70 MB
Lượt xem: 13
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớn giới thiệu chung, rừng ngẫu nhiên xiên phân (RF-ODT); kết quả thực nghiệm; hướng phát triển.
Nội dung trích xuất từ tài liệu:
Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớnGiới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnGiải thuật rừng ngẫu nhiên xiên phân (RF-ODT)cho phân lớp dữ liệu có số chiều lớnĐỗ Thanh NghịKhoa CNTT-TT, ĐH. Cần ThơSố 1 Lý Tự Trọng, Ninh Kiều, Cần ThơEmail: dtnghi@cit.ctu.edu.vnhttp://www.cit.ctu.edu.vn/∼dtnghiĐHBK Tp.HCM, 27/03/2014Đỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn1/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnNội dungGiới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn2/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnCây quyết định: top 10 giải thuật khai mỏ dữ liệu hiệu quả(Wu et al., 08)Đỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn3/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnCây quyết định: top 10 giải thuật khai mỏ dữ liệu hiệu quả(Wu et al., 08)Ưu điểm của cây quyết địnhthời gian huấn luyện nhanhxử lý được dữ liệu liên tục, rời rạcmô hình dễ diễn dịch (luật if ... then ...)kết quả tốt cho phân lớp, hồi quyKhuyết điểm của cây quyết địnhhàm phân hoạch: đơn biếnkhông hiệu quả cho vấn đề phức tạp: số chiều rất lớn (nhiễu),mất cân bằng, phi tuyếnĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn4/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnTop 10 vấn đề khó của khai mỏ dữ liệu (Yang & Wu, 06)Phân lớp dữ liệu có số chiều lớn#individus#dimensionsvài trăm phần tử với hàng nghìn chiềudữ liệu hoàn toàn dễ tách biệtcó nhiều lựa chọn mô hìnhmô hình học thường cho độ chính xác 100% trong tập họcnhưng dự báo tập kiểm tra không tốtmô hình tốt: dự báo tốt trong tương laiĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn5/ 40
Nội dung trích xuất từ tài liệu:
Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớnGiới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnGiải thuật rừng ngẫu nhiên xiên phân (RF-ODT)cho phân lớp dữ liệu có số chiều lớnĐỗ Thanh NghịKhoa CNTT-TT, ĐH. Cần ThơSố 1 Lý Tự Trọng, Ninh Kiều, Cần ThơEmail: dtnghi@cit.ctu.edu.vnhttp://www.cit.ctu.edu.vn/∼dtnghiĐHBK Tp.HCM, 27/03/2014Đỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn1/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnNội dungGiới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn2/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnCây quyết định: top 10 giải thuật khai mỏ dữ liệu hiệu quả(Wu et al., 08)Đỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn3/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnCây quyết định: top 10 giải thuật khai mỏ dữ liệu hiệu quả(Wu et al., 08)Ưu điểm của cây quyết địnhthời gian huấn luyện nhanhxử lý được dữ liệu liên tục, rời rạcmô hình dễ diễn dịch (luật if ... then ...)kết quả tốt cho phân lớp, hồi quyKhuyết điểm của cây quyết địnhhàm phân hoạch: đơn biếnkhông hiệu quả cho vấn đề phức tạp: số chiều rất lớn (nhiễu),mất cân bằng, phi tuyếnĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn4/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnTop 10 vấn đề khó của khai mỏ dữ liệu (Yang & Wu, 06)Phân lớp dữ liệu có số chiều lớn#individus#dimensionsvài trăm phần tử với hàng nghìn chiềudữ liệu hoàn toàn dễ tách biệtcó nhiều lựa chọn mô hìnhmô hình học thường cho độ chính xác 100% trong tập họcnhưng dự báo tập kiểm tra không tốtmô hình tốt: dự báo tốt trong tương laiĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn5/ 40
Tìm kiếm theo từ khóa liên quan:
Phương pháp nghiên cứu khoa học Bài giảng Phương pháp nghiên cứu khoa học Giải thuật rừng ngẫu nhiên xiên phân Rừng ngẫu nhiên xiên phân Phân lớp dữ liệu Phân lớp dữ liệu có số chiều lớn Giải thuật khai mở dữ liệuGợi ý tài liệu liên quan:
-
Tiểu luận: Phương pháp Nghiên cứu Khoa học trong kinh doanh
27 trang 492 0 0 -
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 351 1 0 -
Đề cương bài giảng Phương pháp nghiên cứu khoa học - Trường Đại học Công nghiệp dệt may Hà Nội
74 trang 275 0 0 -
23 trang 223 0 0
-
8 trang 194 0 0
-
Tài liệu về phương pháp nghiên cứu khoa học
9 trang 177 0 0 -
Phương pháp luận nghiên cứu khoa học - Nguyễn Văn Hộ, Nguyễn Đăng Bình
95 trang 170 0 0 -
Tiểu luận môn Phương pháp nghiên cứu khoa học: Năng lượng xanh - Trường ĐH Sư phạm TP. HCM
64 trang 166 0 0 -
Bài giảng Phương phương pháp nghiên cứu khoa học du lịch - PGS.TS. Trần Đức Thanh
131 trang 165 1 0 -
Tiểu luận môn học: Nghiên cứu khả năng hấp phụ đồng của vât liệu chế tạo từ bùn thải mạ
18 trang 148 0 0