Danh mục

Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớn

Số trang: 40      Loại file: pdf      Dung lượng: 1.70 MB      Lượt xem: 13      Lượt tải: 0    
Jamona

Phí tải xuống: 15,000 VND Tải xuống file đầy đủ (40 trang) 0
Xem trước 4 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớn giới thiệu chung, rừng ngẫu nhiên xiên phân (RF-ODT); kết quả thực nghiệm; hướng phát triển.
Nội dung trích xuất từ tài liệu:
Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớnGiới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnGiải thuật rừng ngẫu nhiên xiên phân (RF-ODT)cho phân lớp dữ liệu có số chiều lớnĐỗ Thanh NghịKhoa CNTT-TT, ĐH. Cần ThơSố 1 Lý Tự Trọng, Ninh Kiều, Cần ThơEmail: dtnghi@cit.ctu.edu.vnhttp://www.cit.ctu.edu.vn/∼dtnghiĐHBK Tp.HCM, 27/03/2014Đỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn1/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnNội dungGiới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn2/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnCây quyết định: top 10 giải thuật khai mỏ dữ liệu hiệu quả(Wu et al., 08)Đỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn3/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnCây quyết định: top 10 giải thuật khai mỏ dữ liệu hiệu quả(Wu et al., 08)Ưu điểm của cây quyết địnhthời gian huấn luyện nhanhxử lý được dữ liệu liên tục, rời rạcmô hình dễ diễn dịch (luật if ... then ...)kết quả tốt cho phân lớp, hồi quyKhuyết điểm của cây quyết địnhhàm phân hoạch: đơn biếnkhông hiệu quả cho vấn đề phức tạp: số chiều rất lớn (nhiễu),mất cân bằng, phi tuyếnĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn4/ 40Giới thiệuRừng ngẫu nhiên xiên phân (RF-ODT)Kết quả thực nghiệmHướng phát triểnTop 10 vấn đề khó của khai mỏ dữ liệu (Yang & Wu, 06)Phân lớp dữ liệu có số chiều lớn#individus#dimensionsvài trăm phần tử với hàng nghìn chiềudữ liệu hoàn toàn dễ tách biệtcó nhiều lựa chọn mô hìnhmô hình học thường cho độ chính xác 100% trong tập họcnhưng dự báo tập kiểm tra không tốtmô hình tốt: dự báo tốt trong tương laiĐỗ Thanh NghịRF-ODT cho phân lớp dữ liệu có số chiều lớn5/ 40

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: