Danh mục

Báo cáo nghiên cứu khoa học: PHỤ THUỘC DỮ LIỆU VÀ TÁC ĐỘNG CỦA NÓ ĐỐI VỚI BÀI TOÁN PHÂN LỚP CỦA KHAI PHÁ DỮ LIỆU

Số trang: 10      Loại file: pdf      Dung lượng: 197.76 KB      Lượt xem: 5      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Tuyển tập các báo cáo nghiên cứu khoa học của trường đại học Huế: PHỤ THUỘC DỮ LIỆU VÀ TÁC ĐỘNG CỦA NÓ ĐỐI VỚI BÀI TOÁN PHÂN LỚP CỦA KHAI PHÁ DỮ LIỆU...
Nội dung trích xuất từ tài liệu:
Báo cáo nghiên cứu khoa học: " PHỤ THUỘC DỮ LIỆU VÀ TÁC ĐỘNG CỦA NÓ ĐỐI VỚI BÀI TOÁN PHÂN LỚP CỦA KHAI PHÁ DỮ LIỆU"TẠP CHÍ KHOA HỌC, Đại học Huế, Số 53, 2009 PHỤ THUỘC DỮ LIỆU VÀ TÁC ĐỘNG CỦA NÓ ĐỐI VỚI BÀI TOÁN PHÂN LỚP CỦA KHAI PHÁ DỮ LIỆU Lê V n T ng Lân ờư ă Tr ng i h c Khoa h c, i h c Hu ờư ạĐ ọ ọ ạĐ ọ ế TÓM TẮT Cây quy t nh là m t trong nh ng gi i pháp tr c quan và h u hi u mô t quá trình ịđ ế ộ ữ ả ự ữ ểđ ệ ảphân l p d li u. Trên cây quy t nh, chúng ta d dàng tìm ra các lu t, nh ng lu t này cung ệữ ớ ịđ ế ễ ậ ữ ậc p thông tin ra quy t nh gi i quy t m t v n nào ó. Xây d ng m t cây quy t nh ph c ấ ểđ ịđ ế ả ế ềđ ấ ộ đ ự ộ ịđ ế ụv khai phá d li u hi u qu ph thu c vào vi c ch n t p m u hu n luy n. Trong th c t , d ụ ệữ ệ ụả ộ ệ ọ ậ ẫ ấ ệ ữếựli u nghi p v c l u tr r t a d ng và ph c t p cho nên vi c ch n t t b d li u m u còn ệ ợưđ ụ ệ ạ đấữ ư ạứ ệ ệữộ ố ọ ẫg p nhi u khó kh n. ặ ề ă Trong bài báo này, chúng tôi t p trung phân tích s ph thu c t nhiên và s ph thu c ậ ự ụ ựộ ự ụ ộtheo t ng quan hàm s c a d li u, nh m lo i b nh ng tính toán d th a trong thu t toán h c ơư ệữ ủố ằ ữỏạ ừư ậ ọquy n p và các s ph thu c d li u m u hu n luy n, t o d ng cây quy t nh có kh n ng d ạ ụự ẫ ởệữ ộ ấ ạệ ự ịđ ế ăả ự oán cao, nh m h tr ra quy t nh trong các bài toán phân tích d li u.đ ợỗ ằ ịđ ế ệữ T khoá: Khai phá d li u, phát hi n tri th c, cây quy t nh, m u hu n luy n, ph ừ ệữ ệ ứ ịđ ế ẫ ấ ệ ụthu c hàm, ph thu c hàm x p x , phân l p d li u. ộ ụ ộ ỉấ ớ ệữI. Đặt vấn đề Một trong những đích khai phá dữ liệu trong thực tế nhằm đạt đến là mô tả cácmẫu dữ liệu, mỗi một sự mô tả là thể hiện những tri thức được khai phá. Sự phân lớp làquá trình nhằm đến một trong những mục đích ấy. Cây quyết định là một trong nhữnggiải pháp trực quan và hữu hiệu để mô tả quá trình phân lớp dữ liệu. Do cây quyết địnhrất hữu dụng nên đã có nhiều nghiên cứu để xây dựng nó mà nổi bật là các thuật toánhọc quy nạp như CATD, ID3, C45,...[3, 4, 5, 7, 9, 10]. Xây dựng cây quyết định có khả năng dự đoán cao, là một trong những mục tiêuquan trọng của khai phá dữ liệu. Để xây dựng được một cây quyết định có hiệu quả thìngoài các thuật toán học quy nạp tốt, việc chọn mẫu huấn luyện đóng một vai trò đángkể. Khi chọn mẫu huấn luyện, sự phụ thuộc tự nh ...

Tài liệu được xem nhiều:

Tài liệu liên quan: