LUẬN VĂN: ÁP DỤNG PHưƠNG PHÁP TRÍCH CHỌN THUỘC TÍNH ĐẶC TRƯNG ĐỂ NÂNG CAO HIỆU QUẢ PHÂN LỚP KHI KHAI PHÁ DỮ LIỆU LỚN
Số trang: 58
Loại file: pdf
Dung lượng: 1.28 MB
Lượt xem: 8
Lượt tải: 0
Xem trước 6 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Trong khóa luận này tôi áp dụng thuật toán di truyền (Genetic Algorithm) để bước đầu cải tiến hiệu quả phân lớp của phương pháp minimax probability machine (MPM). Phần đầu tôi xin giới thiệu tổng quan về khái niệm khai phá dữ liệu. Tiếp đó, tôi sẽ trình bày về cơ sở lý thuyết của thuật toán di truyền và phương pháp phân lớp minimax probability machine. Cuối cùng, tôi sẽ mô tả chi tiết về quá trình xây dựng hệ thống có ứng dụng thuật toán di truyền trong phân lớp minimax probability machine để chuẩn đoán bệnh...
Nội dung trích xuất từ tài liệu:
LUẬN VĂN:ÁP DỤNG PHưƠNG PHÁP TRÍCH CHỌN THUỘC TÍNH ĐẶC TRƯNG ĐỂ NÂNG CAO HIỆU QUẢ PHÂN LỚP KHI KHAI PHÁ DỮ LIỆU LỚN ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Trần Phương NhungÁP DỤNG PHƢƠNG PHÁP TRÍCH CHỌN THUỘC TÍNH ĐẶC TRƢNG ĐỂ NÂNG CAO HIỆU QUẢ PHÂN LỚP KHI KHAI PHÁ DỮ LIỆU LỚN KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2009 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Trần Phương NhungÁP DỤNG PHƢƠNG PHÁP TRÍCH CHỌN THUỘC TÍNH ĐẶC TRƢNG ĐỂ NÂNG CAO HIỆU QUẢ PHÂN LỚP KHI KHAI PHÁ DỮ LIỆU LỚN KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hướng dẫn: TS. Nguyễn Hà Nam HÀ NỘI - 2009 Lời cảm ơn “Để hoàn thành khóa luận này, tôi xin gửi lời cảm ơn chân thành tới quý thầy côtrong trường Đại học Công Nghệ - ĐHQGHN đã tận tình chỉ bảo tôi trong suốt bốn nămhọc đại học. Tôi cũng xin cảm ơn sự hướng dẫn nhiệt tình của thầy Nguyễn Hà Nam,cùng sự giúp đỡ của anh Đặng Tất Đạt – sinh viên cao học khoa Toán Tin trường Đạihọc Tự Nhiên, ĐHQGHN. Tôi cũng thầm biết ơn sự ủng hộ của gia đình, bạn bè – những người thân yêu luônluôn là chỗ dựa tinh thần vững chắc cho tôi.” Hà Nội, tháng 05 năm 2009. Sinh viên Trần Phương Nhung Tóm tắt khóa luận Trong khóa luận này tôi áp dụng thuật toán di truyền (Genetic Algorithm) để bướcđầu cải tiến hiệu quả phân lớp của phương pháp minimax probability machine (MPM).Phần đầu tôi xin giới thiệu tổng quan về khái niệm khai phá dữ liệu. Tiếp đó, tôi sẽ trìnhbày về cơ sở lý thuyết của thuật toán di truyền và phương pháp phân lớp minimaxprobability machine. Cuối cùng, tôi sẽ mô tả chi tiết về quá trình xây dựng hệ thống cóứng dụng thuật toán di truyền trong phân lớp minimax probability machine để chuẩn đoánbệnh ung thư. Mô hình phân lớp mới này sẽ được chạy thử trên một số cơ sở dữ liệu lớnvà đưa ra những số liệu thống kê để có thể thấy được hiệu quả của hệ thống so vớiphương pháp phân lớp chỉ sử dụng minimax probability machine. 1 Mục lụcGiới thiệu......................................................................................................................... 8Chương 1: Giới thiệu về khai phá dữ liệu.................................................................... 10 Khai phá dữ liệu là gì?...................................................................................... 10 1.1. Tại sao phải tiến hành khai phá dữ liệu? ........................................................... 10 1.2. Quá trình khai phá dữ liệu ................................................................................ 11 1.3. Kiến trúc điển hình của một hệ khai phá dữ liệu ............................................... 12 1.4. Các bài toán khai phá dữ liệu điển hình ............................................................ 13 1.5. Các lĩnh vực liên quan đến khai phá dữ liệu ..................................................... 15 1.6. Các ứng dụng điển hình của khai phá dữ liệu ................................................... 15 1.7. Các thách thức với khai phá dữ liệu .................................................................. 16 1.8. Kết luận ............................................................................................................ 16 1.9.Chương 2: Trích chọn thuộc tính phù hợp .................................................................. 17 Giới thiệu ......................................................................................................... 17 2.1. Mô hình trong bài toán trích chọn ..................................................................... 18 2.2. Các mô hình trong trích chọn .................................................................... 18 2.2.1. Đánh giá hai mô hình Filter và Wrapper ................................................... 19 2.2.2. 2.2.2.1. Mô hình Filter .................................................................................... 19 2.2.2.2. Mô hình Wrapper ............................................................................... 19 Một số kỹ thuật xử lý........................................................................................ 20 2.3. Bộ sinh tập co ...
Nội dung trích xuất từ tài liệu:
LUẬN VĂN:ÁP DỤNG PHưƠNG PHÁP TRÍCH CHỌN THUỘC TÍNH ĐẶC TRƯNG ĐỂ NÂNG CAO HIỆU QUẢ PHÂN LỚP KHI KHAI PHÁ DỮ LIỆU LỚN ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Trần Phương NhungÁP DỤNG PHƢƠNG PHÁP TRÍCH CHỌN THUỘC TÍNH ĐẶC TRƢNG ĐỂ NÂNG CAO HIỆU QUẢ PHÂN LỚP KHI KHAI PHÁ DỮ LIỆU LỚN KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2009 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Trần Phương NhungÁP DỤNG PHƢƠNG PHÁP TRÍCH CHỌN THUỘC TÍNH ĐẶC TRƢNG ĐỂ NÂNG CAO HIỆU QUẢ PHÂN LỚP KHI KHAI PHÁ DỮ LIỆU LỚN KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hướng dẫn: TS. Nguyễn Hà Nam HÀ NỘI - 2009 Lời cảm ơn “Để hoàn thành khóa luận này, tôi xin gửi lời cảm ơn chân thành tới quý thầy côtrong trường Đại học Công Nghệ - ĐHQGHN đã tận tình chỉ bảo tôi trong suốt bốn nămhọc đại học. Tôi cũng xin cảm ơn sự hướng dẫn nhiệt tình của thầy Nguyễn Hà Nam,cùng sự giúp đỡ của anh Đặng Tất Đạt – sinh viên cao học khoa Toán Tin trường Đạihọc Tự Nhiên, ĐHQGHN. Tôi cũng thầm biết ơn sự ủng hộ của gia đình, bạn bè – những người thân yêu luônluôn là chỗ dựa tinh thần vững chắc cho tôi.” Hà Nội, tháng 05 năm 2009. Sinh viên Trần Phương Nhung Tóm tắt khóa luận Trong khóa luận này tôi áp dụng thuật toán di truyền (Genetic Algorithm) để bướcđầu cải tiến hiệu quả phân lớp của phương pháp minimax probability machine (MPM).Phần đầu tôi xin giới thiệu tổng quan về khái niệm khai phá dữ liệu. Tiếp đó, tôi sẽ trìnhbày về cơ sở lý thuyết của thuật toán di truyền và phương pháp phân lớp minimaxprobability machine. Cuối cùng, tôi sẽ mô tả chi tiết về quá trình xây dựng hệ thống cóứng dụng thuật toán di truyền trong phân lớp minimax probability machine để chuẩn đoánbệnh ung thư. Mô hình phân lớp mới này sẽ được chạy thử trên một số cơ sở dữ liệu lớnvà đưa ra những số liệu thống kê để có thể thấy được hiệu quả của hệ thống so vớiphương pháp phân lớp chỉ sử dụng minimax probability machine. 1 Mục lụcGiới thiệu......................................................................................................................... 8Chương 1: Giới thiệu về khai phá dữ liệu.................................................................... 10 Khai phá dữ liệu là gì?...................................................................................... 10 1.1. Tại sao phải tiến hành khai phá dữ liệu? ........................................................... 10 1.2. Quá trình khai phá dữ liệu ................................................................................ 11 1.3. Kiến trúc điển hình của một hệ khai phá dữ liệu ............................................... 12 1.4. Các bài toán khai phá dữ liệu điển hình ............................................................ 13 1.5. Các lĩnh vực liên quan đến khai phá dữ liệu ..................................................... 15 1.6. Các ứng dụng điển hình của khai phá dữ liệu ................................................... 15 1.7. Các thách thức với khai phá dữ liệu .................................................................. 16 1.8. Kết luận ............................................................................................................ 16 1.9.Chương 2: Trích chọn thuộc tính phù hợp .................................................................. 17 Giới thiệu ......................................................................................................... 17 2.1. Mô hình trong bài toán trích chọn ..................................................................... 18 2.2. Các mô hình trong trích chọn .................................................................... 18 2.2.1. Đánh giá hai mô hình Filter và Wrapper ................................................... 19 2.2.2. 2.2.2.1. Mô hình Filter .................................................................................... 19 2.2.2.2. Mô hình Wrapper ............................................................................... 19 Một số kỹ thuật xử lý........................................................................................ 20 2.3. Bộ sinh tập co ...
Tìm kiếm theo từ khóa liên quan:
luận văn công nghệ thông tin khai phá dữ liệu lớn sử dụng minimax probability machine. thuật toán di truyền phương pháp phân lớp minimax probability machine.Gợi ý tài liệu liên quan:
-
52 trang 414 1 0
-
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 296 0 0 -
Thảo luận đề tài: Mối quan hệ giữa đầu tư theo chiều rộng và đầu tư theo chiều sâu
98 trang 291 0 0 -
Báo cáo thực tập thực tế: Nghiên cứu và xây dựng website bằng Wordpress
24 trang 287 0 0 -
74 trang 280 0 0
-
96 trang 280 0 0
-
Tài liệu dạy học môn Tin học trong chương trình đào tạo trình độ cao đẳng
348 trang 267 1 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng di động android quản lý khách hàng cắt tóc
81 trang 266 0 0 -
EBay - Internet và câu chuyện thần kỳ: Phần 1
143 trang 255 0 0 -
Tài liệu hướng dẫn sử dụng thư điện tử tài nguyên và môi trường
72 trang 248 0 0