Báo cáo thực tập tốt nghiệp: Khai phá dữ liệu bằng cây quyết định và ứng dụng
Số trang: 45
Loại file: pdf
Dung lượng: 1.70 MB
Lượt xem: 13
Lượt tải: 0
Xem trước 5 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Báo cáo thực tập tốt nghiệp: Khai phá dữ liệu bằng cây quyết định và ứng dụng có cấu trúc gồm 3 chương với nội dung trình bày về công nghệ khai phá trí thức; các phương pháp khai phá dữ liệu bằng cây quyết định; cài đặt chương trình khai phá dữ liệu sử dụng cây quyết định. Tài liệu hữu ích với những bạn chuyên ngành Công nghệ thông tin và những bạn quan tâm tới lĩnh vực này.
Nội dung trích xuất từ tài liệu:
Báo cáo thực tập tốt nghiệp: Khai phá dữ liệu bằng cây quyết định và ứng dụng TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN ------------ BÁO CÁO THỰC TẬP TỐT NGHIỆPĐỀ TÀI: KHAI PHÁ DỮ LIỆU BẰNG CÂY QUYẾT ĐỊNH VÀ ỨNG DỤNG Giảng viên hướng dẫn: Ths. Trần Hùng Cường Sinh viên thực hiện: Nguyễn Bá Nguyện Lớp: Khoa học máy tính 3 Khóa: 4 Hà Nội, Tháng 3 năm 2013 LỜI MỞ ĐẦU Trong thời đại ngày nay, yếu tố quyết định thành công trong mọi lĩnh vực luôn gắnliền với việc nắm bắt, thống kê và khai thác thông tin hiệu quả. Dữ liệu ngày càng lớnnên việc tìm ra những thông tin tiềm ẩn trong chúng càng khó khăn hơn. Khai phá tri thức là một lĩnh vực nghiên cứu mới, mở ra một thời kỳ trong việctìm ra thông tin hữu ích. Nhiệm vụ cơ bản của lĩnh vực này là khai phá tri thức trongcơ sở dữ liệu, khai phá dữ liệu trong cơ sở dữ liệu không phải là một hệ thống phântích tự động mà là một quá trình tương tác thường xuyên giữa con người với cơ sở dữliệu được sự trợ giúp của nhiều phương pháp và công cụ tin học. Em xin bày tỏ sự biết ơn sâu sắc của mình tới Ths Trần Hùng Cường người đã trựctiếp hướng dẫn, chỉ bảo tận tình, cung cấp tài liệu và phương pháp nghiên cứu khoahọc để em hoàn thành bản luận văn này. Em xin gửi lời cảm ơn tới các thầy cô giáo đãdạy dỗ trong quá trình em theo học tại Trường. Trong suốt quá trình nghiên cứu, mặc dù đã hết sức cố gắng nhưng chắc chắn bàiluận không tránh khỏi những thiếu sót, rất mong quý thầy cô góp ý để luận văn đượchoàn chỉnh hơn. Em xin chân thành cảm ơn! Ký tên Nguyện Nguyễn Bá Nguyện TÓM TẮT NỘI DUNGNội dung luận văn em xin trình bày bao gồm ba chương:Chương một: giới thiệu chung về công nghệ khai phá trí thức, các khái niệm cơ bản, ýnghĩa và tầm quan trọng của việc khai phá tri thức.Chương hai: trình bày các phương pháp khai phá dữ liệu bằng cây quyết định, kháiniệm cơ bản về cây quyết định, các thuật toán xây dựng cây quyết định: CLS, ID3,C4.5, rút gọn các luật quyết định và đánh giá các thuật toán xây dựng cây quyết định.Chương ba: cài đặt chương trình hỗ trợ ra quyết đinh bằng cây quyết đinh dựa trênthuật toán C4.5. MỤC LỤCLỜI MỞ ĐẦU .............................................................................................................. 2TÓM TẮT NỘI DUNG ............................................................................................... 3MỤC LỤC ................................................................................................................... 4DANH SÁCH HÌNH VẼ ............................................................................................. 6PHẦN MỞ ĐẦU ......................................................................................................... 7CHƢƠNG 1: GIỚI THIỆU CHUNG VỀ KHAI PHÁ TRI THỨC......................... 81.1 Phát hiện tri thức và khai phá dữ liệu........................................................................... 81.2 Quá trình phát hiện tri thức từ cơ sở dữ liệu ................................................................ 8 1.2.1. Hình thành và định nghĩa bài toán. ...................................................... 9 1.2.2. Thu thập và xử lý dữ liệu. ..................................................................... 9 1.2.3. Khai thác dữ liệu và rút ra tri thức ..................................................... 10 1.2.4. Phân tích và đánh giá tri thức ............................................................ 10 1.2.5. Sử dụng tri thức phát hiện được ......................................................... 101.3. Khai phá dữ liệu ......................................................................................................... 11 1.3.1. Các quan niệm về khai phá dữ liệu. .................................................... 11 1.3.2. Quá trình khái phá dữ liệu. ................................................................. 12 1.3.3. Kiến trúc của hệ thống khai phá dữ liệu. ............................................ 141.4. Các kỹ thuật khai phá dữ liệu ..................................................................................... 15 1.4.1. Phân lớp dữ liệu .................................................................................. 15 1.4.2. Phân cụm dữ liệu ................................................................................ 16 1.4.3. ...
Nội dung trích xuất từ tài liệu:
Báo cáo thực tập tốt nghiệp: Khai phá dữ liệu bằng cây quyết định và ứng dụng TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN ------------ BÁO CÁO THỰC TẬP TỐT NGHIỆPĐỀ TÀI: KHAI PHÁ DỮ LIỆU BẰNG CÂY QUYẾT ĐỊNH VÀ ỨNG DỤNG Giảng viên hướng dẫn: Ths. Trần Hùng Cường Sinh viên thực hiện: Nguyễn Bá Nguyện Lớp: Khoa học máy tính 3 Khóa: 4 Hà Nội, Tháng 3 năm 2013 LỜI MỞ ĐẦU Trong thời đại ngày nay, yếu tố quyết định thành công trong mọi lĩnh vực luôn gắnliền với việc nắm bắt, thống kê và khai thác thông tin hiệu quả. Dữ liệu ngày càng lớnnên việc tìm ra những thông tin tiềm ẩn trong chúng càng khó khăn hơn. Khai phá tri thức là một lĩnh vực nghiên cứu mới, mở ra một thời kỳ trong việctìm ra thông tin hữu ích. Nhiệm vụ cơ bản của lĩnh vực này là khai phá tri thức trongcơ sở dữ liệu, khai phá dữ liệu trong cơ sở dữ liệu không phải là một hệ thống phântích tự động mà là một quá trình tương tác thường xuyên giữa con người với cơ sở dữliệu được sự trợ giúp của nhiều phương pháp và công cụ tin học. Em xin bày tỏ sự biết ơn sâu sắc của mình tới Ths Trần Hùng Cường người đã trựctiếp hướng dẫn, chỉ bảo tận tình, cung cấp tài liệu và phương pháp nghiên cứu khoahọc để em hoàn thành bản luận văn này. Em xin gửi lời cảm ơn tới các thầy cô giáo đãdạy dỗ trong quá trình em theo học tại Trường. Trong suốt quá trình nghiên cứu, mặc dù đã hết sức cố gắng nhưng chắc chắn bàiluận không tránh khỏi những thiếu sót, rất mong quý thầy cô góp ý để luận văn đượchoàn chỉnh hơn. Em xin chân thành cảm ơn! Ký tên Nguyện Nguyễn Bá Nguyện TÓM TẮT NỘI DUNGNội dung luận văn em xin trình bày bao gồm ba chương:Chương một: giới thiệu chung về công nghệ khai phá trí thức, các khái niệm cơ bản, ýnghĩa và tầm quan trọng của việc khai phá tri thức.Chương hai: trình bày các phương pháp khai phá dữ liệu bằng cây quyết định, kháiniệm cơ bản về cây quyết định, các thuật toán xây dựng cây quyết định: CLS, ID3,C4.5, rút gọn các luật quyết định và đánh giá các thuật toán xây dựng cây quyết định.Chương ba: cài đặt chương trình hỗ trợ ra quyết đinh bằng cây quyết đinh dựa trênthuật toán C4.5. MỤC LỤCLỜI MỞ ĐẦU .............................................................................................................. 2TÓM TẮT NỘI DUNG ............................................................................................... 3MỤC LỤC ................................................................................................................... 4DANH SÁCH HÌNH VẼ ............................................................................................. 6PHẦN MỞ ĐẦU ......................................................................................................... 7CHƢƠNG 1: GIỚI THIỆU CHUNG VỀ KHAI PHÁ TRI THỨC......................... 81.1 Phát hiện tri thức và khai phá dữ liệu........................................................................... 81.2 Quá trình phát hiện tri thức từ cơ sở dữ liệu ................................................................ 8 1.2.1. Hình thành và định nghĩa bài toán. ...................................................... 9 1.2.2. Thu thập và xử lý dữ liệu. ..................................................................... 9 1.2.3. Khai thác dữ liệu và rút ra tri thức ..................................................... 10 1.2.4. Phân tích và đánh giá tri thức ............................................................ 10 1.2.5. Sử dụng tri thức phát hiện được ......................................................... 101.3. Khai phá dữ liệu ......................................................................................................... 11 1.3.1. Các quan niệm về khai phá dữ liệu. .................................................... 11 1.3.2. Quá trình khái phá dữ liệu. ................................................................. 12 1.3.3. Kiến trúc của hệ thống khai phá dữ liệu. ............................................ 141.4. Các kỹ thuật khai phá dữ liệu ..................................................................................... 15 1.4.1. Phân lớp dữ liệu .................................................................................. 15 1.4.2. Phân cụm dữ liệu ................................................................................ 16 1.4.3. ...
Tìm kiếm theo từ khóa liên quan:
Khai phá dữ liệu bằng cây quyết định Báo cáo thực tập Công nghệ thông tin Thuật toán xây dựng cây quyết định Chương trình khai phá dữ liệu Ưu điểm của cây quyết định Kiểu của cây quyết địnhGợi ý tài liệu liên quan:
-
74 trang 294 0 0
-
48 trang 198 0 0
-
Báo cáo Thực tập công nhân CNTT
187 trang 145 0 0 -
Báo cáo thực tập Công nghệ thông tin: Lập trình game trên Unity
27 trang 118 0 0 -
57 trang 105 0 0
-
Báo cáo thực tập Hệ quản trị cơ sở dữ liệu Access: Quản lý học sinh
44 trang 101 0 0 -
Báo cáo thực tập tốt nghiệp Công nghệ thông tin: Tìm hiểu và triển khai Android Apps trên GooglePlay
72 trang 57 0 0 -
Báo cáo thực tập: Tìm hiểu mạng LAN cho cơ quan xí nghiệp
55 trang 50 0 0 -
Luận văn tốt nghiệp: Khai mỏ dữ liệu và khám phá tri thức - ĐH Tây Đô
104 trang 26 0 0 -
Báo cáo thực tập tốt nghiệp: Xây dựng website quản lý thư viện trường Đại học Điện Lực
135 trang 23 0 0