![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Luận văn Thạc sĩ Công nghệ thông tin: Sử dụng cây quyết định phân lớp dữ liệu mất cân đối
Số trang: 71
Loại file: pdf
Dung lượng: 2.20 MB
Lượt xem: 11
Lượt tải: 0
Xem trước 8 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận văn "Sử dụng cây quyết định phân lớp dữ liệu mất cân đối" được thực hiện với mục tiêu chính như thách thức của bài toán phân lớp dữ liệu mất cân đối là vấn đề về đối tượng cần quan tâm nghiên cứu lại có rất ít mẫu - mẫu lớp thiểu số so với các lớp khác trong tập dữ liệu - mẫu lớp đa số.
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Công nghệ thông tin: Sử dụng cây quyết định phân lớp dữ liệu mất cân đối BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGOẠI NGỮ TIN HỌC THÀNH PHỐ HỒ CHÍ MINH LÊ THANH PHONG SỬ DỤNG CÂY QUYẾT ĐỊNHPHÂN LỚP DỮ LIỆU MẤT CÂN ĐỐI LUẬN VĂN THẠC SỸ NGÀNH CÔNG NGHỆ THÔNG TIN Mã số: 60 48 02 01 TP. HCM, THÁNG 10 NĂM 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGOẠI NGỮ TIN HỌC THÀNH PHỐ HỒ CHÍ MINH LÊ THANH PHONG SỬ DỤNG CÂY QUYẾT ĐỊNHPHÂN LỚP DỮ LIỆU MẤT CÂN ĐỐI LUẬN VĂN THẠC SỸ Ngành: CÔNG NGHỆ THÔNG TIN Mã số: 60 48 02 01 NGƯỜI HƯỚNG DẪN KHOA HỌC PGS. TS. LÊ HOÀI BẮC TP. HCM, THÁNG 10 NĂM 2018 CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC THÀNH PHỐ HỒ CHÍ MINH Người hướng dẫn khoa học: PGS. TS. Lê Hoài Bắc- Học viên đã bảo vệ thành công luận văn ngày 04 tháng 06 năm 2019, tại Hội đồngđánh giá luận văn thạc sĩ thành lập theo Quyết định số …. ngày …. /…./2019 của Hiệutrưởng Trường ĐH Ngoại ngữ -Tin học TP.HCM, với sự tham gia của: Chủ tịch Hội đồng: PGS.TS. Phạm Thế Bảo Phản biện 1: TS. Trần Minh Thái Phản biện 2: TS. Đặng Trường Sơn Ủy viên: PGS.TS Nguyễn Thanh Bình Thư ký: TS. Nguyễn Đức Cường- Có thể tìm hiểu Luận văn tại Thư viện của Trường ĐH Ngoại ngữ - Tin họcTPHCM, hoặc trên cổng thông tin điện tử, website của đơn vị quản lý sau đại học củaTrường. LỜI CAM ĐOANTôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong Luậnvăn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác.Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này đã được cảm ơn và cácthông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc. TPHCM, ngày 25 tháng 10 năm 2018 Tác giả luận văn Lê Thanh Phong LỜI CẢM ƠN Lời đầu tôi xin chân thành cảm ơn PGS. TS. Lê Hoài Bắc đã tận tình hướng dẫn cũngnhư cung cấp tài liệu thông tin khoa học cần thiết cho luận văn này. Xin chân thành cảm ơn Lãnh đạo trường Đại học Ngoại ngữ Tin học Thành Phố Hồ ChíMinh, Ban Sau Đại Học, Khoa Công Nghệ Thông Tin đã tạo điều kiện cho tôi hoàn thành tốtcông việc nghiên cứu khoa học của mình.Cuối cùng, tôi xin chân thành cảm ơn đến gia đình, các anh chị và các bạn đồng nghiệp, đơn vịcông tác đã hỗ trợ cho tôi rất nhiều trong suốt quá trình học tập, nghiên cứu và thực hiện đề tàiluận văn thạc sĩ một cách hoàn chỉnh.Tôi xin chân thành cảm ơn! Tác giả Lê Thanh Phong DANH MỤC VIẾT TẮTSTT Từ viết tắt Ý nghĩa 1 AUC Area Under the ROC Curve 2 CLS Concept Learning System 3 CSC4.5 Cost-Sensitive C4.5 4 CSDL Cơ Sở Dữ Liệu 5 FN False Negative 6 FP False Positive 7 FPR False Positive Rate 8 ID3 Interactive Dichotomizer 3 9 ILA Inductive Learning Algorithm 10 KTDL Khai Thác Dữ Liệu 11 MDL Minimum Description Length 12 NB Naïve Bayes 13 ROC Receiver Operating Characteristic 14 SC4.5 Standard C4.5 15 SQL Structured Query Language 16 TN True Negative 17 TP True Positive 18 TPR True Positive Rate 19 UCI University of California Irvine (Machine Learning Repository) i DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊHình 2-1: Quá trình khai thác dữ liệu ........................................................................................ 7Hình 2-3: Quá trình phân lớp dữ liệu - Bước xây dựng mô hình phân lớp ............................... 9Hình 2-4: Quá trình phân lớp dữ liệu – Ước lượng độ chính xác mô hình.............................. 10Hình 2-5: Quá trình phân lớp dữ liệu – Phân lớp dữ liệu mới ................................................. 11Hình 2-6: Mô hình ứng dụng luật ............................................................................................ 15Hình 2-7: Phương pháp Holdout.............................................................................................. 28Hình 2-8: ...
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Công nghệ thông tin: Sử dụng cây quyết định phân lớp dữ liệu mất cân đối BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGOẠI NGỮ TIN HỌC THÀNH PHỐ HỒ CHÍ MINH LÊ THANH PHONG SỬ DỤNG CÂY QUYẾT ĐỊNHPHÂN LỚP DỮ LIỆU MẤT CÂN ĐỐI LUẬN VĂN THẠC SỸ NGÀNH CÔNG NGHỆ THÔNG TIN Mã số: 60 48 02 01 TP. HCM, THÁNG 10 NĂM 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGOẠI NGỮ TIN HỌC THÀNH PHỐ HỒ CHÍ MINH LÊ THANH PHONG SỬ DỤNG CÂY QUYẾT ĐỊNHPHÂN LỚP DỮ LIỆU MẤT CÂN ĐỐI LUẬN VĂN THẠC SỸ Ngành: CÔNG NGHỆ THÔNG TIN Mã số: 60 48 02 01 NGƯỜI HƯỚNG DẪN KHOA HỌC PGS. TS. LÊ HOÀI BẮC TP. HCM, THÁNG 10 NĂM 2018 CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC THÀNH PHỐ HỒ CHÍ MINH Người hướng dẫn khoa học: PGS. TS. Lê Hoài Bắc- Học viên đã bảo vệ thành công luận văn ngày 04 tháng 06 năm 2019, tại Hội đồngđánh giá luận văn thạc sĩ thành lập theo Quyết định số …. ngày …. /…./2019 của Hiệutrưởng Trường ĐH Ngoại ngữ -Tin học TP.HCM, với sự tham gia của: Chủ tịch Hội đồng: PGS.TS. Phạm Thế Bảo Phản biện 1: TS. Trần Minh Thái Phản biện 2: TS. Đặng Trường Sơn Ủy viên: PGS.TS Nguyễn Thanh Bình Thư ký: TS. Nguyễn Đức Cường- Có thể tìm hiểu Luận văn tại Thư viện của Trường ĐH Ngoại ngữ - Tin họcTPHCM, hoặc trên cổng thông tin điện tử, website của đơn vị quản lý sau đại học củaTrường. LỜI CAM ĐOANTôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong Luậnvăn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác.Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này đã được cảm ơn và cácthông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc. TPHCM, ngày 25 tháng 10 năm 2018 Tác giả luận văn Lê Thanh Phong LỜI CẢM ƠN Lời đầu tôi xin chân thành cảm ơn PGS. TS. Lê Hoài Bắc đã tận tình hướng dẫn cũngnhư cung cấp tài liệu thông tin khoa học cần thiết cho luận văn này. Xin chân thành cảm ơn Lãnh đạo trường Đại học Ngoại ngữ Tin học Thành Phố Hồ ChíMinh, Ban Sau Đại Học, Khoa Công Nghệ Thông Tin đã tạo điều kiện cho tôi hoàn thành tốtcông việc nghiên cứu khoa học của mình.Cuối cùng, tôi xin chân thành cảm ơn đến gia đình, các anh chị và các bạn đồng nghiệp, đơn vịcông tác đã hỗ trợ cho tôi rất nhiều trong suốt quá trình học tập, nghiên cứu và thực hiện đề tàiluận văn thạc sĩ một cách hoàn chỉnh.Tôi xin chân thành cảm ơn! Tác giả Lê Thanh Phong DANH MỤC VIẾT TẮTSTT Từ viết tắt Ý nghĩa 1 AUC Area Under the ROC Curve 2 CLS Concept Learning System 3 CSC4.5 Cost-Sensitive C4.5 4 CSDL Cơ Sở Dữ Liệu 5 FN False Negative 6 FP False Positive 7 FPR False Positive Rate 8 ID3 Interactive Dichotomizer 3 9 ILA Inductive Learning Algorithm 10 KTDL Khai Thác Dữ Liệu 11 MDL Minimum Description Length 12 NB Naïve Bayes 13 ROC Receiver Operating Characteristic 14 SC4.5 Standard C4.5 15 SQL Structured Query Language 16 TN True Negative 17 TP True Positive 18 TPR True Positive Rate 19 UCI University of California Irvine (Machine Learning Repository) i DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊHình 2-1: Quá trình khai thác dữ liệu ........................................................................................ 7Hình 2-3: Quá trình phân lớp dữ liệu - Bước xây dựng mô hình phân lớp ............................... 9Hình 2-4: Quá trình phân lớp dữ liệu – Ước lượng độ chính xác mô hình.............................. 10Hình 2-5: Quá trình phân lớp dữ liệu – Phân lớp dữ liệu mới ................................................. 11Hình 2-6: Mô hình ứng dụng luật ............................................................................................ 15Hình 2-7: Phương pháp Holdout.............................................................................................. 28Hình 2-8: ...
Tìm kiếm theo từ khóa liên quan:
Luận văn Thạc sĩ Luận văn Thạc sĩ Công nghệ thông tin Cây quyết định phân lớp dữ liệu Phân lớp dữ liệu mất cân đối Khai thác dữ liệuTài liệu liên quan:
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 368 5 0 -
97 trang 335 0 0
-
97 trang 322 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 305 0 0 -
155 trang 296 0 0
-
64 trang 270 0 0
-
115 trang 270 0 0
-
26 trang 269 0 0
-
70 trang 226 0 0
-
128 trang 226 0 0