Luận văn Thạc sĩ Hệ thống thông tin: Phát triển hệ thống dự đoán điểm thi tốt nghiệp của học sinh trung học phổ thông sử dụng kỹ thuật rừng ngẫu nhiên hồi quy
Số trang: 38
Loại file: pdf
Dung lượng: 1.24 MB
Lượt xem: 10
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận văn "Phát triển hệ thống dự đoán điểm thi tốt nghiệp của học sinh trung học phổ thông sử dụng kỹ thuật rừng ngẫu nhiên hồi quy" được hoàn thành với mục tiêu nhằm đề xuất một mô hình Random Forest Regression vào việc phân loại điểm tổng kết của học sinh, sử dụng kĩ thuật phân lớp. Xây dựng một hệ thống sử dụng mô hình đã được huấn luyện để tiên đoán ra điểm thi tốt nghiệp trung học phổ thông quốc gia, từ đó xây dựng một website có thể tiên đoán điểm thi tốt nghiệp trung học phổ thông quốc gia khi người dùng nhập điểm tổng kết các môn có liên quan đến kì thi.
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Hệ thống thông tin: Phát triển hệ thống dự đoán điểm thi tốt nghiệp của học sinh trung học phổ thông sử dụng kỹ thuật rừng ngẫu nhiên hồi quy UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT PHẠM THỊ HẢO PHÁT TRIỂN HỆ THỐNG DỰ ĐOÁN ĐIỂM THI TỐT NGHIỆP CỦA HỌC SINH THPT SỬ DỤNG KỸ THUẬT RỪNG NGẪU NHIÊN HỒI QUY CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ NGÀNH: 8480104 LUẬN VĂN THẠC SĨ BÌNH DƯƠNG, NĂM 2019 UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT PHẠM THỊ HẢO PHÁT TRIỂN HỆ THỐNG DỰ ĐOÁN ĐIỂM THI TỐT NGHIỆP CỦA HỌC SINH THPT SỬ DỤNG KỸ THUẬT RỪNG NGẪU NHIÊN HỒI QUY CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ NGÀNH: 8480104 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS QUẢN THÀNH THƠ BÌNH DƯƠNG, NĂM 2019 LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Phát triển hệ thống dự đoán điểm thi tốt nghiệp của học sinh trung học phổ thông sử dụng kỹ thuật rừng ngẫu nhiên hồi quy” là công trình nghiên cứu của tôi dưới sự hướng dẫn của PGS.TS Quản Thành Thơ xuất phát trên yêu cầu thực tế trong việc giảng dạy của tôi tại trường trung học phổ thông. Những nội dung được trình bày trong luận văn là quá trình học tập, tiếp thu và tích lũy kiến thức và là kết quả nghiên cứu của tôi, chưa từng công bố trước đây dưới bất cứ hình thức nào. Bình Dương, ngày … tháng… năm… Tác giả Phạm Thị Hảo LỜI CẢM ƠN Tôi xin chân thành cảm ơn quý thầy cô giáo trong khoa Kỹ thuật công nghệ trường đại học Thủ Dầu Một đã dạy dỗ truyền đạt những kiến thức quý báu cho tôi. Đặc biệt, tôi xin gửi lời cảm ơn sâu sắc đến PGS.TS Quản Thành Thơ đã tận tình hướng dẫn tôi để hoàn thành công trình nghiên cứu này. Tôi xin kính chúc quý thầy cô giáo luôn dồi dào sức khỏe để có thể tiếp tục sự nghiệp trồng người cao cả của mình. TÓM TẮT LUẬN VĂN Trong những năm gần đây, kì thi tốt nghiệp trung học phổ thông quốc gia thường xuyên được đổi mới về hình thức thi và nội dung đề thi. Do đó, giáo viên, phụ huynh và học sinh khối 12 ở các trường phổ thông càng quan tâm hơn nữa đến vấn đề học sinh được bao nhiêu điểm khi thi, liệu với những điểm đó có thể xét được các trường đại học nào… Vấn đề tiên đoán số điểm thi, các giáo viên giảng dạy trực tiếp có thể đoán được dựa trên năng lực học tập của các em hoặc các bậc phụ huynh sẽ đi xem bói để nghe thầy bói phán mà không có cơ sở khoa học nào, đôi khi dựa trên cảm tính. Ở lĩnh vực dự đoán, có rất nhiều mô hình sử dụng các kĩ thuật khác nhau như Weka, logic mờ, rừng ngẫu nhiên hồi quy… Rừng ngẫu nhiên là một phương pháp học tập chung để phân loại, hồi quy và các nhiệm vụ khác hoạt động bằng cách xây dựng vô số cây quyết định tại thời điểm đào tạo và đưa ra phân lớp (phân loại) hoặc dự đoán trung bình (hồi quy) của các cây riêng lẻ. Kể từ khi được giới thiệu bởi Breiman (2001), kĩ thuật rừng ngẫu nhiên đã thành công như một phương pháp phân loại và hồi quy có độ chính xác khá cao, được áp dụng vào nhiều mô hình tiên đoán. Trong đề tài luận văn này, tôi đề xuất một mô hình tiên đoán điểm thi tốt nghiệp trung học phổ thông quốc gia cho học sinh. Mô hình lấy điểm tổng kết các môn có tham gia thi để làm tập huấn luyện và tập kiểm thử trong kĩ thuật rừng hồi quy ngẫu nhiên để đưa ra các điểm dự đoán. Sau đó tiếp tục xây dựng hệ thống dự đoán điểm trên website để người dùng có thể nhập và dự đoán dựa vào mô hình đã xây dựng ở trên. 1 MỤC LỤC Đề mục ..................................................................................................... Trang Chương 1: Giới thiệu .................................................................................. 3 1.1 Đặt vấn đề ............................................................................................... 3 1.2 Mục tiêu và phạm vi nghiên cứu ............................................................ 3 1.3 Tổng quan về luận văn............................................................................ 4 Chương 2: Kiến thức nền tảng .................................................................. 5 2.1 Khai phá dữ liệu...................................................................................... 5 2.2 Học máy .................................................................................................. 6 2.3 Phương pháp rừng hồi quy ngẫu nhiên .................................................. 16 Chương 3: Xây dựng mô hình tiên đoán điểm bằng Random Forest ... 21 3.1 Kiến thức tổng quát của hệ thống ........................................................... 21 3.2 Mô tả dữ liệu của bài toán ...................................................................... 22 3.3 Chuẩn hóa dữ liệu để đưa vào mô hình Random Forest ........................ 23 Chương 4: Thí nghiệm ............................................................................... 24 4.1 Tập dữ liệu .............................................................................................. 24 4.2 Các thiết lập ............................................................................................ 24 4.3 Kết quả thực nghiệm ............................................................................... 25 4.4 Website tiên đoán điểm thi tốt nghiệp .................................................... 26 Chương 5: Công nghệ sử dụng .................................................................. 28 5.1 Ngôn ngữ lập trình ................................................ ...
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Hệ thống thông tin: Phát triển hệ thống dự đoán điểm thi tốt nghiệp của học sinh trung học phổ thông sử dụng kỹ thuật rừng ngẫu nhiên hồi quy UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT PHẠM THỊ HẢO PHÁT TRIỂN HỆ THỐNG DỰ ĐOÁN ĐIỂM THI TỐT NGHIỆP CỦA HỌC SINH THPT SỬ DỤNG KỸ THUẬT RỪNG NGẪU NHIÊN HỒI QUY CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ NGÀNH: 8480104 LUẬN VĂN THẠC SĨ BÌNH DƯƠNG, NĂM 2019 UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT PHẠM THỊ HẢO PHÁT TRIỂN HỆ THỐNG DỰ ĐOÁN ĐIỂM THI TỐT NGHIỆP CỦA HỌC SINH THPT SỬ DỤNG KỸ THUẬT RỪNG NGẪU NHIÊN HỒI QUY CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ NGÀNH: 8480104 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS QUẢN THÀNH THƠ BÌNH DƯƠNG, NĂM 2019 LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Phát triển hệ thống dự đoán điểm thi tốt nghiệp của học sinh trung học phổ thông sử dụng kỹ thuật rừng ngẫu nhiên hồi quy” là công trình nghiên cứu của tôi dưới sự hướng dẫn của PGS.TS Quản Thành Thơ xuất phát trên yêu cầu thực tế trong việc giảng dạy của tôi tại trường trung học phổ thông. Những nội dung được trình bày trong luận văn là quá trình học tập, tiếp thu và tích lũy kiến thức và là kết quả nghiên cứu của tôi, chưa từng công bố trước đây dưới bất cứ hình thức nào. Bình Dương, ngày … tháng… năm… Tác giả Phạm Thị Hảo LỜI CẢM ƠN Tôi xin chân thành cảm ơn quý thầy cô giáo trong khoa Kỹ thuật công nghệ trường đại học Thủ Dầu Một đã dạy dỗ truyền đạt những kiến thức quý báu cho tôi. Đặc biệt, tôi xin gửi lời cảm ơn sâu sắc đến PGS.TS Quản Thành Thơ đã tận tình hướng dẫn tôi để hoàn thành công trình nghiên cứu này. Tôi xin kính chúc quý thầy cô giáo luôn dồi dào sức khỏe để có thể tiếp tục sự nghiệp trồng người cao cả của mình. TÓM TẮT LUẬN VĂN Trong những năm gần đây, kì thi tốt nghiệp trung học phổ thông quốc gia thường xuyên được đổi mới về hình thức thi và nội dung đề thi. Do đó, giáo viên, phụ huynh và học sinh khối 12 ở các trường phổ thông càng quan tâm hơn nữa đến vấn đề học sinh được bao nhiêu điểm khi thi, liệu với những điểm đó có thể xét được các trường đại học nào… Vấn đề tiên đoán số điểm thi, các giáo viên giảng dạy trực tiếp có thể đoán được dựa trên năng lực học tập của các em hoặc các bậc phụ huynh sẽ đi xem bói để nghe thầy bói phán mà không có cơ sở khoa học nào, đôi khi dựa trên cảm tính. Ở lĩnh vực dự đoán, có rất nhiều mô hình sử dụng các kĩ thuật khác nhau như Weka, logic mờ, rừng ngẫu nhiên hồi quy… Rừng ngẫu nhiên là một phương pháp học tập chung để phân loại, hồi quy và các nhiệm vụ khác hoạt động bằng cách xây dựng vô số cây quyết định tại thời điểm đào tạo và đưa ra phân lớp (phân loại) hoặc dự đoán trung bình (hồi quy) của các cây riêng lẻ. Kể từ khi được giới thiệu bởi Breiman (2001), kĩ thuật rừng ngẫu nhiên đã thành công như một phương pháp phân loại và hồi quy có độ chính xác khá cao, được áp dụng vào nhiều mô hình tiên đoán. Trong đề tài luận văn này, tôi đề xuất một mô hình tiên đoán điểm thi tốt nghiệp trung học phổ thông quốc gia cho học sinh. Mô hình lấy điểm tổng kết các môn có tham gia thi để làm tập huấn luyện và tập kiểm thử trong kĩ thuật rừng hồi quy ngẫu nhiên để đưa ra các điểm dự đoán. Sau đó tiếp tục xây dựng hệ thống dự đoán điểm trên website để người dùng có thể nhập và dự đoán dựa vào mô hình đã xây dựng ở trên. 1 MỤC LỤC Đề mục ..................................................................................................... Trang Chương 1: Giới thiệu .................................................................................. 3 1.1 Đặt vấn đề ............................................................................................... 3 1.2 Mục tiêu và phạm vi nghiên cứu ............................................................ 3 1.3 Tổng quan về luận văn............................................................................ 4 Chương 2: Kiến thức nền tảng .................................................................. 5 2.1 Khai phá dữ liệu...................................................................................... 5 2.2 Học máy .................................................................................................. 6 2.3 Phương pháp rừng hồi quy ngẫu nhiên .................................................. 16 Chương 3: Xây dựng mô hình tiên đoán điểm bằng Random Forest ... 21 3.1 Kiến thức tổng quát của hệ thống ........................................................... 21 3.2 Mô tả dữ liệu của bài toán ...................................................................... 22 3.3 Chuẩn hóa dữ liệu để đưa vào mô hình Random Forest ........................ 23 Chương 4: Thí nghiệm ............................................................................... 24 4.1 Tập dữ liệu .............................................................................................. 24 4.2 Các thiết lập ............................................................................................ 24 4.3 Kết quả thực nghiệm ............................................................................... 25 4.4 Website tiên đoán điểm thi tốt nghiệp .................................................... 26 Chương 5: Công nghệ sử dụng .................................................................. 28 5.1 Ngôn ngữ lập trình ................................................ ...
Tìm kiếm theo từ khóa liên quan:
Luận văn Thạc sĩ Luận văn Thạc sĩ Hệ thống thông tin Hệ thống thông tin Kỹ thuật rừng ngẫu nhiên hồi quy Hệ thống dự đoán điểm thi tốt nghiệp Phương pháp rừng hồi quy ngẫu nhiênGợi ý tài liệu liên quan:
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 363 5 0 -
97 trang 324 0 0
-
Bài tập thực hành môn Phân tích thiết kế hệ thống thông tin
6 trang 314 0 0 -
97 trang 300 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 299 0 0 -
155 trang 272 0 0
-
115 trang 266 0 0
-
64 trang 258 0 0
-
26 trang 253 0 0
-
Bài thuyết trình Hệ thống thông tin trong bệnh viện
44 trang 241 0 0