Danh mục

BÁO CÁO ỨNG DỤNG KHAI PHÁ DỮ LIỆU XÂY DỰNG CÔNG CỤ DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN

Số trang: 8      Loại file: pdf      Dung lượng: 536.21 KB      Lượt xem: 14      Lượt tải: 0    
10.10.2023

Phí tải xuống: 8,000 VND Tải xuống file đầy đủ (8 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trên cơ sở dữ liệu thông tin tuyển sinh đầu vào và kết quả học tập đã thu thập được của sinh viên thuộc hệ đào tạo chính quy của một trường cao đẳng ở Miền Trung, đề tài tiến hành nghiên cứu các kỹ thuật cho phép phân lớp trong khai phá dữ liệu, ứng dụng các kỹ thuật đó để xây dựng mô hình dự đoán kết quả học tập của sinh viên. Đề tài tiến hành so sánh kết quả của các kỹ thuật để lựa chọn kỹ thuật cho kết quả chính xác nhất. Từ đó,...
Nội dung trích xuất từ tài liệu:
BÁO CÁO "ỨNG DỤNG KHAI PHÁ DỮ LIỆU XÂY DỰNG CÔNG CỤ DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN " Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012 ỨNG DỤNG KHAI PHÁ DỮ LIỆU XÂY DỰNG CÔNG CỤ DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN THE APPLICATION OF DATA MINING FOR BUILDING TOOL TO FORCAST THE LEARNING RESULTS OF STUDENTS SVTH: Nguyễn Thị Thanh Thủy Lớp 34K14, Khoa Thống kê - Tin học, Trường Đại học Kinh tế, Đại học Đà Nẵng GVHD: TS. Nguyễn Trần Quốc Vinh Khoa Thống kê - Tin học, Trường Đại học Kinh tế, Đại học Đà Nẵng TÓM TẮT Trên cơ sở dữ liệu thông tin tuyển sinh đầu vào và kết quả học tập đã thu thập được của sinh viên thuộc hệ đào tạo chính quy của một trường cao đẳng ở Miền Trung, đề tài tiến hành nghiên cứu các kỹ thuật cho phép phân lớp trong khai phá dữ liệu, ứng dụng các kỹ thuật đó để xây dựng mô hình dự đoán kết quả học tập của sinh viên. Đề tài tiến hành so sánh kết quả của các kỹ thuật để lựa chọn kỹ thuật cho kết quả chính xác nhất. Từ đó, xây dựng chương trình dự báo kết quả học tập cho mỗi sinh viên để tư vấn cho sinh viên chọn lộ trình học phù hợp nhất để đạt được kết quả học tập cao nhất. Từ khóa: Sinh viên; các kỹ thuật; kết quả; dự đoán kết quả học tập; dữ liệu ABSTRACT Basing on the university entrance examination enrollment and result data of students studying at a Junior college in central Viet Nam, this studies different techniques for classific ation tasks by exploiting the above data and applies these techniques to formulate a model for student’s academic result prediction. This also compares the effectiveness of each technique to that of the others to finally select the best one that will be us ed as the foundation for establishing a program of student’s academic result prediction so as to advise students the most suitable way of study for the best academic result. Key words: Student; techniques; result; academic result prediction; data 1. Đặt vấn đề Ngày nay, các trường đại học và cao đẳng đã chuyển sang đào tạo theo học chế tín chỉ. Việc tư vấn học tập, chủ yếu liên quan đến việc lựa chọn lộ trình học phù hợp nhằm đạt được kết quả học tập cao nhất cho mỗi sinh viên được đặc biệt quan tâm. Đó cũng là khó khăn chung không chỉ của mỗi sinh viên, mà còn của các bên tham gia tư vấn, từ các tổ chức quản lý trong trường đại học cho đến các cán bộ được phân công chuyên trách như giảng viên chủ nhiệm. Các giảng viên chuyên trách không thể tiếp cận toàn bộ dữ liệu về điểm của sinh viên. Ngay cả với các cấp quản lý, bằng cảm tính hoặc suy luận thủ công từ khối dữ liệu khổng lồ để đưa ra những tư vấn tốt trong việc chọn lộ trình học cho mỗi sinh viên không phải là khả thi. Tại Việt Nam, việc nghiên cứu khai phá dữ liệu trong lĩnh vực giáo dục đào tạo còn chưa được quan tâm đúng mức. Đã có một số công trình được công bố sử dụng hồ sơ cá nhân cũng như điểm đầu vào để dự báo kết quả học tập toàn khoá hoặc giai đoạn của sinh viên, nhưng tác giả chưa gặp công trình nghiên cứu nào có sử dụng lộ trình học để dự báo kết quả học tập. 1 Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012 Vì vậy, đề tài “Ứng dụng khai phá dữ liệu xây dựng công cụ dự đoán kết quả học tập của sinh viên” đi sâu vào việc khai phá dữ liệu từ thông tin cá nhân, điểm tuyển sinh đầu vào kết hợp với lộ trình học để dự đoán kết quả học tập của sinh viên. Đề tài tiến hành nghiên cứu các kỹ thuật cho phép phân lớp trong khai phá dữ liệu, ứng dụng các kỹ thuật đó để xây dựng các mô hình dự đoán kết quả học tập của sinh viên bằng công cụ SQL Server Business Intelligence Development Studio. Từ đó, đánh giá và lựa chọn mô hình cũng như kỹ thuật cho kết quả dự đoán tốt nhất để ứng dụng và xây dựng chương trình dự báo kết quả học tập cho mỗi sinh viên. Kết quả dự đoán đó có thể được dùng để tư vấn cho sinh viên lựa chọn lộ trình học phù hợp để đạt được kết quả học tập cao nhất. 2. Phân tích xây dựng mô hình Quá trình khai phá dữ liệu được tiến hành theo quy trình chuẩn, bao gồm các bước thu thập, làm sạch, trích lọc, chuyển đổi dữ liệu về dạng phù hợp, ứng dụng kỹ thuật khai phá dữ liệu để xây dựng mô hình và đánh giá kết quả thu được. Nguồn dữ liệu cho việc khai phá nhằm dự đoán kết quả học tập sẽ được thu thập từ nhiều nguồn dữ liệu khác nhau. Hồ sơ cá nhân của sinh viên đã nộp vào trường để dự tuyển được phân công nhập vào các bảng tính excel, bao gồm các thông tin như họ tên, ngày sinh, nơi sinh, phái, dân tộc, khu vực, điểm ưu tiên.... Ngoài hồ sơ mà thí sinh nộp vào trường còn một nguồn dữ liệu quan trọng khác đó là dữ liệu từ kết quả thi tuyển hằng năm như số báo danh, khối thi, ngành chọn thi, điểm thi các môn, điểm ưu tiên, kết quả (Đậu, Hỏng). Nguồn dữ liệu quan trọng nữa, đó là thông tin kết quả học tập toàn khoá cũng như các môn học mỗi sinh viên chọn học ở mỗi học kỳ như: mã sinh viên, ngành học, môn học, kết quả ... Dữ liệu cần xử lý được thu thập từ các bộ phận quản lý. Vì vậy, dữ liệu có tính trung thực cao, hầu hết đều phản ánh đúng ngữ nghĩa. Tuy nhiên, do bộ phận quản lý hay thay đổi và hệ thống lưu trữ quản lý thông tin sinh viên chưa đ ược nâng cao, nên dữ liệu thu thập không được liên tục theo thời gian, một số trường dữ liệu bị thiếu do việc cập nhật ban đầu không đầy đủ hoặc chưa được nhập liệu. Từ đó loại bỏ ra các bản ghi có trường dữ liệu bị thiếu hoặc bị trùng lặp, các môn học, ngành học đều được quy ước mã. Kết quả, tác giả thu được gần 70.000 bản ghi về điểm tổng kết học phần và dữ liệu cá nhân, tuyển sinh cho hơn 2000 sinh viên thuộc hệ đào tạo chính quy bậc cao đẳng tại một trường cao đẳng ở Miền Trung. Dữ liệu trong các tệp e ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: