Giải pháp hỗ trợ sinh viên lập kế hoạch học tập dựa trên tiếp cận tập thô
Số trang: 8
Loại file: pdf
Dung lượng: 506.45 KB
Lượt xem: 19
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết này đề xuất một phương pháp mới trong dự đoán kết quả học tập của sinh viên nhằm hỗ trợ sinh viên lập kế hoạch học tập phù hợp. Thực nghiệm trên dữ liệu thực tế để xác định các sinh viên có thuộc diện “cảnh báo” hay “không cảnh báo” đã cho thấy phương pháp này có khả năng dự đoán tốt hơn so với các phương pháp khai phá dữ liệu tiêu biểu như Cây quyết định, láng giềng lân cận và một số phương pháp sinh luật khác. Tiếp cận tập thô cũng đã cho thấy nó rất hiệu quả trong trường hợp dữ liệu mất cân bằng.
Nội dung trích xuất từ tài liệu:
Giải pháp hỗ trợ sinh viên lập kế hoạch học tập dựa trên tiếp cận tập thô Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR'9)”; Cần Thơ, ngày 4-5/8/2016 DOI: 10.15625/vap.2016.00019 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ Lê Đức Thắng1, Trương Thị Hải2, Nguyễn Thái Nghe1, Huỳnh Xuân Hiệp1 1 Khoa CNTT&TT, Trường Đại học Cần Thơ 2 Khoa Công Nghệ, Trường Đại học Phú Xuân {ldthang,ntnghe,hxhiep}@cit.ctu.edu.vn, trnhai208@gmail.com TÓM TẮT—Lý thuyết tập thô (rough set theory) đã được xây dựng trên một nền tảng toán học vững chắc vì thế được ứng dụng trong khá nhiều lĩnh vực, đặc biệt là ứng dụng trong khoa học máy tính như giải quyết bài toán phân lớp (đa nhãn hoặc đơn nhãn), phân cụm và luật kết hợp. Dựa trên tiếp cận tập thô, bài viết này đề xuất một phương pháp mới trong dự đoán kết quả học tập của sinh viên nhằm hỗ trợ sinh viên lập kế hoạch học tập phù hợp. Thực nghiệm trên dữ liệu thực tế để xác định các sinh viên có thuộc diện “cảnh báo” hay “không cảnh báo” đã cho thấy phương pháp này có khả năng dự đoán tốt hơn so với các phương pháp khai phá dữ liệu tiêu biểu như Cây quyết định, láng giềng lân cận và một số phương pháp sinh luật khác. Tiếp cận tập thô cũng đã cho thấy nó rất hiệu quả trong trường hợp dữ liệu mất cân bằng. Từ khóa—Lý thuyết tập thô; bảng quyết định; luật quyết định; dữ liệu mất cân bằng; lựa chọn môn học. I. GIỚI THIỆU Lý thuyết tập thô (rough set theory) - do Zdzislaw Pawlak đề xuất năm 1982 [14] - được xây dựng trên một nền tảng toán học vững chắc vì thế được ứng dụng trong khá nhiều lĩnh vực, đặc biệt là ứng dụng trong khoa học máy tính như giải quyết bài toán phân lớp (đa nhãn hoặc đơn nhãn), phân cụm và luật kết hợp. Bài viết này sẽ đề xuất sử dụng lý thuyết tập thô trong xây dựng hệ thống hỗ trợ giáo dục đào tạo, đặc biệt là việc dự đoán kết quả học tập của sinh viên. Thật vậy, dự đoán kết quả học tập của sinh viên một các chính xác là rất hữu ích trong nhiều ngữ cảnh khác nhau ở các trường đào tạo đại học và sau đại học. Chẳng hạn, xác định các ứng viên xuất sắc để tham gia các đội tuyển tin học, hoặc cấp học bổng nhằm khuyến khích họ nỗ lực hơn nữa trong học tập, hay việc xác định các sinh viên có năng lực yếu kém để có những biện pháp thích hợp nhằm hỗ trợ họ học tập tốt hơn. Thời gian gần đây, số lượng sinh viên bị buộc thôi học có chiều hướng tăng ở nhiều trường đại học (chẳng hạn như tại Đại học Cần Thơ, hàng năm có trên dưới 150 sinh viên thuộc diện buộc thôi học do kết quả học tập yếu kém [4]) và thường tập trung vào những sinh viên học năm thứ ba và năm thứ tư. Một phần nguyên nhân là do sinh viên không có kế hoạch học tập phù hợp. Hiện tượng này đã gây tổn thất lớn cho bản thân sinh viên, gia đình và toàn xã hội. Chính vì thế việc phát hiện sớm các học viên yếu kém để giúp họ lập kế hoạch học tập sao cho ph hợp là một nhu cầu rất cần thiết. Dự đoán kết quả học tập của sinh viên cũng đã được nhiều nhà nghiên cứu quan tâm, như trong [1][2][3][5][7][8][10][11]. Hàng năm đều có hội thảo quốc tế chuyên về lĩnh vực này (xem chi tiết tại www.educationaldatamining.org), ở đó ta có thể tìm thấy những nghiên cứu gần nhất. Tuy nhiên phần lớn các nghiên cứu trên tập trung vào việc ứng dụng các kỹ thuật trong khai phá dữ liệu (data mining) trong dự đoán kết quả học tập của sinh viên [12][13]. Nghiên cứu này sẽ đề xuất một phương pháp mới trong dự đoán kết quả học tập của sinh viên dựa trên tiếp cận tập thô. Trước hết, bài viết sẽ giới thiệu một trong những ưu điểm của lý thuyết tập thô, là d ng để đơn giản hóa thông tin trước khi sinh ra luật quyết định, do đó tập luật thu được khá tối tiểu nhưng vẫn bao hàm được thông tin mong muốn. Sau đó đề xuất ứng dụng cho bài toán dự đoán/phân lớp (prediction/classification) sinh viên thuộc diện cảnh báo học vụ hay không, từ đó hỗ trợ họ lập kế hoạch học tập phù hợp. Thực nghiệm trên dữ liệu thực tế đã cho thấy phương pháp này có khả năng dự đoán tốt hơn so với các phương pháp khai phá dữ liệu truyền thống khác như Cây quyết định, láng giềng lân cận, SVM,… đặc biệt là trong trường hợp dữ liệu mất cân bằng (imbalanced data). Trong các phần tiếp theo, bài viết sẽ giới thiệu ngắn gọn về lý thuyết tập thô cũng như minh họa cho bài toán phân lớp dựa trên các luật sinh ra, sau cùng là mô hình đề xuất và kết quả thực nghiệm. II. LÝ THUYẾT TẬP THÔ A. Hệ thống thông tin quyết định Thông thường một hệ thống biểu diễn tri thức được mô tả bằng hệ thống thông tin quyết định, đó là một bộ bốn DIS = (U, A{d}, V, f ). Ở đó, U là một tập hợp hữu hạn các đối tượng; A là một tập hợp hữu hạn các thuộc tính điều kiện, dA là thuộc tính quyết định. Mỗi thuộc tính a A{d} định nghĩa một hàm thông tin f a : U Va , với Va là miền giá trị của a, và V là tập hợp các Va . Một hệ thống thông tin quyết định được mô tả bằng một bảng quyết định như ví dụ sau. 152 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ Bảng 1. ảng quyết định U A {d} a1 a2 a3 x1 2 ...
Nội dung trích xuất từ tài liệu:
Giải pháp hỗ trợ sinh viên lập kế hoạch học tập dựa trên tiếp cận tập thô Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR'9)”; Cần Thơ, ngày 4-5/8/2016 DOI: 10.15625/vap.2016.00019 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ Lê Đức Thắng1, Trương Thị Hải2, Nguyễn Thái Nghe1, Huỳnh Xuân Hiệp1 1 Khoa CNTT&TT, Trường Đại học Cần Thơ 2 Khoa Công Nghệ, Trường Đại học Phú Xuân {ldthang,ntnghe,hxhiep}@cit.ctu.edu.vn, trnhai208@gmail.com TÓM TẮT—Lý thuyết tập thô (rough set theory) đã được xây dựng trên một nền tảng toán học vững chắc vì thế được ứng dụng trong khá nhiều lĩnh vực, đặc biệt là ứng dụng trong khoa học máy tính như giải quyết bài toán phân lớp (đa nhãn hoặc đơn nhãn), phân cụm và luật kết hợp. Dựa trên tiếp cận tập thô, bài viết này đề xuất một phương pháp mới trong dự đoán kết quả học tập của sinh viên nhằm hỗ trợ sinh viên lập kế hoạch học tập phù hợp. Thực nghiệm trên dữ liệu thực tế để xác định các sinh viên có thuộc diện “cảnh báo” hay “không cảnh báo” đã cho thấy phương pháp này có khả năng dự đoán tốt hơn so với các phương pháp khai phá dữ liệu tiêu biểu như Cây quyết định, láng giềng lân cận và một số phương pháp sinh luật khác. Tiếp cận tập thô cũng đã cho thấy nó rất hiệu quả trong trường hợp dữ liệu mất cân bằng. Từ khóa—Lý thuyết tập thô; bảng quyết định; luật quyết định; dữ liệu mất cân bằng; lựa chọn môn học. I. GIỚI THIỆU Lý thuyết tập thô (rough set theory) - do Zdzislaw Pawlak đề xuất năm 1982 [14] - được xây dựng trên một nền tảng toán học vững chắc vì thế được ứng dụng trong khá nhiều lĩnh vực, đặc biệt là ứng dụng trong khoa học máy tính như giải quyết bài toán phân lớp (đa nhãn hoặc đơn nhãn), phân cụm và luật kết hợp. Bài viết này sẽ đề xuất sử dụng lý thuyết tập thô trong xây dựng hệ thống hỗ trợ giáo dục đào tạo, đặc biệt là việc dự đoán kết quả học tập của sinh viên. Thật vậy, dự đoán kết quả học tập của sinh viên một các chính xác là rất hữu ích trong nhiều ngữ cảnh khác nhau ở các trường đào tạo đại học và sau đại học. Chẳng hạn, xác định các ứng viên xuất sắc để tham gia các đội tuyển tin học, hoặc cấp học bổng nhằm khuyến khích họ nỗ lực hơn nữa trong học tập, hay việc xác định các sinh viên có năng lực yếu kém để có những biện pháp thích hợp nhằm hỗ trợ họ học tập tốt hơn. Thời gian gần đây, số lượng sinh viên bị buộc thôi học có chiều hướng tăng ở nhiều trường đại học (chẳng hạn như tại Đại học Cần Thơ, hàng năm có trên dưới 150 sinh viên thuộc diện buộc thôi học do kết quả học tập yếu kém [4]) và thường tập trung vào những sinh viên học năm thứ ba và năm thứ tư. Một phần nguyên nhân là do sinh viên không có kế hoạch học tập phù hợp. Hiện tượng này đã gây tổn thất lớn cho bản thân sinh viên, gia đình và toàn xã hội. Chính vì thế việc phát hiện sớm các học viên yếu kém để giúp họ lập kế hoạch học tập sao cho ph hợp là một nhu cầu rất cần thiết. Dự đoán kết quả học tập của sinh viên cũng đã được nhiều nhà nghiên cứu quan tâm, như trong [1][2][3][5][7][8][10][11]. Hàng năm đều có hội thảo quốc tế chuyên về lĩnh vực này (xem chi tiết tại www.educationaldatamining.org), ở đó ta có thể tìm thấy những nghiên cứu gần nhất. Tuy nhiên phần lớn các nghiên cứu trên tập trung vào việc ứng dụng các kỹ thuật trong khai phá dữ liệu (data mining) trong dự đoán kết quả học tập của sinh viên [12][13]. Nghiên cứu này sẽ đề xuất một phương pháp mới trong dự đoán kết quả học tập của sinh viên dựa trên tiếp cận tập thô. Trước hết, bài viết sẽ giới thiệu một trong những ưu điểm của lý thuyết tập thô, là d ng để đơn giản hóa thông tin trước khi sinh ra luật quyết định, do đó tập luật thu được khá tối tiểu nhưng vẫn bao hàm được thông tin mong muốn. Sau đó đề xuất ứng dụng cho bài toán dự đoán/phân lớp (prediction/classification) sinh viên thuộc diện cảnh báo học vụ hay không, từ đó hỗ trợ họ lập kế hoạch học tập phù hợp. Thực nghiệm trên dữ liệu thực tế đã cho thấy phương pháp này có khả năng dự đoán tốt hơn so với các phương pháp khai phá dữ liệu truyền thống khác như Cây quyết định, láng giềng lân cận, SVM,… đặc biệt là trong trường hợp dữ liệu mất cân bằng (imbalanced data). Trong các phần tiếp theo, bài viết sẽ giới thiệu ngắn gọn về lý thuyết tập thô cũng như minh họa cho bài toán phân lớp dựa trên các luật sinh ra, sau cùng là mô hình đề xuất và kết quả thực nghiệm. II. LÝ THUYẾT TẬP THÔ A. Hệ thống thông tin quyết định Thông thường một hệ thống biểu diễn tri thức được mô tả bằng hệ thống thông tin quyết định, đó là một bộ bốn DIS = (U, A{d}, V, f ). Ở đó, U là một tập hợp hữu hạn các đối tượng; A là một tập hợp hữu hạn các thuộc tính điều kiện, dA là thuộc tính quyết định. Mỗi thuộc tính a A{d} định nghĩa một hàm thông tin f a : U Va , với Va là miền giá trị của a, và V là tập hợp các Va . Một hệ thống thông tin quyết định được mô tả bằng một bảng quyết định như ví dụ sau. 152 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ Bảng 1. ảng quyết định U A {d} a1 a2 a3 x1 2 ...
Tìm kiếm theo từ khóa liên quan:
Giải pháp hỗ trợ lập kế hoạch học tập Lập kế hoạch học tập Hỗ trợ sinh viên lập kế hoạch học tập Lý thuyết tập thô Dự đoán kết quả học tập của sinh viênTài liệu liên quan:
-
Bài giảng Kỹ năng mềm - Chương 3: Kỹ năng tự học và lập kế hoạch học tập
33 trang 51 0 0 -
7 BƯỚC LẬP KẾ HOẠCH HỌC TẬP HIỆU QUẢ
3 trang 44 0 0 -
Đề xuất cải tiến lược đồ độ đo trong lý thuyết tập thô
2 trang 39 0 0 -
Một số tính chất của phủ suy dẫn từ họ phủ tập thô
11 trang 25 0 0 -
Luận văn: Luật kết hợp theo tiếp cận lý thuyết tập thô và khai phá dữ liệu song song
82 trang 23 0 0 -
Tóm tắt luận văn Thạc sĩ: Nghiên cứu ứng dụng lý thuyết tập thô trong trích chọn dữ liệu
27 trang 22 0 0 -
Năng lực tự học của sinh viên khối ngành kỹ thuật trường Đại học Hải Dương
6 trang 21 0 0 -
Luận văn Thạc sĩ ngành Công nghệ thông tin: Phân cụm thô của dữ liệu tuần tự
53 trang 19 0 0 -
Khai phá dữ liệu trên hệ thông tin đa trị
8 trang 19 0 0 -
10 trang 18 0 0