Ứng dụng kỹ thuật phân cụm và luật kết hợp phân tích tình hình học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng
Số trang: 7
Loại file: pdf
Dung lượng: 767.41 KB
Lượt xem: 18
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Nghiên cứu tập trung vào kỹ thuật phân cụm và luật kết hợp để phân tích tình hình học tiếng Anh của sinh viên nhà Trường nhằm giúp Trường nắm được đặc điểm, thực trạng và mong muốn của sinh viên trong việc học tiếng Anh từ đó đưa ra các tư vấn, định hướng và đề xuất các giải pháp nhằm nâng cao hiệu quả của việc dạy và học tiếng Anh cho sinh viên trong Trường.
Nội dung trích xuất từ tài liệu:
Ứng dụng kỹ thuật phân cụm và luật kết hợp phân tích tình hình học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng Nguyễn Văn Chức, Trần Thị Quỳnh Tiên 175 Ứng dụng kỹ thuật phân cụm và luật kết hợp phân tích tình hình học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng Nguyễn Văn Chức, Trần Thị Quỳnh Tiên Trường Đại học Kinh tế - Đại học Đà Nẵng chuc.nv@due.edu.vn, quynhtien96@gmail.com Tóm tắt. Vấn đề nâng cao năng lực tiếng Anh cho sinh viên của các trường Đại học đang là yêu cầu cấp thiết, giúp sinh viên đáp ứng yêu cầu ngày càng cao của thị trường lao động nhất là trong bối cảnh hội nhập quốc tế. Một trong những khó khăn của các trường Đại học trong việc dạy tiếng Anh cho sinh viên là do mỗi sinh viên có sự khác nhau về đầu tư cho việc học tiếng Anh của mình (thời gian, kinh phí, quyết tâm…) dẫn đến kỹ năng tiếng Anh của mỗi người là không giống nhau. Việc này gây khó khăn cho các trường đại học trong việc xây dựng chương trình học tiếng Anh cho sinh viên một cách hiệu quả. Để có được cái nhìn tổng quan về thực trạng việc học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng, nghiên cứu tập trung vào kỹ thuật phân cụm và luật kết hợp để phân tích tình hình học tiếng Anh của sinh viên nhà Trường nhằm giúp Trường nắm được đặc điểm, thực trạng và mong muốn của sinh viên trong việc học tiếng Anh từ đó đưa ra các tư vấn, định hướng và đề xuất các giải pháp nhằm nâng cao hiệu quả của việc dạy và học tiếng Anh cho sinh viên trong Trường. Từ khóa: Phân tích dữ liệu, phân cụm, luật kết hợp, học tiếng Anh, Khai phá dữ liệu. 1 Đặt vấn đề Trong xu thế toàn cầu hóa và hội nhập quốc tế ngày nay, khả năng ngoại ngữ, đặc biệt là tiếng Anh đóng một vai trò rất quan trọng trong tất cả các hoạt động từ giao tiếp, học tập, công việc... Ở Việt Nam, tiếng Anh đã được giảng dạy từ rất sớm trong các trường học từ bậc tiểu học đến đại học. Bên cạnh đó, các trung tâm ngoại ngữ cũng đóng góp tích cực vào việc đào tạo năng lực tiếng Anh đáp ứng yêu cầu học tập của người học. Ở bậc đại học, năng lực ngoại ngữ (chủ yếu là tiếng Anh) của sinh viên được các trường đại học rất coi trọng và có nhiều giải pháp giúp sinh viên hoàn thiện kỹ năng ngoại ngữ như đưa năng lực ngoại ngữ là chuẩn đầu ra để tốt nghiệp, nhiều chương trình đào tạo dạy bằng tiếng Anh… Vì vậy, việc nắm được đặc điểm, xu hướng và thực trạng học tiếng Anh của sinh viên trong các trường đạị học là việc làm rất cần thiết, giúp các trường đại học có được cái nhìn tổng quan về năng lực tiếng Anh của sinh viên, từ đó đề xuất các chính sách, định hướng và tư vấn giúp sinh viên nâng cao năng lực tiếng Anh. Để phân tích thực trạng học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng, sau quá trình thu thập dữ liệu về tình hình học tiếng Anh của sinh viên trong Trường, nghiên cứu tập trung vào ứng dụng kỹ thuật phân cụm và luật kết hợp trong khai phá dữ liệu để để phân tích, giúp nhà Trường có được các thông tin cần thiết về thực trạng, đặc điểm và mong muốn học tiếng Anh của sinh viên. Từ đó, đề xuất những giải pháp phù hợp trong tư vấn, định hướng và giảng dạy giúp nâng cao năng lực tiếng Anh cho sinh viên. 2 Sơ lược về kỹ thuật phân cụm và luật kết hợp 2.1 Phân cụm dữ liệu Phân cụm dữ liệu là qui trình tìm cách nhóm các đối tượng đã cho vào các cụm (clusters), sao cho các đối tượng trong cùng 1 cụm càng giống nhau (similar) càng tốt và các đối tượng khác cụm thì càng khác nhau nhau (Dissimilar) càng tốt.[1],[2] 176 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” Mục đích của phân cụm là tìm ra bản chất bên trong các nhóm của dữ liệu. Có rất nhiều kỹ thuật phân cụm như phân cụm phân hoạch, phân cụm phân cấp, phân cụm dựa trên mật độ... Tuy nhiên, không có tiêu chí nào là được xem là tốt nhất để đánh giá hiệu qủa của phân tích phân cụm, điều này phụ thuộc vào mục đích của bài toán phân cụm. [1],[2] 2.2 Luật kết hợp Trong lĩnh vực Data Mining, mục đích của luật kết hợp (Association Rule - AR) là tìm ra các mối quan hệ giữa các đối tượng trong khối lượng lớn dữ liệu. Nội dung cơ bản của luật kết hợp được tóm tắt như dưới đây.[1],[2] Cho cơ sở dữ liệu giao dịch T gồm tập các giao dịch t1, t2…, tn. T = {t1, t2…, tn}. Mỗi giao dịch ti bao gồm tập các đối tượng I (gọi là itemset). I = {i1, i2 …, im}. Một itemset gồm k items gọi là k-itemset. Mục đích của luật kết hợp là tìm ra sự kết hợp (tương quan) giữa các items. Những luật kết hợp này có dạng X → Y Hai tiêu chí rất quan trọng trong việc đánh giá luật kết hợp đó là độ hỗ trợ (support) và độ tin cậy (confidence). Công thức tính độ hỗ trợ và độ tin cậy của luật kết hợp X→Y: [2] n( X Y ) Support ( X Y ) P( X Y ) N n( X Y ) Confidence( X Y ) P(Y X ) n( X ) Trong đó: - n(X): Số giao dịch chứa X. - N: Tổng số giao dịch. Các luật kết hợp có độ hỗ trợ và độ tin cậy lớn hơn hoặc bằng độ hỗ trợ tối thiểu (min_sup) và độ tin cậy tối thiểu (min_conf) gọi là các luật mạnh. min_sup và min_conf gọi là các giá trị ngưỡng (threshold) được xác định trước khi sinh các luật kết hợp. 3 Ứng dụng kỹ thuật phân cụm và luật kết hợp phân tích tình hình học tiếng Anh của sinh viên Đại học Kinh tế - Đại học Đà Nẵng 3.1 Mô tả bài toán Mục đích: ứng dụng kỹ thuật phân cụm và luật kết hợp để đánh giá được tình hình học tiếng Anh của sinh ...
Nội dung trích xuất từ tài liệu:
Ứng dụng kỹ thuật phân cụm và luật kết hợp phân tích tình hình học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng Nguyễn Văn Chức, Trần Thị Quỳnh Tiên 175 Ứng dụng kỹ thuật phân cụm và luật kết hợp phân tích tình hình học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng Nguyễn Văn Chức, Trần Thị Quỳnh Tiên Trường Đại học Kinh tế - Đại học Đà Nẵng chuc.nv@due.edu.vn, quynhtien96@gmail.com Tóm tắt. Vấn đề nâng cao năng lực tiếng Anh cho sinh viên của các trường Đại học đang là yêu cầu cấp thiết, giúp sinh viên đáp ứng yêu cầu ngày càng cao của thị trường lao động nhất là trong bối cảnh hội nhập quốc tế. Một trong những khó khăn của các trường Đại học trong việc dạy tiếng Anh cho sinh viên là do mỗi sinh viên có sự khác nhau về đầu tư cho việc học tiếng Anh của mình (thời gian, kinh phí, quyết tâm…) dẫn đến kỹ năng tiếng Anh của mỗi người là không giống nhau. Việc này gây khó khăn cho các trường đại học trong việc xây dựng chương trình học tiếng Anh cho sinh viên một cách hiệu quả. Để có được cái nhìn tổng quan về thực trạng việc học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng, nghiên cứu tập trung vào kỹ thuật phân cụm và luật kết hợp để phân tích tình hình học tiếng Anh của sinh viên nhà Trường nhằm giúp Trường nắm được đặc điểm, thực trạng và mong muốn của sinh viên trong việc học tiếng Anh từ đó đưa ra các tư vấn, định hướng và đề xuất các giải pháp nhằm nâng cao hiệu quả của việc dạy và học tiếng Anh cho sinh viên trong Trường. Từ khóa: Phân tích dữ liệu, phân cụm, luật kết hợp, học tiếng Anh, Khai phá dữ liệu. 1 Đặt vấn đề Trong xu thế toàn cầu hóa và hội nhập quốc tế ngày nay, khả năng ngoại ngữ, đặc biệt là tiếng Anh đóng một vai trò rất quan trọng trong tất cả các hoạt động từ giao tiếp, học tập, công việc... Ở Việt Nam, tiếng Anh đã được giảng dạy từ rất sớm trong các trường học từ bậc tiểu học đến đại học. Bên cạnh đó, các trung tâm ngoại ngữ cũng đóng góp tích cực vào việc đào tạo năng lực tiếng Anh đáp ứng yêu cầu học tập của người học. Ở bậc đại học, năng lực ngoại ngữ (chủ yếu là tiếng Anh) của sinh viên được các trường đại học rất coi trọng và có nhiều giải pháp giúp sinh viên hoàn thiện kỹ năng ngoại ngữ như đưa năng lực ngoại ngữ là chuẩn đầu ra để tốt nghiệp, nhiều chương trình đào tạo dạy bằng tiếng Anh… Vì vậy, việc nắm được đặc điểm, xu hướng và thực trạng học tiếng Anh của sinh viên trong các trường đạị học là việc làm rất cần thiết, giúp các trường đại học có được cái nhìn tổng quan về năng lực tiếng Anh của sinh viên, từ đó đề xuất các chính sách, định hướng và tư vấn giúp sinh viên nâng cao năng lực tiếng Anh. Để phân tích thực trạng học tiếng Anh của sinh viên trường Đại học Kinh tế - Đại học Đà Nẵng, sau quá trình thu thập dữ liệu về tình hình học tiếng Anh của sinh viên trong Trường, nghiên cứu tập trung vào ứng dụng kỹ thuật phân cụm và luật kết hợp trong khai phá dữ liệu để để phân tích, giúp nhà Trường có được các thông tin cần thiết về thực trạng, đặc điểm và mong muốn học tiếng Anh của sinh viên. Từ đó, đề xuất những giải pháp phù hợp trong tư vấn, định hướng và giảng dạy giúp nâng cao năng lực tiếng Anh cho sinh viên. 2 Sơ lược về kỹ thuật phân cụm và luật kết hợp 2.1 Phân cụm dữ liệu Phân cụm dữ liệu là qui trình tìm cách nhóm các đối tượng đã cho vào các cụm (clusters), sao cho các đối tượng trong cùng 1 cụm càng giống nhau (similar) càng tốt và các đối tượng khác cụm thì càng khác nhau nhau (Dissimilar) càng tốt.[1],[2] 176 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” Mục đích của phân cụm là tìm ra bản chất bên trong các nhóm của dữ liệu. Có rất nhiều kỹ thuật phân cụm như phân cụm phân hoạch, phân cụm phân cấp, phân cụm dựa trên mật độ... Tuy nhiên, không có tiêu chí nào là được xem là tốt nhất để đánh giá hiệu qủa của phân tích phân cụm, điều này phụ thuộc vào mục đích của bài toán phân cụm. [1],[2] 2.2 Luật kết hợp Trong lĩnh vực Data Mining, mục đích của luật kết hợp (Association Rule - AR) là tìm ra các mối quan hệ giữa các đối tượng trong khối lượng lớn dữ liệu. Nội dung cơ bản của luật kết hợp được tóm tắt như dưới đây.[1],[2] Cho cơ sở dữ liệu giao dịch T gồm tập các giao dịch t1, t2…, tn. T = {t1, t2…, tn}. Mỗi giao dịch ti bao gồm tập các đối tượng I (gọi là itemset). I = {i1, i2 …, im}. Một itemset gồm k items gọi là k-itemset. Mục đích của luật kết hợp là tìm ra sự kết hợp (tương quan) giữa các items. Những luật kết hợp này có dạng X → Y Hai tiêu chí rất quan trọng trong việc đánh giá luật kết hợp đó là độ hỗ trợ (support) và độ tin cậy (confidence). Công thức tính độ hỗ trợ và độ tin cậy của luật kết hợp X→Y: [2] n( X Y ) Support ( X Y ) P( X Y ) N n( X Y ) Confidence( X Y ) P(Y X ) n( X ) Trong đó: - n(X): Số giao dịch chứa X. - N: Tổng số giao dịch. Các luật kết hợp có độ hỗ trợ và độ tin cậy lớn hơn hoặc bằng độ hỗ trợ tối thiểu (min_sup) và độ tin cậy tối thiểu (min_conf) gọi là các luật mạnh. min_sup và min_conf gọi là các giá trị ngưỡng (threshold) được xác định trước khi sinh các luật kết hợp. 3 Ứng dụng kỹ thuật phân cụm và luật kết hợp phân tích tình hình học tiếng Anh của sinh viên Đại học Kinh tế - Đại học Đà Nẵng 3.1 Mô tả bài toán Mục đích: ứng dụng kỹ thuật phân cụm và luật kết hợp để đánh giá được tình hình học tiếng Anh của sinh ...
Tìm kiếm theo từ khóa liên quan:
Kỹ thuật phân cụm Luật kết hợp Khai phá dữ liệu Phân cụm dữ liệu Mô hình phân tích tình hình học tiếng AnhGợi ý tài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 351 1 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 230 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 222 0 0 -
Luận văn: Tổng quan khai phá dữ liệu và ứng dụng
55 trang 170 0 0 -
8 trang 131 0 0
-
4 trang 115 0 0
-
12 trang 104 0 0
-
Bài giảng Khai phá dữ liệu: Chương 5 - TS. Võ Thị Ngọc Châu
116 trang 48 0 0 -
Bài giảng Khai phá dữ liệu (Data mining): Chương 8 - ĐH Bách khoa TP.HCM
8 trang 45 0 0 -
68 trang 44 0 0