Áp dụng rừng ngẫu nhiên trong học máy dự đoán chất lượng rượu vang
Số trang: 4
Loại file: pdf
Dung lượng: 1,023.89 KB
Lượt xem: 9
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết "Áp dụng rừng ngẫu nhiên trong học máy dự đoán chất lượng rượu vang" đề xuất sử dụng 3 phương pháp DT (Decision Tree), SVM (Support Vector Machine), RF (Random Forest) trong học máy để dự đoán rượu vang...
Nội dung trích xuất từ tài liệu:
Áp dụng rừng ngẫu nhiên trong học máy dự đoán chất lượng rượu vang KHOA HỌC CÔNG NGHỆ P-ISSN 1859-3585 E-ISSN 2615-9619 ÁP DỤNG RỪNG NGẪU NHIÊN TRONG HỌC MÁY DỰ ĐOÁN CHẤT LƯỢNG RƯỢU VANG APPLICATION OF RANDOM FOREST IN MACHINE LEARNING TO PREDICT WINE QUALITY Đỗ Thị Kim Dung1,*, Lê Đinh Phú Cường2, Viên Thanh Nhã , Lê Đình Hồng Mạnh4, Phạm Văn Cường4, 3 Phan Đức Thiện5, Phạm Thành Công4, Lê Việt Anh4 DOI: https://doi.org/10.57001/huih5804.2023.107 TÓM TẮT 1. GIỚI THIỆU Hiện nay, học máy được ứng dụng ngày càng nhiều vào đời sống. Máy móc Chất lượng của rượu vang được người tiêu dùng và nhà cũng có thể hỗ trợ con người lựa chọn các sản phẩm phù hợp. Nhà sản xuất thì sản xuất rất quan tâm. Có rất nhiều loại rượu vang trên thị muốn sản xuất một mẫu rượu phù hợp cho người tiêu dùng và khách hàng thì trường, nó đa dạng về màu sắc, hình dạng và nhiều đặc muốn có một mẫu rượu phù hợp với lựa chọn của mình. Hơn nửa, chất lượng của tính khác nhau. Trong đó có một vài đặc tính sẽ thay đổi rượu vang không chỉ phụ thuộc vào một yếu tố nhất định mà nó phụ thuộc vào theo thời gian và có thể làm kém đi chất lượng của rượu. nhiều yếu tố. Nếu dựa vào cách thủ công để dự đoán chất lượng thì mất rất nhiều Bên cạnh đó nếu tiêu thụ nhiều sản phẩm kém chất lượng thời gian. Dựa vào nhu cầu thực tế đó trong nghiên cứu này chúng tôi đề xuất sử sẽ làm ảnh hưởng nghiêm trọng đến sức khỏe người sử dụng 3 phương pháp DT (Decision Tree), SVM (Support Vector Machine), RF dụng. Một ứng dụng tự động dự đoán chất lượng rượu là (Random Forest) trong học máy để dự đoán rượu vang. Dữ liệu rượu vang được sử rất cần thiết. dụng làm cơ sở đánh giá có 1599 dòng, mỗi dòng có 12 cột. Kết quả thực nghiệm Có nhiều cách giải quyết vấn đề này, tuy nhiên đa phần cho thấy phương pháp RF cho kết quả tốt nhất, dựa vào kết quả này chúng tôi là giải quyết thủ công còn phụ thuộc vào yếu tố con người xây dựng trang web dự đoán chất lượng rượu. là chính. Trong những năm gần đây một số nhà nghiên cứu Từ khóa: Học máy RF, chất lượng, dự đoán. đã sử dụng học máy để giải quyết vấn đề này, chẳng hạn như: Terence đã sử dụng bộ dữ liệu chất lượng rượu vang ABSTRACT đỏ tại trang kaggle.com và dùng nhiều mô hình phân loại Currently, machine learning is applied more and more in life. Machines can để dự đoán xem một mẫu rượu vang đỏ có tốt hay không. also assist humans in choosing the right products. The producer wants to Devika để dự đoán chất lượng rượu vang, các nhà nghiên produce a suitable wine for the consumer and the customer wants a suitable cứu đã sử dụng Logistic Regression, Stochastic Gradient wine of his choice. More than half, the quality of wine depends not only on a Descent, Support Vector Classifier và Random Forest [2]. certain factor, but it depends on many factors. If you rely on manual methods to Phân tích chứng minh rằng chất lượng được cải thiện khi predict the quality, it takes a lot of time. Based on that actual need in this study, lượng đường dư ở mức vừa phải và không thay đổi đột we propose to use 3 methods DT (Decision Tree), SVM (Support Vector Machine), ngột, cho thấy đặc điểm này không quan trọng bằng các RF (Random Forest) in machine learning to predict wine. The wine data used as đặc điểm khác như rượu và axit xitric. Bài toán dự đoán chất the basis of the assessment has 1599 lines, each with 12 columns. Experimental lượng rượu bằng so sánh các phương pháp học máy và đưa results show that RF method gives the best result, based on this result we build a ra dự đoán cao được chúng tôi áp dụng trong bài báo này. wine quality prediction website. 2. PHƯƠNG PHÁP Keywords: Machine learning RF, quality, prediction. 2.1. Học máy véc tơ hỗ trợ - Support Vector Machine (SVM) 1 Khoa Công nghệ thông tin, Trường Đại học Phan Thiết 2 Khoa Công nghệ thông tin, Trường Đại học Yersin Đà Lạt 3 Khoa Công nghệ thông tin, Trường Đại học Thủy Lợi - Phân hiệu miền Nam 4 Trường Đại học Công nghiệp Hà Nội 5 Trường Đại học Sư Phạm Kỹ thuật Nam Định * Email: dtkdung@upt.edu.vn Ngày nhận bài: 20/02/2023 Ngày nhận bài sửa sau phản biện: 29/3/2023 Ngày chấp nhận đăng: 15/6/2023 Hình 1. Bộ phân loại SVM44 Tạp chí KHOA HỌC VÀ CÔNG NGHỆ ● Tập 59 - Số 3 (6/2023) Website: https://jst-haui.vnP-ISSN 1859-3585 E-ISSN 2615-9619 SCIENCE - TECHNOLOGY SVM là một kỹ thuật học máy ...
Nội dung trích xuất từ tài liệu:
Áp dụng rừng ngẫu nhiên trong học máy dự đoán chất lượng rượu vang KHOA HỌC CÔNG NGHỆ P-ISSN 1859-3585 E-ISSN 2615-9619 ÁP DỤNG RỪNG NGẪU NHIÊN TRONG HỌC MÁY DỰ ĐOÁN CHẤT LƯỢNG RƯỢU VANG APPLICATION OF RANDOM FOREST IN MACHINE LEARNING TO PREDICT WINE QUALITY Đỗ Thị Kim Dung1,*, Lê Đinh Phú Cường2, Viên Thanh Nhã , Lê Đình Hồng Mạnh4, Phạm Văn Cường4, 3 Phan Đức Thiện5, Phạm Thành Công4, Lê Việt Anh4 DOI: https://doi.org/10.57001/huih5804.2023.107 TÓM TẮT 1. GIỚI THIỆU Hiện nay, học máy được ứng dụng ngày càng nhiều vào đời sống. Máy móc Chất lượng của rượu vang được người tiêu dùng và nhà cũng có thể hỗ trợ con người lựa chọn các sản phẩm phù hợp. Nhà sản xuất thì sản xuất rất quan tâm. Có rất nhiều loại rượu vang trên thị muốn sản xuất một mẫu rượu phù hợp cho người tiêu dùng và khách hàng thì trường, nó đa dạng về màu sắc, hình dạng và nhiều đặc muốn có một mẫu rượu phù hợp với lựa chọn của mình. Hơn nửa, chất lượng của tính khác nhau. Trong đó có một vài đặc tính sẽ thay đổi rượu vang không chỉ phụ thuộc vào một yếu tố nhất định mà nó phụ thuộc vào theo thời gian và có thể làm kém đi chất lượng của rượu. nhiều yếu tố. Nếu dựa vào cách thủ công để dự đoán chất lượng thì mất rất nhiều Bên cạnh đó nếu tiêu thụ nhiều sản phẩm kém chất lượng thời gian. Dựa vào nhu cầu thực tế đó trong nghiên cứu này chúng tôi đề xuất sử sẽ làm ảnh hưởng nghiêm trọng đến sức khỏe người sử dụng 3 phương pháp DT (Decision Tree), SVM (Support Vector Machine), RF dụng. Một ứng dụng tự động dự đoán chất lượng rượu là (Random Forest) trong học máy để dự đoán rượu vang. Dữ liệu rượu vang được sử rất cần thiết. dụng làm cơ sở đánh giá có 1599 dòng, mỗi dòng có 12 cột. Kết quả thực nghiệm Có nhiều cách giải quyết vấn đề này, tuy nhiên đa phần cho thấy phương pháp RF cho kết quả tốt nhất, dựa vào kết quả này chúng tôi là giải quyết thủ công còn phụ thuộc vào yếu tố con người xây dựng trang web dự đoán chất lượng rượu. là chính. Trong những năm gần đây một số nhà nghiên cứu Từ khóa: Học máy RF, chất lượng, dự đoán. đã sử dụng học máy để giải quyết vấn đề này, chẳng hạn như: Terence đã sử dụng bộ dữ liệu chất lượng rượu vang ABSTRACT đỏ tại trang kaggle.com và dùng nhiều mô hình phân loại Currently, machine learning is applied more and more in life. Machines can để dự đoán xem một mẫu rượu vang đỏ có tốt hay không. also assist humans in choosing the right products. The producer wants to Devika để dự đoán chất lượng rượu vang, các nhà nghiên produce a suitable wine for the consumer and the customer wants a suitable cứu đã sử dụng Logistic Regression, Stochastic Gradient wine of his choice. More than half, the quality of wine depends not only on a Descent, Support Vector Classifier và Random Forest [2]. certain factor, but it depends on many factors. If you rely on manual methods to Phân tích chứng minh rằng chất lượng được cải thiện khi predict the quality, it takes a lot of time. Based on that actual need in this study, lượng đường dư ở mức vừa phải và không thay đổi đột we propose to use 3 methods DT (Decision Tree), SVM (Support Vector Machine), ngột, cho thấy đặc điểm này không quan trọng bằng các RF (Random Forest) in machine learning to predict wine. The wine data used as đặc điểm khác như rượu và axit xitric. Bài toán dự đoán chất the basis of the assessment has 1599 lines, each with 12 columns. Experimental lượng rượu bằng so sánh các phương pháp học máy và đưa results show that RF method gives the best result, based on this result we build a ra dự đoán cao được chúng tôi áp dụng trong bài báo này. wine quality prediction website. 2. PHƯƠNG PHÁP Keywords: Machine learning RF, quality, prediction. 2.1. Học máy véc tơ hỗ trợ - Support Vector Machine (SVM) 1 Khoa Công nghệ thông tin, Trường Đại học Phan Thiết 2 Khoa Công nghệ thông tin, Trường Đại học Yersin Đà Lạt 3 Khoa Công nghệ thông tin, Trường Đại học Thủy Lợi - Phân hiệu miền Nam 4 Trường Đại học Công nghiệp Hà Nội 5 Trường Đại học Sư Phạm Kỹ thuật Nam Định * Email: dtkdung@upt.edu.vn Ngày nhận bài: 20/02/2023 Ngày nhận bài sửa sau phản biện: 29/3/2023 Ngày chấp nhận đăng: 15/6/2023 Hình 1. Bộ phân loại SVM44 Tạp chí KHOA HỌC VÀ CÔNG NGHỆ ● Tập 59 - Số 3 (6/2023) Website: https://jst-haui.vnP-ISSN 1859-3585 E-ISSN 2615-9619 SCIENCE - TECHNOLOGY SVM là một kỹ thuật học máy ...
Tìm kiếm theo từ khóa liên quan:
Áp dụng rừng ngẫu nhiên Học máy dự đoán Dự đoán chất lượng rượu vang Kiểm nghiệm chất lượng rượu vang Tạp chí Khoa học và Công nghệTài liệu liên quan:
-
15 trang 217 0 0
-
9 trang 154 0 0
-
Phân tích và so sánh các loại pin sử dụng cho ô tô điện
6 trang 101 0 0 -
10 trang 90 0 0
-
Hội nhập quốc tế trong lĩnh vực pháp luật sở hữu trí tuệ của Việt Nam
4 trang 82 0 0 -
Ảnh hưởng các tham số trong bảng sam điều kiện đối với phương pháp điều khiển sử dụng đại số gia tử
9 trang 68 0 0 -
5 trang 62 0 0
-
15 trang 51 0 0
-
Đánh giá việc sử dụng xi măng thay thế bột khoáng nhằm cải thiện tính năng của bê tông nhựa nóng
5 trang 51 0 0 -
Mô hình quá trình kết tụ hạt dưới ảnh hưởng của sóng siêu âm trong hệ thống lọc bụi ly tâm
4 trang 46 0 0