Ứng dụng mô hình học máy dự báo chất lượng nước dưới đất: Điển hình tại khu vực thành phố Hội An, tỉnh Quảng Nam
Số trang: 5
Loại file: pdf
Dung lượng: 812.34 KB
Lượt xem: 15
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết Ứng dụng mô hình học máy dự báo chất lượng nước dưới đất: Điển hình tại khu vực thành phố Hội An, tỉnh Quảng Nam nghiên cứu dự báo chất lượng nước dưới đất khu vực lân cận bãi rác Cẩm Hà, Tp. Hội An, Quảng Nam bằng các mô hình học máy.
Nội dung trích xuất từ tài liệu:
Ứng dụng mô hình học máy dự báo chất lượng nước dưới đất: Điển hình tại khu vực thành phố Hội An, tỉnh Quảng Nam106 Lê Phước Cường, Ngô Viết Thắng ỨNG DỤNG MÔ HÌNH HỌC MÁY DỰ BÁO CHẤT LƯỢNG NƯỚC DƯỚI ĐẤT: ĐIỂN HÌNH TẠI KHU VỰC THÀNH PHỐ HỘI AN, TỈNH QUẢNG NAM APPLICATION OF MACHINE LEARNING MODELS IN UNDERGROUND WATER PREDICTION: A CASE STUDY IN HOIAN CITY, QUANGNAM PROVINCE Lê Phước Cường*, Ngô Viết Thắng Trường Đại học Bách khoa - Đại học Đà Nẵng1 *Tác giả liên hệ: lpcuong@dut.udn.vn (Nhận bài: 10/02/2022; Chấp nhận đăng: 28/3/2022)Tóm tắt - Bài báo nghiên cứu dự báo chất lượng nước dưới đất khu Abstract - This article studies to predict groundwater quality in thevực lân cận bãi rác Cẩm Hà, Tp. Hội An, Quảng Nam bằng các mô vicinity of Cam Ha landfill, Hoi An city, Quang Nam province byhình học máy. Nghiên cứu đã tiến hành phân tích bộ dữ liệu về chất machine learning models. The study analyzed dataset onlượng nước dưới đất trong mùa mưa và mùa khô. Bộ dữ liệu với groundwater quality in rainy and dry seasons. Dataset with 268 lines,268 dòng, gồm 8 biến đầu vào (Fe, As, Mo, Co, Ni, Al, Zn, Pb) và including 8 input variables (Fe, As, Mo, Co, Ni, Al, Zn, Pb) and1 biến đầu ra (GWQI). Các tác giả đã nghiên cứu xác định mô hình 1 output oneis the groundwater quality index (GWQI). Authorsdự báo tối ưu dựa vào các giá trị sai số tuyệt đối trung bình (MAE), determined the optimal forecasting model based on the mean absolutesai số toàn phương trung bình (RMSE) và R2. Ngôn ngữ R được error (MAE), root mean square error (RMSE) and R2. R languagedùng để tối ưu hoá các mô hình hồi quy tuyến tính (LR), rừng ngẫu was used in order to optimize machine learning models, such as:nhiên (RF), máy hỗ trợ vec-tơ (SVM), K- điểm dữ liệu gần nhất linear regression (LR), random forest (RF), support vector machine(KNN), mạng lập thể (Cubist) với tỉ lệ “Huấn luyện”:“Kiểm tra” từ (SVM), K-nearest neighbors (KNN), Cubist with Train:Test ratio70:30 đến 85:15. Kết quả thu được cho thấy, mô hình Cubist ở tỷ lệ from 70:30 to 85:15. The obtained results show that the Cubist model70:30 là tối ưu nhất cho bộ dữ liệu tại khu vực lân cận bãi rác Cẩm at the ratio 70:30 is the most optimal one for the dataset in the vicinityHà với độ tin cậy R2 lần lượt là 98,8% và 96%. of Cam Ha landfill with the R2 value of 98.8% and 96 %, respectively.Từ khóa - Học máy; nước dưới đất; Groundwater Quality Index Key words - Machine learning; groundwater; Groundwater(GWQI); bãi rác Cẩm Hà. Quality Index (GWQI); Cam Ha landfill1. Đặt vấn đề việc sử dụng chỉ số chất lượng nước dưới đất (GWQI) như Đất, nước dưới đất là nguồn tài nguyên vô cùng quý một giá trị có khả năng cung cấp sự ảnh hưởng tổng hợpgiá, đóng vai trò quyết định cho sự tồn tại và phát triển của của từng thông số chất lượng trên toàn bộ chất lượng nướccon người. Hiện nay, vấn đề ô nhiễm nguồn nước đang là đã hỗ trợ tích cực cho việc dự báo chất lượng nước dướichủ đề nóng trên toàn cầu nói chung và Việt Nam nói riêng. đất trong thời gian qua [3], [4], [5], [6], [7], [8], [9], [10],Nguyên nhân gây nên tình trạng ô nhiễm môi trường nước [11]. Trong nghiên cứu này, tác giả đã phân tích một sốnhư hiện nay chủ yếu từ ý thức của số ít người dân, các mô hình có khả năng dự báo chất lượng nước dưới đất,doanh nghiệp thiếu trách nhiệm và cả những bất cập, hạn bao gồm: Hồi quy tuyến tính (LR-Linear Regression),chế trong công tác quản lý, bảo vệ môi trường [1]. rừng ngẫu nhiên (RF - Random Forest), máy hỗ trợ véc- Điển hình tại khu vực bãi rác Cẩm Hà nằm trên địa bàn tơ (SVM - Support vector machine), K điểm dữ liệu gầnthôn Bầu Ốc Thượng, xã Cẩm Hà, thành phố Hội An có nhất (KNN - K nearest neighbor), mạng lập thể (Cubist). Từ các giá trị sai số tuyệt đối trung bình (MAE), sai sốdiện tích khoảng 1,3 hectares (ha), sức chứa 100.000 m3 là toàn phương trung bình (RMSE) và R2 tác giả đã đề xuấtnơi tập trung rác thải của toàn thành phố. Hơn 40 năm tồn ...
Nội dung trích xuất từ tài liệu:
Ứng dụng mô hình học máy dự báo chất lượng nước dưới đất: Điển hình tại khu vực thành phố Hội An, tỉnh Quảng Nam106 Lê Phước Cường, Ngô Viết Thắng ỨNG DỤNG MÔ HÌNH HỌC MÁY DỰ BÁO CHẤT LƯỢNG NƯỚC DƯỚI ĐẤT: ĐIỂN HÌNH TẠI KHU VỰC THÀNH PHỐ HỘI AN, TỈNH QUẢNG NAM APPLICATION OF MACHINE LEARNING MODELS IN UNDERGROUND WATER PREDICTION: A CASE STUDY IN HOIAN CITY, QUANGNAM PROVINCE Lê Phước Cường*, Ngô Viết Thắng Trường Đại học Bách khoa - Đại học Đà Nẵng1 *Tác giả liên hệ: lpcuong@dut.udn.vn (Nhận bài: 10/02/2022; Chấp nhận đăng: 28/3/2022)Tóm tắt - Bài báo nghiên cứu dự báo chất lượng nước dưới đất khu Abstract - This article studies to predict groundwater quality in thevực lân cận bãi rác Cẩm Hà, Tp. Hội An, Quảng Nam bằng các mô vicinity of Cam Ha landfill, Hoi An city, Quang Nam province byhình học máy. Nghiên cứu đã tiến hành phân tích bộ dữ liệu về chất machine learning models. The study analyzed dataset onlượng nước dưới đất trong mùa mưa và mùa khô. Bộ dữ liệu với groundwater quality in rainy and dry seasons. Dataset with 268 lines,268 dòng, gồm 8 biến đầu vào (Fe, As, Mo, Co, Ni, Al, Zn, Pb) và including 8 input variables (Fe, As, Mo, Co, Ni, Al, Zn, Pb) and1 biến đầu ra (GWQI). Các tác giả đã nghiên cứu xác định mô hình 1 output oneis the groundwater quality index (GWQI). Authorsdự báo tối ưu dựa vào các giá trị sai số tuyệt đối trung bình (MAE), determined the optimal forecasting model based on the mean absolutesai số toàn phương trung bình (RMSE) và R2. Ngôn ngữ R được error (MAE), root mean square error (RMSE) and R2. R languagedùng để tối ưu hoá các mô hình hồi quy tuyến tính (LR), rừng ngẫu was used in order to optimize machine learning models, such as:nhiên (RF), máy hỗ trợ vec-tơ (SVM), K- điểm dữ liệu gần nhất linear regression (LR), random forest (RF), support vector machine(KNN), mạng lập thể (Cubist) với tỉ lệ “Huấn luyện”:“Kiểm tra” từ (SVM), K-nearest neighbors (KNN), Cubist with Train:Test ratio70:30 đến 85:15. Kết quả thu được cho thấy, mô hình Cubist ở tỷ lệ from 70:30 to 85:15. The obtained results show that the Cubist model70:30 là tối ưu nhất cho bộ dữ liệu tại khu vực lân cận bãi rác Cẩm at the ratio 70:30 is the most optimal one for the dataset in the vicinityHà với độ tin cậy R2 lần lượt là 98,8% và 96%. of Cam Ha landfill with the R2 value of 98.8% and 96 %, respectively.Từ khóa - Học máy; nước dưới đất; Groundwater Quality Index Key words - Machine learning; groundwater; Groundwater(GWQI); bãi rác Cẩm Hà. Quality Index (GWQI); Cam Ha landfill1. Đặt vấn đề việc sử dụng chỉ số chất lượng nước dưới đất (GWQI) như Đất, nước dưới đất là nguồn tài nguyên vô cùng quý một giá trị có khả năng cung cấp sự ảnh hưởng tổng hợpgiá, đóng vai trò quyết định cho sự tồn tại và phát triển của của từng thông số chất lượng trên toàn bộ chất lượng nướccon người. Hiện nay, vấn đề ô nhiễm nguồn nước đang là đã hỗ trợ tích cực cho việc dự báo chất lượng nước dướichủ đề nóng trên toàn cầu nói chung và Việt Nam nói riêng. đất trong thời gian qua [3], [4], [5], [6], [7], [8], [9], [10],Nguyên nhân gây nên tình trạng ô nhiễm môi trường nước [11]. Trong nghiên cứu này, tác giả đã phân tích một sốnhư hiện nay chủ yếu từ ý thức của số ít người dân, các mô hình có khả năng dự báo chất lượng nước dưới đất,doanh nghiệp thiếu trách nhiệm và cả những bất cập, hạn bao gồm: Hồi quy tuyến tính (LR-Linear Regression),chế trong công tác quản lý, bảo vệ môi trường [1]. rừng ngẫu nhiên (RF - Random Forest), máy hỗ trợ véc- Điển hình tại khu vực bãi rác Cẩm Hà nằm trên địa bàn tơ (SVM - Support vector machine), K điểm dữ liệu gầnthôn Bầu Ốc Thượng, xã Cẩm Hà, thành phố Hội An có nhất (KNN - K nearest neighbor), mạng lập thể (Cubist). Từ các giá trị sai số tuyệt đối trung bình (MAE), sai sốdiện tích khoảng 1,3 hectares (ha), sức chứa 100.000 m3 là toàn phương trung bình (RMSE) và R2 tác giả đã đề xuấtnơi tập trung rác thải của toàn thành phố. Hơn 40 năm tồn ...
Tìm kiếm theo từ khóa liên quan:
Ô nhiễm nguồn nước Mô hình học máy Chất lượng nước dưới đất Chỉ số chất lượng nước dưới đất Bảo vệ môi trườngGợi ý tài liệu liên quan:
-
Tài liệu Giáo dục địa phương tỉnh Bắc Kạn lớp 1
60 trang 689 0 0 -
báo cáo chuyên đề GIÁO DỤC BẢO VỆ MÔI TRƯỜNG
78 trang 288 0 0 -
10 trang 284 0 0
-
Biểu mẫu Cam kết an toàn lao động
2 trang 233 4 0 -
Báo cáo đánh giá tác động môi trường: Đánh giá tác động môi trường xây dựng nhà máy xi măng
63 trang 180 0 0 -
Giáo án Khoa học lớp 4 - Bài 3: Ô nhiễm và bảo vệ nguồn nước (Sách Chân trời sáng tạo)
10 trang 148 1 0 -
Giải pháp xây dựng TCVN và QCVN về xe điện hài hòa với tiêu chuẩn, quy chuẩn quốc tế
2 trang 144 0 0 -
130 trang 143 0 0
-
Bài giảng Quản lý nhà nước về tài nguyên và môi trường - Chương 0: Giới thiệu học phần (Năm 2022)
8 trang 139 0 0 -
Trích xuất danh mục khía cạnh sử dụng BERT với hàm mất mát cân bằng
9 trang 133 0 0