Nghiên cứu ứng dụng thử nghiệm thuật toán phân cụm dữ liệu (AI) để phân vùng các đặc trưng nhiệt độ, độ muối bề mặt khu vực Biển Đông
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Nghiên cứu ứng dụng thử nghiệm thuật toán phân cụm dữ liệu (AI) để phân vùng các đặc trưng nhiệt độ, độ muối bề mặt khu vực Biển ĐôngNGHIÊN CỨU ỨNG DỤNG THỬ NGHIỆM THUẬT TOÁN PHÂN CỤM DỮ LIỆU (AI) ĐỂ PHÂN VÙNG CÁC ĐẶC TRƯNG NHIỆT ĐỘ, ĐỘ MUỐI BỀ MẶT KHU VỰC BIỂN ĐÔNG Nguyễn Hồng Lân, Lê Phú Hưng Trường Đại học Tài nguyên và Môi trường Hà Nội Tóm tắt Trong nước biển tồn tại các khối nước tương đối đồng nhất về các đặc trưng lý hóa như nhiệtđộ và độ muối. Việc xác định các khối nước cùng với các đặc trưng nhiệt muối của chúng có vaitrò quan trọng trong việc đánh giá các quá trình động lực - nguyên nhân dẫn đến sự hình thànhcác khối nước đó. Hiện nay, với sự trợ giúp của các thuật toán của khai phá dữ liệu (các thuậttoán thuộc trí tuệ nhân tạo - AI trong khai phá dữ liệu) có thể xác định và phân chia khối nướcbiển thành các khối nước có độ tương đồng cao về nhiệt muối. Trong nghiên cứu này nhóm tác giảbước đầu áp dụng thử nghiệm thuật toán phân cụm dữ liệu đối với bộ dữ liệu bề mặt nhiệt muốihai chiều (2D) để phân chia bề mặt nước biển khu vực Biển Đông thành các vùng có các đặc trưngnhiệt muối có độ tương đồng cao. Từ khóa: Khối nước; Phân cụm dữ liệu; Nhiệt - Muối. Abstract Application of AI data clustering algorithm for zoning water surface based on temperature and salinity characteristics in the East Sea (Bien Dong) Homogenous water masses in the seawater always exist in the form of similarity in physicaland chemical characteristics, such as temperature and salinity. It is also necessary to assess thedynamical processes that base on the water mass characteristics, formed by thermal and saltyidentification. Nowadays, it is possible to identify and divide seawater mass into smaller areas forthe similarity in temperature and salinity as a result of the support from the data cluster algorithmsmethod (another form of AI for data mining). In this study, the clustering algorithms using thethermal - salty surface dataset in 2-Dimensional (2D) is applied and tested for splitting thesurface of the East Sea into different regions with the different values of temperature and salinitycharacteristics. Keywords: Water mass; Data clustering; Thermal - Salty. 1. Đặt vấn đề Trong đại dương nói chung và tại các khu vực biển nói riêng liên tục diễn ra những quá trìnhtrao đổi năng lượng và vật chất, di chuyển và xáo trộn, làm biến đổi và hướng tới san bằng nhữngđặc trưng lý, hóa, sinh học ở mọi điểm của đại dương. Tuy nhiên, vẫntồn tại những khối nước lớnchiếm khoảng không gian kích thước cỡ đại dương hoặc biển và duy trì trong một thời gian dàitính đồng nhất tương đối của các đặc trưng của chúng đã từng được hình thành ở những vùng địalý nhất định. Những đặc trưng lý hóa cơ bản thường được sử dụng để phân biệt các khối nước với nhau lànhiệt độ (T) và độ muối (S) của chúng. Những yếu tố vật lý, hóa học, sinh học khác như oxy hòatan, độ trong suốt tương đối, các chỉ số thủy sinh thì được dùng ít hơn. Một trong những phươngpháp phân tích các khối nước được sử dụng nhiều nhất hiện nay là phương pháp đường cong T - Sdựa trên biểu đồ T - S của các trạm quan trắc hải văn. Biểu đồ T - S là hệ trục vuông góc có tọa độ Hội thảo Khoa học Quốc gia 2023 67là nhiệt độ T và độ muối S, trên đó ghi các độ sâu quan trắc ứng với nhiệt độ và độ muối quan trắcđược [1]. Phương pháp phân tích dựa trên biểu đồ T - S có hạn chế là cho phép phân chia theo độsâu các lớp nước có đặc trưng T - S tương tự nhau chỉ cho profile tại một điểm. Sau đó kết nối vớicác điểm khác ta có thể xác định được ranh giới các khối nước. Hình 1: Khu vực nghiên cứu và lưới dữ liệu T - S Trong nghiên cứu này, nhóm tác giả đề xuất phân chia các khối nước dựa trên phương phápphân cụm dữ liệu (data clustering) trong lý thuyết khai phá dữ liệu (data mining). Phương phápnày xác định được các cụm dữ liệu của các yếu tố nào đó có độ tương đồng cao. Khi áp dụng cácphân cụm này đối với môi trường nước biển có các yếu tố đặc trưng là nhiệt độ (T) và độ muối(S) thì các khối nước biển chính là các cụm dữ liệu có độ tương đồng cao về các yếu tố đặc trưngT - S của khối nước đó. 2. Phương pháp nghiên cứu 2.1. Chuẩn hóa dữ liệu Để khai phá dữ liệu thành công, trước khi thực hiện các phương pháp khai phá, chúng tacần có cái nhìn tổng quan về dữ liệu. Trên cơ sở đó chúng ta có thể phát hiện ra các đặc tính củadữ liệu, cũng như có thể phát hiện ra đâu là dữ liệu nhiễu hay dữ liệu ngoại lai. Để thực hiện cácphương pháp khai phá dữ liệu trước hết cần thiết việc tiền xử lý, chuẩn hóa dữ liệu và lựa chọnphương pháp khai phá nào cho phù hợp với tập dữ liệu ta đang xét. Việc tiền xử lý dữ liệu khôngthuộc phạm vi n ...
Tìm kiếm theo từ khóa liên quan:
Kỷ yếu Hội thảo khoa học quốc gia Phát triển quản lý bền vững tài nguyên môi trường Thuật toán phân cụm dữ liệu Phân vùng đặc trưng nhiệt độ Độ muối bề mặt biểnGợi ý tài liệu liên quan:
-
15 trang 149 0 0
-
Định hướng phát triển ngành logistics Việt Nam trong bối cảnh hiện nay
10 trang 95 0 0 -
Quản lý và hỗ trợ người học trong bối cảnh chuyển đổi số - Kỷ yếu hội thảo khoa học quốc gia: Phần 1
342 trang 84 1 0 -
Kinh tế thủ đô Hà Nội năm 2023 và nhiệm vụ, giải pháp năm 2024
8 trang 67 0 0 -
4 trang 63 0 0
-
Chuyển đổi số hoạt động quản lý và đào tạo cho các cơ sở giáo dục đại học của Việt Nam
8 trang 62 0 0 -
18 trang 59 0 0
-
21 trang 59 0 0
-
13 trang 57 0 0
-
Kỷ yếu Hội thảo khoa học quốc gia - Kinh tế truyền thông: Lý luận, thực tiễn và kinh nghiệm
890 trang 52 1 0 -
Quản lý và hỗ trợ người học trong bối cảnh chuyển đổi số - Kỷ yếu hội thảo khoa học quốc gia: Phần 2
178 trang 52 0 0 -
Tham vấn tâm lý học đường trong bối cảnh chuyển đổi số - Vận dụng và giải pháp
9 trang 49 0 0 -
7 trang 47 0 0
-
14 trang 46 0 0
-
Vai trò của trí thức trẻ Việt Nam trong nền kinh tế số - Kỷ yếu hội thảo khoa học quốc gia
88 trang 45 0 0 -
5 trang 45 0 0
-
Một số giải pháp nâng cao vai trò của tham vấn tâm lý học đường trong bối cảnh chuyển đổi số
7 trang 41 0 0 -
Quá trình đi lên chủ nghĩa xã hội ở Trung Quốc và bài học kinh nghiệm đối với Việt Nam hiện nay
14 trang 40 0 0 -
648 trang 39 1 0
-
Kinh tế Việt Nam năm 2020 và triển vọng năm 2021 - Kỷ yếu hội thảo khoa học Quốc gia: Phần 1
342 trang 36 0 0