Danh mục

Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Phát triển một số thuật toán phân cụm mờ trên tập mờ viễn cảnh và ứng dụng trong dự báo

Số trang: 27      Loại file: pdf      Dung lượng: 540.57 KB      Lượt xem: 11      Lượt tải: 0    
Hoai.2512

Hỗ trợ phí lưu trữ khi tải xuống: 2,000 VND Tải xuống file đầy đủ (27 trang) 0
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục tiêu nghiên cứu của luận án là nghiên cứu, phát triển các thuật toán phân cụm mở rộng trên tập mờ viễn cảnh như: phân cụm xác định số cụm tự động, phân cụm với dữ liệu phức tạp. Kiểm chứng, so sách với các thuật toán liên quan khác. Nghiên cứu, phát triển ứng dụng của thuật toán phân cụm trên tập mờ viễn cảnh vào bài toán dự báo thời tiết dựa trên ảnh mây vệ tinh.
Nội dung trích xuất từ tài liệu:
Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Phát triển một số thuật toán phân cụm mờ trên tập mờ viễn cảnh và ứng dụng trong dự báo ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN PHẠM HUY THÔNG PHÁT TRIỂN MỘT SỐ THUẬT TOÁNPHÂN CỤM MỜ TRÊN TẬP MỜ VIỄN CẢNH VÀ ỨNG DỤNG TRONG DỰ BÁO Chuyên ngành: Cơ sở toán học cho tin học Mã số: 9460117.02 DỰ THẢO TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội, 2019 Công trình được hoàn thành tại: Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội. Người hướng dẫn khoa học: 1. PGS. TS. Lê Hoàng Sơn 2. PGS. TS. Nguyễn Thị Hồng Minh Phản biện 1: ............................................. Phản biện 2: ............................................. Phản biện 3: .............................................Luận án sẽ được bảo vệ tại Hội đồng chấm luận án cấp Đại học Quốcgia họp tại: Trường Đại học Khoa học Tự nhiên – Đại học Quốc giaHà Nộivào hồi......giờ......., ngày.......tháng.......năm 20...Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam, - Trung tâm thông tin - Thư viện, Đại học Quốc gia Hà Nội. MỞ ĐẦU Phân cụm dữ liệu là việc sắp xếp các đối tượng dữ liệu vàotừng cụm sao cho các phần tử trong cùng một cụm có mức độ tươngtự là cao nhất và hai phần tử bất kỳ ở hai cụm khác nhau có mức độtương tự là thấp nhất. Việc phân cụm như vậy giúp cho việc khai phádữ liệu, đặc biệt là các bài toán dữ liệu lớn trở nên hiệu quả khi cácdữ liệu được phân thành các nhóm với các tính chất đặc trưng. Tuynhiên, việc các phân cụm này cũng có một số nhược điểm là mỗi mộtphần tử chỉ thuộc về một cụm dữ liệu hay một số dữ liệu có thể bịthiếu thông tin hoặc thông tin không chắc chắn. Để giải quyết vấn đềnày, dựa trên lý thuyết về tập mờ của Zadeh, Bezdek đã đưa ra thuậttoán phân cụm mờ Fuzzy C-mean (FCM) nhằm giải quyết các nhượcđiểm trên. Thuật toán này được biết đến như một phương thức chínhtrong phân cụm mờ. Tuy nhiên, chất lượng phân cụm của FCM thường không caodo thuật toán này được cài đặt trên cơ cở của các tập mờ truyềnthống, ở đó vẫn có những giới hạn về độ thuộc, sự do dự và mơ hồcủa các tham số mẫu. Chính vì vậy việc nghiên cứu các thuật toánphân cụm trên các tập mờ nâng cao nhằm mục tiêu giải quyết cácnhược điểm này. Đến nay đã có rất nhiều các thuật toán phân cụmtrên các tập mờ nâng cao như thuật toán phân cụm trên tập mờ loại 2(T2FS), tập mờ trực cảm, … mang lại chất lượng phân cụm tốt hơn.Tuy nhiên các thuật toán này khi phân cụm cho kết quả vẫn chưa đưara được các thông tin đầy đủ, đặc biệt là sự phù hợp của mô hình. Vào năm 2014, tác giả Bùi Công Cường giới thiệu tập mờ viễncảnh (PFS), là một sự khái quát hóa của tập mờ truyền thống và tậpmờ trực cảm. Các mô hình dựa trên PFS có thể được áp dụng chonhiều tình huống cần ý kiến của con người liên quan nhiều đến cáccâu trả lời kiểu: đồng ý, do dự, không đồng ý và từ chối trả lời. Cáctình huống này có thể cho kết quả rõ ràng hơn trên các thuật toánphân cụm dựa trên PFS. Chính vì vậy việc phát triển thuật toán phân 1cụm mờ trên PFS sẽ nâng cao độ chính xác phân cụm. Hiện nay cácthuật toán phân cụm mờ trên tập mờ viễn cảnh mới chỉ dừng lại ởviệc đưa ra một số độ đo kết hợp sử dụng phân cụm phân cấp để thựchiện mà chưa xem xét đến việc phân cụm theo cách tiếp cận phânhoạch. Ngoài các nhược điểm về chất lượng cụm, thuật toán FCM vàcác thuật toán phân cụm trên các tập mờ nâng cao còn có một sốnhược điểm khác như xác định số cụm hay xử lý với dữ liệu phứctạp. Thứ nhất, thuật toán FCM và các thuật toán phân cụm trên cáctập mờ nâng cao phải xác định trước số cụm trước khi thực hiện phâncụm. Việc xác định số cụm ban đầu không tốt dẫn đến chất lượngcụm không tốt, chứa nhiễu hoặc các điểm ngoại biên. Có ba cách tiếpcận cụ thể là quét, tiền xử lý và cắt tỉa đang được sử dụng nhiều nhất.Các nghiên cứu đã chứng minh được phương pháp cắt tỉa là cách tiếpcận hiệu quả nhất. Thứ hai, xử lý với dữ liệu phức tạp là không dễvới FCM và các thuật toán phân cụm trẻn tập mờ nâng cao. Cácphương pháp phân cụm trên tập dữ liệu phức tạp được chia thành hainhóm: loại dữ liệu hỗn hợp bao gồm dữ liệu kiểu loại, dữ liệu số vàcấu trúc đặc biệt của dữ liệu. Phân cụm mờ có rất nhiều ứng dụng trong thực tế cuộc sống ởrất nhiều lĩnh vực khác nhau như: trong kinh tế với dự báo tỉ giá, dựbáo chứng khoán, dự báo tài chính, …; trong y khoa: Hỗ trợ chuẩnđoán hình ảnh, hỗ trợ tư vấn khám bệnh, …; trong thủy văn: dự báothời tiết ngắn hạn, …; trong xử lý ảnh: Phân đoạn ảnh, …; trong hệtư vấn: hỗ trợ ra quyết định, … Đề tài nghiên cứu tập trung vào ứng dụng của phân cụm mờtrong bài toán dự báo thời tiết ngắn hạn. Dự báo thời tiết ngắn hạnkết hợp mô tả về trạng thái hiện tại của khí quyển v ...

Tài liệu được xem nhiều:

Tài liệu liên quan: