Danh mục

Mạng nơron phân cụm min-max mờ dựa trên tâm cụm dữ liệu

Số trang: 13      Loại file: pdf      Dung lượng: 417.28 KB      Lượt xem: 8      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết này trình bày một mạng nơron được cải tiến từ mô hình mạng nơron phân cụm min-max mờ FMNN của Simpson. Mô hình cải tiến được gọi là Centroid-based FMNN (CFMNN) nhằm cải thiện hiệu suất phân cụm của FMNN.
Nội dung trích xuất từ tài liệu:
Mạng nơron phân cụm min-max mờ dựa trên tâm cụm dữ liệuCông nghệ thông tin MẠNG NƠRON PHÂN CỤM MIN-MAX MỜ DỰA TRÊN TÂM CỤM DỮ LIỆU Vũ Đình Minh1, Nguyễn Doãn Cường2*, Nguyễn Thị Lan Hương1 Tóm tắt: Mạng nơron min-max mờ (FMNN) là một loại mạng nơron dựa trên hình thức các hyperbox cho phân loại và dự báo. Bài báo này trình bày một mạng nơron được cải tiến từ mô hình mạng nơron phân cụm min-max mờ FMNN của Simpson. Mô hình cải tiến được gọi là Centroid-based FMNN (CFMNN) nhằm cải thiện hiệu suất phân cụm của FMNN. CFMNN sử dụng khoảng cách của mẫu dữ liệu với tâm cụm dữ liệu thuộc hyperbox để điều chỉnh các hyperbox. Các thực nghiệm đã được chúng tôi tiến hành trên các tập dữ liệu PID, Wine và tập dữ liệu thực tế bao gồm 1.500 hồ sơ bệnh nhân để so sánh CFMNN với FMNN đã được công bố trước đây. Các kết quả thử nghiệm cho thấy tiềm năng của CFMNN trong phân cụm dữ liệu.Từ khóa: Min-max mờ, Mạng nơron min-max mờ, Phân cụm, Tâm cụm, Tâm hộp. 1. ĐẶT VẤN ĐỀ Từ lý thuyết tập mờ [15] được Zadeh đưa ra vào năm 1965, đã có nhiều nghiêncứu về nhận biết và phân loại với tập mờ. Trong đó, có rất nhiều nhà khoa học chúý đến sự hợp nhất của logic mờ và mạng nơron để phát triển hệ thống thông minh[3, 12, 14]. Lý do chính là khả năng kết hợp lý luận mờ trong xử lý thông tinkhông chắc chắn với khả năng học của mạng nơron mờ [2, 13, 17, 16]. Dựa trên những ưu điểm của việc kết hợp logic mờ và mạng nơron, Simpsonđã đề xuất một mô hình mạng nơron mờ min-max (FMNN) [10, 11], cho phép kếthợp mạng nơron và lý thuyết min-max mờ (FMM) để giải quyết bài toán phân lớpvà phân cụm. Mô hình FMNN của Simpson sử dụng phương pháp dựa trên dữ liệu, là môhình mạng nơron học gia tăng cho khẳ năng xử lý các bộ dữ liệu quy mô lớn [14].Học gia tăng là một kỹ thuật hiệu quả trong khám phá tri thức vì nó cho phép sửdụng lại, bổ sung thông tin trong một lần duyệt [4]. Một lợi thế của việc học giatăng là tất cả các dữ liệu huấn luyện có thể ngay lập tức sử dụng cho việc học thayvì chờ đợi cho một tập huấn được đào tạo lại. FMNN dựa trên sự tổng hợp của các hyperbox mờ [1] để xác định và giới hạncác không gian con trong không gian mẫu n-chiều. Mỗi hyperbox mờ là một khônggian con được xác định bằng hai điểm min và max. Kích thước của hyperbox mờlà một giá trị trong khoảng từ 0 đến 1, mỗi mẫu vào được phân loại dựa trên mứcđộ thuộc với các hyperbox mờ tương ứng. Thuật toán học của FMNN nhằm mục tiêu tạo và điều chỉnh các hyperboxtrong không gian n-chiều. Nếu quá trình mở rộng tạo ra sự chồng lấn giữa cáchyperbox thì thực hiện quá trình co lại để khử chồng lấn. Nói cách khác, FMNNphân cụm bằng cách tạo ra các hyperbox, mỗi hyperbox đại diện cho một cụm sẽtương ứng là một nơron trong lớp đầu ra. Dựa trên mô hình FMNN gốc, một số biến thể đã được phát triển. Các nghiêncứu trong [8, 9] đã cải tiến FMNN bằng cách sử dụng hệ số khoảng cách tươngquan CCC (Cophenetic Correlation Coefficient) so với tâm hình học của hyperbox.20 V. Đ. Minh, N. D. Cường, N. T. L. Hương, “Mạng nơron phân cụm … tâm cụm dữ liệu.”Nghiên cứu khoa học công nghệMột mạng FMNN mới được Quteishat và Lim đề xuất để giải quyết hiện tượngmạng chỉ có số ít hyperboxes có kích thước lớn được tạo ra [7]. Cả hai đề xuất trênđều dựa trên tâm hình học của các hyperbox, các tác giả đã hiệu chỉnh điểm minvà max của hyperbox dựa trên khoảng cách giữa mẫu và tâm hyperbox. Điều nàythật tốt khi dữ liệu có độ nhiễu thấp, phân bố tương đối đều. Nhưng khi dữ liệu cóđộ nhiễu cao, phân bố không đều trong hyperbox sẽ dẫn đến phân loại sai, làmgiảm hiệu quả thuật toán. Trong bài báo này, chúng tôi đề xuất một mô hình nâng cao hiệu quả phân cụmđược cải tiến từ mô hình gốc của Simpson và các tác giả trong [7, 8, 9], bằng cáchxác định khoảng cách của các mẫu tới tâm của hyperbox và tâm của cụm dữ liệuthuộc hyperbox tương ứng trong FMNN. Việc điều chỉnh điểm min và max củahyperbox phụ thuộc vào khoảng cách giữa mẫu vào và tâm cụm và tâm hình họccủa hyperbox khi giá trị hàm thuộc của hyperbox giảm nhiều. Hiệu quả được đánhgiá bằng cách sử dụng thuật toán sửa đổi để phân cụm trên các tập dữ liệu Wine,PID từ UCI và tập dữ liệu thực tế bao gồm 1.500 hồ sơ bệnh nhân đến khám vàđiều trị bệnh do tăng men gan tại bệnh viện Đa khoa TW Thái Nguyên và BệnhViện Gang Thép Thái Nguyên. Các phần còn lại của bài báo bao gồm: phần 2 tổng hợp lại nghiên cứu nền tảngvề thuật toán mờ min-max và mô hình mạng nơron phân cụm mờ min-max FMNN.Phần 3 trình bày mô hình CFMNN đề xuất. Phần 4 trình bày các kết quả thựcnghiệm và phần 5 kết luận. 2. MẠNG NƠRON PHÂN CỤM MIN-MAX MỜ2.1. Hàm thuộc hyperbox mờ Một hyperbox là một vùng của không gian mẫu n-chiều với các mẫu đi kèmvới hàm thuộc. Kích thước mỗi chiều (ký hiệu là ) của hyperbox nhận giá trịtrong khoảng ...

Tài liệu được xem nhiều: