Danh mục

BÀI GIẢNG ĐIỀU KHIỂN THÔNG MINH - CHƯƠNG 4 XÂU CHUỖI FUZZY (FUZZY CLUSTERING)

Số trang: 16      Loại file: pdf      Dung lượng: 621.12 KB      Lượt xem: 6      Lượt tải: 0    
Jamona

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Kỹ thuật xâu chuỗi là phương pháp không giám sát (unsupervised methods) được dùng khi tổ chức dữ liệu thành nhóm dùng tính giống nhau của từng mục dữ liệu riêng. Hầu hết các thuật toán xâu chuỗi đều dùng các phương pháp thống kê truyền thống, như phương pháp phân bố dữ liệu thống kê cơ sở, nên rất hữu ích trong trường hợp biết rất it thông tin ban đầu. Khả năng của các thuật toán xâu chuỗi trong nhằm phát hiện cấu trúc cơ bản (underlying structures) trong dữ liệu, và được khái thác trong rất nhiều...
Nội dung trích xuất từ tài liệu:
BÀI GIẢNG ĐIỀU KHIỂN THÔNG MINH - CHƯƠNG 4 XÂU CHUỖI FUZZY (FUZZY CLUSTERING) ĐIỀU KHIỂN THÔNG MINH Tröôøng ÑH SPKT TP. HCM http://www.hcmute.edu.vn CHƯƠNG BỐN: XÂU CHUỖI FUZZY (FUZZY CLUSTERING) Kỹ thuật xâu chuỗi là phương pháp không giám sát (unsupervised methods) được dùng khi tổ chức dữ liệu thành nhóm dùng tính giống nhau của từng mục dữ liệu riêng. Hầu hết các thuật toán xâu chuỗi đều dùng các phương pháp thống kê truyền thống, như phương pháp phân bố dữ liệu thống kê cơ sở, nên rất hữu ích trong trường hợp biết rất it thông tin ban đầu. Khả năng của các thuật toán xâu chuỗi trong nhằm phát hiện cấu trúc cơ bản (underlying structures) trong dữ liệu, và được khái thác trong rất nhiều ứng dụng như xếp lớp, xử lý ảnh, phân loại mẫu, mô hình và nhận dạng. Chương này trình bày tổng quan về thuật toán xâu chuỗi mờ trên nền c-means. Độc giả có thể tham khảo thêm về phép xâu chuỗi mờ trong tài liệu cổ điển của Duda và Hart (1973), Bezdek (1981) và Jain và Dubes (1988). Gần đây có thêm phần tổng quan về các thuật toán xâu chuỗi của (Bezdek and Pal, 1992). 1. Các ý niệm cơ bản M . HC T TP Trình bày các ý niệm cơ bản về dữ liệu, chuỗi cluster,Kvà chuỗi prototypes cùng tổng SP g ÑH ôøn quan về nhiều hướng xâu chuỗi khác. à Trö äc ve thuo uyeàn q 1.1 Tập dữ liệu Baûn Kỹ thuật xâu chuỗi có thể áp dụng cho dữ liệu định lượng (dạng số), dữ liệu định tính (khẳng định), hay hỗn hợp cả hai. Chương này xem xét việc xâu chuỗi các dữ liệu định lượng. Dữ liệu là quan sát tiêu biểu của các quá trình vật lý nào đó. Mỗi quan sát n biến đo được, nhóm thành vectơ cột n-chiều zk = [z1k, . . . , znk]T, zk  Rn. Tập của N quan sát được gọi là Z = {zk | k = 1, 2, . . ., N}, và được biểu diễn thành ma trận n × N: z12  z1 N   z11 z z 22  z 2 N  Z   21        z n 2  z nN   z n1 (4.1) Trong thuật ngữ về nhận dạng mẫu, các cột của ma trận này được gọi là mẫu (patterns) hay đối tượng (objects), các hàng được gọi là đặc trưng (features) hay hay thuộc tính (attributes), và Z được gọi là mẫu hình (pattern) hay ma trận dữ liệu. Ý nghĩa của các hàng và các cột trong Z tùy thuộc vào ngữ cảnh. Thí dụ, trong chẩn đoán y khoa, các cột này có thể là bệnh nhân, và các hàng là các hiện tượng, hay các xác nghiệm của các bệnh nhân này. Khi dùng phương pháp xâu chuỗi trong mô hình hóa và nhận dạng hệ thống động, các cột trong Z có thể chứa các mẫu tín hiệu thời gian, và các cột là các biến vật lý quan sát được của hệ thống (vị trí, áp suất, nhiệt độ, v.v,..). Để biểu diễn được các đăc tính động của hệ thống, cũng cần có thêm các trị quá khứ của các biến này trong Z. Thö vieän ÑH SPKT TP. HCM - http://www.thuvienspkt.edu.vn TRANG – 53 53 ĐIỀU KHIỂN THÔNG MINH Tröôøng ÑH SPKT TP. HCM http://www.hcmute.edu.vn 1.2 Clusters và Prototypes Có nhiều định nghĩa về cluster, tùy theo mục tiêu xâu chuỗi. Thông thường, xem quan điểm rằng cluster là nhóm các đối tượng giống nhau nhiều hơn so với các thành viên của nhóm các clusters khác (Bezdek, 1981; Jain và Dubes, 1988). Thừa số “tương tự” cần được hiểu theo nghĩa tương tự toán học theo nghĩa chính xác. Trong không gian mêtric, tương tự thường được định nghĩa thông qua ý nghĩa norm cự ly (distance norm). Cự ly có thể đo theo tự thân vectơ dữ liệu, hay là cự ly từ vectơ dữ liệu đến một số (prototype) của cluster. Cá ...

Tài liệu được xem nhiều: