Luận văn Thạc sĩ Khoa học: Các thuật toán phân tích phân cụm và ứng dụng
Số trang: 64
Loại file: pdf
Dung lượng: 757.74 KB
Lượt xem: 12
Lượt tải: 0
Xem trước 7 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận văn có kết cấu gồm 3 chương. Chương 1 nêu khái quát chung về nhận dạng, bao gồm khái niệm về dạng, lớp dạng và khái niệm nhận dạng, cùng với những ứng dụng của nhận dạng. Chương 2 trình bày một số các thuật toán phân cụm dữ liệu trong 2 trường hợp: chưa biết trước số lớp và đã biết trước số lớp. Chương 3 xây dựng chương trình ứng dụng minh họa cho thuật toán ISODATA, trong đó có ứng dụng thuật toán ISODATA để phân cụm dữ liệu với số liệu đầu vào cho trước.
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Khoa học: Các thuật toán phân tích phân cụm và ứng dụngMục lụcLời nói đầu iii1 Khái quát chung về dạng và nhận dạng 1 1.1 Khái niệm về dạng và nhận dạng . . . . . . . . . . . . . . 1 1.1.1 Khái niệm về dạng, lớp dạng . . . . . . . . . . . . . 1 1.1.2 Khái niệm nhận dạng: . . . . . . . . . . . . . . . . 2 1.2 Không gian mẫu và cách tiếp cận nhận dạng . . . . . . . . 2 1.3 Một số ứng dụng của nhận dạng: . . . . . . . . . . . . . . 5 1.3.1 Nhận dạng giọng nói . . . . . . . . . . . . . . . . . 6 1.3.2 Nhận dạng chữ viết tay . . . . . . . . . . . . . . . 7 1.3.3 Dự báo thời tiết . . . . . . . . . . . . . . . . . . . . 7 1.3.4 Phân tích điện tâm đồ để chẩn đoán hoạt động của tim . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3.5 Phân tích y học bằng chụp tia X-quang . . . . . . . 8 1.3.6 Làm rõ các bức ảnh chụp từ vệ tinh và khoảng không 8 1.4 Học có hướng dẫn và không có hướng dẫn . . . . . . . . . 92 Phân tích phân cụm và các thuật toán phân cụm 11 2.1 Phân tích phân cụm . . . . . . . . . . . . . . . . . . . . . 11 2.1.1 Khái niệm phân cụm . . . . . . . . . . . . . . . . . 11 2.1.2 Ứng dụng của phân cụm . . . . . . . . . . . . . . . 13 2.1.3 Các yêu cầu của phân tích phân cụm . . . . . . . . 13 2.2 Các độ đo thường được sử dụng trong phân tích phân cụm 15 2.2.1 Độ đo sự gần gũi . . . . . . . . . . . . . . . . . . . 15 2.2.2 Khoảng cách giữa hai cụm (interset) và khoảng cách nội cụm (intraset) . . . . . . . . . . . . . . . . . . . 17 2.3 Phân cụm trong trường hợp số lớp chưa biết . . . . . . . . 19 2.3.1 Thuật toán sử dụng phương pháp trực quan . . . . 19 2.3.2 Thuật toán Batchelor và Wilkins . . . . . . . . . . 21 i 2.4 Phân cụm trong trường hợp đã biết số lớp . . . . . . . . . 25 2.4.1 Thuật toán ISODATA . . . . . . . . . . . . . . . . 25 2.4.2 Thuật toán ISODATA hiệu chỉnh . . . . . . . . . . 34 2.4.3 Thuật toán K-means . . . . . . . . . . . . . . . . . 36 2.5 Thuật toán K*-means . . . . . . . . . . . . . . . . . . . . 40 2.5.1 Độ đo cho phân cụm dữ liệu . . . . . . . . . . . . . 41 2.5.2 Thuật toán K*-means . . . . . . . . . . . . . . . . 45 2.6 Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . 483 Chương trình ứng dụng thuật toán ISODATA 52 3.1 Nêu lại ví dụ: . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.2 Các trường hợp tính toán . . . . . . . . . . . . . . . . . . 52Kết luận 59Tài liệu tham khảo 60 ii Lời nói đầu Cuộc sống ngày càng hiện đại, khoa học công nghệ ngày càng pháttriển và đạt được nhiều thành tựu to lớn, phục vụ thiết thực cho cuộc sốngcủa con người. Trong những thành tựu đó không thể không nhắc tới côngnghệ nhận dạng. Công nghệ nhận dạng sử dụng khả năng tính toán củamáy tính để xử lý một khối lượng dữ liệu lớn thành các thông tin cần thiếtdựa vào quá trình nhận dạng của con người. Nhờ công nghệ nhận dạngbạn có thể điều khiển các đồ vật trong nhà mình không cần bằng tay màbằng giọng nói, hay bạn không phải tra thìa khóa vào ổ để mở cửa mà chỉcần đặt tay vào máy nhận dạng là cửa tự động mở, v.v. Còn vô số các ứngdụng mà bạn không thể ngờ tới trong tương lai không xa. Công nghệ cuộcsống, điều đó thật thú vị phải không? Đó là lí do vì sao chúng tôi chọn đềtài Các thuật toán phân tích phân cụm và ứng dụng. Không đi sâu vàonghiên cứu từng ứng dụng cụ thể của nhận dạng ở trên mà luận văn nàytập trung vào ba chương chính: Chương 1: Nêu khái quát chung về nhận dạng, bao gồm khái niệmvề dạng, lớp dạng và khái niệm nhận dạng, cùng với những ứng dụng củanhận dạng. Qua đó cung cấp cho chúng ta một cách nhìn tổng quan vềnhận dạng. Chương 2: Đây là nội dung chính của bản luận văn. Chương này gồmba phần: • Phần đầu là mục phân tích phân cụm bao gồm khái niệm phân cụm, ứng dụng của phân cụm, và một số yêu cầu trong phân cụm. • Giới thiệu một số độ đo thường được sử dụng trong phân tích phân ...
Nội dung trích xuất từ tài liệu:
Luận văn Thạc sĩ Khoa học: Các thuật toán phân tích phân cụm và ứng dụngMục lụcLời nói đầu iii1 Khái quát chung về dạng và nhận dạng 1 1.1 Khái niệm về dạng và nhận dạng . . . . . . . . . . . . . . 1 1.1.1 Khái niệm về dạng, lớp dạng . . . . . . . . . . . . . 1 1.1.2 Khái niệm nhận dạng: . . . . . . . . . . . . . . . . 2 1.2 Không gian mẫu và cách tiếp cận nhận dạng . . . . . . . . 2 1.3 Một số ứng dụng của nhận dạng: . . . . . . . . . . . . . . 5 1.3.1 Nhận dạng giọng nói . . . . . . . . . . . . . . . . . 6 1.3.2 Nhận dạng chữ viết tay . . . . . . . . . . . . . . . 7 1.3.3 Dự báo thời tiết . . . . . . . . . . . . . . . . . . . . 7 1.3.4 Phân tích điện tâm đồ để chẩn đoán hoạt động của tim . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3.5 Phân tích y học bằng chụp tia X-quang . . . . . . . 8 1.3.6 Làm rõ các bức ảnh chụp từ vệ tinh và khoảng không 8 1.4 Học có hướng dẫn và không có hướng dẫn . . . . . . . . . 92 Phân tích phân cụm và các thuật toán phân cụm 11 2.1 Phân tích phân cụm . . . . . . . . . . . . . . . . . . . . . 11 2.1.1 Khái niệm phân cụm . . . . . . . . . . . . . . . . . 11 2.1.2 Ứng dụng của phân cụm . . . . . . . . . . . . . . . 13 2.1.3 Các yêu cầu của phân tích phân cụm . . . . . . . . 13 2.2 Các độ đo thường được sử dụng trong phân tích phân cụm 15 2.2.1 Độ đo sự gần gũi . . . . . . . . . . . . . . . . . . . 15 2.2.2 Khoảng cách giữa hai cụm (interset) và khoảng cách nội cụm (intraset) . . . . . . . . . . . . . . . . . . . 17 2.3 Phân cụm trong trường hợp số lớp chưa biết . . . . . . . . 19 2.3.1 Thuật toán sử dụng phương pháp trực quan . . . . 19 2.3.2 Thuật toán Batchelor và Wilkins . . . . . . . . . . 21 i 2.4 Phân cụm trong trường hợp đã biết số lớp . . . . . . . . . 25 2.4.1 Thuật toán ISODATA . . . . . . . . . . . . . . . . 25 2.4.2 Thuật toán ISODATA hiệu chỉnh . . . . . . . . . . 34 2.4.3 Thuật toán K-means . . . . . . . . . . . . . . . . . 36 2.5 Thuật toán K*-means . . . . . . . . . . . . . . . . . . . . 40 2.5.1 Độ đo cho phân cụm dữ liệu . . . . . . . . . . . . . 41 2.5.2 Thuật toán K*-means . . . . . . . . . . . . . . . . 45 2.6 Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . 483 Chương trình ứng dụng thuật toán ISODATA 52 3.1 Nêu lại ví dụ: . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.2 Các trường hợp tính toán . . . . . . . . . . . . . . . . . . 52Kết luận 59Tài liệu tham khảo 60 ii Lời nói đầu Cuộc sống ngày càng hiện đại, khoa học công nghệ ngày càng pháttriển và đạt được nhiều thành tựu to lớn, phục vụ thiết thực cho cuộc sốngcủa con người. Trong những thành tựu đó không thể không nhắc tới côngnghệ nhận dạng. Công nghệ nhận dạng sử dụng khả năng tính toán củamáy tính để xử lý một khối lượng dữ liệu lớn thành các thông tin cần thiếtdựa vào quá trình nhận dạng của con người. Nhờ công nghệ nhận dạngbạn có thể điều khiển các đồ vật trong nhà mình không cần bằng tay màbằng giọng nói, hay bạn không phải tra thìa khóa vào ổ để mở cửa mà chỉcần đặt tay vào máy nhận dạng là cửa tự động mở, v.v. Còn vô số các ứngdụng mà bạn không thể ngờ tới trong tương lai không xa. Công nghệ cuộcsống, điều đó thật thú vị phải không? Đó là lí do vì sao chúng tôi chọn đềtài Các thuật toán phân tích phân cụm và ứng dụng. Không đi sâu vàonghiên cứu từng ứng dụng cụ thể của nhận dạng ở trên mà luận văn nàytập trung vào ba chương chính: Chương 1: Nêu khái quát chung về nhận dạng, bao gồm khái niệmvề dạng, lớp dạng và khái niệm nhận dạng, cùng với những ứng dụng củanhận dạng. Qua đó cung cấp cho chúng ta một cách nhìn tổng quan vềnhận dạng. Chương 2: Đây là nội dung chính của bản luận văn. Chương này gồmba phần: • Phần đầu là mục phân tích phân cụm bao gồm khái niệm phân cụm, ứng dụng của phân cụm, và một số yêu cầu trong phân cụm. • Giới thiệu một số độ đo thường được sử dụng trong phân tích phân ...
Tìm kiếm theo từ khóa liên quan:
Thuật toán phân cụm Thuật toán ISODATA Khái niệm nhận dạng Khái niệm phân cụm Luận văn thạc sĩ khoa họcTài liệu liên quan:
-
26 trang 288 0 0
-
26 trang 88 0 0
-
23 trang 81 0 0
-
86 trang 79 0 0
-
Luận văn Thạc sĩ Khoa học: Đặc điểm hình thành các hợp chất Nito trong nước dưới đất khu vực Hà Nội
131 trang 39 0 0 -
86 trang 32 0 0
-
111 trang 32 0 0
-
26 trang 30 0 0
-
89 trang 30 0 0
-
Luận văn Thạc sĩ Khoa học: Nghiên cứu, xây dựng quy trình sản xuất cơm thập cẩm ăn liền
173 trang 29 1 0