![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Tóm tắt luận văn Thạc sỹ ngành Khoa học máy tính: Nghiên cứu phương pháp cho bài toán phân cụm và xây dựng hệ thống thử nghiệm
Số trang: 26
Loại file: pdf
Dung lượng: 953.75 KB
Lượt xem: 5
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Tóm tắt luận văn Thạc sỹ ngành Khoa học máy tính: Nghiên cứu phương pháp cho bài toán phân cụm và xây dựng hệ thống thử nghiệm giới thiệu về khai phá dữ liệu, các khái niệm cơ bản trong khai phá dữ liệu, phân cụm dữ liệu và một số phương pháp trong lĩnh vực này, tìm hiều kết hợp thuật toán trong phân cụm, áp dụng chúng vào một vấn đề cụ thể trong BI, cài đặt ứng dụng cụ thể dựa trên thuật toán.
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sỹ ngành Khoa học máy tính: Nghiên cứu phương pháp cho bài toán phân cụm và xây dựng hệ thống thử nghiệm HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG --------------------------------------- NGUYỄN LÂM TÚNGHIÊN CỨU PHƢƠNG PHÁP CHO BÀI TOÁN PHÂN CỤM VÀ XÂY DỰNG HỆ THỐNG THỬ NGHIỆM Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI – 2013 Luận văn được hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNGNgười hướng dẫn khoa học: PGS.TS Đoàn Văn BanPhản biện 1: ……………………………………………………………………………Phản biện 2: …………………………………………………………………………..Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Côngnghệ Bưu chính Viễn thôngVào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............Có thể tìm hiểu luận văn tại: - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 1 LỜI MỞ ĐẦU Thông tin là một nguồn tri thức rồi rào và quan trọng đối với nhân loại,lượng dữ liệu con người ta thu thập được ngày càng lớn. Với sự phát triển của côngnghệ điện toán và hệ thống lưu trữ dữ liệu thì khối lượng tài nguyên số ngày càngtrở nên đồ sộ và phức tạp. Trong một xã hội hiện đại, thông tin đóng một vai tròthen chốt. Thông tin không những chỉ là một tri thức mà nó còn đóng những vai tròkhác như điều hướng quá trình sản xuất. Ảnh hưởng đến hoạt động xã hội hay thịtrường. Tác động đến thói quen người tiêu dùng. Việc phân cụm dữ liệu, để phân loại và quản lý nguồn dữ liệu một cách cóhiệu quả là một trong những trọng tâm nghiên cứu trong khai phá dữ liệu và Khoahọc máy tính. Mà ứng dụng của nó đã được hiện thực hóa nhiều trong thực tế, kinhdoanh thông minh (BI-Bussiness Intellegent) là một ví dụ rõ nét nhất. Các công tyvà doanh nghiệp luôn muốn phát triển khả năng kinh doanh của họ, muốn phục vụkhách hàng tốt, có thêm khách hàng và lợi nhuận nhiều hơn. Việc hoạch định chiếnlược kinh doanh dựa trên những thông tin hiện tại của công ty là một nhu cầu tấtyếu. Từ đó xây dựng và phát triển các hệ thống BI trở nên rất cần thiết và dần gắnliền với các hoạt động của công ty. Phân cụm dữ liệu có khá nhiều phương pháp. Mỗi phương pháp đều có ưuđiểm, nhược điểm và khả năng ứng dụng riêng của mình. Trong nội dung luận vănnày, tác giả sẽ trình bày phương pháp phân cụm phân cấp kết hợp với mạng nơ-ronđể giải quyết một vấn đề cụ thể trong hệ thống BI. Luận văn được trình bày gồm 3 chương với nội dung các chương như sau: Chương 1: Giới thiệu về khai phá dữ liệu, các khái niệm cơ bản trong khaiphá dữ liệu. Đồng thời trong chương này tác giả cũng đi sâu vào phân cụm dữ liệuvà một số phương pháp trong lĩnh vực này. Chương 2: Trong chương này luận văn tập trung vào việc tìm hiều kết hợpthuật toán trong phân cụm, áp dụng chúng vào một vấn đề cụ thể trong BI. Hai thuậttoán được tìm hiểu sau trong chương này là phân cụm phân cấp và thuật toán SOM. 2Bài toán được đưa ra để giải quyết là bài toán về phân loại khách hàng triển vọng vàsản phẩm tiềm năng.Chương 3: Chương này sẽ đi vào việc cài đặt ứng dụng cụ thể dựa trên thuật toánvà vấn đề đã được nêu ở chương 2. Ứng dụng được phát triển là một ứng dụng đơngiản nhưng bao quát đầy đủ thuật toán cũng như thỏa mãn bài toán đặt ra. 3CHƢƠNG 1: KHAI PHÁ DỮ LIỆU VÀ CÁC PHƢƠNG PHÁPPHÂN CỤM DỮ LIỆU1.1. Giới thiệu chung về khai phá dữ liệu Khai phá dữ liệu là một quá trình rút trích hay khai phá tri thức từ một lượnglớn dữ liệu. Ta nói rằng đây là một quá trình là bởi vì nó được thực hiện theo mộtquy trình với nhiều bước rõ ràng, trong đó mỗi bước có một vai trò nhất định. Việckhai phá dữ liệu là bắt nguồn từ một nhu cầu thực thế khi mà lượng dữ liệu conngười ta sử dụng ngày càng nhiều. Lấy ví dụ như trong quá trình sản xuất, kinhdoanh, dữ liệu về khách hàng, hợp đồng, số liệu kinh doanh, chứng từ, tài liệu, …lên đến hàng triệu file hay bản ghi. Việc quản lý và khai thác lượng lớn dữ liệu nàylà một điều sống còn với các doanh nghiệp.Quá trình khai phá dữ liệu được chia thành ba giai đoạn chính, đó là: - Giai đoạn tiền xử lý (pre-processing) - Giai đoạn khai phá, rút trích (data mining) - Giai đoạn hậu lý xong (post-processing) Hình 1.1.Quá trình khai phá dữ liệu Trong mỗi giai đoạn lại có thể được chia thành các nhiệm vụ nhỏ hơn.Thôngthường vì nhiều lý do mà những dữ liệu thô ban đầu chúng ta không thể sử dụngngay cho quá trình khai phá được. Chúng cần được tinh lọc và xử lý trước. Giaiđoạn tiền xử lý bao gồm bốn bước: - Bước làm sạch dữ liệu (Cleaning): Loại bỏ những dữ liệu dư thừa hoặc không ...
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sỹ ngành Khoa học máy tính: Nghiên cứu phương pháp cho bài toán phân cụm và xây dựng hệ thống thử nghiệm HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG --------------------------------------- NGUYỄN LÂM TÚNGHIÊN CỨU PHƢƠNG PHÁP CHO BÀI TOÁN PHÂN CỤM VÀ XÂY DỰNG HỆ THỐNG THỬ NGHIỆM Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI – 2013 Luận văn được hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNGNgười hướng dẫn khoa học: PGS.TS Đoàn Văn BanPhản biện 1: ……………………………………………………………………………Phản biện 2: …………………………………………………………………………..Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Côngnghệ Bưu chính Viễn thôngVào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............Có thể tìm hiểu luận văn tại: - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 1 LỜI MỞ ĐẦU Thông tin là một nguồn tri thức rồi rào và quan trọng đối với nhân loại,lượng dữ liệu con người ta thu thập được ngày càng lớn. Với sự phát triển của côngnghệ điện toán và hệ thống lưu trữ dữ liệu thì khối lượng tài nguyên số ngày càngtrở nên đồ sộ và phức tạp. Trong một xã hội hiện đại, thông tin đóng một vai tròthen chốt. Thông tin không những chỉ là một tri thức mà nó còn đóng những vai tròkhác như điều hướng quá trình sản xuất. Ảnh hưởng đến hoạt động xã hội hay thịtrường. Tác động đến thói quen người tiêu dùng. Việc phân cụm dữ liệu, để phân loại và quản lý nguồn dữ liệu một cách cóhiệu quả là một trong những trọng tâm nghiên cứu trong khai phá dữ liệu và Khoahọc máy tính. Mà ứng dụng của nó đã được hiện thực hóa nhiều trong thực tế, kinhdoanh thông minh (BI-Bussiness Intellegent) là một ví dụ rõ nét nhất. Các công tyvà doanh nghiệp luôn muốn phát triển khả năng kinh doanh của họ, muốn phục vụkhách hàng tốt, có thêm khách hàng và lợi nhuận nhiều hơn. Việc hoạch định chiếnlược kinh doanh dựa trên những thông tin hiện tại của công ty là một nhu cầu tấtyếu. Từ đó xây dựng và phát triển các hệ thống BI trở nên rất cần thiết và dần gắnliền với các hoạt động của công ty. Phân cụm dữ liệu có khá nhiều phương pháp. Mỗi phương pháp đều có ưuđiểm, nhược điểm và khả năng ứng dụng riêng của mình. Trong nội dung luận vănnày, tác giả sẽ trình bày phương pháp phân cụm phân cấp kết hợp với mạng nơ-ronđể giải quyết một vấn đề cụ thể trong hệ thống BI. Luận văn được trình bày gồm 3 chương với nội dung các chương như sau: Chương 1: Giới thiệu về khai phá dữ liệu, các khái niệm cơ bản trong khaiphá dữ liệu. Đồng thời trong chương này tác giả cũng đi sâu vào phân cụm dữ liệuvà một số phương pháp trong lĩnh vực này. Chương 2: Trong chương này luận văn tập trung vào việc tìm hiều kết hợpthuật toán trong phân cụm, áp dụng chúng vào một vấn đề cụ thể trong BI. Hai thuậttoán được tìm hiểu sau trong chương này là phân cụm phân cấp và thuật toán SOM. 2Bài toán được đưa ra để giải quyết là bài toán về phân loại khách hàng triển vọng vàsản phẩm tiềm năng.Chương 3: Chương này sẽ đi vào việc cài đặt ứng dụng cụ thể dựa trên thuật toánvà vấn đề đã được nêu ở chương 2. Ứng dụng được phát triển là một ứng dụng đơngiản nhưng bao quát đầy đủ thuật toán cũng như thỏa mãn bài toán đặt ra. 3CHƢƠNG 1: KHAI PHÁ DỮ LIỆU VÀ CÁC PHƢƠNG PHÁPPHÂN CỤM DỮ LIỆU1.1. Giới thiệu chung về khai phá dữ liệu Khai phá dữ liệu là một quá trình rút trích hay khai phá tri thức từ một lượnglớn dữ liệu. Ta nói rằng đây là một quá trình là bởi vì nó được thực hiện theo mộtquy trình với nhiều bước rõ ràng, trong đó mỗi bước có một vai trò nhất định. Việckhai phá dữ liệu là bắt nguồn từ một nhu cầu thực thế khi mà lượng dữ liệu conngười ta sử dụng ngày càng nhiều. Lấy ví dụ như trong quá trình sản xuất, kinhdoanh, dữ liệu về khách hàng, hợp đồng, số liệu kinh doanh, chứng từ, tài liệu, …lên đến hàng triệu file hay bản ghi. Việc quản lý và khai thác lượng lớn dữ liệu nàylà một điều sống còn với các doanh nghiệp.Quá trình khai phá dữ liệu được chia thành ba giai đoạn chính, đó là: - Giai đoạn tiền xử lý (pre-processing) - Giai đoạn khai phá, rút trích (data mining) - Giai đoạn hậu lý xong (post-processing) Hình 1.1.Quá trình khai phá dữ liệu Trong mỗi giai đoạn lại có thể được chia thành các nhiệm vụ nhỏ hơn.Thôngthường vì nhiều lý do mà những dữ liệu thô ban đầu chúng ta không thể sử dụngngay cho quá trình khai phá được. Chúng cần được tinh lọc và xử lý trước. Giaiđoạn tiền xử lý bao gồm bốn bước: - Bước làm sạch dữ liệu (Cleaning): Loại bỏ những dữ liệu dư thừa hoặc không ...
Tìm kiếm theo từ khóa liên quan:
Phương pháp cho bài toán phân cụm Thạc sỹ ngành Khoa học máy tính Khoa học máy tính Luận văn Thạc sỹ Xây dựng hệ thống thử nghiệm Phân cụm dữ liệuTài liệu liên quan:
-
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 490 1 0 -
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 383 6 0 -
32 trang 246 0 0
-
Đồ án nghiên cứu khoa học: Ứng dụng công nghệ cảm biến IoT vào mô hình thủy canh
30 trang 204 0 0 -
6 trang 183 0 0
-
Giải thuật và cấu trúc dữ liệu
305 trang 174 0 0 -
76 trang 157 2 0
-
3 trang 147 2 0
-
126 trang 110 0 0
-
Sửa chữa và lắp ráp máy tính tại nhà
276 trang 105 0 0