Lịch sử khai phá dữ liệu
Số trang: 14
Loại file: doc
Dung lượng: 97.50 KB
Lượt xem: 11
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bạn đọc chắc hẳn là một người rất thích thú với lĩnh vực ứng dụng khai phá dữliệu vào thực tiễn. Nếu không thì bạn đã chẳng đọc cuốn sách này. Chúng ta đềubiết hiện nay có rất nhiều cuốn sách viết về quá trình khai phá dữ liệu. Hầu hết cáctài liệu này đều tập trung trình bày những đặc điểm, chức năng của các công cụ vàgiải thuật khai phá dữ liệu khác nhau.
Nội dung trích xuất từ tài liệu:
Lịch sử khai phá dữ liệuMỤC LỤCChương 1: Nền tảng ứng dụng của khai phá dữ liệu.............................................................2I. Mở đầu...................................................................................................................................2II. Lịch sử của ngành khoa học thống kê và khai phá dữ liệu.................................................4III. Khoa học thống kê hiện đại................................................................................................4IV. Hai quan điểm thực tế........................................................................................................7V. Sự xuất hiện của phân tích thống kê hiện đại: Thế hệ thứ hai.........................................9VI. Dữ liệu, dữ liệu ở mọi nơi...............................................................................................11VII. Phương pháp học máy: Thế hệ thứ ba...........................................................................11VIII. Học thuyết thống kê: Tổng quan thứ 4.........................................................................12PHỤ CHÚ................................................................................................................................14 1Chương1:NềntảngứngdụngcủakhaiphádữliệuI.Mởđầu Bạn đọc chắc hẳn là một người rất thích thú với lĩnh vực ứng dụng khai phá dữliệu vào thực tiễn. Nếu không thì bạn đã chẳng đọc cuốn sách này. Chúng ta đềubiết hiện nay có rất nhiều cuốn sách viết về quá trình khai phá dữ liệu. Hầu hết cáctài liệu này đều tập trung trình bày những đặc điểm, chức năng của các công cụ vàgiải thuật khai phá dữ liệu khác nhau. Một số tài liệu khác thì lại tập trung vào việcđề cập đến những thách thức mà chúng ta có thể gặp phải trong quá trình khai phádữ liệu. Cuốn sách này được trình bày với một mục đích hoàn toàn khác, nhằm cungcấp cho bạn một một cái nhìn tổng quan về ứng dụng của khai phá dữ liệu trongthực tiễn. Điều đầu tiên mà chúng ta phải xem xét tới khi muốn thực hiện quá trình khai phádữ liệu tác nghiệp của một doanh nghiệp đó là lựa chọn công cụ khai phá dữ liệu.Thật khó để có thể nhìn ra sự thực đằng sau những lời quảng cáo thổi phồng củacác công ty phần mềm về những công cụ khai phá dữ liệu mà họ phát triển. Thực tếcho thấy rằng chính những công cụ khai phá dữ liệu xoàng xĩnh nhất vẫn có khảnăng tạo ra được những mô hình đạt chất lượng tốt, chỉ thua kém chút ít (khoảng10% về chất lượng) so với những mô hình được tạo ra bởi các công cụ khai pháđược xem là tốt nhất. Một giải pháp khai phá dữ liệu đạt chất lượng tốt được thực hiện chỉ với nhữngcông cụ chi phí thấp sẽ cho hiệu quả kinh tế cao hơn nhiều so với việc sử dụngnhững công cụ đắt tiền mà hiệu quả chỉ cao hơn khoảng 10%. Vậy bạn sẽ lựa chọncông cụ khai phá dữ liệu cho mình như thế nào? Một vài tổng kết đã được đưa ra. Danh sách các công cụ tốt nhất và phổ biếnnhất được cập nhật hằng năm trên trang KDNuggets.com. Một số tổng kết có trongtài liệu không chỉ chỉ đơn thuần là thảo luận về các đặc điểm và chức năng của cáccông cụ. Việc so sánh các công cụ khai phá dữ liệu một cách chi tiết và chính xáccũng rất thú vị. Những tài liệu được download nhiều nhất là những tài liệu liênquan đến lĩnh vực khai phá dữ liệu - điều này cũng thật dễ hiểu nhưng lại là vềcác công cụ ra đời cách đây cả chục năm được tổng kết bởi Elder và Abbott vào năm1998. 2 Những cân nhắc khác cần phải tính tới khi muốn xây dựng ứng dụng khai phá dữliệu tác nghiệp của một doanh nghiệp là thành lập nhóm phát triển, thiết lập nềntảng, tổ chức việc ứng dụng khai phá dữ liệu sao cho hiệu quả. Cuốn sách nàykhông thảo luận về chủ đề xây dựng nền tảng cho khai phá dữ liệu. Chủ đề này đãđược đề cập khá nhiều trong các cuốn sách. Một cuốn sách tốt, cung cấp một cáinhìn tổng quan về việc xây dựng nền tảng cho khai phá dữ liệu đó là cuốn: Khaiphá dữ liệu: khái niệm và phương pháp được biên soạn bởi Han và Kamber, pháthành năm 2006. Trọng tâm chính của cuốn sách này là trình bày một cách tiếp cận theo hướngthực hành để xây dựng một mô hình khai phá dữ liệu hiệu quả, ít tốn kém, hướngtới việc góp phần tăng lợi nhuận cho doanh nghiệp, trong đó sử dụng các bài học vàcác phiên bản demo của các công cụ khai phá dữ liệu thường dùng. Chúng ta không được cho rằng nền tảng cơ sở của khai phá dữ liệu là khôngquan trọng. Nó thực sự quan trọng cho dù chúng ta có nhận ra nó từ đầu hay không.Lý do là bởi vì phương pháp luận của khoa học thống kê và khai phá dữ liệu khôngphải tự nhiên mà có. Phương pháp phân tích dữ liệu được phát triển dựa trên sự kếthợp của lý thuyết phân tích và thống kê toán. Yếu tố thúc đẩy sự phát triển này là do yêu cầu cấp bách ...
Nội dung trích xuất từ tài liệu:
Lịch sử khai phá dữ liệuMỤC LỤCChương 1: Nền tảng ứng dụng của khai phá dữ liệu.............................................................2I. Mở đầu...................................................................................................................................2II. Lịch sử của ngành khoa học thống kê và khai phá dữ liệu.................................................4III. Khoa học thống kê hiện đại................................................................................................4IV. Hai quan điểm thực tế........................................................................................................7V. Sự xuất hiện của phân tích thống kê hiện đại: Thế hệ thứ hai.........................................9VI. Dữ liệu, dữ liệu ở mọi nơi...............................................................................................11VII. Phương pháp học máy: Thế hệ thứ ba...........................................................................11VIII. Học thuyết thống kê: Tổng quan thứ 4.........................................................................12PHỤ CHÚ................................................................................................................................14 1Chương1:NềntảngứngdụngcủakhaiphádữliệuI.Mởđầu Bạn đọc chắc hẳn là một người rất thích thú với lĩnh vực ứng dụng khai phá dữliệu vào thực tiễn. Nếu không thì bạn đã chẳng đọc cuốn sách này. Chúng ta đềubiết hiện nay có rất nhiều cuốn sách viết về quá trình khai phá dữ liệu. Hầu hết cáctài liệu này đều tập trung trình bày những đặc điểm, chức năng của các công cụ vàgiải thuật khai phá dữ liệu khác nhau. Một số tài liệu khác thì lại tập trung vào việcđề cập đến những thách thức mà chúng ta có thể gặp phải trong quá trình khai phádữ liệu. Cuốn sách này được trình bày với một mục đích hoàn toàn khác, nhằm cungcấp cho bạn một một cái nhìn tổng quan về ứng dụng của khai phá dữ liệu trongthực tiễn. Điều đầu tiên mà chúng ta phải xem xét tới khi muốn thực hiện quá trình khai phádữ liệu tác nghiệp của một doanh nghiệp đó là lựa chọn công cụ khai phá dữ liệu.Thật khó để có thể nhìn ra sự thực đằng sau những lời quảng cáo thổi phồng củacác công ty phần mềm về những công cụ khai phá dữ liệu mà họ phát triển. Thực tếcho thấy rằng chính những công cụ khai phá dữ liệu xoàng xĩnh nhất vẫn có khảnăng tạo ra được những mô hình đạt chất lượng tốt, chỉ thua kém chút ít (khoảng10% về chất lượng) so với những mô hình được tạo ra bởi các công cụ khai pháđược xem là tốt nhất. Một giải pháp khai phá dữ liệu đạt chất lượng tốt được thực hiện chỉ với nhữngcông cụ chi phí thấp sẽ cho hiệu quả kinh tế cao hơn nhiều so với việc sử dụngnhững công cụ đắt tiền mà hiệu quả chỉ cao hơn khoảng 10%. Vậy bạn sẽ lựa chọncông cụ khai phá dữ liệu cho mình như thế nào? Một vài tổng kết đã được đưa ra. Danh sách các công cụ tốt nhất và phổ biếnnhất được cập nhật hằng năm trên trang KDNuggets.com. Một số tổng kết có trongtài liệu không chỉ chỉ đơn thuần là thảo luận về các đặc điểm và chức năng của cáccông cụ. Việc so sánh các công cụ khai phá dữ liệu một cách chi tiết và chính xáccũng rất thú vị. Những tài liệu được download nhiều nhất là những tài liệu liênquan đến lĩnh vực khai phá dữ liệu - điều này cũng thật dễ hiểu nhưng lại là vềcác công cụ ra đời cách đây cả chục năm được tổng kết bởi Elder và Abbott vào năm1998. 2 Những cân nhắc khác cần phải tính tới khi muốn xây dựng ứng dụng khai phá dữliệu tác nghiệp của một doanh nghiệp là thành lập nhóm phát triển, thiết lập nềntảng, tổ chức việc ứng dụng khai phá dữ liệu sao cho hiệu quả. Cuốn sách nàykhông thảo luận về chủ đề xây dựng nền tảng cho khai phá dữ liệu. Chủ đề này đãđược đề cập khá nhiều trong các cuốn sách. Một cuốn sách tốt, cung cấp một cáinhìn tổng quan về việc xây dựng nền tảng cho khai phá dữ liệu đó là cuốn: Khaiphá dữ liệu: khái niệm và phương pháp được biên soạn bởi Han và Kamber, pháthành năm 2006. Trọng tâm chính của cuốn sách này là trình bày một cách tiếp cận theo hướngthực hành để xây dựng một mô hình khai phá dữ liệu hiệu quả, ít tốn kém, hướngtới việc góp phần tăng lợi nhuận cho doanh nghiệp, trong đó sử dụng các bài học vàcác phiên bản demo của các công cụ khai phá dữ liệu thường dùng. Chúng ta không được cho rằng nền tảng cơ sở của khai phá dữ liệu là khôngquan trọng. Nó thực sự quan trọng cho dù chúng ta có nhận ra nó từ đầu hay không.Lý do là bởi vì phương pháp luận của khoa học thống kê và khai phá dữ liệu khôngphải tự nhiên mà có. Phương pháp phân tích dữ liệu được phát triển dựa trên sự kếthợp của lý thuyết phân tích và thống kê toán. Yếu tố thúc đẩy sự phát triển này là do yêu cầu cấp bách ...
Tìm kiếm theo từ khóa liên quan:
Lịch sử khai phá dữ liệu khoa học thống kê phân tích thống kê hiện đại phương pháp học máy học thuyết thống kêGợi ý tài liệu liên quan:
-
Trích xuất danh mục khía cạnh sử dụng BERT với hàm mất mát cân bằng
9 trang 131 0 0 -
Áp dụng phương pháp học máy để phát hiện tấn công DDoS trong môi trường thực nghiệm mạng SDN
5 trang 99 0 0 -
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 0: Giới thiệu môn học
12 trang 30 0 0 -
Mô hình hệ thống khai thác dữ liệu phi cấu trúc hỗ trợ khách hàng ra quyết định mua hàng trực tuyến
6 trang 28 0 0 -
Luận án Tiến sĩ Răng hàm mặt: Hiệu quả của chẩn đoán sâu răng giai đoạn sớm bằng phương pháp học máy
201 trang 27 0 0 -
Bộ dữ liệu dạng Netflow dùng trong phát hiện xâm nhập trái phép và ứng dụng
12 trang 27 0 0 -
5 trang 25 0 0
-
26 trang 24 0 0
-
Giải đoán địa hình đáy ven biển bằng ảnh vệ tinh sử dụng học máy và điện toán đám mây
3 trang 24 0 0 -
Bài giảng Máy học và mạng neural: Bài 1 - TS. Vũ Đức Lung
55 trang 24 0 0