Danh mục

Lịch sử khai phá dữ liệu

Số trang: 14      Loại file: doc      Dung lượng: 97.50 KB      Lượt xem: 11      Lượt tải: 0    
Thư viện của tui

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bạn đọc chắc hẳn là một người rất thích thú với lĩnh vực ứng dụng khai phá dữliệu vào thực tiễn. Nếu không thì bạn đã chẳng đọc cuốn sách này. Chúng ta đềubiết hiện nay có rất nhiều cuốn sách viết về quá trình khai phá dữ liệu. Hầu hết cáctài liệu này đều tập trung trình bày những đặc điểm, chức năng của các công cụ vàgiải thuật khai phá dữ liệu khác nhau.
Nội dung trích xuất từ tài liệu:
Lịch sử khai phá dữ liệuMỤC LỤCChương 1: Nền tảng ứng dụng của khai phá dữ liệu.............................................................2I. Mở đầu...................................................................................................................................2II. Lịch sử của ngành khoa học thống kê và khai phá dữ liệu.................................................4III. Khoa học thống kê hiện đại................................................................................................4IV. Hai quan điểm thực tế........................................................................................................7V. Sự xuất hiện của phân tích thống kê hiện đại: Thế hệ thứ hai.........................................9VI. Dữ liệu, dữ liệu ở mọi nơi...............................................................................................11VII. Phương pháp học máy: Thế hệ thứ ba...........................................................................11VIII. Học thuyết thống kê: Tổng quan thứ 4.........................................................................12PHỤ CHÚ................................................................................................................................14 1Chương1:NềntảngứngdụngcủakhaiphádữliệuI.Mởđầu Bạn đọc chắc hẳn là một người rất thích thú với lĩnh vực ứng dụng khai phá dữliệu vào thực tiễn. Nếu không thì bạn đã chẳng đọc cuốn sách này. Chúng ta đềubiết hiện nay có rất nhiều cuốn sách viết về quá trình khai phá dữ liệu. Hầu hết cáctài liệu này đều tập trung trình bày những đặc điểm, chức năng của các công cụ vàgiải thuật khai phá dữ liệu khác nhau. Một số tài liệu khác thì lại tập trung vào việcđề cập đến những thách thức mà chúng ta có thể gặp phải trong quá trình khai phádữ liệu. Cuốn sách này được trình bày với một mục đích hoàn toàn khác, nhằm cungcấp cho bạn một một cái nhìn tổng quan về ứng dụng của khai phá dữ liệu trongthực tiễn. Điều đầu tiên mà chúng ta phải xem xét tới khi muốn thực hiện quá trình khai phádữ liệu tác nghiệp của một doanh nghiệp đó là lựa chọn công cụ khai phá dữ liệu.Thật khó để có thể nhìn ra sự thực đằng sau những lời quảng cáo thổi phồng củacác công ty phần mềm về những công cụ khai phá dữ liệu mà họ phát triển. Thực tếcho thấy rằng chính những công cụ khai phá dữ liệu xoàng xĩnh nhất vẫn có khảnăng tạo ra được những mô hình đạt chất lượng tốt, chỉ thua kém chút ít (khoảng10% về chất lượng) so với những mô hình được tạo ra bởi các công cụ khai pháđược xem là tốt nhất. Một giải pháp khai phá dữ liệu đạt chất lượng tốt được thực hiện chỉ với nhữngcông cụ chi phí thấp sẽ cho hiệu quả kinh tế cao hơn nhiều so với việc sử dụngnhững công cụ đắt tiền mà hiệu quả chỉ cao hơn khoảng 10%. Vậy bạn sẽ lựa chọncông cụ khai phá dữ liệu cho mình như thế nào? Một vài tổng kết đã được đưa ra. Danh sách các công cụ tốt nhất và phổ biếnnhất được cập nhật hằng năm trên trang KDNuggets.com. Một số tổng kết có trongtài liệu không chỉ chỉ đơn thuần là thảo luận về các đặc điểm và chức năng của cáccông cụ. Việc so sánh các công cụ khai phá dữ liệu một cách chi tiết và chính xáccũng rất thú vị. Những tài liệu được download nhiều nhất là những tài liệu liênquan đến lĩnh vực khai phá dữ liệu - điều này cũng thật dễ hiểu nhưng lại là vềcác công cụ ra đời cách đây cả chục năm được tổng kết bởi Elder và Abbott vào năm1998. 2 Những cân nhắc khác cần phải tính tới khi muốn xây dựng ứng dụng khai phá dữliệu tác nghiệp của một doanh nghiệp là thành lập nhóm phát triển, thiết lập nềntảng, tổ chức việc ứng dụng khai phá dữ liệu sao cho hiệu quả. Cuốn sách nàykhông thảo luận về chủ đề xây dựng nền tảng cho khai phá dữ liệu. Chủ đề này đãđược đề cập khá nhiều trong các cuốn sách. Một cuốn sách tốt, cung cấp một cáinhìn tổng quan về việc xây dựng nền tảng cho khai phá dữ liệu đó là cuốn: Khaiphá dữ liệu: khái niệm và phương pháp được biên soạn bởi Han và Kamber, pháthành năm 2006. Trọng tâm chính của cuốn sách này là trình bày một cách tiếp cận theo hướngthực hành để xây dựng một mô hình khai phá dữ liệu hiệu quả, ít tốn kém, hướngtới việc góp phần tăng lợi nhuận cho doanh nghiệp, trong đó sử dụng các bài học vàcác phiên bản demo của các công cụ khai phá dữ liệu thường dùng. Chúng ta không được cho rằng nền tảng cơ sở của khai phá dữ liệu là khôngquan trọng. Nó thực sự quan trọng cho dù chúng ta có nhận ra nó từ đầu hay không.Lý do là bởi vì phương pháp luận của khoa học thống kê và khai phá dữ liệu khôngphải tự nhiên mà có. Phương pháp phân tích dữ liệu được phát triển dựa trên sự kếthợp của lý thuyết phân tích và thống kê toán. Yếu tố thúc đẩy sự phát triển này là do yêu cầu cấp bách ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: