Bài giảng Nhập môn Khai phá dữ liệu - PGS.TS. Hà Quang Thụy
Số trang: 195
Loại file: pdf
Dung lượng: 13.47 MB
Lượt xem: 15
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Nhập môn Khai phá dữ liệu gồm có những nội dung chính sau: Nhu cầu của khai phá dữ liệu (KPDL), khái niệm KPDL và phát hiện tri thức trong CSDL, KPDL và xử lý CSDL truyền thống, kiểu dữ liệu trong KPDL, kiểu mẫu được khai phá, công nghệ KPDL điển hình, một số ứng dụng điển hình, các vấn đề chính trong KPDL. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Bài giảng Nhập môn Khai phá dữ liệu - PGS.TS. Hà Quang Thụy03/02/17BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆUCHƯƠNG 1. GIỚI THIỆU CHUNG VỀ KHAIPHÁ DỮ LIỆUPGS. TS. HÀ QUANG THỤYHÀ NỘI 09-2015TRƯỜNG ĐẠI HỌC CÔNG NGHỆĐẠI HỌC QUỐC GIA HÀ NỘINội dung2.Nhu cầu của khai phá dữ liệu (KPDL)Khái niệm KPDL và phát hiện tri thức trong CSDLKPDL và xử lý CSDL truyền thống3.4.Kiểu dữ liệu trong KPDL5.Kiểu mẫu được khai phá6.Công nghệ KPDL điển hìnhMột số ứng dụng điển hình7.8.Các vấn đề chính trong KPDL1.1103/02/171. Nhu cầu về khai phá dữ liệuSự bùng nổ dữ liệuLý do công nghệLý do xã hộiThể hiệnKinh tế tri thứcNgành kinh tế định hướng dữ liệuPhát hiện tri thức từ dữ liệuBùng nổ dữ liệu: Luật MooreXuất xứ Gordon E. Moore (1965). Cramming more components onto integratedcircuits, Electronics, 38 (8), April 19, 1965. Một quan sát và dự báo“Phương ngôn 2x Số lượng bán dẫn tích hợp trong một chíp sẽ tăng gấp đôi sau khoảng hainăm Chi phí sản xuất mạch bán dẫn với cùng tính năng giảm một nửa sau hai năm Phiên bản 18 tháng: rút ngắn chu kỳ thời gian2203/02/17Luật Moore & công nghiệp điện tửDẫn dắt ngành công nghệ bán dẫn Mô hình cơ bản cho ngành công nghiệp mạch bán dẫn “Định luật Moore vẫn tạo khả năng cơ bản cho sự phát triển của chúng tôi, vànó vẫn còn hiệu lực tốt tại Intel… Định luật Moore không chỉ là mạch bán dẫn.Nó cũng là cách sử dụng sáng tạo mạch bán dẫn”. Paul S. Otellini, Chủ tịch vàGiám đốc điều hành Tập đoàn Intel “toàn bộ chu trình thiết kế, phát triển, sản xuất, phân phối và bán hàng được coilà có tính bền vững khi tuân theo định luật Moore… Nếu đánh bại định luậtMoore, thị trường không thể hấp thụ hết các sản phẩm mới, và kỹ sư bị mất việclàm. Nếu bị tụt sau định luật Moore, không có gì để mua, và gánh nặng đè lênđôi vai của chuỗi các nhà phân phối sản phẩm”. Daniel Grupp, Giám đốc PTcông nghệ tiên tiến, Acorn Technologies, Inc. (http://acorntech.com/)Thúc đẩy công nghệ xử lý, lưu giữ và truyền dẫn dữ liệu Công nghệ bán dẫn là nền tảng của công nghiệp điện tử. Định luật Moore với công nghiệp phần cứng máy tính: bộ xử lý Intel trong 40năm qua (trang tiếp theo). Bùng nổ về năng lực xử lý tính toán và lưu trữ dữ liệu. Tác động tới sự phát triển công nghệ cơ sở dữ liệu (tổ chức và quản lý dữ liệu)và công nghệ mạng (truyền dẫn dữ liệu)Luật Moore: Bộ xử lý Intel“Anotherdecadeisprobablystraightforward...There is certainly noend to creativity”. Gordon Moore, IntelChairman Emeritus of the BoardSpeaking of extending Moore’s Law atthe International Solid-State CircuitsConference (ISSCC), February 2003.Moore’s Law: Transistor densities on a singlechip double about every two years.(Source: Intel Web site Moore’s Law: Made Realby Intel Innovation,www.intel.com/technology/mooreslaw/?iid=search, accessed January 9, 2008.)3303/02/17Hệ thống ước và bội đơn vị đoGiá trị, cách đọc các bội và ước điển hìnhThiết bị thu thập – lưu trữ dữ liệuNăng lực số hóaSloan Digital Sky Survey Thiết bị số hóa đa dạng Mọi lĩnh vực Quản lý, Thương mại, Khoa học… Một ví dụ điển hình: SDSS http://www.sdss.org/ Đã tạo bản đồ 3-chiều có chứa hơn 930.000 thiên hà vàhơn 120.000 quasar Kính viễn vọng đầu tiên Làm việc từ 2000 Vài tuần đầu tiên: thu thập dữ liệu thiên văn học = toàn bộtrong quá khứ. Sau 10 năm: 140 TB Kính viễn vọng kế tiếp Large Synoptic Survey Telescope Bắt đầu hoạt động 2016. Sau 5 ngày sẽ có 140 TB4403/02/17Tiến hóa Công nghệ CSDL: năm 2006Tiến hóa công nghệ CSDL [HK0106]: Hệ CSDL mở rộng,KDL & KPDL, Hệ CSDL dựa trên WebTiến hóa Công nghệ CSDL: năm 2011Tiến hóa công nghệ CSDL [HKP11]: Hệ CSDL mở rộngvà Phân tích dữ liệu mở rộng (có KPDL)55
Nội dung trích xuất từ tài liệu:
Bài giảng Nhập môn Khai phá dữ liệu - PGS.TS. Hà Quang Thụy03/02/17BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆUCHƯƠNG 1. GIỚI THIỆU CHUNG VỀ KHAIPHÁ DỮ LIỆUPGS. TS. HÀ QUANG THỤYHÀ NỘI 09-2015TRƯỜNG ĐẠI HỌC CÔNG NGHỆĐẠI HỌC QUỐC GIA HÀ NỘINội dung2.Nhu cầu của khai phá dữ liệu (KPDL)Khái niệm KPDL và phát hiện tri thức trong CSDLKPDL và xử lý CSDL truyền thống3.4.Kiểu dữ liệu trong KPDL5.Kiểu mẫu được khai phá6.Công nghệ KPDL điển hìnhMột số ứng dụng điển hình7.8.Các vấn đề chính trong KPDL1.1103/02/171. Nhu cầu về khai phá dữ liệuSự bùng nổ dữ liệuLý do công nghệLý do xã hộiThể hiệnKinh tế tri thứcNgành kinh tế định hướng dữ liệuPhát hiện tri thức từ dữ liệuBùng nổ dữ liệu: Luật MooreXuất xứ Gordon E. Moore (1965). Cramming more components onto integratedcircuits, Electronics, 38 (8), April 19, 1965. Một quan sát và dự báo“Phương ngôn 2x Số lượng bán dẫn tích hợp trong một chíp sẽ tăng gấp đôi sau khoảng hainăm Chi phí sản xuất mạch bán dẫn với cùng tính năng giảm một nửa sau hai năm Phiên bản 18 tháng: rút ngắn chu kỳ thời gian2203/02/17Luật Moore & công nghiệp điện tửDẫn dắt ngành công nghệ bán dẫn Mô hình cơ bản cho ngành công nghiệp mạch bán dẫn “Định luật Moore vẫn tạo khả năng cơ bản cho sự phát triển của chúng tôi, vànó vẫn còn hiệu lực tốt tại Intel… Định luật Moore không chỉ là mạch bán dẫn.Nó cũng là cách sử dụng sáng tạo mạch bán dẫn”. Paul S. Otellini, Chủ tịch vàGiám đốc điều hành Tập đoàn Intel “toàn bộ chu trình thiết kế, phát triển, sản xuất, phân phối và bán hàng được coilà có tính bền vững khi tuân theo định luật Moore… Nếu đánh bại định luậtMoore, thị trường không thể hấp thụ hết các sản phẩm mới, và kỹ sư bị mất việclàm. Nếu bị tụt sau định luật Moore, không có gì để mua, và gánh nặng đè lênđôi vai của chuỗi các nhà phân phối sản phẩm”. Daniel Grupp, Giám đốc PTcông nghệ tiên tiến, Acorn Technologies, Inc. (http://acorntech.com/)Thúc đẩy công nghệ xử lý, lưu giữ và truyền dẫn dữ liệu Công nghệ bán dẫn là nền tảng của công nghiệp điện tử. Định luật Moore với công nghiệp phần cứng máy tính: bộ xử lý Intel trong 40năm qua (trang tiếp theo). Bùng nổ về năng lực xử lý tính toán và lưu trữ dữ liệu. Tác động tới sự phát triển công nghệ cơ sở dữ liệu (tổ chức và quản lý dữ liệu)và công nghệ mạng (truyền dẫn dữ liệu)Luật Moore: Bộ xử lý Intel“Anotherdecadeisprobablystraightforward...There is certainly noend to creativity”. Gordon Moore, IntelChairman Emeritus of the BoardSpeaking of extending Moore’s Law atthe International Solid-State CircuitsConference (ISSCC), February 2003.Moore’s Law: Transistor densities on a singlechip double about every two years.(Source: Intel Web site Moore’s Law: Made Realby Intel Innovation,www.intel.com/technology/mooreslaw/?iid=search, accessed January 9, 2008.)3303/02/17Hệ thống ước và bội đơn vị đoGiá trị, cách đọc các bội và ước điển hìnhThiết bị thu thập – lưu trữ dữ liệuNăng lực số hóaSloan Digital Sky Survey Thiết bị số hóa đa dạng Mọi lĩnh vực Quản lý, Thương mại, Khoa học… Một ví dụ điển hình: SDSS http://www.sdss.org/ Đã tạo bản đồ 3-chiều có chứa hơn 930.000 thiên hà vàhơn 120.000 quasar Kính viễn vọng đầu tiên Làm việc từ 2000 Vài tuần đầu tiên: thu thập dữ liệu thiên văn học = toàn bộtrong quá khứ. Sau 10 năm: 140 TB Kính viễn vọng kế tiếp Large Synoptic Survey Telescope Bắt đầu hoạt động 2016. Sau 5 ngày sẽ có 140 TB4403/02/17Tiến hóa Công nghệ CSDL: năm 2006Tiến hóa công nghệ CSDL [HK0106]: Hệ CSDL mở rộng,KDL & KPDL, Hệ CSDL dựa trên WebTiến hóa Công nghệ CSDL: năm 2011Tiến hóa công nghệ CSDL [HKP11]: Hệ CSDL mở rộngvà Phân tích dữ liệu mở rộng (có KPDL)55
Tìm kiếm theo từ khóa liên quan:
Khai phá dữ liệu Nhập môn Khai phá dữ liệu Bài giảng Nhập môn Khai phá dữ liệu Cơ sở dữ liệu Kiểu mẫu được khai phá Công nghệ khai phá dữ liệuGợi ý tài liệu liên quan:
-
62 trang 401 3 0
-
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 377 6 0 -
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 350 1 0 -
Giáo trình Cơ sở dữ liệu: Phần 2 - TS. Nguyễn Hoàng Sơn
158 trang 292 0 0 -
13 trang 292 0 0
-
Phân tích thiết kế hệ thống - Biểu đồ trạng thái
20 trang 285 0 0 -
Tài liệu học tập Tin học văn phòng: Phần 2 - Vũ Thu Uyên
85 trang 255 1 0 -
Đề cương chi tiết học phần Quản trị cơ sở dữ liệu (Database Management Systems - DBMS)
14 trang 244 0 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 230 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 221 0 0