Danh mục

Bài giảng Chủ đề hiện đại về khai phá dữ liệu - khai phá quá trình: Chương 1 - PGS.TS. Hà Quang Thụy

Số trang: 68      Loại file: ppt      Dung lượng: 3.86 MB      Lượt xem: 7      Lượt tải: 0    
Hoai.2512

Hỗ trợ phí lưu trữ khi tải xuống: 28,000 VND Tải xuống file đầy đủ (68 trang) 0
Xem trước 7 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng Chủ đề hiện đại về khai phá dữ liệu - khai phá quá trình: Chương 1 của PGS.TS. Hà Quang Thụy bao gồm những nội dung về giới thiệu hệ thống thông tin; giới thiệu khai phá quá trình. Mời các bạn tham khảo bài giảng để bổ sung thêm kiến thức về lĩnh vực này.
Nội dung trích xuất từ tài liệu:
Bài giảng Chủ đề hiện đại về khai phá dữ liệu - khai phá quá trình: Chương 1 - PGS.TS. Hà Quang Thụy BÀI GIẢNG MỘT SỐ CHỦ ĐỀ HIỆN ĐẠI VỀ KHAI PHÁ DỮ LIỆU: KHAI PHÁ QUÁ TRÌNH CHƯƠNG 1. GIỚI THIỆU CHUNGVỀ HỆ THỐNG THÔNG TIN VÀ KHAI PHÁ QUÁ TRÌNH PGS. TS. HÀ QUANG THỤY HÀ NỘI 01-2015 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI 1 Nội dung1. Giới thiệu chung về hệ thống thông tin2. Giới thiệu sơ bộ về khai phá quá trình 2Phần 1. Giới thiệu chung về Hệ thống thông tin 3Dữ liệu, thông tin, tri thức  Khái niệm dữ liệu  Dữ liệu: sự kiện thô  chỉ số nhân viên, tên mặt hàng, số lượng hàng trong một đơn hàng..  “Thô”: thu được từ ghi chép sự kiện từ thế giới thực  Các kiểu dữ liệu: chữ-số (Alphanumeric), ảnh (image), âm thanh (tiếng nói, tiếng động, Video (hình/ảnh chuyển động)  Dạng tự nhiên và số hóa  Khái niệm thông tin  Dữ liệu được tổ chức dựa theo mang thêm một ý nghĩa thông tin  Thông tin: tập dữ liệu được tổ chức theo cách (các quy tắc và các mỗi quan hệ) tạo ra một giá trị gia tăng ngoài tập giá trị của các dữ liệu riêng. So sánh khái niệm mẫu (pattern) trong khai phá dữ liệu. Tổng doanh thu bán hàng trong tháng số lượng bán hàng của từng ngày, từng đại lý.  Minh họa: Dữ liêu Thanh tà vẹt, thanh ray. Thông tin đường sắt (trái), đường sắt phức hợp (phải).  Từ dữ liệu thông tin cần qua một quá trình (Một tập các nhiệm vụ có liên quan loogic được thực hiện để đạt được một kết quả xác định) 4Tri thức  Khái niệm tri thức  Các dự báo và hiểu biết về một tập các thông tin và các cách thức mà thông tin trở nên hữu ích để hỗ trợ một nhiệm vụ cụ thể hoặc đưa ra một quyết định. So sánh khái niệm tri thức trong Khai phá dữ liệu.  Có tri thức hiểu biết mối quan hệ trong thông tin  Nhân công tri thức (knowledge worker): người tạo, sử dụng, phổ biến tri thức, thường là chuyên gia về khoa học, kỹ thuật, kinh doanh, miền ỨD.  Hệ thống quản lý tri thức (knowledge management system): một tập được tổ chức gồm con người, thủ tục, phần mềm, CSDL và các thiết bị để tạo ra, lưu trữ và sử dụng tri thức và kinh nghiệm của tổ chức.  Xử lý dữ liệu theo bộ óc hoặc thủ công hoặc bằng máy tính. 5Các đặc trưng của thông tin có giá trị  Thông tin có giá trị  Cho người quản lý và người ra quyết định (“quản lý” và “lãnh đạo”). Nhìn chung “chính xác, đúng người, đúng thời điểm”  Các đặc trưng: truy nhập được (Accessible), chính xác (Accurate), đầy đủ (Complete), kinh tế (Economical), linh hoạt (Flexible), có liên quan (Relevant), tin cậy (Reliable), An toàn (Secure), đơn giản (Simple), kịp thời (Timely), kiểm chứng được (Verifiable).  Truy nhập được  Người sử dụng có thẩm quyền dễ dàng nhận được, ở dạng phù hợp, đúng thời điểm theo yêu cầu.  Chính xác  Thông tin chính xác là không bị lỗi. Trong nhiều trường hợp, thông tin không chính xác do dữ liệu không chính xác trong quá trình chuyển đổi (được gọi là “nhập rác, xuất rác”: garbage in, garbage out: GIGO).  Đầy đủ  Thông tin cần bao gồm các yếu tố quan trọng. Phản ví dụ: Một báo cáo đầu tư không nói về chi phí quan trọng. 6Thông tin có giá trị (tiếp)  Tính kinh tế  Tính kinh tế liên quan tới chi phí tạo thông tin. Người ra quyết định cần cân bằng giá trị của thông tin với chi phí tạo ra nó.  Tính linh hoạt  Thông tin được sử dụng linh hoạt cho nhiều mục đích. Ví dụ, thông tin lượng hàng tồn kho cho người bán hàng, cho người quản lý tài chính…  Có liên quan  Có liên quan là quan trọng cho người ra quyết định.  Tính tin cậy  Theo sự tín nhiệm của người dùng. Tính tin cậy phụ thuộc vào tính tin cậy của phương pháp thu thập thông tin / tính tin cậy của nguồn thông tin.  Tính an toàn  Tránh được sự truy nhập trái phép.  Tính đơn giản  Cần đơn giản, không quá phức tạp. Thông tin phức tạp và chi tiết có thể không cần thiết. 7Thông tin có giá trị (tiếp)  Tính kịp thời  Được cung cấp khi cần đến nó: “Biết thời tiết cuối tuần trước không giúp gì cho chọn áo khoác mặc thứ Năm”.  Tính kiểm chứng được  Thông tin cần kiểm chứng được: kiểm tra được tính đúng đ ...

Tài liệu được xem nhiều: