![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Bài giảng một số chủ đề hiện đại về khai phá dữ liệu - Khai phá quá trình: Chương 1 - PGS. TS Hà Quang Thụy
Số trang: 68
Loại file: ppt
Dung lượng: 3.86 MB
Lượt xem: 10
Lượt tải: 0
Xem trước 7 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng một số chủ đề hiện đại về khai phá dữ liệu - Khai phá quá trình: Chương 1 - PGS. TS Hà Quang Thụy tập trung vào hai nội dung chính là giới thiệu chung về hệ thống thông tin và giới thiệu sơ bộ về khai phá quá trình. Hy vọng tài liệu là nguồn thông tin hữu ích cho quá trình học tập và nghiên cứu của các bạn.
Nội dung trích xuất từ tài liệu:
Bài giảng một số chủ đề hiện đại về khai phá dữ liệu - Khai phá quá trình: Chương 1 - PGS. TS Hà Quang Thụy BÀI GIẢNG MỘT SỐ CHỦ ĐỀ HIỆN ĐẠI VỀ KHAI PHÁ DỮ LIỆU: KHAI PHÁ QUÁ TRÌNH CHƯƠNG 1. GIỚI THIỆU CHUNG VỀ HỆ THỐNG THÔNG TIN VÀ KHAI PHÁ QUÁ TRÌNH PGS. TS. HÀ QUANG THỤY HÀ NỘI 01-2015 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI 1 Nội dung 1. Giới thiệu chung về hệ thống thông tin 2. Giới thiệu sơ bộ về khai phá quá trình 2 Phần 1. Giới thiệu chung về Hệ thống thông tin 3 Dữ liệu, thông tin, tri thức Khái niệm dữ liệu Dữ liệu: sự kiện thô chỉ số nhân viên, tên mặt hàng, số lượng hàng trong một đơn hàng.. “Thô”: thu được từ ghi chép sự kiện từ thế giới thực Các kiểu dữ liệu: chữ-số (Alphanumeric), ảnh (image), âm thanh (tiếng nói, tiếng động, Video (hình/ảnh chuyển động) Dạng tự nhiên và số hóa Khái niệm thông tin Dữ liệu được tổ chức dựa theo mang thêm một ý nghĩa thông tin Thông tin: tập dữ liệu được tổ chức theo cách (các quy tắc và các mỗi quan hệ) tạo ra một giá trị gia tăng ngoài tập giá trị của các dữ liệu riêng. So sánh khái niệm mẫu (pattern) trong khai phá dữ liệu. Tổng doanh thu bán hàng trong tháng số lượng bán hàng của từng ngày, từng đại lý. Minh họa: Dữ liêu Thanh tà vẹt, thanh ray. Thông tin đường sắt (trái), đường sắt phức hợp (phải). Từ dữ liệu thông tin cần qua một quá trình (Một tập các nhiệm vụ có liên quan loogic được thực hiện để đạt được một kết quả xác định) 4 Tri thức Khái niệm tri thức Các dự báo và hiểu biết về một tập các thông tin và các cách thức mà thông tin trở nên hữu ích để hỗ trợ một nhiệm vụ cụ thể hoặc đưa ra một quyết định. So sánh khái niệm tri thức trong Khai phá dữ liệu. Có tri thức hiểu biết mối quan hệ trong thông tin Nhân công tri thức (knowledge worker): người tạo, sử dụng, phổ biến tri thức, thường là chuyên gia về khoa học, kỹ thuật, kinh doanh, miền ỨD. Hệ thống quản lý tri thức (knowledge management system): một tập được tổ chức gồm con người, thủ tục, phần mềm, CSDL và các thiết bị để tạo ra, lưu trữ và sử dụng tri thức và kinh nghiệm của tổ chức. Xử lý dữ liệu theo bộ óc hoặc thủ công hoặc bằng máy tính. 5 Các đặc trưng của thông tin có giá trị Thông tin có giá trị Cho người quản lý và người ra quyết định (“quản lý” và “lãnh đạo”). Nhìn chung “chính xác, đúng người, đúng thời điểm” Các đặc trưng: truy nhập được (Accessible), chính xác (Accurate), đầy đủ (Complete), kinh tế (Economical), linh hoạt (Flexible), có liên quan (Relevant), tin cậy (Reliable), An toàn (Secure), đơn giản (Simple), kịp thời (Timely), kiểm chứng được (Verifiable). Truy nhập được Người sử dụng có thẩm quyền dễ dàng nhận được, ở dạng phù hợp, đúng thời điểm theo yêu cầu. Chính xác Thông tin chính xác là không bị lỗi. Trong nhiều trường hợp, thông tin không chính xác do dữ liệu không chính xác trong quá trình chuyển đổi (được gọi là “nhập rác, xuất rác”: garbage in, garbage out: GIGO). Đầy đủ Thông tin cần bao gồm các yếu tố quan trọng. Phản ví dụ: Một báo cáo đầu tư không nói về chi phí quan trọng. 6 Thông tin có giá trị (tiếp) Tính kinh tế Tính kinh tế liên quan tới chi phí tạo thông tin. Người ra quyết định cần cân bằng giá trị của thông tin với chi phí tạo ra nó. Tính linh hoạt Thông tin được sử dụng linh hoạt cho nhiều mục đích. Ví dụ, thông tin lượng hàng tồn kho cho người bán hàng, cho người quản lý tài chính… Có liên quan Có liên quan là quan trọng cho người ra quyết định. Tính tin cậy Theo sự tín nhiệm của người dùng. Tính tin cậy phụ thuộc vào tính tin cậy của phương pháp thu thập thông tin / tính tin cậy của nguồn thông tin. Tính an toàn Tránh được sự truy nhập trái phép. Tính đơn giản Cần đơn giản, không quá phức tạp. Thông tin phức tạp và chi tiết có thể không cần thiết. 7 Thông tin có giá trị (tiếp) Tính kịp thời Được cung cấp khi cần đến nó: “Biết thời tiết cuối tuần trước không giúp gì cho chọn áo khoác mặc thứ Năm”. Tính kiểm chứng được Thông tin cần kiểm chứng được: kiểm tra được tính đúng đắn có thể bằng nhiều nguồn khác nhau. Lưu ý Độ quan trọng các đặc trưng tùy thuộc vào kiểu dữ liệu cần đến: (i) Với dữ liệu thông minh thị trường: tính kịp thời > tính chính xác / tính đầy đủ (chẳng hạn, các đối thủ cạnh tranh có thể tạo ra giảm giá lớn…); (ii) tính chính xác, đầy đủ và kiểm chứng được là quan trọng 8 Khái niệm hệ thống Khái niệm hệ thống Một tập các phần tử / các thành phần tương tác để hoàn thành mục tiêu Các phần tử và các quan hệ giữa chúng xác định cách hoạt động của hệ thống. Hệ thống có các thành phần input, các cơ chế xử lý, output và cơ chế phản hồi Ví dụ, hệ thống rửa ô tô: Bao gồm các phần tử độc lập hoặc thành phần (phun chất lỏng, chổi bọt, sấy không khí…) Cơ chế xử lý tùy theo lựa chọn khách hàng: chỉ làm sạch / làm sạch & đánh bóng / làm s ...
Nội dung trích xuất từ tài liệu:
Bài giảng một số chủ đề hiện đại về khai phá dữ liệu - Khai phá quá trình: Chương 1 - PGS. TS Hà Quang Thụy BÀI GIẢNG MỘT SỐ CHỦ ĐỀ HIỆN ĐẠI VỀ KHAI PHÁ DỮ LIỆU: KHAI PHÁ QUÁ TRÌNH CHƯƠNG 1. GIỚI THIỆU CHUNG VỀ HỆ THỐNG THÔNG TIN VÀ KHAI PHÁ QUÁ TRÌNH PGS. TS. HÀ QUANG THỤY HÀ NỘI 01-2015 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI 1 Nội dung 1. Giới thiệu chung về hệ thống thông tin 2. Giới thiệu sơ bộ về khai phá quá trình 2 Phần 1. Giới thiệu chung về Hệ thống thông tin 3 Dữ liệu, thông tin, tri thức Khái niệm dữ liệu Dữ liệu: sự kiện thô chỉ số nhân viên, tên mặt hàng, số lượng hàng trong một đơn hàng.. “Thô”: thu được từ ghi chép sự kiện từ thế giới thực Các kiểu dữ liệu: chữ-số (Alphanumeric), ảnh (image), âm thanh (tiếng nói, tiếng động, Video (hình/ảnh chuyển động) Dạng tự nhiên và số hóa Khái niệm thông tin Dữ liệu được tổ chức dựa theo mang thêm một ý nghĩa thông tin Thông tin: tập dữ liệu được tổ chức theo cách (các quy tắc và các mỗi quan hệ) tạo ra một giá trị gia tăng ngoài tập giá trị của các dữ liệu riêng. So sánh khái niệm mẫu (pattern) trong khai phá dữ liệu. Tổng doanh thu bán hàng trong tháng số lượng bán hàng của từng ngày, từng đại lý. Minh họa: Dữ liêu Thanh tà vẹt, thanh ray. Thông tin đường sắt (trái), đường sắt phức hợp (phải). Từ dữ liệu thông tin cần qua một quá trình (Một tập các nhiệm vụ có liên quan loogic được thực hiện để đạt được một kết quả xác định) 4 Tri thức Khái niệm tri thức Các dự báo và hiểu biết về một tập các thông tin và các cách thức mà thông tin trở nên hữu ích để hỗ trợ một nhiệm vụ cụ thể hoặc đưa ra một quyết định. So sánh khái niệm tri thức trong Khai phá dữ liệu. Có tri thức hiểu biết mối quan hệ trong thông tin Nhân công tri thức (knowledge worker): người tạo, sử dụng, phổ biến tri thức, thường là chuyên gia về khoa học, kỹ thuật, kinh doanh, miền ỨD. Hệ thống quản lý tri thức (knowledge management system): một tập được tổ chức gồm con người, thủ tục, phần mềm, CSDL và các thiết bị để tạo ra, lưu trữ và sử dụng tri thức và kinh nghiệm của tổ chức. Xử lý dữ liệu theo bộ óc hoặc thủ công hoặc bằng máy tính. 5 Các đặc trưng của thông tin có giá trị Thông tin có giá trị Cho người quản lý và người ra quyết định (“quản lý” và “lãnh đạo”). Nhìn chung “chính xác, đúng người, đúng thời điểm” Các đặc trưng: truy nhập được (Accessible), chính xác (Accurate), đầy đủ (Complete), kinh tế (Economical), linh hoạt (Flexible), có liên quan (Relevant), tin cậy (Reliable), An toàn (Secure), đơn giản (Simple), kịp thời (Timely), kiểm chứng được (Verifiable). Truy nhập được Người sử dụng có thẩm quyền dễ dàng nhận được, ở dạng phù hợp, đúng thời điểm theo yêu cầu. Chính xác Thông tin chính xác là không bị lỗi. Trong nhiều trường hợp, thông tin không chính xác do dữ liệu không chính xác trong quá trình chuyển đổi (được gọi là “nhập rác, xuất rác”: garbage in, garbage out: GIGO). Đầy đủ Thông tin cần bao gồm các yếu tố quan trọng. Phản ví dụ: Một báo cáo đầu tư không nói về chi phí quan trọng. 6 Thông tin có giá trị (tiếp) Tính kinh tế Tính kinh tế liên quan tới chi phí tạo thông tin. Người ra quyết định cần cân bằng giá trị của thông tin với chi phí tạo ra nó. Tính linh hoạt Thông tin được sử dụng linh hoạt cho nhiều mục đích. Ví dụ, thông tin lượng hàng tồn kho cho người bán hàng, cho người quản lý tài chính… Có liên quan Có liên quan là quan trọng cho người ra quyết định. Tính tin cậy Theo sự tín nhiệm của người dùng. Tính tin cậy phụ thuộc vào tính tin cậy của phương pháp thu thập thông tin / tính tin cậy của nguồn thông tin. Tính an toàn Tránh được sự truy nhập trái phép. Tính đơn giản Cần đơn giản, không quá phức tạp. Thông tin phức tạp và chi tiết có thể không cần thiết. 7 Thông tin có giá trị (tiếp) Tính kịp thời Được cung cấp khi cần đến nó: “Biết thời tiết cuối tuần trước không giúp gì cho chọn áo khoác mặc thứ Năm”. Tính kiểm chứng được Thông tin cần kiểm chứng được: kiểm tra được tính đúng đắn có thể bằng nhiều nguồn khác nhau. Lưu ý Độ quan trọng các đặc trưng tùy thuộc vào kiểu dữ liệu cần đến: (i) Với dữ liệu thông minh thị trường: tính kịp thời > tính chính xác / tính đầy đủ (chẳng hạn, các đối thủ cạnh tranh có thể tạo ra giảm giá lớn…); (ii) tính chính xác, đầy đủ và kiểm chứng được là quan trọng 8 Khái niệm hệ thống Khái niệm hệ thống Một tập các phần tử / các thành phần tương tác để hoàn thành mục tiêu Các phần tử và các quan hệ giữa chúng xác định cách hoạt động của hệ thống. Hệ thống có các thành phần input, các cơ chế xử lý, output và cơ chế phản hồi Ví dụ, hệ thống rửa ô tô: Bao gồm các phần tử độc lập hoặc thành phần (phun chất lỏng, chổi bọt, sấy không khí…) Cơ chế xử lý tùy theo lựa chọn khách hàng: chỉ làm sạch / làm sạch & đánh bóng / làm s ...
Tìm kiếm theo từ khóa liên quan:
Khai phá dữ liệu Khai phá quá trình Hệ thống thông tin Khai phá quá trình Vấn đề khai phá dữ liệu Tìm hiểu quá trình khai phá dữ liệuTài liệu liên quan:
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 354 1 0 -
Bài tập thực hành môn Phân tích thiết kế hệ thống thông tin
6 trang 340 0 0 -
Bài thuyết trình Hệ thống thông tin trong bệnh viện
44 trang 279 0 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 236 0 0 -
Bài giảng HỆ THỐNG THÔNG TIN KẾ TOÁN - Chương 2
31 trang 235 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 233 0 0 -
Phương pháp và và ứng dụng Phân tích thiết kế hệ thống thông tin: Phần 1 - TS. Nguyễn Hồng Phương
124 trang 231 0 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng quản lý kho hàng trên nền Web
61 trang 217 0 0 -
62 trang 209 2 0
-
Bài giảng Phân tích thiết kế hệ thống thông tin - Chương 9: Thiết kế giao diện
21 trang 194 0 0