tiểu luận: 'Áp dụng kỹ thuật phân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý và điều hành
Số trang: 24
Loại file: pdf
Dung lượng: 560.06 KB
Lượt xem: 12
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Việc dùng các phương tiện tin học để tổ chức và khai thác cácCSDL đã được phát triển từ những năm 60, nhiều CSDL đã được tổ chức, phát triển và khai thác ở mọi qui mô và khắp các lĩnh vực hoạt động của xã hội.
Nội dung trích xuất từ tài liệu:
tiểu luận: “Áp dụng kỹ thuật phân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý và điều hành TI U LU N TÀI: “Áp d ng k thu t phân tích d li utr c tuy n (OLAP) ph c v công tác qu n lý và i u hành” 1 MỞ ĐẦU Học viện Công nghệ Bưu chính viễn thông là một đơn vịthành viên của Tập đoàn Bưu chính Viễn thông Việt Nam có chứcnăng chính là đào tạo, nghiên cứu khoa học và chuyển giao côngnghệ trong lĩnh vực bưu chính, viễn thông, điện - điện tử và côngnghệ thông tin phục vụ sự phát triển của ngành Bưu chính Viễnthông và của xã hội. Chính vì vậy việc quản lý, phân tích và đánhgiá thông tin về công tác quản lí, đào tạo dưới các góc độ khácnhau là một trong nhưng vấn đề cần được quan tâm, tôi đã chọn đềtài tốt nghiệp cao học ngành công nghệ thông tin của tôi vớihướng phục vụ công tác này. Xuất phát từ thực tế đó, tôi đã chọn đề tài “Áp dụng kỹ thuậtphân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý vàđiều hành” Xây dựng một hệ trợ giúp quyết định dựa vào dữ liệu, sửdụng phương pháp luận xử lý phân tích trực tuyến (OLAP). Trongđó tập trung vào hai công việc chính là tập hợp dữ liệu để tổ chứcdữ liệu đa chiều, phân tích và hiển thị dữ liệu để trợ giúp ra quyếtđịnh.Luận văn gồm 3 chương:Chương 1: Tổng quan các phương pháp khai thác dữ liệuChương 2: Hệ thống trợ giúp quyết định sử dụng phân tích đachiều trong xử lý phân tích trực tuyến 2Chương 3: Xây dựng hệ thống trợ giúp quản lý với chức năngOLAP 3 Chương 1 TỔNG QUAN CÁC PHƯƠNG PHÁP KHAI THÁC DỮ LIỆU1.1. GIỚI THIỆU CÁC PHƯƠNG PHÁP KHAI THÁC DỮLIỆU Việc dùng các phương tiện tin học để tổ chức và khai thác cácCSDL đã được phát triển từ những năm 60, nhiều CSDL đã đượctổ chức, phát triển và khai thác ở mọi qui mô và khắp các lĩnh vựchoạt động của xã hội. Sự phát triển nhanh chóng của một lượng lớn dữ liệu được thuthập và lưu trữ trong các CSDL lớn đã vượt ra ngoài khả năng củacon người có thể hiểu được chúng nếu không có những công cụ hỗtrợ tốt. Tình huống này đã đặt chúng ta trong hoàn cảnh nhiều dữliệu nhưng thiếu thông tin, thiếu tri thức. Với một khối lượng lớndữ liệu như vậy rõ ràng là các phương pháp thủ công truyền thốngáp dụng để phân tích dữ liệu như chia bảng không còn là phù hợpnữa Chính vì vậy, có một kỹ thuật mới ra đời đó là “Khai phá dữliệu”. Khai phá dữ liệu là một ngữ tương đối mới, nó ra đời vàokhoảng những năm cuối của của thập kỷ 1980. Các nhà thống kêxem khai phá dữ liệu như là một quá trình phân tích được thiết kếthăm dò một lượng cực lớn các dữ liệu nhằm phát hiện ra các mẫuthích hợp và/hoặc các mối quan hệ mang tính hệ thống giữa cácbiến và sau đó sẽ hợp thức hoá các kết quả tìm được bằng cách ápdụng các mẫu đã phát hiện được cho tập con mới của dữ liệu. Nói tóm lại: khai phá dữ liệu là một bước trong quy trình pháthiện tri thức gồm có các thụât toán khai thác dữ liệu chuyên dùng 4dưới một số quy định về hiệu quả tính toán chấp nhận được để tìmra các mẫu hoặc các mô hình trong dữ liệu. Phát hiện tri thức trongcác cơ sở dữ liệu là một qui trình nhận biết các mẫu hoặc các môhình trong dữ liệu với các tính năng: hợp thức, mới, khả ích, và cóthể hiểu được.1.1.1. Hình thành và định nghĩa bài toán Đây là bước tìm hiểu lĩnh vực ứng dụng và hình thành bàitoán, bước này sẽ quyết định cho việc rút ra những tri thức hữuích, đồng thời lựa chọn các phương pháp khai phá dữ liệu thíchhợp với mục đích của ứng dụng và bản chất của dữ liệu.1.1.2. Thu thập và tiền xử lý dữ liệu Trong bước này dữ liệu được thu thập ở dạng thô (nguồn dữliệu thu thập có thể là từ các kho dữ liệu hay nguồn thông tinInternet).1.1.3. Khai phá dữ liệu và rút ra các tri thức Đây là bước quan trọng nhất trong tiến trình khám phá trithức. Kết quả của bước này là trích ra được các mẫu và/hoặc cácmô hình ẩn dưới các dữ liệu.1.1.4. Phân tích và kiểm định kết quả Bước thứ tư là hiểu các tri thức đã tìm được, đặc biệt là làmsáng tỏ các mô tả và dự đoán. Trong bước này, kết quả tìm đượcsẽ được biến đổi sang dạng phù hợp với lĩnh vực ứng dụng và dễhiểu hơn cho người dùng.1.1.5. Sử dụng các tri thức phát hiện được Các tri thức khám phá được sẽ được củng cố, kết hợp lạithành một hệ thống, đồng thời giải quyết các xung đột tiềm năngtrong các tri thức đó. Các giai đoạn của quá trình khám phá tri 5thức có mối quan hệ chặt chẽ với nhau trong bối cảnh chung củahệ thống.1.2. QUÁ TRÌNH KHAI PHÁ DỮ LIỆU Khai phá dữ liệu là hoạt động trọng tâm của quá trình khámphá tri thức. Thuật ngữ khai phá dữ liệu còn được một số nhà khoahọc gọi là phát hiện tri thức trong cơ sở dữ liệu. Quá trình khai phá dữ liệu bắt đầu với kho dữ liệu thô v ...
Nội dung trích xuất từ tài liệu:
tiểu luận: “Áp dụng kỹ thuật phân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý và điều hành TI U LU N TÀI: “Áp d ng k thu t phân tích d li utr c tuy n (OLAP) ph c v công tác qu n lý và i u hành” 1 MỞ ĐẦU Học viện Công nghệ Bưu chính viễn thông là một đơn vịthành viên của Tập đoàn Bưu chính Viễn thông Việt Nam có chứcnăng chính là đào tạo, nghiên cứu khoa học và chuyển giao côngnghệ trong lĩnh vực bưu chính, viễn thông, điện - điện tử và côngnghệ thông tin phục vụ sự phát triển của ngành Bưu chính Viễnthông và của xã hội. Chính vì vậy việc quản lý, phân tích và đánhgiá thông tin về công tác quản lí, đào tạo dưới các góc độ khácnhau là một trong nhưng vấn đề cần được quan tâm, tôi đã chọn đềtài tốt nghiệp cao học ngành công nghệ thông tin của tôi vớihướng phục vụ công tác này. Xuất phát từ thực tế đó, tôi đã chọn đề tài “Áp dụng kỹ thuậtphân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý vàđiều hành” Xây dựng một hệ trợ giúp quyết định dựa vào dữ liệu, sửdụng phương pháp luận xử lý phân tích trực tuyến (OLAP). Trongđó tập trung vào hai công việc chính là tập hợp dữ liệu để tổ chứcdữ liệu đa chiều, phân tích và hiển thị dữ liệu để trợ giúp ra quyếtđịnh.Luận văn gồm 3 chương:Chương 1: Tổng quan các phương pháp khai thác dữ liệuChương 2: Hệ thống trợ giúp quyết định sử dụng phân tích đachiều trong xử lý phân tích trực tuyến 2Chương 3: Xây dựng hệ thống trợ giúp quản lý với chức năngOLAP 3 Chương 1 TỔNG QUAN CÁC PHƯƠNG PHÁP KHAI THÁC DỮ LIỆU1.1. GIỚI THIỆU CÁC PHƯƠNG PHÁP KHAI THÁC DỮLIỆU Việc dùng các phương tiện tin học để tổ chức và khai thác cácCSDL đã được phát triển từ những năm 60, nhiều CSDL đã đượctổ chức, phát triển và khai thác ở mọi qui mô và khắp các lĩnh vựchoạt động của xã hội. Sự phát triển nhanh chóng của một lượng lớn dữ liệu được thuthập và lưu trữ trong các CSDL lớn đã vượt ra ngoài khả năng củacon người có thể hiểu được chúng nếu không có những công cụ hỗtrợ tốt. Tình huống này đã đặt chúng ta trong hoàn cảnh nhiều dữliệu nhưng thiếu thông tin, thiếu tri thức. Với một khối lượng lớndữ liệu như vậy rõ ràng là các phương pháp thủ công truyền thốngáp dụng để phân tích dữ liệu như chia bảng không còn là phù hợpnữa Chính vì vậy, có một kỹ thuật mới ra đời đó là “Khai phá dữliệu”. Khai phá dữ liệu là một ngữ tương đối mới, nó ra đời vàokhoảng những năm cuối của của thập kỷ 1980. Các nhà thống kêxem khai phá dữ liệu như là một quá trình phân tích được thiết kếthăm dò một lượng cực lớn các dữ liệu nhằm phát hiện ra các mẫuthích hợp và/hoặc các mối quan hệ mang tính hệ thống giữa cácbiến và sau đó sẽ hợp thức hoá các kết quả tìm được bằng cách ápdụng các mẫu đã phát hiện được cho tập con mới của dữ liệu. Nói tóm lại: khai phá dữ liệu là một bước trong quy trình pháthiện tri thức gồm có các thụât toán khai thác dữ liệu chuyên dùng 4dưới một số quy định về hiệu quả tính toán chấp nhận được để tìmra các mẫu hoặc các mô hình trong dữ liệu. Phát hiện tri thức trongcác cơ sở dữ liệu là một qui trình nhận biết các mẫu hoặc các môhình trong dữ liệu với các tính năng: hợp thức, mới, khả ích, và cóthể hiểu được.1.1.1. Hình thành và định nghĩa bài toán Đây là bước tìm hiểu lĩnh vực ứng dụng và hình thành bàitoán, bước này sẽ quyết định cho việc rút ra những tri thức hữuích, đồng thời lựa chọn các phương pháp khai phá dữ liệu thíchhợp với mục đích của ứng dụng và bản chất của dữ liệu.1.1.2. Thu thập và tiền xử lý dữ liệu Trong bước này dữ liệu được thu thập ở dạng thô (nguồn dữliệu thu thập có thể là từ các kho dữ liệu hay nguồn thông tinInternet).1.1.3. Khai phá dữ liệu và rút ra các tri thức Đây là bước quan trọng nhất trong tiến trình khám phá trithức. Kết quả của bước này là trích ra được các mẫu và/hoặc cácmô hình ẩn dưới các dữ liệu.1.1.4. Phân tích và kiểm định kết quả Bước thứ tư là hiểu các tri thức đã tìm được, đặc biệt là làmsáng tỏ các mô tả và dự đoán. Trong bước này, kết quả tìm đượcsẽ được biến đổi sang dạng phù hợp với lĩnh vực ứng dụng và dễhiểu hơn cho người dùng.1.1.5. Sử dụng các tri thức phát hiện được Các tri thức khám phá được sẽ được củng cố, kết hợp lạithành một hệ thống, đồng thời giải quyết các xung đột tiềm năngtrong các tri thức đó. Các giai đoạn của quá trình khám phá tri 5thức có mối quan hệ chặt chẽ với nhau trong bối cảnh chung củahệ thống.1.2. QUÁ TRÌNH KHAI PHÁ DỮ LIỆU Khai phá dữ liệu là hoạt động trọng tâm của quá trình khámphá tri thức. Thuật ngữ khai phá dữ liệu còn được một số nhà khoahọc gọi là phát hiện tri thức trong cơ sở dữ liệu. Quá trình khai phá dữ liệu bắt đầu với kho dữ liệu thô v ...
Tìm kiếm theo từ khóa liên quan:
kỹ thuật phân tích dữ liệu phân tích dữ liệu trực tuyến xử lý phân tích trực tuyến khai thác dữ liệu chức năng OLAP cơ sở dữ liệu công nghệ thông tinGợi ý tài liệu liên quan:
-
52 trang 426 1 0
-
62 trang 401 3 0
-
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 376 6 0 -
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 309 0 0 -
74 trang 293 0 0
-
Giáo trình Cơ sở dữ liệu: Phần 2 - TS. Nguyễn Hoàng Sơn
158 trang 290 0 0 -
13 trang 290 0 0
-
96 trang 289 0 0
-
Báo cáo thực tập thực tế: Nghiên cứu và xây dựng website bằng Wordpress
24 trang 288 0 0 -
Phân tích thiết kế hệ thống - Biểu đồ trạng thái
20 trang 283 0 0