Danh mục

Tóm tắt luận văn Thạc sĩ: Nghiên cứu quy trình ETL trong kho dữ liệu ứng dụng vào hệ thống dữ liệu kinh doanh trong doanh nghiệp Viễn Thông

Số trang: 24      Loại file: pdf      Dung lượng: 704.68 KB      Lượt xem: 10      Lượt tải: 0    
tailieu_vip

Phí tải xuống: 1,000 VND Tải xuống file đầy đủ (24 trang) 0
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục đích của đề tài là tiếp cận các phương pháp tìm hiểu các bước trong một quy trinh xây dựng một hệ thống ETL, các phương án xử lý trong từng trường hợp cụ thể để có thể áp dụng trong các bài toán thực tế.
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ: Nghiên cứu quy trình ETL trong kho dữ liệu ứng dụng vào hệ thống dữ liệu kinh doanh trong doanh nghiệp Viễn Thông 1 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- NGUYỄN ANH NGUYÊN ĐỀ TÀI:NGHIÊN CỨU QUY TRÌNH ETL TRONG KHO DỮ LIỆU ỨNG DỤNGVÀO HỆ THỐNG DỮ LIỆU KINH DOANH TRONG DOANH NGHIỆP VIỄN THÔNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI -2012 2 Luận văn được hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNGNgười hướng dẫn khoa học: TS PHẠM THẾ QUẾPhản biện 1:…………………………………………………………………………. …………………………………………………………………………. ………………………………………………………………………….Phản biện 2:………………………………………………………………………….. ………………………………………………………………………….. …………………………………………………………………………..Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện CôngnghệBưu chính Viễn thôngVào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............Có thể tìm hiểu luận văn tại:- Thư viện của Học viện Công nghệ Bưu chính Viễn thông 3 MỞ ĐẦU1. Lý do chọn đề tàiNgành công nghiệp viễn thông sau những năm phát triển đang lưu trữ một khối lượng dữliệu khổng lồ, bao gồm các dữ liệu như thông tin về khách hàng, chi tiết cuộc gọi, các dịchvụ thuê bao, thông tin cảnh bảo tình trạng hệ thống mạng viễn thông, dữ liệu về hệ thốngcáp viễn thông v.v... Lượng dữ liệu khổng lồ này nếu được khai thác đúng cách sẽ là một lợithế cho các doanh nghiệp viễn thông trong việc tung ra các dịch vụ chăm sóc khách hànghay các ứng dụng mang tính thực tiễn cao, đồng nghĩa với việc tăng cơ hội cạnh tranh đốivới các doanh nghiệp khác. Từ đó yêu cầu đặt ra việc xây dựng kho dữ liệu từ những nguồndữ liệu trên phục vụ cho việc phân tích kinh doanh tại các đơn vị viễn thông. Tuy nhiên việcxây dựng một hệ thống như thế vấp phải một số hạn chế về mặt kỹ thuật, đặc biệt là khikích thước cũng như độ phức tạp của môi trường thông tin tăng lên. Lưu trữ phân tán ởnhiều dạng không tương thích với nhau, thậm chí còn ở những dạng phi cấu trúc. Nhiềuhệ CSDL đã được xây dựng không tương thích với nhau và không tương thích với nhữnghệ thông tin mới được xây dựng. Nhiều khách hàng không thoả mãn với những hệ thốngthông tin hiện thời. Kho dữ liệu thường bao gồm các thành phần khác nhau, mỗi thành phần có thiết kế,kĩ thuật và công cụ riêng [6]. Trong đó hệ thống ETL là một thành phần chính chịu tráchnhiệm cho quá trình ETL ( Extract, Transform, Load) trong kho kho dữ liệu; cho phép tríchrút các dữ liệu từ nhiều nguồn khác nhau, làm sạch, tùy chỉnh và chuyển đổi, và cuối cùngtải vào kho dữ liệu[1]. Việc xây dựng ETL chiếm đến 80% phát triển dự án và 55% thờigian của kho dữ liệu [4]. Vì vậy việc đánh giá đúng vai trò của quá trình ETL từ đó có thểthể mô hình hóa, thiết kế và tối ưu ETL trong việc xây dựng kho dữ liệu sẽ quyết định sựthành bại của kho dữ liệu [6].Với mục đích nghiên cứu về các quá trình ETL trong việc xây dựng kho dữ liệu, tôi chọn đềtài “Nghiên cứu quy trình ETL trong kho dữ liệu ứng dụng vào hệ thống dữ liệu kinhdoanh trong doanh nghiệp viễn thông ”.1. Mục đích của đề tài: Tiếp cận các phương pháp tìm hiểu các bước trong một quy trinhxây dựng một hệ thống ETL, các phương án xử lý trong từng trường hợp cụ thể để có thể ápdụng trong các bài toán thực tế.2. Đối tượng và phạm vi nghiên cứu: Việc nghiên cứu sẽ tập trung vào lý thuyết xâydựng hệ thống ETL, áp dụng vào xây dựng chức năng trích xuất với nguồn dữ liệu từ hệ 4thống dữ liệu Vinaphone.3. Phương pháp nghiên cứu: Tìm hiểu các tài liệu liên quan đến các kỹ thuậtELT trong kho dữ liệu, các phương pháp xây dựng hệ thống ETL.4. Kết cấu của luận vănLuận văn gồm 3 chươngChương 1: Tổng quan về ETL trong kho dữ liệu Chương này trình bày các khái niệm, các thành phần, chức năng trong kho dữ liệu,các ứng dụng cũng như những mô hình kho dữ liệu. Tổng quan về ETL, các thành phần vàvai trò ETL trong kho dữ liệuChương 2: Kiến trúc và các thành phần ETL Chương này tập trung vào chi tiết các thành phần của ETL, các bước thực hiện củamột hệ thống ETL, những vấn đề gặp phải với mỗi thành phần cụ thể trong một hệ thốngETL. Các biện pháp giải quyết với mỗi tình huống trong những bài toán cụ thể.Chương 3: Xây dựng modul trích xuất dữ liệu trong ETL. Chương cuối cùng của luận văn trình bày một thử nghiệm nhỏ áp dụng phần lýthuyết đã nêu ở 2 chương trước. Đó là áp dụng thử nghiệm phương pháp trích xuất đãnghiên cứu trong phần lý ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: