Ứng dụng kỹ thuật xây dựng hệ thống kho dữ liệu trong việc khai phá dữ liệu khách hàng của các ngân hàng thương mại - Nguyễn Tuấn Minh
Số trang: 6
Loại file: pdf
Dung lượng: 518.42 KB
Lượt xem: 7
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Việc xây dựng một kho dữ liệu cho phép rút trích tài nguyên, tính toán theo yêu cầu để cung cấp các báo cáo dựa vào CSDL hoạt động phục vụ sản xuất, kinh doanh trở nên thông minh hơn, tăng thêm chất lượng và tính linh hoạt của việc phân tích kinh doanh có chất lượng cao và ổn định. Xuất phát từ thực tế đó mà tài liệu "Ứng dụng kỹ thuật xây dựng hệ thống kho dữ liệu trong việc khai phá dữ liệu khách hàng của các ngân hàng thương mại" đã được thực hiện.
Nội dung trích xuất từ tài liệu:
Ứng dụng kỹ thuật xây dựng hệ thống kho dữ liệu trong việc khai phá dữ liệu khách hàng của các ngân hàng thương mại - Nguyễn Tuấn Minh ỨNG DỤNG KỸ THUẬT XÂY DỰNG HỆ THỐNG KHO DỮ LIỆU TRONG VIỆC KHAI PHÁ DỮ LIỆU KHÁCH HÀNG CỦA CÁC NGÂN HÀNG THƯƠNG MẠI Nguyễn Tuấn Minh Trung tâm Thực hành, Học viện Ngân hàng Thông tin là nguồn tài nguyên quý giá của một tổ chức. Các phần mềm máy tínhlà những công cụ hiệu quả để xử lý thông tin và hệ quản trị cơ sở dữ liệu (CSDL) làcông cụ phổ biến cho phép lưu trữ và rút trích thông tin một cách hiệu quả. Với sựphát triển của mô hình kho dữ liệu, ngày nay ở Việt Nam, các tổ chức, doanh nghiệpluôn chú trọng khả năng lưu trữ, xử lý và khai thác thông tin giúp nhà quản trị, lãnhđạo phân tích trên các lớp dữ liệu dự báo được các khuynh hướng phát triển, đưa racác quyết sách đúng đắn, kịp thời và hiệu quả cho cơ quan, tổ chức của mình. Đápứng các yêu cầu trên, nhiều công cụ được xây dựng nhằm thỏa mãn các nhu cầu khaithác dữ liệu mức cao đã được các hãng nổi tiếng tập trung nghiên cứu, trong đó,nguồn dữ liệu đối với các tập đoàn công nghệ, tài chính, ngân hàng là vô cùng lớn. CắtXây dựng một kho dữ liệu cho phép rút trích tài nguyên, tính toán theo yêucầu để cung cấp các báo cáo dựa vào CSDL hoạt động phục vụ sản xuất, kinh doanhtrở nên thông minh hơn, tăng thêm chất lượng và tính linh hoạt của việc phân tích kinhdoanh có chất lượng cao và ổn định.1. Kho dữ liệu là gì? Kho dữ liệu là tập hợp các CSDL tích hợp, hướng chủ đề, được thiết kế để hỗ trợcho chức năng trợ giúp quyết định. Công nghệ kho dữ liệu là tập các phương pháp, kỹthuật và các công cụ có thể kết hợp, hỗ trợ nhau để cung cấp thông tin cho người sửdụng trên cơ sở tích hợp từ nhiều nguồn dữ liệu, nhiều môi trường khác nhau thiết kếchủ yếu cho truy vấn và phân tích hơn là xử lý các giao tác. Kho dữ liệu thường rất lớn tới hàng trăm Gigabyte (GB) hay thậm chí hàngTerabyte (TB). Kho dữ liệu được xây dựng để tiện lợi cho việc truy cập theo nhiềunguồn, nhiều kiểu dữ liệu khác nhau sao cho có thể kết hợp được cả những ứng dụngcủa các công nghệ hiện đại và kế thừa được từ những hệ thống đã có sẵn từ trước.Ngoài việc chứa đựng một CSDL quan hệ, kho dữ liệu còn bao gồm sử dụng các phatrong trích xuất, chuyển đổi, tải dữ liệu (Extract,Tranform, Loading - ETL), công nghệxử lý phân tích trực tuyến (OnLine Analytical Processing – OLAP), các công cụ phântích, và các ứng dụng cho việc thu thập và cung cấp dữ liệu tới người sử dụng.2. Đặc trưng của kho dữ liệu(1) Hướng chủ thể Kho dữ liệu được tổ chức xung quanh các chủ đề chính như khách hàng, sảnphẩm, bán hàng, tập trung vào việc mô hình hóa và phân tích dữ liệu cho những ngườiđưa ra quyết định, mà không tập trung vào các hoạt động hay các xử lý giao tác hàngngày. Kho dữ liệu cung cấp một khung nhìn đơn giản và súc tích xung quanh các sựkiện của các chủ thể. Ví dụ, để tìm hiểu thêm về dữ liệu bán hàng của công ty, ta cóthể xây dựng một kho dữ liệu tập trung trên doanh thu. Sử dụng kho dữ liệu có thể trảlời các câu hỏi như Ai là khách hàng tốt nhất của chúng ta cho mặt hàng này nămngoái?. Các chủ thể điển hình. Các tài khoản khách hàng. Việc bán hàng. Tiền tiết kiệm của khách hàng. Các yêu sách bảo hiểm. Đặt chỗ hành khách. Hình 1: Mô tả dữ liệu tổ chức theo hướng chủ thể Các hệ thống OLTP có thể chứa hàng trăm GB số liệu, tuy nhiên những số liệunày có thể hoàn toàn vô ích trong việc phân tích trực tuyến như: Địa chỉ, ID kháchhàng... Các dữ liệu kiểu này thường không được đưa vào kho dữ liệu để hạn chế dữliệu cần xem xét xuống mức tối thiểu nhưng cũng bảo đảm các thông tin theo từng chủđề. Một chủ đề là một miền dữ liệu được tách ra từ một tập hợp lớn các chủ đề màngười sử dụng quan tâm trong công việc kinh doanh.(2) Tích hợp Được xây dựng bằng việc tích hợp dữ liệu từ các nguồn dữ liệu hỗn tạp. Các kỹthuật làm sạch và tích hợp dữ liệu được áp dụng để đảm bảo sự đồng nhất trong cácquy ước tên, cấu trúc mã hóa, các đơn vị đo thuộc tính... giữa các nguồn khác nhau. Hình 2: Mô tả dữ liệu được tích hợp từ nhiều nguồn Kho dữ liệu phải đưa các dữ liệu từ các nguồn khác nhau về định dạng phù hợp.Chúng ta phải giải quyết những vấn đề như xung đột tên và mâu thuẩn giữa các đơn vịđo.(4) Biến thời gian Yêu cầu quan trọng cho kho dữ liệu là phạm vi về thời gian dài hơn so với các hệthống tác nghiệp. CSDL tác nghiệp: dữ liệu có giá trị hiện thời. Dữ liệu của kho dữ liệu: cung cấp thông tin lịch sử từ 5-10 năm trước. Yếu tố thời gian được lưu trữ trong hệ thống. Hình 3: Mô tả dữ liệu theo thời gian Các hệ OLTP thường bao quát một khoảng thời gian không lớn và chúng đượclưu trữ theo chu ...
Nội dung trích xuất từ tài liệu:
Ứng dụng kỹ thuật xây dựng hệ thống kho dữ liệu trong việc khai phá dữ liệu khách hàng của các ngân hàng thương mại - Nguyễn Tuấn Minh ỨNG DỤNG KỸ THUẬT XÂY DỰNG HỆ THỐNG KHO DỮ LIỆU TRONG VIỆC KHAI PHÁ DỮ LIỆU KHÁCH HÀNG CỦA CÁC NGÂN HÀNG THƯƠNG MẠI Nguyễn Tuấn Minh Trung tâm Thực hành, Học viện Ngân hàng Thông tin là nguồn tài nguyên quý giá của một tổ chức. Các phần mềm máy tínhlà những công cụ hiệu quả để xử lý thông tin và hệ quản trị cơ sở dữ liệu (CSDL) làcông cụ phổ biến cho phép lưu trữ và rút trích thông tin một cách hiệu quả. Với sựphát triển của mô hình kho dữ liệu, ngày nay ở Việt Nam, các tổ chức, doanh nghiệpluôn chú trọng khả năng lưu trữ, xử lý và khai thác thông tin giúp nhà quản trị, lãnhđạo phân tích trên các lớp dữ liệu dự báo được các khuynh hướng phát triển, đưa racác quyết sách đúng đắn, kịp thời và hiệu quả cho cơ quan, tổ chức của mình. Đápứng các yêu cầu trên, nhiều công cụ được xây dựng nhằm thỏa mãn các nhu cầu khaithác dữ liệu mức cao đã được các hãng nổi tiếng tập trung nghiên cứu, trong đó,nguồn dữ liệu đối với các tập đoàn công nghệ, tài chính, ngân hàng là vô cùng lớn. CắtXây dựng một kho dữ liệu cho phép rút trích tài nguyên, tính toán theo yêucầu để cung cấp các báo cáo dựa vào CSDL hoạt động phục vụ sản xuất, kinh doanhtrở nên thông minh hơn, tăng thêm chất lượng và tính linh hoạt của việc phân tích kinhdoanh có chất lượng cao và ổn định.1. Kho dữ liệu là gì? Kho dữ liệu là tập hợp các CSDL tích hợp, hướng chủ đề, được thiết kế để hỗ trợcho chức năng trợ giúp quyết định. Công nghệ kho dữ liệu là tập các phương pháp, kỹthuật và các công cụ có thể kết hợp, hỗ trợ nhau để cung cấp thông tin cho người sửdụng trên cơ sở tích hợp từ nhiều nguồn dữ liệu, nhiều môi trường khác nhau thiết kếchủ yếu cho truy vấn và phân tích hơn là xử lý các giao tác. Kho dữ liệu thường rất lớn tới hàng trăm Gigabyte (GB) hay thậm chí hàngTerabyte (TB). Kho dữ liệu được xây dựng để tiện lợi cho việc truy cập theo nhiềunguồn, nhiều kiểu dữ liệu khác nhau sao cho có thể kết hợp được cả những ứng dụngcủa các công nghệ hiện đại và kế thừa được từ những hệ thống đã có sẵn từ trước.Ngoài việc chứa đựng một CSDL quan hệ, kho dữ liệu còn bao gồm sử dụng các phatrong trích xuất, chuyển đổi, tải dữ liệu (Extract,Tranform, Loading - ETL), công nghệxử lý phân tích trực tuyến (OnLine Analytical Processing – OLAP), các công cụ phântích, và các ứng dụng cho việc thu thập và cung cấp dữ liệu tới người sử dụng.2. Đặc trưng của kho dữ liệu(1) Hướng chủ thể Kho dữ liệu được tổ chức xung quanh các chủ đề chính như khách hàng, sảnphẩm, bán hàng, tập trung vào việc mô hình hóa và phân tích dữ liệu cho những ngườiđưa ra quyết định, mà không tập trung vào các hoạt động hay các xử lý giao tác hàngngày. Kho dữ liệu cung cấp một khung nhìn đơn giản và súc tích xung quanh các sựkiện của các chủ thể. Ví dụ, để tìm hiểu thêm về dữ liệu bán hàng của công ty, ta cóthể xây dựng một kho dữ liệu tập trung trên doanh thu. Sử dụng kho dữ liệu có thể trảlời các câu hỏi như Ai là khách hàng tốt nhất của chúng ta cho mặt hàng này nămngoái?. Các chủ thể điển hình. Các tài khoản khách hàng. Việc bán hàng. Tiền tiết kiệm của khách hàng. Các yêu sách bảo hiểm. Đặt chỗ hành khách. Hình 1: Mô tả dữ liệu tổ chức theo hướng chủ thể Các hệ thống OLTP có thể chứa hàng trăm GB số liệu, tuy nhiên những số liệunày có thể hoàn toàn vô ích trong việc phân tích trực tuyến như: Địa chỉ, ID kháchhàng... Các dữ liệu kiểu này thường không được đưa vào kho dữ liệu để hạn chế dữliệu cần xem xét xuống mức tối thiểu nhưng cũng bảo đảm các thông tin theo từng chủđề. Một chủ đề là một miền dữ liệu được tách ra từ một tập hợp lớn các chủ đề màngười sử dụng quan tâm trong công việc kinh doanh.(2) Tích hợp Được xây dựng bằng việc tích hợp dữ liệu từ các nguồn dữ liệu hỗn tạp. Các kỹthuật làm sạch và tích hợp dữ liệu được áp dụng để đảm bảo sự đồng nhất trong cácquy ước tên, cấu trúc mã hóa, các đơn vị đo thuộc tính... giữa các nguồn khác nhau. Hình 2: Mô tả dữ liệu được tích hợp từ nhiều nguồn Kho dữ liệu phải đưa các dữ liệu từ các nguồn khác nhau về định dạng phù hợp.Chúng ta phải giải quyết những vấn đề như xung đột tên và mâu thuẩn giữa các đơn vịđo.(4) Biến thời gian Yêu cầu quan trọng cho kho dữ liệu là phạm vi về thời gian dài hơn so với các hệthống tác nghiệp. CSDL tác nghiệp: dữ liệu có giá trị hiện thời. Dữ liệu của kho dữ liệu: cung cấp thông tin lịch sử từ 5-10 năm trước. Yếu tố thời gian được lưu trữ trong hệ thống. Hình 3: Mô tả dữ liệu theo thời gian Các hệ OLTP thường bao quát một khoảng thời gian không lớn và chúng đượclưu trữ theo chu ...
Tìm kiếm theo từ khóa liên quan:
Xây dựng kho dữ liệu Hệ thống kho dữ liệu Khai phá dữ liệu khách hàng Ngân hàng thương mại Khai phá dữ liệu ngân hàng thương mại Kỹ thuật xây dựng kho dữ liệuGợi ý tài liệu liên quan:
-
7 trang 241 3 0
-
19 trang 184 0 0
-
Các yếu tố tác động đến hành vi sử dụng Mobile banking: Một nghiên cứu thực nghiệm tại Việt Nam
20 trang 181 0 0 -
Bài giảng học Lý thuyết tài chính- tiền tệ
54 trang 177 0 0 -
Hoàn thiện pháp luật về ngân hàng thương mại ở Việt Nam: Phần 1
190 trang 172 0 0 -
Giáo trình: Mô phỏng sàn giao dịch chứng khoán: Phần 1 - ĐH Kỹ thuật Công nghệ
28 trang 159 0 0 -
Bài giảng Lý thuyết tiền tệ: Bài 4 - Các ngân hàng trung gian
20 trang 154 0 0 -
CÁC QUY TẮC VÀ THỰC HÀNH THỐNG NHẤT VỀ TÍN DỤNG CHỨNG TỪ
29 trang 139 0 0 -
38 trang 131 0 0
-
Bài giảng Nghiệp vụ ngân hàng thương mại: Chương 2 - ThS. Lê Ngọc Lưu Quang
45 trang 129 0 0