Danh mục

Các mẫu dịch vụ thông tin, Phần 3: Mẫu làm sạch dữ liệu

Số trang: 17      Loại file: pdf      Dung lượng: 455.21 KB      Lượt xem: 16      Lượt tải: 0    
10.10.2023

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Giới thiệu Thông tin là một trong những tài sản chiến lược nhất của bất kỳ tổ chức nào. Chất lượng dữ liệu là một điều kiện tiên quyết quan trọng về sử dụng thông tin để đạt được những lợi thế thấy rõ trên thị trường. Dữ liệu tồi chỉ biến thông tin có giá trị tiềm năng cao thành các luồng byte vô dụng. Ví dụ, thông tin địa chỉ không chính xác về một "bên tham gia" (chẳng hạn như một người dùng dịch vụ, bệnh nhân hoặc khách hàng) sẽ hạn chế tầm hiểu biết chiến...
Nội dung trích xuất từ tài liệu:
Các mẫu dịch vụ thông tin, Phần 3: Mẫu làm sạch dữ liệuCác mẫu dịch vụ thông tin, Phần 3: Mẫu làm sạch dữ liệuGiới thiệuThông tin là một trong những tài sản chiến lược nhất của bất kỳ tổ chức nào. Chấtlượng dữ liệu là một điều kiện tiên quyết quan trọng về sử dụng thông tin để đạtđược những lợi thế thấy rõ trên thị trường. Dữ liệu tồi chỉ biến thông tin có giá trịtiềm năng cao thành các luồng byte vô dụng. Ví dụ, thông tin địa chỉ không chínhxác về một bên tham gia (chẳng hạn như một người dùng dịch vụ, bệnh nhânhoặc khách hàng) sẽ hạn chế tầm hiểu biết chiến lược để có thể hiểu rõ về thôngtin. Loại dữ liệu này có thể bao gồm thông tin để cho biết rằng liệu hai bên thamgia có giống nhau hay không, con số tổng của những người dùng dịch vụ và có cáinhìn đầy đủ về khách hàng. Dữ liệu tùy tiện có thể làm giảm sự hài lòng của kháchhàng, làm cho việc trao đổi thông tin khó khăn và làm tăng các chi phí khi cố tìmcách né tránh vấn đề, cũng như tạo ra những thách thức khác.Các tầng trong một kiến trúc phần mềmMột kiến trúc phần mềm có bốn tầng:Tầng Cơ sở dữ liệu -- Nằm ở dưới cùng, nó chịu trách nhiệm duy trì dữ liệu vàcung cấp các hoạt động tạo, đọc, cập nhật và xóa dữ liệu.Tầng Ứng dụng -- Nằm trên tầng cơ sở dữ liệu, nó cung cấp logic nghiệp vụ.Tầng Tiến trình -- Nó sắp xếp thứ tự logic nghiệp vụ thông qua việc quản lý luồngcông việc.Tầng Trình bày -- Nằm trên cùng, nó đưa ra hiển thị trực quan của tất cả các tầngbên dưới cho người dùng cuối.Các vấn đề về chất lượng dữ liệu là nghiêm trọng nhất khi thông tin nằm rải ráctrên các kho lưu trữ dữ liệu bị cô lập và không đồng nhất. Bản chất không đồngnhất và cô lập của môi trường như vậy thường đi cùng với một kiến trúc có cácđịnh dạng khác nhau và các giá trị không nhất quán. Ngay cả trong một cơ sở dữliệu đơn lẻ, chất lượng dữ liệu đã lưu giữ lâu dài không nhất thiết là tốt hơn nếukhông thực thi các quy tắc thích hợp. Cho dù thông tin vẫn còn trong một kho lưutrữ dữ liệu hoặc được một ứng dụng đang hoạt động xử lý, chất lượng dữ liệuthường hoặc không được thực thi chút nào hoặc bị kiểm soát bởi các thành phầnkhác nhau, sử dụng những quy tắc không nhất quán, nhúng trong một mã ứng dụngnào đó.Để chuyển thông tin thành sự hiểu biết và sử dụng được giá trị quan trọng của nó,chất lượng dữ liệu cần được giải quyết bằng cách áp dụng phương pháp làm sạchdữ liệu theo cách nhất quán; có nghĩa là, sử dụng các quy tắc làm sạch nhất quántrong toàn doanh nghiệp, không chỉ trong tầng cơ sở dữ liệu mà còn trong các tầngứng dụng và tiến trình.Sau khi mô tả tóm tắt giá trị của cách tiếp cận này, bạn sẽ tìm hiểu bối cảnh trongđó nên áp dụng mẫu làm sạch dữ liệu nào. Tiếp theo, bạn tìm hiểu về cách tiếp cậntheo vấn đề và giải pháp cho mẫu này. Cuối cùng, bạn sẽ có cái nhìn sơ tổng quanvề các vùng trọng tâm và các vùng nhiều rủi ro, cũng như những hạn chế của mẫunày.Về đầu trangĐề xuất giá trị của mẫu làm sạch dữ liệuMẫu này có thể cung cấp ba giá trị chính là:Ưu điểm của tính nhất quán và chất lượng.Giảm chi phí phát triển và bảo trì.Ưu điểm về khả năng tái sử dụng.Chúng ta hãy xem xét kỹ hơn từng giá trị một.Ưu điểm của tính nhất quán và chất lượngLợi ích quan trọng nhất khi áp dụng mẫu làm sạch dữ liệu là nó có thể cải thiệntính nhất quán và chất lượng thông tin, cho dù mẫu đó được duy trì trong cơ sở dữliệu hay được một ứng dụng xử lý. Mẫu này cải thiện chất lượng của dữ liệu và bảođảm rằng nó có chất lượng cao.Việc áp dụng mẫu làm sạch dữ liệu trong một bối cảnh SOA cung cấp các quytrình nghiệp vụ có khả năng quản lý và bảo đảm chất lượng dữ liệu ngay tại thờiđiểm thu thập ban đầu của nó. Việc áp dụng làm sạch dữ liệu trước khi thông tinđược lưu giữ lâu dài cho phép đưa vào các cơ chế xác nhận hợp lệ đã quy định vềnghiệp vụ tại điểm nhập dữ liệu, chẳng hạn như trong các cổng thông tin nhập dữliệu.Giảm chi phí phát triển và bảo trìMẫu này cung cấp các hướng dẫn thực hành được gợi ý về cách định rõ các quy tắclàm sạch và cách áp dụng có hiệu quả nhất các hướng dẫn đó cho dữ liệu lưu giữlâu dài và dữ liệu tạm thời. Nhiều bản thực hiện mẫu làm sạch dữ liệu cung cấp cáccông cụ tinh vi để phát triển, thử nghiệm và triển khai các quy tắc làm sạch. Cáccông cụ này có thể giúp làm giảm chi phí hoạt động trong nhiều dự án trong đó cácquy tắc làm sạch được xác định bằng thủ công và phải duy trì một cách rất vất vả.Ưu điểm về khả năng tái sử dụngMột khía cạnh quan trọng của mẫu làm sạch dữ liệu là nó tập trung vào khả năngtái sử dụng ở mức doanh nghiệp. Nếu mỗi cơ sở dữ liệu và ứng dụng thực hiện quytrình làm sạch riêng của mình, thì điều này có thể dẫn đến các quy tắc làm sạchkhông nhất quán, trong đó mức chất lượng dữ liệu tăng thêm, nhưng không theomột cách nhất quán và có hiệu quả và chưa đạt đến mức cần thiết. Mẫu này mô tảlàm thế nào có thể áp dụng một cách nhất quán các quy tắc làm sạch như nhau chorất nhiều người tiêu dùng.Về đầu trangBối cảnhBố ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: