Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 3: Gọi khai phá động từ Cognos khi sử dụng một ví dụ phân tích giỏ thị trường
Số trang: 38
Loại file: pdf
Dung lượng: 1.18 MB
Lượt xem: 10
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Benjamin G. Leonhardi, Kỹ sư phần mềm, IBM Christoph Sieb, Kỹ sư phần mềm cao cấp, IBM Dr. Michael J. Wurst, Kỹ sư phần mềm cao cấp, IBM Tóm tắt: Các quy tắc kết hợp biểu thị các mặt hàng, các sự kiện hoặc các thực thể khác nào thường xảy ra đồng thời trong các tập dữ liệu lớn. Ví dụ, có thể áp dụng kiến thức này trong việc phân tích giỏ hàng (ND: một lần mua sắm ở một cửa hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã mua...
Nội dung trích xuất từ tài liệu:
Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 3: Gọi khai phá động từ Cognos khi sử dụng một ví dụ phân tích giỏ thị trường Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 3: Gọi khai phá động từ Cognos khi sử dụng một ví dụ phân tích giỏ thị trường Benjamin G. Leonhardi, Kỹ sư phần mềm, IBM Christoph Sieb, Kỹ sư phần mềm cao cấp, IBM Dr. Michael J. Wurst, Kỹ sư phần mềm cao cấp, IBM Tóm tắt: Các quy tắc kết hợp biểu thị các mặt hàng, các sự kiện hoặc các thực thể khác nào thường xảy ra đồng thời trong các tập dữ liệu lớn. Ví dụ, có thể áp dụng kiến thức này trong việc phân tích giỏ hàng (ND: một lần mua sắm ở một cửa hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã mua trong quá trình này sau đó cùng xuất hiện và được gọi là một giỏ hàng hay giỏ thị trường) để sử dụng các tiềm năng bán hàng chéo bằng cách giới thiệu các sản phẩm thường được mua cùng với nhau. Bạn có thể áp dụng khai phá các quy tắc kết hợp trong InfoSphere Warehouse và xuất khẩu mô hình kết quả tới các báo cáo Cognos, tương tự như cách các bài viết trước trong loạt bài này đã làm với các mô hình Cụm và Phân loại. Do việc khai phá quy tắc kết hợp là một nhiệm vụ tương tác cao, nên một giải pháp tốt hơn sẽ là cho phép người dùng gọi khai phá trực tiếp từ một báo cáo Cognos, có thể chỉ định các tham số bổ sung. Cách tiếp cận như vậy có thể được bao hàm như là khai phá đặc biệt hoặc khai phá động. Trong bài viết này, bạn sẽ tìm hiểu để đạt được điều này. Mở đầu Khi bạn đang làm việc với lượng dữ liệu lớn, điều quan trọng là bạn hiểu rõ các quy tắc về các thực thể khác nhau có liên quan với nhau như thế nào. Thường phát hiện ra các quy tắc này là một quá trình phức tạp. Các quy tắc kết hợp rất đơn giản chỉ là chủ nghĩa hình thức có tác động mạnh đến các quy tắc mô tả các tập dữ liệu vì chúng biểu thị các thực thể nào có thể xuất hiện đồng thời với nhau. Một ví dụ truyền thống về các quy tắc kết hợp có thể thường thấy trong lĩnh vực bán lẻ. Ví dụ, một quy tắc kết hợp chung là “NẾU trứng VÀ sữa thì SAU ĐÓ là đường” nói lên rằng khi mua hàng nhiều khách hàng mua trứng và sữa cũng mua đường. Quy tắc này có thể được phát hiện có hiệu quả thậm chí từ các các tập dữ liệu rất lớn. InfoSphere Warehouse cho phép bạn tìm các quy tắc này một cách thuận tiện như bài viết này đã mô tả chi tiết. Bài viết trước của loạt bài này đã mô tả cách trước hết xây dựng mô hình khai phá trong InfoSphere Warehouse và sau đó xuất bản các kết quả bằng cách sử dụng Cognos. Điều này là tốt trong một số kịch bản. Tuy nhiên, một nhà phân tích thường muốn tác động đến việc phân tích tương tác, ví dụ, hạn chế các quy tắc được tìm thấy. Chuyển sang InfoSphere Warehouse DesignStudio rồi quay lại Cognos mỗi khi thay đổi một tham số thật không thuận tiện chút nào. Do đó bạn muốn tạo các bản ghi tương tác cho phép người dùng thiết lập các tham số trong một báo cáo Cognos, tự động gọi khai phá trong nền tảng rồi cung cấp các kết quả trả lại Cognos. Bài viết này cho bạn thấy cách thực hiện chính xác các bước đó. Trước tiên, hãy tìm hiểu về nhiệm vụ khai phá quy tắc kết hợp và cách có được nó trong InfoSphere Warehouse. Sau đó, hãy xem cách gọi động khai phá dữ liệu từ Cognos. Cuối cùng, hãy xem một ví dụ về việc có thể sử dụng cơ chế này theo thời gian thực. Phân tích giỏ hàng và khai phá quy tắc kết hợp Các quy tắc kết hợp và các ứng dụng của chúng Các quy tắc kết hợp mô tả những mục nào thường xảy ra cùng nhau. Khái niệm về một giao dịch có tầm quan trọng thiết yếu trong ngữ cảnh này. (Một truy cập đơn vào một cửa hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã mua trong quá trình truy cập này sau đó đang cùng xuất hiện và được gọi là một giỏ hàng hay tổng quát hơn là giỏ thị trường). Mặc dù, tất cả các mua sắm của một khách hàng trong suốt một năm cũng có thể được xem như là một giao dịch. Điều đó phụ thuộc vào loại các quy tắc nào mà bạn quan tâm. Hãy xem xét một ví dụ đơn giản. Bảng sau đây chứa các giao dịch về các mặt hàng. Mỗi giao dịch có chứa tất cả các mặt hàng mà một khách hàng đã mua trong một lần truy cập vào một cửa hàng. Hình 1. Các giao dịch mẫu Như bạn thấy, máy tính (PC) được mua khá thường xuyên. Ngoài ra, sự kết hợp của máy tính và màn hình (Monitor) xuất hiện trong 20% các giao dịch. Như bạn cũng có thể thấy, trong 50% trường hợp đã mua một máy tính (PC) và màn hình (Monitor), cũng mua một con chuột (Mouse). Nếu chúng ta lấy điều n ày làm một quy tắc: [PC, Monitor]->Mouse, ở đây [Pc, Monitor] là phần thân còn Mouse là phần đầu hoặc phần đích, thì số lượng các giao dịch bao gồm các phần thân và phần đầu được chia cho số lượng tất cả các giao dịch có hiệu lực được gọi là sự hỗ trợ (20%). Cách tính này cho chúng ta biết quy tắc này xuất hiện trong dữ liệu thường xuyên như thế nào. Mặc dù nó không cho chúng ta biết độ chính xác của quy tắc này bằng bao nhiêu. Độ tin cậy mô tả tỷ lệ phần trăm số lần phần thân của một quy tắc xuất hiện trong một giao dịch và phần đầu cũng xuất hiện. Điều này mang đến thông tin về tính chính xác của quy tắc này. Khai phá các quy tắc kết hợp đòi hỏi người sử dụng phải nói sự hỗ trợ và độ tin cậy tối thiểu. Sau đó thuật toán xác định chính xác các cách kết hợp các mặt hàng và các quy tắc để thực hiện tiêu chuẩn này Có nhiều kịch bản ứng dụng trong đó sử dụng khai phá quy tắc kết hợp. Chúng ta đã đề cập đến một sự khai phá nổi bật nhất: đó là bán lẻ. Ví dụ, các quy tắc kết hợp được dùng để sắp xếp hàng hóa trong một siêu thị sao cho các sản phẩm thường được mua trong cùng một lần truy cập đến một cửa hàng được đặt gần nhau. Quan trọng hơn là, sử dụng các quy tắc kết hợp để tận dụng tiềm năng bán hàng chéo trong thương mại điện tử bằng cách giới thiệu cho những người sử dụng các mặt hàng nào có thể cần quan tâm thêm nữa với họ. Một lĩnh vực ứng dụng khác là chăm sóc sức khỏe. Có thể sử dụng các quy tắc ...
Nội dung trích xuất từ tài liệu:
Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 3: Gọi khai phá động từ Cognos khi sử dụng một ví dụ phân tích giỏ thị trường Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 3: Gọi khai phá động từ Cognos khi sử dụng một ví dụ phân tích giỏ thị trường Benjamin G. Leonhardi, Kỹ sư phần mềm, IBM Christoph Sieb, Kỹ sư phần mềm cao cấp, IBM Dr. Michael J. Wurst, Kỹ sư phần mềm cao cấp, IBM Tóm tắt: Các quy tắc kết hợp biểu thị các mặt hàng, các sự kiện hoặc các thực thể khác nào thường xảy ra đồng thời trong các tập dữ liệu lớn. Ví dụ, có thể áp dụng kiến thức này trong việc phân tích giỏ hàng (ND: một lần mua sắm ở một cửa hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã mua trong quá trình này sau đó cùng xuất hiện và được gọi là một giỏ hàng hay giỏ thị trường) để sử dụng các tiềm năng bán hàng chéo bằng cách giới thiệu các sản phẩm thường được mua cùng với nhau. Bạn có thể áp dụng khai phá các quy tắc kết hợp trong InfoSphere Warehouse và xuất khẩu mô hình kết quả tới các báo cáo Cognos, tương tự như cách các bài viết trước trong loạt bài này đã làm với các mô hình Cụm và Phân loại. Do việc khai phá quy tắc kết hợp là một nhiệm vụ tương tác cao, nên một giải pháp tốt hơn sẽ là cho phép người dùng gọi khai phá trực tiếp từ một báo cáo Cognos, có thể chỉ định các tham số bổ sung. Cách tiếp cận như vậy có thể được bao hàm như là khai phá đặc biệt hoặc khai phá động. Trong bài viết này, bạn sẽ tìm hiểu để đạt được điều này. Mở đầu Khi bạn đang làm việc với lượng dữ liệu lớn, điều quan trọng là bạn hiểu rõ các quy tắc về các thực thể khác nhau có liên quan với nhau như thế nào. Thường phát hiện ra các quy tắc này là một quá trình phức tạp. Các quy tắc kết hợp rất đơn giản chỉ là chủ nghĩa hình thức có tác động mạnh đến các quy tắc mô tả các tập dữ liệu vì chúng biểu thị các thực thể nào có thể xuất hiện đồng thời với nhau. Một ví dụ truyền thống về các quy tắc kết hợp có thể thường thấy trong lĩnh vực bán lẻ. Ví dụ, một quy tắc kết hợp chung là “NẾU trứng VÀ sữa thì SAU ĐÓ là đường” nói lên rằng khi mua hàng nhiều khách hàng mua trứng và sữa cũng mua đường. Quy tắc này có thể được phát hiện có hiệu quả thậm chí từ các các tập dữ liệu rất lớn. InfoSphere Warehouse cho phép bạn tìm các quy tắc này một cách thuận tiện như bài viết này đã mô tả chi tiết. Bài viết trước của loạt bài này đã mô tả cách trước hết xây dựng mô hình khai phá trong InfoSphere Warehouse và sau đó xuất bản các kết quả bằng cách sử dụng Cognos. Điều này là tốt trong một số kịch bản. Tuy nhiên, một nhà phân tích thường muốn tác động đến việc phân tích tương tác, ví dụ, hạn chế các quy tắc được tìm thấy. Chuyển sang InfoSphere Warehouse DesignStudio rồi quay lại Cognos mỗi khi thay đổi một tham số thật không thuận tiện chút nào. Do đó bạn muốn tạo các bản ghi tương tác cho phép người dùng thiết lập các tham số trong một báo cáo Cognos, tự động gọi khai phá trong nền tảng rồi cung cấp các kết quả trả lại Cognos. Bài viết này cho bạn thấy cách thực hiện chính xác các bước đó. Trước tiên, hãy tìm hiểu về nhiệm vụ khai phá quy tắc kết hợp và cách có được nó trong InfoSphere Warehouse. Sau đó, hãy xem cách gọi động khai phá dữ liệu từ Cognos. Cuối cùng, hãy xem một ví dụ về việc có thể sử dụng cơ chế này theo thời gian thực. Phân tích giỏ hàng và khai phá quy tắc kết hợp Các quy tắc kết hợp và các ứng dụng của chúng Các quy tắc kết hợp mô tả những mục nào thường xảy ra cùng nhau. Khái niệm về một giao dịch có tầm quan trọng thiết yếu trong ngữ cảnh này. (Một truy cập đơn vào một cửa hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã mua trong quá trình truy cập này sau đó đang cùng xuất hiện và được gọi là một giỏ hàng hay tổng quát hơn là giỏ thị trường). Mặc dù, tất cả các mua sắm của một khách hàng trong suốt một năm cũng có thể được xem như là một giao dịch. Điều đó phụ thuộc vào loại các quy tắc nào mà bạn quan tâm. Hãy xem xét một ví dụ đơn giản. Bảng sau đây chứa các giao dịch về các mặt hàng. Mỗi giao dịch có chứa tất cả các mặt hàng mà một khách hàng đã mua trong một lần truy cập vào một cửa hàng. Hình 1. Các giao dịch mẫu Như bạn thấy, máy tính (PC) được mua khá thường xuyên. Ngoài ra, sự kết hợp của máy tính và màn hình (Monitor) xuất hiện trong 20% các giao dịch. Như bạn cũng có thể thấy, trong 50% trường hợp đã mua một máy tính (PC) và màn hình (Monitor), cũng mua một con chuột (Mouse). Nếu chúng ta lấy điều n ày làm một quy tắc: [PC, Monitor]->Mouse, ở đây [Pc, Monitor] là phần thân còn Mouse là phần đầu hoặc phần đích, thì số lượng các giao dịch bao gồm các phần thân và phần đầu được chia cho số lượng tất cả các giao dịch có hiệu lực được gọi là sự hỗ trợ (20%). Cách tính này cho chúng ta biết quy tắc này xuất hiện trong dữ liệu thường xuyên như thế nào. Mặc dù nó không cho chúng ta biết độ chính xác của quy tắc này bằng bao nhiêu. Độ tin cậy mô tả tỷ lệ phần trăm số lần phần thân của một quy tắc xuất hiện trong một giao dịch và phần đầu cũng xuất hiện. Điều này mang đến thông tin về tính chính xác của quy tắc này. Khai phá các quy tắc kết hợp đòi hỏi người sử dụng phải nói sự hỗ trợ và độ tin cậy tối thiểu. Sau đó thuật toán xác định chính xác các cách kết hợp các mặt hàng và các quy tắc để thực hiện tiêu chuẩn này Có nhiều kịch bản ứng dụng trong đó sử dụng khai phá quy tắc kết hợp. Chúng ta đã đề cập đến một sự khai phá nổi bật nhất: đó là bán lẻ. Ví dụ, các quy tắc kết hợp được dùng để sắp xếp hàng hóa trong một siêu thị sao cho các sản phẩm thường được mua trong cùng một lần truy cập đến một cửa hàng được đặt gần nhau. Quan trọng hơn là, sử dụng các quy tắc kết hợp để tận dụng tiềm năng bán hàng chéo trong thương mại điện tử bằng cách giới thiệu cho những người sử dụng các mặt hàng nào có thể cần quan tâm thêm nữa với họ. Một lĩnh vực ứng dụng khác là chăm sóc sức khỏe. Có thể sử dụng các quy tắc ...
Tìm kiếm theo từ khóa liên quan:
quản trị dữ liệu lập trình XML ngôn ngữ SQL data base hệ quản trị lưu trữ dữ liệu bộ nhớGợi ý tài liệu liên quan:
-
Đáp án đề thi học kỳ 2 môn cơ sở dữ liệu
3 trang 290 1 0 -
PHÂN TÍCH THIẾT KẾ HỆ THỐNG XÂY DỰNG HỆ THỐNG ĐẶT VÉ TÀU ONLINE
43 trang 278 2 0 -
8 trang 248 0 0
-
6 trang 152 0 0
-
Hướng dẫn tạo file ghost và bung ghost
12 trang 143 0 0 -
Hướng dẫn sử dụng Mapinfo Professional-Phần cơ bản
57 trang 82 0 0 -
Phát triển Java 2.0: Phân tích dữ liệu lớn bằng MapReduce của Hadoop
12 trang 69 0 0 -
Giáo trình Điện toán đám mây (Xuất bản lần thứ hai): Phần 1
64 trang 64 0 0 -
Đồ án tốt nghiệp ngành Công nghệ thông tin: Áp dụng các kỹ thuật trong big data vào lưu trữ dữ liệu
96 trang 62 1 0 -
150 trang 59 0 0