Bài viết phát biểu và chứng minh một số tính chất tính gia tăng ma trận độ hỗ trợ, từ đó xác định ma trận độ chính xác và ma trận độ phủ trên khối dữ liệu khi bổ sung và loại bỏ lớp đối tượng thuần nhất để sinh các luật quyết định có ý nghĩa.
Nội dung trích xuất từ tài liệu:
Một số tính chất của ma trận SUP trên khối dữ liệu khi bổ sung và loại bỏ lớp đối tượng thuần nhấtKỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020DOI: 10.15625/vap.2020.00186 MỘT SỐ TÍNH CHẤT CỦA MA TRẬN SUP TRÊN KHỐI DỮ LIỆU KHI BỔ SUNG VÀ LOẠI BỎ LỚP ĐỐI TƯỢNG THUẦN NHẤT Trịnh Đình Thắng1, Đỗ Thị Lan Anh1, Trần Minh Tuyến2 Viện Công nghệ thông tin, Trường Đại học Sư phạm Hà Nội 2 1 2 Đại học Công đoàn thangdhsp2@hpu2.edu.vn, lananh.cntt.sp2@gmail.com, tuyentm@dhcd.edu.vn TÓM TẮT: Bài báo phát biểu và chứng minh một số tính chất tính gia tăng ma trận độ hỗ trợ, từ đó xác định ma trận độchính xác và ma trận độ phủ trên khối dữ liệu khi bổ sung và loại bỏ lớp đối tượng thuần nhất để sinh các luật quyết định có ýnghĩa. Các thuật toán để tính gia tăng ma trận độ hỗ trợ trên khối quyết định cũng đã được đề xuất khi tăng hoặc giảm tập đốitượng,… Độ phức tạp của các thuật toán này trên khối quyết định khi bổ sung và loại bỏ lớp đối tượng thuần nhất cũng đã đượcphát biểu và chứng minh ở đây. Từ khóa: Ma trận độ hỗ trợ, ma trận độ chính xác, ma trận độ phủ, khối dữ liệu, khối quyết định. I. GIỚI THIỆU Khi nghiên cứu mô hình và thuật toán để khai phá các luật quyết định trên khối dữ liệu với tập đối tượng thayđổi thì việc tính gia tăng các ma trận Sup, Acc, Cov luôn được các tác giả quan tâm. Mục tiêu của bài báo này là từ môhình bổ sung và loại bỏ đối tượng ra khỏi khối dữ liệu, đề xuất và chứng minh một số tính chất của các ma trận độ hỗtrợ, độ chính xác và độ phủ trên khối dữ liệu khi bổ sung và loại bỏ các lớp đối tượng. Từ các tính chất này, bài báo đềxuất các thuật toán tính gia tăng của các ma trận tương ứng cùng độ phức tạp tính toán. Các kết quả của việc tính giatăng các ma trận Acc và Cov sẽ là cơ sở để tìm ra các luật quyết định có ý nghĩa trên khối dữ liệu khi bổ sung và loạibỏ các lớp đối tượng. II. CÁC KHÁI NIỆM CƠ BẢN2.1. Khối Định nghĩa 2.1 [1] Gọi R = (id; A1, A2, ..., An) là một bộ hữu hạn các phần tử, trong đó id là tập chỉ số hữu hạnkhác rỗng, Ai (i=1..n) là các thuộc tính. Mỗi thuộc tính Ai (i=1..n) có miền giá trị tương ứng là dom(Ai). Một khối rtrên R, kí hiệu r(R) gồm một số hữu hạn phần tử mà mỗi phần tử là một họ các ánh xạ từ tập chỉ số id đến các miềntrị của các thuộc tính Ai (i=1..n). Nói một cách khác: t∈ r(R) ⇔ t = {ti : id → dom(Ai)}i=1..n. Ta kí hiệu khối đó là r(R) hoặc r(id; A1, A2,..., An ), đôi khi nếu không sợ nhầm lẫn ta kí hiệu đơn giản là r.2.2. Lát cắt của khối Định nghĩa 2.2 [2, 3] Cho R = (id; A1, A2,..., An ), r(R) là một khối trên R. Với mỗi x∈ id ta kí hiệu r(Rx) là một khối với Rx = ({x};A1, A2,..., An ) sao cho: tx∈ r(Rx) ⇔ tx = {tix = ti } i=1..n , ở đây t∈ r(R), t = { ti : id → dom(Ai)}i=1..n , x Khi đó r(Rx) được gọi là một lát cắt trên khối r(R) tại điểm x. Sau đây, để cho đơn giản ta sử dụng các kí hiệu: x(i) = (x; Ai ) ; id(i) = {x(i) | x ∈ id}. Ta gọi x(i) (x ∈ id, i = 1..n)là các thuộc tính chỉ số của lược đồ khối R = (id; A1,A2,...,An ).2.3. Khối thông tin Định nghĩa 2.3 [4] Cho lược đồ khối R = (id; A1, A2, ... , An ), r là một khối trên R. Khi đó khối thông tin là một bộ bốn IB = (U, A, nV, f) với U là tập các đối tượng thuộc r gọi là không gian các đối tượng, A = id (i ) là tập các thuộc tính chỉ số của i =1đối tượng, V = V x( i ) , Vx( i ) là tập giá trị của các đối tượng ứng với thuộc tính chỉ số x(i), f là hàm thông tin UxA → x ( i ) ∈AV thỏa mãn: ∀u∈U, ∀ x(i)∈ A ta có f(u, x(i))∈ Vx ( i ) . Khi đó, ta gọi f(u, x(i)) là giá trị của đối tượng u tại thuộc tính chỉ số x(i).Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến 343 Định nghĩa 2.4 [4] Cho lược đồ khối R = (id; A1, A2, ... , An ), r là một khối trên R, rx là lát cắt của khối r tạiđiểm x∈id. Khi đó lát cắt của khối thông tin tại x là một bộ bốn IBx = (U, Ax, Vx, fx) với U là tập các đối tượng thuộc rgọi là không gian các đối tư ...