Bài viết Tích hợp cơ sở tri thức xác suất bằng toán tử trung vị đề xuất một toán tử tích hợp mới và một thuật toán sử dụng toán tử này để tiến hành tích hợp các cơ sở tri thức dạng xác suất.
Nội dung trích xuất từ tài liệu:
Tích hợp cơ sở tri thức xác suất bằng toán tử trung vị
Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8
TÍCH HỢP CƠ SỞ TRI THỨC XÁC SUẤT
BẰNG TOÁN TỬ TRUNG VỊ
Nguyễn Văn Thẩm1, Nguyễn Quỳnh Diệp1, Nguyễn Đỗ Kiều Loan2
1
Trường Đại học Thủy lợi, email: thamnv@tlu.edu.vn
2
Học viện Tài chính
1. GIỚI THIỆU CHUNG của phép thử đó, kí hiệu là S. Đặt là một tập
Để xây dựng và duy trì hoạt động của các hệ hữu hạn các sự kiện, trong đó mỗi sự kiện là
thống dựa trên tri thức thì cần xem xét các một tập con của không gian mẫu S.
phương pháp tích hợp. Tích hợp tri thức Định nghĩa 1. [4] Đặt F, G và [0,1]
(THTT) có thể được hiểu như là tiến trình tạo Một ràng buộc xác suất (RBXS) là một biểu
ra một cơ sở tri thức (CSTT) nhất quán từ một thức có dạng c[], trong đó c=(F|G).
tập các cơ sở tri thức thuộc về các hệ thống Nếu F độc lập với G, tức G là lặp thừa, G T,
khác nhau. THTT là một bài toán quan trọng kí hiệu (F|T). bởi (F). Hai RBXS c1 và c2
và có rất nhiều các ứng dụng sử dụng tiến trình được gọi là tương đương về cấu trúc, được kí
THTT. Bài báo này tập trung vào phương pháp hiệu c1 c2, nếu sự kiện bên trái của c1 bằng
THTT trên môi trường xác suất. sự kiện bên trái của c2 và sự kiện bên phải của
Bài toán THTT trong môi trường xác suất c1 bằng sự kiện bên phải của c2.
được định nghĩa như sau: Cho một hồ sơ tri Định nghĩa 2. [4] Một cơ sở tri thức (CSTT)
thức xác suất . Cần xác định một CSTT xác xác suất K là một tập hữu hạn các RBXS:
suất chung * là đại diện tốt nhất cho tập các k1 , ,kn
CSTT xác suất đã cho. Trong đó: ki ci [ i ] i 1,n
Gần đây, có hai cách tiếp cận chính để thực
Định nghĩa 3. Một hồ sơ TTXS R trên tập
hiện tiến hành tích hợp các CSTT xác suất: (i)
tìm phân phối xác suất chung biểu diễn cho các sự kiện là một bộ , , trong đó
CSTT xác suất kết quả bằng cách sử dụng các là một tập hữu hạn gồm n sự kiện và là
hàm phân kỳ [2,4]; (ii) sử dụng các toán tử tích một đa tập hữu hạn gồm m CSTT xác suất.
hợp để tính giá trị trung vị của các giá trị xác Định nghĩa 4. Một hồ sơ TTXS ,
suất trong các ràng buộc xác suất đầu vào [1,3]. là hồ sơ TTXS nhất quán nếu và chỉ nếu
Trong bài báo này, chúng tôi tập trung vào : nhất quán.
phương pháp thứ hai. Bài báo đề xuất một
2.2. Toán tử tích hợp trung vị
toán tử tích hợp mới và một thuật toán sử
dụng toán tử này để tiến hành tích hợp các Dựa trên công thức Bordley [1,3], Định
CSTT dạng xác suất. nghĩa sau đây phát biểu về toán tử tích hợp
trung vị theo hệ số của hai giá trị xác suất
2. NỘI DUNG trong hai RBXS mà chúng tương đương về
2.1. Một số khái niệm cấu trúc, trong đó mỗi RBXS thuộc một
CSTT xác suất.
Tập hợp tất cả các kết quả của một phép 1c
Đặt c 1 , c 1
c
thử ngẫu nhiên được gọi là không gian mẫu
64
Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8
Định nghĩa 5. [3] Cho , , Theo Định lý 2, toán tử tích hợp thỏa
, F|G 1 1 ; F|G 2 2 .
1 , 2 mãn tính chất MVP nên dễ dàng có được hệ
Toán tử tích hợp tích hợp trung vị của hai quả sau:
giá trị xác suất 1, 2 trong hai RBXS thỏa mãn Hệ quả 1.
các tính chất sau:
(CMT)-Giao hoán (Commutativity). Hệ quả 1 đảm bảo rằng giá trị xác suất của
(1, 2) = (2, 1) RBSX mới là giá trị trung bình. Do đó, CSTT
(IDP) -Lũy đẳng (Idempotence). xác suất sau khi tích hợp sẽ phản ánh mức
(1, 2) = 1 trung bình của các CSTT xác suất ban đầu.
(MVP)- Giá trị trung vị (Mean Value
2.3. Thuật toán đề xuất
Property). If 1 < 2 thì
1 < (1, 2) < 2 Thuật toán đề xuất sau đây được sử dụng
(SFS)- Tự đối xứng (Self-Symmetry). để tích hợp các CSTT xác suất trong một hồ
(1, 1 1) = 0.5 sơ TTXS nhất quán thành một CSTT xác suất
(SM)-Đối xứng (Symmetry). nhất quán dựa trên toán tử tích hợp trung vị
(1 1, 1 2) = 1 (1, 2) hợp trung vị theo hệ số .
Định nghĩa 6. Cho , , 1 , 2 , Thuật toán 1. NewBordley
Input: , và toán tử
F|G 1 1 ; F|G 2 2 . Khi đó, Output: *
RBXS F|G [ c(1, 2)]* . Trong đó, 1: 0 ;
c(1,
...