![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Bài giảng An toàn cơ sở dữ liệu: Chương 4 - Trần Thị Lượng
Số trang: 121
Loại file: pdf
Dung lượng: 2.05 MB
Lượt xem: 19
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Chương 4 đề cập đến an toàn cơ sở dữ liệu thống kê. Trong chương này chúng ta sẽ đi sâu vào các vấn đề suy diễn trên các CSDL thống kê, thảo luận một số kỹ thuật bảo vệ cơ bản, đánh giá chung về đặc trưng của các kỹ thuật nói tên. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Bài giảng An toàn cơ sở dữ liệu: Chương 4 - Trần Thị Lượng CHƯƠNG 4 AN TOÀN CSDL THỐNG KÊ Giảng viên: Trần Thị Lượng Mục tiêu Chúng ta đi sâu vào các vấn đề suy diễn trên các CSDL thống kê. Thảo luận một số kỹ thuật bảo vệ cơ bản: Kỹ thuật dựa vào khái niệm Kỹ thuật dựa vào hạn chế Kỹ thuật dựa vào gây nhiễu Đánh giá chung về đặc trưng của các kỹ thuật này. Nội dung 4.1 Giới thiệu 4.2 Các khái niệm cơ bản và giả định 4.3 Một số kiểu tấn công suy diễn 4.4 Các kỹ thuật chống suy diễn 4.4.1 Các kỹ thuật khái niệm 4.4.2 Các kỹ thuật dựa vào hạn chế 4.4.3 Các kỹ thuật dựa vào gây nhiễu 4.5 Khung làm việc chung dành cho việc so sánh các kỹ thuật chống suy diễn 4.1 Giới thiệu CSDL thống kê (SDB) là một CSDL chứa các bản ghi nhạy cảm mô tả về các cá nhân nhưng chỉ các câu truy vấn thống kê (như: COUNT, SUM, MEAN, MAX, MIN…) mới được trả lời, ngoài các câu truy vấn này thì những truy vấn vào các mục dữ liệu riêng sẽ không được đáp lại Ví dụ một số câu truy vấn thống kê COUNT: Select count(*) from Nhanvien (Trả lại tổng số lượng các bg trong table) Select count(Luong) AS count_Luong from Nhanvien Select count(Distinct Luong) from Nhanvien (Trả lại số lượng các loại lương phân biệt nhau) select count(*) from nhanvien where Luong Ví dụ một số câu truy vấn thống kê SUM: Select SUM(Luong) as sum_Luong from Nhanvien Select SUM(Distinct Luong) as sum_Luong from Nhanvien Select Chucvu, Sum(Luong) from Nhanvien GROUP BY chucvu Select HoTen, chucvu, Luong from nhanvien ORDER by chucvu Compute SUM(Luong) by chucvu (Thêm cột tổng lương với từng kiểu chức vụ) Ví dụ một số câu truy vấn thống kê AVG: Select AVG(Luong) AS avg_Luong from Nhanvien Select AVG(Luong) AS avg_Luong from Nhanvien where Luong>1000 Select AVG(distinct Luong) AS avg_Luong from Nhanvien Select chucvu, AVG(Luong) as avg_Luong, SUM(Luong) as sum_luong from Nhanvien Group by chucvu Order by chucvu Ví dụ một số câu truy vấn thống kê MIN: Select MIN(Luong) from Nhanvien Select MIN(Distinct Luong) from Nhanvien MAX Select MAX(Distinct Luong) from Nhanvien Select MAX(Luong) from Nhanvien 4.1 Giới thiệu Ứng dụng của SDB (Statistical Database): CSDL điều tra dân số, CSDL về số người tử vong, về kế hoạch kinh tế, CSDL thống kê về khám chữa bệnh, CSDL về các vụ tai nạn ô tô, CSDL về công nhân, CSDL thống kê về tội phạm… Ví dụ: 4.1 Giới thiệu Vấn đề bảo vệ SDB: Vấn đề chính trong bảo vệ SDB là dàn xếp giữa các yêu cầu cá nhân và quyền của các tổ chức để biết và xử lý thông tin => vấn đề suy diễn trong SDB. Suy diễn: trong một SDB có nghĩa là có thể thu được các thông tin bí mật trong các thực thể đơn lẻ, bằng cách lợi dụng các câu truy vấn thống kê. 4.1 Giới thiệu Một SDB chắc chắn bị lộ: nếu người sử dụng phát hiện được một cá nhân có một đặc điểm cụ thể nào đó, nghĩa là người dùng biết cá nhân này được biểu diễn trong SDB có một số giá trị thuộc tính nào đó. Một SDB hoàn toàn không bị lộ: nếu người sử dụng biết được một cá nhân cụ thể không nắm giữ một đặc điểm nào đó. 4.1 Giới thiệu Các đặc tính của SDB cần được bảo vệ: SDB tĩnh: SDB không thay đổi trong suốt thời gian tồn tại của chúng. SDB động: thay đổi liên tục theo sự thay đổi của dữ liệu thực, cho phép sửa đổi, nghĩa là được phép chèn hoặc xoá các thực thể để phản ánh các thay đổi động của thế giới thực (ví dụ các CSDL nghiên cứu trực tuyến, lớp học trực tuyến khi bổ sung thành viên,…). 4.1 Giới thiệu SDB trực tuyến (online): trong đó người sử dụng nhận được các phản hồi thời gian thực cho các câu truy vấn thống kê của mình. SDB ngoại tuyến (offline): trong đó người sử dụng không biết khi nào các thống kê của họ được xử lý, việc SDB bị lộ sẽ khó khăn. 4.1 Giới thiệu Kiến thức làm việc (working knowledge) là tập các mục thông tin liên quan đến các giá trị thuộc tính trong SDB và các kiểu thống kê có sẵn trong SDB Kiến thức bổ sung của người sử dụng (sumplementary knowledge): Người sử dụng có thể có kiến thức bổ sung về các cá nhân được biểu diễn trong SDB. Họ hoàn toàn có thể lợi dụng kiến thức này cho các mục đích suy diễn. Mô hình làm lộ SDB Ví dụ về làm lộ một SDB Ví dụ 1 (lộ chính xác) Ví dụ 2 (lộ xấp xỉ) Ví dụ 2 Nội dung 4.1 Giới thiệu 4.2 Các khái niệm cơ bản và giả định 4.3 Một số kiểu tấn công suy diễn 4.4 Các kỹ thuật chống suy diễn 4.4.1 Các kỹ thuật khái niệm 4.4.2 Các kỹ thuật dựa vào hạn chế 4.4.3 Các kỹ thuật dựa vào gây nhiễu 4.5 Khung làm việc chung dành cho việc so sánh các kỹ thuật chống suy diễn 4.2 Các khái niệm cơ bản và các giả định CSDL thống kê (SDB): ta xem xét cấu trúc của một SDB là một dạng quan hệ, giả sử là R. N là số bản ghi: Xi là bản ghi thứ i M là số thuộc tính: A1, A2, …, AM Xij là giá trị của thuộc tính Aj trong bản ghi xi Mỗi thuộc tính Aj (1 j M) có thể có |Aj | giá trị. ...
Nội dung trích xuất từ tài liệu:
Bài giảng An toàn cơ sở dữ liệu: Chương 4 - Trần Thị Lượng CHƯƠNG 4 AN TOÀN CSDL THỐNG KÊ Giảng viên: Trần Thị Lượng Mục tiêu Chúng ta đi sâu vào các vấn đề suy diễn trên các CSDL thống kê. Thảo luận một số kỹ thuật bảo vệ cơ bản: Kỹ thuật dựa vào khái niệm Kỹ thuật dựa vào hạn chế Kỹ thuật dựa vào gây nhiễu Đánh giá chung về đặc trưng của các kỹ thuật này. Nội dung 4.1 Giới thiệu 4.2 Các khái niệm cơ bản và giả định 4.3 Một số kiểu tấn công suy diễn 4.4 Các kỹ thuật chống suy diễn 4.4.1 Các kỹ thuật khái niệm 4.4.2 Các kỹ thuật dựa vào hạn chế 4.4.3 Các kỹ thuật dựa vào gây nhiễu 4.5 Khung làm việc chung dành cho việc so sánh các kỹ thuật chống suy diễn 4.1 Giới thiệu CSDL thống kê (SDB) là một CSDL chứa các bản ghi nhạy cảm mô tả về các cá nhân nhưng chỉ các câu truy vấn thống kê (như: COUNT, SUM, MEAN, MAX, MIN…) mới được trả lời, ngoài các câu truy vấn này thì những truy vấn vào các mục dữ liệu riêng sẽ không được đáp lại Ví dụ một số câu truy vấn thống kê COUNT: Select count(*) from Nhanvien (Trả lại tổng số lượng các bg trong table) Select count(Luong) AS count_Luong from Nhanvien Select count(Distinct Luong) from Nhanvien (Trả lại số lượng các loại lương phân biệt nhau) select count(*) from nhanvien where Luong Ví dụ một số câu truy vấn thống kê SUM: Select SUM(Luong) as sum_Luong from Nhanvien Select SUM(Distinct Luong) as sum_Luong from Nhanvien Select Chucvu, Sum(Luong) from Nhanvien GROUP BY chucvu Select HoTen, chucvu, Luong from nhanvien ORDER by chucvu Compute SUM(Luong) by chucvu (Thêm cột tổng lương với từng kiểu chức vụ) Ví dụ một số câu truy vấn thống kê AVG: Select AVG(Luong) AS avg_Luong from Nhanvien Select AVG(Luong) AS avg_Luong from Nhanvien where Luong>1000 Select AVG(distinct Luong) AS avg_Luong from Nhanvien Select chucvu, AVG(Luong) as avg_Luong, SUM(Luong) as sum_luong from Nhanvien Group by chucvu Order by chucvu Ví dụ một số câu truy vấn thống kê MIN: Select MIN(Luong) from Nhanvien Select MIN(Distinct Luong) from Nhanvien MAX Select MAX(Distinct Luong) from Nhanvien Select MAX(Luong) from Nhanvien 4.1 Giới thiệu Ứng dụng của SDB (Statistical Database): CSDL điều tra dân số, CSDL về số người tử vong, về kế hoạch kinh tế, CSDL thống kê về khám chữa bệnh, CSDL về các vụ tai nạn ô tô, CSDL về công nhân, CSDL thống kê về tội phạm… Ví dụ: 4.1 Giới thiệu Vấn đề bảo vệ SDB: Vấn đề chính trong bảo vệ SDB là dàn xếp giữa các yêu cầu cá nhân và quyền của các tổ chức để biết và xử lý thông tin => vấn đề suy diễn trong SDB. Suy diễn: trong một SDB có nghĩa là có thể thu được các thông tin bí mật trong các thực thể đơn lẻ, bằng cách lợi dụng các câu truy vấn thống kê. 4.1 Giới thiệu Một SDB chắc chắn bị lộ: nếu người sử dụng phát hiện được một cá nhân có một đặc điểm cụ thể nào đó, nghĩa là người dùng biết cá nhân này được biểu diễn trong SDB có một số giá trị thuộc tính nào đó. Một SDB hoàn toàn không bị lộ: nếu người sử dụng biết được một cá nhân cụ thể không nắm giữ một đặc điểm nào đó. 4.1 Giới thiệu Các đặc tính của SDB cần được bảo vệ: SDB tĩnh: SDB không thay đổi trong suốt thời gian tồn tại của chúng. SDB động: thay đổi liên tục theo sự thay đổi của dữ liệu thực, cho phép sửa đổi, nghĩa là được phép chèn hoặc xoá các thực thể để phản ánh các thay đổi động của thế giới thực (ví dụ các CSDL nghiên cứu trực tuyến, lớp học trực tuyến khi bổ sung thành viên,…). 4.1 Giới thiệu SDB trực tuyến (online): trong đó người sử dụng nhận được các phản hồi thời gian thực cho các câu truy vấn thống kê của mình. SDB ngoại tuyến (offline): trong đó người sử dụng không biết khi nào các thống kê của họ được xử lý, việc SDB bị lộ sẽ khó khăn. 4.1 Giới thiệu Kiến thức làm việc (working knowledge) là tập các mục thông tin liên quan đến các giá trị thuộc tính trong SDB và các kiểu thống kê có sẵn trong SDB Kiến thức bổ sung của người sử dụng (sumplementary knowledge): Người sử dụng có thể có kiến thức bổ sung về các cá nhân được biểu diễn trong SDB. Họ hoàn toàn có thể lợi dụng kiến thức này cho các mục đích suy diễn. Mô hình làm lộ SDB Ví dụ về làm lộ một SDB Ví dụ 1 (lộ chính xác) Ví dụ 2 (lộ xấp xỉ) Ví dụ 2 Nội dung 4.1 Giới thiệu 4.2 Các khái niệm cơ bản và giả định 4.3 Một số kiểu tấn công suy diễn 4.4 Các kỹ thuật chống suy diễn 4.4.1 Các kỹ thuật khái niệm 4.4.2 Các kỹ thuật dựa vào hạn chế 4.4.3 Các kỹ thuật dựa vào gây nhiễu 4.5 Khung làm việc chung dành cho việc so sánh các kỹ thuật chống suy diễn 4.2 Các khái niệm cơ bản và các giả định CSDL thống kê (SDB): ta xem xét cấu trúc của một SDB là một dạng quan hệ, giả sử là R. N là số bản ghi: Xi là bản ghi thứ i M là số thuộc tính: A1, A2, …, AM Xij là giá trị của thuộc tính Aj trong bản ghi xi Mỗi thuộc tính Aj (1 j M) có thể có |Aj | giá trị. ...
Tìm kiếm theo từ khóa liên quan:
An toàn cơ sở dữ liệu Bài giảng An toàn cơ sở dữ liệu Cơ sở dữ liệu An toàn cơ sở dữ liệu thống kê Tấn công suy diễn Kỹ thuật chống suy diễnTài liệu liên quan:
-
62 trang 405 3 0
-
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 380 6 0 -
13 trang 306 0 0
-
Giáo trình Cơ sở dữ liệu: Phần 2 - TS. Nguyễn Hoàng Sơn
158 trang 302 0 0 -
Phân tích thiết kế hệ thống - Biểu đồ trạng thái
20 trang 296 0 0 -
Tài liệu học tập Tin học văn phòng: Phần 2 - Vũ Thu Uyên
85 trang 265 1 0 -
Đề cương chi tiết học phần Quản trị cơ sở dữ liệu (Database Management Systems - DBMS)
14 trang 251 0 0 -
Giáo trình về dữ liệu và các mô hình cơ sở dữ liệu
62 trang 198 0 0 -
8 trang 188 0 0
-
Giáo trình Cơ sở dữ liệu: Phần 2 - Đại học Kinh tế TP. HCM
115 trang 183 0 0