Tóm tắt Luận án tiến sĩ Toán học: Cải tiến một số thuật toán trong miễn dịch nhân tạo cho phát hiện xâm nhập mạng
Số trang: 26
Loại file: pdf
Dung lượng: 457.26 KB
Lượt xem: 5
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận án nghiên cứu các thuật toán tối ưu để sinh bộ dò theo nghĩa tốc độ thực hiện nhanh cả về huấn luyện và kiểm tra. Nghiên cứu và đề xuất mô hình hệ phát hiện xâm nhập mạng dựa trên hệ miễn dịch nhân tạo để phát hiện tấn công, cả loại đã biết và chưa biết. Hệ thống được xây dựng này có sử dụng hệ miễn dịch nhân tạo kết hợp với thống kê dựa trên dữ liệu định dạng flow.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án tiến sĩ Toán học: Cải tiến một số thuật toán trong miễn dịch nhân tạo cho phát hiện xâm nhập mạngBỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ……..….***………… NGUYỄN VĂN TRƯỜNG CẢI TIẾN MỘT SỐ THUẬT TOÁN TRONG MIỄN DỊCH NHÂN TẠO CHO PHÁT HIỆN XÂM NHẬP MẠNG Chuyên ngành: Cơ sở Toán học cho Tin học Mã số: 62 46 01 10 TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội – 2019Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ -Viện Hàn lâm Khoa học và Công nghệ Việt NamNgười hướng dẫn khoa học 1: PGS. TS Nguyễn Xuân HoàiNgười hướng dẫn khoa học 2: PGS. TS Lương Chi MaiPhản biện 1: …Phản biện 2: …Phản biện 3: ….Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Họcviện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệViệt Nam vào hồi … giờ ..’, ngày … tháng … năm 201….Có thể tìm hiểu luận án tại:- Thư viện Học viện Khoa học và Công nghệ- Thư viện Quốc gia Việt Nam 1MỞ ĐẦUTính cấp thiết của luận án Mạng máy tính phải đối mặt với rất nhiều tấn công. Để đảm bảo an toàn, cầnthiết phải có hệ thống kiểm soát an ninh, chẳng hạn như hệ thống phát hiện xâm nhập(Intrusion Detection Systems, IDS). Tuy vậy, việc phát hiện xâm nhập lại phải đối phóvới rất nhiều vấn đề như lưu lượng mạng lớn, phân bố dữ liệu không cân bằng, khó nhậnbiết ranh giới giữa hành vi bình thường và hành vi bất thường, và yêu cầu thích nghithường xuyên với môi trường thay đổi. Hệ quả là các nhà nghiên cứu đã nỗ lực sử dụngnhiều phương pháp khác nhau để xây dựng các hệ IDS tin cậy. Một trong những phương pháp dựa trên trí tuệ tính toán cho phát hiện xâm nhậpnổi trội gần đây là hệ miễn dịch nhân tạo (AIS), có nguồn gốc từ hệ miễn dịch sinh học. Thuật toán chọn lọc âm tính (NSA) của AIS, được sử dụng nhiều trong các IDSs.Dù cho đã có những ứng dụng thành công, nhưng NSA có một vài điểm yếu: 1-Tỉ lệ lỗidương tính và lỗi âm tính còn cao, 2-Thời gian huấn luyện và kiểm tra còn cao, 3-Có mốiquan hệ theo hàm mũ giữa kích thước dữ liệu huấn luyện và số lượng bộ dò có thể đượcsinh ra cho kiểm tra, 4- Khó phân biệt được hai khái niệm “dữ liệu bình thường” với “dữliệu bất thường” trong môi trường mạng. Để giải quyết được những hạn chế ấy, các xuhướng nghiên cứu gần đây tập trung theo hướng giải quyết vấn đề cấu trúc phức tạp củabộ dò miễn dịch, phương pháp so khớp và các hệ AIS lai.Mục đích nghiên cứu Do việc biểu diễn dữ liệu là một nhân tố quan trọng ảnh hưởng đến thời gian huấnluyện và kiểm tra, nên đề tài luận án hướng đến sinh tập bộ dò đầy đủ và thu gọn. Luận án nghiên cứu các thuật toán tối ưu để sinh bộ dò theo nghĩa tốc độ thực hiệnnhanh cả về huấn luyện và kiểm tra. Nghiên cứu và đề xuất mô hình hệ phát hiện xâm nhập mạng dựa trên hệ miễn dịchnhân tạo để phát hiện tấn công, cả loại đã biết và chưa biết. Hệ thống được xây dựngnày có sử dụng hệ miễn dịch nhân tạo kết hợp với thống kê dựa trên dữ liệu định dạngflow.Mô tả bài toán Luận án tập trung nghiên cứu ba bài toán: Bài toán 1: Tìm dạng biểu diễn thu gọn 2cho dữ liệu nhằm không chỉ cực tiểu hóa bộ nhớ lưu trữ dữ liệu mà còn giảm thời gianphát hiện. Bài toán 2: Đề xuất thuật toán giảm thời gian huấn luyện so với các công trìnhđã công bố. Bài toán 3: Cải tiến hiệu suất phát hiện theo hướng giảm lỗi cảnh báo saitrong khi vẫn giữ được tỉ lệ phát hiện và độ chính xác cao nhất có thể. Vấn đế tìm ra một thuật toán tối ưu có thể vừa giảm được độ phức tạp thời gian,bộ nhớ vừa có hiệu suất phát hiện tốt nhất là không khả thi. Những khía cạnh đó luônmâu thuẫn với nhau. Do vậy, trong mỗi chương chúng tôi chỉ tập trung giải quyết mộtbài toán tương đối độc lập. Bài toán phát hiện xâm nhập trong luận án có thể được phát biểu không hình thứcnhư sau: Cho trước tập hữu hạn các luồng mạng S có gắn nhãn là self (bình thường) haynonself (bất thường). Mục tiêu là xây dựng mô hình phân lớp trên S có khả năng phânlớp một luồng không gắn nhãn s.Tổng quan về luận án Chương đầu tiên giới thiệu kiến thức nền tảng cần thiết cho các giải thuật sẽ đượctrình bày ở các chương kế tiếp. Chương 2 trình bày về kết hợp thuật toán chọn lọc. Kỹ thuật đưa ra nhằm giảm bộnhớ lưu trữ các bộ dò trong giai đoạn huấn luyện. Do bộ nhớ này giảm, nên hệ quả tấtyếu là thời gian kiểm tra cũng giảm đi. Cấu trúc cây được sử dụng để cải thiện độ phứctạp thời gian và bộ nhớ. Tập bộ dò đầy đủ và không dư thừa là cần thiết để đạt được khả năng bao phủ chấpnhận được của bộ phân lớp cho seft và nonself. Một thuật toán sinh tập bộ dò như vậyđược đề xuất trong chương 3. Chương 4 bao gồm hai thuật toán chọn lọc cho huấn luyện nhanh. Các thuật toántối ưu có thể sinh tập bộ dò trong thời gian tuyến tính với kích thước dữ liệu huấn luyện.Về mặt thời gian phát hiện, thuật toán thứ nhất và thuật toán thứ hai có độ phức tạplần lượt là tuyến tính và đa thức. Chương 5 giới thiệu về một cách tiếp cận lai của thuật toán chọn lọc với thống kê.Tần suất của dữ liệu seft và nonself được lưu trong lá của cấu trúc cây biểu diễn bộ dò.Phương pháp này đóng vai trò quan trọng trong cải tiến hiệu suất của thuật toán. Cáchtiếp cận lai này có thể được coi như kỹ thuật phân loại hai lớp được huấn luyện dựa trêndữ liệu thuộc cả hai loại là seft và nonself. 3Chương 1KIẾN THỨC CHUẨN BỊ1.1 Hệ miễn dịch ngườiHệ miễn dịch con người là một kiến trúc bảo vệ nhiều tầng, bao gồm tầng vật lý, tầngsinh lý và hệ miễn dịch (thích nghi và bẩm sinh). Hệ miễn dịch thích nghi có khả năngnhận diện các tác nhân gây bệnh, và ghi nhớ chúng để tăng khả năng phản ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án tiến sĩ Toán học: Cải tiến một số thuật toán trong miễn dịch nhân tạo cho phát hiện xâm nhập mạngBỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ……..….***………… NGUYỄN VĂN TRƯỜNG CẢI TIẾN MỘT SỐ THUẬT TOÁN TRONG MIỄN DỊCH NHÂN TẠO CHO PHÁT HIỆN XÂM NHẬP MẠNG Chuyên ngành: Cơ sở Toán học cho Tin học Mã số: 62 46 01 10 TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội – 2019Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ -Viện Hàn lâm Khoa học và Công nghệ Việt NamNgười hướng dẫn khoa học 1: PGS. TS Nguyễn Xuân HoàiNgười hướng dẫn khoa học 2: PGS. TS Lương Chi MaiPhản biện 1: …Phản biện 2: …Phản biện 3: ….Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Họcviện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệViệt Nam vào hồi … giờ ..’, ngày … tháng … năm 201….Có thể tìm hiểu luận án tại:- Thư viện Học viện Khoa học và Công nghệ- Thư viện Quốc gia Việt Nam 1MỞ ĐẦUTính cấp thiết của luận án Mạng máy tính phải đối mặt với rất nhiều tấn công. Để đảm bảo an toàn, cầnthiết phải có hệ thống kiểm soát an ninh, chẳng hạn như hệ thống phát hiện xâm nhập(Intrusion Detection Systems, IDS). Tuy vậy, việc phát hiện xâm nhập lại phải đối phóvới rất nhiều vấn đề như lưu lượng mạng lớn, phân bố dữ liệu không cân bằng, khó nhậnbiết ranh giới giữa hành vi bình thường và hành vi bất thường, và yêu cầu thích nghithường xuyên với môi trường thay đổi. Hệ quả là các nhà nghiên cứu đã nỗ lực sử dụngnhiều phương pháp khác nhau để xây dựng các hệ IDS tin cậy. Một trong những phương pháp dựa trên trí tuệ tính toán cho phát hiện xâm nhậpnổi trội gần đây là hệ miễn dịch nhân tạo (AIS), có nguồn gốc từ hệ miễn dịch sinh học. Thuật toán chọn lọc âm tính (NSA) của AIS, được sử dụng nhiều trong các IDSs.Dù cho đã có những ứng dụng thành công, nhưng NSA có một vài điểm yếu: 1-Tỉ lệ lỗidương tính và lỗi âm tính còn cao, 2-Thời gian huấn luyện và kiểm tra còn cao, 3-Có mốiquan hệ theo hàm mũ giữa kích thước dữ liệu huấn luyện và số lượng bộ dò có thể đượcsinh ra cho kiểm tra, 4- Khó phân biệt được hai khái niệm “dữ liệu bình thường” với “dữliệu bất thường” trong môi trường mạng. Để giải quyết được những hạn chế ấy, các xuhướng nghiên cứu gần đây tập trung theo hướng giải quyết vấn đề cấu trúc phức tạp củabộ dò miễn dịch, phương pháp so khớp và các hệ AIS lai.Mục đích nghiên cứu Do việc biểu diễn dữ liệu là một nhân tố quan trọng ảnh hưởng đến thời gian huấnluyện và kiểm tra, nên đề tài luận án hướng đến sinh tập bộ dò đầy đủ và thu gọn. Luận án nghiên cứu các thuật toán tối ưu để sinh bộ dò theo nghĩa tốc độ thực hiệnnhanh cả về huấn luyện và kiểm tra. Nghiên cứu và đề xuất mô hình hệ phát hiện xâm nhập mạng dựa trên hệ miễn dịchnhân tạo để phát hiện tấn công, cả loại đã biết và chưa biết. Hệ thống được xây dựngnày có sử dụng hệ miễn dịch nhân tạo kết hợp với thống kê dựa trên dữ liệu định dạngflow.Mô tả bài toán Luận án tập trung nghiên cứu ba bài toán: Bài toán 1: Tìm dạng biểu diễn thu gọn 2cho dữ liệu nhằm không chỉ cực tiểu hóa bộ nhớ lưu trữ dữ liệu mà còn giảm thời gianphát hiện. Bài toán 2: Đề xuất thuật toán giảm thời gian huấn luyện so với các công trìnhđã công bố. Bài toán 3: Cải tiến hiệu suất phát hiện theo hướng giảm lỗi cảnh báo saitrong khi vẫn giữ được tỉ lệ phát hiện và độ chính xác cao nhất có thể. Vấn đế tìm ra một thuật toán tối ưu có thể vừa giảm được độ phức tạp thời gian,bộ nhớ vừa có hiệu suất phát hiện tốt nhất là không khả thi. Những khía cạnh đó luônmâu thuẫn với nhau. Do vậy, trong mỗi chương chúng tôi chỉ tập trung giải quyết mộtbài toán tương đối độc lập. Bài toán phát hiện xâm nhập trong luận án có thể được phát biểu không hình thứcnhư sau: Cho trước tập hữu hạn các luồng mạng S có gắn nhãn là self (bình thường) haynonself (bất thường). Mục tiêu là xây dựng mô hình phân lớp trên S có khả năng phânlớp một luồng không gắn nhãn s.Tổng quan về luận án Chương đầu tiên giới thiệu kiến thức nền tảng cần thiết cho các giải thuật sẽ đượctrình bày ở các chương kế tiếp. Chương 2 trình bày về kết hợp thuật toán chọn lọc. Kỹ thuật đưa ra nhằm giảm bộnhớ lưu trữ các bộ dò trong giai đoạn huấn luyện. Do bộ nhớ này giảm, nên hệ quả tấtyếu là thời gian kiểm tra cũng giảm đi. Cấu trúc cây được sử dụng để cải thiện độ phứctạp thời gian và bộ nhớ. Tập bộ dò đầy đủ và không dư thừa là cần thiết để đạt được khả năng bao phủ chấpnhận được của bộ phân lớp cho seft và nonself. Một thuật toán sinh tập bộ dò như vậyđược đề xuất trong chương 3. Chương 4 bao gồm hai thuật toán chọn lọc cho huấn luyện nhanh. Các thuật toántối ưu có thể sinh tập bộ dò trong thời gian tuyến tính với kích thước dữ liệu huấn luyện.Về mặt thời gian phát hiện, thuật toán thứ nhất và thuật toán thứ hai có độ phức tạplần lượt là tuyến tính và đa thức. Chương 5 giới thiệu về một cách tiếp cận lai của thuật toán chọn lọc với thống kê.Tần suất của dữ liệu seft và nonself được lưu trong lá của cấu trúc cây biểu diễn bộ dò.Phương pháp này đóng vai trò quan trọng trong cải tiến hiệu suất của thuật toán. Cáchtiếp cận lai này có thể được coi như kỹ thuật phân loại hai lớp được huấn luyện dựa trêndữ liệu thuộc cả hai loại là seft và nonself. 3Chương 1KIẾN THỨC CHUẨN BỊ1.1 Hệ miễn dịch ngườiHệ miễn dịch con người là một kiến trúc bảo vệ nhiều tầng, bao gồm tầng vật lý, tầngsinh lý và hệ miễn dịch (thích nghi và bẩm sinh). Hệ miễn dịch thích nghi có khả năngnhận diện các tác nhân gây bệnh, và ghi nhớ chúng để tăng khả năng phản ...
Tìm kiếm theo từ khóa liên quan:
Luận án tiến sĩ Luận án tiến sĩ Toán học Cơ sở Toán học cho Tin học Cơ sở Toán học Mạng máy tínhGợi ý tài liệu liên quan:
-
205 trang 410 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 375 1 0 -
206 trang 298 2 0
-
174 trang 294 0 0
-
228 trang 258 0 0
-
Giáo án Tin học lớp 9 (Trọn bộ cả năm)
149 trang 243 0 0 -
Ngân hàng câu hỏi trắc nghiệm môn mạng máy tính
99 trang 235 1 0 -
47 trang 232 3 0
-
Đề cương chi tiết học phần Thiết kế và cài đặt mạng
3 trang 227 0 0 -
Giáo trình Hệ thống mạng máy tính CCNA (Tập 4): Phần 2
102 trang 226 0 0