BÁO CÁO ỨNG DỤNG MẠNG NEURON NHÂN TẠO ĐỂ NHẬN DẠNG TỆP THỰC THI GIẢ THƯ MỤC
Số trang: 5
Loại file: pdf
Dung lượng: 348.11 KB
Lượt xem: 12
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Virus máy tính xuất hiện và lây lan ngày càng nhiều. Một tỉ lệ không nhỏ virus đánh lừa người dùng kích hoạt bằng cách giả dạng thư mục. Các chương trình chống virus hiện nay đều nhận dạng chủ yếu dựa trên mã đặc trưng hoặc hành vi của tệp. Trong bài báo này, tác giả đề xuất phương pháp mới, sử dụng mạng Neuron để nhận dạng các tệp thực thi giả thư mục dựa trên việc nhận dạng biểu tượng của tệp. Tác giả đã thử nghiệm giải pháp đề xuất với lượng lớn mẫu virus giả...
Nội dung trích xuất từ tài liệu:
BÁO CÁO " ỨNG DỤNG MẠNG NEURON NHÂN TẠO ĐỂ NHẬN DẠNG TỆP THỰC THI GIẢ THƯ MỤC " Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012 ỨNG DỤNG MẠNG NEURON NHÂN TẠO ĐỂ NHẬN DẠNG TỆP THỰC THI GIẢ THƯ MỤC FAKE FOLDER EXECUTABLE FILE RECOGNITION USING ARTIFICIAL NEURAL NETWORK SVTH: Nguyễn Trọng Nguyên Lớp 07T3, Khoa Công Nghệ Thông Tin, Trường Đại học Bách khoa, Đại học Đà Nẵng GVHD: TS. Huỳnh Hữu Hưng Khoa Công Nghệ Thông Tin, Trường Đại học Bách khoa, Đại học Đà Nẵng TÓM TẮT Virus máy tính xuất hiện và lây lan ngày càng nhiều. Một tỉ lệ không nhỏ virus đánh lừa người dùngkích hoạt bằng cách giả dạng thư mục. Các chương trình chống virus hiện nay đều nhận dạng chủ yếu dựatrên mã đặc trưng hoặc hành vi của tệp. Trong bài báo này, tác giả đề xuất phương pháp mới, sử dụngmạng Neuron để nhận dạng các tệp thực thi giả thư mục dựa trên việc nhận dạng biểu tượng của tệp . Tácgiả đã thử nghiệm giải pháp đề xuất với lượng lớn mẫu virus giả thư mục (70 mẫu) thu thập được thực tếvà kết quả thử nghiệm cho độ chính xác cao, hơn 99.8%. ABSTRACT Computer viruses appear and infect more and more . Some viruses cheat users by masqueradingfolder. Most of current antiviruses are based on specific code identification or behavior. This plan introducesanother method which identify fake folder executable file, using Artificial Neural Network technology. Theproposed solution is tested with 70 fake folder virus samples, with high accuracy (more than 99.8%).1. Mở đầu Mạng neuron nhân tạo, Artificial Neural Network (ANN), là một mô hình xử lý thông tinphỏng theo cách thức xử lý thông tin của các hệ neuron sinh học. ANN được ứng dụng rộng rãitrong lĩnh vực khoa học máy tính, cụ thể là các dạng bài toán phân lớp: dự đoán [3][5][6], nhậndạng [2][4][7][8],… ANN được tạo nên từ một lượng các phần tử (neuron) kết nối với nhau thôngqua các trọng số liên kết. Một ANN được cấu hình cho một ứng dụng cụ thể thông qua quá trìnhhọc từ tập các mẫu huấn luyện cho trước. Trong vấn đề nhận dạng tệp thực thi giả thư mục, mạng neuron tỏ ra ưu thế hơn các phươngpháp khác (so sánh ảnh biểu tượng tệp với ảnh biểu tượng mẫu có sẵn, xác định hình dạng đườngbao,…) ở chỗ tốn rất ít thời gian cho thủ tục tiền xử lý, trích trọn đặc trưng,… Bên cạnh đó,phương pháp này hầu như không bị ảnh hưởng bởi nhiễu trên ảnh biểu tượng, mang tính tổng quát.Mặt khác các phương pháp ra quyết định trong nhận dạng truyền thống được cài đặt tĩnh trongchương trình, khi muốn bổ sung thêm các mẫu học mới cần phải thiết kế lại chương trình. Trongkhi với mạng neuron, chỉ cần cung cấp một tập mẫu huấn luyện mới là có thể bổ sung vào “bộ nhớmạng” những giá trị tính toán mới mà không ảnh hưởng đến cấu trúc chương trình ban đầu. Trong phạm vi bài báo này, chúng tôi sẽ giới thiệu tổng quan về mạng neuron và ứng dụngmạng Perceptron nhiều lớp lan truyền ngược sai số để xây dựng chương trình nhận dạng tệp thựcthi giả thư mục. 1 Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 20122. Nhận dạng tệp thực thi giả thư mụcTrong phần này, tác giả trình bày về phương pháp, thuật toán nhận dạng tệp thực thi giả thư mục.Giải pháp đề xuất được xây dựng gồm các bước: (1) trích ảnh biểu tượng của tệp mẫu, (2) tínhvector đặc trưng, (3) thêm vector vào tệp input, (4) huấn luyện mạng neuron, (5) kiểm tra tệp vàkết luận. Trích ảnh biểu tượng tệp mẫu Tính vector đặc trưng Thêm các vector vào tệp input Huấn luyện mạng neuron Kiểm tra tệp & kết luận Hình 1. Các bước nhận dạng tệp thực thi giả thư mục dùng ANN.2.1. Dữ liệu đầu vào Dữ liệu ban đầu của bài toán là các biểu tượng của các ứng dụng được chọn ngẫu nhiên từcác ứng dụng, định dạng tệp phổ biến và một số mẫu virus giả thư mục thu thập được trong quátrình nghiên cứu. Dữ liệu ban đầu được chia thành 2 tập dữ liệu: Tập biểu tượng phổ biến trong hệ điều hành Microsoft Windows. - Tập biểu tượng các mẫu virus giả thư mục thu thập được. - Hình 2. Một số biểu tượng trong 2 tập dữ liệu. 2 Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 20122.2. Các bước nhận dạng2.2.1. Trích ảnh biểu tượng của tệp mẫu ...
Nội dung trích xuất từ tài liệu:
BÁO CÁO " ỨNG DỤNG MẠNG NEURON NHÂN TẠO ĐỂ NHẬN DẠNG TỆP THỰC THI GIẢ THƯ MỤC " Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012 ỨNG DỤNG MẠNG NEURON NHÂN TẠO ĐỂ NHẬN DẠNG TỆP THỰC THI GIẢ THƯ MỤC FAKE FOLDER EXECUTABLE FILE RECOGNITION USING ARTIFICIAL NEURAL NETWORK SVTH: Nguyễn Trọng Nguyên Lớp 07T3, Khoa Công Nghệ Thông Tin, Trường Đại học Bách khoa, Đại học Đà Nẵng GVHD: TS. Huỳnh Hữu Hưng Khoa Công Nghệ Thông Tin, Trường Đại học Bách khoa, Đại học Đà Nẵng TÓM TẮT Virus máy tính xuất hiện và lây lan ngày càng nhiều. Một tỉ lệ không nhỏ virus đánh lừa người dùngkích hoạt bằng cách giả dạng thư mục. Các chương trình chống virus hiện nay đều nhận dạng chủ yếu dựatrên mã đặc trưng hoặc hành vi của tệp. Trong bài báo này, tác giả đề xuất phương pháp mới, sử dụngmạng Neuron để nhận dạng các tệp thực thi giả thư mục dựa trên việc nhận dạng biểu tượng của tệp . Tácgiả đã thử nghiệm giải pháp đề xuất với lượng lớn mẫu virus giả thư mục (70 mẫu) thu thập được thực tếvà kết quả thử nghiệm cho độ chính xác cao, hơn 99.8%. ABSTRACT Computer viruses appear and infect more and more . Some viruses cheat users by masqueradingfolder. Most of current antiviruses are based on specific code identification or behavior. This plan introducesanother method which identify fake folder executable file, using Artificial Neural Network technology. Theproposed solution is tested with 70 fake folder virus samples, with high accuracy (more than 99.8%).1. Mở đầu Mạng neuron nhân tạo, Artificial Neural Network (ANN), là một mô hình xử lý thông tinphỏng theo cách thức xử lý thông tin của các hệ neuron sinh học. ANN được ứng dụng rộng rãitrong lĩnh vực khoa học máy tính, cụ thể là các dạng bài toán phân lớp: dự đoán [3][5][6], nhậndạng [2][4][7][8],… ANN được tạo nên từ một lượng các phần tử (neuron) kết nối với nhau thôngqua các trọng số liên kết. Một ANN được cấu hình cho một ứng dụng cụ thể thông qua quá trìnhhọc từ tập các mẫu huấn luyện cho trước. Trong vấn đề nhận dạng tệp thực thi giả thư mục, mạng neuron tỏ ra ưu thế hơn các phươngpháp khác (so sánh ảnh biểu tượng tệp với ảnh biểu tượng mẫu có sẵn, xác định hình dạng đườngbao,…) ở chỗ tốn rất ít thời gian cho thủ tục tiền xử lý, trích trọn đặc trưng,… Bên cạnh đó,phương pháp này hầu như không bị ảnh hưởng bởi nhiễu trên ảnh biểu tượng, mang tính tổng quát.Mặt khác các phương pháp ra quyết định trong nhận dạng truyền thống được cài đặt tĩnh trongchương trình, khi muốn bổ sung thêm các mẫu học mới cần phải thiết kế lại chương trình. Trongkhi với mạng neuron, chỉ cần cung cấp một tập mẫu huấn luyện mới là có thể bổ sung vào “bộ nhớmạng” những giá trị tính toán mới mà không ảnh hưởng đến cấu trúc chương trình ban đầu. Trong phạm vi bài báo này, chúng tôi sẽ giới thiệu tổng quan về mạng neuron và ứng dụngmạng Perceptron nhiều lớp lan truyền ngược sai số để xây dựng chương trình nhận dạng tệp thựcthi giả thư mục. 1 Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 20122. Nhận dạng tệp thực thi giả thư mụcTrong phần này, tác giả trình bày về phương pháp, thuật toán nhận dạng tệp thực thi giả thư mục.Giải pháp đề xuất được xây dựng gồm các bước: (1) trích ảnh biểu tượng của tệp mẫu, (2) tínhvector đặc trưng, (3) thêm vector vào tệp input, (4) huấn luyện mạng neuron, (5) kiểm tra tệp vàkết luận. Trích ảnh biểu tượng tệp mẫu Tính vector đặc trưng Thêm các vector vào tệp input Huấn luyện mạng neuron Kiểm tra tệp & kết luận Hình 1. Các bước nhận dạng tệp thực thi giả thư mục dùng ANN.2.1. Dữ liệu đầu vào Dữ liệu ban đầu của bài toán là các biểu tượng của các ứng dụng được chọn ngẫu nhiên từcác ứng dụng, định dạng tệp phổ biến và một số mẫu virus giả thư mục thu thập được trong quátrình nghiên cứu. Dữ liệu ban đầu được chia thành 2 tập dữ liệu: Tập biểu tượng phổ biến trong hệ điều hành Microsoft Windows. - Tập biểu tượng các mẫu virus giả thư mục thu thập được. - Hình 2. Một số biểu tượng trong 2 tập dữ liệu. 2 Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 20122.2. Các bước nhận dạng2.2.1. Trích ảnh biểu tượng của tệp mẫu ...
Tìm kiếm theo từ khóa liên quan:
MẠNG NEURON NHÂN TẠO tuyển tập báo cáo nghiên cứu khoa học đề tài nghiên cứu chuyên ngành khoa học công nghệ môi trường kỹ thuật khao họcTài liệu liên quan:
-
Đề tài nghiên cứu khoa học: Kỹ năng quản lý thời gian của sinh viên trường Đại học Nội vụ Hà Nội
80 trang 1557 4 0 -
Tiểu luận: Phương pháp Nghiên cứu Khoa học trong kinh doanh
27 trang 498 0 0 -
57 trang 343 0 0
-
33 trang 334 0 0
-
Tiểu luận môn Phương Pháp Nghiên Cứu Khoa Học Thiên văn vô tuyến
105 trang 274 0 0 -
95 trang 271 1 0
-
Phương pháp nghiên cứu trong kinh doanh
82 trang 270 0 0 -
Đề tài Xây dựng hệ thống quản lý nhân sự đại học Dân Lập
46 trang 244 0 0 -
29 trang 231 0 0
-
Tóm tắt luận án tiến sỹ Một số vấn đề tối ưu hóa và nâng cao hiệu quả trong xử lý thông tin hình ảnh
28 trang 223 0 0