Danh mục

Luận án Tiến sĩ Hệ thống thông tin: Nghiên cứu các phương pháp phát hiện tin nhắn rác tiếng Việt

Số trang: 119      Loại file: pdf      Dung lượng: 1.71 MB      Lượt xem: 2      Lượt tải: 0    
Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Luận án Tiến sĩ Hệ thống thông tin "Nghiên cứu các phương pháp phát hiện tin nhắn rác tiếng Việt" trình bày các nội dung chính sau: Giới thiệu tổng quan về tin nhắn SMS; Nghiên cứu mức độ ảnh hưởng của độ dài tin nhắn tới hiệu quả của mô hình phát hiện tin nhắn rác tiếng Việt; Đề xuất 2 phương án tiếp cận để giải quyết bài toán phát hiện tin nhắn rác với đặc điểm đa biến thể của tiếng Việt.
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Hệ thống thông tin: Nghiên cứu các phương pháp phát hiện tin nhắn rác tiếng Việt HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- VŨ MINH TUẤNNGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN TIN NHẮN RÁC TIẾNG VIỆT Chuyên ngành: Hệ thống thông tin Mã số: 9.48.01.04 LUẬN ÁN TIẾN SỸ HỆ THỐNG THÔNG TIN HÀ NỘI - 2024 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- VŨ MINH TUẤNNGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN TIN NHẮN RÁC TIẾNG VIỆT Chuyên ngành: Hệ thống thông tin Mã số: 9.48.01.04 LUẬN ÁN TIẾN SỸ HỆ THỐNG THÔNG TIN Người hướng dẫn khoa học: PGS.TS. Trần Quang Anh TS. Nguyễn Xuân Thắng HÀ NỘI - 2024 MỤC LỤC MỤC LỤC ............................................................................................................... i LỜI CAM ĐOAN ................................................................................................... v LỜI CẢM ƠN ........................................................................................................ vi DANH MỤC KÝ HIỆU VÀ VIẾT TẮT ............................................................. vii DANH MỤC CÁC BẢNG .................................................................................... ix DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ .................................................................... x MỞ ĐẦU ................................................................................................................ 1 1. LÝ DO LỰA CHỌN ĐỀ TÀI .................................................................... 1 2. MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI VÀ PHƯƠNG PHÁP NGHIÊN CỨU 4 2.1. Mục tiêu nghiên cứu ................................................................................. 4 2.2. Đối tượng và phạm vi nghiên cứu ............................................................ 4 2.3. Phương pháp nghiên cứu .......................................................................... 5 3. Ý NGHĨA CỦA ĐỀ TÀI ............................................................................ 5 3.1. Ý nghĩa khoa học ...................................................................................... 5 3.2. Ý nghĩa thực tiễn....................................................................................... 6 4. NHIỆM VỤ NGHIÊN CỨU VÀ KẾT QUẢ ĐẠT ĐƯỢC ....................... 6 4.1. Nhiệm vụ nghiên cứu ................................................................................ 6 4.2. Các kết quả đạt được................................................................................. 7 5. BỐ CỤC LUẬN ÁN................................................................................... 8 Chương 1 TỔNG QUAN VỀ TIN NHẮN SMS VÀ PHƯƠNG PHÁP PHÁTHIỆN TIN NHẮN RÁC TIẾNG VIỆT....................................................................... 10 1.1. TIN NHẮN SMS .................................................................................. 10 1.1.1. Khái niệm tin nhắn SMS ............................................................... 10 i 1.1.2. Cấu trúc tin nhắn SMS .................................................................. 11 1.1.3. Cơ chế hoạt động cơ bản của tin nhắn SMS.................................. 12 1.2. TIN NHẮN RÁC VÀ CÁC ĐẶC TRƯNG.......................................... 12 1.2.1. Định nghĩa tin nhắn rác ................................................................. 12 1.2.2. Quy định về tin nhắn rác ............................................................... 13 1.2.3. Đặc trưng của tin nhắn rác ............................................................. 15 1.3. TẬP DỮ LIỆU TIN NHẮN TIẾNG VIỆT .......................................... 22 1.3.1. Nghiên cứu về tập dữ liệu tin nhắn................................................ 22 1.3.2. Xây dựng tập dữ liệu tin nhắn tiếng Việt ...................................... 24 1.3.3. Mô tả và phân tích tập dữ liệu ....................................................... 29 1.4. BÀI TOÁN PHÁT HIỆN TIN NHẮN RÁC TIẾNG VIỆT ................. 35 1.4.1. Phân tích mức độ ảnh hưởng của độ dài tin nhắn đến hiệu quả của mô hình phát hiện tin nhắn rác ............................................................................. 35 1.4.2. Xây dựng mô hình phát hiện tin nhắn rác với đặc điểm đa biến thể của tiếng Việt 36 1.5. NGHIÊN CỨU TỔNG QUAN VỀ PHƯƠNG PHÁP PHÁT HIỆN TINNHẮN RÁC TIẾNG VIỆT ..................................................................................... 38 1.5.1. Nghiên cứu về mức độ ảnh hưởng của độ dài tin nhắn với hiệu quả của mô hình phát hiện tin nhắn rác ...................................................................... 38 1.5.2. Nghiên cứu về phương pháp phát hiện tin nhắn rác với đặc điểm đa biến thể của tiếng Việt .......................................................................................... 40 1.6. CÁC ĐỘ ĐO ĐÁNH GIÁ PHÂN LỚP NHỊ PHÂN............................ 43 1.6.1. Accuracy ........................................................................................ 44 1.6.2. ...

Tài liệu được xem nhiều:

Tài liệu liên quan: