Danh mục

Khóa luận cử nhân Tin học: Tìm hiểu các hướng tiệp cận phân loại email và xây dựng phần mềm mail client hỗ trợ tiếng Việt

Số trang: 106      Loại file: pdf      Dung lượng: 1.00 MB      Lượt xem: 8      Lượt tải: 0    
10.10.2023

Phí tải xuống: 53,000 VND Tải xuống file đầy đủ (106 trang) 0
Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Đề tài gồm 10 chương với những nội dung cụ thể như: Giới thiệu các kho dữ liệu dùng kiểm thử phân loại email, phương pháp phân loại Naïve Bayesian và ứng dụng phân loại email, thực hiện và kiểm thử phân loại email dựa trên phương pháp phân loại Naïve Bayesian,...
Nội dung trích xuất từ tài liệu:
Khóa luận cử nhân Tin học: Tìm hiểu các hướng tiệp cận phân loại email và xây dựng phần mềm mail client hỗ trợ tiếng Việt I H C QU C GIA TP. H CHÍ MINH TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN MÔN H TH NG THÔNG TIN LÊ NGUY N BÁ DUY –TR N MINH TRÍ TÌM HI U CÁC H NG TI P C N PHÂN LO IEMAIL VÀ XÂY D NG PH N M M MAIL CLIENT TR TI NG VI T KHOÁ LU N C NHÂN TIN H C TP. HCM, N M 2005 1 I H C QU C GIA TP. H CHÍ MINH TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN MÔN H TH NG THÔNG TIN LÊ NGUY N BÁ DUY -0112050 TR N MINH TRÍ -0112330 TÌM HI U CÁC H NG TI P C N PHÂN LO IEMAIL VÀ XÂY D NG PH N M M MAIL CLIENT TR TI NG VI T KHOÁ LU N C NHÂN TIN H C GIÁO VIÊN H NG D N TH Y LÊ C DUY NHÂN NIÊN KHÓA 2001-2005 2 IC M N Tr c tiên, chúng tôi xin chân thành c m n th y Lê c Duy Nhân, ng i ãh ng d n chúng tôi th c hi n tài này. Nh có s h ng d n, ch b o t n tìnhc a th y, chúng tôi ã hoàn thành khoá lu n này. Chúng con xin kính g i lòng bi t n, kính tr ng c a chúng con n ông bà,cha m và các ng i thân trong gia ình ã h t lòng nuôi chúng con n h c, luônluôn bên chúng con, ng viên giúp chúng con v t qua khó kh n Chúng em xin c m n t t c các th y cô tr ng i h c Khoa H c T Nhiên, c bi t là các th y cô trong khoa Công Ngh Thông Tin ã h t lòng gi ng d y,truy n t nhi u ki n th c và kinh nghi m quý báu cho chúng em. Chúng em c ngxin chân thành c m n khoa Công Ngh Thông Tin, b môn H Th ng Thông Tin ãt om i u ki n thu n l i trong quá trình th c hi n khoá lu n c a chúng em. Chúng tôi xin chân thành c m n b n bè trong l p c ng nh các anh ch itr c ã giúp , óng góp ý ki n cho chúng tôi. V i th i gian nghiên c u ng n, trong vòng 6 tháng và n ng l c c a nh ngng i làm tài, ch c ch n tài còn có nhi u thi u sót. Chúng tôi r t mong nh n c nh ng góp ý, nh n xét tài c hoàn thi n h n. Thành ph H Chí Minh Tháng 7 n m 2005 Nh ng ng i th c hi n: Lê Nguy n Bá Duy – Tr n Minh Trí. 3v M c l c:Ch ng 1 : M U................................................................................... 9 1.1 Gi i thi u: ........................................................................................................... 10 1.2 Yêu c u bài toán: ................................................................................................. 12 1.3 B c c khoá lu n : ............................................................................................... 12Ch ng 2 : T NG QUAN ......................................................................... 14 2.1 Các cách th c con ng i x lý v i spam :............................................................ 15 2.2 Các ph ng pháp ti p c n:................................................................................... 16 2.2.1 Complaining to Spammers ISPs : ................................................................ 16 2.2.2 Mail Blacklists /Whitelists: ........................................................................... 16 2.2.3 Mail volume :............................................................................................... 18 2.2.4 Signature/ Checksum schemes: ..................................................................... 19 2.2.5 Genetic Algorithms:...................................................................................... 20 2.2.6 Rule-Based (hay là Heuristic): ...................................................................... 21 2.2.7 Challenge-Response:..................................................................................... 22 2.2.8 Machine Learning ( Máy h c ):..................................................................... 23 2.3 Ph ng pháp l a ch n : ....................................................................................... 24 2.4 Các ch s ánh giá hi u qu phân lo i email : ..................................................... 24 2.4.1 Spam Recall và Spam Precision: ................................................................... 24 2.4.2 T l l i Err (Error) và t l chính xác Acc(Accuracy) : .................................. 25 ...

Tài liệu được xem nhiều: