Danh mục

Đề tài : Phân tích bố cục và nhận dạng ảnh công văn tiếng việt

Số trang: 120      Loại file: doc      Dung lượng: 2.61 MB      Lượt xem: 1      Lượt tải: 0    
Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Phân tích bố cục văn bản là một bước rất quan trọng trong hệ thống OCR. Do nhiều yếu tố như kích cỡ chữ, kiểu chữ, khoảng cách giữa các dòng và bố cục của một số văn bản khá phức tạp, cùng với sự xuất hiện của nhiễu và dấu (đặc biệt trong các văn bản tiếng Việt),… đã ảnh hưởng rất lớn đến kết quả của quá trình phân tích và nhận dạng.
Nội dung trích xuất từ tài liệu:
Đề tài : Phân tích bố cục và nhận dạng ảnh công văn tiếng việt Bài Luận Đề Tài:Phân tích bố cục và nhận dạng ảnh công văn tiếng Việt i LỜI CẢM ƠN Để hoàn thành đề tài này và có kiến thức như ngày hôm nay,đầu tiên chúng em xin gửi lời cảm ơn đến Ban Giám Hiệu cùngtoàn thể Thầy Cô Khoa Công Nghệ Thông Tin – Trường Đại HọcNông Lâm TP.HCM đã tận tình giảng dạy, truyền đạt kiến thứccũng như những kinh nghiệm quý báu cho chúng em trong suốtquá trình học tập và nghiên cứu tại trường. Chúng em cũng chân thành cảm ơn thầy Nguyễn Đức Thànhđã tận tình hướng dẫn và quan tâm, động viên chúng em trong quátrình thực hiện đề tài. Chúng em cũng bày tỏ lòng biết ơn sâu sắc đến những ngườithân trong gia đình, bạn bè đã động viên và tạo mọi điều kiện giúpchúng em trong quá trình học tập cũng như trong cuộc sống. Mặc dù chúng em đã cố gắng hoàn thành tốt đề tài nhưngcũng không thể tránh khỏi những sai sót nhất định, rất mong đượcsự thông cảm và chia sẻ cùng quý Thầy Cô và bạn bè. Chúng em xin gửi lời chúc sức khỏe và thành đạt tới tất cảquý thầy cô cùng các bạn. Nhóm sinh viên thực hiện Võ Đại Bình Nguyễn Thị Tú Mi Nguyễn Thùy Giang ii MỤC LỤC TrangDANH MỤC CÁC HÌNH .............................................................................................. VIIDANH MỤC CÁC BẢNG .............................................................................................. XIDANH SÁCH CHỮ VIẾT TẮT .................................................................................... XIITÓM TẮT ..................................................................................................................... XIIICHƯƠNG 1: GIỚI THIỆU ................................................................................................ 1CHƯƠNG 2: NHỊ PHÂN HÓA ........................................................................................ 5 2.1. ĐẶT VẤN ĐỀ ..................................................................................................... 5 2.2. PHƯƠNG PHÁP OTSU...................................................................................... 5CHƯƠNG 3: CHỈNH NGHIÊNG ẢNH VĂN BẢN ........................................................ 8 3.1. SỬ DỤNG CÁC PHÉP BIẾN ĐỔI MORPHOLOGY TRONG ƯỚC LƯỢNG NGHIÊNG VĂN BẢN ........................................................................................ 8 3.1.1. ĐẶT VẤN ĐỀ ............................................................................................ 8 3.1.2. MỘT SỐ HƯỚNG TIẾP CẬN HIỆN CÓ:................................................. 9 3.1.3. MÔ TẢ PHƯƠNG PHÁP. ....................................................................... 15 3.1.3.1. BƯỚC TIỀN XỬ LÝ ....................................................................... 16 3.1.3.2. ƯỚC LƯỢNG THÔ ......................................................................... 16 3.1.3.3. ÁP DỤNG CÁC PHÉP BIẾN ĐỔI MORPHOLOGY .................... 19 3.1.3.4. ƯỚC LƯỢNG TINH........................................................................ 25 3.1.4. KẾT QUẢ THỰC NGHIỆM .................................................................... 28 3.2. PHƯƠNG PHÁP QUAY ẢNH VĂN BẢN NHỊ PHÂN .................................. 33 3.2.1. ĐẶT VẤN ĐỀ .......................................................................................... 33 3.2.2. MÔ TẢ PHƯƠNG PHÁP ........................................................................ 34 3.2.2.1. TẠO VÀ LƯU TRỮ CÁC PMPs..................................................... 34 iii 3.2.2.2. CHIA ẢNH THÀNH CÁC BLOCK ................................................ 35 3.2.2.3. THỰC HIỆN QUAY ẢNH .............................................................. 36 3.2.3. KẾT LUẬN............................................................................................... 38 3.3. TỔNG KẾT ....................................................................................................... 38CHƯƠNG 4: TÁCH KHỐI VĂN BẢN .......................................................................... 40 4.1. ĐẶT VẤN ĐỀ: .................................................................................................. 40 4.2. MỘT SỐ PHƯƠNG PHÁP TÁCH KHỐI HIỆN CÓ ........................................ 43 4.3. MÔ TẢ PHƯƠNG PHÁP ................................................................................. 45 4.3.1. TÁCH KHỐI THEO CHIỀU NGANG .................................................... 45 4.3.2. TÁCH KHỐI THEO CHIỀU DỌC .......................................................... 51 4.3.3. TÁCH KHỐI THEO CHIỀU NGANG LẦN 2 ........................................ 51 4.4. KẾT LUẬN VÀ NHẬN XÉT TỪ KẾT QUẢ THỰC NGHIỆM: ..................... 53CHƯƠNG 5:TÁCH DÒNG VĂN BẢN ......................................................................... 55 5.1. ĐẶT VẤN ĐỀ ................................................................................................... 55 5.2. MÔ TẢ PHƯƠNG PHÁP ................................................................................. 55 5.2.1. DÙNG CÁ ...

Tài liệu được xem nhiều: