Tóm tắt luận án Tiến sĩ Toán học: Phân tích cấu trúc hình học trang ảnh tài liệu dựa trên phương pháp ngưỡng thích nghi
Số trang: 26
Loại file: pdf
Dung lượng: 2.44 MB
Lượt xem: 26
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu của luận án là nghiên cứu và phát triển các thuật toán vi phân. Lỗi tách một vùng văn bản chính xác làm cho các vùng văn bản nhỏ hơn làm sai lệch hoặc mất thông tin của văn bản hoặc văn bản (phân đoạn quá mức), lỗi bao gồm các vùng văn bản trong các cột văn bản hoặc các đoạn văn bản (phân đoạn dưới).
Nội dung trích xuất từ tài liệu:
Tóm tắt luận án Tiến sĩ Toán học: Phân tích cấu trúc hình học trang ảnh tài liệu dựa trên phương pháp ngưỡng thích nghiBỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ……..….***………… HÀ ĐẠI TÔN PHÂN TÍCH CẤU TRÚC HÌNH HỌC TRANG ẢNH TÀI LIỆU DỰA TRÊN PHƯƠNG PHÁP NGƯỠNG THÍCH NGHI Chuyên ngành: Cớ sở Toán học cho Tin học Mã số: 62 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI - 2018 1 Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt NamNgười hướng dẫn khoa học: TS. Nguyễn Đức DũngPhản biện 1: …Phản biện 2: …Phản biện 3: ….Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Học viện Khoahọc và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam vào hồi …giờ ..’, ngày … tháng … năm 201….Có thể tìm hiểu luận án tại:- Thư viện Học viện Khoa học và Công nghệ- Thư viện Quốc gia Việt Nam 2 MỞ ĐẦU Nhận dạng văn bản là một lĩnh vực đã được quan tâm nghiên cứu và ứng dụng trong nhiềunăm nay. Quá trình nhận dạng văn bản được thực hiện qua các bước chính như sau: Trang ảnhđầu vào sẽ qua bước tiền xử lý, sau đó là bước phân tích trang, kết quả đầu ra của phân tích trangsẽ là đầu vào của bước nhận dạng, cuối cùng là bước hậu xử lý. Kết quả của một hệ thống nhậndạng phụ thuộc chính vào hai bước: phân tích trang và nhận dạng. Đến thời điểm này, bài toánnhận dạng trên các văn bản chữ in đã được giải quyết gần như trọn vẹn (sản phẩm thương mạiFineReader 12.0 của hãng ABBYY có thể nhận dạng chữ in trên nhiều ngôn ngữ khác nhau, phầnmềm nhận dạng chữ Việt in VnDOCR 4.0 của Viện Công nghệ Thông Tin Hà Nội có thể nhậndạng với độ chính xác trên 98%). Tuy nhiên trên thế giới cũng như ở Việt Nam, bài toán phântích trang vẫn còn là một thách thức lớn đối với các nhà nghiên cứu. Cho đến này phân tích trangvẫn đang nhận được sự quan tâm của nhiều nhà nghiên cứu. Cứ hai năm một lần trên thế giới lạicó cuộc thi phân tích trang quốc tế nhằm thúc đẩy sự phát triển các thuật toán phân tích trang.Chính những điều này đã là động lực thúc đẩy luận án cố gắng nghiên cứu để đề xuất các giảipháp hữu hiệu cho bài toán phân tích trang.ThuậtTrong những năm gần đây đã có rất nhiều cácthuật toán phân tích trang được phát triển, đặc biệt là các thuật toán phát triển theo hướng tiếpcận lại ghép (hybrid). Các thuật toán được đề xuất đều thể hiện những điểm mạnh, điểm yếu khácnhau, nhưng nhìn chung hầu hết vẫn mắc phải hai lỗi cơ bản là: lỗi phân tách một vùng chữ đúngra thành các vùng chữ nhỏ hơn làm sai hoặc mất thông tin của các dòng chữ hay đoạn văn bản(over-segmentation), lỗi gộp các vùng chữ ở các cột văn bản hay các đoạn văn bản lại với nhau(under-segmentation). Vì vậy mục tiêu của luận án là nghiên cứu phát triển các thuật toán phântích trang giảm đồng thời cả hai kiểu lỗi: over-segmentation, under-segmentation. Các vấn đềtrong phân tích trang là rất rộng vì vậy luận án giới hạn phạm vi nghiên cứu trong khuôn khổ cáctrang ảnh văn bản được soạn thảo bằng ngôn ngữ Latin cụ thể là Tiếng Anh và tập trung vào phântích các vùng chữ. Luận án chưa đề xuất đến vấn đề phát hiện và phân tích cấu trúc của các vùngbảng, phát hiện các vùng ảnh và phân tích cấu trúc logic. Với những mục tiêu đặt ra luận án đãđạt được một số kết quả sau: 1. Đề xuất một giải pháp làm tăng tốc thuật toán phát hiện nền trang ảnh. 2. Đề xuất phương pháp tham số thích nghi làm giảm sự ảnh hưởng của kích cỡ và kiểu phông chữ đến kết quả phân tích trang. 3. Đề xuất một giải pháp mới cho vấn đề phát hiện và sử dụng các đối tượng phân tách trong các thuật toán phân tích trang. 4. Đề xuất một giải pháp mới tách các vùng chữ thành các đoạn văn bản dựa trên phân tích ngữ cảnh. 3 CHƯƠNG 1. TỔNG QUAN VỀ PHÂN TÍCH TRANG ẢNH TÀI LIỆU Trong chương này, tôi trình bày tổng quan hệ thống nhận dạng văn bản, bài toán phân tíchtrang, các thuật toán phân tích trang tiêu biểu, những lỗi cơ bản nhất của các thuật toán phân tíchtrang. Từ đó dẫn đến mục tiêu nghiên cứu và những kết quả đạt được của luận án này. 1.1. Các thành phần chính của hệ thống nhận dạng văn bản Về cơ bản, một hệ thống nhận dạng văn bản thường được thực hiện qua các bước cơ bảnnhư được mô tả ở hình 1. Những thông tin ở dạng văn bản như sách, báo, tạp chí, ... sau quá trìnhscan sẽ cho ta kết quả là các file ảnh văn bản. Những file ảnh này sẽ là đầu vào của một hệ thốngnhận dạng, kết quả đầu ra của hệ thống nhận dạng là những file văn bản có thể dễ dàng chín ...
Nội dung trích xuất từ tài liệu:
Tóm tắt luận án Tiến sĩ Toán học: Phân tích cấu trúc hình học trang ảnh tài liệu dựa trên phương pháp ngưỡng thích nghiBỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ……..….***………… HÀ ĐẠI TÔN PHÂN TÍCH CẤU TRÚC HÌNH HỌC TRANG ẢNH TÀI LIỆU DỰA TRÊN PHƯƠNG PHÁP NGƯỠNG THÍCH NGHI Chuyên ngành: Cớ sở Toán học cho Tin học Mã số: 62 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI - 2018 1 Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt NamNgười hướng dẫn khoa học: TS. Nguyễn Đức DũngPhản biện 1: …Phản biện 2: …Phản biện 3: ….Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Học viện Khoahọc và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam vào hồi …giờ ..’, ngày … tháng … năm 201….Có thể tìm hiểu luận án tại:- Thư viện Học viện Khoa học và Công nghệ- Thư viện Quốc gia Việt Nam 2 MỞ ĐẦU Nhận dạng văn bản là một lĩnh vực đã được quan tâm nghiên cứu và ứng dụng trong nhiềunăm nay. Quá trình nhận dạng văn bản được thực hiện qua các bước chính như sau: Trang ảnhđầu vào sẽ qua bước tiền xử lý, sau đó là bước phân tích trang, kết quả đầu ra của phân tích trangsẽ là đầu vào của bước nhận dạng, cuối cùng là bước hậu xử lý. Kết quả của một hệ thống nhậndạng phụ thuộc chính vào hai bước: phân tích trang và nhận dạng. Đến thời điểm này, bài toánnhận dạng trên các văn bản chữ in đã được giải quyết gần như trọn vẹn (sản phẩm thương mạiFineReader 12.0 của hãng ABBYY có thể nhận dạng chữ in trên nhiều ngôn ngữ khác nhau, phầnmềm nhận dạng chữ Việt in VnDOCR 4.0 của Viện Công nghệ Thông Tin Hà Nội có thể nhậndạng với độ chính xác trên 98%). Tuy nhiên trên thế giới cũng như ở Việt Nam, bài toán phântích trang vẫn còn là một thách thức lớn đối với các nhà nghiên cứu. Cho đến này phân tích trangvẫn đang nhận được sự quan tâm của nhiều nhà nghiên cứu. Cứ hai năm một lần trên thế giới lạicó cuộc thi phân tích trang quốc tế nhằm thúc đẩy sự phát triển các thuật toán phân tích trang.Chính những điều này đã là động lực thúc đẩy luận án cố gắng nghiên cứu để đề xuất các giảipháp hữu hiệu cho bài toán phân tích trang.ThuậtTrong những năm gần đây đã có rất nhiều cácthuật toán phân tích trang được phát triển, đặc biệt là các thuật toán phát triển theo hướng tiếpcận lại ghép (hybrid). Các thuật toán được đề xuất đều thể hiện những điểm mạnh, điểm yếu khácnhau, nhưng nhìn chung hầu hết vẫn mắc phải hai lỗi cơ bản là: lỗi phân tách một vùng chữ đúngra thành các vùng chữ nhỏ hơn làm sai hoặc mất thông tin của các dòng chữ hay đoạn văn bản(over-segmentation), lỗi gộp các vùng chữ ở các cột văn bản hay các đoạn văn bản lại với nhau(under-segmentation). Vì vậy mục tiêu của luận án là nghiên cứu phát triển các thuật toán phântích trang giảm đồng thời cả hai kiểu lỗi: over-segmentation, under-segmentation. Các vấn đềtrong phân tích trang là rất rộng vì vậy luận án giới hạn phạm vi nghiên cứu trong khuôn khổ cáctrang ảnh văn bản được soạn thảo bằng ngôn ngữ Latin cụ thể là Tiếng Anh và tập trung vào phântích các vùng chữ. Luận án chưa đề xuất đến vấn đề phát hiện và phân tích cấu trúc của các vùngbảng, phát hiện các vùng ảnh và phân tích cấu trúc logic. Với những mục tiêu đặt ra luận án đãđạt được một số kết quả sau: 1. Đề xuất một giải pháp làm tăng tốc thuật toán phát hiện nền trang ảnh. 2. Đề xuất phương pháp tham số thích nghi làm giảm sự ảnh hưởng của kích cỡ và kiểu phông chữ đến kết quả phân tích trang. 3. Đề xuất một giải pháp mới cho vấn đề phát hiện và sử dụng các đối tượng phân tách trong các thuật toán phân tích trang. 4. Đề xuất một giải pháp mới tách các vùng chữ thành các đoạn văn bản dựa trên phân tích ngữ cảnh. 3 CHƯƠNG 1. TỔNG QUAN VỀ PHÂN TÍCH TRANG ẢNH TÀI LIỆU Trong chương này, tôi trình bày tổng quan hệ thống nhận dạng văn bản, bài toán phân tíchtrang, các thuật toán phân tích trang tiêu biểu, những lỗi cơ bản nhất của các thuật toán phân tíchtrang. Từ đó dẫn đến mục tiêu nghiên cứu và những kết quả đạt được của luận án này. 1.1. Các thành phần chính của hệ thống nhận dạng văn bản Về cơ bản, một hệ thống nhận dạng văn bản thường được thực hiện qua các bước cơ bảnnhư được mô tả ở hình 1. Những thông tin ở dạng văn bản như sách, báo, tạp chí, ... sau quá trìnhscan sẽ cho ta kết quả là các file ảnh văn bản. Những file ảnh này sẽ là đầu vào của một hệ thốngnhận dạng, kết quả đầu ra của hệ thống nhận dạng là những file văn bản có thể dễ dàng chín ...
Tìm kiếm theo từ khóa liên quan:
Tóm tắt luận án Tiến sĩ Tóm tắt luận án Tiến sĩ Toán học Thuật toán phân tích trang HP2S và AOSM Thuật toán phân tích trang WhiteSpace Phương pháp ngưỡng thích nghiGợi ý tài liệu liên quan:
-
Tóm tắt Luận án Tiến sĩ Quản lý công: Quản lý nhà nước về thú y trên địa bàn thành phố Hà Nội
25 trang 236 0 0 -
27 trang 196 0 0
-
27 trang 151 0 0
-
29 trang 146 0 0
-
27 trang 135 0 0
-
8 trang 127 0 0
-
27 trang 121 0 0
-
27 trang 120 0 0
-
26 trang 118 0 0
-
28 trang 114 0 0