Danh mục

Improved OCR quality for smart scanned document management system

Số trang: 17      Loại file: pdf      Dung lượng: 7.85 MB      Lượt xem: 12      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

This paper investigated several algorithms for data pre-processing including image deskewing, table and document layout analysis to improve the accuracy of the OCR model and then built an end-to-end scanned document management system. We verified the algorithms using a well-known OCR software namely Tesseract.
Nội dung trích xuất từ tài liệu:
Improved OCR quality for smart scanned document management system

Tài liệu được xem nhiều: