LUẬN VĂN: Cải tiến các bước thực hiện của thuật toán, đặt tên là T-Recs++.
Số trang: 32
Loại file: pdf
Dung lượng: 1.48 MB
Lượt xem: 15
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Ngày nay khi máy tính phát triển, cùng với tốc độ và không gian lưu trữ trong máy tính đã được nâng cấp lên rất nhiều. Việc lưu trữ số lượng khổng lồ tài liệu và xử lý những nhiệm vụ phức tạp trên máy tính ngày càng nhiều. Những công việc văn phòng hàng ngày đều liên quan đến tài liệu, một tài liệu không chỉ đơn giản được lưu trữ mà nó cần phải được xử lý để có khả năng thay đổi, soạn thảo, chỉnh sửa và trích chọn các thông tin quan trọng. Vì thế các...
Nội dung trích xuất từ tài liệu:
LUẬN VĂN: Cải tiến các bước thực hiện của thuật toán, đặt tên là T-Recs++. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ………………………. LUẬN VĂNCải tiến các bước thực hiện của thuật toán, đặt tên là T-Recs++. MỤC LỤCMỤC LỤC ......................................................................................................................1MỞ ĐẦU .........................................................................................................................2CHƢƠNG 1 TỔNG QUAN HỆ PHÂN TÍCH TÀI LIỆU .........................................41.1. Giới thiệu chung một hệ phân tích trang tài liệu .................................................41.2. Sơ lược về nhận dạng ký tự quang học (OCR) ....................................................71.3. Kết luận chương......................................................................................................8CHƢƠNG 2 THUẬT TOÁN TÁCH BẢNG T-RECS ...............................................92.1. Giới thiệu .................................................................................................................92.2. Thuật toán phân đoạn khởi tạo ...........................................................................11 2.2.1. Trường hợp thuật toán nhận dạng sai cột ................................................................... 12 2.2.2. Cải tiến các bước của thuật toán phân đoạn khởi tạo - T-Recs++ ............................. 13 2.2.3. Những ưu điểm của thuật toán.................................................................................... 15 2.2.4. Những mặt hạn chế của thuật toán khởi tạo ............................................................... 162.3. Các bước xử lý khối sau khi phân đoạn .............................................................16 2.3.1. Trộn các khối phân đoạn sai ....................................................................................... 17 2.3.2. Phân tách các cột bị trộn vào một khối ....................................................................... 18 2.3.3. Nhóm các từ bị phân tách ........................................................................................... 202.4. Phân tích khối .......................................................................................................21 2.4.1. Khối loại 2 nằm cùng với khối loại 1 ........................................................................ 212.5. Xác định cấu trúc các cột, hàng ..........................................................................222.6. Kết luận chương....................................................................................................22CHƢƠNG 3 THỰC NGHIỆM ...................................................................................243.1. T-Recs++ ................................................................................................................24 3.1.1. Giới thiệu .................................................................................................................... 24 3.1.2. Mô tả chương trình ..................................................................................................... 24 3.1.3. Một số kết quả thử nghiệm ......................................................................................... 26KẾT LUẬN ..................................................................................................................28DANH MỤC CÁC TÀI LIỆU THAM KHẢO………………………………….....30 1 MỞ ĐẦU Ngày nay khi máy tính phát triển, cùng với tốc độ và không gian lưu trữ trongmáy tính đã được nâng cấp lên rất nhiều. Việc lưu trữ số lượng khổng lồ tài liệu và xửlý những nhiệm vụ phức tạp trên máy tính ngày càng nhiều. Những công việc vănphòng hàng ngày đều liên quan đến tài liệu, một tài liệu không chỉ đơn giản được lưutrữ mà nó cần phải được xử lý để có khả năng thay đổi, soạn thảo, chỉnh sửa và tríchchọn các thông tin quan trọng. Vì thế các hệ phân tích tài liệu ra đời, mục đích củachúng là giúp biểu diễn thông tin trong các tài liệu ảnh, tài liệu giấy được đưa vào từmáy quét dưới dạng có cấu trúc. Một hệ phân tích và nhận dạng tài liệu có mục đích là chuyển đổi tự động nhữngthông tin lưu trữ trong tài liệu giấy thành biểu diễn dưới dạng những cấu trúc mà cóthể truy xuất, thay đổi được bằng máy tính. Quy trình xử lý của một hệ phân tích tàiliệu bắt đầu bằng việc lấy dữ liệu, các tài liệu từ giấy in sẽ được quét qua máy quét đểlưu trữ trong máy tính dưới dạng các tệp dữ liệu ảnh. Rõ ràng rằng khi máy tính ra đờivà phát triển đã giải quyết được nhiều vấn đề trong việc lưu trữ thông tin. Theo ướctính trên thế giới, chỉ có một số lượng nhỏ tài liệu từ những thư viện giấy khổng lồđược đưa lên mạng và vì vậy vẫn còn số lượng lớn nhữ ...
Nội dung trích xuất từ tài liệu:
LUẬN VĂN: Cải tiến các bước thực hiện của thuật toán, đặt tên là T-Recs++. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ………………………. LUẬN VĂNCải tiến các bước thực hiện của thuật toán, đặt tên là T-Recs++. MỤC LỤCMỤC LỤC ......................................................................................................................1MỞ ĐẦU .........................................................................................................................2CHƢƠNG 1 TỔNG QUAN HỆ PHÂN TÍCH TÀI LIỆU .........................................41.1. Giới thiệu chung một hệ phân tích trang tài liệu .................................................41.2. Sơ lược về nhận dạng ký tự quang học (OCR) ....................................................71.3. Kết luận chương......................................................................................................8CHƢƠNG 2 THUẬT TOÁN TÁCH BẢNG T-RECS ...............................................92.1. Giới thiệu .................................................................................................................92.2. Thuật toán phân đoạn khởi tạo ...........................................................................11 2.2.1. Trường hợp thuật toán nhận dạng sai cột ................................................................... 12 2.2.2. Cải tiến các bước của thuật toán phân đoạn khởi tạo - T-Recs++ ............................. 13 2.2.3. Những ưu điểm của thuật toán.................................................................................... 15 2.2.4. Những mặt hạn chế của thuật toán khởi tạo ............................................................... 162.3. Các bước xử lý khối sau khi phân đoạn .............................................................16 2.3.1. Trộn các khối phân đoạn sai ....................................................................................... 17 2.3.2. Phân tách các cột bị trộn vào một khối ....................................................................... 18 2.3.3. Nhóm các từ bị phân tách ........................................................................................... 202.4. Phân tích khối .......................................................................................................21 2.4.1. Khối loại 2 nằm cùng với khối loại 1 ........................................................................ 212.5. Xác định cấu trúc các cột, hàng ..........................................................................222.6. Kết luận chương....................................................................................................22CHƢƠNG 3 THỰC NGHIỆM ...................................................................................243.1. T-Recs++ ................................................................................................................24 3.1.1. Giới thiệu .................................................................................................................... 24 3.1.2. Mô tả chương trình ..................................................................................................... 24 3.1.3. Một số kết quả thử nghiệm ......................................................................................... 26KẾT LUẬN ..................................................................................................................28DANH MỤC CÁC TÀI LIỆU THAM KHẢO………………………………….....30 1 MỞ ĐẦU Ngày nay khi máy tính phát triển, cùng với tốc độ và không gian lưu trữ trongmáy tính đã được nâng cấp lên rất nhiều. Việc lưu trữ số lượng khổng lồ tài liệu và xửlý những nhiệm vụ phức tạp trên máy tính ngày càng nhiều. Những công việc vănphòng hàng ngày đều liên quan đến tài liệu, một tài liệu không chỉ đơn giản được lưutrữ mà nó cần phải được xử lý để có khả năng thay đổi, soạn thảo, chỉnh sửa và tríchchọn các thông tin quan trọng. Vì thế các hệ phân tích tài liệu ra đời, mục đích củachúng là giúp biểu diễn thông tin trong các tài liệu ảnh, tài liệu giấy được đưa vào từmáy quét dưới dạng có cấu trúc. Một hệ phân tích và nhận dạng tài liệu có mục đích là chuyển đổi tự động nhữngthông tin lưu trữ trong tài liệu giấy thành biểu diễn dưới dạng những cấu trúc mà cóthể truy xuất, thay đổi được bằng máy tính. Quy trình xử lý của một hệ phân tích tàiliệu bắt đầu bằng việc lấy dữ liệu, các tài liệu từ giấy in sẽ được quét qua máy quét đểlưu trữ trong máy tính dưới dạng các tệp dữ liệu ảnh. Rõ ràng rằng khi máy tính ra đờivà phát triển đã giải quyết được nhiều vấn đề trong việc lưu trữ thông tin. Theo ướctính trên thế giới, chỉ có một số lượng nhỏ tài liệu từ những thư viện giấy khổng lồđược đưa lên mạng và vì vậy vẫn còn số lượng lớn nhữ ...
Tìm kiếm theo từ khóa liên quan:
Cải tiến các bước thực hiện của thuật toán đặt tên là T-Recs++. nghiệp vụ kế toán giá thành sản phẩm chi phí sản xuất kế toán tập hợp chi phí luận vănGợi ý tài liệu liên quan:
-
Thảo luận đề tài: Mối quan hệ giữa đầu tư theo chiều rộng và đầu tư theo chiều sâu
98 trang 306 0 0 -
Bài giảng: Chương 2: Bảo hiểm hàng hải
94 trang 271 1 0 -
78 trang 263 0 0
-
Luận văn: Thiết kế xây dựng bộ đếm xung, ứng dụng đo tốc độ động cơ trong hệ thống truyền động điện
63 trang 237 0 0 -
79 trang 228 0 0
-
Đồ án: Kỹ thuật xử lý ảnh sử dụng biến đổi Wavelet
41 trang 219 0 0 -
Tiểu luận: Phân tích chiến lược của Công ty Sữa Vinamilk
25 trang 216 0 0 -
LUẬN VĂN: TÌM HIỂU PHƯƠNG PHÁP HỌC TÍCH CỰC VÀ ỨNG DỤNG CHO BÀI TOÁN LỌC THƯ RÁC
65 trang 213 0 0 -
Báo cáo thực tập nhà máy đường Bến Tre
68 trang 212 0 0 -
BÀI THUYẾT TRÌNH CÔNG TY CỔ PHẦN
11 trang 205 0 0