Nhận dạng chữ viết: Những thành tựu, thách thức và hướng tiếp cận
Số trang: 9
Loại file: pdf
Dung lượng: 739.98 KB
Lượt xem: 14
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết này sẽ tổng hợp những thành quả đạt được và những tồn tại, thách thức hiện nay trong lĩnh vực nhận dạng chữ viết đồng thời nêu lên những hướng tiếp cận mới cho hướng nghiên cứu này.
Nội dung trích xuất từ tài liệu:
Nhận dạng chữ viết: Những thành tựu, thách thức và hướng tiếp cậnUED Journal of Sciences, Humanities & Education – ISSN 1859 - 4603 TẠP CHÍ KHOA HỌC XÃ HỘI, NHÂN VĂN VÀ GIÁO DỤC NHẬN DẠNG CHỮ VIẾT: NHỮNG THÀNH TỰU, THÁCH THỨC VÀ HƯỚNG TIẾP CẬN Nhận bài: 22 – 05– 2015 Phạm Anh Phương Chấp nhận đăng: 25 – 09 – 2015 Tóm tắt: Trong lĩnh vực nhận dạng thì nhận dạng chữ đang ngày càng có nhiều ứng dụng trong đời http://jshe.ued.udn.vn/ sống xã hội. Cho đến nay, bài toán nhận dạng chữ in đã được giải quyết gần như trọn vẹn (sản phẩm FineReader 12.0 của hãng ABBYY có thể nhận dạng chữ in theo 20 ngôn ngữ khác nhau, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 của Viện Công nghệ Thông tin Hà Nội có thể nhận dạng được các tài liệu chứa hình ảnh, bảng và văn bản với độ chính xác trên 98%). Tuy nhiên, trên thế giới cũng như ở Việt Nam thì bài toán nhận dạng chữ viết tay vẫn còn là vấn đề thách thức lớn đối với các nhà nghiên cứu. Bài báo này sẽ tổng hợp những thành quả đạt được và những tồn tại, thách thức hiện nay trong lĩnh vực nhận dạng chữ viết đồng thời nêu lên những hướng tiếp cận mới cho hướng nghiên cứu này. Từ khóa: Nhận dạng chữ in; nhận dạng chữ viết tay; OCR. nhận dạng chữ viết tay off-line, dữ liệu đầu vào là ảnh1. Giới thiệu văn bản nên việc nhận dạng có độ khó cao hơn so với Nhận dạng chữ là lĩnh vực được nhiều nhà nghiên nhận dạng chữ viết tay on-line. Do dữ liệu đầu vào làcứu trong và ngoài nước quan tâm 000. Cho đến nay, ảnh văn bản nên nhận dạng chữ viết tay off-line và nhậnlĩnh vực này cũng đã đạt được nhiều thành tựu lớn lao dạng chữ in còn được gọi chung là nhận dạng chữcả về mặt lý thuyết lẫn ứng dụng thực tế. Lĩnh vực nhận quang học (OCR - Optical Character Recognition).dạng chữ được chia làm hai loại: Nhận dạng chữ in và Khó khăn lớn nhất khi nghiên cứu bài toán nhậnnhận dạng chữ viết tay. dạng chữ viết tay là sự biến thiên quá đa dạng trong Đến thời điểm này, công nghệ nhận dạng chữ in đã cách viết của từng người. Điều này gây khó khăn trongđạt được những giải pháp tốt để ứng dụng vào các sản việc trích chọn đặc trưng cũng như lựa chọn mô hìnhphẩm thương mại. Tuy nhiên, nhận dạng chữ viết tay nhận dạng. Vì vậy để nghiên cứu về lĩnh vực nhận dạngvẫn còn là vấn đề thách thức lớn đối với các nhà nghiên chữ viết tay, cần phải có một khối lượng kiến thứccứu. Nhận dạng chữ viết tay được phân ra làm hai loại: tương đối rộng liên quan đến nhiều lĩnh vực khác nhau.nhận dạng chữ viết tay on-line và nhận dạng chữ viết Sau đây là một số lĩnh vực có liên hệ chặt chẽ đối vớitay off-line. nhận dạng chữ viết tay: Xử lý ảnh (Image Processing): được sử dụng Nhận dạng chữ viết tay on-line được thực hiện trên trong các giai đoạn tiền xử lý, tách chữ và trích chọncơ sở lưu lại các thông tin về nét chữ như thứ tự nét viết, đặc trưng.hướng và tốc độ của nét trong quá trình viết. Đối với Học máy (Machine Learning): được sử dụng trong giai đoạn huấn luyện và nhận dạng, chẳng hạn như các mạng nơ ron nhân tạo, SVM,...* Liên hệ tác giảPhạm Anh Phương Lý thuyết nhận dạng (Pattern Recognition): sử dụngTrường Đại học Sư phạm, Đại học Đà Nẵng các phương pháp luận phân lớp sử dụng trong côngEmail: paphuong@yahoo.com đoạn huấn luyện và nhận dạng. Tạp chí Khoa học Xã hội, Nhân văn & Giáo dục, Tập 5, số 3(2015), 11-19 | 11Phạm Anh Phương Xác suất thống kê và toán ứng dụng: lý thuyết xácsuất đóng vai trò rất quan trọng trong các phương phápphân lớp thống kê như mô hình Markov ẩn, phươngpháp Bayes, k-láng giềng gần nhất, SVM... Ngôn ngữ học và ngôn ngữ học tính toán(Linguistic and Computational Linguistic): Các kiếnthức về ngữ pháp đóng vai trò quan trọng trong côngđoạn hậu xử ...
Nội dung trích xuất từ tài liệu:
Nhận dạng chữ viết: Những thành tựu, thách thức và hướng tiếp cậnUED Journal of Sciences, Humanities & Education – ISSN 1859 - 4603 TẠP CHÍ KHOA HỌC XÃ HỘI, NHÂN VĂN VÀ GIÁO DỤC NHẬN DẠNG CHỮ VIẾT: NHỮNG THÀNH TỰU, THÁCH THỨC VÀ HƯỚNG TIẾP CẬN Nhận bài: 22 – 05– 2015 Phạm Anh Phương Chấp nhận đăng: 25 – 09 – 2015 Tóm tắt: Trong lĩnh vực nhận dạng thì nhận dạng chữ đang ngày càng có nhiều ứng dụng trong đời http://jshe.ued.udn.vn/ sống xã hội. Cho đến nay, bài toán nhận dạng chữ in đã được giải quyết gần như trọn vẹn (sản phẩm FineReader 12.0 của hãng ABBYY có thể nhận dạng chữ in theo 20 ngôn ngữ khác nhau, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 của Viện Công nghệ Thông tin Hà Nội có thể nhận dạng được các tài liệu chứa hình ảnh, bảng và văn bản với độ chính xác trên 98%). Tuy nhiên, trên thế giới cũng như ở Việt Nam thì bài toán nhận dạng chữ viết tay vẫn còn là vấn đề thách thức lớn đối với các nhà nghiên cứu. Bài báo này sẽ tổng hợp những thành quả đạt được và những tồn tại, thách thức hiện nay trong lĩnh vực nhận dạng chữ viết đồng thời nêu lên những hướng tiếp cận mới cho hướng nghiên cứu này. Từ khóa: Nhận dạng chữ in; nhận dạng chữ viết tay; OCR. nhận dạng chữ viết tay off-line, dữ liệu đầu vào là ảnh1. Giới thiệu văn bản nên việc nhận dạng có độ khó cao hơn so với Nhận dạng chữ là lĩnh vực được nhiều nhà nghiên nhận dạng chữ viết tay on-line. Do dữ liệu đầu vào làcứu trong và ngoài nước quan tâm 000. Cho đến nay, ảnh văn bản nên nhận dạng chữ viết tay off-line và nhậnlĩnh vực này cũng đã đạt được nhiều thành tựu lớn lao dạng chữ in còn được gọi chung là nhận dạng chữcả về mặt lý thuyết lẫn ứng dụng thực tế. Lĩnh vực nhận quang học (OCR - Optical Character Recognition).dạng chữ được chia làm hai loại: Nhận dạng chữ in và Khó khăn lớn nhất khi nghiên cứu bài toán nhậnnhận dạng chữ viết tay. dạng chữ viết tay là sự biến thiên quá đa dạng trong Đến thời điểm này, công nghệ nhận dạng chữ in đã cách viết của từng người. Điều này gây khó khăn trongđạt được những giải pháp tốt để ứng dụng vào các sản việc trích chọn đặc trưng cũng như lựa chọn mô hìnhphẩm thương mại. Tuy nhiên, nhận dạng chữ viết tay nhận dạng. Vì vậy để nghiên cứu về lĩnh vực nhận dạngvẫn còn là vấn đề thách thức lớn đối với các nhà nghiên chữ viết tay, cần phải có một khối lượng kiến thứccứu. Nhận dạng chữ viết tay được phân ra làm hai loại: tương đối rộng liên quan đến nhiều lĩnh vực khác nhau.nhận dạng chữ viết tay on-line và nhận dạng chữ viết Sau đây là một số lĩnh vực có liên hệ chặt chẽ đối vớitay off-line. nhận dạng chữ viết tay: Xử lý ảnh (Image Processing): được sử dụng Nhận dạng chữ viết tay on-line được thực hiện trên trong các giai đoạn tiền xử lý, tách chữ và trích chọncơ sở lưu lại các thông tin về nét chữ như thứ tự nét viết, đặc trưng.hướng và tốc độ của nét trong quá trình viết. Đối với Học máy (Machine Learning): được sử dụng trong giai đoạn huấn luyện và nhận dạng, chẳng hạn như các mạng nơ ron nhân tạo, SVM,...* Liên hệ tác giảPhạm Anh Phương Lý thuyết nhận dạng (Pattern Recognition): sử dụngTrường Đại học Sư phạm, Đại học Đà Nẵng các phương pháp luận phân lớp sử dụng trong côngEmail: paphuong@yahoo.com đoạn huấn luyện và nhận dạng. Tạp chí Khoa học Xã hội, Nhân văn & Giáo dục, Tập 5, số 3(2015), 11-19 | 11Phạm Anh Phương Xác suất thống kê và toán ứng dụng: lý thuyết xácsuất đóng vai trò rất quan trọng trong các phương phápphân lớp thống kê như mô hình Markov ẩn, phươngpháp Bayes, k-láng giềng gần nhất, SVM... Ngôn ngữ học và ngôn ngữ học tính toán(Linguistic and Computational Linguistic): Các kiếnthức về ngữ pháp đóng vai trò quan trọng trong côngđoạn hậu xử ...
Tìm kiếm theo từ khóa liên quan:
Nhận dạng chữ in Nhận dạng chữ viết tay Nhận dạng chữ quang học Mô hình liên mạng nơ ron Hệ thống xử lý biểu mẫu tự độngGợi ý tài liệu liên quan:
-
Bài tập lớn môn học Kĩ thuật đồ họa: Nghiên cứu ứng dụng nhận dạng chữ viết tay
17 trang 31 0 0 -
Kỹ thuật vi xử lý Microprocessors - Phần 1
84 trang 22 0 0 -
Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron
9 trang 18 0 0 -
Báo cáo môn Trí tuệ nhân tạo nâng cao: Sử dụng mạng neural xây dựng ứng dụng nhận dạng chữ viết tay
22 trang 15 0 0 -
Thiết kế hệ thống nhúng nhận dạng chữ viết tay
9 trang 15 0 0 -
9 trang 13 0 0
-
Nhận dạng chữ viết tay rời rạc trên cơ sở phương pháp máy véc tơ tựa
8 trang 11 0 0 -
11 trang 10 0 0