Danh mục

Nhận dạng dấu thanh và mũ trong ký tự tiếng Việt viết tay

Số trang: 4      Loại file: pdf      Dung lượng: 2.46 MB      Lượt xem: 14      Lượt tải: 0    
Jamona

Phí lưu trữ: miễn phí Tải xuống file đầy đủ (4 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết Nhận dạng dấu thanh và mũ trong ký tự tiếng Việt viết tay đề xuất một giải pháp nhận dạng dấu, kể cả trong trường hợp mũ và thanh trong ký tự dính liền nhau – một vấn đề rất phổ biến và ảnh hưởng đáng kể đến kết quả nhận dạng.
Nội dung trích xuất từ tài liệu:
Nhận dạng dấu thanh và mũ trong ký tự tiếng Việt viết tay Huỳnh Hữu Hưng, Nguyễn Trọng Nguyên NHẬN DẠNG DẤU THANH VÀ MŨ TRONG KÝ TỰ TIẾNG VIỆT VIẾT TAY RECOGNIZING ACCENT IN VIETNAMESE HANDWRITING CHARACTERS TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌ hướng đ Huỳnh Hữu Hưng, Nguyễn Trọng Nguyên trên: nhậ Trường Đại học Bách khoa, Đại học Đà Nẵng; Email: hhhung@dut.udn.vn, ntnguyen.dn@gmail.com toán thấpTóm tắt – Nhận dạng ký tự viết tay là chủ đề đang được nghiên cứu Abstract – Handwriting character recognition is one of the most 3. Phươrộng rãi hiện nay. Nhiều giải pháp được áp dụng cho ký tự tiếng Anh common research topics. Many approaches have applied to Englishvà mang lại hiệu quả cao. Tuy nhiên, bài toán tiếng Việt đang đối characters and achieve high accuracy. However, the complexities Nmặt với nhiều thách thức, phần lớn vấn đề đến từ dấu mũ và dấu in the language of each country are not same. Recognizing bước xửthanh (gọi chung là dấu). Bài báo này đề xuất một giải pháp nhận Vietnamese handwriting character is facing many problems, most Việt. Môdạng dấu, kể cả trong trường hợp mũ và thanh trong ký tự dính liền of them come from the accent. This paper focuses on accentnhau – một vấn đề rất phổ biến và ảnh hưởng đáng kể đến kết quả recognition, especially when there is a connection between two được thểnhận dạng. Chúng tôi bắt đầu với việc tách riêng dấu và chữ cái accents - a common problem which affects the identification result.bằng kĩ thuật gán nhãn vùng liên thông. Tiếp theo, dấu được phân Hình 1. Các Our approach dấu starts được with nghiên cứu separating và một accent fromsốcharacter ví dụ về usingvào hai lớp: dấu đơn (một dấu mũ hoặc dấu thanh) hoặc dấu kép ký tự có sựlabeling the connected-component xuất hiện nhiều dấu method. The obtained accent(mũ và thanh dính liền nhau). Dấu kép (nếu có) tiếp tục được tách then is checked if it is single or multiple (the combination of manyra thành các dấu đơn để chuẩn bị cho bước xử lý cuối cùng. Quá 2. Các accents). nghiên In the second cứu liêneach case, quan accent is extracted for the lasttrình nhận dạng được thực hiện bằng phương pháp mô hình Markov processing step. The recognition is performed using hidden Markov n = 1ẩn. Giải pháp đề xuất đã được thử nghiệm và thu được kết quả khả Hiệnsingle models with each nay, accent. nhiều Proposed hướng tiếp cận has solution chobeen vấn testedquan. ...

Tài liệu được xem nhiều: