Đồ án tốt nghiệp: Ứng dụng mạng neuron nhân tạo để nhận dạng ký tự viết tay tiếng Việt
Số trang: 9
Loại file: pdf
Dung lượng: 578.46 KB
Lượt xem: 17
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Giới thiệu mạng neuron nhân tạo; tìm hiểu mạng neuron Kohonen; thiết kế và xây dựng chương trình;... là những nội dung chính ma "Đồ án tốt nghiệp: Ứng dụng mạng neuron nhân tạo để nhận dạng ký tự viết tay tiếng Việt" hướng đến nghiên cứu.
Nội dung trích xuất từ tài liệu:
Đồ án tốt nghiệp: Ứng dụng mạng neuron nhân tạo để nhận dạng ký tự viết tay tiếng Việt MỤC LỤC TỔNG QUAN VỀ ĐỀ TÀI ................................................................................ 1 CHƯƠNG 1. CƠ SỞ LÝ THUYẾTERROR! BOOKMARK NOT DEFINED. 1.1. MẠNG NEURON NHÂN TẠO ...... ERROR! BOOKMARK NOT DEFINED. 1.1.1. Cấu trúc và mô hình mạng neuronError! Bookmark not defined. 1.1.2. Cấu tạo và phƣơng thức làm việc của mạng neuronError! Bookmark not d 1.1.3. Các luật học ............................... Error! Bookmark not defined. 1.2. MẠNG NEURON KOHONEN ...... ERROR! BOOKMARK NOT DEFINED. 1.2.1. Giới thiệu................................... Error! Bookmark not defined. 1.2.2. Mạng neuron Kohonen .............. Error! Bookmark not defined. CHƯƠNG 2. THIẾT KẾ VÀ XÂY DỰNG CHƢƠNG TRÌNH ..................... 3 2.1. GIỚI THIỆU ............................... ERROR! BOOKMARK NOT DEFINED. 2.2. PHÁT BIỂU BÀI TOÁN ............... ERROR! BOOKMARK NOT DEFINED. 2.3. CÁC BƢỚC GIẢI QUYẾT BÀI TOÁNERROR! BOOKMARK NOT DEFINED. 2.3.1. Xây dựng mạng neuron ............. Error! Bookmark not defined. 2.3.2. Xử lý dữ liệu ............................. Error! Bookmark not defined. 2.3.3. Huấn luyện mạng neuron .......... Error! Bookmark not defined. 2.3.4. Nhận dạng ký tự ........................ Error! Bookmark not defined. 2.3.5. Hậu xử lý dữ liệu....................... Error! Bookmark not defined. CHƯƠNG 3. TRIỂN KHAI VÀ ĐÁNH GIÁ KẾT QUẢ ............................... 3 3.1. MÔI TRƢỜNG TRIỂN KHAI .................................................................. 3 3.2. GIAO DIỆN CHƢƠNG TRÌNH ................................................................ 3 3.3. ĐÁNH GIÁ VÀ NHẬN XÉT ................................................................... 4 i DANH MỤC HÌNH VẼ Hình 1: Một neuron sinh học ............................ Error! Bookmark not defined. Hình 2: Sự liên kết các neuron ......................... Error! Bookmark not defined. Hình 3: Mô hình một neuron nhân tạo ............. Error! Bookmark not defined. Hình 4: Đồ thị các dạng hàm truyền ................. Error! Bookmark not defined. Hình 5: Cấu trúc huấn luyện mạng neuron ....... Error! Bookmark not defined. Hình 6: Học có giám sát ................................... Error! Bookmark not defined. Hình 7: Học không giám sát ............................. Error! Bookmark not defined. Hình 8: Sơ đồ cấu trúc chung của quá trình họcError! Bookmark not defined. Hình 9: Một dạng mạng neuron Kohonen ........ Error! Bookmark not defined. Hình 10: Các bƣớc trong nhận dạng ký tự ....... Error! Bookmark not defined. Hình 11: Cấu trúc mạng neuron Kohonen ........ Error! Bookmark not defined. Hình 12: Xác định dấu thanh và dấu mũ. ......... Error! Bookmark not defined. Hình 13: Xác định ký tự có dấu thanh hay dấu mũ.Error! Bookmark not defined. Hình 14: Xác định dấu thanh ............................ Error! Bookmark not defined. Hình 15: Giao diện phần mềm nhận dạng ký tự .................................................3 Hình 16: Giao diện phần mềm huấn luyện ký tự ................................................4 Hình 17: Kết quả nhận dạng với ký tự không dấu ..............................................4 Hình 18: Kết quả nhận dạng với ký tự có dấu mũ ..............................................5 Hình 19: Kết quả nhận dạng với đầu vào là ảnh ................................................6 ii Ứng dụng mạng neuron nhân tạo để nhận dạng ký tự viết tay tiếng Việt TỔNG QUAN VỀ ĐỀ TÀI 1. Bối cảnh và lý do thực hiện đề tài Nhận dạng chữ viết tay là một đề tài rất quan trọng. Chủ đề này đã đƣợc nghiên cứu trong vài thập kỷ qua. Ngôn ngữ đƣợc hƣớng đến nhiều nhất là tiếng Anh, trong đó mỗi ký tự chỉ gồm một chữ cái, do đó kết quả thƣờng cao hơn các ngôn ngữ khác. Trong tiếng Việt ngoài ký tự đơn lẻ nhƣ tiếng Anh còn có thể chứa thêm một hoặc hai dấu. Do đó, kết quả nghiên cứu trên tiếng Việt còn hạn chế. Hiện nay có các phần mềm nhận dạng chữ Việt in rất nổi tiếng, ví dụ nhƣ: VietOCR, ABBYY, VnDOCR,… Những phần mềm đƣợc nêu trên chỉ phục vụ cho việc nhận dạng chữ Việt in, chính vì vậy đề tài của em đề ra một hƣớng giải quyết đối với bài toán nhận dạng chữ viết tay tiếng Việt. 2. Phương pháp triển khai đề tài Trong đề tài này đề xuất một giải pháp nhận dạng dòng văn bản có dấu, các dấu đƣợc viết riêng lẻ không dính liền nhau. Từ ảnh ban đầu, thông qua việc phân tích ảnh để tìm ký tự, quá trình tiền xử lý ký tự, cách giải quyết bắt đầu theo lần lƣợt là việc tách từng dòng ký tự, tách từng từ trong mỗi dòng, tách từng ký tự trong mỗi từ và tách từng phần của ký tự (nếu có) trong mỗi ký tự bằng kỹ thuật gán nhãn vùng liên thông. Tiếp theo, với ký tự có nhiều phần đƣợc phân vào hai lớp: dấu đơn (ký tự có mũ hoặc dấu thanh) và dấu kép (ký tự có mũ và dấu thanh). Quá trình nhận biết mũ hay dấu thanh đƣợc thực hiện bằng phƣơng pháp tính số điểm tiếp xúc. Sau khi nhận biết đƣợc dấu thanh và dấu mũ, các ký tự và dấu đƣợc nhận dạng bằng việc sử dụng mạng neuron Kohonen. Sau đó thực hiện việc ghép các ký tự và các dấu đã đƣợc nhận dạng lại với nhau theo thứ tự nhƣ trong ảnh ban đầu. Giải pháp đề xuất đã đƣợc thử nghiệm và thu đƣợc hiệu quả khả quan. Ngôn ngữ lập trình: Java. Công cụ lập trình: Eclipse. Ứng dụng mạng neuron nhân tạo để nhận dạng ký tự viết tay tiếng Việt 3. Kết cấu của đồ án Kết cấu của đồ án gồm có các nội dung sau: Tổng quan về đề tài Chƣơng 1: Cơ sở ...
Nội dung trích xuất từ tài liệu:
Đồ án tốt nghiệp: Ứng dụng mạng neuron nhân tạo để nhận dạng ký tự viết tay tiếng Việt MỤC LỤC TỔNG QUAN VỀ ĐỀ TÀI ................................................................................ 1 CHƯƠNG 1. CƠ SỞ LÝ THUYẾTERROR! BOOKMARK NOT DEFINED. 1.1. MẠNG NEURON NHÂN TẠO ...... ERROR! BOOKMARK NOT DEFINED. 1.1.1. Cấu trúc và mô hình mạng neuronError! Bookmark not defined. 1.1.2. Cấu tạo và phƣơng thức làm việc của mạng neuronError! Bookmark not d 1.1.3. Các luật học ............................... Error! Bookmark not defined. 1.2. MẠNG NEURON KOHONEN ...... ERROR! BOOKMARK NOT DEFINED. 1.2.1. Giới thiệu................................... Error! Bookmark not defined. 1.2.2. Mạng neuron Kohonen .............. Error! Bookmark not defined. CHƯƠNG 2. THIẾT KẾ VÀ XÂY DỰNG CHƢƠNG TRÌNH ..................... 3 2.1. GIỚI THIỆU ............................... ERROR! BOOKMARK NOT DEFINED. 2.2. PHÁT BIỂU BÀI TOÁN ............... ERROR! BOOKMARK NOT DEFINED. 2.3. CÁC BƢỚC GIẢI QUYẾT BÀI TOÁNERROR! BOOKMARK NOT DEFINED. 2.3.1. Xây dựng mạng neuron ............. Error! Bookmark not defined. 2.3.2. Xử lý dữ liệu ............................. Error! Bookmark not defined. 2.3.3. Huấn luyện mạng neuron .......... Error! Bookmark not defined. 2.3.4. Nhận dạng ký tự ........................ Error! Bookmark not defined. 2.3.5. Hậu xử lý dữ liệu....................... Error! Bookmark not defined. CHƯƠNG 3. TRIỂN KHAI VÀ ĐÁNH GIÁ KẾT QUẢ ............................... 3 3.1. MÔI TRƢỜNG TRIỂN KHAI .................................................................. 3 3.2. GIAO DIỆN CHƢƠNG TRÌNH ................................................................ 3 3.3. ĐÁNH GIÁ VÀ NHẬN XÉT ................................................................... 4 i DANH MỤC HÌNH VẼ Hình 1: Một neuron sinh học ............................ Error! Bookmark not defined. Hình 2: Sự liên kết các neuron ......................... Error! Bookmark not defined. Hình 3: Mô hình một neuron nhân tạo ............. Error! Bookmark not defined. Hình 4: Đồ thị các dạng hàm truyền ................. Error! Bookmark not defined. Hình 5: Cấu trúc huấn luyện mạng neuron ....... Error! Bookmark not defined. Hình 6: Học có giám sát ................................... Error! Bookmark not defined. Hình 7: Học không giám sát ............................. Error! Bookmark not defined. Hình 8: Sơ đồ cấu trúc chung của quá trình họcError! Bookmark not defined. Hình 9: Một dạng mạng neuron Kohonen ........ Error! Bookmark not defined. Hình 10: Các bƣớc trong nhận dạng ký tự ....... Error! Bookmark not defined. Hình 11: Cấu trúc mạng neuron Kohonen ........ Error! Bookmark not defined. Hình 12: Xác định dấu thanh và dấu mũ. ......... Error! Bookmark not defined. Hình 13: Xác định ký tự có dấu thanh hay dấu mũ.Error! Bookmark not defined. Hình 14: Xác định dấu thanh ............................ Error! Bookmark not defined. Hình 15: Giao diện phần mềm nhận dạng ký tự .................................................3 Hình 16: Giao diện phần mềm huấn luyện ký tự ................................................4 Hình 17: Kết quả nhận dạng với ký tự không dấu ..............................................4 Hình 18: Kết quả nhận dạng với ký tự có dấu mũ ..............................................5 Hình 19: Kết quả nhận dạng với đầu vào là ảnh ................................................6 ii Ứng dụng mạng neuron nhân tạo để nhận dạng ký tự viết tay tiếng Việt TỔNG QUAN VỀ ĐỀ TÀI 1. Bối cảnh và lý do thực hiện đề tài Nhận dạng chữ viết tay là một đề tài rất quan trọng. Chủ đề này đã đƣợc nghiên cứu trong vài thập kỷ qua. Ngôn ngữ đƣợc hƣớng đến nhiều nhất là tiếng Anh, trong đó mỗi ký tự chỉ gồm một chữ cái, do đó kết quả thƣờng cao hơn các ngôn ngữ khác. Trong tiếng Việt ngoài ký tự đơn lẻ nhƣ tiếng Anh còn có thể chứa thêm một hoặc hai dấu. Do đó, kết quả nghiên cứu trên tiếng Việt còn hạn chế. Hiện nay có các phần mềm nhận dạng chữ Việt in rất nổi tiếng, ví dụ nhƣ: VietOCR, ABBYY, VnDOCR,… Những phần mềm đƣợc nêu trên chỉ phục vụ cho việc nhận dạng chữ Việt in, chính vì vậy đề tài của em đề ra một hƣớng giải quyết đối với bài toán nhận dạng chữ viết tay tiếng Việt. 2. Phương pháp triển khai đề tài Trong đề tài này đề xuất một giải pháp nhận dạng dòng văn bản có dấu, các dấu đƣợc viết riêng lẻ không dính liền nhau. Từ ảnh ban đầu, thông qua việc phân tích ảnh để tìm ký tự, quá trình tiền xử lý ký tự, cách giải quyết bắt đầu theo lần lƣợt là việc tách từng dòng ký tự, tách từng từ trong mỗi dòng, tách từng ký tự trong mỗi từ và tách từng phần của ký tự (nếu có) trong mỗi ký tự bằng kỹ thuật gán nhãn vùng liên thông. Tiếp theo, với ký tự có nhiều phần đƣợc phân vào hai lớp: dấu đơn (ký tự có mũ hoặc dấu thanh) và dấu kép (ký tự có mũ và dấu thanh). Quá trình nhận biết mũ hay dấu thanh đƣợc thực hiện bằng phƣơng pháp tính số điểm tiếp xúc. Sau khi nhận biết đƣợc dấu thanh và dấu mũ, các ký tự và dấu đƣợc nhận dạng bằng việc sử dụng mạng neuron Kohonen. Sau đó thực hiện việc ghép các ký tự và các dấu đã đƣợc nhận dạng lại với nhau theo thứ tự nhƣ trong ảnh ban đầu. Giải pháp đề xuất đã đƣợc thử nghiệm và thu đƣợc hiệu quả khả quan. Ngôn ngữ lập trình: Java. Công cụ lập trình: Eclipse. Ứng dụng mạng neuron nhân tạo để nhận dạng ký tự viết tay tiếng Việt 3. Kết cấu của đồ án Kết cấu của đồ án gồm có các nội dung sau: Tổng quan về đề tài Chƣơng 1: Cơ sở ...
Tìm kiếm theo từ khóa liên quan:
Đồ án tốt nghiệp Neuron nhân tạo Ký tự viết tay tiếng Việt Nhận dạng ký tự viết tay tiếng Việt Mạng neuron nhân tạo Ứng dụng mạng neuron nhân tạoGợi ý tài liệu liên quan:
-
124 trang 542 0 0
-
Đồ án tốt nghiệp: Thiết kế và thi công mô hình điều khiển, giám sát bãi giữ xe ô tô tự động
187 trang 436 0 0 -
Đồ án tốt nghiệp: Nghiên cứu sản xuất nến thơm quy mô phòng thí nghiệm
73 trang 404 0 0 -
Đồ án tốt nghiệp: Xe điều khiển từ xa thông qua Smartphone
23 trang 341 0 0 -
116 trang 337 0 0
-
105 trang 289 0 0
-
Đồ án tốt nghiệp: Thiết kế và thi công Robot đánh trống trong trường học
99 trang 289 0 0 -
Đồ án tốt nghiệp Thiết kế đồ họa: Cụm thiết kế đồ họa quảng cáo cho shop giày Denah Sneaker
39 trang 273 0 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng di động android quản lý khách hàng cắt tóc
81 trang 261 0 0 -
Đồ án tốt nghiệp: Nghiên cứu quy trình sản xuất nước chanh dây lên men
79 trang 257 0 0