Danh mục

Ứng dụng mạng nơ-ron nhân tạo trong nhận dạng tự động chữ số viết tay hỗ trợ giáo dục trẻ mầm non

Số trang: 8      Loại file: pdf      Dung lượng: 1.06 MB      Lượt xem: 13      Lượt tải: 0    
Jamona

Hỗ trợ phí lưu trữ khi tải xuống: 1,000 VND Tải xuống file đầy đủ (8 trang) 0

Báo xấu

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Nghiên cứu này trình bày quá trình xây dựng nền tảng kỹ thuật cho ứng dụng điện thoại thông minh dạy trẻ em tập viết chữ số. Phần lõi kỹ thuật của ứng dụng được xây dựng dựa trên trên nền mạng nơ-ron nhân tạo.
Nội dung trích xuất từ tài liệu:
Ứng dụng mạng nơ-ron nhân tạo trong nhận dạng tự động chữ số viết tay hỗ trợ giáo dục trẻ mầm non 124 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” Ứng dụng mạng nơ-ron nhân tạo trong nhận dạng tự động chữ số viết tay hỗ trợ giáo dục trẻ mầm non Hoàng Lê Uyên Thục1, Phan Đình Tùng2, Lê Thị Mỹ Hạnh3 Trường Đại học Bách khoa, Đại học Đà Nẵng 54 Nguyễn Lương Bằng, Liên Chiểu, Đà Nẵng 1 hluthuc@dut.udn.vn,2102140165@sv.dut.udn.vn,3ltmhanh@dut.udn.vn Tóm tắt. Giáo dục mầm non đóng vai trò khởi nguồn cho sự phát triển của trẻ em về sau. Ứng dụng công nghệ thông tin vào giáo dục mầm non là một hướng đi mới, giúp đa dạng hóa phương pháp giáo dục và tạo hứng thú học tập cho trẻ. Nghiên cứu này trình bày quá trình xây dựng nền tảng kỹ thuật cho ứng dụng điện thoại thông minh dạy trẻ em tập viết chữ số. Phần lõi kỹ thuật của ứng dụng được xây dựng dựa trên trên nền mạng nơ-ron nhân tạo. Chúng tôi thực hiện ba kịch bản nhận dạng ảnh chữ số viết tay khác nhau với cùng cấu trúc mạng nơ-ron: (1) ảnh không qua xử lý, (2) ảnh qua bước trích vùng quan tâm, (3) ảnh qua bước phân tích thành phần chính. Kết quả kiểm tra trên 10.000 ảnh chữ số viết tay trên tập dữ liệu MNIST cho thấy hiệu quả rất hứa hẹn và tính khả thi của ứng dụng đề xuất. Keywords: mạng nơ-ron nhân tạo ANN (Artificial Neural Network), nhận dạng chữ số viết tay (handwritten digit recognition), vùng quan tâm ROI (Region Of Interest), phân tích thành phần chính PCA (Principle Component Analysis), giáo dục trẻ mầm non (early childhood education). 1 Đặt vấn đề Những năm đầu tiên của cuộc đời đứa trẻ là giai đoạn đặc biệt nhạy cảm trong quá trình phát triển, đặt nền móng cho thời thơ ấu và những năm tiếp theo về các chức năng nhận thức; các năng lực hành vi, xã hội và tự điều chỉnh; sức khoẻ thể chất [1]. Nhiều nghiên cứu cho thấy lợi ích của giáo dục mầm non (GDMN) đối với trẻ em thể hiện ở nhiều mặt như đạt được thành tích học tập cao, có hành vi phù hợp, giảm tỷ lệ phạm tội, thành công trong sự nghiệp [1]. Trên cơ sở lợi ích của GDMN, chương trình GDMN quốc tế IPC (International Preschool Curriculum) được thiết kế nhằm hướng đến sự phát triển toàn diện của trẻ với 6 lĩnh vực học tập cốt lõi gồm ngôn ngữ (languare art), toán và số đếm (numeracy), nghệ thuật sáng tạo (creative art), khoa học (sciences), kỹ năng vận động (motor skills), tình cảm - kỹ năng xã hội (socio-emotional) [2]. Nghiên cứu của chúng tôi tập trung vào ứng dụng công nghệ thông tin vào một trong sáu lĩnh vực giáo dục cốt lõi của IPC, đó là “toán và số đếm”. Hiện nay, có rất nhiều ứng dụng di động giúp trẻ em học về “số đếm” như Zap Zap Math [3], 123 Kids Fun Numbers [4]. Các ứng dụng này đều được thiết kế với giao diện bắt mắt, có phần thưởng khi trẻ thực hiện tốt yêu cầu, có nội dung bài học phong phú. Tuy nhiên, các ứng dụng này đều sử dụng tiếng Anh và giá thành khá cao nên chưa thực sự phù hợp với điều kiện Việt Nam. Hơn nữa, hầu hết các ứng dụng chỉ hướng dẫn trẻ nhận biết mặt con số chứ chưa thiết kế chức năng giúp trẻ học viết con số. Từ những phân tích trên đây, chúng tôi đặt mục tiêu lâu dài là xây dựng ứng dụng di động dành riêng cho giáo dục trẻ mầm non ở Việt Nam học về số đếm và đặt tên là BKNumber. Hoàng Lê Uyên Thục, Phan Đình Tùng, Lê Thị Mỹ Hạnh 125 So với các ứng dụng học toán hiện có, điểm mới khác biệt của ứng dụng đề xuất là chức năng dạy trẻ viết con số. Đối với trẻ nhỏ chưa biết cầm bút, hoạt động viết con số được thực hiện thông qua cách thức vẽ bằng ngón tay trên màn hình cảm ứng của điện thoại/ máy tính bảng. Hoạt động vẽ bằng ngón tay (finger painting) đã được chứng minh là mang lại nhiều lợi ích to lớn đối với sự phát triển của trẻ về não bộ, xúc giác, vận động tinh,... [5]. Để dạy trẻ viết con số, trước tiên trẻ được yêu cầu vẽ con số bằng ngón tay trên màn hình điện thoại/ máy tính bảng. Sau khi trẻ vẽ xong con số thì một phần mềm nhận dạng tự động chữ số viết tay sẽ được thực thi nhằm nhận dạng con số đã viết là số nào trong các con số từ 0 đến 9. Quá trình này được thể hiện thông qua sơ đồ mô tả chức năng dạy trẻ viết con số trên điện thoại như trên Hình 1. Hình 1. Sơ đồ mô tả chức năng nhận dạng chữ số viết tay Như vậy, phần nền tảng kỹ thuật của ứng dụng chính là phần mềm thực hiện nhận dạng tự động các con số từ 0 đến 9 từ các ảnh con số viết bằng ngón tay trên màn hình điện thoại. Đây cũng là nội dung nghiên cứu chính của nghiên cứu và được trình bày tiếp theo như sau: mục 2 nêu tóm tắt các nghiên cứu liên quan, mục 3 trình bày chi tiết về các phương pháp nhận dạng chữ số viết tay sử dụng trong ứng dụng đề xuất, mục 4 mô tả các thí nghiệm kiểm tra, đánh giá các phương pháp nhận dạng được sử dụng trong hệ thống và cuối cùng là kết luận ở mục 5. 2 Các nghiên cứu liên quan đến nhận dạng chữ số viết tay Nhận dạng chữ viết tay là một công việc đầy thách thức, do kiểu viết cũng như cách di chuyển bút trên giấy của mỗi người là khác nhau. Hơn nữa, cùng một người nhưng chữ viết tay cũng thay đổi tùy thuộc thời điểm viết, tâm trạng khi viết, loại giấy, loại bút viết. Do đó, nhận dạng chữ viết tay nói chung và chữ số viết tay nói riêng vẫn chưa đạt độ chính xác tốt nhất để có thể ứng dụng rộng rãi trong thực tế. Nhìn chung, hiện nay có hai cách tiếp cận chính đối với hệ thống nhận dạng tự động chữ số viết tay. Đó là tiếp cận theo hướng truyền thống và theo hướng học sâu (deep learning). Với cách tiếp cận truyền thống, hệ thống gồm ba pha xử lý chính như sau [6]: Phân vùng ký tự: ở bước này, các ký tự được phân tách ra khỏi vùng còn lại trong ảnh để đưa đến khối xử lý tiếp theo sau. Do ảnh chữ số có thể có nhiễu, văn bản có thể bị nghiêng nên các phép tiền xử lý nhằm lọc nhiễu ...

Tài liệu được xem nhiều: