Nhận dạng chữ số viết tay dùng mạng neuron nhân tạo
Số trang: 12
Loại file: pdf
Dung lượng: 910.97 KB
Lượt xem: 17
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết trình bày những khái niệm cơ bản, theo khía cạnh đơn giản nhất, từ đó có thể làm rõ được bản chất của AI, hay cụ thể hơn là Deep Learning. Lựa chọn mô hình mạng neuron nhân tạo tiêu chuẩn, mạng perceptron đa lớp (Multi-layer Perceptron), thực hiện tác vụ nhận dạng chữ số viết tay.
Nội dung trích xuất từ tài liệu:
Nhận dạng chữ số viết tay dùng mạng neuron nhân tạoTẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số 1 (2019) NHẬN DẠNG CHỮ SỐ VIẾT TAY DÙNG MẠNG NEURON NHÂN TẠO Phạm Phú Quốc*, Vương Quang Phước Khoa Điện tử - Viễn thông, Trường Đại học Khoa học, ĐH Huế *Email: phuquochusc@gmail.com Ngày nhận bài: 21/3/2019; ngày hoàn thành phản biện: 21/5/2019; ngày duyệt đăng: 02/7/2019 TÓM TẮT Với vị trí dẫn đầu trong xu thế công nghệ hiện tại, trí tuệ nhân tạo (Artificial Intelligence - AI), đã v| đang được nhiều nhà khoa học trên toàn thế giới nghiên cứu và phát triển. Ở Việt Nam, chủ đề này đã thu hút được nhiều sự quan tâm trong v|i năm gần đ}y, tuy nhiên số lượng c{c b|i b{o cũng như t|i liệu liên quan còn khá hạn chế. Bài báo trình bày những khái niệm cơ bản, theo khía cạnh đơn giản nhất, từ đó có thể l|m rõ được bản chất của AI, hay cụ thể hơn l| Deep Learning. Chúng tôi lựa chọn mô hình mạng neuron nhân tạo tiêu chuẩn, mạng perceptron đa lớp (Multi-layer Perceptron), thực hiện tác vụ nhận dạng chữ số viết tay. Hiệu năng của mạng được đ{nh gi{ thông qua tỷ lệ nhận dạng đúng hình ảnh. Bên cạnh đó, c{c tham số chi phối đến kết quả như tỷ lệ học (Learning Rate), số lớp ẩn/số neuron lớp ẩn v| kích thước gói dữ liệu cũng được khảo s{t v| đ{nh giá trong quá trình thực hiện. Từ khóa: mạng neuron nhân tạo, mạng perceptron đa lớp, trí tuệ nhân tạo.1. MỞ ĐẦU Hiện nay, với hệ thống dữ liệu hình ảnh khổng lồ trên toàn thế giới, việc phântích, xử lý để khai thác sử dụng thông tin trong ảnh là một nhu cầu thiết yếu. Tuynhiên, với số lượng dữ liệu khổng lồ, việc phân tích, xử lý thủ công sẽ mất rất nhiềuthời gian và nguồn nhân lực. Thực tiễn đã chứng minh, việc ứng dụng trí tuệ nhân tạonói chung hay Deep Learning nói riêng vào các nhiệm vụ trên đã giúp tiết kiệm đượcnhiều thời gian và công sức. Từ giữa năm 2011, Google đã giới thiệu dự án DeepLearning sử dụng mạng neuron nhân tạo dùng cho nhận dạng giọng nói v| sau đó mởrộng lên c{c lĩnh vực kh{c như Gmail, Google dịch, Google ảnh< *1]. Đối với bài toánnhận dạng chữ số viết tay, mạng neuron nhiều lớp sẽ được huấn luyện dựa trên cácpixel, đơn vị nhỏ nhất của hình ảnh. Vì vậy mạng neuron nhân tạo là công cụ vô cùngthích hợp cho việc xử lý, phân tích hình ảnh và mang lại kết quả rất khả quan [2]. 119Nhận dạng chữ số viết tay dùng mạng neuron nhân tạo Mục tiêu bài báo trình bày các khái niệm căn bản, xây dựng mô hình nhận diệnchữ số viết tay bằng mạng neuron nhân tạo cho tỷ lệ nhận dạng đúng trên 90%. Cácphần tiếp theo của bài báo sẽ trình b|y đơn vị cấu tạo nhỏ nhất tạo thành mạng neuronnhân tạo đa lớp và cấu trúc, thông số của mô hình mạng neuron đa lớp cũng như kếtquả thực nghiệm với các trường hợp kh{c nhau để khảo sát, làm rõ chức năng của cácthông số trong mô hình mạng.2. NEURON NHÂN TẠO Neuron nhân tạo được xây dựng trên ý tưởng từ neuron sinh học, đơn vị cấutạo thành hệ thần kinh của não bộ con người. Những neuron này có nhiệm vụ nhận tínhiệu từ não bộ và truyền tín hiệu đến các bộ phận kh{c nhau trên cơ thể. Một cáchtương tự, ta có các neuron nhân tạo hay perceptron l| đơn vị cấu thành mạng neuronnhân tạo. Một perceptron sẽ nhận các ngõ vào có giá trị x1, x2, ... xn và ngõ ra củaperceptron sẽ cho ra giá trị nhị phân [3]. Hình 1 mô tả cấu trúc của một perceptron đơngiản với 2 giá trị đầu vào X1, X2. X1 Ngõ ra X2 Hình 1. Mô hình Perceptron đơn giản. Nhiệm vụ của perceptron là sử dụng các giá trị ngõ vào để tính toán và xácđịnh giá trị ngõ ra là 0 hoặc 1. Trong một mạng neuron nhân tạo, ngõ ra của neuronlớp trước sẽ là đầu vào của lớp tiếp theo.2.1 Trọng số (Weight – w) Weight hay trọng số (w) là con số biểu thị mức độ quan trọng của ngõ vào sovới ngõ ra [5]. Giá trị ngõ ra của perceptron phụ thuộc vào tổng giữa trọng số và ngõvào: ∑ (1) ∑ { Trong đó : ngõ vào thứ của perceptron; : trọng số của ngõ vào ; : mức ngưỡng quyết định giá trị ngõ ra. H|m x{c định ngõ ra ở (1) còn đượcgọi là hàm step. 120TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số 1 (2019)2.2 Bias – b Để đơn giản cho perceptron quyết định giá ...
Nội dung trích xuất từ tài liệu:
Nhận dạng chữ số viết tay dùng mạng neuron nhân tạoTẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số 1 (2019) NHẬN DẠNG CHỮ SỐ VIẾT TAY DÙNG MẠNG NEURON NHÂN TẠO Phạm Phú Quốc*, Vương Quang Phước Khoa Điện tử - Viễn thông, Trường Đại học Khoa học, ĐH Huế *Email: phuquochusc@gmail.com Ngày nhận bài: 21/3/2019; ngày hoàn thành phản biện: 21/5/2019; ngày duyệt đăng: 02/7/2019 TÓM TẮT Với vị trí dẫn đầu trong xu thế công nghệ hiện tại, trí tuệ nhân tạo (Artificial Intelligence - AI), đã v| đang được nhiều nhà khoa học trên toàn thế giới nghiên cứu và phát triển. Ở Việt Nam, chủ đề này đã thu hút được nhiều sự quan tâm trong v|i năm gần đ}y, tuy nhiên số lượng c{c b|i b{o cũng như t|i liệu liên quan còn khá hạn chế. Bài báo trình bày những khái niệm cơ bản, theo khía cạnh đơn giản nhất, từ đó có thể l|m rõ được bản chất của AI, hay cụ thể hơn l| Deep Learning. Chúng tôi lựa chọn mô hình mạng neuron nhân tạo tiêu chuẩn, mạng perceptron đa lớp (Multi-layer Perceptron), thực hiện tác vụ nhận dạng chữ số viết tay. Hiệu năng của mạng được đ{nh gi{ thông qua tỷ lệ nhận dạng đúng hình ảnh. Bên cạnh đó, c{c tham số chi phối đến kết quả như tỷ lệ học (Learning Rate), số lớp ẩn/số neuron lớp ẩn v| kích thước gói dữ liệu cũng được khảo s{t v| đ{nh giá trong quá trình thực hiện. Từ khóa: mạng neuron nhân tạo, mạng perceptron đa lớp, trí tuệ nhân tạo.1. MỞ ĐẦU Hiện nay, với hệ thống dữ liệu hình ảnh khổng lồ trên toàn thế giới, việc phântích, xử lý để khai thác sử dụng thông tin trong ảnh là một nhu cầu thiết yếu. Tuynhiên, với số lượng dữ liệu khổng lồ, việc phân tích, xử lý thủ công sẽ mất rất nhiềuthời gian và nguồn nhân lực. Thực tiễn đã chứng minh, việc ứng dụng trí tuệ nhân tạonói chung hay Deep Learning nói riêng vào các nhiệm vụ trên đã giúp tiết kiệm đượcnhiều thời gian và công sức. Từ giữa năm 2011, Google đã giới thiệu dự án DeepLearning sử dụng mạng neuron nhân tạo dùng cho nhận dạng giọng nói v| sau đó mởrộng lên c{c lĩnh vực kh{c như Gmail, Google dịch, Google ảnh< *1]. Đối với bài toánnhận dạng chữ số viết tay, mạng neuron nhiều lớp sẽ được huấn luyện dựa trên cácpixel, đơn vị nhỏ nhất của hình ảnh. Vì vậy mạng neuron nhân tạo là công cụ vô cùngthích hợp cho việc xử lý, phân tích hình ảnh và mang lại kết quả rất khả quan [2]. 119Nhận dạng chữ số viết tay dùng mạng neuron nhân tạo Mục tiêu bài báo trình bày các khái niệm căn bản, xây dựng mô hình nhận diệnchữ số viết tay bằng mạng neuron nhân tạo cho tỷ lệ nhận dạng đúng trên 90%. Cácphần tiếp theo của bài báo sẽ trình b|y đơn vị cấu tạo nhỏ nhất tạo thành mạng neuronnhân tạo đa lớp và cấu trúc, thông số của mô hình mạng neuron đa lớp cũng như kếtquả thực nghiệm với các trường hợp kh{c nhau để khảo sát, làm rõ chức năng của cácthông số trong mô hình mạng.2. NEURON NHÂN TẠO Neuron nhân tạo được xây dựng trên ý tưởng từ neuron sinh học, đơn vị cấutạo thành hệ thần kinh của não bộ con người. Những neuron này có nhiệm vụ nhận tínhiệu từ não bộ và truyền tín hiệu đến các bộ phận kh{c nhau trên cơ thể. Một cáchtương tự, ta có các neuron nhân tạo hay perceptron l| đơn vị cấu thành mạng neuronnhân tạo. Một perceptron sẽ nhận các ngõ vào có giá trị x1, x2, ... xn và ngõ ra củaperceptron sẽ cho ra giá trị nhị phân [3]. Hình 1 mô tả cấu trúc của một perceptron đơngiản với 2 giá trị đầu vào X1, X2. X1 Ngõ ra X2 Hình 1. Mô hình Perceptron đơn giản. Nhiệm vụ của perceptron là sử dụng các giá trị ngõ vào để tính toán và xácđịnh giá trị ngõ ra là 0 hoặc 1. Trong một mạng neuron nhân tạo, ngõ ra của neuronlớp trước sẽ là đầu vào của lớp tiếp theo.2.1 Trọng số (Weight – w) Weight hay trọng số (w) là con số biểu thị mức độ quan trọng của ngõ vào sovới ngõ ra [5]. Giá trị ngõ ra của perceptron phụ thuộc vào tổng giữa trọng số và ngõvào: ∑ (1) ∑ { Trong đó : ngõ vào thứ của perceptron; : trọng số của ngõ vào ; : mức ngưỡng quyết định giá trị ngõ ra. H|m x{c định ngõ ra ở (1) còn đượcgọi là hàm step. 120TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số 1 (2019)2.2 Bias – b Để đơn giản cho perceptron quyết định giá ...
Tìm kiếm theo từ khóa liên quan:
Mạng neuron nhân tạo Mạng perceptron đa lớp Trí tuệ nhân tạo Nhận dạng chữ số viết tay Cấu tạo mạng MLPTài liệu liên quan:
-
Đề cương chi tiết học phần Trí tuệ nhân tạo
12 trang 440 0 0 -
7 trang 230 0 0
-
Kết quả bước đầu của ứng dụng trí tuệ nhân tạo trong phát hiện polyp đại tràng tại Việt Nam
10 trang 187 0 0 -
6 trang 175 0 0
-
Xu hướng và tác động của cách mạng công nghiệp lần thứ tư đến môi trường thông tin số
9 trang 165 0 0 -
9 trang 157 0 0
-
Tìm hiểu về Luật An ninh mạng (hiện hành): Phần 1
93 trang 151 0 0 -
Luận văn tốt nghiệp: Ứng dụng trí tuệ nhân tạo trong xây dựng GAME
0 trang 130 0 0 -
Xác lập tư cách pháp lý cho trí tuệ nhân tạo
6 trang 129 1 0 -
Chuyển đổi số: cơ sở và ứng dụng
18 trang 122 0 0