Ứng dụng phương pháp Học tăng cường xây dựng mô hình xe tự hành
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Ứng dụng phương pháp Học tăng cường xây dựng mô hình xe tự hành 16 Nguyễn Dũng, Đặng Việt Hùng,... / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 6(49) (2021) 16-26 6(49) (2021) 16-26 Ứng dụng phương pháp Học tăng cường xây dựng mô hình xe tự hành Applying Reinforcement Learning method to building self-driving car model Nguyễn Dũnga, Đặng Việt Hùnga*, Lê Thị Ngọc Vâna, Trần Huệ Chia, Phan Văn Sơna, Nguyễn Quang Vinhc Nguyen Dunga, Hung Dang Vieta*, Le Thi Ngoc Vana, Tran Hue Chia, Phan Van Sona, Nguyen Quang Vinhc a Khoa Công nghệ Thông tin, Trường Đại học Duy Tân, Đà Nẵng, Việt Nam a Faculty of Information Technology, Duy Tan University, 55000, Danang, Vietnam b Viện Nghiên cứu và Phát triển Công nghệ Cao, Ðại học Duy Tân, Ðà Nẵng, Việt Nam b Institute of Research and Development, Duy Tan University, Da Nang, 550000, Vietnam c Tổng Công ty Điện lực Tp.HCM, Hồ Chí Minh, Việt Nam. c Ho Chi Minh city Power Corporation, 700000 Ho Chi Minh city, Vietnam (Ngày nhận bài: 03/8/2021, ngày phản biện xong: 02/11/2021, ngày chấp nhận đăng: 02/12/2021) Tóm tắt Bài báo áp dụng thuật toán Q-Learning vào huấn luyện xe tự hành và tránh va chạm với chướng ngại vật. Hiện nay xe tự hành là loại xe đang được rất nhiều công ty tham gia nghiên cứu và mong muốn sản xuất đưa vào thực tiễn sử dụng. Q-Learning (Watkins, 1989) là một hình thức Học tăng cường không cần mô hình và có thể được xem như là một phương pháp lập trình động không đồng bộ (DP). Nó cho phép Tác tử khả năng học tập để hành động tối ưu trong môi trường có thuộc tính Markov bằng cách trải nghiệm kết quả của hành động, mà không cần phải xây dựng mô hình xác suất. Bài báo này trình bày quá trình xây dựng chương trình mô phỏng hệ thống xe tự hành dựa vào thuật toán Q- Learning. Kết quả cho thấy thuật toán Q-Learning thành công trong việc xây dựng một kĩ thuật tự huấn luyện để thích nghi với yêu cầu nào đó. Từ khóa: Q-Learning; Học tăng cường; Markov; xe tự hành. Abstract This paper applies Q-Learning algorithm to training a self-driving cars (SDC) model to avoid moving obstacles. Currently, SDC is one of the trendy fields that many companies do research to produce and put into practice. Q- Learning (Watkins, 1989) is a form of model-free reinforcement learning (RL). It can also be viewed as an asynchronous dynamic programming (DP) method. It gives agents an ability to learn how to act optimally in Markov environment by experiencing the results of the action, without building problem model maps. In this work, we build a self-driving car simulation program based on the Q-Learning algorithm. The results show that Q-learning can successfully equipt an agent to self-train for achieving some target. Keywords: Q-Learning: Reinforcement Learning (RL); Markov; self-driving car. * Corresponding Author: Dang Viet Hung, Faculty of Information Technology, Duy Tan University, 55000, Danang, Vietnam; Institute of Research and Devolopment, Duy Tan University, 55000, Danang, Vietnam. Email: dangviethung@duytan.edu.vn Nguyễn Dũng, Đặng Việt Hùng,... / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 6(49) (2021) 16-26 17 1. Giới thiệu controlled car” (một chiếc xe điều khiển bằng Học máy nghiên cứu cách thức để mô hình sóng radio). Tuy nhiên nó đã không được thành hóa bài toán cho phép máy tính tự động hiểu, công như mong đợi. Sau đó đến năm 1969 John xử lý và học từ dữ liệu để thực thi nhiệm vụ McCarthy đã đưa ra khái niệm tự trị và đặt tên được giao cũng như cách đánh giá giúp tăng là ROBO-CHAUFFevo [4]. Ông là một trong tính hiệu quả. Dưới góc nhìn của trí tuệ nhân những người sáng lập trí tuệ nhân tạo, ông đã tạo, động lực chính của học máy là nhu cầu thu đưa ra thuật ngữ ‘Ô tô điều khiển bằng máy nhận tri thức. Thật vậy, trong nhiều trường hợp, tính’. Ý tưởng của ông nhắc đến một chiếc xe kiến thức chuyên gia khan hiếm hoặc tiến độ có khả năng tự động điều hướng qua các con thực hiện chậm vì một số nhiệm vụ cần đưa ra đường bằng cách sử dụng cùng một góc nhìn quyết định nhanh chóng dựa trên xử lý dữ liệu như con người có được khi lái xe. khổng lồ và thiếu ổn định dẫn đến việc buộc Các nhà khoa học và các nhà sản xuất xe ô phải dùng đến máy tính. Tom Mitchell, giáo sư tô bắt đầu tiếp cận bài toán, vào năm 2003 nổi tiếng của Đại học Carnegie Mellon Toyota đã ra mắt Prius hybrid [5]. Chiếc xe sử University - CMU định nghĩa cụ thể và chuẩn dụng các cảm biến (sensor) và camera hoạt mực hơn về học máy như sau: Một chương động tốt để hoạt động trong các bãi đỗ xe tự trình máy tính được xem là học cách thực thi động điều này mang lại niềm phấn khích lớn. một lớp nhiệm vụ thông qua trải nghiệm, đối Xu hướng sau đó được tiếp nối bởi BMW cũng với thang đo năng lực nếu như dùng năng lực ta như cách này hệ thống đỗ xe tự động. Tiếp đó đo thấy năng lực thực thi của chương trình có là sự ra đời của Tesla Autopilot vào năm 2015 tiến bộ sau khi trải qua trải nghiệm (máy đã và Gm Super Cruise – 2017 được hỗ trợ tự học)” [1] động với hệ thống phanh, kiểm soát tốc độ và Reinforcement Learning (RL) là một lớp ...
Tìm kiếm theo từ khóa liên quan:
Bài viết nghiên cứu khoa học Q-Learning Học tăng cường Xe tự hành Phương pháp Học tăng cường Xây dựng mô hình xe tự hànhGợi ý tài liệu liên quan:
-
6 trang 215 0 0
-
Constraints on preinflation fluctuations in a nearly flat open ΛCDM cosmology
8 trang 124 0 0 -
Hành trình tiếp nhận chủ nghĩa Mác – Lênin và tìm ra con đường cứu nước của Chủ tịch Hồ Chí Minh
5 trang 112 0 0 -
Đổi mới đào tạo ngành Tài chính – Ngân hàng ở Việt Nam: Thực tiễn và bài học kinh nghiệm
6 trang 101 0 0 -
Đánh giá hiệu năng trong mạng có kết nối không liên tục DTN
8 trang 94 0 0 -
4 trang 82 0 0
-
7 trang 69 0 0
-
Cội nguồn khát vọng xây dựng đất nước giàu mạnh trong tư tưởng Hồ Chí Minh
6 trang 58 0 0 -
Phương pháp giảng dạy đối với học phần Kế toán tài chính 1
8 trang 57 0 0 -
7 trang 49 0 0
-
Nghiên cứu hiệu ứng quang xúc tác và khả năng hấp phụ Cr (VI) của vật liệu Nanocomposite ZnO – CuO
7 trang 47 0 0 -
Vai trò giáo dục thế giới quan duy vật biện chứng đối với sinh viên Việt Nam hiện nay
4 trang 41 0 0 -
Giải pháp rút ngắn khoảng cách giàu nghèo
6 trang 38 0 0 -
Quan hệ lao động trong bối cảnh Việt Nam thực hiện Hiệp định EVFTA
5 trang 38 0 0 -
Smart tourism: A case study of Da Nang city
13 trang 36 0 0 -
Phát hiện malware dựa trên header của tập tin Portable Executable sử dụng Machine Learning
6 trang 36 0 0 -
Một số vấn đề đặt ra đối với hệ thống an sinh xã hội ở Việt Nam hiện nay
7 trang 36 0 0 -
Xu hướng biến đổi cơ cấu xã hội - giai cấp ở Việt Nam hiện nay
6 trang 33 0 0 -
Quy định số: 03/2020-QyĐ/TC-HVNH
7 trang 33 0 0 -
Giáo dục đại học định hướng công dân toàn cầu ở Việt Nam
5 trang 32 0 0