Tổng quan về những ứng dụng của mạng Nơ-ron trong điều khiển

Số trang: 8 Loại file: pdf Dung lượng: 308.56 KB Lượt xem: 11 Lượt tải: 0

Jamona

Phí tải xuống: 1,000 VND

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài báo sẽ giới thiệu về mạng nơ-ron, phương pháp huấn luyện mạng và những ứng dụng trong lĩnh vực điều khiển. Một số kết quả nghiên cứu nổi bật trong những năm gần đây sẽ được trình bày. Cuối cùng, những thuận lợi, khó khăn và hướng phát triển của mạng nơ-ron trong điều khiển được đưa ra.
Nội dung trích xuất từ tài liệu:
Tổng quan về những ứng dụng của mạng Nơ-ron trong điều khiển Những vấn đề chung TỔNG QUAN VỀ NHỮNG ỨNG DỤNG CỦA MẠNG NƠ-RON TRONG ĐIỀU KHIỂN Nguyễn Hoài Nam* Tóm tắt: Bài báo sẽ giới thiệu về mạng nơ-ron, phương pháp huấn luyện mạng và những ứng dụng trong lĩnh vực điều khiển. Một số kết quả nghiên cứu nổi bật trong những năm gần đây sẽ được trình bày. Cuối cùng, những thuận lợi, khó khăn và hướng phát triển của mạng nơ-ron trong điều khiển được đưa ra. Từ khóa: Mạng nơ-ron, Nhận dạng, Tối ưu, Điều khiển, Phương pháp huấn luyện mạng, Điều khiển dự báo theo mô hình, Điều khiển theo mô hình mẫu, Điểm giả cực trị. 1. ĐẶT VẤN ĐỀ Mạng nơ-ron ra đời từ những năm 1940 bởi McCulloch và Pitts [1]. Hai tác giả này là những người đầu tiên đưa ra một mô hình toán học của nơ-ron. Với mô hình này, các đầu vào của nơ ron được nhân với các trọng số, sau đó được đưa vào bộ tổng. Đầu ra của bộ tổng sẽ được so sánh với một giá trị ngưỡng để xác định đầu ra của nơ-ron có kích thích hay không. Mạng nơ-ron này đã được chứng tỏ là có khả năng xấp xỉ các hàm lô gíc và hàm đại số. Sau đó mạng nơ-ron nhiều lớp được đưa ra vào những năm 1960, tuy nhiên, ở giai đoạn đó chưa có phương pháp huấn luyện mạng nào để có thể huấn luyện được mạng nhiều lớp. Do đó, có một khoảng thời gian dài những nghiên cứu về mạng nơ-ron gần như bế tắc. Cho đến năm 1986, Rumelhart and McClelland đã đưa ra thuật toán lan truyền ngược để huấn luyện mạng nơ-ron [2]. Từ đó những nghiên cứu về mạng nơ-ron lại bắt đầu bùng nổ. Dựa trên cơ sở thuật toán lan truyền ngược, đã có rất nhiều phương pháp huấn luyện mạng khác nhau như hạ nhanh nhất, hướng liên hợp, hiệu chỉnh hệ số học và Marquardt [3]. Thuật toán Marquardt ra đời từ năm 1963 [4] bởi tác giả Marquardt. Ông đã phát triển thuật toán dựa trên nghiên cứu của Levenberg. Hagan [3] đã chỉ ra rằng thuật toán Marquardt hiệu quả hơn hẳn so với các phương pháp khác đặc biệt về tốc độ hội tụ khi kích thước của mạng nơ-ron lên tới hàng trăm thông số. Mặc dù mạng nơ-ron ra đời từ rất lâu và đã được ứng dụng rộng rãi và thành công trong các lĩnh vực như phân loại mẫu, nhận dạng mẫu, xấp xỉ dữ liệu, nhưng những ứng dụng trong lĩnh vực nhận dạng và điều khiển các hệ thống động học vẫn còn khá mới mẻ và ít được quan tâm. Cho đến những năm đầu của thập kỷ 90, mạng nơ-ron mới được nghiên cứu và ứng dụng vào nhận dạng và điều khiển [5], [6], [7]. Mạng nơ-ron có thể được sử dụng như mô hình cho đối tượng hoặc bộ điều khiển. Lớp các mạng nơ-ron này thường là mạng nơ-ron động học và có hồi qui. Để huấn luyện mạng hồi qui này người ta thường sử dụng thuật toán lan truyền ngược [8]. Horn đã chỉ ra rằng khi huấn luyện một lớp mạng hồi qui sẽ gặp những khó khăn vì có rất nhiều vùng giả cực trị [9]. Tác giả này đã sử dụng phương pháp phân tích các nghiệm của đa thức ngẫu nhiên để phân tích những nguyên nhân gây ra các vùng giả cực trị này. Trên cơ sở đó một số giải pháp đã được đưa ra để tránh các vùng giả cực trị này trong quá trình huấn luyện mạng như: (1) dùng hàm mục tiêu gồm tổng các sai số bình phương cộng với tích của hệ số điều chỉnh nhân với tổng bình phương các trọng số, phương pháp này sẽ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2016 3 Điều khiển – Cơ điện tử - Truyền thông ép các trọng số của mạng nơ-ron về vùng ổn định trong quá trình huấn luyện mạng; (2) dùng nhiều chuỗi dữ liệu huấn luyện mạng khác nhau, ta có thể dùng một chuỗi để huấn luyện mạng với một số lần học, sau đó chuyển sang sử dụng chuỗi khác hoặc có thể tính gradient cho các chuỗi, sau đó lấy giá trị gradient trung bình; (3) chọn các giá trị ban đầu cho các trọng số của mạng một cách ngẫu nhiên. Phan [11] cũng đưa ra một đề xuất mới cho việc tránh các điểm giả cực trị dựa trên thông tin gradient lớn nhất của các chuỗi, chuỗi có gradient lớn nhất sẽ bị loại bỏ khỏi quá trình huấn luyện mạng. Jafari [12] đã đưa ra phương pháp chọn khoảng dự báo tối ưu trong quá trình huấn luyện mạng. Phương pháp này giúp quá trình huấn luyện mạng nhanh hơn và tránh được những vùng giả cực trị. Có nhiều cấu trúc điều khiển sử dụng mạng nơ-ron khác nhau đã được đề xuất. Trong bài báo này, chỉ một số dạng chính được trình bày, như là điều khiển dự báo, điều khiển tuyến tính hóa phản hồi và điều khiển tham chiếu mô hình [13]. Việc lựa chọn cấu trúc cho mạng nơ-ron như thế nào trước khi huấn luyện mạng cũng là một vấn đề rất quan trọng. Nếu cấu trúc mạng hợp lý ta có thể huấn luyện được mạng, ngược lại ta sẽ không thể huấn luyện mạng. Hiện tại chưa có phương pháp lựa chọn cấu trúc mạng một cách tổng quát cho bài toán nhận dạng đối tượng bất kỳ, tuy nhiên cũng có những kỹ thuật được sử dụng để chỉnh định cấu trúc mạng trong quá trình huấn luyện mạng [14, 15, 16, 17] như thêm hoặc bớt nơ-ron, lựa chọn cấu trúc mạng sử dụng giải thuật di truyền. Việc huấn luyện mạng có thể bắt đầu bằng một cấu trúc mạng đơn giản nhất, sau đó tăng dần số nơ-ron hoặc bắt đầu bằng một cấu trúc mạng lớn, sau đó sẽ bỏ dần số nơ-ron đi. Ngoài ra, giải thuật di truyền, phương pháp phân loại mẫu cũng có thể được sử dụng để lựa chọn cấu trúc mạng. Nội dung tiếp theo của bài báo được trình bày như sau. Phần hai sẽ giới thiệu về cấu trúc mạng nơ-ron động học và phương pháp huấn luyện mạng này. Phần tiếp theo sẽ trình bày về các cấu trúc hệ thống điều khiển dựa trên cơ sở mạng nơ ron. Phần cuối sẽ đưa ra những nhận xét, gợi ý và kết luận. 2. MẠNG NƠ-RON ĐỘNG HỌC 2.1. Cấu trúc mạng nơ-ron động học Hình 1. Ví dụ về mạng nơ-ron hồi quy. Mạng nơ ron động học gồm nhiều lớp, trong đó đầu ra của mỗi lớp có thể được phản hồi trở về đầu vào của lớp đó hoặc các lớp trước thông qua khối trễ TDL (Tapped Delay Lines). Khối trễ này gồm nhiều ...