Giới thiệu về Mạng Nơron
Số trang: 27
Loại file: pdf
Dung lượng: 649.90 KB
Lượt xem: 9
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mạng nơ-ron là 1 họ các quá trình xử lý thông tin dựa trên mô hình các nơ-ron thần kinh của con người. Kết hợp 1 số lượng lớn các thành phần đơn giản (nơ-ron) cấu trúc phức tạp nhằm giải quyết 1 vấn đề cụ thể nào đó Giống như con người, mạng nơ-ron học bằng các ví dụ (mẫu) Lĩnh vực ứng dụng: Phát hiện bệnh Dự báo thị trường chứng khoán Nghiên cứu khách hàng Kiểm tra độ tin cậy của máy móc Quản lý rủi ro …
...
Nội dung trích xuất từ tài liệu:
Giới thiệu về Mạng Nơron Giới thiệu về Mạng Nơron Trình bày: Phạm Nguyên Khang 1 Nội dung trình bày Sơ lược về mạng nơ-ron Perceptron Mạng nơron nhiều tầng (MLP) Giải thuật lan truyền ngược (back propagation) Một số vấn đề của mạng nơ-ron Hướng phát triển Thảo luận 2 Nơ-ron sinh học 3 Nơ-ron sinh học 4 Sơ lược về mạng nơ-ron Mạng nơ-ron là 1 họ các quá trình xử lý thông tin dựa trên mô hình các nơ-ron thần kinh của con người. Kết hợp 1 số lượng lớn các thành phần đơn giản (nơ-ron) cấu trúc phức tạp nhằm giải quyết 1 vấn đề cụ thể nào đó Giống như con người, mạng nơ-ron học bằng các ví dụ (mẫu) Lĩnh vực ứng dụng: Phát hiện bệnh Dự báo thị trường chứng khoán Nghiên cứu khách hàng Kiểm tra độ tin cậy của máy móc Quản lý rủi ro … 5 Nơ-ron nhân tạo (artificial neuron) Mô phỏng các nơ-ron sinh học Nhận các tín hiệu từ các nơ-ron khác (hay từ đầu vào). Nếu giá trị (tổng các tín hiệu có nhân hệ số) nhận được vượt quá một ngưỡng nào đó, nơ-ron này sẽ kích hoạt (nó sẽ gửi tín hiệu đến các nơ-ron khác nữa) 6 Perceptron Perceptron là mô hình đơn giản nhất của mạng nơ-ron (chỉ có 1 tầng). Perceptron = 1 nơ-ron nhân tạo Mô hình toán của perceptron: ⎛ d ⎞ output = f ⎜ ∑ vi wi ⎟ ⎝ i =1 ⎠ f được gọi là hàm kích hoạt (activation action) hay hàm truyền có thể là: Tuyến tính Ngưỡng (Heaviside step) 1 Logistic sigmoid g ( x) = Gauss 1 + e− x … 7 Huấn luyện Perceptron (1) Xét trường hợp, ⎧ d perceptron xử dụng hàm ⎪+ 1, ⎪ ∑v w i i >t kích hoạt ngưỡng. output = ⎨ i =1 d ⎪− 1, ⎪ ⎩ ∑v w i =1 i i ≤t Nếu cho w0 = -t, và v0 = 1, ta có thể viết lại: ⎧ d ⎪+ 1, ⎪ ∑v w i i >0 ⎛ d ⎞ output = ⎨ i =0 d = sign⎜ ∑ vi wi ⎟ ⎝ i =0 ⎠ ⎪− 1, ⎪ ⎩ ∑ i =0 vi wi ≤ 0 8 Huấn luyện Perceptron (2) Khởi tạo: Khởi tạo w (0 hoặc ngẫu nhiên) Chọn tốc độ học µ Học: Với mỗi mẫu (x, t) trong tập học Tính y = f(x,w) Nếu (y != t) thay đổi vectơ trọng số w w(mới) = w(cũ) + µ(t-y)x Lặp lại quá trình « học » cho đến khi « điều kiện dừng » thỏa mãn 9 Điều kiện dừng Quá trình học, thực chất là quá trình đi tìm các trọng số w sao cho lỗi xảy ra là nhỏ nhất phương pháp giải bài toán tối ưu Điều kiện dừng trong quá trình học có thể là 1 trong các tiêu chí, hay kết hợp các tiêu chí: Lỗi nhỏ đến mức chấp nhận được Sau một số bước lặp đủ lớn … 10 Khả năng của Perceptron Phương trình v.w = 0 chính là một siêu phẳng trong không gian d-chiều. Perceptron có khả năng phân lớp tuyến tính. Có thể dùng để giải bài toán hồi quy tuyến tính Hạn chế của Perceptron: Không thể phân lớp phi tuyến Ví dụ: bài toán XOR Giải pháp: Sử dụng mạng nơ-ron nhiều tầng MLP 11 Mạng nơ-ron nhiều tầng (MLP) 12 Mạng nơ-ron nhiều tầng (MLP) 13 Mạng nơ-ron nhiều tầng (MLP) input, output và các tầng ẩn (hiden layers). Số lượng các nơ-ron trong tầng input = số chiều Số lượng các nơ-ron trong tầng output thường = số các lớp Thông thường các mạng nơ-ron dùng 1 tầng ẩn. Số lượng các nơ-ron trong tầng ẩn thường được chọn = ½ (số nơ-ron tầng input + số nơ-ron trong tầng output) Chú ý: các nơ-ron trong tầng input thực sự không phải là các nơ-ron. Nó chỉ là chỗ để đưa dữ liệu của các mẫu vào 14 Huấn luyện MLP Là quá trình thay đổi giá trị của w để mạng biểu diễn được tập dữ liệu học. Sự khác nhau giữa giá trị thật của mẫu và kết quả dự đoán của mạng gọi là lỗi (học có giám sát). Hàm lỗi thường dùng là sum squared error Hàm lỗi sẽ là một hàm (n+1) biến. Nếu vẽ trong không gian n+1 chiều ta sẽ có một mặt lỗi (error surface) Quá trình huấn luyện sẽ tìm các wi* để lỗi nhỏ nhất. Trong trường hợp tuyến tính, vói hàm lỗi là sum squared error thì mặt lỗi có dạng parapola có thể tìm được w* để lỗi = min tương đối dễ dàng Trong trường hợp tổng quát, hàm lỗi phức tạp (ví dụ: không phải hàm lồi) vấn đề cực tiểu cục bộ (local minimum) giải pháp ??? 15 Một số giải thuật huấn luyện MLP Back propagation (khá nổi tiếng, dễ hiểu) Conjugate gradient descent & Levenber- Marquardt (Bishop 1995, Shepherd 1997) Quick propagation (Fahlman, 1988) Delta-Bar-Delta(Jacob 1988) 16 G ...
Nội dung trích xuất từ tài liệu:
Giới thiệu về Mạng Nơron Giới thiệu về Mạng Nơron Trình bày: Phạm Nguyên Khang 1 Nội dung trình bày Sơ lược về mạng nơ-ron Perceptron Mạng nơron nhiều tầng (MLP) Giải thuật lan truyền ngược (back propagation) Một số vấn đề của mạng nơ-ron Hướng phát triển Thảo luận 2 Nơ-ron sinh học 3 Nơ-ron sinh học 4 Sơ lược về mạng nơ-ron Mạng nơ-ron là 1 họ các quá trình xử lý thông tin dựa trên mô hình các nơ-ron thần kinh của con người. Kết hợp 1 số lượng lớn các thành phần đơn giản (nơ-ron) cấu trúc phức tạp nhằm giải quyết 1 vấn đề cụ thể nào đó Giống như con người, mạng nơ-ron học bằng các ví dụ (mẫu) Lĩnh vực ứng dụng: Phát hiện bệnh Dự báo thị trường chứng khoán Nghiên cứu khách hàng Kiểm tra độ tin cậy của máy móc Quản lý rủi ro … 5 Nơ-ron nhân tạo (artificial neuron) Mô phỏng các nơ-ron sinh học Nhận các tín hiệu từ các nơ-ron khác (hay từ đầu vào). Nếu giá trị (tổng các tín hiệu có nhân hệ số) nhận được vượt quá một ngưỡng nào đó, nơ-ron này sẽ kích hoạt (nó sẽ gửi tín hiệu đến các nơ-ron khác nữa) 6 Perceptron Perceptron là mô hình đơn giản nhất của mạng nơ-ron (chỉ có 1 tầng). Perceptron = 1 nơ-ron nhân tạo Mô hình toán của perceptron: ⎛ d ⎞ output = f ⎜ ∑ vi wi ⎟ ⎝ i =1 ⎠ f được gọi là hàm kích hoạt (activation action) hay hàm truyền có thể là: Tuyến tính Ngưỡng (Heaviside step) 1 Logistic sigmoid g ( x) = Gauss 1 + e− x … 7 Huấn luyện Perceptron (1) Xét trường hợp, ⎧ d perceptron xử dụng hàm ⎪+ 1, ⎪ ∑v w i i >t kích hoạt ngưỡng. output = ⎨ i =1 d ⎪− 1, ⎪ ⎩ ∑v w i =1 i i ≤t Nếu cho w0 = -t, và v0 = 1, ta có thể viết lại: ⎧ d ⎪+ 1, ⎪ ∑v w i i >0 ⎛ d ⎞ output = ⎨ i =0 d = sign⎜ ∑ vi wi ⎟ ⎝ i =0 ⎠ ⎪− 1, ⎪ ⎩ ∑ i =0 vi wi ≤ 0 8 Huấn luyện Perceptron (2) Khởi tạo: Khởi tạo w (0 hoặc ngẫu nhiên) Chọn tốc độ học µ Học: Với mỗi mẫu (x, t) trong tập học Tính y = f(x,w) Nếu (y != t) thay đổi vectơ trọng số w w(mới) = w(cũ) + µ(t-y)x Lặp lại quá trình « học » cho đến khi « điều kiện dừng » thỏa mãn 9 Điều kiện dừng Quá trình học, thực chất là quá trình đi tìm các trọng số w sao cho lỗi xảy ra là nhỏ nhất phương pháp giải bài toán tối ưu Điều kiện dừng trong quá trình học có thể là 1 trong các tiêu chí, hay kết hợp các tiêu chí: Lỗi nhỏ đến mức chấp nhận được Sau một số bước lặp đủ lớn … 10 Khả năng của Perceptron Phương trình v.w = 0 chính là một siêu phẳng trong không gian d-chiều. Perceptron có khả năng phân lớp tuyến tính. Có thể dùng để giải bài toán hồi quy tuyến tính Hạn chế của Perceptron: Không thể phân lớp phi tuyến Ví dụ: bài toán XOR Giải pháp: Sử dụng mạng nơ-ron nhiều tầng MLP 11 Mạng nơ-ron nhiều tầng (MLP) 12 Mạng nơ-ron nhiều tầng (MLP) 13 Mạng nơ-ron nhiều tầng (MLP) input, output và các tầng ẩn (hiden layers). Số lượng các nơ-ron trong tầng input = số chiều Số lượng các nơ-ron trong tầng output thường = số các lớp Thông thường các mạng nơ-ron dùng 1 tầng ẩn. Số lượng các nơ-ron trong tầng ẩn thường được chọn = ½ (số nơ-ron tầng input + số nơ-ron trong tầng output) Chú ý: các nơ-ron trong tầng input thực sự không phải là các nơ-ron. Nó chỉ là chỗ để đưa dữ liệu của các mẫu vào 14 Huấn luyện MLP Là quá trình thay đổi giá trị của w để mạng biểu diễn được tập dữ liệu học. Sự khác nhau giữa giá trị thật của mẫu và kết quả dự đoán của mạng gọi là lỗi (học có giám sát). Hàm lỗi thường dùng là sum squared error Hàm lỗi sẽ là một hàm (n+1) biến. Nếu vẽ trong không gian n+1 chiều ta sẽ có một mặt lỗi (error surface) Quá trình huấn luyện sẽ tìm các wi* để lỗi nhỏ nhất. Trong trường hợp tuyến tính, vói hàm lỗi là sum squared error thì mặt lỗi có dạng parapola có thể tìm được w* để lỗi = min tương đối dễ dàng Trong trường hợp tổng quát, hàm lỗi phức tạp (ví dụ: không phải hàm lồi) vấn đề cực tiểu cục bộ (local minimum) giải pháp ??? 15 Một số giải thuật huấn luyện MLP Back propagation (khá nổi tiếng, dễ hiểu) Conjugate gradient descent & Levenber- Marquardt (Bishop 1995, Shepherd 1997) Quick propagation (Fahlman, 1988) Delta-Bar-Delta(Jacob 1988) 16 G ...
Gợi ý tài liệu liên quan:
-
Mô hình điện mặt trời cho Việt Nam
3 trang 139 0 0 -
Luận văn Điều khiển máy công nghiệp bằng thiết bị lập trình
98 trang 107 0 0 -
46 trang 99 0 0
-
Luận văn: Lọc thích nghi với thuật toán LMS và ứng dụng trong cân bằng kênh
74 trang 68 0 0 -
6 trang 65 0 0
-
An toàn hạt nhân - Yếu tố quyết định tương lai điện hạt nhân
3 trang 38 0 0 -
BÀI TẬP PHẦN BJT MÔN KỸ THUẬT ĐIỆN TỬ
8 trang 33 0 0 -
Nghiên cứu phát triển bo mạch điều khiển máy điều hòa nhiệt độ sử dụng công nghệ PSoC
6 trang 31 0 0 -
Xây dựng hệ thống nhúng (phần 2)
114 trang 30 0 0 -
Ứng dụng của Điện tử - Viễn thông
5 trang 29 0 0