Tóm tắt Luận án Tiến sĩ Toán học: Cải tiến phương pháp học máy trong chuỗi thời gian và ứng dụng
Số trang: 28
Loại file: pdf
Dung lượng: 1.75 MB
Lượt xem: 15
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận án "Cải tiến phương pháp học máy trong chuỗi thời gian và ứng dụng" phân tích một hoặc một vài chuỗi thời gian; đưa ra các mô hình phù hợp để tính các giá trị dự báo trong tương lai của một chuỗi thời gian được chọn tại một thời điểm đã chọn; tối ưu hóa kết quả cho cả dự báo ngắn hạn và dự báo dài hạn (có thể thêm dự báo trung hạn).
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án Tiến sĩ Toán học: Cải tiến phương pháp học máy trong chuỗi thời gian và ứng dụng BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC BÁCH KHOA HÀ NỘI --------------------------- Nguyễn Quang ĐạtCẢI TIẾN PHƯƠNG PHÁP HỌC MÁY TRONG CHUỖI THỜI GIAN VÀ ỨNG DỤNG Ngành: Toán học Mã số: 9460101 Hà Nội - 2023 Công trình được hoàn thành tại: Đại học Bách khoa Hà NộiTập thể hướng dẫn: 1. TS. Nguyễn Thị Ngọc Anh 2. PGS.TS. Nguyễn Ngọc DoanhPhản biện 1: ………………….Phản biện 2: ………………….Phản biện 3: ………………….Luận án được bảo vệ trước Hội đồng đánh giá Luận án Tiến sĩ cấpĐại học Bách Khoa Hà Nội, họp tại Đại học Bách Khoa Hà NộiVào hồi …… giờ ……., ngày ……tháng……năm……Có thể tìm hiểu luận án tại: 1. Thư viện Tạ Quang Bửu – Đại học Bách khoa Hà Nội. 2. Thư viện Quốc gia Việt Nam. Mở đầu Đặt vấn đề Dữ liệu được dự báo trong chuỗi thời gian là rất quan trọng cho việc dựbáo tương lai được nói tới bên trên. Các dữ liệu dự báo này, kết hợp với mộtsố các hệ thống khác (ví dụ như trong dự báo thời tiết thì gồm có cả hệ thốngảnh vệ tinh, dữ liệu quan trắc từ các điểm đo, v.v...) sẽ có thể đưa ra một kếtquả chính xác nhất cho hệ thống nhằm mục tiêu vận hành hệ thống một cáchhợp lý nhất. Động cơ nghiên cứu bài toán Một trong các vấn đề của Big-data là nghiên cứu chuỗi thời gian timeseries. Một trong những mục tiếu quan trọng nhất trong xử lý chuỗi thời gianlà dự báo (prediction hoặc forecasting). Mục tiêu của Luận án Trong Luận án này đã tập trung nghiên cứu và đưa ra một số mô hình máyhọc áp dụng cho dự báo chuỗi thời gian: (1) Phân tích một hoặc một vàichuỗi thời gian; (2) Đưa ra các mô hình phù hợp để tính các giá trị dự báotrong tương lai của một chuỗi thời gian được chọn tại một thời điểm đã chọn;(3) Tối ưu hóa kết quả cho cả dự báo ngắn hạn và dự báo dài hạn (có thểthêm dự báo trung hạn). Phạm vi của nghiên cứu Với các mục tiêu đặt ra bên trên, tôi đã tập trung vào nghiên cứu một sốvấn đề sau đây: (1) Phân tích ưu nhược điểm của một số mô hình máy họctruyền thống; (2) Áp dụng máy học trực tuyến (online learning) và một sốchuỗi thời gian; (3) Phân tích, cài đặt và chạy một số mô hình lai; (4) Mộtsố vấn đề tương lai cần giải quyết. Phương pháp nghiên cứu Hướng nghiên cứu mà tôi làm sẽ gồm một số phương pháp sau: (1) Ápdụng các phương pháp truyền thống; (2) Phân tích ưu nhược điểm của từngphương pháp truyền thống, từ đó nghiên cứu đưa ra mô hình lai phù hợp; (3)Khi đã có các mô hình được đề xuất, tôi sẽ áp dụng vào các bộ dữ liệu phùhợp để kiểm tra kết quả; (4) Phân tích, cài đặt và áp dụng chạy chương trình 1trên một số bộ dữ liệu đối với một số phương pháp máy học Online (trựctuyến); (5) Tổng hợp các vấn đề và đưa ra một số mô hình tốt nhất. Chương 1: Một số mô hình truyền thống trong chuỗi thời gian Chương này giới thiệu một số mô hình truyền thống đang được sử dụngrộng rãi hiện nay, gồm một số mô hình tuyến tính ARIMA, SARIMA, mộtsố mô hình mạng thần kinh nhân tạo là ANN, RNN và áp dụng mô hìnhWavelet trong lọc nhiễu xử lý dữ liệu. 1.1 Autoregressive Integrated Moving Average Model - ARIMA ARIMA, cụm từ viết tắt thông dụng của Autoregressive Integrated MovingAverage được các tác giả Box và Jenkin đưa ra trong năm 1971 [1], ứngdụng vào các mô hình tính toán cho chuỗi thời gian. Tới năm 1991, Brockvà David [2] đã đưa ra các mô tả chi tiết về mô hình ARIMA này. Hiện nay, mô hình ARIMA là một mô hình được sử dụng rộng rãi vào dựbáo chuỗi thời gian. Mô hình ARIMA là sự kết hợp của các mô hình thành phần: AR: tự hồiquy; I: sai phân; MA: trung bình trượt. Trong ARIMA, giá trị d thể hiên cho phần I, Integrated. Tiếp theo, chúng ta sẽ xem xét các giá trị p và q trong mô hình (chúng tagọi chúng là các tham số của mô hình ARIMA). Ở đây, p là tham số của phần tự hồi quy trong mô hình (phần AR của môhình ARIMA) (tiếng Anh là order of the ‘Auto Regressive’ (AR) term).Còn giá trị q là tham số tương ứng của phần trung bình trượt trong mô hình(phần MA trong mô hình ARIMA). yt 0 1 yt 1 2 yt 2 ... p yt p 1 t 1 2 t 1 ... q t q Do đó, mục tiêu của chúng ta trong mô hình ARIMA là xác định các giátrị của p, d, q. Cơ bản chúng ta có thể xây dựng mô hình ARIMA theo 4 bước sau: (1)Xác định tính dừng của chuỗi thời gian; (2) Ước lượng các tham số của mô 2hình. Ở đây là các tham số p và q; (3) Tính toán các giá trị của chuỗi thờigian để xác định độ chính xác của mô hình. Hiệu chỉnh các tham số p, d, q,đưa ra các ước lượng tốt hơn về các tham số này; (4) Dự đoán chuỗi thờigian (với một khoảng tin cậy). 1.2 Seasonal Autoregressive Integrated Moving Average – SARIMA Seasonal Autoregressive Integrated Moving Avera ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án Tiến sĩ Toán học: Cải tiến phương pháp học máy trong chuỗi thời gian và ứng dụng BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC BÁCH KHOA HÀ NỘI --------------------------- Nguyễn Quang ĐạtCẢI TIẾN PHƯƠNG PHÁP HỌC MÁY TRONG CHUỖI THỜI GIAN VÀ ỨNG DỤNG Ngành: Toán học Mã số: 9460101 Hà Nội - 2023 Công trình được hoàn thành tại: Đại học Bách khoa Hà NộiTập thể hướng dẫn: 1. TS. Nguyễn Thị Ngọc Anh 2. PGS.TS. Nguyễn Ngọc DoanhPhản biện 1: ………………….Phản biện 2: ………………….Phản biện 3: ………………….Luận án được bảo vệ trước Hội đồng đánh giá Luận án Tiến sĩ cấpĐại học Bách Khoa Hà Nội, họp tại Đại học Bách Khoa Hà NộiVào hồi …… giờ ……., ngày ……tháng……năm……Có thể tìm hiểu luận án tại: 1. Thư viện Tạ Quang Bửu – Đại học Bách khoa Hà Nội. 2. Thư viện Quốc gia Việt Nam. Mở đầu Đặt vấn đề Dữ liệu được dự báo trong chuỗi thời gian là rất quan trọng cho việc dựbáo tương lai được nói tới bên trên. Các dữ liệu dự báo này, kết hợp với mộtsố các hệ thống khác (ví dụ như trong dự báo thời tiết thì gồm có cả hệ thốngảnh vệ tinh, dữ liệu quan trắc từ các điểm đo, v.v...) sẽ có thể đưa ra một kếtquả chính xác nhất cho hệ thống nhằm mục tiêu vận hành hệ thống một cáchhợp lý nhất. Động cơ nghiên cứu bài toán Một trong các vấn đề của Big-data là nghiên cứu chuỗi thời gian timeseries. Một trong những mục tiếu quan trọng nhất trong xử lý chuỗi thời gianlà dự báo (prediction hoặc forecasting). Mục tiêu của Luận án Trong Luận án này đã tập trung nghiên cứu và đưa ra một số mô hình máyhọc áp dụng cho dự báo chuỗi thời gian: (1) Phân tích một hoặc một vàichuỗi thời gian; (2) Đưa ra các mô hình phù hợp để tính các giá trị dự báotrong tương lai của một chuỗi thời gian được chọn tại một thời điểm đã chọn;(3) Tối ưu hóa kết quả cho cả dự báo ngắn hạn và dự báo dài hạn (có thểthêm dự báo trung hạn). Phạm vi của nghiên cứu Với các mục tiêu đặt ra bên trên, tôi đã tập trung vào nghiên cứu một sốvấn đề sau đây: (1) Phân tích ưu nhược điểm của một số mô hình máy họctruyền thống; (2) Áp dụng máy học trực tuyến (online learning) và một sốchuỗi thời gian; (3) Phân tích, cài đặt và chạy một số mô hình lai; (4) Mộtsố vấn đề tương lai cần giải quyết. Phương pháp nghiên cứu Hướng nghiên cứu mà tôi làm sẽ gồm một số phương pháp sau: (1) Ápdụng các phương pháp truyền thống; (2) Phân tích ưu nhược điểm của từngphương pháp truyền thống, từ đó nghiên cứu đưa ra mô hình lai phù hợp; (3)Khi đã có các mô hình được đề xuất, tôi sẽ áp dụng vào các bộ dữ liệu phùhợp để kiểm tra kết quả; (4) Phân tích, cài đặt và áp dụng chạy chương trình 1trên một số bộ dữ liệu đối với một số phương pháp máy học Online (trựctuyến); (5) Tổng hợp các vấn đề và đưa ra một số mô hình tốt nhất. Chương 1: Một số mô hình truyền thống trong chuỗi thời gian Chương này giới thiệu một số mô hình truyền thống đang được sử dụngrộng rãi hiện nay, gồm một số mô hình tuyến tính ARIMA, SARIMA, mộtsố mô hình mạng thần kinh nhân tạo là ANN, RNN và áp dụng mô hìnhWavelet trong lọc nhiễu xử lý dữ liệu. 1.1 Autoregressive Integrated Moving Average Model - ARIMA ARIMA, cụm từ viết tắt thông dụng của Autoregressive Integrated MovingAverage được các tác giả Box và Jenkin đưa ra trong năm 1971 [1], ứngdụng vào các mô hình tính toán cho chuỗi thời gian. Tới năm 1991, Brockvà David [2] đã đưa ra các mô tả chi tiết về mô hình ARIMA này. Hiện nay, mô hình ARIMA là một mô hình được sử dụng rộng rãi vào dựbáo chuỗi thời gian. Mô hình ARIMA là sự kết hợp của các mô hình thành phần: AR: tự hồiquy; I: sai phân; MA: trung bình trượt. Trong ARIMA, giá trị d thể hiên cho phần I, Integrated. Tiếp theo, chúng ta sẽ xem xét các giá trị p và q trong mô hình (chúng tagọi chúng là các tham số của mô hình ARIMA). Ở đây, p là tham số của phần tự hồi quy trong mô hình (phần AR của môhình ARIMA) (tiếng Anh là order of the ‘Auto Regressive’ (AR) term).Còn giá trị q là tham số tương ứng của phần trung bình trượt trong mô hình(phần MA trong mô hình ARIMA). yt 0 1 yt 1 2 yt 2 ... p yt p 1 t 1 2 t 1 ... q t q Do đó, mục tiêu của chúng ta trong mô hình ARIMA là xác định các giátrị của p, d, q. Cơ bản chúng ta có thể xây dựng mô hình ARIMA theo 4 bước sau: (1)Xác định tính dừng của chuỗi thời gian; (2) Ước lượng các tham số của mô 2hình. Ở đây là các tham số p và q; (3) Tính toán các giá trị của chuỗi thờigian để xác định độ chính xác của mô hình. Hiệu chỉnh các tham số p, d, q,đưa ra các ước lượng tốt hơn về các tham số này; (4) Dự đoán chuỗi thờigian (với một khoảng tin cậy). 1.2 Seasonal Autoregressive Integrated Moving Average – SARIMA Seasonal Autoregressive Integrated Moving Avera ...
Tìm kiếm theo từ khóa liên quan:
Tóm tắt Luận án Tiến sĩ Luận án Tiến sĩ Toán học Cải tiến phương pháp học máy Dự báo chuỗi thời gian Máy học trực tuyếnGợi ý tài liệu liên quan:
-
Tóm tắt Luận án Tiến sĩ Quản lý công: Quản lý nhà nước về thú y trên địa bàn thành phố Hà Nội
25 trang 232 0 0 -
27 trang 193 0 0
-
27 trang 151 0 0
-
29 trang 146 0 0
-
27 trang 135 0 0
-
8 trang 127 0 0
-
27 trang 120 0 0
-
27 trang 119 0 0
-
28 trang 114 0 0
-
26 trang 114 0 0