Danh mục

Áp dụng một vài phương pháp máy học vào bài toán dự báo theo chuỗi thời gian

Số trang: 12      Loại file: pdf      Dung lượng: 688.92 KB      Lượt xem: 16      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết áp dụng một vài phương pháp máy học vào bài toán dự báo dữ liệu chuỗi thời gian bằng mô hình dự báo ARIMA và SARIMA để dự báo giá vàng trong tương lai. Chúng tôi đã tiến hành một loạt thử nghiệm và đánh giá mô hình cũng như phân tích các yếu tố biến động của chuỗi thời gian để tìm ra kết quả tối ưu nhất để tăng hiệu suất dự báo.
Nội dung trích xuất từ tài liệu:
Áp dụng một vài phương pháp máy học vào bài toán dự báo theo chuỗi thời gian TẠP CHÍ KHOA HỌC HO CHI MINH CITY UNIVERSITY OF EDUCATION TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH JOURNAL OF SCIENCE Tập 19, Số 12 (2022): 2064-2075 Vol. 19, No. 12 (2022): 2064-2075 ISSN: Website: https://journal.hcmue.edu.vn https://doi.org/10.54607/hcmue.js.19.12.3334(2022) 2734-9918 Bài báo nghiên cứu 1* ÁP DỤNG MỘT VÀI PHƯƠNG PHÁP MÁY HỌC VÀO BÀI TOÁN DỰ BÁO THEO CHUỖI THỜI GIAN Nguyễn Thị Hồng Thảo1*, Đào Minh Châu1, Vũ Thanh Nguyên1, Phù Phước Huy2 1 Trường Đại học Công nghiệp Thực phẩm Thành phố Hồ Chí Minh, Việt Nam Viện Công nghệ Thông tin – Viện Khoa học và Công nghệ Quân sự, Việt Nam 2 * Tác giả liên hệ: Nguyễn Thị Hồng Thảo – Email: thaonth@hufi.edu.vn Ngày nhận bài: 13-9-2021; ngày nhận bài sửa: 14-01-2022; ngày duyệt đăng: 13-3-2022 TÓM TẮT Vàng đóng vai trò cực kì quan trọng trong nền kinh tế, đặc biệt là đánh giá chỉ số lạm phát của nền kinh tế. Do đó, trong phạm vi nghiên cứu của bài báo này, chúng tôi áp dụng một vài phương pháp máy học vào bài toán dự báo dữ liệu chuỗi thời gian bằng mô hình dự báo ARIMA và SARIMA để dự báo giá vàng trong tương lai. Chúng tôi đã tiến hành một loạt thử nghiệm và đánh giá mô hình cũng như phân tích các yếu tố biến động của chuỗi thời gian để tìm ra kết quả tối ưu nhất để tăng hiệu suất dự báo. Từ khóa: dự báo giá vàng; máy học; mô hình ARIMA; mô hình SARIMA 1. Giới thiệu Trong những năm gần đây, việc nghiên cứu áp dụng máy học đã được ứng dụng rộng rãi như dự đoán kết quả bầu cử, phân tích dự báo đầu tư, lên kế hoạch phát triển kinh tế, đánh giá kết quả phát triển trong một số lĩnh vực… Công nghệ Máy học là một trong những phương pháp chính trong khai phá dữ liệu. Nó được sử dụng trong tiến trình khám phá tri thức. Các phương pháp máy học hoạt động trên các dữ liệu có đặc tả thông tin. Máy học mang đến nhiều lợi ích: máy học giúp xử lí rất nhiều thông tin đến từ nhiều nguồn khác nhau và dự báo các thông tin đó; ở những nơi không có chuyên gia, máy học có thể giúp tạo ra được các quyết định từ các dữ liệu có được; các thuật toán máy học có thể giúp xử lí khi dữ liệu không đầy đủ, không chính xác... Do Máy học mang đến nhiều lợi ích cho con người, nên chúng tôi chọn nghiên cứu vài phương pháp máy học vào bài toán dự báo theo chuỗi thời gian, sử dụng phương pháp ARIMA (Autoregressive Integrated Moving Average) và SARIMA để dự báo trong tương lai. Chúng tôi chọn dữ liệu để phân tích và dự báo là giá vàng. Vàng là một trong những mặt hàng quan trọng đánh giá chỉ số lạm phát của một quốc gia, được xem như một tài sản an Cite this article as: Nguyen Thi Hong Thao, Dao Minh Chau, Vu Thanh Nguyen, & Phu Phuoc Huy (2022). Using some machine learning methods for time series forecasting. Ho Chi Minh City University of Education Journal of Science, 19(12), 2064-2075. 2064 Tạp chí Khoa học Trường ĐHSP TPHCM Nguyễn Thị Hồng Thảo và tgk toàn trước những biến động về kinh tế, chính trị, xã hội hoặc khủng hoảng tiền tệ. Do đó, dự báo về hành vi giá vàng rất cần thiết. Từ đó, chúng tôi đã tiến hành một loạt thử nghiệm và đánh giá hiệu quả của 2 phương pháp ARIMA và SARIMA cũng như phân tích các yếu tố biến động của chuỗi thời gian để tìm ra kết quả tối ưu nhất kết quả dự báo. Với những vai trò quan trọng của vàng đã được phân tích, nên đã có nhiều công trình nghiên cứu về ảnh hưởng của vàng đối với nền kinh tế, biến động giá cũng như đưa ra các dự báo về giá vàng. Hiện nay, với sự phát triển của máy học vấn đề dự báo được thuận tiện hơn và có những kết quả dự báo cơ bản đáp ứng được mục đích của từng tổ chức. Nghiên cứu ảnh hưởng tin tức kinh tế đến giá cả hàng hóa, trong đó có giá vàng trong công trình của Williams (2018). Hay công trình nghiên cứu dự báo giá vàng bằng cách sử dụng các thuật toán máy học của Sami (2017). Các công trình đã đưa ra được một số mô hình dự báo giá vàng cũng như giá một số mặt hàng khác bằng các thuật toán máy học. Đối với công trình nghiên cứu giá vàng thì thường cho kết quả chính xác với giá trị thực nghiệm của tác giả đưa ra, nhưng khi thử với những giá trị khác thì cho kết quả có độ sai lệch. Tuy nhiên, kết quả các công trình nghiên cứu này là cơ sở để nhóm tác giả nghiên cứu đánh giá so sánh thuật toán ARIMA và SARIMA trong dự báo giá vàng. 2. Cơ sở lí thuyết và phương pháp nghiên cứu 2.1. Cơ sở lí thuyết 2.1.1. Phương pháp ARIMA Phương pháp ARIMA là mô hình dự báo theo chuỗi thời gian được phát minh bởi Box- Jenkin, kết quả dự báo phụ thuộc chuỗi giá trị trong quá khứ. Phương pháp ARIMA phân tích định lượng tính tương quan giữa các dữ liệu quan sát để đưa ra mô hình dự báo thông qua các giai đoạn nhận dạng mô hình, ước lượng các tham số từ dữ liệu quan sát và kiểm tra các tham số ước lượng để tìm ra mô hình thích hợp. Phương pháp ARIMA được thực hiện cho dữ liệu dừng (hay dữ liệu đã loại bỏ yếu tố xu thế). ARIMA được kết hợp bởi 3 thành thành phần chính ARIMA(p,q,d): AR (p): Autogressive (tự hồi quy) I (q): Integrated (chuỗi dừng) MA (d): Moving Arverage (trung bình động). Phương pháp ARIMA được thực hiện với dữ liệu dừng hay chuỗi thời gian dừng. Dữ liệu dừng là dữ liệu dao động xung quanh một giá trị trung bình cố định trong dài hạn, dữ liệu có giá trị phương sai xác định không thay đổi theo thời gian, dữ liệu có một giản đồ tự tương quan với các hệ số tự tương quan sẽ giảm dần khi độ trễ tăng l ...

Tài liệu được xem nhiều: