Ứng dụng mô hình Arima để dự báo số lượng trúng tuyển và nhập học tại trường Đại học Quảng Nam
Số trang: 8
Loại file: pdf
Dung lượng: 1.51 MB
Lượt xem: 12
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu của nghiên cứu này nhằm giới thiệu việc xây dựng mô hình chuỗi thời gian theo phương pháp trung bình trượt tích hợp tự hồi quy (Autoregressive Integrated Moving Average - ARIMA). Với dữ liệu quá khứ trúng tuyển và nhập học từ năm 2007-2022 tại trường đại học Quảng Nam, kết quả của mô hình sẽ dự báo số lượng trúng tuyển và nhập học cho những năm tiếp theo.
Nội dung trích xuất từ tài liệu:
Ứng dụng mô hình Arima để dự báo số lượng trúng tuyển và nhập học tại trường Đại học Quảng Nam ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO SỐLƯỢNG TRÚNG TUYỂN VÀ NHẬP HỌC TẠI TRƯỜNG ĐẠI HỌC QUẢNG NAM Lê Phước Thành1, Nguyễn Văn2 Tóm tắt: Trong phân tích dữ liệu, việc dự báo thường dựa trên hai loại mô hìnhchính là mô hình nhân quả và mô hình chuỗi thời gian. Trong mô hình nhân quả, kỹ thuậtphân tích hồi qui được sử dụng để thiết lập mối quan hệ giữa biến phụ thuộc và cácbiến nguyên nhân. Mục tiêu của nghiên cứu này nhằm giới thiệu việc xây dựng mô hìnhchuỗi thời gian theo phương pháp trung bình trượt tích hợp tự hồi quy (AutoregressiveIntegrated Moving Average - ARIMA). Với dữ liệu quá khứ trúng tuyển và nhập học từnăm 2007-2022 tại trường đại học Quảng Nam, kết quả của mô hình sẽ dự báo số lượngtrúng tuyển và nhập học cho những năm tiếp theo. Từ khóa: Dự báo chuỗi thời gian, ARIMA, Tự hồi quy, Trung bình trượt, Tínhdừng, Nhiễu trắng, Tương quan, Hồi quy, Hiệp phương sai, Phương pháp Box-Jenkins. 1. Mở đầu Dự báo chuỗi thời gian là một lớp mô hình quan trọng trong thống kê, kinh tếlượng và học máy (Machine learning). Sở dĩ chúng ta gọi lớp mô hình này là chuỗi thờigian (Time series) là vì mô hình được áp dụng trên các chuỗi đặc thù có yếu tố thời gian.Một mô hình chuỗi thời gian thường dự báo dựa trên giả định rằng các qui luật trong quákhứ sẽ lặp lại ở tương lai. Do đó xây dựng mô hình chuỗi thời gian là chúng ta đang môhình hóa mối quan hệ trong quá khứ giữa biến độc lập (biến đầu vào) và biến phụ thuộc(biến mục tiêu). Dựa vào mối quan hệ này để dự đoán giá trị trong tương lai của biếnphụ thuộc [4]. 2. Nội dung 2.1. Phương pháp nghiên cứu 2.1.1. Mô hình ARIMA Hai tác giả George Box & Gwilym Jenkins (1976) đã nghiên cứu mô hình tự hồiquy tích hợp trung bình trượt (Autoregressive Integrated Moving Average), viết tắt làARIMA. Tên của họ (Box-Jenkins) được dùng để gọi cho các quá trình ARIMA tổngquát áp dụng vào việc phân tích và dự báo [3]. Dựa trên giả thuyết chuỗi dừng và phương sai sai số không đổi, mô hình sử dụngđầu vào chính là những tín hiệu quá khứ của chuỗi được dự báo để dự báo nó. Các tínhiệu đó bao gồm: chuỗi tự hồi qui AR (Auto Regression) và chuỗi trung bình trượt MA(Moving Average). Hầu hết các chuỗi thời gian sẽ có xu hướng tăng hoặc giảm theo thờigian, do đó yếu tố chuỗi dừng thường không đạt được. Trong trường hợp chuỗi khôngdừng thì ta cần biến đổi sang chuỗi dừng bằng sai phân. Khi đó tham số đặc trưng củamô hình sẽ có thêm thành phần bậc của sai phân d và mô hình được đặc tả bởi 3 tham sốARIMA(p, d, q) [4].1.ThS., Trường Đại học Quảng Nam2.ThS., Trường Đại học Quảng Nam 31ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO SỐ LƯỢNG TRÚNG TUYỂN... Mô hình sẽ biểu diễn phương trình hồi qui tuyến tính đa biến (Multiple LinearRegression) của các biến đầu vào (còn gọi là biến phụ thuộc trong thống kê) là 2 thànhphần chính như sau [3], [6]: 1) Quá trình tự hồi quy-AR (AutoRegression) bậc p Trong một quá trình tự hồi quy bậc p, số liệu tại thời điểm hiện tại yt được tạo rabởi một tổng trung bình có trọng số của các giá trị trong quá khứ tính cho đến giá trị quákhứ thứ p(yt-k). Mô hình tự hồi quy tổng quát chỉ có các giá trị hiện tại và quá khứ của Yđược sử dụng trong mô hình và không có biến hồi quy nào khác. Giá trị của Y tương laiphụ thuộc vào giá trị của nó trong quá khứ cộng với một yếu tố ngẫu nhiên. Rõ ràng vớimô hình tự hồi quy, dữ liệu đã tự nó giải thích cho bản thân nó. Mô hình AR(p) có dạngnhư sau: Yt=µ + φ1Yt-1 + φ2Yt-2 +…+ φpYt-p + εt φi: là các trọng số được ước lượng thể hiện sự ảnh hưởng của các giá trị yt-i lên yt. µ: là hệ số chặn εt: là sai số 2) Quá trình trung bình trượt-MA (Moving Average) bậc q Quá trình trung bình trượt được hiểu là quá trình dịch chuyển hoặc thay đổi giá trịtrung bình của chuỗi theo thời gian. Mô hình trung bình trượt được mô tả hoàn toàn bằngphương trình tuyến tính có trọng số của các sai số ngẫu nhiên hiện hành và các giá trị trễcủa nó. Mô hình được viết như sau: Yt=µ + εt - θ1ε t-1 + … +θqε t-q µ: Trung bình của chuỗi thời gian tĩnh {yt} εt: Sai số, còn gọi là nhiễu trắng (white noise) là thành phần ngẫu nhiên thể hiệncho yếu tố không thể dự đoán được và không có tính quy luật. θi: Các hệ số ước lượng mức ảnh hưởng của εt-i lên yt 3) Quá trình trung bình trượt tích hợp tự hồi quy-ARIMA bậc (p, d, q) Mô hình ARIMA(p,q) là sự kết hợp của hai mô hình AR(p) và MA(q): Yt=δ + + Mô hình ARMA(p,q) làm việc tốt với các dữ liệu tĩnh, tức là không có thành phầnxu hướng (trend). Nhưng trong thực tế dữ liệu thường có một xu hướng đi lên hay đ ...
Nội dung trích xuất từ tài liệu:
Ứng dụng mô hình Arima để dự báo số lượng trúng tuyển và nhập học tại trường Đại học Quảng Nam ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO SỐLƯỢNG TRÚNG TUYỂN VÀ NHẬP HỌC TẠI TRƯỜNG ĐẠI HỌC QUẢNG NAM Lê Phước Thành1, Nguyễn Văn2 Tóm tắt: Trong phân tích dữ liệu, việc dự báo thường dựa trên hai loại mô hìnhchính là mô hình nhân quả và mô hình chuỗi thời gian. Trong mô hình nhân quả, kỹ thuậtphân tích hồi qui được sử dụng để thiết lập mối quan hệ giữa biến phụ thuộc và cácbiến nguyên nhân. Mục tiêu của nghiên cứu này nhằm giới thiệu việc xây dựng mô hìnhchuỗi thời gian theo phương pháp trung bình trượt tích hợp tự hồi quy (AutoregressiveIntegrated Moving Average - ARIMA). Với dữ liệu quá khứ trúng tuyển và nhập học từnăm 2007-2022 tại trường đại học Quảng Nam, kết quả của mô hình sẽ dự báo số lượngtrúng tuyển và nhập học cho những năm tiếp theo. Từ khóa: Dự báo chuỗi thời gian, ARIMA, Tự hồi quy, Trung bình trượt, Tínhdừng, Nhiễu trắng, Tương quan, Hồi quy, Hiệp phương sai, Phương pháp Box-Jenkins. 1. Mở đầu Dự báo chuỗi thời gian là một lớp mô hình quan trọng trong thống kê, kinh tếlượng và học máy (Machine learning). Sở dĩ chúng ta gọi lớp mô hình này là chuỗi thờigian (Time series) là vì mô hình được áp dụng trên các chuỗi đặc thù có yếu tố thời gian.Một mô hình chuỗi thời gian thường dự báo dựa trên giả định rằng các qui luật trong quákhứ sẽ lặp lại ở tương lai. Do đó xây dựng mô hình chuỗi thời gian là chúng ta đang môhình hóa mối quan hệ trong quá khứ giữa biến độc lập (biến đầu vào) và biến phụ thuộc(biến mục tiêu). Dựa vào mối quan hệ này để dự đoán giá trị trong tương lai của biếnphụ thuộc [4]. 2. Nội dung 2.1. Phương pháp nghiên cứu 2.1.1. Mô hình ARIMA Hai tác giả George Box & Gwilym Jenkins (1976) đã nghiên cứu mô hình tự hồiquy tích hợp trung bình trượt (Autoregressive Integrated Moving Average), viết tắt làARIMA. Tên của họ (Box-Jenkins) được dùng để gọi cho các quá trình ARIMA tổngquát áp dụng vào việc phân tích và dự báo [3]. Dựa trên giả thuyết chuỗi dừng và phương sai sai số không đổi, mô hình sử dụngđầu vào chính là những tín hiệu quá khứ của chuỗi được dự báo để dự báo nó. Các tínhiệu đó bao gồm: chuỗi tự hồi qui AR (Auto Regression) và chuỗi trung bình trượt MA(Moving Average). Hầu hết các chuỗi thời gian sẽ có xu hướng tăng hoặc giảm theo thờigian, do đó yếu tố chuỗi dừng thường không đạt được. Trong trường hợp chuỗi khôngdừng thì ta cần biến đổi sang chuỗi dừng bằng sai phân. Khi đó tham số đặc trưng củamô hình sẽ có thêm thành phần bậc của sai phân d và mô hình được đặc tả bởi 3 tham sốARIMA(p, d, q) [4].1.ThS., Trường Đại học Quảng Nam2.ThS., Trường Đại học Quảng Nam 31ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO SỐ LƯỢNG TRÚNG TUYỂN... Mô hình sẽ biểu diễn phương trình hồi qui tuyến tính đa biến (Multiple LinearRegression) của các biến đầu vào (còn gọi là biến phụ thuộc trong thống kê) là 2 thànhphần chính như sau [3], [6]: 1) Quá trình tự hồi quy-AR (AutoRegression) bậc p Trong một quá trình tự hồi quy bậc p, số liệu tại thời điểm hiện tại yt được tạo rabởi một tổng trung bình có trọng số của các giá trị trong quá khứ tính cho đến giá trị quákhứ thứ p(yt-k). Mô hình tự hồi quy tổng quát chỉ có các giá trị hiện tại và quá khứ của Yđược sử dụng trong mô hình và không có biến hồi quy nào khác. Giá trị của Y tương laiphụ thuộc vào giá trị của nó trong quá khứ cộng với một yếu tố ngẫu nhiên. Rõ ràng vớimô hình tự hồi quy, dữ liệu đã tự nó giải thích cho bản thân nó. Mô hình AR(p) có dạngnhư sau: Yt=µ + φ1Yt-1 + φ2Yt-2 +…+ φpYt-p + εt φi: là các trọng số được ước lượng thể hiện sự ảnh hưởng của các giá trị yt-i lên yt. µ: là hệ số chặn εt: là sai số 2) Quá trình trung bình trượt-MA (Moving Average) bậc q Quá trình trung bình trượt được hiểu là quá trình dịch chuyển hoặc thay đổi giá trịtrung bình của chuỗi theo thời gian. Mô hình trung bình trượt được mô tả hoàn toàn bằngphương trình tuyến tính có trọng số của các sai số ngẫu nhiên hiện hành và các giá trị trễcủa nó. Mô hình được viết như sau: Yt=µ + εt - θ1ε t-1 + … +θqε t-q µ: Trung bình của chuỗi thời gian tĩnh {yt} εt: Sai số, còn gọi là nhiễu trắng (white noise) là thành phần ngẫu nhiên thể hiệncho yếu tố không thể dự đoán được và không có tính quy luật. θi: Các hệ số ước lượng mức ảnh hưởng của εt-i lên yt 3) Quá trình trung bình trượt tích hợp tự hồi quy-ARIMA bậc (p, d, q) Mô hình ARIMA(p,q) là sự kết hợp của hai mô hình AR(p) và MA(q): Yt=δ + + Mô hình ARMA(p,q) làm việc tốt với các dữ liệu tĩnh, tức là không có thành phầnxu hướng (trend). Nhưng trong thực tế dữ liệu thường có một xu hướng đi lên hay đ ...
Tìm kiếm theo từ khóa liên quan:
Dự báo chuỗi thời gian Hiệp phương sai Phương pháp Box-Jenkins Tự hồi quy Trung bình trượtTài liệu liên quan:
-
Ứng dụng mô hình ARIMA trong dự báo chỉ số VN-Index
5 trang 48 0 0 -
Cải biên thuật toán bậc cao của singh và ứng dụng trong dự báo chuỗi thời gian
8 trang 48 0 0 -
Dự báo chuỗi thời gian với mô hình Transfomers
4 trang 43 1 0 -
Ứng dụng của mô hình LMD-AR và DE-SVM để chẩn đoán hư hỏng ổ lăn
8 trang 29 0 0 -
Bài giảng: Dự báo sử dụng mô hình chuỗi thời gian
23 trang 26 0 0 -
Bài giảng Sử dụng mô hình Arima trong dự báo chuỗi thời gian - Cao Hào Thi
26 trang 25 0 0 -
Bài giảng Phân tích chuỗi thời gian: Phần 4 - Vũ Duy Thành
26 trang 18 0 0 -
Bài giảng Chương 4: Lợi nhuận và rủi ro (No pain, no gain) - PGS.TS. Trương Đông Lộc
39 trang 17 0 0 -
Mạng nơ ron mờ hồi quy và ứng dụng dự báo
8 trang 17 0 0 -
26 trang 16 0 0