Danh mục

Xác định trình tự hồi qui trong việc dự báo hệ thống dữ liệu đa chiều

Số trang: 10      Loại file: pdf      Dung lượng: 428.49 KB      Lượt xem: 8      Lượt tải: 0    
Hoai.2512

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài báo này xây dựng một giải pháp để xác định trình tự hồi qui trong việc dự báo hệ thống dữ liệu đa chiều bằng phương pháp phân tích thành phần chính. Phần ứng dụng dựa vào dữ liệu trên trang Web của Tổng cục Thống kê. Kết quả cho thấy, việc sử dụng phương pháp phân tích thành phần chính đã đưa ra trình tự hồi qui chính xác, góp phần nâng cao hiệu quả của dự báo.
Nội dung trích xuất từ tài liệu:
Xác định trình tự hồi qui trong việc dự báo hệ thống dữ liệu đa chiềuNghiên cứu khoa học công nghệ XÁC ĐỊNH TRÌNH TỰ HỒI QUI TRONG VIỆC DỰ BÁO HỆ THỐNG DỮ LIỆU ĐA CHIỀU Hà Gia Sơn* Tóm tắt: Bài báo này xây dựng một giải pháp để xác định trình tự hồi qui trong việc dự báo hệ thống dữ liệu đa chiều bằng phương pháp phân tích thành phần chính. Phần ứng dụng dựa vào dữ liệu trên trang Web của Tổng cục Thống kê. Kết quả cho thấy, việc sử dụng phương pháp phân tích thành phần chính đã đưa ra trình tự hồi qui chính xác, góp phần nâng cao hiệu quả của dự báo.Từ khóa: Dự báo, Chuỗi thời gian, Dữ liệu đa chiều, Phân tích thành phần chính. 1. ĐẶT VẤN ĐỀ “Dự báo là dự kiến, tiên đoán về những sự kiện, hiện tượng, trạng thái nào đócó thể hay nhất định sẽ xảy ra trong tương lai.” (từ điển Bách khoa). Ở nướcngoài, có nhiều công trình nghiên cứu về vấn đề này, đã có một hệ thống lý thuyếtgồm nhiều phương pháp, qui trình cũng như nhiều mô hình để dự báo tương lainhư tài liệu [10]. Tài liệu [8] đã phân tích và thăm dò các yếu tố của chuỗi thờigian, các mô hình của chuỗi thời gian, quy trình Box-Jenkins dành để dự báo. Tàiliệu [9] nêu tổng quan về các phương pháp dự báo trong kinh doanh. Trong thờigian gần đây, ở trong nước, chúng ta đã quan tâm nhiều hơn tới lĩnh vực dự báo, đãcó nhiều đề tài các cấp, với những mục đích và cách tiếp cận khác nhau về dự báonhư các công trình [1-5], [7]. Hiện tại, xuất hiện nhiều mô hình dự báo có hiệu quả cao, tuy nhiên, mọi sự vậtvà hiện tượng đều không xuất hiện hay biến đổi đơn độc mà còn chịu tác động củanhững sự việc, hiện tượng khác, chúng phụ thuộc và ảnh hưởng lẫn nhau. Tổnghợp các công trình nghiên cứu cho thấy, khi dự báo những bộ dữ liệu thu thậpđược tập hợp thành một bảng lớn (dữ liệu đa chiều), người ta thường dùng mô hìnhphân tích hồi quy tuyến tính để phân tích quan hệ giữa biến phụ thuộc Y với mộthay nhiều biến độc lập X để tìm sự liên quan giữa các cột (biến) của bảng dữ liệunày. Tuy nhiên, trong thực tế, các biến X lại không độc lập mà phụ thuộc lẫn nhau,chính vì vậy, cần phải xác định chính xác trình tự đề hồi qui, hay cụ thể hơn, cầndự báo biến X nào trước, sau đó, lấy kết quả dự báo của biến này và các biến khácđể hồi qui ra các biến X, Y tiếp theo. Trong bài viết, phần đầu là cơ sở lý thuyết chung và phương pháp phân tíchthành phần chính, ở mục tiếp theo, tác giả đưa các giải thuật về ứng dụng và pháttriển phương pháp phân tích thành phần chính để xác định trình tự hồi qui, ứngdụng dựa vào dữ liệu trên trang http://gso.gov.vn. Kết quả cho thấy, việc sử dụngphương pháp phân tích thành phần chính đã đưa ra trình tự hồi qui chính xác, nângcao hiệu quả của dự báo. 2. NỘI DUNG CẦN GIẢI QUYẾT2.1. Xây dựng lý thuyết2.1.1. Giả thiết ban đầu Trong dự báo, số liệu trong quá khứ và hiện tại quyết định xu hướng vận độngcủa các hiện tượng trong tương lai.Tạp chí Nghiên cứu KH&CN quân sự, Số 45, 10 - 2016 99 Công nghệ thông tin & Cơ sở toán học cho tin học2.1.2. Phương pháp thường sử dụng trong dự báo hệ thống dữ liệu đa chiều. Như đã nói ở trên, dữ liệu đa chiều là một bộ số liệu dạng bảng các giá trị bằngsố cùng các thứ nguyên hoặc đơn vị đo của nó , đó là những yếu tố định lượng hayđịnh tính của một hoặc nhiều biến ngẫu nhiên nào đó. Dự báo hệ thống dữ liệu đachiều là việc xác định các giá trị của bảng này ở thời điểm tương lai. Việc dự báonày chia làm 02 giai đoạn: Giai đoạn 1: dự báo từng cột của bảng dự liệu này. Đề làm được việc này,Theo ([10]), người ta thường dùng các mô hình dự báo định lượng, nó sẽ khắcphục được tính chủ quan và cảm tính trong dự báo bằng cách sử dụng các côngcụ toán học. Giai đoạn 2: Theo ([10]), người ta thuờng dùng mô hình hồi quy bội để tìm sựliên quan giữa các biến (các cột) trong bảng với nhau để xác định lại các giá trị dựbáo, nghĩa là liên hệ biến phụ thuộc Y cho trước với nhiều biến độc lập X1, X2, ...,Xn. Mô hình có công thức tổng quát như sau: Y=  X1X2 + X3+…….nXn +n+1Yt (2.1) Nhược điểm của phương pháp này chính là việc coi các biến X1, X2, ..., Xn độclập với nhau, tuy nhiên trong thực tế, chúng lại có sự liên quan với nhau, ví dụ Xktác động vào Xi nhưng ta lại dự báo Xi trước mà không tính tới sự biến động (kếtquả dự báo) của Xk . Vì vậy, để sử dụng tốt mô hình hồi qui trong dự báo, cần phảiđưa ra được trình tự để hồi qui, nếu không sẽ dẫn tới việc kết quả dự báo sẽ rấtthiếu chính xác.2.1.3. Phương pháp phân tích thành phần chính Dùng kỹ thuật “Phân tích thành phần chính” để xác định, mục đích của kỹ thuậtnày là rút ra thông tin chủ yếu chưa trong bảng dữ liệu bằng cách xây dựng mộtbiểu diễn đơn giản hơn, sao cho t ...

Tài liệu được xem nhiều:

Tài liệu cùng danh mục:

Tài liệu mới: