Lab 2. DỰ BÁO BẰNG PHƯƠNG PHÁP HỒI QUI
Số trang: 11
Loại file: doc
Dung lượng: 183.50 KB
Lượt xem: 16
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
File chap5.sav chứa dữ liệu về bán hàng. Dữ liệu sẽ được phân ra làm 2 thời đoạn:
luyện tập và để kiểm tra. Dữ liệu của thời đoạn kiểm tra đôi khi còn được gọi là mẫu để
dành (hold-out sample).
Nội dung trích xuất từ tài liệu:
Lab 2. DỰ BÁO BẰNG PHƯƠNG PHÁP HỒI QUI 1 Lab 2. DỰ BÁO BẰNG PHƯƠNG PHÁP HỒI QUI Biên soạn: TS. Nguyễn Văn Ngọc File chap5.sav chứa dữ liệu về bán hàng. Dữ liệu sẽ được phân ra làm 2 th ời đo ạn: luyện tập và để kiểm tra. Dữ liệu c ủa thời đoạn ki ểm tra đôi khi còn đ ược g ọi là m ẫu đ ể dành (hold-out sample). 1. Xây dựng đồ thị Trong thời đoạn luyện tập xây dựng mô hình bạn hãy chọn 100 quan sát đầu tiên của chuỗi sales. Chọn trong Menu Data: Data Select Cases Hình 1. Hộp thoại “Chọn số quan sát” Bạn hãy chọn Based on time or case range (Dựa trên thời gian hoặc số quan sát), sau đó nhấp vào nút Range... . Hộp thoại Select Cases: Range (Chọn vùng quan sát) được mở ra. 2 Hình 2. Hộp thoại “Chọn vùng quan sát” Bây giờ xem xét chuỗi của chúng ta. Chọn trong Menu Graphs: Graphs Sequence… 260 250 240 230 220 210 200 SALES 190 1 11 21 31 41 51 61 71 81 91 6 16 26 36 46 56 66 76 86 96 Sequence number Hình 3. Dữ liệu về bán hàng (thời đoạn luyện tập). 2. Sử dụng thủ thuật Curve Estimation Đồ thị các giá trị của biến sales, được xây dựng cho 100 quan sát đầu tiên tăng liên tục, đặc biệt là về cuối. Rõ ràng là chuỗi có tự tương quan dương: mỗi một giá trị gần đúng với giá trị 3 đứng trước đó, dường như chuỗi có “bộ nhớ”. Phương pháp dự báo đơn giản nhất cho chuỗi này là xác định một đường cong xấp xỉ với giá trị của chuỗi. Thủ thuật Curve Estimation dùng để làm điều đó: xác định phương pháp tốt nhất xây dựng đường cong đi qua chuỗi dữ liệu và cho biết nó phù hợp đến mức độ nào. Thủ thuật này sẽ tạo ra 4 chuỗi thời gian mới: dự báo bằng mô hình, sai số, giới hạn trên và giới hạn dưới của độ tin cậy cho các giá trị dự báo. Có thể xây dựng đồ thị các chuỗi này, để nhờ chúng xác định xem mô hình chạy tốt tới mức nào. Chọn dạng đường cong bậc hai và lập phương. Bạn hãy thử ước lượng các hệ số cho đường bậc hai và đường lập phương cho 100 quan sát đầu tiên của chuỗi. Sau đó làm tiếp cho thời đoạn kiểm tra và so sánh 2 mô hình. Phân tích hồi qui được sử dụng trong thủ thuật Curve Estimation để ước lượng các tham số của đường cong. Để chọn đường bậc hai, gần với chuỗi sales, bạn hãy chọn trong Menu Analyze: Analyze Regression Curve Estimation… Hình 4. Hộp thoại “Ước lượng đường cong”. Bạn hãy chọn biến sales và đưa vào khung danh sách Dependent(s) (các biến phụ thuộc). Trong nhóm Independent (Các biến độc lập) hãy chọn Time (Thời gian). Trong nhóm Models bạn hãy đánh dấu chọn Linear, Quadratic và Cubic. Để có thể so sánh giá trị của các mô hình 4 với các giá trị quan sát của chuỗi sales, hãy nhấp vào nút Save…. Hộp thoại Curve Estimation Save được mở ra như hình 5. Hình 5. Hộp thoại “Curve Estimation: save”. Đầu tiên chúng ta xem xét các giá trị dự báo, tạo ra bởi các mô hình bậc hai và lập phương, cho nên trong nhóm Save ta chọn Predicted values (Các giá trị dự báo). Trong phần dưới của Hộp thoại chỉ ra giai đoạn luyện tập (Estimation Period) đã chọn các quan sát từ 1 đến 100. Để dự báo tất cả các giá trị của chuỗi (cho đến giá trị cuối cùng), hãy chọn trong nhóm Predict Case s (dự báo quan sát) tùy chọn Predict from estimation period through last case (Dự báo từ thời đoạn luyện tập đến quan sát cuối cùng). Nhấp lên nút Continue, để trở về Hộp thoại chính Curve Estimation. Hãy chắc chắn rằng các tùy chọn Include constant in equation (Đưa constant vào mô hình) và Plot models (Xây dựng đồ thị cho mô hình) đã được đánh dấu. Nhấp vào nút OK. Chúng ta hãy xem xét các dữ liệu thống kê trình bày trong hình 6. Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3 SALES QUA .462 97 41.73 .000 206.517 .0593 .0021 SALES CUB .877 96 227.80 .000 185.507 2.4952 -.0579 .0004 The following new variables are being created: Name Label FIT_1 Fit for SALES from CURVEFIT, MOD_2 QUADRATIC FIT_2 Fit for SALES from CURVEFIT, MOD_2 CUBIC Hình 6. Ước lượng đường cong bậc hai và đường lập phương. Phương trình đường cong bậc 2 có dạng: sales = 206.517 + (0.0593 × case) + (0.0021 × case 2 ) Trong đó: case – số quan sát. Hệ số đứng trước số hạng bình phương có giá trị nhỏ – đường cong gần với đường thẳng. 5 Với đường cong bậc 3, ngoài b0, b1 và b2, mô hình này còn có hệ số b3 đứng trước số hạng lập phương. Hệ số b3 nhỏ. Phương trình tốt hơn là phương trình bậc 3: sales = 185.507 + ( 2.4925 × case) + ( 0.0579 × case) + ( 0.0004 × case) 2 3 3. Xây dựng các đồ thị Thủ thuật Curve Estimation tạo ra các giá trị dự báo bởi 2 mô hình và được gh ...
Nội dung trích xuất từ tài liệu:
Lab 2. DỰ BÁO BẰNG PHƯƠNG PHÁP HỒI QUI 1 Lab 2. DỰ BÁO BẰNG PHƯƠNG PHÁP HỒI QUI Biên soạn: TS. Nguyễn Văn Ngọc File chap5.sav chứa dữ liệu về bán hàng. Dữ liệu sẽ được phân ra làm 2 th ời đo ạn: luyện tập và để kiểm tra. Dữ liệu c ủa thời đoạn ki ểm tra đôi khi còn đ ược g ọi là m ẫu đ ể dành (hold-out sample). 1. Xây dựng đồ thị Trong thời đoạn luyện tập xây dựng mô hình bạn hãy chọn 100 quan sát đầu tiên của chuỗi sales. Chọn trong Menu Data: Data Select Cases Hình 1. Hộp thoại “Chọn số quan sát” Bạn hãy chọn Based on time or case range (Dựa trên thời gian hoặc số quan sát), sau đó nhấp vào nút Range... . Hộp thoại Select Cases: Range (Chọn vùng quan sát) được mở ra. 2 Hình 2. Hộp thoại “Chọn vùng quan sát” Bây giờ xem xét chuỗi của chúng ta. Chọn trong Menu Graphs: Graphs Sequence… 260 250 240 230 220 210 200 SALES 190 1 11 21 31 41 51 61 71 81 91 6 16 26 36 46 56 66 76 86 96 Sequence number Hình 3. Dữ liệu về bán hàng (thời đoạn luyện tập). 2. Sử dụng thủ thuật Curve Estimation Đồ thị các giá trị của biến sales, được xây dựng cho 100 quan sát đầu tiên tăng liên tục, đặc biệt là về cuối. Rõ ràng là chuỗi có tự tương quan dương: mỗi một giá trị gần đúng với giá trị 3 đứng trước đó, dường như chuỗi có “bộ nhớ”. Phương pháp dự báo đơn giản nhất cho chuỗi này là xác định một đường cong xấp xỉ với giá trị của chuỗi. Thủ thuật Curve Estimation dùng để làm điều đó: xác định phương pháp tốt nhất xây dựng đường cong đi qua chuỗi dữ liệu và cho biết nó phù hợp đến mức độ nào. Thủ thuật này sẽ tạo ra 4 chuỗi thời gian mới: dự báo bằng mô hình, sai số, giới hạn trên và giới hạn dưới của độ tin cậy cho các giá trị dự báo. Có thể xây dựng đồ thị các chuỗi này, để nhờ chúng xác định xem mô hình chạy tốt tới mức nào. Chọn dạng đường cong bậc hai và lập phương. Bạn hãy thử ước lượng các hệ số cho đường bậc hai và đường lập phương cho 100 quan sát đầu tiên của chuỗi. Sau đó làm tiếp cho thời đoạn kiểm tra và so sánh 2 mô hình. Phân tích hồi qui được sử dụng trong thủ thuật Curve Estimation để ước lượng các tham số của đường cong. Để chọn đường bậc hai, gần với chuỗi sales, bạn hãy chọn trong Menu Analyze: Analyze Regression Curve Estimation… Hình 4. Hộp thoại “Ước lượng đường cong”. Bạn hãy chọn biến sales và đưa vào khung danh sách Dependent(s) (các biến phụ thuộc). Trong nhóm Independent (Các biến độc lập) hãy chọn Time (Thời gian). Trong nhóm Models bạn hãy đánh dấu chọn Linear, Quadratic và Cubic. Để có thể so sánh giá trị của các mô hình 4 với các giá trị quan sát của chuỗi sales, hãy nhấp vào nút Save…. Hộp thoại Curve Estimation Save được mở ra như hình 5. Hình 5. Hộp thoại “Curve Estimation: save”. Đầu tiên chúng ta xem xét các giá trị dự báo, tạo ra bởi các mô hình bậc hai và lập phương, cho nên trong nhóm Save ta chọn Predicted values (Các giá trị dự báo). Trong phần dưới của Hộp thoại chỉ ra giai đoạn luyện tập (Estimation Period) đã chọn các quan sát từ 1 đến 100. Để dự báo tất cả các giá trị của chuỗi (cho đến giá trị cuối cùng), hãy chọn trong nhóm Predict Case s (dự báo quan sát) tùy chọn Predict from estimation period through last case (Dự báo từ thời đoạn luyện tập đến quan sát cuối cùng). Nhấp lên nút Continue, để trở về Hộp thoại chính Curve Estimation. Hãy chắc chắn rằng các tùy chọn Include constant in equation (Đưa constant vào mô hình) và Plot models (Xây dựng đồ thị cho mô hình) đã được đánh dấu. Nhấp vào nút OK. Chúng ta hãy xem xét các dữ liệu thống kê trình bày trong hình 6. Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3 SALES QUA .462 97 41.73 .000 206.517 .0593 .0021 SALES CUB .877 96 227.80 .000 185.507 2.4952 -.0579 .0004 The following new variables are being created: Name Label FIT_1 Fit for SALES from CURVEFIT, MOD_2 QUADRATIC FIT_2 Fit for SALES from CURVEFIT, MOD_2 CUBIC Hình 6. Ước lượng đường cong bậc hai và đường lập phương. Phương trình đường cong bậc 2 có dạng: sales = 206.517 + (0.0593 × case) + (0.0021 × case 2 ) Trong đó: case – số quan sát. Hệ số đứng trước số hạng bình phương có giá trị nhỏ – đường cong gần với đường thẳng. 5 Với đường cong bậc 3, ngoài b0, b1 và b2, mô hình này còn có hệ số b3 đứng trước số hạng lập phương. Hệ số b3 nhỏ. Phương trình tốt hơn là phương trình bậc 3: sales = 185.507 + ( 2.4925 × case) + ( 0.0579 × case) + ( 0.0004 × case) 2 3 3. Xây dựng các đồ thị Thủ thuật Curve Estimation tạo ra các giá trị dự báo bởi 2 mô hình và được gh ...
Tìm kiếm theo từ khóa liên quan:
thủ thuật máy tính tin học căn bản lab hướng dẫn học lab tài liệu học lab chuỗi dữ liệuTài liệu liên quan:
-
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 318 0 0 -
Làm việc với Read Only Domain Controllers
20 trang 306 0 0 -
Sửa lỗi các chức năng quan trọng của Win với ReEnable 2.0 Portable Edition
5 trang 215 0 0 -
Xử lý tình trạng máy tính khởi động/tắt chậm
4 trang 213 0 0 -
Giáo trình Bảo trì hệ thống và cài đặt phần mềm
68 trang 209 0 0 -
Tổng hợp 30 lỗi thương gặp cho những bạn mới sử dụng máy tính
9 trang 206 0 0 -
Phần III: Xử lý sự cố Màn hình xanh
3 trang 206 0 0 -
UltraISO chương trình ghi đĩa, tạo ổ đĩa ảo nhỏ gọn
10 trang 204 0 0 -
Sao lưu dữ liệu Gmail sử dụng chế độ Offline
8 trang 203 0 0 -
Hướng dẫn cách khắc phục lỗi màn hình xanh trong windows
7 trang 202 0 0