Bài giảng Xác suất & thống kê đại học - Chương 8: Bài toán tương quan và Hồi quy
Số trang: 20
Loại file: pdf
Dung lượng: 241.61 KB
Lượt xem: 17
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Xác suất & thống kê đại học Chương 8: Bài toán tương quan và Hồi quy định nghĩa, khái niệm về hệ tương quan mẫu, đường hồi quy trung bình tuyến tính thực nghiệm, phương pháp bình phương bé nhất.
Nội dung trích xuất từ tài liệu:
Bài giảng Xác suất & thống kê đại học - Chương 8: Bài toán tương quan và Hồi quy Chương 8. Bài toán tương quan & Hồi quy1. HỆ SỐ TƯƠNG QUAN MẪU1.1. Định nghĩa• Hệ số tương quan mẫu r là số đo mức độ phụ thuộc tuyến tính giữa hai mẫu ngẫu nhiên cùng cỡ X và Y .• Giả sử ta có mẫu ngẫu nhiên cỡ n về vector ngẫu nhiên (X , Y ) là (x i , y i ); i = 1; 2;...; n . Khi đó, hệ số tương quan mẫu r được tính theo công thức: n xy - x .y 1 r = ; xy = å x iy i . ˆ ˆ sx .sy n i=1 Chương 8. Bài toán tương quan & Hồi quy1.2. Tính chất 1) - 1 £ r £ 1. 2) Nếu r = 0 thì X , Y không có quan hệ tuyến tính; Nếu r = ± 1 thì X , Y có quan hệ tuyến tính tuyệt đối. 3) Nếu r < 0 thì quan hệ giữa X , Y là giảm biến. 4) Nếu r > 0 thì quan hệ giữa X , Y là đồng biến.VD 1. Kết quả đo lường độ cholesterol (Y) có trong máucủa 10 đối tượng nam ở độ tuổi (X) như sau: X 20 52 30 57 28 43 57 63 40 49 Y 1,9 4,0 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4,0Tính hệ số tương quan mẫu giữa X và Y . Chương 8. Bài toán tương quan & Hồi quy Chương 8. Bài toán tương quan & Hồi quy2. Đường hồi quy trung bình tuyến tính thực nghiệm• Từ mẫu thực nghiệm về vector ngẫu nhiên (X , Y ) , ta biễu diễn các cặp điểm (x i , y i ) lên mpOxy . Khi đó, đường cong nối các điểm là đường cong phụ thuộc của Y theo X mà ta cần tìm (xem hình a), b)). Chương 8. Bài toán tương quan & Hồi quy• Đường thẳng là đường hồi quy thực nghiệm xấp xỉ tốt nhất các điểm mẫu đã cho, cũng là xấp xỉ đường cong cần tìm. Trong hình a) ta thấy xấp xỉ tốt (phụ thuộc tuyến tính chặt), hình b) xấp xỉ không tốt. Chương 8. Bài toán tương quan & Hồi quy2.1. Phương pháp bình phương bé nhất• Khi có sự phụ thuộc tuyến tính tương đối chặt giữa hai biến ngẫu nhiên X và Y ta cần tìm biểu thức a + bX xấp xỉ Y tốt nhất theo nghĩa cực tiểu sai số bình 2 phương trung bình E (Y - a - bX ) , phương pháp này được gọi là bình phương bé nhất.• Với mỗi cặp điểm (x i , y i ) thì sai số xấp xỉ là: ei = y i - (a + bx i ) (xem hình c)). Chương 8. Bài toán tương quan & Hồi quyTa đi tìm các ước lượng a, b n 2sao cho å ei đạt cực tiểu. i=1 n 2Đặt Q = å ei i=1 n 2 = å êi é - (a + bx )ù , ta có: y ë i úû i=1 ì ï n n ï na + b x = ìQ = 0 ï ï a / ï ï å i å yi (1) í / Û ï n í i= 1 n i=1 n ïQ = 0 ï b ï ïa ï î ï å xi + bå xi2 = å x i y i (2) ï ï i=1 î i=1 i= 1 Chương 8. Bài toán tương quan & Hồi quy 1 n 1 n (1) Û a = å y i - b. å x i = y - b.x . n i= 1 n i=1Thay a vào (2), ta được: n n n 2 (y - b.x )å x i + bå xi = å x iy i i= 1 i=1 i= 1 æ1 n 1 n ö æ1 n 1 n ö ç 2 ÷ ç ÷Û b ç å x i - x . å x i ÷= çn ÷ ç å x i yi - y . å x i ÷ çn ÷ ç i= 1 è n i=1 ÷ø ç i= 1 è n i=1 ÷ø æ2 2ö xy - x .yÛ b çx - x ÷ = xy - x .y Û b = ç ÷ . è ø ˆ2 sx Chương 8. Bài toán tương quan & Hồi quy xy - x .y• Vậy b = , a = y - b.x . ˆ2 sx Đường hồi quy tuyến tính của Y theo X là: y = a + bx . xy - x .y• Tương tự: b = , a = x - b.y . 2 sy ˆ Đường hồi quy tuyến tính của X theo Y là: x = a + by . Chương 8. Bài toán tương quan & Hồi quyVD 2. Đo chiều cao (X: m) và khối lượng (Y: kg) của 5 học sinh nam, ta có kết quả: X 1,45 1,60 1,50 1,65 1,55 Y 50 55 45 60 551) Tìm hệ số tương quan r.2) Lập phương trình hồi quy tuyến tính của Y theo X.3) Dự đoán nếu một học sinh cao 1,62m thì nặng khoảng bao nhiêu kg? Chương 8. Bài toán tươn ...
Nội dung trích xuất từ tài liệu:
Bài giảng Xác suất & thống kê đại học - Chương 8: Bài toán tương quan và Hồi quy Chương 8. Bài toán tương quan & Hồi quy1. HỆ SỐ TƯƠNG QUAN MẪU1.1. Định nghĩa• Hệ số tương quan mẫu r là số đo mức độ phụ thuộc tuyến tính giữa hai mẫu ngẫu nhiên cùng cỡ X và Y .• Giả sử ta có mẫu ngẫu nhiên cỡ n về vector ngẫu nhiên (X , Y ) là (x i , y i ); i = 1; 2;...; n . Khi đó, hệ số tương quan mẫu r được tính theo công thức: n xy - x .y 1 r = ; xy = å x iy i . ˆ ˆ sx .sy n i=1 Chương 8. Bài toán tương quan & Hồi quy1.2. Tính chất 1) - 1 £ r £ 1. 2) Nếu r = 0 thì X , Y không có quan hệ tuyến tính; Nếu r = ± 1 thì X , Y có quan hệ tuyến tính tuyệt đối. 3) Nếu r < 0 thì quan hệ giữa X , Y là giảm biến. 4) Nếu r > 0 thì quan hệ giữa X , Y là đồng biến.VD 1. Kết quả đo lường độ cholesterol (Y) có trong máucủa 10 đối tượng nam ở độ tuổi (X) như sau: X 20 52 30 57 28 43 57 63 40 49 Y 1,9 4,0 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4,0Tính hệ số tương quan mẫu giữa X và Y . Chương 8. Bài toán tương quan & Hồi quy Chương 8. Bài toán tương quan & Hồi quy2. Đường hồi quy trung bình tuyến tính thực nghiệm• Từ mẫu thực nghiệm về vector ngẫu nhiên (X , Y ) , ta biễu diễn các cặp điểm (x i , y i ) lên mpOxy . Khi đó, đường cong nối các điểm là đường cong phụ thuộc của Y theo X mà ta cần tìm (xem hình a), b)). Chương 8. Bài toán tương quan & Hồi quy• Đường thẳng là đường hồi quy thực nghiệm xấp xỉ tốt nhất các điểm mẫu đã cho, cũng là xấp xỉ đường cong cần tìm. Trong hình a) ta thấy xấp xỉ tốt (phụ thuộc tuyến tính chặt), hình b) xấp xỉ không tốt. Chương 8. Bài toán tương quan & Hồi quy2.1. Phương pháp bình phương bé nhất• Khi có sự phụ thuộc tuyến tính tương đối chặt giữa hai biến ngẫu nhiên X và Y ta cần tìm biểu thức a + bX xấp xỉ Y tốt nhất theo nghĩa cực tiểu sai số bình 2 phương trung bình E (Y - a - bX ) , phương pháp này được gọi là bình phương bé nhất.• Với mỗi cặp điểm (x i , y i ) thì sai số xấp xỉ là: ei = y i - (a + bx i ) (xem hình c)). Chương 8. Bài toán tương quan & Hồi quyTa đi tìm các ước lượng a, b n 2sao cho å ei đạt cực tiểu. i=1 n 2Đặt Q = å ei i=1 n 2 = å êi é - (a + bx )ù , ta có: y ë i úû i=1 ì ï n n ï na + b x = ìQ = 0 ï ï a / ï ï å i å yi (1) í / Û ï n í i= 1 n i=1 n ïQ = 0 ï b ï ïa ï î ï å xi + bå xi2 = å x i y i (2) ï ï i=1 î i=1 i= 1 Chương 8. Bài toán tương quan & Hồi quy 1 n 1 n (1) Û a = å y i - b. å x i = y - b.x . n i= 1 n i=1Thay a vào (2), ta được: n n n 2 (y - b.x )å x i + bå xi = å x iy i i= 1 i=1 i= 1 æ1 n 1 n ö æ1 n 1 n ö ç 2 ÷ ç ÷Û b ç å x i - x . å x i ÷= çn ÷ ç å x i yi - y . å x i ÷ çn ÷ ç i= 1 è n i=1 ÷ø ç i= 1 è n i=1 ÷ø æ2 2ö xy - x .yÛ b çx - x ÷ = xy - x .y Û b = ç ÷ . è ø ˆ2 sx Chương 8. Bài toán tương quan & Hồi quy xy - x .y• Vậy b = , a = y - b.x . ˆ2 sx Đường hồi quy tuyến tính của Y theo X là: y = a + bx . xy - x .y• Tương tự: b = , a = x - b.y . 2 sy ˆ Đường hồi quy tuyến tính của X theo Y là: x = a + by . Chương 8. Bài toán tương quan & Hồi quyVD 2. Đo chiều cao (X: m) và khối lượng (Y: kg) của 5 học sinh nam, ta có kết quả: X 1,45 1,60 1,50 1,65 1,55 Y 50 55 45 60 551) Tìm hệ số tương quan r.2) Lập phương trình hồi quy tuyến tính của Y theo X.3) Dự đoán nếu một học sinh cao 1,62m thì nặng khoảng bao nhiêu kg? Chương 8. Bài toán tươn ...
Tìm kiếm theo từ khóa liên quan:
Bài toán tương quan Bài toán hồi quy Hồi quy trung bình tuyến tính Xác suất thống kê Xác suất thống kê đại học Lý thuyết xác suấtGợi ý tài liệu liên quan:
-
Giáo trình Xác suất thống kê: Phần 1 - Trường Đại học Nông Lâm
70 trang 326 5 0 -
Giáo trình Thống kê xã hội học (Xác suất thống kê B - In lần thứ 5): Phần 2
112 trang 207 0 0 -
Đề cương chi tiết học phần: Xác suất thống kê
3 trang 179 0 0 -
116 trang 170 0 0
-
Bài giảng Xác suất thống kê và quy hoạch thực nghiệm: Chương 3.4 và 3.5 - Nguyễn Thị Thanh Hiền
26 trang 169 0 0 -
Bài giảng Xác suất và thống kê trong y dược - Chương 1: Khái niệm cơ bản của lý thuyết xác suất
69 trang 166 0 0 -
Giáo trình Xác suất thống kê (tái bản lần thứ năm): Phần 2
131 trang 165 0 0 -
Một số ứng dụng của xác suất thống kê
5 trang 133 0 0 -
Bài giảng Nguyên lý thống kê: Chương 1 - GV. Quỳnh Phương
34 trang 131 0 0 -
Đề thi kết thúc học phần Xác suất thống kê năm 2019 - Đề số 5 (09/06/2019)
1 trang 129 0 0