Danh mục

Bài giảng Xác suất thống kê: Chương 8 - Nguyễn Kiều Dung

Số trang: 27      Loại file: pdf      Dung lượng: 1.24 MB      Lượt xem: 27      Lượt tải: 0    
Jamona

Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng Xác suất thống kê: Chương 8 - Hồi quy tuyến tính đơn, được biên soạn gồm các nội dung chính sau: Mô hình hồi quy tuyến tính đơn; Covarian và hệ số tương quan của bnn 2 chiều, Ước lượng các hệ số của đường hồi quy tuyến tính; Ước lượng độ lệch chuẩn ( sai số chuẩn của ước lượng);...Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Xác suất thống kê: Chương 8 - Nguyễn Kiều Dung Chương 8: HỒI QUY TUYẾN TÍNH ĐƠNBài toán phân tích hồi quy là bài toán nghiên cứu mối liên hệphụ thuộc của một biến (gọi là biến phụ thuộc) vào một haynhiều biến khác (gọi là các biến độc lập), với ý tưởng ướclượng được giá trị trung bình (tổng thể) của biến phụ thuộctheo giá trị của các biến độc lập, dựa trên mẫu được biếttrước. Lý thuyết hồi quy đơn nghiên cứu bài toán dự báo biếnngẫu nhiên Y theo một biến ngẫu nhiên X. Biến X được gọi làbiến độc lập, hay gọi là biến giải thích. Y gọi là biến phụthuộc, hay là biến được giải thích. Người ta tìm cách thay Ybởi hàm f(X) sao cho “chính xác nhất”. 1Trong mối liên hệ hàm số y = f(x), với mỗi một giá trị x ta tìmđược duy nhất một giá trị y. Tuy nhiên trong bài toán hồi quy,sự phụ thuộc của Y vào X mang tính thống kê: một giá trị Xi cóthể có tương ứng nhiều giá trị khác nhau của Y, bởi vì ngoàiyếu tố chính là X, biến Y có thể còn chịu tác động bởi một sốyếu tố khác không được xét đến. 23Định nghĩa:Hàm hồi quy của Y theo X chính là kz vọng có điều kiện của Y đối vớiX, tức là E(Y|X).Hàm hồi quy tuyến tính đơn có dạng: fY(X) = E(Y|X) = 0 + 1X.Mô hình hồi quy tuyến tính đơn:Giả định của mô hình hồi quy tuyến tính đơn: Ta có các tham số 0;1 và 2 sao cho với mỗi giá trị x của biến độc lập, biến Y phụ thuộcvào x theo phương trình Y = 0 + 1x +  ;ở đây, biến  là sai số ngẫu nhiên có phân phối chuẩn N(0; 2).Minh họa: với mỗi cặp giá trị (Xi,Yi) từ {(X1,Y1); (X2,Y2);… (Xn,Yn);…mà X1= X2= …= Xn …}, ta sẽ có biểu diễn: Yi = 0 + 1.Xi +  iCác sai số ngẫu nhiên {i} i là độc lập với nhau, tuân theo quy luậtphân phối chuẩn N(0; 2). (2 là hằng số) 45Một số yêu cầu của bài toán:1. Tìm các đặc trưng mẫu 2 chiều.2. Tìm covarian, hệ số tương quan mẫu và { nghĩa ( chương 3).3. Ước lượng các hệ số đường hồi quy tuyến tính ( Tìm phươngtrình của đường hồi quy tuyến tính mẫu Y theo X và dự đoán).4. Tìm hệ số xác định R25. Ước lượng độ lệch chuẩn  ( sai số chuẩn).6. Tìm khoảng tin cậy cho các hệ số 0 ; 1 của đường hồi quytuyến tính .7. Kiểm định sự phù hợp của của đường hồi quy tuyến tính, kiểmđịnh các hệ số 0 ; 1 (BTL)8. Tìm khoảng tin cậy cho các giá trị dự đoán của Y theo X. (BTL)9. Kiểm tra sự phù hợp của mô hình hồi quy tuyến tính (BTL). 61. Một số đặc trưng mẫu: 782. Covarian và hệ số tương quan của bnn 2 chiều:* Hiệp phương sai (Covarian, mômen tương quan) của biến ngẫu nhiên 2 chiều (X, Y): cov(X,Y) = E[(X-E(X)).(Y-E(Y))] = E(XY) - E(X).E(Y) ở đây: Nhận xét: cov(X,X)= E[(X-E(X))2] = E(X2) - E2(X)  D(X) cov(Y,Y) = … = E(Y2) - E2(Y)  D(Y)* Hệ số tương quan của X và Y: cov(X,Y) E(XY)-E(X).E(Y)  XY  = D(X) D(Y) D(X) D(Y)* Ma trận tương quan ( ma trận hiệp phương sai) của (X,Y): 9 Hệ số tương quan và covarian dùng để đặc trưng cho mức độchặt chẽ của mối liên hệ phụ thuộc giữa các BNN X và Y. Hệ số tương quan không có đơn vị đo và |XY| 1. Nếu  XY = 0 thì ta nói X, Y không tương quan, ngược lạikhi  XY  0 ta nói X, Y có tương quan. Nếu X, Y độc lập thì cov(X,Y)= XY = 0. Điều ngược lại không đúng, tức là nếu cov(X,Y)= 0 thìhoặc X, Y độc lập, hoặc X, Y phụ thuộc ở một dạng thức nào đó. Nếu XY = 1 thì X, Y có tương quan tuyến tính (thuận /nghịch). Khi  XY  1 thì X, Y có tương quan “gần” tuyến tính. Chương III: Véc tơ ngẫu nhiên 2 chiều 10Covarian và hệ số tương quan của mẫu:rXY là một ước lượng của hệ số tương quan  giữa X,Y.Khi |rXY |  0.3  X, Y không có mối quan hệ tuyến tính hoặcmối quan hệ tuyến tính rất yếu.Khi 0.3 < |rXY |  0.5  X, Y có mối quan hệ tuyến tính rất yếu.Khi 0.5 < |rXY |  0.8  X, Y có quan hệ tuyến tính trung bình.Khi 0.8 < |rXY |  X, Y có quan hệ tuyến tính mạnh. 11Các bước thực hiện Máy CASIO fx 570 ES (PLUS)… Máy CASIO fx 580 vn….Vào chế độ thống MODE -- 3 (STAT) -- 2 (A+BX) MODE -- 6 - 2kê hai biến.Mở cột tần số SHIFT -- MODE (SETUP) -- -- SHIFT -- MODE -  - 3 - 1(nếu máy chưa mở) -- 4 (STAT) -- 1 (ON)Nhập dữ liệu X Y FREQ 1 x1 y1 n 11 2 x1 y2 n 12 … … … …. … xk yh n kh ACĐọc kết quả SHIFT – 1 (STAT)- 4 (VAR) – OPTN – ...

Tài liệu được xem nhiều: