![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
HỒI QUI TUYẾN TÍNH (Linear regression)
Số trang: 11
Loại file: pdf
Dung lượng: 202.09 KB
Lượt xem: 8
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Phân tích hồi qui (Regression) là kỹ thuật rất thường dùng trong thống kê y học nhằm tiên đoán giá trị của một đặc điểm khi đã biết giá trị của một đặc điểm khác. Như vậy, phân tích hồi qui chỉ giúp tiên đoán (hoặc ước lượng) khi 2 biến số có mối tương quan khá tốt.Sở dĩ gọi là hồi qui tuyến tính vì kỹ thuật chỉ giúp đo đạc các mối liên quan tuyến tính (theo đường thẳng). Sở dĩ gọi là hồi đơn biến (simple linear regression) vì chỉ dùng 1 biến số này (gọi...
Nội dung trích xuất từ tài liệu:
HỒI QUI TUYẾN TÍNH (Linear regression) HỒI QUI TUYẾN TÍNH (Linear regression)I. GIỚI THIỆU Phân tích hồi qui (Regression) là k ỹ thuật rất thường dùng trong thống kê y họcnh ằm tiên đoán giá trị của một đặc điểm khi đã biết giá trị của một đặc điểm khác.Như vậy, phân tích hồi qui chỉ giúp tiên đoán (hoặc ước lượng) khi 2 biến số có mốitương quan khá tốt.Sở dĩ gọi là hồi qui tuyến tính vì kỹ thuật chỉ giúp đo đạc các mối liên quan tuyến tính(theo đường thẳng). Sở dĩ gọi là hồi đơn biến (simple linear regression) vì chỉ dùng 1biến số n ày (g ọi là biến số độc lập – independent variable hay biến số giải thích –explanatory variable) để tiên đoán (hay ước lượng) ra biến số kia (biến số phụ thuộc –dependent variable). Trong hồi qui đa biến – multiple regression có nhiều hơn 1independent variable được sử dụng để tiên đoán.II. THIẾT LẬP PHƯƠNG TRÌNH HỒI QUI MẪU (Sample regression equation) Phương trình (pt) hồi qui mẫu là pt được thiết lập từ số liệu của 1 mẫu (rút ra từdân số) và sẽ được suy diễn như 1 pt hồi qui cho dân số (nếu thích hợp).Khái niệm về đường thẳng vừa khít nhất (line of best fit)Giống như trường hợp với Pearson r, giả định quan trọng nhất trong hồi qui tuyến tínhlà 2 biến số được xem xét có mối liên quan tuyến tính với nhau . Nghĩa là một đườngthẳng có thể đ ược sử dụng để mô tả mối liên quan này. Công thức đại số của pt đườngthẳng là: y = a + bxtheo đó b là độ dốc (slope) của đư ờng thẳng và a là điểm cắt (intercept) của đườngthẳng vào trục y.Độ dốc cho biết sự thay đổi trung b ình ở y có đư ợc khi x thay đổi. Độ dốc càng nhiều(đư ờng thẳng dựng đứng hơn) thì y cũng thay đổi nhiều hơn tương ứng với mỗi thayđổi của x, và mối tương quan của 2 biến số cũng mạnh hơn.Giá trị tại điểm cắt a cho biết giá trị trung b ình của y khi x = 0. y xVới 2 điểm bất kỳ, rất dễ để xác định ph ương trình đường thẳng. Tuy nhiên, khi cónhiều điểm hơn (≥ 3 điểm), khó có thể tìm thấy 1 đường thẳng đi qua các điểm nàycùng 1 lúc n goại trừ khi có mối tương quan tuyệt đối ± 1. Như vậy, trong hồi quituyến tính, cần phải tìm một đ ường thẳng “vừa khít nh ất” với các điểm. Đó cũngchính là đường hồi qui (regression line).Công thức của pt đ ường thẳng cho thấy tương ứng với mỗi giá trị của x, chỉ có 1 giátrị của Y, và đây cũng là phép đo chính xác, nghĩa là không có sai số. Trong thực tế,hầu hết các khảo sát về mối tương quan đều không chính xác. Do vậy, pt hồi qui lẽ ranên được viết là: y = a + bx + etheo đó e (error) là sai số. Chính điều này đ ã thừa nhận là pt tiên đoán không thể giúptiên đoán y chính xác tuyệt đối được. Như vậy, với một x cho trước, có thể có nhiềuhơn một y.Thí dụ chứng minh: x Y x Y0 4 3 100 5 3 110 6 3 121 6 4 121 7 4 131 8 4 142 8 5 142 9 5 152 10 5 16Với mỗi giá trị của x biết trước, có 3 giá trị khác nhau của y. Như vậy, đường hồi quikhông th ể đi qua tất cả các điểm có tọa độ (x, y).Đường thẳng trong đồ thị phân tán là đường “vừa khít nhất” cho tất cả các điểm.Khoảng cách giữa các điểm và đường hồi qui tiêu biểu cho sai số (e) trong công thức.Khoảng cách giữa các điểm và đường “vừa khít nhất” đ ược tính: là giá trị tiên đoán được của Y từ x di = yi – y y là số trung bình của dân số (bao gồm) các Y có thểcó tương ứng với một x đ ã chotrước.Tính tổng độ lệch (từ đường hồi qui) b ình phương (sum of the squared deviations) đ ểđo tổng độ vừa khít của đường hồi qui: d i2 ( yi y ) 2 (Sum of Squared Errors) SSE =Đường hồi qui đi qua các số trung bình của các giá trị Y có thực (observed)tương ứng với x đã cho trước.Phương trình hồi qui mẫuPt hồi qui mẫu có thể được viết như sau: Y là giá trị ước lượng được của Y cho bởi đ ường Y 0 1 xhồi qui 0 là hằng số chỉ nơi đường hồi qui cắt trục Y, vàước lượng giá trị trung bình của Y khi x=0 ...
Nội dung trích xuất từ tài liệu:
HỒI QUI TUYẾN TÍNH (Linear regression) HỒI QUI TUYẾN TÍNH (Linear regression)I. GIỚI THIỆU Phân tích hồi qui (Regression) là k ỹ thuật rất thường dùng trong thống kê y họcnh ằm tiên đoán giá trị của một đặc điểm khi đã biết giá trị của một đặc điểm khác.Như vậy, phân tích hồi qui chỉ giúp tiên đoán (hoặc ước lượng) khi 2 biến số có mốitương quan khá tốt.Sở dĩ gọi là hồi qui tuyến tính vì kỹ thuật chỉ giúp đo đạc các mối liên quan tuyến tính(theo đường thẳng). Sở dĩ gọi là hồi đơn biến (simple linear regression) vì chỉ dùng 1biến số n ày (g ọi là biến số độc lập – independent variable hay biến số giải thích –explanatory variable) để tiên đoán (hay ước lượng) ra biến số kia (biến số phụ thuộc –dependent variable). Trong hồi qui đa biến – multiple regression có nhiều hơn 1independent variable được sử dụng để tiên đoán.II. THIẾT LẬP PHƯƠNG TRÌNH HỒI QUI MẪU (Sample regression equation) Phương trình (pt) hồi qui mẫu là pt được thiết lập từ số liệu của 1 mẫu (rút ra từdân số) và sẽ được suy diễn như 1 pt hồi qui cho dân số (nếu thích hợp).Khái niệm về đường thẳng vừa khít nhất (line of best fit)Giống như trường hợp với Pearson r, giả định quan trọng nhất trong hồi qui tuyến tínhlà 2 biến số được xem xét có mối liên quan tuyến tính với nhau . Nghĩa là một đườngthẳng có thể đ ược sử dụng để mô tả mối liên quan này. Công thức đại số của pt đườngthẳng là: y = a + bxtheo đó b là độ dốc (slope) của đư ờng thẳng và a là điểm cắt (intercept) của đườngthẳng vào trục y.Độ dốc cho biết sự thay đổi trung b ình ở y có đư ợc khi x thay đổi. Độ dốc càng nhiều(đư ờng thẳng dựng đứng hơn) thì y cũng thay đổi nhiều hơn tương ứng với mỗi thayđổi của x, và mối tương quan của 2 biến số cũng mạnh hơn.Giá trị tại điểm cắt a cho biết giá trị trung b ình của y khi x = 0. y xVới 2 điểm bất kỳ, rất dễ để xác định ph ương trình đường thẳng. Tuy nhiên, khi cónhiều điểm hơn (≥ 3 điểm), khó có thể tìm thấy 1 đường thẳng đi qua các điểm nàycùng 1 lúc n goại trừ khi có mối tương quan tuyệt đối ± 1. Như vậy, trong hồi quituyến tính, cần phải tìm một đ ường thẳng “vừa khít nh ất” với các điểm. Đó cũngchính là đường hồi qui (regression line).Công thức của pt đ ường thẳng cho thấy tương ứng với mỗi giá trị của x, chỉ có 1 giátrị của Y, và đây cũng là phép đo chính xác, nghĩa là không có sai số. Trong thực tế,hầu hết các khảo sát về mối tương quan đều không chính xác. Do vậy, pt hồi qui lẽ ranên được viết là: y = a + bx + etheo đó e (error) là sai số. Chính điều này đ ã thừa nhận là pt tiên đoán không thể giúptiên đoán y chính xác tuyệt đối được. Như vậy, với một x cho trước, có thể có nhiềuhơn một y.Thí dụ chứng minh: x Y x Y0 4 3 100 5 3 110 6 3 121 6 4 121 7 4 131 8 4 142 8 5 142 9 5 152 10 5 16Với mỗi giá trị của x biết trước, có 3 giá trị khác nhau của y. Như vậy, đường hồi quikhông th ể đi qua tất cả các điểm có tọa độ (x, y).Đường thẳng trong đồ thị phân tán là đường “vừa khít nhất” cho tất cả các điểm.Khoảng cách giữa các điểm và đường hồi qui tiêu biểu cho sai số (e) trong công thức.Khoảng cách giữa các điểm và đường “vừa khít nhất” đ ược tính: là giá trị tiên đoán được của Y từ x di = yi – y y là số trung bình của dân số (bao gồm) các Y có thểcó tương ứng với một x đ ã chotrước.Tính tổng độ lệch (từ đường hồi qui) b ình phương (sum of the squared deviations) đ ểđo tổng độ vừa khít của đường hồi qui: d i2 ( yi y ) 2 (Sum of Squared Errors) SSE =Đường hồi qui đi qua các số trung bình của các giá trị Y có thực (observed)tương ứng với x đã cho trước.Phương trình hồi qui mẫuPt hồi qui mẫu có thể được viết như sau: Y là giá trị ước lượng được của Y cho bởi đ ường Y 0 1 xhồi qui 0 là hằng số chỉ nơi đường hồi qui cắt trục Y, vàước lượng giá trị trung bình của Y khi x=0 ...
Tìm kiếm theo từ khóa liên quan:
chuyên ngành y khoa tài liệu y khoa lý thuyết y học giáo trình y học bài giảng y học bệnh lâm sàng chuẩn đoán bệnhTài liệu liên quan:
-
38 trang 170 0 0
-
HƯỚNG DẪN ĐIÊU KHẮC RĂNG (THEO TOOTH CARVING MANUAL / LINEK HENRY
48 trang 169 0 0 -
Access for Dialysis: Surgical and Radiologic Procedures - part 3
44 trang 163 0 0 -
Bài giảng Kỹ thuật IUI – cập nhật y học chứng cứ - ThS. BS. Giang Huỳnh Như
21 trang 157 1 0 -
Bài giảng Tinh dầu và dược liệu chứa tinh dầu - TS. Nguyễn Viết Kình
93 trang 153 0 0 -
Tài liệu Bệnh Học Thực Hành: TĨNH MẠCH VIÊM TẮC
8 trang 127 0 0 -
Bài giảng Thoát vị hoành bẩm sinh phát hiện qua siêu âm và thái độ xử trí
19 trang 112 0 0 -
40 trang 106 0 0
-
Bài giảng Chẩn đoán và điều trị tắc động mạch ngoại biên mạn tính - TS. Đỗ Kim Quế
74 trang 95 0 0 -
40 trang 70 0 0