Bài giảng Ứng dụng mô hình hồi quy Logistic
Số trang: 24
Loại file: pptx
Dung lượng: 666.98 KB
Lượt xem: 15
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng trình bày ứng dụng mô hình hồi quy Logistic; ba ứng dụng hình hồi quy logistic; đánh giá mối liên quản, ảnh hưởng, hiệu chỉnh, tiên lượng; mô hình hiệu chỉnh cho yếu tố nhiễu; áp dụng BMA vào nghiên cứu thiếu cân; diễn giải kết quả BMA...
Nội dung trích xuất từ tài liệu:
Bài giảng Ứng dụng mô hình hồi quy LogisticỨng dụng mô hình hồi qui logistic Tuan V. Nguyen Senior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj. Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame Australia Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen Ba ứng dụng hình hồi qui logistic• Đánh giá mối liên quan, ảnh hưởng (association)• Hiệu chỉnh (adjustment) cho yếu tố nhiễu• Tiên lượng (prediction) Ứng dụng 1:Đánh giá mối liên quan, ảnh hưởngCân nặng của trẻ sơ sinh và mẹ hút thuốc lá• Câu hỏi nghiên cứu: có mối liên quan giữa mẹ hút thuốc lá và trọng lượng sơ sinh?• Nghiên cứu cắt ngang trên 189 bà mẹ và trẻ sơ sinh• Biến outcome: low, biến tiên lượng: smoke bw = read.csv(~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6- 2019/Datasets/birthwt.csv) head(bw) id low age lwt race smoke ptl ht ui ftv bwt 1 85 0 19 182 2 0 0 0 1 0 2523 2 86 0 33 155 3 0 0 0 0 3 2551 3 87 0 20 105 1 1 0 0 0 1 2557 Hiển thị mối liên quan bằng biểu đồ Summary:bw$smoke =as.factor(bw$smoke) estimatebs$low = lwr.ci upr.cias.factor(bw$low)library(DescTools) odds ratio 2.022 1.081 3.783Desc(bw$smoke ~ bw$low) rel. risk (col1) 1.258 1.013 1.561 rel. risk (col2) 0.622 0.409 0.945 bw$low 0 1 Sum Mô hình hồi qui logisticMô hình liên quan giữa smoke và low như sau: gọi P là xác suất trọng lượngthấp P log = α + β smoke 1− P # Triển khai bằng Rm = glm(low ~ smoke, family=binomial, data=bw)summary(m)# tính odds ratiolibrary(epiDisplay)logistic.display(m) Kết quả phân tíchMô hình liên quan giữa smoke và low như sau: gọi P là xác suất trọng lượngthấp P log = α + β smoke 1− P Coefficients: Estimate Std. Error z value Pr(>|z|)(Intercept) -1.0871 0.2147 -5.062 4.14e-07 ***smoke1 0.7041 0.3196 2.203 0.0276 *---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 P log = −1.087 + 0.704 × smoke 1− P Kết quả phân tích> logistic.display(m)Logistic regression predicting low : 1 vs 0 OR(95%CI) P(Walds test) P(LR-test)smoke: 1 vs 0 2.02 (1.08,3.78) 0.028 0.027Log-likelihood = -114.9023No. of observations = 189AIC value = 233.8046Diễn giải: có mối liên quan giữa bà mẹ hút thuốc lá và sinh con thiếu cân.Tính trung bình, những bà mẹ hút thuốc lá có odds sinh con thiếu cân cao 2lần (KTC 95%: 1.1 đến 3.8) so với những bà mẹ không hút thuốc lá. Ứng dụng 2:Hiệu chỉnh cho yếu tố nhiễu Yếu tố nhiễu (confounding factors)• Câu hỏi nghiên cứu: có mối liên quan giữa bà mẹ hút thuốc lá và sinh con thiếu cân ?• Yếu tố nhiễu: có liên quan đến yếu tố nguy cơ (risk factor) và outcome• Mối liên quan giữa hút thuốc lá và thiếu cân có thể do yếu tố chủng tộc và độ tuổi?• Câu hỏi mới: mối liên quan giữa hút thuốc lá và thiếu cân có độc lập với yếu tố chủng tộc và độ tuổi? Yếu tố nhiễu: chủng tộc> Desc(factor(bw$race) ~ bw$low) > Desc(factor(bw$race) ~ bw$smoke) bw$low bw$smoke 0 1 Sum 0 1 Sumfactor(bw$race) factor(bw$race)1 freq 73 23 96 1 freq 44 52 96 p.row 76.0% 24.0% . p.row 45.8% 54.2% . p.col 56.2% 39.0% . p.col 38.3% 70.3% .2 freq 15 11 26 2 freq 16 10 26 p.row 57.7% 42.3% . p.row 61.5% 38.5% . p.col 11.5% 18.6% . p.col 13.9% 13.5% .3 freq 42 25 67 3 freq 55 12 67 p.row 62.7% 37.3% . p.row 82.1% 17.9% . p.col 32.3% 42.4% . p.col 47.8% 16.2% . Mô hình hiệu chỉnh cho yếu tố nhiễu• Câu hỏi mới: mối liên quan giữa hút thuốc lá và thiếu cân có độc lập với yếu tố chủng tộc và độ tuổi?• Giải pháp: phân tích mô hình hồi qui logistic• Mô hình mới: P log = α × β1smoke + β2 race + β3age 1− P m = glm(low ~ smoke + factor(race) + age, family = binomial, data=bw) logistic.display(m) Kết quả phân tích > m = glm(low ~ smoke + factor(race) + age, family = binomial, data=bw) > logistic.display(m) OR lower95ci upper95ci Pr(>|Z|) smoke1 3.0058203 1.4499820 6.231081 0.00308734 ...
Nội dung trích xuất từ tài liệu:
Bài giảng Ứng dụng mô hình hồi quy LogisticỨng dụng mô hình hồi qui logistic Tuan V. Nguyen Senior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj. Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame Australia Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen Ba ứng dụng hình hồi qui logistic• Đánh giá mối liên quan, ảnh hưởng (association)• Hiệu chỉnh (adjustment) cho yếu tố nhiễu• Tiên lượng (prediction) Ứng dụng 1:Đánh giá mối liên quan, ảnh hưởngCân nặng của trẻ sơ sinh và mẹ hút thuốc lá• Câu hỏi nghiên cứu: có mối liên quan giữa mẹ hút thuốc lá và trọng lượng sơ sinh?• Nghiên cứu cắt ngang trên 189 bà mẹ và trẻ sơ sinh• Biến outcome: low, biến tiên lượng: smoke bw = read.csv(~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6- 2019/Datasets/birthwt.csv) head(bw) id low age lwt race smoke ptl ht ui ftv bwt 1 85 0 19 182 2 0 0 0 1 0 2523 2 86 0 33 155 3 0 0 0 0 3 2551 3 87 0 20 105 1 1 0 0 0 1 2557 Hiển thị mối liên quan bằng biểu đồ Summary:bw$smoke =as.factor(bw$smoke) estimatebs$low = lwr.ci upr.cias.factor(bw$low)library(DescTools) odds ratio 2.022 1.081 3.783Desc(bw$smoke ~ bw$low) rel. risk (col1) 1.258 1.013 1.561 rel. risk (col2) 0.622 0.409 0.945 bw$low 0 1 Sum Mô hình hồi qui logisticMô hình liên quan giữa smoke và low như sau: gọi P là xác suất trọng lượngthấp P log = α + β smoke 1− P # Triển khai bằng Rm = glm(low ~ smoke, family=binomial, data=bw)summary(m)# tính odds ratiolibrary(epiDisplay)logistic.display(m) Kết quả phân tíchMô hình liên quan giữa smoke và low như sau: gọi P là xác suất trọng lượngthấp P log = α + β smoke 1− P Coefficients: Estimate Std. Error z value Pr(>|z|)(Intercept) -1.0871 0.2147 -5.062 4.14e-07 ***smoke1 0.7041 0.3196 2.203 0.0276 *---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 P log = −1.087 + 0.704 × smoke 1− P Kết quả phân tích> logistic.display(m)Logistic regression predicting low : 1 vs 0 OR(95%CI) P(Walds test) P(LR-test)smoke: 1 vs 0 2.02 (1.08,3.78) 0.028 0.027Log-likelihood = -114.9023No. of observations = 189AIC value = 233.8046Diễn giải: có mối liên quan giữa bà mẹ hút thuốc lá và sinh con thiếu cân.Tính trung bình, những bà mẹ hút thuốc lá có odds sinh con thiếu cân cao 2lần (KTC 95%: 1.1 đến 3.8) so với những bà mẹ không hút thuốc lá. Ứng dụng 2:Hiệu chỉnh cho yếu tố nhiễu Yếu tố nhiễu (confounding factors)• Câu hỏi nghiên cứu: có mối liên quan giữa bà mẹ hút thuốc lá và sinh con thiếu cân ?• Yếu tố nhiễu: có liên quan đến yếu tố nguy cơ (risk factor) và outcome• Mối liên quan giữa hút thuốc lá và thiếu cân có thể do yếu tố chủng tộc và độ tuổi?• Câu hỏi mới: mối liên quan giữa hút thuốc lá và thiếu cân có độc lập với yếu tố chủng tộc và độ tuổi? Yếu tố nhiễu: chủng tộc> Desc(factor(bw$race) ~ bw$low) > Desc(factor(bw$race) ~ bw$smoke) bw$low bw$smoke 0 1 Sum 0 1 Sumfactor(bw$race) factor(bw$race)1 freq 73 23 96 1 freq 44 52 96 p.row 76.0% 24.0% . p.row 45.8% 54.2% . p.col 56.2% 39.0% . p.col 38.3% 70.3% .2 freq 15 11 26 2 freq 16 10 26 p.row 57.7% 42.3% . p.row 61.5% 38.5% . p.col 11.5% 18.6% . p.col 13.9% 13.5% .3 freq 42 25 67 3 freq 55 12 67 p.row 62.7% 37.3% . p.row 82.1% 17.9% . p.col 32.3% 42.4% . p.col 47.8% 16.2% . Mô hình hiệu chỉnh cho yếu tố nhiễu• Câu hỏi mới: mối liên quan giữa hút thuốc lá và thiếu cân có độc lập với yếu tố chủng tộc và độ tuổi?• Giải pháp: phân tích mô hình hồi qui logistic• Mô hình mới: P log = α × β1smoke + β2 race + β3age 1− P m = glm(low ~ smoke + factor(race) + age, family = binomial, data=bw) logistic.display(m) Kết quả phân tích > m = glm(low ~ smoke + factor(race) + age, family = binomial, data=bw) > logistic.display(m) OR lower95ci upper95ci Pr(>|Z|) smoke1 3.0058203 1.4499820 6.231081 0.00308734 ...
Tìm kiếm theo từ khóa liên quan:
Ứng dụng mô hình hồi quy Logistic Mô hình hồi quy Logistic Hồi quy Logistic Diễn giải kết quả BMA Áp dụng BMATài liệu liên quan:
-
Các nhân tố ảnh hưởng đến tình trạng nghèo đa chiều ở Việt Nam
15 trang 169 0 0 -
Machine Learning cơ bản: Phần 1 - Vũ Hữu Tiệp
232 trang 56 0 0 -
8 trang 35 0 0
-
108 trang 32 0 0
-
Bài giảng Khai phá web - Bài 9: Chủ đề nâng cao
41 trang 31 0 0 -
13 trang 31 0 0
-
Tác động lấn át của FDI đến sự rời ngành của doanh nghiệp nội địa trong ngành dệt may Việt Nam
10 trang 26 0 0 -
Xác định cỡ mẫu trong nghiên cứu y học khi không có công thức: Phương pháp giả lập
7 trang 23 0 0 -
Phân loại phương tiện giao thông Việt Nam trong không ảnh
8 trang 22 0 0 -
Bài giảng Học máy: Bài 4 - Nguyễn Hoàng Long
0 trang 21 0 0