Bài giảng Mô hình hồi quy Logistic
Số trang: 42
Loại file: pdf
Dung lượng: 2.25 MB
Lượt xem: 11
Lượt tải: 0
Xem trước 5 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng nghiên cứu mô hình hồi quy Logistic; ứng dụng của mô hình hồi quy Logistic; thời điểm sử dụng mô hình hồi quy Logistic; một vài khái niệm cơ bản...
Nội dung trích xuất từ tài liệu:
Bài giảng Mô hình hồi quy Logistic Tuan V. NguyenSenior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj. Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame AustraliaPhân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. NguyenMô hình hồi qui logistic (logistic regression)• Ví dụ dẫn nhập• Khái niệm odds, logit, và mô hình hồi qui logistic• Ước tính và R The Challenger shuttle disasterFlight Temp Damage Flight Temp DamageSTS-1 66 0 STS 51B 75 0STS-2 70 1 STS 51G 70 0STS-3 69 0 STS 51F 81 0STS-4 80 STS 51I 76 0STS-5 68 0 STS 51J 79 0STS-6 67 0 STS 61A 75 1STS-7 72 0 STS 61B 76 0STS-8 73 0 STS 61C 58 1STS-9 70 0STS 41B 57 1 Temp = c(66, 70, 69, 80, 68, 67, 72, 73, 70, 57, 63,STS 41C 63 1 70, 78, 67, 53, 67, 75, 70, 81, 76, 79, 75, 76, 58)STS 41D 70 1 Damage = c(0, 1, 0, ., 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 1, 0,STS 41G 78 0 0, 0, 0, 0, 0, 1, 0, 1)STS 51A 67 0STS 51C 53 1STS 51D 67 0 Nghiên cứu bệnh tiểu đường (type 2 diabetes)• Nghiên cứu cắt ngang trên 3155 cá nhân• Outcome: chẩn đoán tiểu đường• Yếu tố nguy cơ: tuổi, giới tính, huyết áp, vòng eo, vòng mông, cân nặng, tỉ trọng cơ thể (BMI)• Câu hỏi 1: BMI có liên quan đến bệnh tiểu đường?• Câu hỏi 2: Yếu tố nào có liên quan đến tiểu đường?• Câu hỏi 2: Có thể xây dựng mô hình tiên lượng nguy cơ mắc bệnh?> db = read.csv(~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6-2019/Datasets/Diabetes data.csv, header=T)> head(db) id age gender height weight waist hip sysbp diabp active hypertension1 1 76 Female 163 53 90 93 160 90 0 12 1 40 Female 149 51 74 94 100 60 0 03 1 51 Female 151 55 91 100 120 80 0 04 1 43 Female 158 62 78 96 120 80 1 05 2 72 Female 148 47 91 95 130 60 1 06 2 44 Male 155 48 69 86 120 80 0 0 bmi whr diabetes1 19.95 0.97 IFG2 22.97 0.79 Normal3 24.12 0.91 Normal4 24.84 0.81 Normal5 21.46 0.96 IFG6 19.98 0.80 Normal Gian lận thẻ tín dụng (credit card)• Nghiên cứu cắt ngang trên 284807 transactions• Outcome: gian lận (yes / no)• Yếu tố nguy cơ: Time, Amount, V1-V28• Câu hỏi: Có thể xây dựng mô hình tiên lượng gian lận> cc = read.csv(~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6-2019/Datasets/Credit card data.csv, header=T)> head(cc, 3) Time V1 V2 V3 V4 V5 V61 0 -1.359807 -0.07278117 2.5363467 1.3781552 -0.33832077 0.462387782 0 1.191857 0.26615071 0.1664801 0.4481541 0.06001765 -0.082360813 1 -1.358354 -1.34016307 1.7732093 0.3797796 -0.50319813 1.80049938 V7 V8 V9 V10 V11 V121 0.23959855 0.09869790 0.3637870 0.09079417 -0.5515995 -0.617800862 -0.07880298 0.08510165 -0.2554251 -0.16697441 1.6127267 1.065235313 0.79146096 0.24767579 -1.5146543 0.20764287 0.6245015 0.06608369 V13 V14 V15 V16 V17 V181 -0.9913898 -0.3111694 1.4681770 -0.4704005 0.2079712 0.025790582 0.4890950 -0.1437723 0.6355581 0.4639170 -0.1148047 -0.183361273 0.7172927 -0.1659459 2.3458649 -2.8900832 1.1099694 -0.12135931 V19 V20 V21 V22 V23 V241 0.403993 0.25141210 -0.01830678 0.2778376 -0.1104739 0.066928082 -0.145783 -0.06908314 -0.22577525 -0.6386720 0.1012880 -0.339846483 -2.261857 0.52497973 0.24799815 0.7716794 0.9094123 -0.68928096 V25 V26 V27 V28 Amount Class1 0.1285394 -0.1891148 0.133558377 -0.02105305 149.62 02 0.1671704 0.1258945 -0.008983099 0.01472417 2.69 03 -0.3276418 -0.1390966 -0.055352794 -0.05975184 378.66 0 Đặc tính của các nghiên cứu• Outcome (dependent) variable: biến nhị phân (binary variable), chỉ có 2 giá trị• Predictor (independent) variables: đa dạng (nhị phân, biến liên tục) Không thể dùng mô hình hồi qui tuyến tính! Ứng dụng của mô hình hồi qui logistic• M ...
Nội dung trích xuất từ tài liệu:
Bài giảng Mô hình hồi quy Logistic Tuan V. NguyenSenior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj. Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame AustraliaPhân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. NguyenMô hình hồi qui logistic (logistic regression)• Ví dụ dẫn nhập• Khái niệm odds, logit, và mô hình hồi qui logistic• Ước tính và R The Challenger shuttle disasterFlight Temp Damage Flight Temp DamageSTS-1 66 0 STS 51B 75 0STS-2 70 1 STS 51G 70 0STS-3 69 0 STS 51F 81 0STS-4 80 STS 51I 76 0STS-5 68 0 STS 51J 79 0STS-6 67 0 STS 61A 75 1STS-7 72 0 STS 61B 76 0STS-8 73 0 STS 61C 58 1STS-9 70 0STS 41B 57 1 Temp = c(66, 70, 69, 80, 68, 67, 72, 73, 70, 57, 63,STS 41C 63 1 70, 78, 67, 53, 67, 75, 70, 81, 76, 79, 75, 76, 58)STS 41D 70 1 Damage = c(0, 1, 0, ., 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 1, 0,STS 41G 78 0 0, 0, 0, 0, 0, 1, 0, 1)STS 51A 67 0STS 51C 53 1STS 51D 67 0 Nghiên cứu bệnh tiểu đường (type 2 diabetes)• Nghiên cứu cắt ngang trên 3155 cá nhân• Outcome: chẩn đoán tiểu đường• Yếu tố nguy cơ: tuổi, giới tính, huyết áp, vòng eo, vòng mông, cân nặng, tỉ trọng cơ thể (BMI)• Câu hỏi 1: BMI có liên quan đến bệnh tiểu đường?• Câu hỏi 2: Yếu tố nào có liên quan đến tiểu đường?• Câu hỏi 2: Có thể xây dựng mô hình tiên lượng nguy cơ mắc bệnh?> db = read.csv(~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6-2019/Datasets/Diabetes data.csv, header=T)> head(db) id age gender height weight waist hip sysbp diabp active hypertension1 1 76 Female 163 53 90 93 160 90 0 12 1 40 Female 149 51 74 94 100 60 0 03 1 51 Female 151 55 91 100 120 80 0 04 1 43 Female 158 62 78 96 120 80 1 05 2 72 Female 148 47 91 95 130 60 1 06 2 44 Male 155 48 69 86 120 80 0 0 bmi whr diabetes1 19.95 0.97 IFG2 22.97 0.79 Normal3 24.12 0.91 Normal4 24.84 0.81 Normal5 21.46 0.96 IFG6 19.98 0.80 Normal Gian lận thẻ tín dụng (credit card)• Nghiên cứu cắt ngang trên 284807 transactions• Outcome: gian lận (yes / no)• Yếu tố nguy cơ: Time, Amount, V1-V28• Câu hỏi: Có thể xây dựng mô hình tiên lượng gian lận> cc = read.csv(~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6-2019/Datasets/Credit card data.csv, header=T)> head(cc, 3) Time V1 V2 V3 V4 V5 V61 0 -1.359807 -0.07278117 2.5363467 1.3781552 -0.33832077 0.462387782 0 1.191857 0.26615071 0.1664801 0.4481541 0.06001765 -0.082360813 1 -1.358354 -1.34016307 1.7732093 0.3797796 -0.50319813 1.80049938 V7 V8 V9 V10 V11 V121 0.23959855 0.09869790 0.3637870 0.09079417 -0.5515995 -0.617800862 -0.07880298 0.08510165 -0.2554251 -0.16697441 1.6127267 1.065235313 0.79146096 0.24767579 -1.5146543 0.20764287 0.6245015 0.06608369 V13 V14 V15 V16 V17 V181 -0.9913898 -0.3111694 1.4681770 -0.4704005 0.2079712 0.025790582 0.4890950 -0.1437723 0.6355581 0.4639170 -0.1148047 -0.183361273 0.7172927 -0.1659459 2.3458649 -2.8900832 1.1099694 -0.12135931 V19 V20 V21 V22 V23 V241 0.403993 0.25141210 -0.01830678 0.2778376 -0.1104739 0.066928082 -0.145783 -0.06908314 -0.22577525 -0.6386720 0.1012880 -0.339846483 -2.261857 0.52497973 0.24799815 0.7716794 0.9094123 -0.68928096 V25 V26 V27 V28 Amount Class1 0.1285394 -0.1891148 0.133558377 -0.02105305 149.62 02 0.1671704 0.1258945 -0.008983099 0.01472417 2.69 03 -0.3276418 -0.1390966 -0.055352794 -0.05975184 378.66 0 Đặc tính của các nghiên cứu• Outcome (dependent) variable: biến nhị phân (binary variable), chỉ có 2 giá trị• Predictor (independent) variables: đa dạng (nhị phân, biến liên tục) Không thể dùng mô hình hồi qui tuyến tính! Ứng dụng của mô hình hồi qui logistic• M ...
Tìm kiếm theo từ khóa liên quan:
Mô hình hồi quy Logistic Hồi quy Logistic Ứng dụng mô hình hồi quy Logistic Sử dụng mô hình hồi quy Logistic Mô hình hồi quy Logistic dựa trên logitGợi ý tài liệu liên quan:
-
Các nhân tố ảnh hưởng đến tình trạng nghèo đa chiều ở Việt Nam
15 trang 149 0 0 -
Machine Learning cơ bản: Phần 1 - Vũ Hữu Tiệp
232 trang 50 0 0 -
8 trang 33 0 0
-
13 trang 28 0 0
-
Bài giảng Khai phá web - Bài 9: Chủ đề nâng cao
41 trang 27 0 0 -
108 trang 27 0 0
-
Tác động lấn át của FDI đến sự rời ngành của doanh nghiệp nội địa trong ngành dệt may Việt Nam
10 trang 23 0 0 -
Xác định cỡ mẫu trong nghiên cứu y học khi không có công thức: Phương pháp giả lập
7 trang 21 0 0 -
Giáo trình Nhập môn trí tuệ nhân tạo: Phần 2 - Từ Minh Phương
99 trang 19 0 0 -
Phân loại phương tiện giao thông Việt Nam trong không ảnh
8 trang 17 0 0