11 Phân tích phương sai (Analysis of variance)
Số trang: 47
Loại file: pdf
Dung lượng: 361.13 KB
Lượt xem: 16
Lượt tải: 0
Xem trước 5 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Phân tích phương sai, như tên gọi, là một số phương pháp phân tích thống kê mà trọng điểm là phương sai (thay vì số trung bình). Phương pháp phân tích phương sai nằm trong “đại gia đình” các phương pháp có tên là mô hình tuyến tính (hay general linear models), bao gồm cả hồi qui tuyến tính mà chúng ta đã gặp trong chương trước. Trong chương này, chúng ta sẽ làm quen với cách sử dụng R trong phân tích phương sai. Chúng ta sẽ bắt đầu bằng một phân tích đơn giản, sau đó sẽ...
Nội dung trích xuất từ tài liệu:
11 Phân tích phương sai (Analysis of variance) 11 Phân tích phương sai (Analysis of variance) Phân tích phương sai, như tên gọi, là một số phương pháp phân tích thống kêmà trọng điểm là phương sai (thay vì số trung bình). Phương pháp phân tích phươngsai nằm trong “đại gia đình” các phương pháp có tên là mô hình tuyến tính (haygeneral linear models), bao gồm cả hồi qui tuyến tính mà chúng ta đã gặp trongchương trước. Trong chương này, chúng ta sẽ làm quen với cách sử dụng R trongphân tích phương sai. Chúng ta sẽ bắt đầu bằng một phân tích đơn giản, sau đó sẽxem đến phân tích phương sai hai chiều, và các phương pháp phi tham số thông dụng.11.1 Phân tích phương sai đơn giản (one-wayanalysis of variance - ANOVA) Ví dụ 1. Bảng thống kê 11.1 dưới đây so sánh độ galactose trong 3nhóm bệnh nhân: nhóm 1 gồm 9 bệnh nhân với bệnh Crohn; nhóm 2 gồm 11bệnh nhân với bệnh viêm ruột kết (colitis); và nhóm 3 gồm 20 đối tượng khôngcó bệnh (gọi là nhóm đối chứng). Câu hỏi đặt ra là độ galactose giữa 3 nhómbệnh nhân có khác nhau hay không? Gọi giá trị trung bình của ba nhóm là µ1,µ2, và µ3, và nói theo ngôn ngữ của kiểm định giả thiết thì giả thiết đảo là: Ho: µ1 = µ2 = µ3Và giả thiết chính là: HA: có một khác biệt giữa 3 µj (j=1,2,3)Bảng 11.1. Độ galactose cho 3 nhóm bệnh nhân Crohn, viêm ruột kết và đối chứng Nhóm 1: bệnh Nhóm 2: bệnh viêm Nhóm 3: đối chứng Crohn ruột kết (control) 1343 1264 1809 2850 1393 1314 1926 2964 1420 1399 2283 2973 1641 1605 2384 3171 1897 2385 2447 3257 2160 2511 2479 3271 2169 2514 2495 3288 2279 2767 2525 3358 2890 2827 2541 3643 2895 2769 3657 3011 n=9 n=11 n=20 Trung bình: 1910 Trung bình: 2226 Trung bình: 2804 SD: 516 SD: 727 SD: 527 173Chú thích: SD là độ lệch chuẩn (standard deviation). Mới xem qua vấn đề, có lẽ bạn đọc sẽ nghĩ rằng chúng ta cần làm 3 sosánh (bằng phương pháp kiểm định t): giữa nhóm 1 và 2, nhóm 2 và 3, và nhóm 1và 3. Nhưng cách làm này không hợp lí, vì có ba phương sai khác nhau. Cáchthích hợp nhất để so sánh này là phân tích phương sai. Phân tích phương sai cóthể ứng dụng để so sánh nhiều nhóm cùng một lúc (simultaneous comparisons).11.1.1 Mô hình phân tích phương sai Để minh họa cho phương pháp phân tích phương sai, chúng ta phảidùng kí hiệu. Gọi độ galactose của bệnh nhân i thuộc nhóm j (j = 1, 2, 3) là xij.Mô hình phân tích phương sai phát biểu rằng: xij = µ + α i + ε ij [1]Hay cụ thể hơn: xi1 = µ + α1 + εi1 xi2 = µ + α2 + εi2 xi3 = µ + α3 + εi3 Tức là, giá trị galactose của bất cứ bệnh nhân nào bằng giá trị trungbình của toàn quần thể (µ) cộng/trừ cho ảnh hưởng của nhóm j được đo bằng hệsố ảnh hưởng α i , và sai số ε ij . Một giả định khác là ε ij phải tuân theo luật phânphối chuẩn với trung bình 0 và phương sai σ2. Hai thông số cần ước tính là µ vàα i . Cũng như phân tích hồi qui tuyến tính, hai thông số này được ước tính bằngphương pháp bình phương nhỏ nhất; tức là tìm ước số µ và α j sao cho ˆ ˆ∑( x − µ − α j ) nhỏ nhất. 2 ˆˆ ijQuay lại với số liệu nghiên cứu trên, chúng ta có những tóm tắt thống kê như sau: Nhóm Số đối Trung bình Phương sai tượng (nj) 1 – Crohn n1 = 9 s12 = 265944 x1 = 1910 2 – Viêm ruột kết n2 = 11 x2 = 2226 2 s2 = 473387 3 – Đối chứng n3 = 20 x3 = 2804 2 s3 = 277500 Toàn bô mẫu n = 40 x = 2444 ( )( ...
Nội dung trích xuất từ tài liệu:
11 Phân tích phương sai (Analysis of variance) 11 Phân tích phương sai (Analysis of variance) Phân tích phương sai, như tên gọi, là một số phương pháp phân tích thống kêmà trọng điểm là phương sai (thay vì số trung bình). Phương pháp phân tích phươngsai nằm trong “đại gia đình” các phương pháp có tên là mô hình tuyến tính (haygeneral linear models), bao gồm cả hồi qui tuyến tính mà chúng ta đã gặp trongchương trước. Trong chương này, chúng ta sẽ làm quen với cách sử dụng R trongphân tích phương sai. Chúng ta sẽ bắt đầu bằng một phân tích đơn giản, sau đó sẽxem đến phân tích phương sai hai chiều, và các phương pháp phi tham số thông dụng.11.1 Phân tích phương sai đơn giản (one-wayanalysis of variance - ANOVA) Ví dụ 1. Bảng thống kê 11.1 dưới đây so sánh độ galactose trong 3nhóm bệnh nhân: nhóm 1 gồm 9 bệnh nhân với bệnh Crohn; nhóm 2 gồm 11bệnh nhân với bệnh viêm ruột kết (colitis); và nhóm 3 gồm 20 đối tượng khôngcó bệnh (gọi là nhóm đối chứng). Câu hỏi đặt ra là độ galactose giữa 3 nhómbệnh nhân có khác nhau hay không? Gọi giá trị trung bình của ba nhóm là µ1,µ2, và µ3, và nói theo ngôn ngữ của kiểm định giả thiết thì giả thiết đảo là: Ho: µ1 = µ2 = µ3Và giả thiết chính là: HA: có một khác biệt giữa 3 µj (j=1,2,3)Bảng 11.1. Độ galactose cho 3 nhóm bệnh nhân Crohn, viêm ruột kết và đối chứng Nhóm 1: bệnh Nhóm 2: bệnh viêm Nhóm 3: đối chứng Crohn ruột kết (control) 1343 1264 1809 2850 1393 1314 1926 2964 1420 1399 2283 2973 1641 1605 2384 3171 1897 2385 2447 3257 2160 2511 2479 3271 2169 2514 2495 3288 2279 2767 2525 3358 2890 2827 2541 3643 2895 2769 3657 3011 n=9 n=11 n=20 Trung bình: 1910 Trung bình: 2226 Trung bình: 2804 SD: 516 SD: 727 SD: 527 173Chú thích: SD là độ lệch chuẩn (standard deviation). Mới xem qua vấn đề, có lẽ bạn đọc sẽ nghĩ rằng chúng ta cần làm 3 sosánh (bằng phương pháp kiểm định t): giữa nhóm 1 và 2, nhóm 2 và 3, và nhóm 1và 3. Nhưng cách làm này không hợp lí, vì có ba phương sai khác nhau. Cáchthích hợp nhất để so sánh này là phân tích phương sai. Phân tích phương sai cóthể ứng dụng để so sánh nhiều nhóm cùng một lúc (simultaneous comparisons).11.1.1 Mô hình phân tích phương sai Để minh họa cho phương pháp phân tích phương sai, chúng ta phảidùng kí hiệu. Gọi độ galactose của bệnh nhân i thuộc nhóm j (j = 1, 2, 3) là xij.Mô hình phân tích phương sai phát biểu rằng: xij = µ + α i + ε ij [1]Hay cụ thể hơn: xi1 = µ + α1 + εi1 xi2 = µ + α2 + εi2 xi3 = µ + α3 + εi3 Tức là, giá trị galactose của bất cứ bệnh nhân nào bằng giá trị trungbình của toàn quần thể (µ) cộng/trừ cho ảnh hưởng của nhóm j được đo bằng hệsố ảnh hưởng α i , và sai số ε ij . Một giả định khác là ε ij phải tuân theo luật phânphối chuẩn với trung bình 0 và phương sai σ2. Hai thông số cần ước tính là µ vàα i . Cũng như phân tích hồi qui tuyến tính, hai thông số này được ước tính bằngphương pháp bình phương nhỏ nhất; tức là tìm ước số µ và α j sao cho ˆ ˆ∑( x − µ − α j ) nhỏ nhất. 2 ˆˆ ijQuay lại với số liệu nghiên cứu trên, chúng ta có những tóm tắt thống kê như sau: Nhóm Số đối Trung bình Phương sai tượng (nj) 1 – Crohn n1 = 9 s12 = 265944 x1 = 1910 2 – Viêm ruột kết n2 = 11 x2 = 2226 2 s2 = 473387 3 – Đối chứng n3 = 20 x3 = 2804 2 s3 = 277500 Toàn bô mẫu n = 40 x = 2444 ( )( ...
Tìm kiếm theo từ khóa liên quan:
quản lý bệnh viện vẽ biểu đồ bằng R phần mềm quản lý bệnh viện tài liệu quản lý bệnh viện thực hành quản lý bệnh việnGợi ý tài liệu liên quan:
-
Bài thuyết trình Hệ thống thông tin trong bệnh viện
44 trang 223 0 0 -
Mô tả công việc lập trình viên phần mềm
1 trang 190 0 0 -
Đồ án tốt nghiệp - Phân tích thiết kế hệ thống - Quản lý hồ sơ bệnh án của 1 khoa
20 trang 135 0 0 -
Tài liệu cơ bản trong quản lý bệnh viện
393 trang 73 0 0 -
Ứng dụng công nghệ thông tin trong quản lý bệnh viện tại Bệnh viện Nhân Dân Gia Định
5 trang 51 1 0 -
44 trang 29 0 0
-
Chuyên đề Quản lý bệnh viện: Phần 2
234 trang 25 0 0 -
Đánh giá hoạt động giáo dục sức khỏe tại Bệnh viện Bỏng Quốc gia Lê Hữu Trác năm 2022
9 trang 24 0 0 -
Chương trình y tế quốc gia Tổ chức y tế: Phần 2
100 trang 23 0 0 -
Chuyên đề Quản lý bệnh viện: Phần 1
159 trang 23 0 0