Vấn đề bây giờ là xác định khoảng tin cậy 95% của số trung vị . Nói cách khác, nếu nghiên cứu được lặp lại 1000 lần, và mỗi lần chọn 11 đối tượng, thì khoảng tin cậy của số trung vị ra sao. Phương pháp bootstrap rất có ích để giải quyết vấn đề.
Nội dung trích xuất từ tài liệu:
Lâm sàng thống kê: Bài 3. Khoảng tin cậy 95% của trung vị - Nguyễn Văn Tuấn Lâm sàng th ng kê Kho ng tin c y 95% c a trung v Nguy n Văn Tu n H i: “Em o m t bi n s lâm sàng, nhưng vì bi n s này không tuân theo lu tphân ph i chu n, nên em ph i dùng s trung v mô t bi n s . Em mu n bi t cáchtính kho ng tin c y 95% c a nó. Tìm trong sách giáo khoa không th y sách nào ch cáchtính này. Mong th y ch cách tính kho ng tin c y 95% c a s trung v .” ây là m t v n thú v ! i v i các bi n không tuân theo lu t phân ph i chu n,chúng ta không th s d ng s trung bình và l ch chu n mô t bi n. Thay vào ó,chúng ta ph i áp d ng các phương pháp th ng kê phi tham s (non-parametric statistics) tính. M t trong nh ng ch s mô t trung bình c a bi n là s trung v (median). úng như b n c vi t, các sách giáo khoa không mô t cách tính kho ng tin c y95% c a s trung v . ơn gi n vì … không có công th c nào tính. Tuy nhiên, trongba th p niên tr l i ây, v i s phát tri n c a máy tính, m t cu c cách m ng th ng kê ãx y ra. Phương pháp cách m ng ó có tên là “bootstrap method” do nhà th ng kê h cBradley Efron phát tri n vào năm 1979. Phương pháp bootstrap ã ư c ng d ng r ngrãi trong nhi u lĩnh v c khoa h c, và n nay có th xem là m t phương pháp chu n.Trong bài này, tôi s “l i d ng” câu h i gi i thi u phương pháp này. Vì ph i s d ngmáy tính, cho nên b n c c n ph i bi t qua m t ngôn ng th ng kê, ch ng h n như Rti n vi c theo dõi. Chúng ta s b t u b ng m t ví d c th .Phương pháp ư c tính s trung v Ví d 1. S li u v ch s au (pain index) 11 b nh nhân th p kh p như sau: 0.05, 0.15, 0.35, 0.25, 0.20, 0.05, 0.10, 0.05, 0.30, 0.05, và 0.25(Chú ý ch s càng cao, au càng nghiêm tr ng). S trung bình c a 11 b nh nhân là0.163 và l ch chu n 0.112. Vì s trung bình th p hơn 2 l n l ch chu n, chúng ta cóth k t lu n r ng bi n s này không tuân theo lu t phân ph i chu n. Cách tính median cóth ti n hành qua hai bư c ơn gi n sau ây: • Bư c 1: S p x p d li u theo th t t th p nh t n cao nh t: 0.05, 0.05, 0.05, 0.05, 0.10, 0.15, 0.20, 0.25, 0.25, 0.30, 0.35 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 1 Chú ý: hàng th 2 (s trong ngo c) là s th t t th p n cao. • Bư c 2: Xác nh s gi a. Vì có 11 b nh nhân, s gi a ph i là s hàng th 6. S hàng th 6 là 0.15 và ây chính là s trung v : 0.05, 0.05, 0.05, 0.05, 0.10, 0.15, 0.20, 0.25, 0.25, 0.30, 0.35Phương pháp bootstrap V n bây gi là xác nh kho ng tin c y 95% c a s trung v . Nói cách khác,n u nghiên c u ư c l p l i 1000 l n, và m i l n ch n 11 i tư ng, thì kho ng tin c yc a s trung v ra sao. Phương pháp bootstrap r t có ích gi i quy t v n . Phươngpháp này ư c ti n hành như sau: • Bư c 1: B t u b ng m u g c x1, x2, x3, …, xn. Trong ví d trên: 0.05, 0.05, 0.05, 0.05, 0.10, 0.15, 0.20, 0.25, 0.25, 0.30, 0.35 • Bư c 2: Ch n ng u nhiên n cá nhân t m u g c v i qui trình l y m u có hoàn l i (replacement sample). M i l n ch n m u, tính s trung v và t m g i s này là mi. C n gi i thích thêm ây v phương pháp l y m u có hoàn l i có nghĩa là m t cá nhân có th ư c hơn m t l n trong m t l n ch n m u. Ch ng h n như t qu n th 2, 3, 4, 5, l y m u có hoàn l i có nghĩa là l n ch n m u th nh t có th là 2, 4, 5, 2 (t c i tư ng th hai ư c ch n hai l n); l n th hai có th là 4, 4, 2, 2, 5 (t c i tư ng th hai và th tư ư c ch n hai l n); l n th ba có th là 2, 5, 2, 3; v.v... • Bư c 3: L p l i bư c hai N l n (N thư ng là 1000 hay 10000 hay th m chí 1 tri u – tùy theo nhu c u). Trong trư ng h p trên, 10 m u u tiên có th là: M u 1: 0.05 0.05 0.10 0.05 0.20 0.20 0.05 0.25 0.10 0.10 0.30 0.10 M u 2: 0.05 0.25 0.30 0.05 0.30 0.30 0.05 0.05 0.25 0.05 0.35 0.25 M u 3: 0.35 0.10 0.05 0.25 0.05 0.05 0.20 0.25 0.15 0.25 0.10 0.15 M u 4: 0.05 0.05 0.10 0.25 0.15 0.05 0.20 0.05 0.10 0.25 0.05 0.10 M u 5: 0.30 0.25 0.05 0.25 0.25 0.05 0.20 0.05 0.25 0.05 0.05 0.20 M u 6: 0.05 0.25 0.10 0.05 0.05 0.15 0.25 0.05 0.05 0.05 0.05 0.05 M u 7: 0.05 0.15 0.25 0.05 0.05 0.30 0.20 0.25 0.30 0.05 0.35 0.20 M u 8: 0.05 0.05 0.20 0.05 0.10 0.05 0.05 0.10 0.20 0.10 0.05 0.05 M u 9: 0.05 0.05 0.10 0.25 0.20 0.25 0.25 0.20 0.35 0.25 0.35 0.25 M u 10: 0.05 0.05 0.05 0.25 0.35 0.25 0.25 0.15 0.20 0.20 0.15 0.20 v.v…Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 2 (Chú ý: s phía sau có nghĩa là s trung v cho t ng m u) • Bư c 4: n ây chúng ta có N s trung v . S p x p N s t th p n cao và ánh s : 1, 2, 3, …, N. Ch n s trung v h ng 2.5% và 97.5% c a N s trung v , và ó chính là kho ng tin c y 95%. Ch ng h n như n u N = 1000 l n, thì kho ng tin c y 95% chính là s trung v hàng th 25 và 975. Các bư c tính toán trên có th th c hi n b ng ngôn ng R (hay m t ngôn ng hayph n m m nào mà b n c quen thu c) r t d dàng. i v i R, các mã s d ng (và gi ithích kèm theo) như sau: # nh p các s li u g c vào m t vector có tên là x x Vì phương pháp bootstrap òi h i có máy tính, và do ó, ngư i s d ng ph i amhi u m t ngôn ng hay ph n m m th ng kê. Trong bài này, tôi s d ng ngôn ng Rth c hi n phương pháp bootstrap, vì R là m t ngôn ng tương i d s d ng nhưng r tlinh ho t tính toán các v n khó trong th c t nghiên c u lâm sàng. B n c mu nbi t thêm v ngôn ng R có th tìm c cu n sách “Phân tích s li u và t o bi u b ngR” c a tôi, do Nhà xu t b n ...