Một trong những khó khăn và có thẻ nói là vấn đề nan giải trong các nghiên cứu đa biến và các biến tiên lượng (predictor variables) thường có mối liên quan sinh học với nhau. Chẳng hạn như chiều cao và cân nặng có liên quan với nhau, hay các chỉ số sinh hóa biến chuyển theo từng độ tuổi.
Nội dung trích xuất từ tài liệu:
Lâm sàng thống kê: Bài 8. Chọn biến trong phân tích hồi quy logistic : một sai lầm phổ biến - Nguyễn Văn Tuấn Lâm sàng th ng kê Ch n bi n trong phân tích h i qui logistic: m t sai l m ph bi n Nguy n Văn Tu n H i: “Trong m t bài vi t trư c ây, Th y vi t r ng cách ch n bi n cho m t môhình h i qui logistic a bi n t các phân tích ơn bi n là sai l m. Xin Th y gi i thíchthêm t i sao?” M t nghiên c u y h c tiêu bi u thư ng o lư ng nhi u y u t lâm sàng nh mtiên lư ng m t bi n c nào ó, ch ng h n như t vong, gãy xương, ái tháo ư ng, v.v...L y ví d m t nghiên c u v nguy cơ t vong, nhà nghiên c u có th thu th p các thôngtin như tu i, chi u cao, cân n ng, ti n s b nh t t, l i s ng, hay có th o lư ng cáchormone, các ch s sinh hóa, v.v… (s g t t t là “bi n” hay variable) và câu h i t ra làtrong nh ng bi n này, bi n nào có liên quan n t vong. ây là m t v n không ơngi n, và câu tr l i thư ng ph i d a vào k t qu phân tích th ng kê và ki n th c sinh h c.M t mô hình có th tiên oán r t chính xác, nhưng hoàn toàn vô d ng vì không có ýnghĩa lâm sàng hay sinh h c; ngư c l i, m t mô hình có ý nghĩa lâm sàng nhưng khôngphù h p v i các gi nh th ng kê cũng ch là m t trò chơi con s ! M t trong nh ng khó khăn và có th nói là v n nan gi i trong các nghiên c u a bi n là các bi n tiên lư ng (predictor variables) thư ng có m i liên quan sinh h c v inhau. Ch ng h n như chi u cao và cân n ng có liên quan v i nhau, hay các ch s sinhhóa bi n chuy n theo t ng tu i. Và, nh ng m i tương quan này làm cho v n ch nmô hình thêm r c r i, nh t là trong i u ki n nghiên c u d a vào m t m u.V n ch n mô hình b n c hi u rõ v n , tôi s l y m t ví d ơn gi n: m t nghiên c u lâmsàng nh m m c ích phát tri n m t mô hình tiên lư ng nguy cơ t vong (hay “khnăng s ng sót” cho “tích c c” hơn) các b nh nhân c p c u (ICU) d a vào các ch slâm sàng thu th p ư c t lúc b nh nhân nh p vi n. Tiêu chí lâm sàng là t l b nh nhâns ng sót sau 30 ngày xu t vi n (và ti t ki m ch nghĩa, g i bi n này là Y). Các bi nthu th p lúc nh p vi n g m tu i, cân n ng, và kho ng 8 ch s sinh hóa khác (g i t t làx1, x2, x3, …., x10). tiên lư ng kh năng s ng sót chúng ta có r t nhi u mô hình kh dĩ,ch ng h n như: Y = b0 + b1×x1 + eChương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 1 Y = b0 + b1×x1 + b2×x2 + e Y = b0 + b1×x1 + b2×x2 + b3×x3 + e Y = b0 + b1×x1 + b2×x2 + b6×x6 + e v.v…trong ó, b0, b1, b3, v.v… là nh ng thông s liên quan n t ng bi n c n ư c tính, và elà ph n ng u nhiên c a mô hình. Th t ra, các mô hình trên ây còn ơn gi n, vì chúng tachưa xem xét n các nh hư ng tương tác, nh hư ng phi tuy n tính, v.v… Có th nóikhông ngoa r ng, v i 10 bi n s , con s mô hình kh dĩ có th lên n hàng trăm ngàn,th m chí … b t t n. Nhưng trong nh ng mô hình này, mô hình nào có th tiên lư ngchính xác nh t và ơn gi n nh t? ây là m t câu h i ã làm t n bi t bao công s c c a nhi u nhà khoa h c th ngkê, nhà toán h c và bi t bao gi y m c tr l i, nhưng cho n nay v n v n chưa ngãngũ. R t nhi u phương pháp ã ư c phát tri n, nhưng chưa có m t phương pháp nàohoàn ch nh. R t nhi u nhà th ng kê h c và toán h c mu n gi i quy t v n , và ôi khih cũng phát tri n m t vài phương pháp, nhưng r t ti c là các phương pháp này khi ápd ng vào môi trư ng y h c thì r t vô nghĩa, vô duyên, và không th s d ng ư c. Tôi skhông bàn chi ti t t i sao v n v n chưa ngã ngũ (tôi s quay l i ch này trong m tbài vi t khác), mà ch nhân cơ h i này bàn v m t sai l m ph bi n trong vi c i tìmm t mô hình tiên lư ng.M t sai l m ph bi n c m t bài báo khoa h c trên m t t p san y h c trong nư c trư c ây, tôi cácth y tác gi vi t: “Các bi n có liên quan v i t vong trong phân tích ơn bi n v i m c ýnghĩa pbi n khác cùng m t lúc. Ch ng h n như n u bi n x1 và x2 có tương quan v i nhau, thìphân tích giai o n 1 có th ch n c hai bi n, nhưng trong mô hình a bi n (giai o n 2),có th ch có x1 có ý nghĩa th ng kê, còn x2 thì không (hay ngư c l i), b i vì thông tinc a bi n này ã hàm ch a trong thông tin c a bi n kia (do hai bi n có liên quan nhau). M tv n khác, tinh vi hơn và “t nh ” hơn, là nh hư ng c a m t bi n trunggian, r t khó hay không th ki m soát trong giai o n 1. (Tôi s bàn qua v v n nhhư ng c a bi n trung gian trong m t bài khác). Trong trư ng h p này, có th hai bi n cóth hai bi n x1 và x5 (ch ng h n) trong th c t u có nh hư ng n Y, nhưng nh hư ngnày ch t n t i khi chúng xu t hi n bên nhau (c ng hư ng); do ó, khi phân tích riêng l ,chúng ta không phát hi n ư c nh hư ng c a chúng, và do ó phân tích ơn gi n tronggiai o n 1 có th b qua c hai bi n! Ví d 1: Gi i, th d c, và t vong. M t nghiên c u (mô ph ng) m t th i i m(cross-sectional study) nh m ánh gi m i liên h c a gi i và nguy cơ t vong vì b nhnh i máu cơ tim. Các nhà nghiên c u còn thu th p thông tin liên quan n thói quen t pth d c và v n ng cơ th t ng i tư ng. K t qu nghiên c u có th tóm lư c nhưsau:B ng 1. S i tư ng t vong và còn s ng chia theo gi i và thói quen t p th d cBi n T vong S ng Odds ratio và tr s PGi i • N 113 2000 OR = 1.21 • Nam 94 2000 p = 0.176T p th d c • Không 164 2000 OR = 4.06 • Có 43 2000 p = 0.0001Trong nghiên c u trên, n u chúng ta áp d ng phương pháp phân tích h i qui logistic chot ng bi n riêng l , chúng ta s có: • OR (odds ratio) cho n là 1.21 v i tr s p = 0.176, t c không có ý nghĩa th ng ...