Danh mục

Ý nghĩa của trị số P (P-value) trong nghiên cứu khoa học

Số trang: 5      Loại file: doc      Dung lượng: 52.50 KB      Lượt xem: 9      Lượt tải: 0    
Hoai.2512

Hỗ trợ phí lưu trữ khi tải xuống: miễn phí Tải xuống file đầy đủ (5 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Phân tích thống kê là một khâu quan trọng không thể thiếu được trong các công trình nghiên cứukhoa học, nhất là khoa học thực nghiệm. Một công trình nghiên cứu khoa học, cho dù có tốnkém và quan trọng cỡ nào, nếu không được phân tích đúng phương pháp sẽ không bao giờ cócơ hội được xuất hiện trong các tập san khoa học.
Nội dung trích xuất từ tài liệu:
Ý nghĩa của trị số P (P-value) trong nghiên cứu khoa họcÝ nghĩa của trị số P (P-value) trong nghiên cứu khoa họcNguyễn Văn TuấnPhân tích thống kê là một khâu quan trọng không thể thiếu được trong các công trình nghiên cứukhoa học, nhất là khoa học thực nghiệm. Một công trình nghiên cứu khoa học, cho dù có tốnkém và quan trọng cỡ nào, nếu không được phân tích đúng phương pháp sẽ không bao giờ cócơ hội được xuất hiện trong các tập san khoa học. Ngày nay, chỉ cần nhìn qua tất cả các tậpsan nghiên cứu khoa học trên thế giới, hầu như bất cứ bài báo y học nào cũng có phần“Statistical Analysis” (Phân tích thống kê), nơi mà tác giả phải mô tả cẩn thận phương pháp phântích, tính toán như thế nào, và giải thích ngắn gọn tại sao sử dụng những phương pháp đó đểhàm ý “bảo kê” hay tăng trọng lượng khoa học cho những phát biểu trong bài báo. Các tạp san yhọc có uy tín càng cao yêu cầu về phân tích thống kê càng nặng. Không có phần phân tíchthống kê, bài báo không có ý nghĩa khoa học.Trong các bài báo khoa học, ngoài những dữ kiện bằng số, biểu đồ và hình ảnh, con số màchúng ta thường hay gặp nhất là trị số P (mà tiếng Anh gọi là P-value). Trị số P là một con sốxác suất, tức là viết tắt chữ “probability value”. Chúng ta thường gặp những phát biểu được kèmtheo con số, chẳng hạn như “Kết quả phân tích cho thấy tỉ lệ gãy xương trong nhóm bệnh nhânđược điều trị bằng thuốc Alendronate là 2%, thấp hơn tỉ lệ trong nhóm bệnh nhân không đượcchữa trị (5%), và mức độ khác biệt này có ý nghĩa thống kê (p = 0.01)”, hay một phát biểu như“Sau 3 tháng điều trị, mức độ giảm áp suất máu trong nhóm bệnh nhân là 10% (p < 0.05)”. Trongvăn cảnh trên đây, đại đa số nhà khoa học, thậm chí cả các nhà thống kê và toán học chuyênnghiệp, hiểu rằng trị số P phản ánh xác suất sự hiệu nghiệm của thuốc Alendronate hay mộtthuật điều trị, họ hiểu rằng câu văn trên có nghĩa là “xác suất mà thuốc alendronate tốt hơn giảdược là 0.99” (lấy 1 trừ cho 0.01). Nhưng cách hiểu đó hoàn toàn sai!Rất nhiều người, không chỉ người đọc mà ngay cả chính các tác giả của những bài báo khoahọc, giáo sư đại học, không hiểu ý nghĩa của trị số P! Theo một nghiên cứu được công bố trêntập san danh tiếng Statistics in Medicine [1], tác giả cho biết 85% các tác giả khoa học và bác sĩnghiên cứu không hiểu hay hiểu sai ý nghĩa của trị số P. Đọc đến đây có lẽ bạn đọc rất ngạcnhiên, bởi vì điều này có nghĩa là nhiều nhà nghiên cứu khoa học có khi không hiểu hay hiểu sainhững gì chính họ viết ra có nghĩa gì! Thế thì, câu hỏi cần đặt ra một cách nghiêm chỉnh: Ýnghĩa của trị số P là gì?Để trả lời cho câu hỏi này, chúng ta cần phài xem xét qua tiến trình của một công trình nghiêncứu khoa học thực nghiệm. Một nghiên cứu khoa học, như chúng ta đều biết, phải bắt đầu bằngmột giả thuyết. Hãy lấy một ví dụ về một nghiên cứu so sánh chỉ số thông minh (IQ) giữa pháinam và nữ. Giả thuyết có thể đề ra là sinh viên nữ thông minh hơn sinh viên nam. Giả thuyếtnày, phát biểu theo ngôn ngữ thực nghiệm, là chỉ số IQ trong nữ giới cao hơn chỉ số IQ trongnam giới. Nhưng để cho tiện việc tính toán và phân tích sau này, một giả thuyết đảo (nullhypothesis, hay gọi tắt là Ho) được phát biểu rằng chỉ số IQ trong phái nữ bằng với chỉ số IQtrong phái nam.Để “chứng minh” giả thuyết trên, nhà nghiên cứu có thể đo tất cả sinh viên nam và nữ trong tấtcả các trường đại học trong cả nước và tính toán xem chỉ số IQ của phái nữa có cao hơn haybằng với chỉ số IQ của phái nam. Trong trường hợp này, nhà nghiên cứu không cần đến phântích thống kê, không cần đến trị số P. Nhưng một việc làm như thế chẳng những không thực tế,mà còn không cần thiết, bởi vì nhà nghiên cứu có thể chỉ chọn ra một số đối tượng, thu thậpthông tin, và dùng các thuật toán thống kê để suy luận cho toàn bộ quần thể sinh viên. Giả dụnhà nghiên cứu quyết định chọn hai nhóm sinh viên đại học (100 sinh viên nam và 100 sinh viênnữ) có cùng độ tuổi và có cùng hoàn cảnh gia đình, nhưng họ được chọn một cách ngẫu nhiêntừ nhiều trường đại học khác nhau.Bước kế tiếp là nhà nghiên cứu sử dụng một phương pháp đo lường khách quan nào đó để “đo”chỉ số IQ trong từng sinh viên trong nhóm 200 người này. Giả dụ như sau khi đo xong và kết quảđược tóm lược như sau:Phái namPhái nữSố lượng sinh viên (n)100100Chỉ số IQ trung bình (mean)130140Độ lệch chuẩn (standard deviation)2022Đến đây, câu hỏi cụ thể đặt ra là các số liệu trên đây có đủ bằng chứng để kết luận rằng sinhviên nữ thông minh hơn sinh viên nam? Nói cách khác, nhà nghiên cứu phải dựa vào kết quả thuthập được trong một nhóm đối tượng để suy luận cho một quần thể sinh viên của cả nước. Câuhỏi này hoàn toàn có lí do của nó, bởi vì nên nhớ rằng đây chỉ là dữ kiện của một nhóm ngườiđược chọn ngẫu nhiên từ một quần thể, và vì bản chất ngẫu nhiên trong chọn đối tượng, nếumột nghiên cứu khác cũng chọn 200 đối tượng như trên thì kết quả có thể khác đi, thậm chíngược lại với kết qu ...

Tài liệu được xem nhiều: