Thông tin tài liệu:
Bài viết Một số thuật toán thống kê thường được sử dụng trong dịch tễ học bao gồm những nội dung về khoảng tin cậy cho một tỷ lệ, Test có ý nghĩa, cách để thực hiện một test t, test một phía và test 2 phía, một số điều chú ý về các test thống kê.
Nội dung trích xuất từ tài liệu:
Một số thuật toán thống kê thường được sử dụng trong dịch tễ họcMỘT SỐ THUẬT TOÁN THỐNG KÊ THƯỜNG ĐƯỢC SỬ DỤNG TRONGDỊCH TỂ HỌCGiới thiệu: Chúng tôi thực hiện định hướng thực hành ở một số phương pháp và thuậttoán mà nó có thể ứng dụng trong phân tích dữ liệu ban đầu. Khoảng tin cậy cho một tỷ lệđược mô tả, và test t được giới thiệu. Test x2 trình bày dài hơn, và test fisher nhận đượcsự chú ý. Cuối cùng, một số quan niệm nhầm lẫn phổ biến về test ý nghĩa được bàn luận.Đây không phải là một quyển sách thống kê, và đã có một số lượng lớn sách thống kêy học . Tuy nhiên, có một lượng lớn cách tính toán thống kê đơn giản mà nó thường dùngtrong dịch tể học, và hầu hết có thể thực hiện trên một máy tính bỏ túi. Nó cho một cảmgiác tự tin có thể tính một khoảng tin cậy cho dữ liệu đã thực hiện, hay có thể kiểm tracách tính toán ở một số bài báo đã xuất bản. Chương này chỉ chứa một số thuật toánthống kê mà chính tôi thường thực hiện bằng tay.Hai thuật toán đã được giới thiệu trong các chương trước, chủ yếu làm thế nào để tính95% khoảng tin cậy cho nguy cơ tương đối gần đúng (odd ratios) và nguy cơ tương đối(relative risks). Điều này có thể thực hiện nhanh chóng và cho kết quả khoảng giới hạn cóthể có của giá trị ORs và RRs, mặc dầu đối với một số nghiên cứu trong thực tiễn. việcđòi hỏi tất cả giá trị ở các ô trong bảng 2x2 phải có một giá trị 10 hay lớn hơn khôngphải lúc nào cũng được chấp thuận.Vấn đề khác không phải không phổ biến trong dịch tể học là ước tính khoảng tin cậycho một tỷ lệ.Khoảng tin cậy cho một tỷ lệThông thường người ta muốn ước tính tỷ lệ của một quần thể có một số đặc trưng, nhưlà tỷ lệ người có kháng thể với bệnh A, hay tỷ lệ của quần thể người thực hiện một testvới bệnh B.Rất hiếm khi để có thể thực hiện test hay hỏi được mọi người, vì thế người tachỉ có thể thực hiện điều này bằng cách thu thập một mẫu ngẫu nhiên.Giả dụ rằng mẫu này là ngẫu nhiên thực sự, không có sai số do chọn lựa, người tamuốn biết làm thế nào tỷ lệ được đo lường trong mẫu liên quan đến tỷ lệ hiện mắc thựctrong quần thể. Đây là lý do tương tự chính xác khi chúng ta theo sau chương 4 đề cậpđến khoảng tin cậy cho ORs: Nếu người ta chỉ muốn thực hiện một trình bày về mẫu chỉnghiên cứu thì không cần thiết khoảng tin cậy. Nếu 31 đối tượng trong 100 thử nghiệmcó kháng thể đối với bệnh A, thì tỷ lệ huyết thanh học trong nhóm này là 31%. Tuynhiên, đây là một tình huống rất hiếm , và người ta muốn các kết quả có thể áp dụng đếnmột số quần thể lớn hơn.Người ta có cảm giác trực quan rằng kích thước của mẫu là quan trọng .Nếu 3 ngườitrong một mẫu 10 người có kháng thể đối với viêm gan A thì ngẫu nhiên(chance) có thểgiữ một vai trò quan trọng.Tỷ lệ huyết thanh thực trong quần thể có thể dễ dàng gần với20 hay 40%, và người ta chần chừ để chứng tỏ nó là 30%. Tuy nhiên, nếu chúng ta thựchiện mẫu 100 đối tượng trong một quần thể lớn hơn và thấy rằng 31 huyết thanh dươngtính thì chúng ta cảm giác bảo đảm hơn về ước tính của khoảng 30% và ngay cả hơn nhưthế nếu 308 trong số 1000 mẫu thấy có kháng thể. Mẫu càng lớn thì càng ít có ảnh hưởngkhi đưa vào cỡ mẫu nghiên cứu ngẫu nhiên một cặp “quá nhiều” hay “quá ít” huyết thanhdương tính.Khoảng tin cậy cho một quần thể là được tính toán theo cách sau:1. Viết số như một tỷ lệ thay vì phần trăm. Đối với mẫu cuối trong đoạn văn trên tỷlệ là 0.308 ( 308 người trong 1000 được thử test)2. Gọi tỷ lệ này là p. Gọi tổng số đối tượng trong nghiên cứu là N.3. Tính số p x (1-p)/N. Trong ví dụ của chúng ta là : 0,308 x 0,692/1000.4. Tính căn bình phương của số này ngay:p(1 p)Nhay trong ví dụ là0.308 X 0.6921000 0.0155. Số này được gọi là sai số chuẩn của một tỷ lệ6. Ngay khi nhận được yếu tố sai số trong các chương trước, bây giờ chúng ta nhânsai số chuẩn với 2, và một lần nữa đây là một cách thống kê để tạo ra một khoảngtin cậy 95%2 x 0,015 = 0,0307. Tuy nhiên, lúc này chúng ta không chia và nhân với số cuối cùng mà thay vào đótrừ và cộng nó với tỷ lệ gốc (0,308 trong ví dụ)Cận dưới : 0,308-0,030 = 0,278.Cận trên : 0,308 +0,030 = 0,338.8. Diễn giải: Chúng ta giả dụ rằng chúng ta đã thực hiện một mẫu ngẫu nhiên thựcsự ( không sai số) của 1000 người trong một quần thể lớn hơn nhiều. Trong ví dụnày chúng ta thấy rằng 308 đối tượng có dương tính với kháng thể của viêm ganA. Chúng ta có thể chứng tỏ rằng với xác suất 95% tỷ lệ huyết thanh học dươngtính trong quần thể phải từ 27,8% và 33,8%.Quan sát mang tính dự báo về sai số: Nếu mẫu bị sai theo một cách thức nào đó thì tỷlệ tính toán sẽ bị sai và khoảng tin cậy sẽ không còn có ý nghĩa. Nếu chúng ta hỏi 1000người và nếu họ đã được xét nghiệm chẩn đoán HIV, nhưng một số trong đó đã xétnghiệm HIV trả lời rằng họ chưa được xét nghiệm thì tỷ lệ tính toán của chúng ta trongtổng số quần thể nghiên cứu là quá thấp và thực tế này tình cờ đã điều chỉnh bằng cáchthêm vào khoảng tin cậy một con số nào đó. Khoảng tin cậy chỉ cho biết ảnh hưởng cóthể có c ...