Giáo trình Xác suất thống kê: Phần 2 - Nguyễn Đình Hiền
Số trang: 138
Loại file: pdf
Dung lượng: 2.58 MB
Lượt xem: 26
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Tiếp nội dung phần 1, Giáo trình Xác suất thống kê: Phần 2 cung cấp cho người đọc những kiến thức như: mẫu quan sát và bài toán ước lượng; kiểm định giả thiết; kiểm định một phân phối và bảng tương liên; hệ số tương quan, hồi quy tuyến tính. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Giáo trình Xác suất thống kê: Phần 2 - Nguyễn Đình Hiền MẪU QUAN SÁT VÀ BÀI TOÁN ƯÓC LƯỢNG §1. TỠNG THỂ VÀ MẪU QUAN SÁT Xét một đám đông gồm rất nhiều cá thể, đứng về lí thuyết thì coi như có vô số cá thể, đám đông này phải thuần nhất theo nghĩa đây là một đám đông có cùng một nguồn gốc, cùng điều kiện ra đời, sống trong cùng một môi trường, sự khác nhau giữa các cá thể là sự khác nhau tự nhiên, ngẫu nhiên không thể tránh được giữa các cá thể của một đám đông. Ta gọi một đám đông như thế là một tổng thể. .Giả thiết khi khảo sát một tính trạng (một đặc tính sinh học, một chỉ số, một số đo,...) trên một cá thể của tổng thể ta được một biến ngẫu nhiên X, biến này có thể là: - Biến định tính chỉ có một trong 2 kết quả (quy ước là có và không, hay 1 và 0 ) như giống đực hay giống cái; có ra hoa hay không ra hoa; mắc bệnh hay không mắc bệnh. - Biến định tính gồm một số loại hay lớp như màu sắc: xanh, đỏ, tím vàng...; Chế độ tưới: tưới ít, tưới vừa, tưới nhiễu; Loại đất: cát, s é t ... - Biến có thể dùng sô' thứ tự để ghi nhận các kết quả từ thấp lên cao như điểm thi: 0, 1, 2,..., 10; Cấp bệnh: cấp 1, 2, .ẵ., 7. - Biến rời rạc như số cây sống khi trồng 100 cây; số trứng nở khi ấp 12 quả trứng; số sản phẩm hỏng trong lô 5000 sản phẩm; - Biến liên tục như chiều cao cây; trọng lượng một con gà; chiều dài một con cá. Tuỳ theo biến ta khảo sát thuộc loại nào và dựa vào yêu cầu nghiên cứu mà đặt ra các giả thiết về tổng thể. Có rất nhiều bài toán trong nghiên cứu được đưa về giả thiết X có phân phối đã biết nhưng còn chứa một vài tham số mà ta cần ước lượng, thí dụ khi ấp trứng ta giả thiết số trứng nở X trong mỗi ổ gồm n quả phân phối nhị thức 60 B(n, p), xác suất trứng nở p chính là tham số chưa biết. Đo chiều cao X của học sinh nam, lứa tuổi 16 ở một vùng, X phân phối chuẩn N(|J., ơ 2) với hai tham số chưa biết: trung bình fj. và phương sai ơ2. Số chai vỡ X khi vận chuyển rượu phân phối Poát-xông với tham sô' JJ. chưa biết. Thời gian sống của bóng đèn phân phối chuẩn N(|a, ơ2) với hai tham số chưa biết ^ và ơ2. Trong một đợt cúm một người có thể bị cúm hoặc không, xác suất bị cúm p là tham số chưa b iế t... Nếu ta khảo sát đồng thời nhiều đặc tính thì được nhiều biến ngẫu nhiên đồng thời và lúc đó sẽ có nhiều tham số cần ước lượng thí dụ hộ số tương quan, hiệp phương s a i,... Như vậy khi khảo sát tổng thể ta giả thiết biến ngẫu nhiên (hoặc hệ nhiều biến ngẫu nhiên) có một phân phối nào đó có chứa một vài tham số gọi là tham số của tổng thể, các tham số này thường được kí hiệu bằng các chữ Hy lạp fl, ơ, p ... Để có được các hiểu biết về tổng thể và cụ thể là về các tham số này ta phải lấy ngẫu nhiên một số cá thể ra xem xét, số cá thể đó họp thành một mẫu quan sát, hay gọi tắt là một mẫu. Khi xem xét mẫu phải xử lí các dữ liệu thu được rồi đưa ra kết luận chung cho tổng thể, các kết luận này được gọi là các kết luận thống kê. Mẫu quan sát chỉ bao gồm một nhóm nhỏ của tổng thể, không thể phản ánh đầy đủ tổng thể cho nên mặc dù cách chọn mẫu đúng đắn, không sai lệch có hệ thống, phương pháp xử lí chính xác cũng không thể loại bỏ những sai lệch so với tổng thể, do đó không bao giờ các kết luận thống kê có thể đúng 100 %. Để dễ suy luận và so sánh, người ta thường định ra một xác suất để kết luận thống kê đúng khi áp dụng cho tổng thể, xác suất đó được gọi là mức tin cậy của kết luận, thường kí hiệu là p, thí dụ p = 0,95 thường gọi là mức tin cậy 1 (đánh dấu *) có nghĩa là kết luận thống kê đưa ra trung bình chỉ đúng 95 trên 100 trường hợp, p = 0,99 thường gọi là mức 2 (đánh dấu **) có nghĩa là kết luận thống kê đưa ra trung bình chỉ đúng 99 trên 100 trường hợp, mức p = 0,999 là mức 3 (đánh dấu ***)ể Cũng có khi người ta dùng số a = 1 - p gọi là mức sai cho phép hay mức ý nghĩa. Thí dụ p = 0,95 thì a = 1 - 0,95 = 0,05 (mức 1) có nghĩa là cho phép kết luận thống kê sai trung bình 5 trên 100 trường hợp khi áp dụng vào tổng thể. 61 §2. CÁCH CHỌN MẪU Như đã nói ở trên vì không thể khảo sát toàn bộ tổng thể (không đủ thời gian, không đủ tiền, sức lực ...), hoặc so với mục đích thấy không thể (khảo sát có tính huỷ hoại mẫu) hoặc không cần phải hiểu thật cặn kẽ nên chỉ khảo sát một nhóm nhỏ gọi là mẫu quan sát. Muốn kết luận thống kê rút ra sau khi khảo sát không bị sai lệch có hệ thống thì mẫu phải phản ánh trung thực tổng thể, không thể thiên về chọn các cá thể tạm gọi là 'tốt' tức là cho các giá trị lớn hơn trung bình, hoặc 'xấu', tức là thiên về phía các giá trị nhỏ hơn trung bình. Có rất nhiều cách chọn mẫu vì việc chọn mẫu không những phải thoả mãn yêu cầu chính là không thiên lệch mà còn phải phù hợp vói điều kiện chuyên môn, thí dụ chọn các mảnh ruộng để gặt nhằm đánh giá năng suất hoàn toàn khác với việc chọn các sản phẩm công nghiệp để đánh giá chất lượng, thí dụ quạt bàn, và càng khác xa cách chọn mẫu để đánh giá chất lượng của các chất lỏng, thí dụ nhiên liệu và cũng khác xa việc chọn mẫu khi điểu tra dân số hoặc điều tra xã hội. Thuần tuý về mặt thống kê cũng có nhiều cách chọn mẫu như chọn mẫu ngẫu nhiên (rút thăm, dùng bảng số ngẫu nhiên, quay xổ số ...), chọn mẫu theo lớp (chia thành một số lớp tương đối đồng đều, thí dụ chia theo vùng địa lí, chia theo các tầng lớp xã hội ,.ề sau đó trong mỗi lớp chọn ngẫu nhiên một số cá thể, số lượng có thể căn cứ vào mức đồng đều của nhóm ...), chọn mẫu hai tầng (chia thành nhiều lớp tương đối đồng đều sau đó chọn một số lớp điển hình và khảo sát toàn bộ các cá thể trong lớp đó, ...) Ở đây chúng ta không để cập đến cách chọn mẫu cụ thể mà chỉ giả thiết là mẫu chọn ra mang tính ngẫu nhiên không có sai số hộ thống. §3. CÁC SỐ ĐẶC TRƯNG CỦA MAU Giả sử chúng ta muốn khảo sát mộ ...
Nội dung trích xuất từ tài liệu:
Giáo trình Xác suất thống kê: Phần 2 - Nguyễn Đình Hiền MẪU QUAN SÁT VÀ BÀI TOÁN ƯÓC LƯỢNG §1. TỠNG THỂ VÀ MẪU QUAN SÁT Xét một đám đông gồm rất nhiều cá thể, đứng về lí thuyết thì coi như có vô số cá thể, đám đông này phải thuần nhất theo nghĩa đây là một đám đông có cùng một nguồn gốc, cùng điều kiện ra đời, sống trong cùng một môi trường, sự khác nhau giữa các cá thể là sự khác nhau tự nhiên, ngẫu nhiên không thể tránh được giữa các cá thể của một đám đông. Ta gọi một đám đông như thế là một tổng thể. .Giả thiết khi khảo sát một tính trạng (một đặc tính sinh học, một chỉ số, một số đo,...) trên một cá thể của tổng thể ta được một biến ngẫu nhiên X, biến này có thể là: - Biến định tính chỉ có một trong 2 kết quả (quy ước là có và không, hay 1 và 0 ) như giống đực hay giống cái; có ra hoa hay không ra hoa; mắc bệnh hay không mắc bệnh. - Biến định tính gồm một số loại hay lớp như màu sắc: xanh, đỏ, tím vàng...; Chế độ tưới: tưới ít, tưới vừa, tưới nhiễu; Loại đất: cát, s é t ... - Biến có thể dùng sô' thứ tự để ghi nhận các kết quả từ thấp lên cao như điểm thi: 0, 1, 2,..., 10; Cấp bệnh: cấp 1, 2, .ẵ., 7. - Biến rời rạc như số cây sống khi trồng 100 cây; số trứng nở khi ấp 12 quả trứng; số sản phẩm hỏng trong lô 5000 sản phẩm; - Biến liên tục như chiều cao cây; trọng lượng một con gà; chiều dài một con cá. Tuỳ theo biến ta khảo sát thuộc loại nào và dựa vào yêu cầu nghiên cứu mà đặt ra các giả thiết về tổng thể. Có rất nhiều bài toán trong nghiên cứu được đưa về giả thiết X có phân phối đã biết nhưng còn chứa một vài tham số mà ta cần ước lượng, thí dụ khi ấp trứng ta giả thiết số trứng nở X trong mỗi ổ gồm n quả phân phối nhị thức 60 B(n, p), xác suất trứng nở p chính là tham số chưa biết. Đo chiều cao X của học sinh nam, lứa tuổi 16 ở một vùng, X phân phối chuẩn N(|J., ơ 2) với hai tham số chưa biết: trung bình fj. và phương sai ơ2. Số chai vỡ X khi vận chuyển rượu phân phối Poát-xông với tham sô' JJ. chưa biết. Thời gian sống của bóng đèn phân phối chuẩn N(|a, ơ2) với hai tham số chưa biết ^ và ơ2. Trong một đợt cúm một người có thể bị cúm hoặc không, xác suất bị cúm p là tham số chưa b iế t... Nếu ta khảo sát đồng thời nhiều đặc tính thì được nhiều biến ngẫu nhiên đồng thời và lúc đó sẽ có nhiều tham số cần ước lượng thí dụ hộ số tương quan, hiệp phương s a i,... Như vậy khi khảo sát tổng thể ta giả thiết biến ngẫu nhiên (hoặc hệ nhiều biến ngẫu nhiên) có một phân phối nào đó có chứa một vài tham số gọi là tham số của tổng thể, các tham số này thường được kí hiệu bằng các chữ Hy lạp fl, ơ, p ... Để có được các hiểu biết về tổng thể và cụ thể là về các tham số này ta phải lấy ngẫu nhiên một số cá thể ra xem xét, số cá thể đó họp thành một mẫu quan sát, hay gọi tắt là một mẫu. Khi xem xét mẫu phải xử lí các dữ liệu thu được rồi đưa ra kết luận chung cho tổng thể, các kết luận này được gọi là các kết luận thống kê. Mẫu quan sát chỉ bao gồm một nhóm nhỏ của tổng thể, không thể phản ánh đầy đủ tổng thể cho nên mặc dù cách chọn mẫu đúng đắn, không sai lệch có hệ thống, phương pháp xử lí chính xác cũng không thể loại bỏ những sai lệch so với tổng thể, do đó không bao giờ các kết luận thống kê có thể đúng 100 %. Để dễ suy luận và so sánh, người ta thường định ra một xác suất để kết luận thống kê đúng khi áp dụng cho tổng thể, xác suất đó được gọi là mức tin cậy của kết luận, thường kí hiệu là p, thí dụ p = 0,95 thường gọi là mức tin cậy 1 (đánh dấu *) có nghĩa là kết luận thống kê đưa ra trung bình chỉ đúng 95 trên 100 trường hợp, p = 0,99 thường gọi là mức 2 (đánh dấu **) có nghĩa là kết luận thống kê đưa ra trung bình chỉ đúng 99 trên 100 trường hợp, mức p = 0,999 là mức 3 (đánh dấu ***)ể Cũng có khi người ta dùng số a = 1 - p gọi là mức sai cho phép hay mức ý nghĩa. Thí dụ p = 0,95 thì a = 1 - 0,95 = 0,05 (mức 1) có nghĩa là cho phép kết luận thống kê sai trung bình 5 trên 100 trường hợp khi áp dụng vào tổng thể. 61 §2. CÁCH CHỌN MẪU Như đã nói ở trên vì không thể khảo sát toàn bộ tổng thể (không đủ thời gian, không đủ tiền, sức lực ...), hoặc so với mục đích thấy không thể (khảo sát có tính huỷ hoại mẫu) hoặc không cần phải hiểu thật cặn kẽ nên chỉ khảo sát một nhóm nhỏ gọi là mẫu quan sát. Muốn kết luận thống kê rút ra sau khi khảo sát không bị sai lệch có hệ thống thì mẫu phải phản ánh trung thực tổng thể, không thể thiên về chọn các cá thể tạm gọi là 'tốt' tức là cho các giá trị lớn hơn trung bình, hoặc 'xấu', tức là thiên về phía các giá trị nhỏ hơn trung bình. Có rất nhiều cách chọn mẫu vì việc chọn mẫu không những phải thoả mãn yêu cầu chính là không thiên lệch mà còn phải phù hợp vói điều kiện chuyên môn, thí dụ chọn các mảnh ruộng để gặt nhằm đánh giá năng suất hoàn toàn khác với việc chọn các sản phẩm công nghiệp để đánh giá chất lượng, thí dụ quạt bàn, và càng khác xa cách chọn mẫu để đánh giá chất lượng của các chất lỏng, thí dụ nhiên liệu và cũng khác xa việc chọn mẫu khi điểu tra dân số hoặc điều tra xã hội. Thuần tuý về mặt thống kê cũng có nhiều cách chọn mẫu như chọn mẫu ngẫu nhiên (rút thăm, dùng bảng số ngẫu nhiên, quay xổ số ...), chọn mẫu theo lớp (chia thành một số lớp tương đối đồng đều, thí dụ chia theo vùng địa lí, chia theo các tầng lớp xã hội ,.ề sau đó trong mỗi lớp chọn ngẫu nhiên một số cá thể, số lượng có thể căn cứ vào mức đồng đều của nhóm ...), chọn mẫu hai tầng (chia thành nhiều lớp tương đối đồng đều sau đó chọn một số lớp điển hình và khảo sát toàn bộ các cá thể trong lớp đó, ...) Ở đây chúng ta không để cập đến cách chọn mẫu cụ thể mà chỉ giả thiết là mẫu chọn ra mang tính ngẫu nhiên không có sai số hộ thống. §3. CÁC SỐ ĐẶC TRƯNG CỦA MAU Giả sử chúng ta muốn khảo sát mộ ...
Tìm kiếm theo từ khóa liên quan:
Giáo trình Xác suất thống kê Xác suất thống kê Ước lượng tham số của tổng thể Kiểm định xác suất Kiểm định một phân phối Hồi quy tuyến tínhGợi ý tài liệu liên quan:
-
Giáo trình Xác suất thống kê: Phần 1 - Trường Đại học Nông Lâm
70 trang 333 5 0 -
Giáo trình Thống kê xã hội học (Xác suất thống kê B - In lần thứ 5): Phần 2
112 trang 208 0 0 -
Đề cương chi tiết học phần: Xác suất thống kê
3 trang 197 0 0 -
116 trang 177 0 0
-
Bài giảng Xác suất thống kê và quy hoạch thực nghiệm: Chương 3.4 và 3.5 - Nguyễn Thị Thanh Hiền
26 trang 173 0 0 -
Giáo trình Xác suất thống kê (tái bản lần thứ năm): Phần 2
131 trang 165 0 0 -
Một số ứng dụng của xác suất thống kê
5 trang 146 0 0 -
Bài giảng Xác suất thống kê và quy hoạch thực nghiệm: Chương 5.2 - Nguyễn Thị Thanh Hiền
27 trang 141 0 0 -
Bài giảng Nguyên lý thống kê: Chương 1 - GV. Quỳnh Phương
34 trang 133 0 0 -
Đề thi kết thúc học phần Xác suất thống kê năm 2019 - Đề số 5 (09/06/2019)
1 trang 132 0 0