Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2 - Mai Chi, Trần Doãn Phú
Số trang: 171
Loại file: pdf
Dung lượng: 4.43 MB
Lượt xem: 16
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Giáo trình "Lý thuyết xác suất và thống kê toán" được biên soạn theo chương trình chuẩn của bộ GD&ĐT và dùng làm tài liệu tham khảo cho sinh viên các trường thuộc khối kinh tế và các ngành tương đương khác. Giáo trình kết cấu gồm 9 chương và chia thành 2 phần, phần 2 trình bày những nội dung về: thống kê toán; lý thuyết mẫu; ước lượng các tham số của đại lượng ngẫu nhiên; kiểm định giả thuyết thống kê; tương quan và hồi quy;... Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2 - Mai Chi, Trần Doãn PhúPHẦN II. THỐNG KÊ TOÁN 127 Chương VI LÝ THUYẾT MẪU §1. KHÁI NIỆM VỀ ĐÁM ĐÔNG VÀ MẪU1.1. Đám đông Giả sử ta cần nghiên cứu một hay nhiều dấu hiệu thể hiện trên mộttập hợp gồm N phần tử, thì tập hợp N phần tử này được gọi là đámđông (còn được gọi là tổng thể hay tập nền), N được gọi là kích thướccủa đám đông. Dấu hiệu cần nghiên cứu có thể là định lượng hoặc định tính.Chẳng hạn đối với công nhân một ngành kinh tế thì dấu hiệu địnhlượng có thể là mức lương hàng tháng của công nhân hoặc bậc thợ, còndấu hiệu định tính có thể là giới tính của công nhân hoặc khu vực kinhtế công nhân đang làm việc. Tuy nhiên dấu hiệu định tính có thểchuyển về dấu hiệu định lượng bằng phương pháp biến giả (xemchương 5. [10]). Thông thường kích thước N của đám đông là hữu hạn, song trongtrường hợp số lượng các phần tử của đám đông là quá lớn hoặc khôngthể nắm bắt được toàn bộ các phần tử của đám đông thì ta có thể coikích thước của đám đông là vô hạn. * Ví dụ r. Cần nghiên cứu mức tiêu thụ X một loại thực phẩm củacác gia đình ở một quận nội thành Hà Nội trong một tháng, thì đámđông là tập hợp tất cả các gia đình trong quận, còn kích thước của đámđông là số gia đình trong quận. Ví dụ 2: Cần nghiên cứu trọng lượng X của các gói hàng do mộtmáy tự động đóng thì đám đông là tất cả các gói hàng do máy đóng. Vìmáy đã đórig, đang đóng và sẽ cốn tiếp tục đóng nên ta có thể coi kíchthước của đám đông N = +00. Xét một đám đông kích thước N hữu hạn. Giả sử dấu hiệu địnhlượng cần nghiên cứu X chỉ có thể nhận các giá trị Xj,..., Xị,..., xk với 129 kcác tần số tương ứng Nị,..., Nj,.., Nk. Tất nhiên ta có ^Nj = N, trong i=lđó 0 < Nị < N với Vi. Theo định nghĩa cổ điển về xác suất, ta có P(X= Xj) = Nj/N = Pi, (i= 1,.., k). Như vậy ta có thể coi X là một ĐLNN rờirạc với bảng phân phối xác suất: X xt .. • Xi •• xk p P1 •• • Pi •• Pk ĐLNN X được gọi là ĐLNN gốc, phân phối xác suấtcủa^x đượcgọi là phân phối lý thuyết còn các tham số đặc trưng của X được gọi làcác tham số của đám đông (hay các tham số lý thuyết). Điều này cũngđúng nếu dấu hiệu cần nghiên cứu X phân phối liên tục.1.2. Mẫu Để nghiên cứu dấu hiệu X thể hiện trên một đám đông kích thướcN, đáng lẽ ta phải điều tra tất cả các phần tử của đám đông nhưng điềunày thường không thể thực hiện được vì những lý do: - Khi N = +00 rõ ràng ta không thể điều tra được tất cả các phần tửcủa đấm đông. - Trong một số trường hợp các phần tử sau khi nghiên cứu bị pháhuỷ, lúc đó việc nghiên cứu toàn bộ đám đông là vô nghĩa. - Điều chủ yếu là khi N lớn việc nghiên cứu toàn bộ đám đông đòihỏi nhiều chi phí về vật chất và thời gian. Vì vậy từ đám đông người ta lấy ra một tập hợp nhỏ hơn gồm nphần tử để nghiên cứu và dựa vào đó mà đưa ra những kết luận về dấuhiệu X trên toàn bộ đám đông. Tập hợp n phần tử này được gọi là mẫu,n được gọi là kích thước mẫu.1.3. Các phương pháp chọn mẫu Vì từ thông tin của mẫu ta sẽ đưa ra kết luận về dấu hiệu cầnnghiên cứu trên toàn bộ đám đông nên ta phải Ịấy mẫu một cách khoahọc, sao cho mẫu đại diện một cách khách quan, trung thực cho đám130đông theo dấu hiệu cần nghiên cứu. Nếu mẫu không đại diện trungthực, khách quan cho đám đông thì từ những thông tin thu được trênmẫu ta sẽ có những kết luận sai lệch về dấu hiệu cần nghiên cứu. Tuỳtừng trường hợp cụ thể ta có thể áp dụng một trong những cách chọnmẫu thông dụng sau: - Chọn ngẫu nhiên đơn giản có hoàn lại - Chọn ngẫu nhiên đơn giản không hoàn lại - Chọn điển hình - Chọn máy móc. Ngoài các cách chọn mẫu trên, còn có nhiều cách chọn mẫu khác(xem [8]). Để hiểu được thế nào là chọn ngẫu nhiên đơn giản có hoàn lại,chọn ngẫu nhiên đơn giản không hoàn lại trước hết ta đi nghiên cứuxem thế nào là chọn ngẫu nhiên đơn giản. Chọn ngẫu nhiên đơn giản làcách chọn trong đó các phần tử của mẫu được chọn một cách ngẫunhiên từng phần tử một từ đám đông. Ví dụ để có một mẫu kích thướcn từ một đám đôpg kích thước N ta có thể tiến hành như sau: Đánh sốcác phần tử của đám đông từ 1 đến N. Sau đó viết các số tự nhiên từ 1đến N lên N tấm thẻ giống nhau. Xáo trộn đều N tấm thẻ này rồi rútngẫu nhiên ra từng thẻ một, rút ra n thẻ. Sau đó, những phần tử nào cósố trùng với số ở n thẻ rút ra sẽ là các phần tử của mẫu. Tuy nhiêntrong thực tế để chọn mẫu ngẫu nhiên đơn giản người ta không dùngthẻ mà thường dùng các bảng số ngẫu nhiên, hoặc dùng phần mềmmáy tính để tạo ra những số ngẫu nhiên. Sau đây ta đi nghiên cứu kỹhơn từng cách chọn. 1. Chọn ngẫ ...
Nội dung trích xuất từ tài liệu:
Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2 - Mai Chi, Trần Doãn PhúPHẦN II. THỐNG KÊ TOÁN 127 Chương VI LÝ THUYẾT MẪU §1. KHÁI NIỆM VỀ ĐÁM ĐÔNG VÀ MẪU1.1. Đám đông Giả sử ta cần nghiên cứu một hay nhiều dấu hiệu thể hiện trên mộttập hợp gồm N phần tử, thì tập hợp N phần tử này được gọi là đámđông (còn được gọi là tổng thể hay tập nền), N được gọi là kích thướccủa đám đông. Dấu hiệu cần nghiên cứu có thể là định lượng hoặc định tính.Chẳng hạn đối với công nhân một ngành kinh tế thì dấu hiệu địnhlượng có thể là mức lương hàng tháng của công nhân hoặc bậc thợ, còndấu hiệu định tính có thể là giới tính của công nhân hoặc khu vực kinhtế công nhân đang làm việc. Tuy nhiên dấu hiệu định tính có thểchuyển về dấu hiệu định lượng bằng phương pháp biến giả (xemchương 5. [10]). Thông thường kích thước N của đám đông là hữu hạn, song trongtrường hợp số lượng các phần tử của đám đông là quá lớn hoặc khôngthể nắm bắt được toàn bộ các phần tử của đám đông thì ta có thể coikích thước của đám đông là vô hạn. * Ví dụ r. Cần nghiên cứu mức tiêu thụ X một loại thực phẩm củacác gia đình ở một quận nội thành Hà Nội trong một tháng, thì đámđông là tập hợp tất cả các gia đình trong quận, còn kích thước của đámđông là số gia đình trong quận. Ví dụ 2: Cần nghiên cứu trọng lượng X của các gói hàng do mộtmáy tự động đóng thì đám đông là tất cả các gói hàng do máy đóng. Vìmáy đã đórig, đang đóng và sẽ cốn tiếp tục đóng nên ta có thể coi kíchthước của đám đông N = +00. Xét một đám đông kích thước N hữu hạn. Giả sử dấu hiệu địnhlượng cần nghiên cứu X chỉ có thể nhận các giá trị Xj,..., Xị,..., xk với 129 kcác tần số tương ứng Nị,..., Nj,.., Nk. Tất nhiên ta có ^Nj = N, trong i=lđó 0 < Nị < N với Vi. Theo định nghĩa cổ điển về xác suất, ta có P(X= Xj) = Nj/N = Pi, (i= 1,.., k). Như vậy ta có thể coi X là một ĐLNN rờirạc với bảng phân phối xác suất: X xt .. • Xi •• xk p P1 •• • Pi •• Pk ĐLNN X được gọi là ĐLNN gốc, phân phối xác suấtcủa^x đượcgọi là phân phối lý thuyết còn các tham số đặc trưng của X được gọi làcác tham số của đám đông (hay các tham số lý thuyết). Điều này cũngđúng nếu dấu hiệu cần nghiên cứu X phân phối liên tục.1.2. Mẫu Để nghiên cứu dấu hiệu X thể hiện trên một đám đông kích thướcN, đáng lẽ ta phải điều tra tất cả các phần tử của đám đông nhưng điềunày thường không thể thực hiện được vì những lý do: - Khi N = +00 rõ ràng ta không thể điều tra được tất cả các phần tửcủa đấm đông. - Trong một số trường hợp các phần tử sau khi nghiên cứu bị pháhuỷ, lúc đó việc nghiên cứu toàn bộ đám đông là vô nghĩa. - Điều chủ yếu là khi N lớn việc nghiên cứu toàn bộ đám đông đòihỏi nhiều chi phí về vật chất và thời gian. Vì vậy từ đám đông người ta lấy ra một tập hợp nhỏ hơn gồm nphần tử để nghiên cứu và dựa vào đó mà đưa ra những kết luận về dấuhiệu X trên toàn bộ đám đông. Tập hợp n phần tử này được gọi là mẫu,n được gọi là kích thước mẫu.1.3. Các phương pháp chọn mẫu Vì từ thông tin của mẫu ta sẽ đưa ra kết luận về dấu hiệu cầnnghiên cứu trên toàn bộ đám đông nên ta phải Ịấy mẫu một cách khoahọc, sao cho mẫu đại diện một cách khách quan, trung thực cho đám130đông theo dấu hiệu cần nghiên cứu. Nếu mẫu không đại diện trungthực, khách quan cho đám đông thì từ những thông tin thu được trênmẫu ta sẽ có những kết luận sai lệch về dấu hiệu cần nghiên cứu. Tuỳtừng trường hợp cụ thể ta có thể áp dụng một trong những cách chọnmẫu thông dụng sau: - Chọn ngẫu nhiên đơn giản có hoàn lại - Chọn ngẫu nhiên đơn giản không hoàn lại - Chọn điển hình - Chọn máy móc. Ngoài các cách chọn mẫu trên, còn có nhiều cách chọn mẫu khác(xem [8]). Để hiểu được thế nào là chọn ngẫu nhiên đơn giản có hoàn lại,chọn ngẫu nhiên đơn giản không hoàn lại trước hết ta đi nghiên cứuxem thế nào là chọn ngẫu nhiên đơn giản. Chọn ngẫu nhiên đơn giản làcách chọn trong đó các phần tử của mẫu được chọn một cách ngẫunhiên từng phần tử một từ đám đông. Ví dụ để có một mẫu kích thướcn từ một đám đôpg kích thước N ta có thể tiến hành như sau: Đánh sốcác phần tử của đám đông từ 1 đến N. Sau đó viết các số tự nhiên từ 1đến N lên N tấm thẻ giống nhau. Xáo trộn đều N tấm thẻ này rồi rútngẫu nhiên ra từng thẻ một, rút ra n thẻ. Sau đó, những phần tử nào cósố trùng với số ở n thẻ rút ra sẽ là các phần tử của mẫu. Tuy nhiêntrong thực tế để chọn mẫu ngẫu nhiên đơn giản người ta không dùngthẻ mà thường dùng các bảng số ngẫu nhiên, hoặc dùng phần mềmmáy tính để tạo ra những số ngẫu nhiên. Sau đây ta đi nghiên cứu kỹhơn từng cách chọn. 1. Chọn ngẫ ...
Tìm kiếm theo từ khóa liên quan:
Lý thuyết xác suất và thống kê toán Lý thuyết xác suất Thống kê toán Lý thuyết mẫu Đại lượng ngẫu nhiên Kiểm định giả thuyết thống kê Kiểm định phi tham sốTài liệu liên quan:
-
Bài giảng Xác suất và thống kê trong y dược - Chương 1: Khái niệm cơ bản của lý thuyết xác suất
69 trang 187 0 0 -
Bài giảng Xác suất thống kê và quy hoạch thực nghiệm: Chương 5.2 - Nguyễn Thị Thanh Hiền
27 trang 146 0 0 -
Bài giảng Xác suất thống kê - Chương 6: Kiểm định giả thuyết thống kê (Trường ĐH Thương mại)
58 trang 113 0 0 -
Bài tập Xác suất thống kê (Chương 2)
23 trang 100 0 0 -
Giáo trình Lý thuyết xác suất và thống kê toán học - Phần 1
91 trang 88 0 0 -
Bài giảng Toán cao cấp - Chương 1: Các khái niệm cơ bản của lý thuyết xác suất
16 trang 83 0 0 -
Đặc trưng thống kê và hồi quy với dữ liệu khoảng
5 trang 76 0 0 -
Giáo trình Phương pháp thống kê trong khí hậu: Phần 1
98 trang 70 0 0 -
Giáo trình Xác suất và thống kê: Phần 1 (Tái bản lần thứ mười)
79 trang 66 0 0 -
Bài giảng Lý thuyết xác suất và thống kê toán - Bài 5: Cơ sở lý thuyết mẫu
18 trang 60 0 0