Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2
Số trang: 79
Loại file: pdf
Dung lượng: 2.94 MB
Lượt xem: 12
Lượt tải: 0
Xem trước 8 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Nối tiếp phần 1, "Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2" tiếp tục cung cấp cho học viên những kiến thức về kiểm định giả thuyết thống kê với công cụ phân tích dữ liệu, ước lượng và khoảng tin cậy, kiểm định giả thuyết; các công cụ phân tích dữ liệu cho mô hình thông kê, dự báo; phân tích hồi quy và tương quan; mô hình dự báo;... Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG -------------------- KHOA MARKETING BÀI GIẢNGỨNG DỤNG CÔNG CỤPHÂN TÍCH DỮ LIỆU NGUYỄN NGỌC ANH HàNội 2017 Chương 3: Kiểm định giả thuyết thống kê với các công cụ phân tích dữ liệu Bạn ước lượng các tham số quần thể bằng cách sử dụng điểm ước lượng hoặc khoảngước lượng. Điểm ước lượng là giá trị của một thống kê mẫu đơn, chẳng hạn như trung bìnhmẫu. Khoảng tin cậy là một dãy số, được gọi là một khoảng, được xây dựng quanh điểm ướclượng. Khoảng tin cậy được xây dựng sao cho xác suất khoảng thời gian bao gồm tham sốquần thể được biết đến. Trong phần này, chúng ta sẽ xem cách xây dựng một khoảng tin cậycho cả trung bình quần thể và tỷ lệ quần thể.3.1. Ước lượng và khoảng tin cậy3.1.1. Điểm ước lượng Điểm ước lượng được thực hiện khi giá trị của một thống kê mẫu được coi là giá trịđúng của tham số quần thể. Điểm ước lượng là một thước đo không đáng tin cậy của mộttham số quần thể vì xác suất nó chính xác bằng giá trị thật là cực nhỏ (gần như bằng không).Ngoài ra, không có dấu hiệu cho biết thống kê mẫu đơn là bao nhiêu hoặc gần như thế nào sovới chỉ số quần thể của nó (nghĩa là không có dấu hiệu lỗi lấy mẫu). Do đó một mẫu trung bình, , được sử dụng như một ước tính điểm của quần thể trungbình của nó, μ, trong khi mẫu tỷ lệ, p, được sử dụng để đại diện cho giá trị đúng của quần thểtỷ lệ của nó, π. Đây là hai ví dụ: Một cuộc điều tra của siêu thị với 75 mẫu mua sắm ngẫu nhiên cho thấy thời gian mua sắm trung bình của khách hàng là 28,4 phút ( = 28,4), do đó ước tính thời gian mua sắm trung bình thực tế của người mua sắm siêu thị là 28,4 phút (μ = 28,4). Giả sử 55 trong số 350 những người uống cà phê (15,7%) được phỏng vấn ngẫu nhiên thích cà phê không có caffeine. Sau đó, ước lượng điểm của tỷ lệ thực tế (%) của tất cả những người uống cà phê thích cà phê không caffeine được giả định là 0,157 (π = 0,157 hoặc 15,7%). Khoảng ước lượng là một dải giá trị được xác định xung quanh một mẫu thống kê.Tham số quần thể dự kiến sẽ nằm trong khoảng này với mức độ tin cậy xác định (hoặc xácsuất). Do đó, nó được gọi là khoảng tin cậy. Khoảng tin cậy sẽ được xây dựng với chỉ số trung bình quần thể đơn, μ, và tỷ lệ quầnthể duy nhất, π, sử dụng số liệu thống kê mẫu tương ứng, , và p. Giả sử một sinh viên đo nhiệt độ sôi của một chất lỏng nào đó quan sát các số đo (bằngđộ Celsius) 102.5, 101.7, 103.1, 100.9, 100.5 và 102.2 trên 6 mẫu khác nhau của chất lỏng.Anh ta tính trung bình mẫu là 101,82. Nếu anh ta biết rằng độ lệch chuẩn cho quá trình này là1,2 độ, vậy khoảng tin cậy cho quần thể ở mức độ tin cậy là 95% là bao nhiêu? Nói cách khác, sinh viên ước tính nhiệt độ sôi thực sự trung bình của chất lỏng bằngcách sử dụng kết quả đo của mình. Nếu các phép đo theo phân bố chuẩn, thì trung bình mẫusẽ có phân bố N( , ). Do cỡ mẫu là 6, nên độ lệch chuẩn của mẫu trung bình bằng 1,2/sqrt (6) = 0,49. 55 | P a g e3.1.2. Khoảng tin cậy cho số trung bình. Khoảng tin cậy trên trung bình Sử dụng tính toán phân bố chuẩn để tìm giá trị z để việc sử dụng cho một khoảng tin cậy Tính một khoảng tin cậy trên trung bình khi σ được biết Tính một khoảng tin cậy trên trung bình khi ước lượng σ Khi bạn tính khoảng tin cậy trên trung bình, bạn tính trung bình của một mẫu để ướctính trung bình của quần thể. Rõ ràng, nếu bạn đã biết ý nghĩa của quần thể, sẽ không cầnkhoảng tin cậy. Trong một số trường hợp, bạn có thể muốn có mức độ tin cậy cao hơn trong việc đưatrung bình quần thể vào khoảng (99%). Trong các trường hợp khác, bạn có thể chấp nhận sựtin cậy ít hơn (chẳng hạn như 90%) về ước tính chính xác mức độ trung bình quần thể. Nóichung, mức độ tin cậy được biểu trưng bởi , trong đó là tỷ lệ trong đoạndưới phân bố nằm ngoài khoảng tin cậy. Tỷ lệ phần trên của phân bố là 2, và tỷ lệ phầndưới của phân bố là 2. Bạn sử dụng phương trình (8.1) để xây dựng zzz, ước tính khoảngtin cậy cho trung bình với được biết đến. Với là giá trị tương ứng với xác suất trên 2 từ phân bố chuẩn (tức là một diệntích tích lũy từ 1- 2). Giá trị của cần thiết để xây dựng một khoảng tin cậy được gọilà giá trị quan trọng cho việc phân phối. Độ tin cậy 95% tương ứng với giá trị 0,05. Giá trị Zgiới hạn tương ứng với diện tích tích lũy của 0,975 là 1,96 vì có 0,025 ở phần đuôi trên củasự phân bố, và diện tích tích lũy nhỏ hơn Z = 1,96 là 0,975. Để biết giá trị Z giới hạn cho từngđộ tin cậy, các bạn có thể trang bảng thống kê để biết. Ví dụ :Với độ tin cậy 99% thì giá trị Z giới hạn của 0,005 là 2.58 ...
Nội dung trích xuất từ tài liệu:
Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG -------------------- KHOA MARKETING BÀI GIẢNGỨNG DỤNG CÔNG CỤPHÂN TÍCH DỮ LIỆU NGUYỄN NGỌC ANH HàNội 2017 Chương 3: Kiểm định giả thuyết thống kê với các công cụ phân tích dữ liệu Bạn ước lượng các tham số quần thể bằng cách sử dụng điểm ước lượng hoặc khoảngước lượng. Điểm ước lượng là giá trị của một thống kê mẫu đơn, chẳng hạn như trung bìnhmẫu. Khoảng tin cậy là một dãy số, được gọi là một khoảng, được xây dựng quanh điểm ướclượng. Khoảng tin cậy được xây dựng sao cho xác suất khoảng thời gian bao gồm tham sốquần thể được biết đến. Trong phần này, chúng ta sẽ xem cách xây dựng một khoảng tin cậycho cả trung bình quần thể và tỷ lệ quần thể.3.1. Ước lượng và khoảng tin cậy3.1.1. Điểm ước lượng Điểm ước lượng được thực hiện khi giá trị của một thống kê mẫu được coi là giá trịđúng của tham số quần thể. Điểm ước lượng là một thước đo không đáng tin cậy của mộttham số quần thể vì xác suất nó chính xác bằng giá trị thật là cực nhỏ (gần như bằng không).Ngoài ra, không có dấu hiệu cho biết thống kê mẫu đơn là bao nhiêu hoặc gần như thế nào sovới chỉ số quần thể của nó (nghĩa là không có dấu hiệu lỗi lấy mẫu). Do đó một mẫu trung bình, , được sử dụng như một ước tính điểm của quần thể trungbình của nó, μ, trong khi mẫu tỷ lệ, p, được sử dụng để đại diện cho giá trị đúng của quần thểtỷ lệ của nó, π. Đây là hai ví dụ: Một cuộc điều tra của siêu thị với 75 mẫu mua sắm ngẫu nhiên cho thấy thời gian mua sắm trung bình của khách hàng là 28,4 phút ( = 28,4), do đó ước tính thời gian mua sắm trung bình thực tế của người mua sắm siêu thị là 28,4 phút (μ = 28,4). Giả sử 55 trong số 350 những người uống cà phê (15,7%) được phỏng vấn ngẫu nhiên thích cà phê không có caffeine. Sau đó, ước lượng điểm của tỷ lệ thực tế (%) của tất cả những người uống cà phê thích cà phê không caffeine được giả định là 0,157 (π = 0,157 hoặc 15,7%). Khoảng ước lượng là một dải giá trị được xác định xung quanh một mẫu thống kê.Tham số quần thể dự kiến sẽ nằm trong khoảng này với mức độ tin cậy xác định (hoặc xácsuất). Do đó, nó được gọi là khoảng tin cậy. Khoảng tin cậy sẽ được xây dựng với chỉ số trung bình quần thể đơn, μ, và tỷ lệ quầnthể duy nhất, π, sử dụng số liệu thống kê mẫu tương ứng, , và p. Giả sử một sinh viên đo nhiệt độ sôi của một chất lỏng nào đó quan sát các số đo (bằngđộ Celsius) 102.5, 101.7, 103.1, 100.9, 100.5 và 102.2 trên 6 mẫu khác nhau của chất lỏng.Anh ta tính trung bình mẫu là 101,82. Nếu anh ta biết rằng độ lệch chuẩn cho quá trình này là1,2 độ, vậy khoảng tin cậy cho quần thể ở mức độ tin cậy là 95% là bao nhiêu? Nói cách khác, sinh viên ước tính nhiệt độ sôi thực sự trung bình của chất lỏng bằngcách sử dụng kết quả đo của mình. Nếu các phép đo theo phân bố chuẩn, thì trung bình mẫusẽ có phân bố N( , ). Do cỡ mẫu là 6, nên độ lệch chuẩn của mẫu trung bình bằng 1,2/sqrt (6) = 0,49. 55 | P a g e3.1.2. Khoảng tin cậy cho số trung bình. Khoảng tin cậy trên trung bình Sử dụng tính toán phân bố chuẩn để tìm giá trị z để việc sử dụng cho một khoảng tin cậy Tính một khoảng tin cậy trên trung bình khi σ được biết Tính một khoảng tin cậy trên trung bình khi ước lượng σ Khi bạn tính khoảng tin cậy trên trung bình, bạn tính trung bình của một mẫu để ướctính trung bình của quần thể. Rõ ràng, nếu bạn đã biết ý nghĩa của quần thể, sẽ không cầnkhoảng tin cậy. Trong một số trường hợp, bạn có thể muốn có mức độ tin cậy cao hơn trong việc đưatrung bình quần thể vào khoảng (99%). Trong các trường hợp khác, bạn có thể chấp nhận sựtin cậy ít hơn (chẳng hạn như 90%) về ước tính chính xác mức độ trung bình quần thể. Nóichung, mức độ tin cậy được biểu trưng bởi , trong đó là tỷ lệ trong đoạndưới phân bố nằm ngoài khoảng tin cậy. Tỷ lệ phần trên của phân bố là 2, và tỷ lệ phầndưới của phân bố là 2. Bạn sử dụng phương trình (8.1) để xây dựng zzz, ước tính khoảngtin cậy cho trung bình với được biết đến. Với là giá trị tương ứng với xác suất trên 2 từ phân bố chuẩn (tức là một diệntích tích lũy từ 1- 2). Giá trị của cần thiết để xây dựng một khoảng tin cậy được gọilà giá trị quan trọng cho việc phân phối. Độ tin cậy 95% tương ứng với giá trị 0,05. Giá trị Zgiới hạn tương ứng với diện tích tích lũy của 0,975 là 1,96 vì có 0,025 ở phần đuôi trên củasự phân bố, và diện tích tích lũy nhỏ hơn Z = 1,96 là 0,975. Để biết giá trị Z giới hạn cho từngđộ tin cậy, các bạn có thể trang bảng thống kê để biết. Ví dụ :Với độ tin cậy 99% thì giá trị Z giới hạn của 0,005 là 2.58 ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Ứng dụng công cụ phân tích dữ liệu Công cụ phân tích dữ liệu Kiểm định giả thuyết thống kê Mô hình thông kê Phân tích hồi quy Mô hình dự báoGợi ý tài liệu liên quan:
-
Giáo trình Xác suất thống kê (tái bản lần thứ năm): Phần 2
131 trang 163 0 0 -
Bài giảng Xác suất thống kê và quy hoạch thực nghiệm: Chương 5.2 - Nguyễn Thị Thanh Hiền
27 trang 121 0 0 -
Bài giảng Xác suất thống kê - Chương 6: Kiểm định giả thuyết thống kê (Trường ĐH Thương mại)
58 trang 110 0 0 -
Giáo trình Xử lý số liệu trắc địa: Phần 2 - PGS.TS Đặng Nam Chinh (Chủ biên)
90 trang 79 0 0 -
Tiểu luận: LÝ THUYẾT ĐỒNG DẠNG THỨ NGUYÊN
12 trang 63 0 0 -
Bài giảng Xác suất thống kê - Trường CĐ Công nghiệp Huế
37 trang 40 0 0 -
Sách giao bài tập Xác suất thống kê - Phạm Thanh Hiếu
51 trang 39 0 0 -
Tìm hiểu các công cụ phân tích dữ liệu
10 trang 38 0 0 -
Bài giảng Lý thuyết xác suất và thống kê toán - Chương 7: Hồi quy - Tương quan
73 trang 33 0 0 -
Nhân tố ảnh hưởng đến chất lượng nguồn nhân lực trong các doanh nghiệp dược phẩm Thanh Hóa
11 trang 33 0 0