Chương 3 - Các thống kê cơ bản, tương quan và hồi quy
Số trang: 41
Loại file: ppt
Dung lượng: 1.07 MB
Lượt xem: 16
Lượt tải: 0
Xem trước 5 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Phân phối chuẩn, còn gọi là phân phối Gauss, làmột phân phối xác suất rất quan trọng trong nhiềulĩnh vực. Định nghĩa: Biến ngẫu nhiên X có phân phối chuẩnvới các tham số m (kỳ vọng), σ2 (phương sai) nếunó có hàm mật độ.
Nội dung trích xuất từ tài liệu:
Chương 3 - Các thống kê cơ bản, tương quan và hồi quyChương 3 Các thống kê cơ bản, tương quan và hồi quy Thống kê mô tả (Desriptive Statistics) Tổ chức đồ (Histogram) Tương quan và hồi qui 01/19/11 Ch3 – Các thống kê cơ bản, tương 1 quan & hồi quyGiới thiệu phân phối chuẩn Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất rất quan trọng trong nhiều lĩnh vực Định nghĩa: Biến ngẫu nhiên X có phân phối chuẩn với các tham số m (kỳ vọng), σ2 (phương sai) nếu nó có hàm mật độ: 01/19/11 Ch3 – Các thống kê cơ bản, tương 2 quan & hồi quyĐồ thị hàm mật độ phân phối chuẩn01/19/11 Ch3 – Các thống kê cơ bản, tương 3 quan & hồi quyĐồ thị hàm phân bố trong phân phối chuẩn 01/19/11 Ch3 – Các thống kê cơ bản, tương 4 quan & hồi quyThống kê mô tả (Descriptive Statistics) Thống kê mô tả cho phép tính các số đặc trưng mẫu, các giá trị thống kê mẫu như trung bình, độ lệch chuẩn, sai số chuẩn, trung vị, mode…Số liệu tính toán được bố trí theo cột hoặc theo dòng Mean (trung bình hay kỳ vọng): đặc trưng cho giá trị trung bình của DLNN Standard Deviation (độ lệch chuẩn), Sample Variance (phương sai mẫu): đặc trưng cho độ phân tán các giá trị của DLNN xung quanh giá trị trung bình 01/19/11 Ch3 – Các thống kê cơ bản, tương 5 quan & hồi quyThống kê mô tả (Descriptive Statistics) Standard Error (sai số chuẩn): Sai số của trung bình Median (trung vị): cho giá trị điểm giữa của dãy số, trong xác suất là giá trị Me của đại lượng ngẫu nhiên X sao cho P(XMe) Mode: là giá trị của biến ngẫu nhiên ứng với xác suất cực đại hay giá trị có tần suất xuất hiện trong mẫu lớn nhất Kurtosis(độnhọn): đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay tù hơn đường mật độ chuẩn tắc. Nếu trong [-2,2] thì coi xấp xỉ chuẩn. 01/19/11 Ch3 – Các thống kê cơ bản, tương 6 quan & hồi quyThống kê mô tả (Descriptive Statistics) Skewness (Độ lệch): đánh giá đường phân phối lệch trái hay lệch phải. Nếu trong [-2,2] thì coi số liệu cân đối gần như số liệu trong phân phối chuẩn. ConfidenceLevel(Nửađộdàikhoảngtincậy): Vídụ:Confidencelevel=95% Trong xác suất tương đương bài toán tìm giá trị α sao choP(mαKurtosis > 0 đường màu đỏ, Kurtosis Nếu Kurtosis > 0, kurtosis càng lớn đồ thị càng nhọn. Nếukurtosis Skewness > 0 là lệch phải, Các bước thực hiện Tools -> Data Analysis01/19/11 Ch3 – Các thống kê cơ bản, tương 11 quan & hồi quyCác bước thực hiện Miền dữ liệu Nhóm số liệu theo hàng hay theo cột Nếu dữ liệu có cả nhãn đầu dòng thì tích Nơi đặt kết quả Hiện các thống kê cơ bản Độ tin cậy Số lớn thứ nhất Số nhỏ nhất01/19/11 Ch3 – Các thống kê cơ bản, tương 12 quan & hồi quyTổ chức đồ Tần số xuất hiện của số liệu trong các khoảng cách đều nhau cho phép phác họa biểu đồ tần số. Để vẽ biểu đồ cần thực hiện qua 2 bước: bước chuẩn bị và bước vẽ tổ chức đồ01/19/11 Ch3 – Các thống kê cơ bản, tương 13 quan & hồi quyTổ chức đồ Chuẩn bị: Dể số liệu ở một cột, một hàng hay một bảng chữ nhật Tìm giá trị lớn nhất (hàm Max), nhỏ nhất (hàm Min) Tính khoảng biến thiên R=Max-Min Chọn số khoảng k của miền phân tổ (thực tế chọn k từ 20-30, ví dụ minh họa chọn k từ 6-10), có thể lấy bằng công thức 6*log(n) trong đó n là số giá trị của DLNN X (lấy giá trị nguyên xấp xỉ) Tìm giá trị bước tăng trong miền phân tổ h = R/k (Sử dụng hàm Round(R/k,số chữ số lẻ) Tạo cột bin (Edit->Fill->Series)01/19/11 Ch3 – Các thống kê cơ bản, tương 14 quan & hồi quyTổ chức đồ Vẽ tổ chức đồ Chọn Tool -> Data Analysis-> Histogram để khai báo các mục: Input range: Miền dữ liệu Input Bin: Miền phân tổ Labels: Nhãn ở dòng đầu nếu có Output range: Miền kết quả Pareto: Tần số sắp xếp trong tổ chức đồ là giảm dần Cumulative Percentage: Hiển thị đường tần suất cộng dồn % Chart output: Hiển thị biểu đồ01/19/11 Ch3 – Các thống kê cơ bản, tương 15 quan & hồi quyTổ chức đồ Chọn Tool -> Data Analysis-> Histogram Miền dữ liệu Miền phân tổ Nhãn ở đầu dòng nếu có Nơi chứa kết quả Tần số sắp xếp giảm dần % Cộng dồn Biểu đồ01/19/11 Ch3 – Các thống kê cơ bản, tương 16 quan & hồi quyTổ chức đồ Phân tích kết quả từ biểu ...
Nội dung trích xuất từ tài liệu:
Chương 3 - Các thống kê cơ bản, tương quan và hồi quyChương 3 Các thống kê cơ bản, tương quan và hồi quy Thống kê mô tả (Desriptive Statistics) Tổ chức đồ (Histogram) Tương quan và hồi qui 01/19/11 Ch3 – Các thống kê cơ bản, tương 1 quan & hồi quyGiới thiệu phân phối chuẩn Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất rất quan trọng trong nhiều lĩnh vực Định nghĩa: Biến ngẫu nhiên X có phân phối chuẩn với các tham số m (kỳ vọng), σ2 (phương sai) nếu nó có hàm mật độ: 01/19/11 Ch3 – Các thống kê cơ bản, tương 2 quan & hồi quyĐồ thị hàm mật độ phân phối chuẩn01/19/11 Ch3 – Các thống kê cơ bản, tương 3 quan & hồi quyĐồ thị hàm phân bố trong phân phối chuẩn 01/19/11 Ch3 – Các thống kê cơ bản, tương 4 quan & hồi quyThống kê mô tả (Descriptive Statistics) Thống kê mô tả cho phép tính các số đặc trưng mẫu, các giá trị thống kê mẫu như trung bình, độ lệch chuẩn, sai số chuẩn, trung vị, mode…Số liệu tính toán được bố trí theo cột hoặc theo dòng Mean (trung bình hay kỳ vọng): đặc trưng cho giá trị trung bình của DLNN Standard Deviation (độ lệch chuẩn), Sample Variance (phương sai mẫu): đặc trưng cho độ phân tán các giá trị của DLNN xung quanh giá trị trung bình 01/19/11 Ch3 – Các thống kê cơ bản, tương 5 quan & hồi quyThống kê mô tả (Descriptive Statistics) Standard Error (sai số chuẩn): Sai số của trung bình Median (trung vị): cho giá trị điểm giữa của dãy số, trong xác suất là giá trị Me của đại lượng ngẫu nhiên X sao cho P(XMe) Mode: là giá trị của biến ngẫu nhiên ứng với xác suất cực đại hay giá trị có tần suất xuất hiện trong mẫu lớn nhất Kurtosis(độnhọn): đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay tù hơn đường mật độ chuẩn tắc. Nếu trong [-2,2] thì coi xấp xỉ chuẩn. 01/19/11 Ch3 – Các thống kê cơ bản, tương 6 quan & hồi quyThống kê mô tả (Descriptive Statistics) Skewness (Độ lệch): đánh giá đường phân phối lệch trái hay lệch phải. Nếu trong [-2,2] thì coi số liệu cân đối gần như số liệu trong phân phối chuẩn. ConfidenceLevel(Nửađộdàikhoảngtincậy): Vídụ:Confidencelevel=95% Trong xác suất tương đương bài toán tìm giá trị α sao choP(mαKurtosis > 0 đường màu đỏ, Kurtosis Nếu Kurtosis > 0, kurtosis càng lớn đồ thị càng nhọn. Nếukurtosis Skewness > 0 là lệch phải, Các bước thực hiện Tools -> Data Analysis01/19/11 Ch3 – Các thống kê cơ bản, tương 11 quan & hồi quyCác bước thực hiện Miền dữ liệu Nhóm số liệu theo hàng hay theo cột Nếu dữ liệu có cả nhãn đầu dòng thì tích Nơi đặt kết quả Hiện các thống kê cơ bản Độ tin cậy Số lớn thứ nhất Số nhỏ nhất01/19/11 Ch3 – Các thống kê cơ bản, tương 12 quan & hồi quyTổ chức đồ Tần số xuất hiện của số liệu trong các khoảng cách đều nhau cho phép phác họa biểu đồ tần số. Để vẽ biểu đồ cần thực hiện qua 2 bước: bước chuẩn bị và bước vẽ tổ chức đồ01/19/11 Ch3 – Các thống kê cơ bản, tương 13 quan & hồi quyTổ chức đồ Chuẩn bị: Dể số liệu ở một cột, một hàng hay một bảng chữ nhật Tìm giá trị lớn nhất (hàm Max), nhỏ nhất (hàm Min) Tính khoảng biến thiên R=Max-Min Chọn số khoảng k của miền phân tổ (thực tế chọn k từ 20-30, ví dụ minh họa chọn k từ 6-10), có thể lấy bằng công thức 6*log(n) trong đó n là số giá trị của DLNN X (lấy giá trị nguyên xấp xỉ) Tìm giá trị bước tăng trong miền phân tổ h = R/k (Sử dụng hàm Round(R/k,số chữ số lẻ) Tạo cột bin (Edit->Fill->Series)01/19/11 Ch3 – Các thống kê cơ bản, tương 14 quan & hồi quyTổ chức đồ Vẽ tổ chức đồ Chọn Tool -> Data Analysis-> Histogram để khai báo các mục: Input range: Miền dữ liệu Input Bin: Miền phân tổ Labels: Nhãn ở dòng đầu nếu có Output range: Miền kết quả Pareto: Tần số sắp xếp trong tổ chức đồ là giảm dần Cumulative Percentage: Hiển thị đường tần suất cộng dồn % Chart output: Hiển thị biểu đồ01/19/11 Ch3 – Các thống kê cơ bản, tương 15 quan & hồi quyTổ chức đồ Chọn Tool -> Data Analysis-> Histogram Miền dữ liệu Miền phân tổ Nhãn ở đầu dòng nếu có Nơi chứa kết quả Tần số sắp xếp giảm dần % Cộng dồn Biểu đồ01/19/11 Ch3 – Các thống kê cơ bản, tương 16 quan & hồi quyTổ chức đồ Phân tích kết quả từ biểu ...
Tìm kiếm theo từ khóa liên quan:
tin học ứng dụng thống kê nông nghiệp thống kê tương quan thống kê hồi quy chuyên ngành công nghệ thông tinGợi ý tài liệu liên quan:
-
Giáo trình Phân tích và dự báo trong kinh tế: Phần 2 - Nguyễn Văn Huân, Phạm Việt Bình
68 trang 377 0 0 -
Đề tài Xây dựng hệ thống quản lý nhân sự đại học Dân Lập
46 trang 219 0 0 -
Tài liệu bồi dưỡng giáo viên sử dụng SGK Tin học 10 Cánh diều (Định hướng Tin học ứng dụng)
61 trang 211 0 0 -
101 trang 192 1 0
-
20 trang 177 0 0
-
Giáo trình Mạng máy tính (Nghề: Tin học ứng dụng - Trung cấp) - Trường Cao đẳng Cộng đồng Đồng Tháp
189 trang 161 0 0 -
Giáo trình Tin học ứng dụng: Phần 1 - Trường ĐH Tài nguyên và Môi trường Hà Nội
125 trang 145 0 0 -
Bài giảng Tin học ứng dụng: Kiểm định trung bình - Trường ĐH Y dược Huế
25 trang 137 0 0 -
Giáo trình Quản trị mạng (Nghề: Tin học ứng dụng - Trung cấp) - Trường Cao đẳng Cộng đồng Đồng Tháp
173 trang 118 1 0 -
175 trang 104 0 0