Danh mục

Phân tích số liệu thống kê

Số trang: 40      Loại file: pdf      Dung lượng: 912.98 KB      Lượt xem: 14      Lượt tải: 0    
10.10.2023

Hỗ trợ phí lưu trữ khi tải xuống: 6,000 VND Tải xuống file đầy đủ (40 trang) 0

Báo xấu

Xem trước 4 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Phân tích dữ liệu mang tính khám phá. Dữ liệu nên được xem xét, khám phá trước khi đặt ra bất kỳ giả thuyết nào về mô hình xác suất, mối quan hệ giữa các biến,...Đặc trưng phụ thuộc nhiều vào các kỹ thuật biểu diễn đồ thị. Quần thể: là nhóm đối tượng cần tổng quát hóa.
Nội dung trích xuất từ tài liệu:
Phân tích số liệu thống kê 1Phân tích số liệu thống kêĐặng Hải Vân – Lê Phong – Nguyễn Đình ThúcKhoa CNTT – ĐHKHTN{dhvan,lphong,ndthuc}@fit.hcmus.edu.vn Nội dung • Phân tích dữ liệu mang tính khám phá (EDA) EDA Lấy mẫu • Lấy mẫu  Khái niệm  Lấy mẫu ▫ Khái niệm  Lấy mẫu xác suất ▫ Lấy mẫu  Xử lý mẫu Thống kê mô ▫ Lấy mẫu xác suất tả  Khái niệm ▫ Xử lý mẫu  Các giá trị • Thống kê mô tả thống kê mô tả ▫ Khái niệm  Các kỹ thuật biểu ▫ Các giá trị thống kê mô tả diễn đồ thị  Histogr ▫ Các kỹ thuật biểu diễn đồ thị am  Boxplo  Histogram t  Quantil  Boxplot e-based plot  Quantile-based plot  Scatter  plot Scatter plot HCMUS 2010 - Thống kê máy tính 2 Phân tích dữ liệu mang tính khám phá EDA • Phân tích dữ liệu mang tính khám phá Lấy mẫu  Khái niệm (EDA – Exploratory Data Analysis) [John  Lấy mẫu  Lấy mẫu Tukey, 1977] xác suất  Xử lý mẫu ▫ Dữ liệu nên được xem xét, khám phá trước Thống kê mô tả khi đặt ra bất kỳ giả thuyết nào về mô hình  Khái niệm  Các giá trị xác suất, mối quan hệ giữa các biến,< thống kê mô tả ▫ Hướng tiếp cận:  Các kỹ thuật biểu diễn đồ thị Phân Mô Kết  Histogr Vấn đề Dữ liệu tích hình luận am  Boxplo t ▫ Đặc trưng: phụ thuộc nhiều vào các kỹ  Quantil e-based thuật biểu diễn đồ thị (graphical plot  Scatter techniques) plot HCMUS 2010 - Thống kê máy tính 3 Khái niệm EDA • Quần thể: là nhóm đối tượng cần tổng Lấy mẫu  Khái niệm quát hóa  Lấy mẫu  Lấy mẫu • Mẫu: là nhóm đối tượng thực sự được xác suất  Xử lý mẫu chọn trong nghiên cứu. Thống kê mô tả • Cơ cấu mẫu: là danh sách các phần tử của  Khái niệm  Các giá trị thống kê quần thể có thể. mô tả  Các kỹ • Thống kê (statistic): là hàm của các quan thuật biểu diễn đồ thị sát trong tập mẫu  Histogr am  Boxplo Ví dụ: trung bình mẫu, phương sai mẫu là t  Quantil các thống kê e-based plot  Scatter plot HCMUS 2010 - Thống kê máy tính 4 Lấy mẫu • Lấy mẫu: là một tiến trình chọn các mẫu cho EDA Lấy mẫu mục đích tổng quát hóa.  Khái niệm ▫ Lấy mẫu xác suất (probability sampling)  Lấy mẫu  Lấy mẫu  Thủ tục chọn ngẫu nhiên . Xác suất các phần tử xác suất  Xử lý mẫu được chọn bằng nhau. Thống kê mô  Mẫu chọn được gọi là mẫu ngẫu nhiên tả ▫ Lấy mẫu không xác suất (non-probability  Khái niệm  Các giá trị sampling) thống kê mô tả  Các kỹ Ví dụ: UBND quận 5 thực hiện khảo sát lấy ý kiến của nhân dân quận 5 về tình thuật biểu hình trị an hiện tại của quận. diễn đồ thị  Histogr Cách khảo sát 1: tất cả hộ gia đình của quận đều có cơ hội được chọn và am hỏi qua điện thoại. Xác suất 1 hộ gia đình được hỏi là xác định được.  Boxplo – Lấy mẫu xác suất t Cách khảo sát 2: Bảng câu hỏi được gửi đến các cư dân trong quận dựa  Quantil vào 1 mailing list đã có sẵn. Ngoài ra các bảng câu hỏi được đặt ở các e-based plot nơi công cộng. Theo cách này, không xác định được 1 cá nhân có t ...

Tài liệu được xem nhiều: