Bài giảng Nhập và xử lý số liệu - TS. Nguyễn Minh Hà
Số trang: 9
Loại file: pdf
Dung lượng: 179.33 KB
Lượt xem: 17
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Nhập và xử lý số liệu nhằm trình bày các nội dung chính: chuẩn bị, nhập và kiểm tra dữ liệu, khám phá và trình bày dữ liệu, phân tích thống kê mô tả, phân tích dữ liệu. Bài giảng được trình bày khoa học, súc tích giúp các bạn sinh viên tiếp thu bài học nhanh.
Nội dung trích xuất từ tài liệu:
Bài giảng Nhập và xử lý số liệu - TS. Nguyễn Minh Hà 3/13/2011 CHƯƠNG 9 NHẬP VÀ XỬ LÝ SỐ LIỆU TS. NGUYỄN MINH HÀ TRƯỜNG ĐH MỞ TPHCM 1 NỘI DUNG1. CHUẨN BỊ, NHẬP VÀ KIỂM TRA DỮ LIỆU2. KHÁM PHÁ VÀ TRÌNH BÀY DỮ LIỆU3. PHÂN TÍCH THỐNG KÊ MÔ TẢ4. PHÂN TÍCH DỮ LIỆU 2 1 3/13/2011I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU1. Các loại dữ liệu:- Dữ liệu phân loại- Dữ liệu mô tả/ dữ liệu định danh- Dữ liệu xếp hạng hay thứ tự- Dữ liệu có thể định lượng- Dữ liệu khoảng cách 3I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU2. Trình bày dữ liệu:- Trình bày dữ liệu ở dạng bảng. Gọi là ma trận dữ liệu- Đặt tên biến ngắn gọn, nên viết tắt (tiếng Anh/tiếng Việt không dấu)- Đặt tên biến nên theo quy luật và trình tự của bảng câu hỏi hay trình tự khảo sát.- Có thể lưu trữ ở phần mềm Excel hay SPSS Số nhận dạng Biến 1 Biến 2 Biến 3 Biến 4 (ID) 1 15 1 3 0,4 2 27 0 1 1,2 3 18 0 2 0,9 ... 4 2 3/13/2011I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU3. Mã hóa dữ liệu: Ghi dữ liệu bằng mã số họca. Mã hóa dữ liệu có thể định lượng: Các con số thực tế được sử dụng như mã số cho dữ liệu có thể định lượng.VD ở bảng trênb. Mã hóa dữ liệu phân loại:Các câu hỏi, các biến trả lời nên được mã hóa thành các con số. Việc mã hóa sẽ tiết kiệm thời gian khi nhập, có thể sử dụng để phân tích, kiểm định và đối chiếu.Để tạo ra bộ mã hóa cho mỗi biến, cần phải:- Xem xét dữ liệu và xác lập các nhóm tổng quát- Chia nhóm tổng quát thành những nhóm nhỏ tùy vào phân tích dự định thực hiện- Phân bổ mã số cho tất cả các phân loại- Ghi chú những câu trả lời thực tế được phân bổ vào mỗi loại và bộ mã- Đảm bảo những phân loại có thể hợp nhất với nhau được mã hóa liền nhau để thuận tiện cho việc mã hóa lại. 5I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU4. Nhập dữ liệu:- Cần tạo 1 file để chứa tên và giải thích ý nghĩa của các biến trong dữ liệu để thuận tiện phân tích và kế thừa nghiên cứu.- Các dữ liệu định lượng, nhập đúng giá trị trong bảng phỏng vấn.- Đối với các câu trả lời đóng: • Khi câu có 1 câu trả lời/chọn 1 trong 2 (có/không; Nam/nữ): sử dụng giá trị 0 và 1 để lưu thông tin. Vd: có là 1, không là 0; Nam là 1, Nữ là 0 hoặc ngược lại. Tình trạng gia đình (0: độc thân, 1: lập gia đình hoặc ngược lại) • Khi có từ 3 lựa chọn trở lên nhưng chỉ có 1 câu trả lời (không thích/thích/không ý kiến): Sử dụng 1, 2, 3 tương ứng theo câu trả lời. Trường hợp này hay gặp với với câu hỏi phân loại/ danh nghĩa/định danh. Vd: Màu tóc (đen, đỏ, hung): 1,2,3 tương ứng hoặc có thể đổi thứ tự. Ngành kinh doanh: 1 là Nông nghiệp, 2 là công nghiệp và 3 là dịch vụ. Từ các mã hóa 1, 2, 3, ... Chúng ta có thể chuyển thành các biến dummy khác nhau dễ dàng. 6 3 3/13/2011I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU4. Nhập dữ liệu: • Đối với câu trả lời thứ bậc và xếp hạng: nhập theo số thứ bậc/xếp hạng mà được trả lời. Vd: thang đo likert (1-5) • Khi có từ 3 lựa chọn trở lên và có ít nhất 2 câu trả lời (vd: sở thích xem tivi, đọc báo, và nghe radio): Tạo 3 biến, mỗi biến là 1 sự lựa chọn và sử dụng giá trị 0 và 1 để lưu thông tin. Lựa chọn nào được đánh dấu trong bảng câu hỏi thì biến tương ứng sẽ có giá trị là 1, nếu không được chọn thì đánh số 0.- Câu trả lời mở: Nhập chính xác câu trả lời ghi trong bảng câu hỏi, sau đó đọc và phân nhóm câu trả lời rồi mã hóa. 7I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU5. Kiểm tra sai soát và thanh lọc dữ liệu:- Kiểm tra sai soát: - Kiểm tra các mã không hợp lệ: số 0 hay o, 1 hay I, ... Sử dụng 1 số công dụn ...
Nội dung trích xuất từ tài liệu:
Bài giảng Nhập và xử lý số liệu - TS. Nguyễn Minh Hà 3/13/2011 CHƯƠNG 9 NHẬP VÀ XỬ LÝ SỐ LIỆU TS. NGUYỄN MINH HÀ TRƯỜNG ĐH MỞ TPHCM 1 NỘI DUNG1. CHUẨN BỊ, NHẬP VÀ KIỂM TRA DỮ LIỆU2. KHÁM PHÁ VÀ TRÌNH BÀY DỮ LIỆU3. PHÂN TÍCH THỐNG KÊ MÔ TẢ4. PHÂN TÍCH DỮ LIỆU 2 1 3/13/2011I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU1. Các loại dữ liệu:- Dữ liệu phân loại- Dữ liệu mô tả/ dữ liệu định danh- Dữ liệu xếp hạng hay thứ tự- Dữ liệu có thể định lượng- Dữ liệu khoảng cách 3I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU2. Trình bày dữ liệu:- Trình bày dữ liệu ở dạng bảng. Gọi là ma trận dữ liệu- Đặt tên biến ngắn gọn, nên viết tắt (tiếng Anh/tiếng Việt không dấu)- Đặt tên biến nên theo quy luật và trình tự của bảng câu hỏi hay trình tự khảo sát.- Có thể lưu trữ ở phần mềm Excel hay SPSS Số nhận dạng Biến 1 Biến 2 Biến 3 Biến 4 (ID) 1 15 1 3 0,4 2 27 0 1 1,2 3 18 0 2 0,9 ... 4 2 3/13/2011I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU3. Mã hóa dữ liệu: Ghi dữ liệu bằng mã số họca. Mã hóa dữ liệu có thể định lượng: Các con số thực tế được sử dụng như mã số cho dữ liệu có thể định lượng.VD ở bảng trênb. Mã hóa dữ liệu phân loại:Các câu hỏi, các biến trả lời nên được mã hóa thành các con số. Việc mã hóa sẽ tiết kiệm thời gian khi nhập, có thể sử dụng để phân tích, kiểm định và đối chiếu.Để tạo ra bộ mã hóa cho mỗi biến, cần phải:- Xem xét dữ liệu và xác lập các nhóm tổng quát- Chia nhóm tổng quát thành những nhóm nhỏ tùy vào phân tích dự định thực hiện- Phân bổ mã số cho tất cả các phân loại- Ghi chú những câu trả lời thực tế được phân bổ vào mỗi loại và bộ mã- Đảm bảo những phân loại có thể hợp nhất với nhau được mã hóa liền nhau để thuận tiện cho việc mã hóa lại. 5I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU4. Nhập dữ liệu:- Cần tạo 1 file để chứa tên và giải thích ý nghĩa của các biến trong dữ liệu để thuận tiện phân tích và kế thừa nghiên cứu.- Các dữ liệu định lượng, nhập đúng giá trị trong bảng phỏng vấn.- Đối với các câu trả lời đóng: • Khi câu có 1 câu trả lời/chọn 1 trong 2 (có/không; Nam/nữ): sử dụng giá trị 0 và 1 để lưu thông tin. Vd: có là 1, không là 0; Nam là 1, Nữ là 0 hoặc ngược lại. Tình trạng gia đình (0: độc thân, 1: lập gia đình hoặc ngược lại) • Khi có từ 3 lựa chọn trở lên nhưng chỉ có 1 câu trả lời (không thích/thích/không ý kiến): Sử dụng 1, 2, 3 tương ứng theo câu trả lời. Trường hợp này hay gặp với với câu hỏi phân loại/ danh nghĩa/định danh. Vd: Màu tóc (đen, đỏ, hung): 1,2,3 tương ứng hoặc có thể đổi thứ tự. Ngành kinh doanh: 1 là Nông nghiệp, 2 là công nghiệp và 3 là dịch vụ. Từ các mã hóa 1, 2, 3, ... Chúng ta có thể chuyển thành các biến dummy khác nhau dễ dàng. 6 3 3/13/2011I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU4. Nhập dữ liệu: • Đối với câu trả lời thứ bậc và xếp hạng: nhập theo số thứ bậc/xếp hạng mà được trả lời. Vd: thang đo likert (1-5) • Khi có từ 3 lựa chọn trở lên và có ít nhất 2 câu trả lời (vd: sở thích xem tivi, đọc báo, và nghe radio): Tạo 3 biến, mỗi biến là 1 sự lựa chọn và sử dụng giá trị 0 và 1 để lưu thông tin. Lựa chọn nào được đánh dấu trong bảng câu hỏi thì biến tương ứng sẽ có giá trị là 1, nếu không được chọn thì đánh số 0.- Câu trả lời mở: Nhập chính xác câu trả lời ghi trong bảng câu hỏi, sau đó đọc và phân nhóm câu trả lời rồi mã hóa. 7I. CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU5. Kiểm tra sai soát và thanh lọc dữ liệu:- Kiểm tra sai soát: - Kiểm tra các mã không hợp lệ: số 0 hay o, 1 hay I, ... Sử dụng 1 số công dụn ...
Tìm kiếm theo từ khóa liên quan:
Trình bày dữ liệu Phân tích dữ liệu Kiểm tra dữ liệu Xử lý số liệu Bài giảng kinh tế học Tài liệu kinh tế họcTài liệu liên quan:
-
Bài giảng Đánh giá kinh tế y tế: Phần 2 - Nguyễn Quỳnh Anh
42 trang 215 0 0 -
Lợi ích và thách thức ứng dụng phân tích dữ liệu và dữ liệu lớn trong kiểm toán báo cáo tài chính
8 trang 129 0 0 -
Bài giảng kinh tế học đại cương - Bài 8: Thương mại quốc tế
17 trang 114 0 0 -
Bài giảng Xác suất thống kê ứng dụng trong kinh tế xã hội: Chương 3 - ĐH Thăng Long
24 trang 100 0 0 -
Mô hình Dea Metafrontier và việc so sánh hiệu quả theo vùng của các trường đại học của Việt Nam
6 trang 99 0 0 -
BÀI GIẢNG VỀ ỨNG DỤNG TIN HỌC TRONG THIẾT KẾ THÍ NGHIỆM VÀ XỬ LÝ SỐ LIỆU
48 trang 90 0 0 -
Giáo trình Nhập môn lập trình VB6: Phần 1
246 trang 85 0 0 -
Phát triển Java 2.0: Phân tích dữ liệu lớn bằng MapReduce của Hadoop
12 trang 73 0 0 -
Phân tích dữ liệu bằng SPSS - Phần 2
15 trang 63 0 0 -
Tìm hiểu các công cụ phân tích dữ liệu
10 trang 50 0 0