Phân tích dữ liệu bằng SPSS - Phần 3
Số trang: 53
Loại file: doc
Dung lượng: 325.00 KB
Lượt xem: 23
Lượt tải: 0
Xem trước 6 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Công việc đầu tiên rất quan trọng và cần phải thực hiện một cách cẩn thận trước khi đi vào các bước mô tả hay các phân tích thông kê phức tạp sau này là tiến hành xem xét dữ liệu một cách cẩn thận. SPSS cung cấp cho công cụ Explore để xem xét và kiểm tra dữ liệu:
Nội dung trích xuất từ tài liệu:
Phân tích dữ liệu bằng SPSS - Phần 3PhaântíchdöõlieäubaèngSPSS CHÖÔNG6:XÖÕLYÙVAØPHAÂNTÍCHDÖÕLIEÄU1. Kieåmtradöõlieäu(Explore)Coâng vieäc ñaàu tieân raát quan troïng vaø caàn phaûi thöïchieän moät caùch caån thaän tröôùc khi ñi vaøo caùc böôùcmoâ taû hay caùc phaân tích thoâng keâ phöùc taïp sau naøylaø tieán haønh xem xeùt döõ lieäu moät caùch caån thaän.SPSS cung caáp cho coâng cuï Explore ñeå xem xeùt vaø kieåmtra döõ lieäu: - Phaùt hieän caùc sai soùt - Nhaän daïng döõ lieäu ñeå tìm phöông phaùp phaân tích thích hôïp vaø chuaån bò cho vieäc kieåm tra giaû thuyeátÑeå nhaän daïng vaø phaùt hieän sai soùt trong döõ lieäu, tacoù ba caùch hieãn thò döõ lieäu nhö sau - Bieåu ñoà Histogram - Sô ñoà caønh vaø laù Stem-and-leaf plot - Sô ñoà hoäp BoxplotÑeå öôùc löôïng caùc giaõ ñònh ñöôïc duøng cho vieäc kieåmnghieäm caùc giaû thuyeát, ta duøng caùc pheùp kieåm tra sau: - Kieåm tra levene: Kieåm tra tính ñoàng ñeàu cuûa phöông sai - Kieåm tra K-S Lilliefors: Kieåm tra tính chuaån taéc cuûa toång theå, xem döõ lieäu coù ñöôïc laáy töø moät phaân boá chuaån hay khoângChuùng ta thöôøng duøng giaù trò trung bình soá hoïc ñeå öôùclöôïng ñoä hoäi tuï cuûa döõ lieäu. Tuy nhieân vì giaù trò trungbình bò aûnh höôûng bôûi taát caû caùc giaù trò quan saùt. Ñeågiaûm thieåu nhöõng aûnh höôûng cuûa caùc giaù trò baátthöôøng (quaù lôùn hoaëc quaù beù), ngöôøi ta thöôøng loaïiboû caùc giaù trò lôùn nhaát vaø caùc giaù trò nhoû nhaát(Outliers) theo cuøng moät tyû leä naøo ñoù. Khi ñoù giaù tròtrung bình ñöôïc goïi laø giaù trò trung bình giaõn löôïc(Timmed-mean).Moät caùch laøm khaùc laø gaùn caùc troïng soá khaùc nhaucho caùc giaù trò quan saùt tuøy theo khoaûng caùch cuûa noùñeán giaù trò trung bình, caøng xa troïng soá caøng nhoû. Caùctrong soá naøy goïi laø M-estimators. Coù 4 loaïi troïng soá laøHuber, Turkey, Hampel, vaø Andrew. Döïa vaøo troïng soá naøyta öôùc löôïng laïi giaù trò trung bình cho döõ lieäu.Bieânsoaïn:ÑaøoHoaøiNam 33PhaântíchdöõlieäubaèngSPSSÑeå kieåm tra döõ lieäu, choïn treân menuStatistic/Summarize/Explore… ñeå môû hoäp thoaïi Explorenhö Hình 6-1: Hình61Caùc bieán trong taäp döõ lieäu xuaát hieän trong hoäp beântraùi. Choïn moät hay nhieàu bieán ñöa vaøo oâ Dependentlist, caùc bieán caàn quan saùt seõ ñöôïc lieät keâ rong oânaøy. Chuùng ta cuõng coù theå taùch caùc quan saùt thaønhcaùc nhoùm nhoû rieâng bieät ñeå kieåm tra döïa vaøo caùcgiaù trò cuûa caùc bieán kieåm soaùt seõ ñöôïc ñöa vaøo oâFactorList. Ví duï nhö kieåm tra bieán möùc ñoä ñaùnh giaùnoùi chung döïa vaøo bieán nhaõn hieäu ñang söû duïng. Coùtheå laàn ra caùc quan saùt naøy baèng caùch gaùn nhaõn chonoù baèng gía trò cuûa moät bieán naøo ñoù, bieán naøy seõñöôïc ñöa vaøo trong oâ labelcasesby. Ví duï muoán bieátnhöõng giaù trò di thöôøng trong bieán möùc ñoä ñaùnh giaùnoùi chung theo nhaõn hieäu TV ñang duøng. Ta gaùn nhaõncho caùc quan saùt naøy baèng caùc giaù trò trong bieán soábaûng caâu hoûi. Luùc naøy neáu coù caùc giaù trò dò thöôøngta deã daøng laàn ra noù baèng soá baûng caâu hoûi keøm theoOÂ Display, cho pheùp chuùng ta choïn caùch hieãn thò keátquaû, caùc tham soâ thoáng keâ (Statistic), hoaëc ñoà thò(Plot), SPSS maëc ñònh laø hieãn thò caû haiBieânsoaïn:ÑaøoHoaøiNam 34PhaântíchdöõlieäubaèngSPSSSöû duïng coâng cuï Statistics cho pheùp ta löïa choïn caùcthoáng keâ hieãn thò nhö hoäp thoaïi Hình 6-2: Hình62 - Descriptives: Cho pheùp ta hieãn thò caùc giaù trò thoáng keâ nhö giaù trò trung bình, khoaûng tin caäy, trung vò, trung bình giaõn löôïc, giaù trò nhoû nhaát, lôùn nhaát, khoaûng bieán thieân, caùc baùch phaân vò - Mestimators: Hieãn thò caùc giaù trò trung bình theo 4 loaïi troïng soá - Outliers: Hieãn thò caùc quan saùt coù 5 giaù trò nhoû nhaát vaø 5 giaù trò lôùn nhaát, goïi laø ExtremeValues - Percentiles: Hieån thò caùc giaù trí baùch vò phaânSöû duïng coâng cuï Plots(Hình 6-3), ñeå löïa choïn hieãn thòdaïng ñoà thò (Histogram), bieåu ñoà chænh taéc, caùc pheùpkieåm tra veà phaân phoái chuaån, tính ñoàng ñeàu cuûaphöông sai Hình63Bieânsoaïn:ÑaøoHoaøiNam 35PhaântíchdöõlieäubaèngSPSS - Boxplots: Ñieàu kieän ñeå hieãn thò cuûa Boxplots laø ta phaûi ñang quan saùt nhieàu hôn moät bieán phuï thuoäc (hieãn thò trong oâ dependent list). o Factorlevelstogether ñöa ra moät hieån thò rieâng bieät cho moãi bieán phuï thuoäc. Trong phaïm vi moät hieån thò, Boxplots ñöôïc hieån thò cho moãi moät nhoùm ñöôïc phaân ra theo giaù ...
Nội dung trích xuất từ tài liệu:
Phân tích dữ liệu bằng SPSS - Phần 3PhaântíchdöõlieäubaèngSPSS CHÖÔNG6:XÖÕLYÙVAØPHAÂNTÍCHDÖÕLIEÄU1. Kieåmtradöõlieäu(Explore)Coâng vieäc ñaàu tieân raát quan troïng vaø caàn phaûi thöïchieän moät caùch caån thaän tröôùc khi ñi vaøo caùc böôùcmoâ taû hay caùc phaân tích thoâng keâ phöùc taïp sau naøylaø tieán haønh xem xeùt döõ lieäu moät caùch caån thaän.SPSS cung caáp cho coâng cuï Explore ñeå xem xeùt vaø kieåmtra döõ lieäu: - Phaùt hieän caùc sai soùt - Nhaän daïng döõ lieäu ñeå tìm phöông phaùp phaân tích thích hôïp vaø chuaån bò cho vieäc kieåm tra giaû thuyeátÑeå nhaän daïng vaø phaùt hieän sai soùt trong döõ lieäu, tacoù ba caùch hieãn thò döõ lieäu nhö sau - Bieåu ñoà Histogram - Sô ñoà caønh vaø laù Stem-and-leaf plot - Sô ñoà hoäp BoxplotÑeå öôùc löôïng caùc giaõ ñònh ñöôïc duøng cho vieäc kieåmnghieäm caùc giaû thuyeát, ta duøng caùc pheùp kieåm tra sau: - Kieåm tra levene: Kieåm tra tính ñoàng ñeàu cuûa phöông sai - Kieåm tra K-S Lilliefors: Kieåm tra tính chuaån taéc cuûa toång theå, xem döõ lieäu coù ñöôïc laáy töø moät phaân boá chuaån hay khoângChuùng ta thöôøng duøng giaù trò trung bình soá hoïc ñeå öôùclöôïng ñoä hoäi tuï cuûa döõ lieäu. Tuy nhieân vì giaù trò trungbình bò aûnh höôûng bôûi taát caû caùc giaù trò quan saùt. Ñeågiaûm thieåu nhöõng aûnh höôûng cuûa caùc giaù trò baátthöôøng (quaù lôùn hoaëc quaù beù), ngöôøi ta thöôøng loaïiboû caùc giaù trò lôùn nhaát vaø caùc giaù trò nhoû nhaát(Outliers) theo cuøng moät tyû leä naøo ñoù. Khi ñoù giaù tròtrung bình ñöôïc goïi laø giaù trò trung bình giaõn löôïc(Timmed-mean).Moät caùch laøm khaùc laø gaùn caùc troïng soá khaùc nhaucho caùc giaù trò quan saùt tuøy theo khoaûng caùch cuûa noùñeán giaù trò trung bình, caøng xa troïng soá caøng nhoû. Caùctrong soá naøy goïi laø M-estimators. Coù 4 loaïi troïng soá laøHuber, Turkey, Hampel, vaø Andrew. Döïa vaøo troïng soá naøyta öôùc löôïng laïi giaù trò trung bình cho döõ lieäu.Bieânsoaïn:ÑaøoHoaøiNam 33PhaântíchdöõlieäubaèngSPSSÑeå kieåm tra döõ lieäu, choïn treân menuStatistic/Summarize/Explore… ñeå môû hoäp thoaïi Explorenhö Hình 6-1: Hình61Caùc bieán trong taäp döõ lieäu xuaát hieän trong hoäp beântraùi. Choïn moät hay nhieàu bieán ñöa vaøo oâ Dependentlist, caùc bieán caàn quan saùt seõ ñöôïc lieät keâ rong oânaøy. Chuùng ta cuõng coù theå taùch caùc quan saùt thaønhcaùc nhoùm nhoû rieâng bieät ñeå kieåm tra döïa vaøo caùcgiaù trò cuûa caùc bieán kieåm soaùt seõ ñöôïc ñöa vaøo oâFactorList. Ví duï nhö kieåm tra bieán möùc ñoä ñaùnh giaùnoùi chung döïa vaøo bieán nhaõn hieäu ñang söû duïng. Coùtheå laàn ra caùc quan saùt naøy baèng caùch gaùn nhaõn chonoù baèng gía trò cuûa moät bieán naøo ñoù, bieán naøy seõñöôïc ñöa vaøo trong oâ labelcasesby. Ví duï muoán bieátnhöõng giaù trò di thöôøng trong bieán möùc ñoä ñaùnh giaùnoùi chung theo nhaõn hieäu TV ñang duøng. Ta gaùn nhaõncho caùc quan saùt naøy baèng caùc giaù trò trong bieán soábaûng caâu hoûi. Luùc naøy neáu coù caùc giaù trò dò thöôøngta deã daøng laàn ra noù baèng soá baûng caâu hoûi keøm theoOÂ Display, cho pheùp chuùng ta choïn caùch hieãn thò keátquaû, caùc tham soâ thoáng keâ (Statistic), hoaëc ñoà thò(Plot), SPSS maëc ñònh laø hieãn thò caû haiBieânsoaïn:ÑaøoHoaøiNam 34PhaântíchdöõlieäubaèngSPSSSöû duïng coâng cuï Statistics cho pheùp ta löïa choïn caùcthoáng keâ hieãn thò nhö hoäp thoaïi Hình 6-2: Hình62 - Descriptives: Cho pheùp ta hieãn thò caùc giaù trò thoáng keâ nhö giaù trò trung bình, khoaûng tin caäy, trung vò, trung bình giaõn löôïc, giaù trò nhoû nhaát, lôùn nhaát, khoaûng bieán thieân, caùc baùch phaân vò - Mestimators: Hieãn thò caùc giaù trò trung bình theo 4 loaïi troïng soá - Outliers: Hieãn thò caùc quan saùt coù 5 giaù trò nhoû nhaát vaø 5 giaù trò lôùn nhaát, goïi laø ExtremeValues - Percentiles: Hieån thò caùc giaù trí baùch vò phaânSöû duïng coâng cuï Plots(Hình 6-3), ñeå löïa choïn hieãn thòdaïng ñoà thò (Histogram), bieåu ñoà chænh taéc, caùc pheùpkieåm tra veà phaân phoái chuaån, tính ñoàng ñeàu cuûaphöông sai Hình63Bieânsoaïn:ÑaøoHoaøiNam 35PhaântíchdöõlieäubaèngSPSS - Boxplots: Ñieàu kieän ñeå hieãn thò cuûa Boxplots laø ta phaûi ñang quan saùt nhieàu hôn moät bieán phuï thuoäc (hieãn thò trong oâ dependent list). o Factorlevelstogether ñöa ra moät hieån thò rieâng bieät cho moãi bieán phuï thuoäc. Trong phaïm vi moät hieån thò, Boxplots ñöôïc hieån thò cho moãi moät nhoùm ñöôïc phaân ra theo giaù ...
Tìm kiếm theo từ khóa liên quan:
quy trình xử lý thông tin lý thuyết thống kê phân tích thông tin phân tích dữ liệu thao tác trênGợi ý tài liệu liên quan:
-
Tiểu luận học phần Nguyên lý thống kê kinh tế
20 trang 306 0 0 -
21 trang 131 0 0
-
Lợi ích và thách thức ứng dụng phân tích dữ liệu và dữ liệu lớn trong kiểm toán báo cáo tài chính
8 trang 127 0 0 -
Giáo trình về phân tích thiết kế hệ thống thông tin
113 trang 112 0 0 -
Mô hình Dea Metafrontier và việc so sánh hiệu quả theo vùng của các trường đại học của Việt Nam
6 trang 81 0 0 -
Phát triển Java 2.0: Phân tích dữ liệu lớn bằng MapReduce của Hadoop
12 trang 69 0 0 -
Bài giảng Kỹ thuật xử lý và phân tích số liệu định lượng - ThS, Nguyễn Ngọc Anh
10 trang 66 0 0 -
Phân tích dữ liệu bằng SPSS - Phần 2
15 trang 59 0 0 -
Giáo trình Lý thuyết thống kê: Phần 1
238 trang 40 0 0 -
Bài giảng Các đặc trưng đo lường độ tập trung & độ phân tán các đặc trưng đo lường độ tập trung
31 trang 40 0 0