Bài giảng Tương quan và hồi qui tuyến tính
Số trang: 15
Loại file: pdf
Dung lượng: 282.93 KB
Lượt xem: 18
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu của phân tích tương quan là đo lường cường độ của mối quan hệ giữa hai biến và . Trong phân tích tương quan, X và Y được xem là hai biến ngẫu nhiên “ngang nhau” – không phân biệt biến độc lập và biến phụ thuộc. Tương quan tuyến tính giữa hai biến và là khái niệm thể hiện mức độ của mối liên hệ tuyến tính giữa 2 biến.
Nội dung trích xuất từ tài liệu:
Bài giảng Tương quan và hồi qui tuyến tính Chương 8 TƯƠNG QUAN VÀ HỒI QUI TUYẾN TÍNHI- Tương quan tuyến tính:Khi phân tích mối liên hệ giữa 2 biến định lượngngoài các phương pháp như dùng đồ thị, mã hóathành biến định tính thì chúng ta có thể dùng phântích tương quan; trong phạm vi môn học chúng ta chỉphân tích tương quan tuyến tính.Mục tiêu của phân tích tương quan là đo lườngcường độ của mối quan hệ giữa hai biến và .Trong phân tích tương quan, X và Y được xem là haibiến ngẫu nhiên “ngang nhau” – không phân biệtbiến độc lập và biến phụ thuộc. Tương quan tuyếntính giữa hai biến và là khái niệm thể hiện mức độcủa mối liên hệ tuyến tính giữa 2 biến.Ví dụ: Một công trình nghiên cứu cho thấy giữa tuổi củangười mẹ và lượng sữa có một mối liên quan theo chiềuhướng nghịch, nghĩa là người mẹ nhiều tuổi sẽ ít sữahơn người mẹ còn trẻ. Số liệu thu thập như sau: ( yTuổi (x)) SữaSTT 1 2 3 4 5 6 7 8Tuổi 21 24 27 30 33 36 39 42(X)Sữa 105 110 105 90 95 90 85 80( Y) Hệ số tương quan đơn (r)• Hệ số tương quan tích mômen chéo Pearson ký hiệu là r:• Dùng để lượng hóa mức độ chặt chẽ mối liên hệ tuyến tính của 2 biến định lượng ( tức là 2 biến cùng biến động theo một cách nào đó, dùng thang đo Scale)• Hệ số tương quan hạng chạy từ: -1 Hệ số tương quang hạng (Spearman):Hệ số tương quan đơn chỉ phù hợp dữ liệu thu thậpở thang đo Scale, khi giá trị cụ thể của 2 biến X, Ykhông đo lường chính xác mà chỉ xếp theo hạng, khiđo ta dùng hệ số tương quan hạng để đo lương mốitương quanví dụ: Ứng viên Xếp hạng của Chuyên gia 1 Chuyên gia 2 A 1 3 B 2 1 C 3 4 1.2 Kiểm định giả thuyết về hệ số tương quan• Có thể hệ số tương quan tính được ở tập mẫu rất cao, nhưng chưa chắc đã tồn tại mối tương quan đó trong tổng thể, vì vậy ta phải kiểm định hệ số tương quan trước khi dùng để xem xét tương quan tổng thể.• Chúng ta phát biểu giả thuyết H0 là: không có mối tương quan giữa 2 biến trong tổng thể.• Trong SPSS, bạn có thể yêu cầu kiểm định hai phía các hệ số ở mức ý nghĩa nhỏ hơn 0.05 (phân biệt bằng một dấu sao *) và ở mức ý nghĩa nhỏ hơn 0.01 (phân biệt bằng hai dấu sao **). Từ bảng tính hệ số tương quan, ta có thể thấy xác suất hệ số tương quan tính được ít nhất là ; trong khi không có mối liên hệ tuyến tính nào trong tổng thể giữa tuổi người mẹ và lượng sữa lớn hơn 0.01. Như vậy nếu sử dụng mức ý nghĩa 5% hay 1% (xác suất chấp nhận giả thuyết sai là 5% hay 1%) thì giả thuyết hệ số tương quan của tổng thể bằng 0 được chấp nhận.Thực hiện đo lường tương quan tuyến tính trên SPSSChọn hai hay nhiều biến để phân tích Hệ số tương quan Kiểm định mức ý nghĩa Các tùy chọn tương quan hai biến Giải thích từCorrelation Coefficients (hệ số tương quan): bạn phải chọn ít nhất là một loại hệ số trong các loại hệ số sau:• Pearson: hệ số này là mặc định. Bảng kết quả sẽ thể hiện một ma trận vuông gồm các hệ số tương quan. Tương quan của một biến nào đó với chính nó sẽ có hệ số tương quan là 1 và bạn có thể thấy chúng trên đường chéo của ma trận. Mỗi biến sẽ xuất hiện hai lần trong ma trận với hệ số tương quan y hệt nhau trong hai tam giác trên và dưới đối xứng nhau qua đường chéo của ma trận.• Kendall’s tau-b: là một loại hệ số tương quan hạng. Khi chọn loại tương quan này SPSS sẽ thể hiện tương quan giữa mỗi biến với tất cả các biến khác trong tam giác phía dưới đường chéo của ma trận hệ số tương quan.• Spearman: Spearman là một loại hệ số tương quan hạng và nó sẽ được thể hiện trong phần tam giác phía dưới của ma trận hệ số.• Test of significance (kiểm định mức ý nghĩa). Có hai lựa chọn sau:• Two-tail (kiểm định hai phía). Loại kiểm định này được sử dụng trong trường hợp chiều hướng của mối liên hệ không thể xác định trước được.• One-tail (kiểm định một phía). Loại kiểm định này được sử dụng khi xác định chiều hướng của mối liên hệ giữa hai biến. II- Hồi qui tuyến tính• Mục tiêu của phân tích hồi quy là mô hình hóa mối liên hệ, nghĩa là từ các dữ liệu mẫu thu thập được, cố gắng xây dựng mô hình toán học nhằm thể hiện một cách tốt nhất mối liên hệ giữa hai biến và .• Ví dụ: Bởi vì lượng sữa có xu hướng giảm tuyến tính so với tuổi của người mẹ, ta có thể sử dụng phương trình đường thẳng để mô tả mối liên hệ. Phương trình của đường thẳng là:• lượng sữa của người mẹ =B0 + B1 *(tuổi của người mẹ)• Độ dốc B1là tăng giảm của lượng ...
Nội dung trích xuất từ tài liệu:
Bài giảng Tương quan và hồi qui tuyến tính Chương 8 TƯƠNG QUAN VÀ HỒI QUI TUYẾN TÍNHI- Tương quan tuyến tính:Khi phân tích mối liên hệ giữa 2 biến định lượngngoài các phương pháp như dùng đồ thị, mã hóathành biến định tính thì chúng ta có thể dùng phântích tương quan; trong phạm vi môn học chúng ta chỉphân tích tương quan tuyến tính.Mục tiêu của phân tích tương quan là đo lườngcường độ của mối quan hệ giữa hai biến và .Trong phân tích tương quan, X và Y được xem là haibiến ngẫu nhiên “ngang nhau” – không phân biệtbiến độc lập và biến phụ thuộc. Tương quan tuyếntính giữa hai biến và là khái niệm thể hiện mức độcủa mối liên hệ tuyến tính giữa 2 biến.Ví dụ: Một công trình nghiên cứu cho thấy giữa tuổi củangười mẹ và lượng sữa có một mối liên quan theo chiềuhướng nghịch, nghĩa là người mẹ nhiều tuổi sẽ ít sữahơn người mẹ còn trẻ. Số liệu thu thập như sau: ( yTuổi (x)) SữaSTT 1 2 3 4 5 6 7 8Tuổi 21 24 27 30 33 36 39 42(X)Sữa 105 110 105 90 95 90 85 80( Y) Hệ số tương quan đơn (r)• Hệ số tương quan tích mômen chéo Pearson ký hiệu là r:• Dùng để lượng hóa mức độ chặt chẽ mối liên hệ tuyến tính của 2 biến định lượng ( tức là 2 biến cùng biến động theo một cách nào đó, dùng thang đo Scale)• Hệ số tương quan hạng chạy từ: -1 Hệ số tương quang hạng (Spearman):Hệ số tương quan đơn chỉ phù hợp dữ liệu thu thậpở thang đo Scale, khi giá trị cụ thể của 2 biến X, Ykhông đo lường chính xác mà chỉ xếp theo hạng, khiđo ta dùng hệ số tương quan hạng để đo lương mốitương quanví dụ: Ứng viên Xếp hạng của Chuyên gia 1 Chuyên gia 2 A 1 3 B 2 1 C 3 4 1.2 Kiểm định giả thuyết về hệ số tương quan• Có thể hệ số tương quan tính được ở tập mẫu rất cao, nhưng chưa chắc đã tồn tại mối tương quan đó trong tổng thể, vì vậy ta phải kiểm định hệ số tương quan trước khi dùng để xem xét tương quan tổng thể.• Chúng ta phát biểu giả thuyết H0 là: không có mối tương quan giữa 2 biến trong tổng thể.• Trong SPSS, bạn có thể yêu cầu kiểm định hai phía các hệ số ở mức ý nghĩa nhỏ hơn 0.05 (phân biệt bằng một dấu sao *) và ở mức ý nghĩa nhỏ hơn 0.01 (phân biệt bằng hai dấu sao **). Từ bảng tính hệ số tương quan, ta có thể thấy xác suất hệ số tương quan tính được ít nhất là ; trong khi không có mối liên hệ tuyến tính nào trong tổng thể giữa tuổi người mẹ và lượng sữa lớn hơn 0.01. Như vậy nếu sử dụng mức ý nghĩa 5% hay 1% (xác suất chấp nhận giả thuyết sai là 5% hay 1%) thì giả thuyết hệ số tương quan của tổng thể bằng 0 được chấp nhận.Thực hiện đo lường tương quan tuyến tính trên SPSSChọn hai hay nhiều biến để phân tích Hệ số tương quan Kiểm định mức ý nghĩa Các tùy chọn tương quan hai biến Giải thích từCorrelation Coefficients (hệ số tương quan): bạn phải chọn ít nhất là một loại hệ số trong các loại hệ số sau:• Pearson: hệ số này là mặc định. Bảng kết quả sẽ thể hiện một ma trận vuông gồm các hệ số tương quan. Tương quan của một biến nào đó với chính nó sẽ có hệ số tương quan là 1 và bạn có thể thấy chúng trên đường chéo của ma trận. Mỗi biến sẽ xuất hiện hai lần trong ma trận với hệ số tương quan y hệt nhau trong hai tam giác trên và dưới đối xứng nhau qua đường chéo của ma trận.• Kendall’s tau-b: là một loại hệ số tương quan hạng. Khi chọn loại tương quan này SPSS sẽ thể hiện tương quan giữa mỗi biến với tất cả các biến khác trong tam giác phía dưới đường chéo của ma trận hệ số tương quan.• Spearman: Spearman là một loại hệ số tương quan hạng và nó sẽ được thể hiện trong phần tam giác phía dưới của ma trận hệ số.• Test of significance (kiểm định mức ý nghĩa). Có hai lựa chọn sau:• Two-tail (kiểm định hai phía). Loại kiểm định này được sử dụng trong trường hợp chiều hướng của mối liên hệ không thể xác định trước được.• One-tail (kiểm định một phía). Loại kiểm định này được sử dụng khi xác định chiều hướng của mối liên hệ giữa hai biến. II- Hồi qui tuyến tính• Mục tiêu của phân tích hồi quy là mô hình hóa mối liên hệ, nghĩa là từ các dữ liệu mẫu thu thập được, cố gắng xây dựng mô hình toán học nhằm thể hiện một cách tốt nhất mối liên hệ giữa hai biến và .• Ví dụ: Bởi vì lượng sữa có xu hướng giảm tuyến tính so với tuổi của người mẹ, ta có thể sử dụng phương trình đường thẳng để mô tả mối liên hệ. Phương trình của đường thẳng là:• lượng sữa của người mẹ =B0 + B1 *(tuổi của người mẹ)• Độ dốc B1là tăng giảm của lượng ...
Tìm kiếm theo từ khóa liên quan:
Nguyên lý thống kê Kinh tế lượng Hồi qui tuyến tính Tổng quan phần mềm SPSS Dữ liệu phần mềm SPSS Phân tích dữ liệuGợi ý tài liệu liên quan:
-
Tiểu luận học phần Nguyên lý thống kê kinh tế
20 trang 306 0 0 -
38 trang 233 0 0
-
Lợi ích và thách thức ứng dụng phân tích dữ liệu và dữ liệu lớn trong kiểm toán báo cáo tài chính
8 trang 127 0 0 -
32 trang 107 0 0
-
150 Câu trắc nghiệm nguyên lý thống kê
20 trang 96 0 0 -
Mô hình Dea Metafrontier và việc so sánh hiệu quả theo vùng của các trường đại học của Việt Nam
6 trang 82 0 0 -
Phát triển Java 2.0: Phân tích dữ liệu lớn bằng MapReduce của Hadoop
12 trang 70 0 0 -
Đề thi Nguyên lý thống kê (Mã đề 153)
5 trang 65 0 0 -
Giáo trình Nguyên lý thống kê kinh tế - TS. Mai Văn Nam
135 trang 59 0 0 -
Phân tích dữ liệu bằng SPSS - Phần 2
15 trang 59 0 0