Stata – Thực hành tính hệ số tương quan Pearson

Hôm nay nhóm MBA bàn về hệ số tương quan r trong Stata và cách thực hiện phân tích tương quan cho từng cặp biến trong Stata.

Lý Thuyết tương quan Pearson:

-Hệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tương quan giữa hai biến số, như giữa MỨC ĐỘ HÀI LÒNG (y) và TIỀN LƯƠNG (x).  Hệ số tương quan có giá trị từ -1 đến 1.  Hệ số tương quan bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau; ngược lại nếu hệ số bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối.  Nếu giá trị của hệ số tương quan là âm (r <0) có nghĩa là khi x tăng cao thì y giảm (và ngược lại, khi x giảm thì y tăng); nếu giá trị hệ số tương quan là dương (r > 0) có nghĩa là khi x tăng cao thì y cũng tăng, và khi x tăng cao thì y cũng giảm theo.
-Có nhiều hệ số tương quan , hệ số tương quan thông dụng nhất: hệ số tương quan Pearson r, được định nghĩa như sau

Cho hai biến số x và y  từ n mẫu, hệ số tương quan Pearson được ước tính bằng công thức sau đây:

Trong phân tích áp dụng cho luận văn, kiểm định hệ số tương quan Pearson  dùng để kiểm tra mối liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc. Nếu các biến độc lập với nhau có tương quan chặt thì phải lưu ý đến vấn đề đa cộng tuyến khi phân tích hồi quy (giả thuyết H0: hệ số tương quan bằng 0). Cụ thể cách chạy như sau:

Thực hành tính hệ số tương quan trong Stata

Vào menu Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Pairwise correlations

 

Bảng sau hiện ra:

 

Chọn các độc lập và phụ thuộc đưa vào ô Variales, đồng thời check vào ô Print Significance level for each entry, sau đó nhấn OK, kết quả phân tích tương quan như sau:

pwcorr TINCAY DAPUNG DAMBAO CAMTHONG HUUHINH MINHBACH HAILONG, sig

Giải thích ý nghĩa: ví dụ ta xem xét ô màu đỏ và màu xanh. Đó là giá trị tương quan giữa biến HAILONG và biến TINCAY.

– Ô màu đỏ giá trị là 0.5639 , đó là hệ số tương quan Pearson giữa biến HAILONG và TINCAY.

-Ô màu xanh: là mức ý nghĩa tương quan significant của kiểm định Pearson. Giả thuyết H0: hệ số tương quan bằng 0. Do đó nếu Sig. này bé hơn 5% ta có thể kết luận được là hai biến có tương quan với nhau. Hệ số tương quan càng lớn tương quan càng chặt. nếu Sig. này lớn hơn 5% thì hai biến không có tương quan với nhau.

-Vì một trong những điều kiện cần để phân tích hồi quy là biến độc lập phải có tương quan với biến phụ thuộc, nên nếu ở bước phân tích tương quan này biến độc lập không có tương quan với biến phụ thuộc thì ta loại biến độc lập này ra khỏi phân tích hồi quy.

-Kết quả phân tích tương quan Pearson cho thấy một số biến độc lập có sự tương quan với nhau(sig<5%). Do đó khi phân tích hồi quy cần phải chú ý đến vấn đề đa cộng tuyến. Các biến độc lập có tương quan với biến phụ thuộc và do đó sẽ được đưa vào mô hình để giải thích cho biến phụ thuộc.

Trên đây là các bước thực hành phân tích tương quan pearson bằng Stata, các bạn chạy ra có lỗi hoặc vướng mắc cần hỗ trợ cứ liên hệ nhóm MBA Hỗ Trợ Stata ĐH Bách Khoa Tp.HCM nhé.

Sau đây là video thực hành phân tích tính giá trị tương quan pearson bằng phần mềm Stata

Comments