Nhóm Thạc Sỹ QTKD ĐH Bách Khoa HCM giới thiệu Cách phân tích nhân tố khám phá EFA bằng Stata (thực hành+đọc kết quả)
Lý thuyết
Trước khi kiểm định lý thuyết khoa học thì cần phải đánh giá độ tin cậy và giá trị của thang đo. Phương pháp Cronbach Alpha dùng để đánh giá độ tin cậy của thang đo. Còn phương pháp phân tích nhân tố khám phá EFA (Exploratory Factor Analysis, gọi tắt là phương pháp EFA) giúp chúng ta đánh giá hai loại giá trị quan trọng của thang đo là giá trị hội tụ và giá trị phân biệt.
Phương pháp phân tích nhân tố EFA thuộc nhóm phân tích đa biến phụ thuộc lẫn nhau (interdependence techniques), nghĩa là không có biến phụ thuộc và biến độc lập mà nó dựa vào mối tương quan giữa các biến với nhau (interrelationships). EFA dùng để rút gọn một tập k biến quan sát thành một tập F (F<k) các nhân tố có ý nghĩa hơn. Cơ sở của việc rút gọn này dựa vào mối quan hệ tuyến tính của các nhân tố với các biến nguyên thủy (biến quan sát).
Các tác giả Mayers, L.S., Gamst, G., Guarino A.J. (2000) đề cập rằng: Trong phân tích nhân tố, phương pháp trích Pricipal Components Analysis đi cùng với phép xoay Varimax là cách thức được sử dụng phổ biến nhất.
Theo Hair & ctg (1998, 111), Factor loading (hệ số tải nhân tố hay trọng số nhân tố) là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA:
• Factor loading > 0.3 được xem là đạt mức tối thiểu
• Factor loading > 0.4 được xem là quan trọng
• Factor loading > 0.5 được xem là có ý nghĩa thực tiễn
Điều kiện để phân tích nhân tố khám phá là phải thỏa mãn các yêu cầu:
Hệ số tải nhân tố (Factor loading ) > 0.5
0.5 ≤ KMO ≤ 1: Hệ số KMO (Kaiser-Meyer-Olkin) là chỉ số được dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số KMO lớn có ý nghĩa phân tích nhân tố là thích hợp.
Kiểm định Bartlett có ý nghĩa thống kê (Sig. < 0.05): Đây là một đại lượng thống kê dùng để xem xét giả thuyết các biến không có tương quan trong tổng thể. Nếu kiểm định này có ý nghĩa thống kê (Sig. < 0.05) thì các biến quan sát có mối tương quan với nhau trong tổng thể.
Phần trăm phương sai toàn bộ (Percentage of variance) > 50%: Thể hiện phần trăm biến thiên của các biến quan sát. Nghĩa là xem biến thiên là 100% thì giá trị này cho biết phân tích nhân tố giải thích được bao nhiêu %.
Thực hành chạy phân tích EFA trong Stata
Đầu tiên, các bạn đưa bật Stata lên, đưa file dữ liệu vào và vào menu này để bật lên màn hình phân tích nhân tố: Statistics > Multivariate analysis > Factor and principal component analysis > Factor analysis
Ở đây ta có 6 nhân tố cần đưa vào phân tích EFA với các biến như sau: TINCAY1 TINCAY2 TINCAY3 TINCAY4 DAPUNG1 DAPUNG2 DAPUNG3 DAPUNG4 DAPUNG5 DAPUNG6 DAMBAO1 DAMBAO2 DAMBAO3 DAMBAO4 CAMTHONG1 CAMTHONG2 CAMTHONG3 HUUHINH1 HUUHINH2 HUUHINH3 MINHBACH1 MINHBACH2 MINHBACH3 MINHBACH4
Ta đưa hết các biến này vào ô variables như trong hình.
Tiếp tục nhấn vào tab model 2 để chọn loại phân tích Principal-Component Factor,đồng thời chọn mục Minimum Value of Eigenvalues to be retained, gõ vào số 1
Điều này có nghĩa là nhân tố nào có eigenvalue lớn hơn 1 mới được giữ lại, sau đó nhấn OK, kết quả ra như sau:
Đọc kết quả
Cột Eigenvalues , dòng thứ 6 màu xanh là giá trị Eigenvalues bé nhất mà lớn hơn 1,có nghĩa là có 6 nhân tố được tạo ra( do ngưỡng Eigenvalues >1)
Cột Cumulative dòng thứ 6, ô màu đỏ giá trị là 0.7246, đó là giá trị tổng phương sai trích,ý nghĩalà 6 nhân tố này này giải thích 72.46% biến thiên của dữ liệu.
Tiếp theo ta sẽ tìm ma trận xoay để xem 6 nhân tố này, mỗi nhân tố gồm những câu hỏi nào nhé. Nhấn vào menu sau: Statistics > Multivariate analysis > Factor and principal component analysis > Postestimation > Rotate loadings,chọn varimax( default) và check vào Apply Kaiser normalization như hình dưới
Tiếp theo nhấn vào tab report , chọn Display loading as blank when |loading|< #, nhập vào giá trị 0.3, mục đích là trong bảng ma trận xoay không hiện thị các fatorloading bé hơn 0.3 để dễ nhìn.
Sau đó nhấn OK, sẽ ra được ma trận xoay với hệ số tải như sau
Để hiển thị chỉ số KMO, dùng lệnh "estat kmo, novar" khi đó màn hình hiện ra chỉ số KMO như sau:
Kaiser-Meyer-Olkin measure of sampling adequacy (overall) = 0.8114
Kết quả phân tích nhân tố cho thấy chỉ số KMO là 0.8114> 0.5, điều này chứng tỏ dữ liệu dùng để phân tích nhân tố là hoàn toàn thích hợp.
Ngoài ra còn một kiểm định nữa là kiểm định Bartlett's Test of Sphericity, để thực hiện ta dùng lệnh factortest sau:
factortest TINCAY1 TINCAY2 TINCAY3 TINCAY4 DAPUNG1 DAPUNG2 DAPUNG3 DAPUNG4 DAPUNG5 DAPUNG6 DAMBAO1 DAMBAO2 DAMBAO3
> DAMBAO4 CAMTHONG1 CAMTHONG2 CAMTHONG3 HUUHINH1 HUUHINH2 HUUHINH3 MINHBACH1 MINHBACH2 MINHBACH3 MINHBACH4
(Lưu ý cần cài thêm gói factortest nhé)
Kết quả hiển thị
Determinant of the correlation matrix
Det = 0.000
Bartlett test of sphericity
Chi-square = 3219.986
Degrees of freedom = 276
p-value = 0.000
H0: variables are not intercorrelated
Kaiser-Meyer-Olkin Measure of Sampling Adequacy
KMO = 0.811
Kết quả kiểm định Barlett’s là 3219.986 với mức ý nghĩa (p_value) sig = 0.000 < 0.05,( bác bỏ giả thuyết H0: các biến quan sát không có tương quan với nhau trong tổng thể) như vậy giả thuyết về ma trận tương quan giữa các biến là ma trận đồng nhất bị bác bỏ, tức là các biến có tương quan với nhau và thỏa điều kiện phân tích nhân tố.
Sau đây là video thực hành phân tích chạy EFA và đọc kết quả phân tích nhân tố với phần mềm Stata
Như vậy, nhóm vừa giới thiệu đến các bạn cách chạy EFA và đọc kết quả với phần mềm Stata. Nếu các bạn chạy ra kết quả xấu, hoặc chưa biết rõ nội dung ý nghĩa, cần khảo sát chỉnh sửa số liệu nghiên cứu , các bạn liên hệ nhóm ở đây nhé https://phantichstata.com/lien-he-gioi-thieu
Liên hệ nhóm ở đây ngay https://phantichstata.com/lien-he-gioi-thieu để được:
– Xử lý/ hiệu chỉnh số liệu khảo sát để chạy ra kết quả phân tích nhân tố hội tụ,phân tích hồi quy hồi quy có ý nghĩa thống kê.
– Tư vấn mô hình/bảng câu hỏi/ traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha… trong Stata