1. Giới thiệu về mô hình tác động ngẫu nhiên (RE)
Mô hình tác động ngẫu nhiên (Random Effects – RE) là một trong hai mô hình phổ biến được sử dụng trong phân tích dữ liệu bảng (panel data), bên cạnh mô hình tác động cố định (Fixed Effects – FE).
Khi nào sử dụng mô hình Random Effects?
- Khi các yếu tố không quan sát được không có tương quan với các biến độc lập trong mô hình.
- Khi muốn khai thác cả sự thay đổi giữa các cá thể và theo thời gian.
- Khi số lượng cá thể lớn và số lần quan sát ít (N lớn, T nhỏ).
- Khi muốn đưa vào mô hình các biến không thay đổi theo thời gian (vd: giới tính, địa lý, ngành nghề…).
Ngược lại, nếu các yếu tố không quan sát có tương quan với biến độc lập, mô hình RE sẽ cho ước lượng bị chệch. Khi đó, mô hình Fixed Effects (FE) sẽ phù hợp hơn.
2. Đặc điểm của mô hình Random Effects (RE)
Mô hình RE giả định các yếu tố không quan sát là một biến ngẫu nhiên, không có tương quan với các biến độc lập.
Hồi quy sử dụng phương pháp Generalized Least Squares (GLS) thay vì Ordinary Least Squares (OLS).
3. Cách chạy mô hình Random Effects trong Stata
3.1. Kiểm tra dữ liệu bảng
Trước khi chạy mô hình, cần kiểm tra xem dữ liệu có đúng dạng bảng hay không:
xtset id time
id: Biến định danh cá thể (vd: mã doanh nghiệp, mã quốc gia…).
time: Biến thời gian (vd: năm, quý, tháng…).
Stata sẽ hiển thị thông tin về dữ liệu bảng, bao gồm số cá thể và số giai đoạn thời gian.
3.2. Chạy mô hình Random Effects
Lệnh cơ bản để chạy mô hình tác động ngẫu nhiên trong Stata là:
xtreg y x1 x2 x3, re
y: Biến phụ thuộc.
x1, x2, x3: Các biến độc lập.
re: Tùy chọn để chạy mô hình Random Effects.
3.3. Kiểm định Hausman để lựa chọn giữa FE và RE
Nếu không chắc chắn nên dùng mô hình Fixed Effects (FE) hay Random Effects (RE), ta có thể sử dụng kiểm định Hausman.
hausman fe re
Nếu p-value < 0.05: Bác bỏ mô hình RE, chọn mô hình FE.
Nếu p-value > 0.05: Không có đủ bằng chứng bác bỏ mô hình RE, có thể sử dụng mô hình RE.
Ở đây p=0.7842 nên ta sử dụng mô hình RE
3.4. Kiểm tra phương sai sai số thay đổi trong mô hình RE
Nếu nghi ngờ có phương sai sai số thay đổi (heteroskedasticity), có thể kiểm tra bằng lệnh:
xttest0
Nếu có phương sai thay đổi, nên sử dụng sai số chuẩn hiệu chỉnh (robust standard errors) để có ước lượng đáng tin cậy:
xtreg y x1 x2 x3, re vce(robust)
Hoặc cách thông dụng hơn là sử dụng GLS để khắc phục
4. Ví dụ minh họa trong Stata
4.1. Dữ liệu giả định
Giả sử chúng ta có dữ liệu về mức lương của nhân viên trong nhiều công ty khác nhau qua nhiều năm.
| ID (Nhân viên) | Năm | Lương ($) | Kinh nghiệm | Trình độ | Giới tính |
|---|---|---|---|---|---|
| 1 | 2019 | 5000 | 5 | Đại học | Nam |
| 1 | 2020 | 5500 | 6 | Đại học | Nam |
| 2 | 2019 | 4800 | 4 | Cao đẳng | Nữ |
| 2 | 2020 | 5200 | 5 | Cao đẳng | Nữ |
4.2. Chạy mô hình RE trong Stata
xtset ID Nam
xtreg Luong KinhNghiem TrinhDo GioiTinh, re
Giải thích:
xtset ID Nam: Định dạng dữ liệu bảng.
xtreg Luong KinhNghiem TrinhDo GioiTinh, re: Chạy mô hình RE.
Stata sẽ hiển thị kết quả hồi quy, trong đó các hệ số phản ánh tác động trung bình của từng biến lên mức lương.
4.3. Kiểm định Hausman để chọn giữa FE và RE
xtreg Luong KinhNghiem TrinhDo GioiTinh, fe
estimates store fe
xtreg Luong KinhNghiem TrinhDo GioiTinh, re
estimates store re
hausman fe re
Nếu p-value nhỏ hơn 0.05, ta sử dụng mô hình FE. Nếu lớn hơn 0.05, ta có thể sử dụng mô hình RE.
5. Kết luận
Mô hình tác động ngẫu nhiên (RE) phù hợp khi các yếu tố không quan sát không có tương quan với biến độc lập.
RE cho phép ước lượng hiệu quả hơn khi dữ liệu có nhiều cá thể nhưng ít giai đoạn thời gian.
Kiểm định Hausman giúp xác định mô hình nào phù hợp hơn giữa FE và RE.
Khi có phương sai thay đổi, cần dùng sai số chuẩn hiệu chỉnh (vce(robust)) hoặc GLS
Mô hình Random Effects là một công cụ quan trọng trong phân tích dữ liệu bảng, đặc biệt khi nghiên cứu các dữ liệu kinh tế, tài chính, lao động, và nhiều lĩnh vực khác.
Nếu bạn cần tư vấn hoặc hỗ trợ về phân tích dữ liệu bằng Stata, đừng ngần ngại liên hệ với chúng tôi, nhóm MBA Bách Khoa qua các kênh sau:
-Zalo 0903396688
-Facebook facebook.com/hotroStata