So sánh Fixed Effects và Random Effects trong dữ liệu bảng – Khi nào nên chọn mô hình nào?

1. Giới thiệu về dữ liệu bảng (Panel Data)

Dữ liệu bảng (panel data) kết hợp dữ liệu chuỗi thời gian và dữ liệu chéo, ghi nhận sự thay đổi theo thời gian của các đối tượng khác nhau. Dữ liệu này thường được sử dụng trong các lĩnh vực như kinh tế, tài chính, xã hội học, và y tế.

So với dữ liệu chéo hoặc chuỗi thời gian đơn thuần, dữ liệu bảng mang lại nhiều lợi ích:

  • Giảm phương sai sai số do có nhiều quan sát hơn.
  • Cho phép kiểm soát tác động cá nhân không quan sát được.
  • Phát hiện các hiệu ứng động như quán tính hoặc tác động trễ của biến số.

2. Mô hình Fixed Effects (FE) và Random Effects (RE)

Mô hình hiệu ứng cố định Fixed Effects (FE)

Khi nào nên sử dụng mô hình hiệu ứng cố định

  • Khi ta nghi ngờ các đặc điểm riêng của đối tượng (đơn vị quan sát) có thể ảnh hưởng đến biến phụ thuộc.
  • Khi ta muốn loại bỏ ảnh hưởng của các đặc điểm bên trong mỗi đối tượng, giúp kiểm soát những yếu tố không thay đổi theo thời gian.
  • Khi dữ liệu có số lượng đối tượng quan sát nhiều và thời gian theo dõi dài.

Mô hình Fixed Effects giúp kiểm soát những đặc điểm không đo lường được của từng cá nhân, từ đó tránh được sự thiên lệch.

Mô hình hiệu ứng ngẫu nhiên Random Effects (RE)

Khi nào nên sử dụng mô hình hiệu ứng ngẫu nhiên

  • Khi các đặc điểm riêng của đối tượng không tương quan với biến độc lập.
  • Khi muốn sử dụng thêm thông tin từ các biến bên trong đối tượng và không muốn mất đi sự biến thiên giữa các cá nhân.
  • Khi dữ liệu có nhiều đối tượng quan sát nhưng số kỳ quan sát ngắn.

Mô hình Random Effects phù hợp khi hiệu ứng cá nhân không liên quan đến các biến độc lập, cho phép ước lượng hiệu quả hơn trong một số trường hợp.

3. Kiểm định Hausman – Cách chọn giữa FE và RE

Để quyết định chọn mô hình FE hay RE, ta sử dụng kiểm định Hausman:

Nếu giá trị p-value < 0.05, ta chọn Fixed Effects.

Nếu giá trị p-value > 0.05, ta chọn Random Effects.

Kiểm định này giúp kiểm tra xem hiệu ứng cá nhân có tương quan với biến độc lập hay không. Nếu có, mô hình RE sẽ cho kết quả thiên lệch và ta cần sử dụng FE.

Cách chạy kiểm định Hausman trong Stata

xtreg Y X, fe

estimates store fixed

xtreg Y X, re

estimates store random

hausman fixed random

Sau khi chạy lệnh trên, Stata sẽ trả về giá trị p-value giúp quyết định mô hình phù hợp.

4. Ví dụ thực tế

Bước 1: Nhập dữ liệu

Giả sử ta có tập dữ liệu về tăng trưởng sản xuất kinh doanh của doanh nghiệp theo thời gian.  https://phantichstata.com/filedownload/0903396688.dta

Tải file này về và sử dụng mở lên như sau

use  0903396688.dta, clear

Bước 2: Chạy mô hình FE

xtreg   PE EG DPO , fe
estimates store fixed

Lệnh này giúp kiểm tra tác động của EG và DPO lên PE bằng mô hình Fixed Effects.

Bước 3: Chạy mô hình RE

xtreg   PE EG DPO , re
estimates store random

Tương tự như trên nhưng sử dụng Random Effects.

Bước 4: Kiểm định Hausman

hausman fixed random

Dựa vào giá trị p-value, ta chọn mô hình phù hợp. Trong ví dụ ở đây giá trị này >5% nên ta chọn mô hình hiệu ứng ngẫu nhiên.

5. Kết luận so sánh Fixed Effects và Random Effects

Bài viết đã giúp bạn hiểu rõ hơn về mô hình Fixed Effects và Random Effects trong dữ liệu bảng. Việc lựa chọn giữa FE và RE phụ thuộc vào mức độ tương quan giữa hiệu ứng cá nhân và biến độc lập. Nếu có sự tương quan, FE sẽ phù hợp hơn; nếu không, RE sẽ cho kết quả tốt hơn do sử dụng hiệu quả thông tin giữa các cá nhân.


Comments