Tag Archives: robust regression Stata

Phân biệt kiểm định Breusch-Pagan và White trong Stata : lựa chọn nào để phát hiện phương sai thay đổi

1. Khái niệm phương sai sai số thay đổi

Trong hồi quy tuyến tính có một giả định là phương sai của sai số phải không đổi (homoskedasticity). Khi giả định này bị vi phạm – phương sai của phần dư thay đổi theo giá trị của biến độc lập – ta nói rằng mô hình có phương sai sai số thay đổi. lưu ý là SAI SỐ chính là PHẦN DƯ nhé.
Hậu quả: Các ước lượng OLS vẫn không chệch, nhưng sai số chuẩn bị sai lệch, khiến các kiểm định t và F không còn đáng tin cậy.
Để phát hiện vấn đề này trong Stata, hai phương pháp phổ biến nhất là:

  •     Kiểm định Breusch-Pagan (BP Test)
  •     Kiểm định White (White Test)

2. So sánh kiểm định Breusch-Pagan và White

Tiêu chí

Kiểm định Breusch-Pagan

Kiểm định White

Được đề xuất bởi

Breusch & Pagan (1979)

Halbert White (1980)

Giả định

Mối quan hệ tuyến tính giữa sai số và biến độc lập

Cho phép cả tuyến tính và phi tuyến

Độ nhạy với mô hình phi tuyến

Thấp hơn

Cao hơn

Phát hiện tương tác

Không

Có thể phát hiện tương tác giữa biến độc lập

Tính toán

Đơn giản hơn

Phức tạp hơn một chút

Khuyến nghị sử dụng

Mô hình tuyến tính đơn giản

Mô hình có biến tương tác, phi tuyến

3. Khi nào nên dùng Breusch-Pagan?

Ta sử dụng kiểm định Breusch-Pagan khi:

  •     Mô hình của tuyến tính rõ ràng
  •     Không có biến tương tác hay biến đa thức (như x², x³)
  •     Cần một kiểm định nhanh, đơn giản

Ví dụ lệnh trong Stata:
reg y x1 x2 x3
estat hettest

Kết quả trả về:
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
chi2(1) = 6.87
Prob > chi2 = 0.0088

Do p-value < 0.05 => Có phương sai thay đổi => Vi phạm giả định OLS

4. Khi nào nên dùng kiểm định White?

White test nên được sử dụng khi:

  •     Mô hình có chứa biến tương tác hoặc biến phi tuyến (log, bình phương, căn bậc hai…)
  •     Kiểm định toàn diện hơn, không giới hạn bởi tuyến tính
  •     Dữ liệu dạng cắt ngang với phân tán sai số không đều

Ví dụ lệnh trong Stata:
reg y x1 x2 x3
estat imtest, white

Kết quả:
White's test for Ho: homoskedasticity
Chi2(9) = 20.45
Prob > chi2 = 0.014

=> p-value < 0.05 => Có bằng chứng về phương sai sai số thay đổi.

5. Ưu và nhược điểm của mỗi kiểm định

-Breusch-Pagan
    Ưu điểm: Tính toán nhanh, trực quan, dễ diễn giải
    Nhược điểm: Không phát hiện được quan hệ phi tuyến hoặc tương tác
-White
    Ưu điểm: Linh hoạt, không yêu cầu tuyến tính, phát hiện được tương tác và phi tuyến
    Nhược điểm: Có thể quá nhạy trong mẫu nhỏ => dễ báo sai

6. Tóm lại

    Là người đã giảng dạy và sử dụng Stata trong hàng trăm dự án nghiên cứu định lượng, Ths Khánh và nhóm khuyến nghị như sau:
    -Mô hình tuyến tính đơn giản nên dùng Breusch-Pagan
    -Mô hình có biến bình phương, log, tương tác nên dùng White
    -Cần đánh giá chắc chắn về heteroskedasticity => thực hiện cả hai kiểm định
    Ngoài ra, nên kết hợp với phân tích đồ họa phần dư (residual plots) để có đánh giá trực quan hơn: rvfplot

7. Xử lý nếu phát hiện phương sai thay đổi

Sau khi kiểm định phát hiện phương sai thay đổi, bạn có thể:

  •     Sử dụng hồi quy với robust standard errors: reg y x1 x2 x3, robust
  •     Dùng phương pháp hồi quy hiệu chỉnh như FGLS (Feasible Generalized Least Squares)
  •     Thử biến đổi mô hình (logarit hóa biến phụ thuộc và/hoặc độc lập)