Tag Archives: tự tương quan

FGLS trong Stata: Giải pháp cho phương sai sai số thay đổi và tự tương quan

1.Giới thiệu về hồi quy FGLS

Trong phân tích hồi quy, một trong những giả định quan trọng của mô hình hồi quy tuyến tính là phương sai của sai số phải đồng nhất. Tuy nhiên, trong thực tế, hiện tượng phương sai sai số thay đổi thường xảy ra, làm cho các ước lượng không còn hiệu quả. Một phương pháp phổ biến để khắc phục vấn đề này là sử dụng hồi quy FGLS (Feasible Generalized Least Squares).

FGLS là một phương pháp ước lượng giúp cải thiện tính chính xác của hồi quy khi mô hình gặp phải hiện tượng phương sai sai số thay đổi hoặc tự tương quan. Trong bài viết này, chúng ta sẽ đi sâu vào:

  • Khi nào cần sử dụng FGLS?
  • Cách thực hiện FGLS trong Stata
  • Giải thích kết quả FGLS

2. Khi nào nên sử dụng FGLS?

Hồi quy FGLS thích hợp khi:

  • Có hiện tượng phương sai sai số thay đổi : Khi phương sai của sai số không đồng đều giữa các quan sát, các ước lượng trở nên không hiệu quả.
  • Có hiện tượng tự tương quan trong dữ liệu chuỗi thời gian: Khi các sai số có mối quan hệ với nhau qua các thời điểm khác nhau, FGLS có thể giúp cải thiện mô hình.
  • Dữ liệu bảng panel data: Khi có sự khác biệt về phương sai giữa các cá nhân hoặc nhóm, FGLS giúp điều chỉnh sai số hiệu quả hơn.

3. Cách chạy hồi quy FGLS trong Stata

Bước 1: Kiểm tra hiện tượng phương sai sai số thay đổi

Trước khi sử dụng FGLS, cần kiểm tra xem mô hình có bị phương sai sai số thay đổi hay không. Một trong những kiểm định phổ biến là Breusch-Pagan:

Ví dụ mô hình tác động ngẫu nhiên được chọn, ta sẽ kiểm tra phương sai sai số thay đổi bằng "Breusch and Pagan Lagrangian multiplier test for random effects"

xtreg    LIQ SIZE CAP ROE NIM, re
xttest0

Nếu giá trị p-value < 0.05, ta bác bỏ giả thuyết H0 (phương sai sai số đồng nhất) và kết luận rằng có hiện tượng phương sai sai số thay đổi.

Bước 2: Kiểm tra hiện tượng tự tương quan

.  xtserial  LIQ SIZE CAP ROE NIM

Wooldridge test for autocorrelation in panel data
H0: no first-order autocorrelation
    F(  1,      28) =      3.697
           Prob > F =      0.0647

Nếu giá trị p-value Prob < 0.05, ta bác bỏ giả thuyết H0 (không có tự tương quan) và kết luận rằng có hiện tượng tự tương quan

Bước 3: Chạy hồi quy FGLS

Sau khi xác nhận có phương sai sai số thay đổi, chúng ta thực hiện FGLS bằng cách sử dụng lệnh xtgls trong Stata:

xtgls y x1 x2 x3, panels(heteroskedastic)

y là biến phụ thuộc

x1 x2 x3 là các biến độc lập

panels(heteroskedastic) giúp điều chỉnh phương sai sai số thay đổi theo từng cá nhân trong dữ liệu bảng

. xtgls    LIQ SIZE CAP ROE NIM, panels(heteroskedastic)

Cross-sectional time-series FGLS regression

Coefficients:  generalized least squares
Panels:        heteroskedastic
Correlation:   no autocorrelation

Estimated covariances      =        29          Number of obs     =        145
Estimated autocorrelations =         0          Number of groups  =         29
Estimated coefficients     =         5          Time periods      =          5
                                                Wald chi2(4)      =     198.09
                                                Prob > chi2       =     0.0000

 

Nếu có cả tự tương quan và phương sai sai số thay đổi, ta dùng:

xtgls y x1 x2 x3, panels(heteroskedastic) corr(ar1)

Lệnh trên giả định sai số có cấu trúc tự tương quan bậc 1 (AR(1)).

. xtgls    LIQ SIZE CAP ROE NIM, panels(heteroskedastic) corr(ar1)

Cross-sectional time-series FGLS regression

Coefficients:  generalized least squares
Panels:        heteroskedastic
Correlation:   common AR(1) coefficient for all panels  (0.0498)

Estimated covariances      =        29          Number of obs     =        145
Estimated autocorrelations =         1          Number of groups  =         29
Estimated coefficients     =         5          Time periods      =          5
                                                Wald chi2(4)      =     184.78
                                                Prob > chi2       =     0.0000

4. Giải thích kết quả hồi quy FGLS

Sau khi chạy lệnh xtgls, Stata sẽ hiển thị bảng kết quả. Một số yếu tố quan trọng cần lưu ý:

Hệ số ước lượng (Coef.): Thể hiện mức độ ảnh hưởng của từng biến độc lập lên biến phụ thuộc.

Giá trị p-value: Nếu p-value < 0.05, biến đó có ảnh hưởng đáng kể đến biến phụ thuộc.

5. Kết luận về FGLS trong Stata

Hồi quy FGLS là một phương pháp tốt giúp điều chỉnh phương sai sai số thay đổi và tự tương quan, giúp cải thiện tính chính xác của mô hình hồi quy. Khi dữ liệu của bạn gặp phải vấn đề heteroskedasticity hoặc autocorrelation, sử dụng FGLS là một lựa chọn phù hợp để có được ước lượng đáng tin cậy hơn.

Nếu bạn đang gặp khó khăn trong xử lý dữ liệu và thực hiện phân tích hồi quy FGLS, dịch vụ hỗ trợ từ phantichstata.com có thể giúp bạn tiết kiệm thời gian và đảm bảo kết quả chính xác nhất.

Nếu bạn cần hỗ trợ thêm về việc chạy mô hình hoặc xử lý số liệu, đừng ngần ngại liên hệ với nhóm MBA Bách Khoa qua các kênh sau:

-Zalo 0903396688 

-Facebook  facebook.com/hotroStata

 

Kiểm định tự tương quan, tương quan chuỗi trong Stata

Nhóm Hỗ Trợ Stata giới thiệu về khái niệm tự tương quan, cùng với các kiểm định để xác định xem dữ liệu có bị tự tương quan hay không. Kiểm định này có sự khác biệt khi áp dụng đối với dữ liệu bảng và dữ liệu theo chuỗi thời gian, mỗi loại sẽ có cách kiểm định riêng. Phần này sẽ nói phần thực hành kiểm định tự tương quan trước, sau đó là phần lý thuyết.

Thực hành kiểm định tự tương quan

Kiểm định tự tương quan với dữ liệu chuỗi thời gian

Dùng kiểm định Durbin-Watson, kiểm định Breusch-Godfrey

Cách 1: Gõ lệnh dwstat ngay sau khi chạy hồi quy để tính toán giá trị Durbin-Watson, từ đó mới kết luận có tự tương quan hay không

. dwstat

Durbin-Watson d-statistic(  7,   174) =  2.079461

Cách 2: Có cách khác để kiểm tra tự tương quan Durbin, đó là dùng lệnh  durbinalt (kiểm định thay thế Durbin's alternative test for serial correlation) để tính toán trực tiếp ra mức ý nghĩa thống kê của kiểm định Durbin-Watson luôn.

Cú pháp lệnh là:  estat durbinalt 

Với giả thiết H0: không có tự tương quan, do đó với giá trị Prob>chi2 >5% như trên, ta kết luận chấp nhận giả thiết H0, có nghĩa là không có hiện tượng tự tương quan( đây là điều mong đợi khi làm bài)

Cách 3: Hoặc cách khác nữa, dùng lệnh bgodfrey để kiểm định tự tương quan bằng kiểm định Breusch-Godfrey

Với giả thiết H0: không có tự tương quan, do đó với giá trị Prob>chi2 >5% của kiểm định Breusch-Godfrey như trên, ta kết luận chấp nhận giả thiết H0, có nghĩa là không có hiện tượng tự tương quan( đây là điều mong đợi khi làm bài)

Trên đây là tự tương quan bậc 1, nếu muốn bậc 2, hoặc cao hơn thì thêm tham số lags vào, ví dụ lệnh sau kiểm tra tự tương quan bậc 2: estat bgodfrey,lags(2)

Kiểm định tự tương quan với dữ liệu bảng

Dùng kiểm định Wooldridge, với cú pháp  như sau: xtserial y x1, x2…. ( y là biến phụ thuộc, x1,x2… là biến độc lập)

Với giả thiết Ho: Không có tương quan chuỗi(no first-order autocorrelation)

Do đó với giá trị Prob>F >5% của kiểm định Wooldridge như trên, ta kết luận chấp nhận giả thiết H0, có nghĩa là không có hiện tượng tự tương quan( đây là điều mong đợi khi làm bài)

Lý thuyết

Bản chất của tự tương quan là gì ?

Thuật ngữ tự tương quan có thể được định nghĩa như là: quan hệ tương quan giữa các thành viên của chuỗi của các quan sát được sắp xếp theo thời gian (như trong dữ liệu chuỗi thời gian) hoặc không gian (như trong dữ liệu chéo). Trong ngữ cảnh hồi qui, mô hình hồi qui tuyến tính cổ điển giả định rằng quan hệ tự tương quan không tồn tại trong các nhiễu ui.

Tự tương quan và tương quan chuỗi có khác nhau?

Mặc dù hiện nay trên thực tế thường coi các từ tự tương quan và tương quan chuỗi là đồng nghĩa, một số tác giả vẫn muốn phân biệt hai từ này. Mặc dù sự khác biệt giữa hai từ này có thể là hữu ích, trong bài này chúng ta sẽ coi chúng là đồng nghĩa.

Mặc dù việc xảy ra tự tương quan là hay có với dữ liệu chuỗi thời gian, nó vẫn có thể xảy ra trong dữ liệu chéo. Một số tác giả gọi tự tương quan trong dữ liệu chéo là tự tương quan không gian, tức là tương quan theo không gian chứ không phải là theo thời gian. Tuy nhiên, vấn đề quan trọng là cần nhớ rằng trong phân tích chéo việc sắp xếp thứ tự dữ liệu cần theo lô gich, hoặc lợi ích kinh tế nào đó, để làm cho bất cứ việc xác định xem có tồn tại tự tương quan tồn tại hay không là có ý nghĩa.

Các phương pháp kiểm tra hiện tượng tự tương quan

Đối với dữ liệu bảng : kiểm định Wooldridge
Đối với dữ liệu thời gian:kiểm định Durbin-Watson, kiểm định Breusch-Godfrey