Tag Archives: các loại biến

Stata các loại biến, các loại mô hình trong dữ liệu bảng data panel

Bốn loại biến cơ bản trong dữ liệu bảng panel data

Có bốn loại biến cơ bản có thể được sử dụng trong mô hình dữ liệu bảng panel data:

  1. Đầu tiên là các biến khác nhau giữa các đơn vị phân tích, nhưng không thay đổi theo thời gian (ví dụ: chủng tộc và giới tính, loại hình công ty hoặc cấp học).
  2. Loại biến thứ hai có thể thay đổi theo thời gian, nhưng giống nhau đối với tất cả các đơn vị phân tích tại bất kỳ khoảng thời gian nhất định nào (ví dụ: các chỉ tiêu kinh tế quốc gia: GDP, lạm phát).
  3. Loại thứ ba là một biến số có thể thay đổi theo cả thời gian và đơn vị phân tích(ví dụ: thu nhập, chi tiêu công ty, thành phần học sinh đi học).
  4. Biến cuối cùng là biến thay đổi theo thời gian theo mô hình có thể dự đoán được (ví dụ: thước đo tuổi hoặc thâm niên,ví dụ năm nay thâm niên 10 năm thì sang năm sau chắc chắn sẽ là 11 năm). Việc bao gồm một số biến, chẳng hạn như những biến thay đổi theo đơn vị nhưng không thay đổi theo thời gian, phụ thuộc vào việc sử dụng các hiệu ứng cố định hay ngẫu nhiên. Những cái khác, chẳng hạn như những cái có yếu tố thời gian sẽ phụ thuộc vào khía cạnh thời gian được diễn giải trong mô hình. Nhưng phân tích dữ liệu bảng có các tùy chọn mà theo đó tất cả các loại biến này có thể được đưa vào một số kiểu như là cố định, ngẫu nhiên….

Các loại mô hình cơ bản trong panel data

Các mô hình dữ liệu bảng panel data có thể được sử dụng cho nhiều loại mô hình, từ đơn giản đến những mô hình có mối quan hệ khá phức tạp. Loại mô hình cơ bản nhất là hồi quy pooled OLS, loại bỏ sự phụ thuộc lẫn nhau giữa các quan sát trong một đơn vị phân tích và ước tính một hệ số chặn và hệ số góc không đổi theo thời gian và đơn vị. Điều này tương đương với việc chạy một mô hình hồi quy cơ bản trong đó biến thời gian bị bỏ qua và tất cả các quan sát được phân tích cùng nhau. Mặc dù mô hình này có vấn đề với việc bỏ qua các phụ thuộc trong cùng 1 đơn vị phân tích( ví dụ 1 công ty), nhưng nó có thể tạo thành một mô hình cơ sở cho các mục đích so sánh. Nhưng ta phải được thận trọng vì các hệ số ước tính có thể cung cấp kết quả sai lệch. Tập hợp các mô hình tiếp theo tập trung vào các mức độ khác nhau của kết quả theo đơn vị phân tích cụ thể, trong đó các hệ số chặn, hệ số hồi quy hoặc cả hai thay đổi theo đơn vị.

Lựa chọn giữa fixed effects và random effects

Sự lựa chọn giữa các hiệu ứng cố định và ngẫu nhiên trong các mô hình bảng chủ yếu tập trung vào sự đánh đổi giữa việc kiểm soát tính nội sinh trong các hiệu ứng cố định với hiệu quả thống kê, nhưng kết quả sai lệch do các tác động ngẫu nhiên. Các tác động cố định cung cấp một cách đơn giản để kiểm soát các biến chưa hoặc không thể đo lường được. Điều này được thực hiện bằng cách phân tích từng đơn vị riêng biệt với các hiệu ứng cố định. Bằng cách này, các biến không quan sát được mà không thay đổi theo thời gian là không đổi trong các khoảng thời gian và do đó không thể có bất kỳ ảnh hưởng nào đến kết quả. Bằng cách sử dụng mỗi đơn vị phân tích cho nó tự kiểm soát riêng và các quan sát có quan hệ các quan sát khác trong nhóm, hầu hết các dạng nội sinh đều bị loại bỏ. Nó không thể giải thích cho các biến không được đo lường thay đổi theo thời gian, nhưng tất cả các dạng khác đều được giải quyết. Hơn nữa, các biến không thay đổi theo đơn vị, chẳng hạn như giới tính, v.v., không thể được phân tích vì chúng không đổi trong khoảng thời gian. Do đó, các hiệu ứng cố định sử dụng sự thay đổi trong nội bộ đơn vị để ước tính tất cả các ảnh hưởng và tăng tính nhất quán với chi phí hiệu quả.

Tuy nhiên, các tác động ngẫu nhiên mang lại một loạt các lợi ích và hạn chế khác nhau. Chúng yêu cầu ít tham số ước tính hơn (chủ yếu bằng cách không ước tính điểm chặn cho mỗi đơn vị) và do đó tăng bậc tự do có sẵn. Ngoài ra, các biến bất biến theo thời gian như giới tính hoặc chủng tộc hiện có thể được đưa vào phân tích. Nhưng tất cả những lợi ích này phải được cân nhắc dựa trên sự sai lệch tiềm năng từ các hiệu ứng nội sinh có thể ảnh hưởng đến các ước tính tác động ngẫu nhiên. Do đó, sự lựa chọn giữa các tác động cố định và ngẫu nhiên là sự đánh đổi giữa việc kiểm soát tính nội sinh so với việc tăng hiệu quả và mở rộng các loại biến.

Tóm lại

Mô hình dữ liệu bảng là một khung phân tích được thiết kế cho một cấu trúc dữ liệu cụ thể ,cross-sectional kết hợp với dữ liệu dọc longitudinal, nói đơn giản là ví dụ có nhiều công ty, mỗi một công ty có nhiều năm , mỗi năm đều có các số liệu của công ty đó thì đó là dữ liệu bảng.