Các lệnh phổ biến Stata để hiển thị thông tin mô tả và thống kê mô tả về file dữ liệu

Nhóm ThS giới thiệu đến các bạn các lệnh phổ biến để hiển thị thông tin mô tả và thống kê mô tả về file dữ liệu. Đó là các lệnh sau:

  • describe
  • codebook
  • inspect
  • list
  • tabulate
  • summarize

Dưới đây là thông tin chi tiết các lệnh:

Tìm hiểu tổng quan về file của bạn

Lệnh sysuse tải tập dữ liệu định dạng Stata có sẵn cùng với Stata. Ở đây  sẽ sử dụng file dữ liệu auto (file này có sẵn khi cài stata)

Từ màn hình Stata nhập lệnh sau:
sysuse  auto

describe
Lệnh describe hiển thị cho bạn thông tin cơ bản về file dữ liệu Stata. Như bạn có thể thấy, nó cho chúng ta biết số lượng quan sát trong file, số lượng biến, tên của các biến và hơn thế nữa. File này nói về việc sửa chữa xe hơi.


 
Lệnh codebook là một công cụ tuyệt vời để có cái nhìn tổng quan nhanh chóng về các biến trong file dữ liệu. Nó tạo ra một loại sổ mã điện tử từ file dữ liệu. Hãy xem những gì nó tạo ra bên dưới.


Một lệnh hữu ích khác để có cái nhìn tổng quan nhanh về file dữ liệu là lệnh inspect . Đây là những gì lệnh tạo ra cho file này

Lệnh list rất hữu ích để xem giá trị nội dung của tất cả hoặc một loạt các quan sát. Ở đây chúng tôi xem xét make, price, mpg, rep78 và foreign cho 10 quan sát đầu tiên.
list make price mpg rep78 foreign in 1/10


 

Tạo bảng với lệnh tabulate

Lệnh tabulate  rất hữu ích để lấy các bảng tần số. Dưới đây, làm một bảng cho rep78. Lệnh cũng có thể được rút ngắn thành tab.

Lệnh tab1 có thể được sử dụng để làm gọn câu lệnh tab đi, để yêu cầu bảng cho một loạt biến (thay vì gõ lệnh lập bảng lặp đi lặp lại cho mỗi biến quan tâm).
 

Chúng ta có thể sử dụng tùy chọn plot để tạo biểu đồ nhằm hiển thị trực quan các giá trị được lập bảng.

Cũng có thể tạo bảng chéo bằng cách sử dụng lệnh tab . Hãy cùng nhìn lại lịch sử sửa chữa của ô tô nước ngoài và ô tô trong nước.


Với tùy chọn column, ta có thể yêu cầu tỷ lệ phần trăm cột. Lưu ý rằng khoảng 86% ô tô nước ngoài nhận được đánh giá 4 hoặc 5. Chỉ có khoảng 23% ô tô trong nước được đánh giá cao.
 

tabulate rep78 foreign, column
Ngoài ra để hiển thỉ chỉ mỗi %, ta thêm nofreq
tabulate rep78 foreign, column nofreq
 

Và lưu ý rằng thứ tự của các option sau dấu phẩy trong stata không quan trọng, quan trọng là nó phải nằm sau dấu phẩy

Tạo thống kê tóm tắt với summary

Để thống kê tóm tắt, chúng ta có thể sử dụng lệnh summary. Hãy tạo một số thống kê tóm tắt về mpg (Mileage per gallon, là số dặm đi đi trên một đơn vị xăng)
summarize mpg
Ta thấy lệnh này hiển thị các thông số về quãng đường trung bình đã đi, giá trị nhỏ nhất, lớn nhất…
 

Chúng ta có thể sử dụng tùy chọn detail của lệnh tổng hợp để có được số liệu thống kê tóm tắt chi tiết hơn Variance, Skewness, Kurtosis…
Để nhận các giá trị này một cách riêng biệt cho nước ngoài và trong nước, chúng ta có thể sử dụng tiền tố by foreign: như được hiển thị bên dưới. Lưu ý rằng trước tiên chúng ta phải sắp xếp dữ liệu trước khi sử dụng by foreign:
sort foreign
by foreign: summarize mpg


Đây không phải là cách hiệu quả nhất để làm điều này. Một cách khác, không yêu cầu dữ liệu được sắp xếp, là sử dụng tùy chọn summarize () như một phần của lệnh lập bảng.
tab foreign, summarize ( mpg)
 

Tóm tắt các lệnh đã dùng và mục đích:

Cung cấp thông tin về file  dữ liệu hiện tại, bao gồm số lượng biến và các quan sát cũng như danh sách các biến trong file dữ liệu:
describe
Cung cấp thông tin cho file dữ liệu hiện tại.
codebook
Cung cấp tổng quan nhanh về file dữ liệu.
inspect
Liệt kê các biến make và mpg.
list make mpg
Lập bảng tần số mpg
tabulate mpg
Lập bảng hai chiều của rep78 của foreign.
tab rep78 foreign
Tạo thống kê tóm tắt về mpg và price
sum price mpg
Tạo thống kê tóm tắt cho mpg riêng biệt cho xe hơi nước ngoài và xe trong nước.
sort foreign
by foreign: summarize(mpg)

Tạo thống kê tóm tắt cho mpg của loại xe  (không cần sắp xếp trước).
tabulate foreign, summarize(mpg)

Bạn cứ trao đổi thêm với nhóm ở đây, hoặc comment bên dưới nhé

Liên hệ nhóm thạc sĩ Hỗ trợ Stata.

– SMS, Zalo, Viber:

phone number

– Facebook  facebook.com/hotroStata

Email  hotrostata@gmail.com

Comments