Cách vẽ một số đồ thị cơ bản trong Stata: biểu đồ tròn, histograms, boxplots, scatterplots

Phần này nhóm Thạc Sĩ sẽ giới thiệu và vẽ minh họa một số đồ thị cơ bản trong Stata, bao gồm:

  • Biểu đồ histograms.
  • Biểu đồ hình hộp boxplots.
  • Biểu đồ hình tròn.
  • Biểu đồ phân tán scatterplots.
  • Ma trận biểu đồ phân tán scatterplots.

Hãy sử dụng file dữ liệu auto để tạo một số biểu đồ.
sysuse auto.dta

Biểu đồ histograms

Lệnh histogram có thể được sử dụng để tạo một biểu đồ đơn giản của mpg
histogram mpg


Nếu bạn đang tạo biểu đồ cho một biến phân loại như rep78, bạn có thể thêm tùy chọn discrete. Như bạn có thể thấy bên dưới, khi bạn chỉ định tùy chọn này, các thanh tương ứng nằm liền nhau mà không nằm rời rạc.
hist rep78, percent discrete
 

Biểu đồ hình hộp boxplots

Lệnh graph box có thể được sử dụng để tạo biểu đồ hộp boxplot có thể giúp bạn kiểm tra sự phân phối của mpg. Nếu mpg được phân phối chuẩn, đường trung vị sẽ nằm ở giữa hộp (phần trăm thứ 25 và 75, Q1 và Q3) và phần cuối của râu (giá trị liền kề trên và dưới, là giá trị cao nhất các giá trị trong Q3 + 1.5*(Q3-Q1) và Q1-1.5*(Q3-Q1), tương ứng) sẽ cách đều với hộp. Đường trung vị median được kéo xuống thấp nhất của ô. Quy tắc nhân với 1.5 ở trên là để tìm điểm outlier. Còn gọi là quy tắt IQR Interquartile Rule.
graph box mpg
 

Boxplot có thể được thực hiện riêng biệt cho ô tô nước ngoài và ô tô trong nước bằng cách sử dụng tùy chọn by() hoặc over().
graph box mpg, by(foreign)
 

graph box mpg, over(foreign)
 

Như vậy, hai tùy chọn by hoặc over ra kết quả tương tự nhau
Như bạn có thể thấy trong biểu đồ trên, có một số điểm ngoại lệ outlier trong các ô hộp được tạo ra, chính là các dấu tròn là các điểm outlier. Chúng có thể được xóa khỏi boxplot bằng lệnh noout trong Stata.
graph box mpg, over(foreign) noout
 

Biểu đồ không còn bao gồm các giá trị ngoại lệ outlier. Stata cũng bao gồm một thông báo ở cuối biểu đồ lưu ý rằng các giá trị ngoại lệ outlier đã bị loại trừ.

Biểu đồ hình tròn

Stata cũng có thể tạo ra biểu đồ hình tròn.
graph pie, over(rep78) plabel(_all name) title("lịch sử sửa chữa 1978")
 

Lệnh graph pie với tùy chọn over sẽ tạo một biểu đồ hình tròn đại diện cho tần suất của từng nhóm hoặc giá trị của rep78. Tùy chọn plabel đặt các nhãn giá trị cho rep78 bên trong mỗi lát của biểu đồ hình tròn.

Biểu đồ phân tán scatterplots

Biểu đồ phân tán hai chiều có thể được sử dụng để hiển thị mối quan hệ giữa mpg và trọng lượng weight. Như chúng ta mong đợi, có một mối quan hệ ngược chiều giữa mpg và weight.
graph twoway scatter mpg weight
 

Ta có thể bỏ hẳn chữ graph, gõ ngắn hơn như sau mà vẫn ra kết quả y hệt nhé
twoway scatter mpg weight
Chúng ta có thể hiển thị đường hồi quy dự đoán mpg từ trọng số weight như thế này.
 

Ngoài ra ta kết hợp được đường thẳng và biểu đồ scatter lại thành 1 như sau
twoway (scatter mpg weight) (lfit mpg weight)
 

Chúng ta có thể thêm nhãn label vào các điểm ghi nhãn chúng bằng cách thực hiện như hình dưới đây. Lưu ý rằng mlabel là một tùy chọn trên lệnh scatter. Điều này sẽ hiện lên tên của các dòng xe hơi.
twoway (scatter mpg weight ,mlabel(make)) ( lfit mpg weight)
 

Tên của xe đang nằm ngang, nếu bạn muốn nghiêng 1 góc 45 độ thì thêm tùy chọn mlabangle
twoway(scatter mpg weight, mlabel(make) mlabangle(45))( lfit mpg weight)
 

Giả sử muốn chai ra hai loại xe trong nước và nước ngoài thì chỉ cần thêm tùy chọn by(foreign). Lệnh như sau:
twoway(scatter mpg weight, mlabel(make) mlabangle(45))( lfit mpg weight) , by(foreign)
 

Chúng ta yêu cầu khoảng tin cậy xung quanh các giá trị dự đoán bằng cách sử dụng lfitci thay cho lfit
twoway (scatter mpg weight) (lfitci mpg weight)
 

Muốn xét quan hệt giữa đồng thời nhiều biến, 3 , 4 biến… ví dụ như mpg, weight và price ta có thể dùng lệnh graph matrix như sau
graph matrix mpg weight price

Bạn cứ trao đổi thêm với nhóm ở đây, hoặc comment bên dưới nhé.

Liên hệ nhóm thạc sĩ Hỗ trợ Stata.

– SMS, Zalo, Viber:

phone number

– Facebook  facebook.com/hotroStata

Email  hotrostata@gmail.com

Comments