Bài này hướng dẫn các bạn cách đơn giản nhất và dễ nhớ nhất để hiểu biểu đồ boxplot nhé. Trước tiên cần tìm hiểu khái niệm IQR để nắm được các ý ở phía sau
Định nghĩa IQR
IQR là viết tắt của interquartile range. IQR mô tả 50% giá trị ở giữa khi được sắp xếp từ thấp nhất đến cao nhất. Để tìm IQR, trước tiên hãy tìm giá trị trung vị media của nửa dưới và giá trị trung vị media của nửa trên của dữ liệu. Các giá trị này là phần tư 1 (Q1) và phần tư 3 (Q3). IQR là sự khác biệt giữa Q3 và Q1. IQR = Q3-Q1.
Biểu đồ boxplot lúc nào cũng gồm 1 hình chữ nhật và 2 râu trên và dưới.
-Cạnh trên của hình chữ nhật ứng với Q3 , là tứ phân vị thứ 3
-Cạnh dưới của hình chữ nhật ứng với Q1 , là tứ phân vị thứ 1
-Đường tô đậm ngang bên trong của hình chữ nhật ứng với Q2 , là tứ phân vị thứ 2, nghĩa là trung vị median
-Điểm cao nhất của râu trên là giá trị Q3+ 1.5*IQR, mà giá trị IQR được tính bằng giá trị của Q3-Q1 nhé. Những giá trị cao hơn điểm cao nhất này là ngoại lệ outliers.
-Điểm thấp nhất của râu dưới là giá trị Q1- 1.5*IQR. Những giá trị thấp hơn điểm thấp nhất này là ngoại lệ outliers.
Thực hành vẽ biểu đồ hộp trong SPSS
Đầu tiên các bạn tải file boxplot ở đây, giả sử file chứa thông tin về độ tuổi của 10 người nhé
https://phantichspss.com/filefordownload/boxplot.sav
Chọn menu Analyze –> Descriptive Statistics –> Explore
Chuyển biến Age vào cửa sổ “Dependent List“.
Bấm “Statistics“, và chọn “Outliers“
Bấm OK. Kết quả boxplot như sau:
Diễn giải kết quả tương tự ví dụ ở trên nhé.
Ngoài ra còn có thêm bảng phụ để mô tả chi tiết kết quả:
- Mean 70
- 95% Confidence Interval for Mean
- Lower Bound 56
- Upper Bound 84
- 5% Trimmed Mean 61
- Median 50 ĐÂY LÀ TRUNG VỊ
- Variance 567
- Deviation 7.181
- Minimum 11
- Maximum 40
- Range 29
- Interquartile Range 6 ĐÂY LÀ IQR
- Skewness .369
- Kurtosis 083
Như vậy quá đơn giản rồi đúng không các bạn, khi đọc có gì thắc mắc các bạn cứ nhắn nhóm mình nhé.