Nhóm Thạc Sĩ ĐH Bách Khoa giới thiệu giá trị trung bình, trung vị, tứ phân vị. Đây là các khái niệm cơ bản trong thống kê, được nhóm trình bày bằng đồ thị rất dễ hiểu. Bây giờ các bạn nhìn vào hình bên dưới nhé.
Ta có dãy số như sau: 6, 5, 8, 7, 12, 13, 15, 14, 2, 200, 1. Câu hỏi đặt ra là tìm giá trị trung bình, trung vị, tứ phân vị (cái này hơi khó hơn, nên nếu giờ các bạn chưa xem thì để xem dần dần cũng được nhé)
Giá trị trung bình
Trước tiên chúng ta sẽ làm việc dễ trước, đó là tìm giá trị trung bình cộng. Giá trị trung bình chính là tổng của tất cả các số, chia cho số lượng số, ở đây số lượng số là 11 số, như vậy giá trị trung bình cộng là (6+5+8+7+12+13+15+14+2+200+1)/11=25.72. Trung bình cộng của 11 số trên là 25.72
Giá trị trung vị
Bước 1: sắp xếp dãy số ở trên theo thứ tự tăng dần, ta được kết quả:1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200
Bước 2: xem định nghĩa trung vị: Trung vị là giá trị đứng ở vị trí giữa trong một dãy số đã được sắp xếp có thứ tự. Trước và sau trị số trung vị sẽ có 50% quan sát.
Bước 3: như vậy dãy số ở trên có 11 số (1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200)
Số ở giữa chính sẽ chia đôi bộ số làm 2, bên trái nó có 5 số, bên phải nó có 5 số, như vậy đó chính là số 8. 8 chính là số trung vị của tập hợp ở trên( trung vị cũng còn được gọi là tứ phân vị thứ nhì nhé)
Định nghĩa giá trị trung vị
Đối với một tập dữ liệu, nó có thể được coi là giá trị “giữa”. Đặc điểm cơ bản của giá trị trung vị trong việc mô tả dữ liệu so với giá trị trung bình là nó không bị sai lệch bởi một tỷ lệ nhỏ các giá trị cực lớn hoặc cực nhỏ, và do đó cung cấp một đại diện tốt hơn về giá trị đặc trưng.
Trung vị của một danh sách hữu hạn các số là số “ở giữa”, khi các số đó được liệt kê theo thứ tự từ nhỏ nhất đến lớn nhất.
Nếu tập dữ liệu có số lượng quan sát lẻ, thì tập ở giữa được chọn. Ví dụ: danh sách bảy số sau 1, 3, 3, 6, 7, 8, 9 có giá trị trung vị là số 6
Một tập hợp số lượng quan sát chẵn không có giá trị giữa riêng biệt và giá trị trung bình thường được xác định là giá trị trung bình của hai giá trị giữa.Ví dụ, tập dữ liệu 1, 2, 3, 4, 5, 6, 8, 9 có giá trị trung vị là 4.5 nghĩa là (4 + 5) / 2
Giá trị tứ phân vị
Định nghĩa: điểm tứ phân vị (quartile) là giá trị bằng số phân chia một nhóm các kết quả quan sát bằng số thành bốn phần, mỗi phần có số liệu quan sát bằng nhau (=25% số kết quả quan sát). Tứ phân vị có 3 giá trị, đó là tứ phân vị thứ nhất (Q1), thứ nhì (Q2) và thứ ba (Q3). Ba giá trị này chia một tập hợp dữ liệu (đã sắp xếp dữ liệu theo trật từ từ bé đến lớn) thành 4 phần có số lượng quan sát đều nhau.
Xem lại dãy số 11 số ở trên của chúng ta (1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200)
Giá trị tứ phân vị thứ nhất Q1 bằng trung vị phần dưới, phần dưới là các số (1, 2, 5, 6, 7), là số 5
Giá trị tứ phân vị thứ hai Q2 chính bằng giá trị trung vị, chính là số 8
Giá trị tứ phân vị thứ ba Q3 bằng trung vị phần trên(12, 13, 14, 15, 200), là số 14
Cách dùng SPSS để tính giá trị trung bình, trung vị, tứ phân vị
Bước này sẽ dùng SPSS để tính ra giá trị trung bình, trung vị, tứ phân vị đã tính thủ công ở trên
Bước 1: tải file spss về
Bạn có thể tải file về ở đây: trungbinh-trungvi-tuphanvi.sav
Bước 2: dùng thống kê tần số để tính giá trị trung bình, trung vị, tứ phân vị
Bạn mở file SPSS vừa tải ở trên thì được màn hình như sau:
Tiếp tục vào menu Analyze – Descriptive Statistics – Frequencies
Trong bảng này, tiếp tục đưa biến VAR00001 qua bên phải, và ấn vào nút Statistics.
Sau đó tiếp tục chọn mục :
Quartiles: tứ phân vị
Mean: trung bình
Median: trung vị
Sau đó nhấn OK, kết quả giá trị trung bình, trung vị, tứ phân vị đã được SPSS tính toán tự động như sau:
Kết quả giá trị trung bình, trung vị, tứ phân vị này hoàn toàn khớp với kết quả tính thủ công ở trên.
Như vậy các bạn đã hiểu được giá trị trung bình, trung vị, tứ phân vị là gì.
So sánh trung bình và trung vị: giá trị trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ outlier, còn giá trị trung bình bị ảnh hưởng mạnh bởi các giá trị cực lớn, hoặc cực nhỏ trong bộ số liệu.
Bạn cứ trao đổi thêm với nhóm ở đây, hoặc comment bên dưới nhé
Liên hệ nhóm thạc sĩ Hỗ trợ SPSS.
– SMS, Zalo, Viber:
– Chat Facebook: http://facebook.com/hoidapSPSS/
– Email: hotrospss@gmail.com
- Bàn luận về bản chất của phương sai trích VE(variance extracted) và phương sai trích trung bình AVE (average variance extracted)
- Cách cài đặt PROCESS macro để xử lý biến trung gian, biến điều tiết trên SPSS
- Giá trị Communalities trong phân tích nhân tố EFA
- Hiển thị Font Tiếng Việt trong SPSS ( cả hai loại UNICODE và VNI)
- Ba cách rút gọn dữ liệu:chọn một biến duy nhất, tính tổng hoặc trung bình cộng và tính theo factor scores