Trong thống kê và toán học, trung bình và trung vị là hai khái niệm quan trọng đại diện cho dữ liệu. Dù có một số điểm tương đồng, hai khái niệm này vẫn khác nhau về cách tính toán và ý nghĩa thống kê. Trong bài này này,nhóm MBA Bách Khoa sẽ cùng bạn sẽ tìm hiểu về sự khác nhau giữa trung bình và trung vị, cũng như áp dụng của chúng trong phân tích dữ liệu.
Trung bình (mean)
Trung bình là một chỉ số thống kê đại diện cho giá trị trung tâm của một tập hợp dữ liệu. Để tính trung bình, ta cộng tất cả các giá trị trong tập hợp lại và chia cho số lượng các giá trị đó. Công thức tính trung bình của một dãy số là:
Trung bình = Tổng các giá trị / Số lượng giá trị
Cách biểu diễn khác:
Mean = (x1 + x2 + … + xn) / n
Trong đó:
x1, x2, …, xn là các giá trị trong tập dữ liệu.
n là số lượng các giá trị trong tập dữ liệu.
Trung bình có thể là trung bình cộng (mean) hoặc trung bình có trọng số (weighted mean), tùy thuộc vào trường hợp cụ thể của dữ liệu. Trường hợp công thức ở trên là trung bình không có trọng số
Trung vị (median)
Trung vị là giá trị ở giữa của một tập hợp dữ liệu đã được sắp xếp theo thứ tự tăng dần hoặc giảm dần. Để tính trung vị, ta đơn giản là chọn giá trị ở vị trí giữa của dãy số. Nếu số lượng giá trị trong tập hợp là lẻ, thì trung vị sẽ là giá trị ở vị trí (n + 1) / 2, trong đó n là số lượng giá trị. Nếu số lượng giá trị là chẵn, thì trung vị sẽ là trung bình cộng của hai giá trị ở vị trí n/2 và (n/2 + 1).
Như vậy, trung vị nó có thể là số không xuất hiện trong chuỗi số liệu cho trước, các bạn lưu ý để không bị nhầm lẫn nhé.
Sự khác nhau giữa trung bình và trung vị
Trung bình được tính toán bằng cách cộng tất cả các giá trị lại và chia cho số lượng giá trị, trong khi trung vị là giá trị ở giữa của dãy số đã được sắp xếp.
Trung bình dễ bị ảnh hưởng bởi các giá trị ngoại lệ (outliers) trong dữ liệu vì nó tính toán dựa trên tổng của các giá trị, trong khi trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ. Giá trị ngoại lệ là giá trị rất nhỏ hoặc rất lớn so với đa số các biến khác. Ví dụ bạn có các số sau: 1, 2, 3, 5, 100 thì số 100 chính là ngoại lệ và nó khác rất xa các số còn lại
Độ nhạy với giá trị ngoại lệ: Trung bình có thể bị ảnh hưởng bởi các giá trị ngoại lệ trong dữ liệu, trong khi trung vị không bị ảnh hưởng nhiều bởi các giá trị ngoại lệ. Trung vị được sử dụng để đo lường giá trị trung tâm của dữ liệu mà không bị ảnh hưởng nhiều bởi các giá trị ngoại lệ. Nó là một phép đo đơn giản và ổn định trong trường hợp dữ liệu có các giá trị ngoại lệ.
Đối xứng và phân bố của dữ liệu: Trung vị được sử dụng
Như vậy, nhóm MBA đã trình bài chi tiết sự khác nhau giữa trung bình và trung vị, đồng thời cũng là định nghĩa và cách tính 2 giá trị này
Các bạn cần hỗ trợ kiến thức, hoặc xử lý số liệu cứ liên hệ nhé
– Zalo, Viber, SMS
– Facebook: http://facebook.com/hoidapSPSS/
– Email: hotrospss@gmail.com