Category Archives: SPSS

Giá trị trung bình, trung vị, tứ phân vị: định nghĩa và phân biệt

Giá trị trung bình, trung vị, tứ phân vị

Nhóm Thạc Sĩ ĐH Bách Khoa giới thiệu giá trị trung bình, trung vị, tứ phân vị. Đây là các khái niệm cơ bản trong thống kê, được nhóm trình bày bằng đồ thị rất dễ hiểu. Bây giờ các bạn nhìn vào hình bên dưới nhé.

Ta có dãy số như sau: 6, 5, 8, 7, 12, 13, 15, 14, 2, 200, 1. Câu hỏi đặt ra là tìm giá trị trung bình, trung vị, tứ phân vị (cái này hơi khó hơn, nên nếu giờ các bạn chưa xem thì để xem dần dần cũng được nhé)

Giá trị trung bình

Trước tiên chúng ta sẽ làm việc dễ trước, đó là tìm giá trị trung bình cộng. Giá trị trung bình chính là tổng của tất cả các số, chia cho số lượng số, ở đây số lượng số là 11 số, như vậy giá trị trung bình cộng là (6+5+8+7+12+13+15+14+2+200+1)/11=25.72. Trung bình cộng của 11 số trên là 25.72

Giá trị trung vị

Bước 1: sắp xếp dãy số ở trên theo thứ tự tăng dần, ta được kết quả:1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200

Bước 2: xem định  nghĩa trung vị: Trung vị là giá trị đứng ở vị trí giữa trong một dãy số đã được sắp xếp có thứ tự. Trước và sau trị số trung vị sẽ có 50% quan sát.

Bước 3: như vậy dãy số ở trên có 11 số (1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200)

Số ở giữa chính sẽ chia đôi bộ số làm 2, bên trái nó có 5 số, bên phải nó có 5 số, như vậy đó chính là số 8. 8 chính là số trung vị của tập hợp ở trên( trung vị cũng còn được gọi là tứ phân vị thứ nhì nhé)

Định nghĩa giá trị trung vị

Đối với một tập dữ liệu, nó có thể được coi là giá trị "giữa". Đặc điểm cơ bản của giá trị trung vị trong việc mô tả dữ liệu so với giá trị trung bình là nó không bị sai lệch bởi một tỷ lệ nhỏ các giá trị cực lớn hoặc cực nhỏ, và do đó cung cấp một đại diện tốt hơn về giá trị đặc trưng.
Trung vị của một danh sách hữu hạn các số là số "ở giữa", khi các số đó được liệt kê theo thứ tự từ nhỏ nhất đến lớn nhất.
Nếu tập dữ liệu có số lượng quan sát lẻ, thì tập ở giữa được chọn. Ví dụ: danh sách bảy số sau 1, 3, 3, 6, 7, 8, 9 có giá trị trung vị là số 6
Một tập hợp số lượng quan sát chẵn không có giá trị giữa riêng biệt và giá trị trung bình thường được xác định là giá trị trung bình của hai giá trị giữa.Ví dụ, tập dữ liệu 1, 2, 3, 4, 5, 6, 8, 9 có giá trị trung vị là 4.5 nghĩa là (4 + 5) / 2

Giá trị tứ phân vị

Định nghĩa: điểm tứ phân vị (quartile) là giá trị bằng số phân chia một nhóm các kết quả quan sát bằng số thành bốn phần, mỗi phần có số liệu quan sát bằng nhau (=25% số kết quả quan sát). Tứ phân vị có 3 giá trị, đó là tứ phân vị thứ nhất (Q1), thứ nhì (Q2) và thứ ba (Q3). Ba giá trị này chia một tập hợp dữ liệu (đã sắp xếp dữ liệu theo trật từ từ bé đến lớn) thành 4 phần có số lượng quan sát đều nhau.

Xem lại dãy số 11 số ở trên của chúng ta (1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200)

Giá trị tứ phân vị thứ nhất Q1 bằng trung vị phần dưới, phần dưới là các số (1, 2, 5, 6, 7), là số 5

Giá trị tứ phân vị thứ hai Q2 chính bằng giá trị trung vị, chính là số 8

Giá trị tứ phân vị thứ ba Q3 bằng trung vị phần trên(12, 13, 14, 15, 200), là số 14

Như vậy các bạn đã hiểu được Giá trị trung bình, trung vị, tứ phân vị là gì.

So sánh trung bình và trung vị: giá trị trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ outlier, còn giá trị trung bình bị ảnh hưởng mạnh bởi các giá trị cực lớn, hoặc cực nhỏ trong bộ số liệu.

Bạn cứ trao đổi thêm với nhóm ở đây, hoặc comment bên dưới nhé

Liên hệ nhóm thạc sĩ Hỗ trợ SPSS.

– SMS, Zalo, Viber:

phone number

– Chat Facebook: http://facebook.com/hoidapSPSS/

– Email:                 hotrospss@gmail.com

Chạy phân tích nhân tố chung hay riêng cho biến độc lập và phụ thuộc

Vấn đề:

Thông thường khi làm luận văn với phương pháp hồi quy thì phân tích nhân tố chia làm hai bước
– Phân tích nhân tố chung cho tất cả các biến độc lập
– Phân tích nhân tố cho biến phụ thuộc
Tuy nhiên khi làm bài dạng mô hình cấu trúc tuyến tính, đa số sẽ chỉ chạy phân tích nhân tố duy nhất một lần đưa vào tất cả các biến.
Vậy tại sao có sự khác nhau như thế, bài này sẽ giải thích theo quan điểm của các nhà khoa học trong ngành nhé.( giáo sư Joseph F. Hair, Jr. University of South Alabama và cộng sự-Trang 135 sách: MULTIVARIATE  DATA  ANALYSIS EIGHTH EDITION 2018)

Nguyên gốc tiếng Anh:
For example, mixing dependent and independent variables in a single factor analysis and then using the derived factors to support dependence relationships is not appropriate.

Dịch ra là: Trộn biến độc lập và biến phụ thuộc trong một phép phân tích nhân tố đơn lẻ, sau đó sử dụng nhân tố đó để đánh giá các mối quan hệ là không phù hợp.
Giải thích thêm: đối với các mô hình nghiên cứu đã xác định trước đâu là biến độc lập, đâu là biến phụ thuộc. Thì bắc buộc phải chạy riêng phân tích nhân tố cho biến độc lập và biến phụ thuộc. Thực tế thì đây chính là cách chạy mô hình hồi quy thông dụng chúng ta vẫn hay làm.

Vậy trường hợp gom tất cả câu hỏi vào chạy chung phân tích nhân tố  là như thế nào?

Như ta thấy, mô hình này rất khó xác định biến nào là biến độc lập, biến nào là biến phụ thuộc, vì các biến quan hệ chằng chịt nhân quả với nhau. Mô hình này còn gọi là mô hình cấu trúc tuyến tính. Phân tích EFA áp dụng cho dạng mô hình SEM này phải chạy chung hết tất cả các biến, để đánh giá được giá trị hội tụ và phân biệt của các thang đo.

Một lưu ý quan trọng khác:

– Trường hợp chạy riêng biến độc lập, biến phụ thuộc: sử dụng phép quay Varimax, với phép trích xuất PCA principal component analysis.
– Trường hợp chạy chung tất cả các biến độc lập, biến phụ thuộc, sử dụng phép xoay promax, phép trích xuất PAF Principal Axis Factoring.
Sở dĩ có sự khác nhau này, do giả định của phép xoay Varimax là các nhân tố không được tương quan với nhau( thường thì nhân tố phụ thuộc có tương quan với nhân tố độc lập)Varimax rotation is orthogonal rotation in which assumption is that there is no intercorrelations between components.

Kết luận khi nào chạy phân tích nhân tố chung hay riêng cho biến độc lập và phụ thuộc

– Đối với mô hình hồi quy tuyến tính có 1 biến phụ thuộc: chạy efa 2 lần riêng biệt: lần 1 cho biến độc lập, lần 2 cho biến phụ thuộc.
– Đối với mô hình cấu trúc tuyến tính SEM, mô hình phức tạp, có nhiều hơn 1 biến phụ thuộc: chạy chung efa duy nhất 1 lần cho tất cả các biến.

Bạn cứ trao đổi thêm với nhóm ở đây, hoặc comment bên dưới nhé

Liên hệ nhóm thạc sĩ Hỗ trợ SPSS.

– SMS, Zalo, Viber:

phone number

– Chat Facebook: http://facebook.com/hoidapSPSS/

– Email:                 hotrospss@gmail.com

Câu hỏi đảo, câu hỏi ngược reverse code là gì?

Câu hỏi đảo, câu hỏi ngược reverse code là gì?

Trong thang đo likert, có thể trong cùng 1 nhân tố các bạn sẽ gặp những câu hỏi có nội dung ngược lại với các câu còn lại. Giả sử nhân tố THU NHẬP dưới đây có các câu có nội dung tích cực, thì có câu tô đỏ nội dung tiêu cực, đó chính là câu hỏi đảo reverse code.

Mục đích của câu hỏi đảo, câu hỏi ngược reverse code

Câu hỏi đảo là câu hỏi có nội dung ngược chiều với các câu khác trong nhóm, có một số mục đích chính sau:

  1. Câu hỏi đảo reverse code để kiểm tra xem người đánh bảng khảo sát có…buồn ngủ hay không? Tên gọi khác là câu hỏi gài. Vì thế, sau này khi kiểm tra bảng khảo sát, nếu các câu trong nhân tố được đánh giá ở mức cao(4..5 chẳng hạn) mà câu hỏi đảo cũng đánh giá ở mức cao luôn… Chứng tỏ người được hỏi ý kiến khảo sát họ không tập trung vào nội dung câu hỏi, họ đánh đại đánh bừa. Vì thế những bảng khảo sát này có thể được xem xét để loại bỏ ra khoảng bộ dữ liệu của bạn.
  2. Do thang đo kế thừa từ các nghiên cứu trước, các paper gốc quốc tế. Các paper này cũng sử dụng reverse code, nên nghiên cứu mình cũng dịch sát ý đó và làm câu hỏi đảo reverse code theo.
  3. Do nội dung của câu hỏi, nếu để thuận chiều thì nghe không êm tai lắm, có thể làm cho người ta đánh giá không trung thực, nên cần thiết phải làm câu hỏi đảo, câu hỏi ngược reverse code. Ví dụ:trong một bảng câu hỏi về lòng tự trọng, chúng ta có thể có một số câu hỏi tích cực(ví dụ: Tôi có thái độ tích cực đối với bản thân), nhưng cũng có một số câu hỏi từ ngữ tiêu cực (ví dụ: Đôi khi, tôi nghĩ mình chẳng giỏi gì cả). Và như vậy, câu này cần đổi lại là Tôi thường xuyên nghĩ mình giỏi 🙂

Các nhập liệu câu hỏi ngược vào chương trình SPSS

Các câu hỏi ngược phải được đảo ngược lại như đúng tên của nó trước khi đưa vào SPSS. Ví dụ quy tắc đảo đối với thang đo likert 5 như sau

Giá trị ban đầu Giá trị sau khi đảo
1 5
2 4
3 3
4 2
5 1

Như vậy bạn đã có khái niệm cơ bản nhất về câu hỏi đảo, câu hỏi ngược reverse code là gì nhé. Các thuật ngữ tương tự là: thang đo đảo, câu hỏi gài, reverse scale, negative item, reverse item

Bạn có thể trao đổi thêm với nhóm tại đây nhé:

Liên hệ nhóm thạc sĩ Hỗ trợ SPSS

– SMS, Zalo, Viber:

phone number

– Chat Facebook: http://facebook.com/hoidapSPSS/

– Email:                 hotrospss@gmail.com