All posts by hotrospss

Giá trị trung bình, trung vị, tứ phân vị: định nghĩa và phân biệt

Giá trị trung bình, trung vị, tứ phân vị

Nhóm Thạc Sĩ ĐH Bách Khoa giới thiệu giá trị trung bình, trung vị, tứ phân vị. Đây là các khái niệm cơ bản trong thống kê, được nhóm trình bày bằng đồ thị rất dễ hiểu. Bây giờ các bạn nhìn vào hình bên dưới nhé.

Ta có dãy số như sau: 6, 5, 8, 7, 12, 13, 15, 14, 2, 200, 1. Câu hỏi đặt ra là tìm giá trị trung bình, trung vị, tứ phân vị (cái này hơi khó hơn, nên nếu giờ các bạn chưa xem thì để xem dần dần cũng được nhé)

Giá trị trung bình

Trước tiên chúng ta sẽ làm việc dễ trước, đó là tìm giá trị trung bình cộng. Giá trị trung bình chính là tổng của tất cả các số, chia cho số lượng số, ở đây số lượng số là 11 số, như vậy giá trị trung bình cộng là (6+5+8+7+12+13+15+14+2+200+1)/11=25.72. Trung bình cộng của 11 số trên là 25.72

Giá trị trung vị

Bước 1: sắp xếp dãy số ở trên theo thứ tự tăng dần, ta được kết quả:1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200

Bước 2: xem định  nghĩa trung vị: Trung vị là giá trị đứng ở vị trí giữa trong một dãy số đã được sắp xếp có thứ tự. Trước và sau trị số trung vị sẽ có 50% quan sát.

Bước 3: như vậy dãy số ở trên có 11 số (1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200)

Số ở giữa chính sẽ chia đôi bộ số làm 2, bên trái nó có 5 số, bên phải nó có 5 số, như vậy đó chính là số 8. 8 chính là số trung vị của tập hợp ở trên( trung vị cũng còn được gọi là tứ phân vị thứ nhì nhé)

Định nghĩa giá trị trung vị

Đối với một tập dữ liệu, nó có thể được coi là giá trị "giữa". Đặc điểm cơ bản của giá trị trung vị trong việc mô tả dữ liệu so với giá trị trung bình là nó không bị sai lệch bởi một tỷ lệ nhỏ các giá trị cực lớn hoặc cực nhỏ, và do đó cung cấp một đại diện tốt hơn về giá trị đặc trưng.
Trung vị của một danh sách hữu hạn các số là số "ở giữa", khi các số đó được liệt kê theo thứ tự từ nhỏ nhất đến lớn nhất.
Nếu tập dữ liệu có số lượng quan sát lẻ, thì tập ở giữa được chọn. Ví dụ: danh sách bảy số sau 1, 3, 3, 6, 7, 8, 9 có giá trị trung vị là số 6
Một tập hợp số lượng quan sát chẵn không có giá trị giữa riêng biệt và giá trị trung bình thường được xác định là giá trị trung bình của hai giá trị giữa.Ví dụ, tập dữ liệu 1, 2, 3, 4, 5, 6, 8, 9 có giá trị trung vị là 4.5 nghĩa là (4 + 5) / 2

Giá trị tứ phân vị

Định nghĩa: điểm tứ phân vị (quartile) là giá trị bằng số phân chia một nhóm các kết quả quan sát bằng số thành bốn phần, mỗi phần có số liệu quan sát bằng nhau (=25% số kết quả quan sát). Tứ phân vị có 3 giá trị, đó là tứ phân vị thứ nhất (Q1), thứ nhì (Q2) và thứ ba (Q3). Ba giá trị này chia một tập hợp dữ liệu (đã sắp xếp dữ liệu theo trật từ từ bé đến lớn) thành 4 phần có số lượng quan sát đều nhau.

Xem lại dãy số 11 số ở trên của chúng ta (1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200)

Giá trị tứ phân vị thứ nhất Q1 bằng trung vị phần dưới, phần dưới là các số (1, 2, 5, 6, 7), là số 5

Giá trị tứ phân vị thứ hai Q2 chính bằng giá trị trung vị, chính là số 8

Giá trị tứ phân vị thứ ba Q3 bằng trung vị phần trên(12, 13, 14, 15, 200), là số 14

Như vậy các bạn đã hiểu được Giá trị trung bình, trung vị, tứ phân vị là gì.

So sánh trung bình và trung vị: giá trị trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ outlier, còn giá trị trung bình bị ảnh hưởng mạnh bởi các giá trị cực lớn, hoặc cực nhỏ trong bộ số liệu.

Bạn cứ trao đổi thêm với nhóm ở đây, hoặc comment bên dưới nhé

Liên hệ nhóm thạc sĩ Hỗ trợ SPSS.

– SMS, Zalo, Viber:

phone number

– Chat Facebook: http://facebook.com/hoidapSPSS/

– Email:                 hotrospss@gmail.com

Cách chạy phân tích nhân tố EFA khi làm mô hình SEM với AMOS

Cách chạy phân tích nhân tố EFA khi làm mô hình SEM với AMOS cũng tương tự chạy EFA dùng để phân tích hồi quy SPSS. Tuy nhiên có ba lưu ý, một là dùng phép xoay promax thay cho varimax, hai là phép trích xuất pricipal axis factoring thay vì pricipal component analysis, ba là đưa tất cả các biến không phân biệt độc  lập, phụ thuộc, trung gian vào chạy tất cả một lần chung duy nhất.

Video chi tiết cách chạy EFA khi phân tích với AMOS, trước khi chạy CFA, SEM:

Chi tiết cách chạy phân tích nhân tố EFA khi làm mô hình SEM với AMOS

Vào chọn menu : Analyze-> Data Reduction(hoặc Dimension Reduction) ->Factor

Chọn tất cả các biến trong mô hình( độc lập, phụ thuộc, trung gian…) đưa vào cột Variables bên phải.

Nhấn vào Descriptives, chọn KMO and Bartlett's test of sphericity

Bấm vào nút Extraction, chọn Pricipal axis factoring

Bấm vào nút Rotation, chọn Promax

Bấm vào nút Options, chọn Sorted by size(để sắp xếp hệ số tải từ cao xuống thấp cho dễ đọc) và chọn Suppress absolute values less than, gõ vào .3 ( để loại bỏ khỏi pattern matrix những giá trị bé hơn 0.3 để dễ nhìn)

Sau đó nhấn OK, kết quả sẽ hiển thị khá dài, sẽ chỉ phân tích một số bảng cần thiết

Cách diễn giải kết quả phân tích nhân tố EFA khi làm mô hình SEM với AMOS

Kết quả phân tích EFA cho thấy: Chỉ số KMO = 0.924 > 0.5, điều này chứng tỏ dữ liệu dùng để phân tích nhân tố là hoàn toàn thích hợp.
Mức ý nghĩa Sig.=0.000<0.05 trong kiểm định KMO and Bartlett's chứng tỏ các biến quan sát có tương quan với nhau( bác bỏ giả thuyết H0: các biến quan sát không có tương quan với nhau trong tổng thể) như vậy giả thuyết về ma trận tương quan giữa các biến là ma trận đồng nhất bị bác bỏ, tức là các biến có tương quan với nhau và thỏa điều kiện phân tích nhân tố.


Tổng phương sai trích là 75.115 >50%, chứng tỏ 7 nhân tố này giải thích 75.115% biến thiên của dữ liệu.
Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 7 có Eigenvalues nhỏ nhất = 1.215> 1.


Bảng Pattern Matrix cho ta biến 7 nhân tố này, mỗi nhân tố gồm những thành phần nào. Kết quả cho thấy các hệ số tải nhân tố factor loading đều lớn hơn 0.5 và không có hiện tượng xáo trộn hoặc tách, gộp nhân tố. Do đó có thể kết luận là kết quả efa phù hợp với mô hình ban đầu.

Một số lý thuyết liên quan về KMO, kiểm định Bartlett’s, giá trị Eigenvalue

  1. Trong phân tích nhân tố khám phá, chỉ số KMO dùng để xem xét sự thích hợp của phân tích nhân tố, nếu 0.5≤ KMO<1 thì phân tích nhân tố phù hợp với các dữ liệu.
  2. Kiểm định Bartlett’s xem xét giả thuyết H0: các biến không có tương quan trong tổng thể. Nếu kiểm định này có ý nghĩa thống kê (Sig <0.05) thì các biến đó tương quan với nhau trong tổng thể.
  3. Giá trị Eigenvalue dùng để xác định số lượng nhân tố, chỉ những nhân tố có eigenvalue lớn hơn 1 thì mới được giữ lại trong mô hình, những nhân tố có eigenvalue nhỏ hơn 1 sẽ bị loại vì không có tác dụng tóm tắt thông tin tốt hơn một biến gốc. Nghiên cứu này sử dụng phương pháp trích nhân tố Principal Axis Factoring với phép quay Promax, các biến có hệ số tải nhân tố (factor loading) nhỏ hơn 0.4 bị loại. Tuy nhiên để thang đo đảm bảo ý nghĩa thực tiễn thì trọng số EFA ≥ 0.5, do đó các biến có hệ số tải nhân tố <0.5 tiếp tục bị loại (Hair &ctg, 1998). Theo Gerbing và Anderson (1998), thang đo được chấp nhận khi tổng phương sai trích lớn hơn hoặc bằng 50%.

Liên hệ nhóm thạc sĩ Hỗ trợ SPSS.

– SMS, Zalo, Viber:

phone number

– Facebook: http://facebook.com/hoidapSPSS/

– Email:        hotrospss@gmail.com

Chạy phân tích nhân tố chung hay riêng cho biến độc lập và phụ thuộc

Vấn đề:

Thông thường khi làm luận văn với phương pháp hồi quy thì phân tích nhân tố chia làm hai bước
– Phân tích nhân tố chung cho tất cả các biến độc lập
– Phân tích nhân tố cho biến phụ thuộc
Tuy nhiên khi làm bài dạng mô hình cấu trúc tuyến tính, đa số sẽ chỉ chạy phân tích nhân tố duy nhất một lần đưa vào tất cả các biến.
Vậy tại sao có sự khác nhau như thế, bài này sẽ giải thích theo quan điểm của các nhà khoa học trong ngành nhé.( giáo sư Joseph F. Hair, Jr. University of South Alabama và cộng sự-Trang 135 sách: MULTIVARIATE  DATA  ANALYSIS EIGHTH EDITION 2018)

Nguyên gốc tiếng Anh:
For example, mixing dependent and independent variables in a single factor analysis and then using the derived factors to support dependence relationships is not appropriate.

Dịch ra là: Trộn biến độc lập và biến phụ thuộc trong một phép phân tích nhân tố đơn lẻ, sau đó sử dụng nhân tố đó để đánh giá các mối quan hệ là không phù hợp.
Giải thích thêm: đối với các mô hình nghiên cứu đã xác định trước đâu là biến độc lập, đâu là biến phụ thuộc. Thì bắc buộc phải chạy riêng phân tích nhân tố cho biến độc lập và biến phụ thuộc. Thực tế thì đây chính là cách chạy mô hình hồi quy thông dụng chúng ta vẫn hay làm.

Vậy trường hợp gom tất cả câu hỏi vào chạy chung phân tích nhân tố  là như thế nào?

Như ta thấy, mô hình này rất khó xác định biến nào là biến độc lập, biến nào là biến phụ thuộc, vì các biến quan hệ chằng chịt nhân quả với nhau. Mô hình này còn gọi là mô hình cấu trúc tuyến tính. Phân tích EFA áp dụng cho dạng mô hình SEM này phải chạy chung hết tất cả các biến, để đánh giá được giá trị hội tụ và phân biệt của các thang đo.

Một lưu ý quan trọng khác:

– Trường hợp chạy riêng biến độc lập, biến phụ thuộc: sử dụng phép quay Varimax, với phép trích xuất PCA principal component analysis.
– Trường hợp chạy chung tất cả các biến độc lập, biến phụ thuộc, sử dụng phép xoay promax, phép trích xuất PAF Principal Axis Factoring.
Sở dĩ có sự khác nhau này, do giả định của phép xoay Varimax là các nhân tố không được tương quan với nhau( thường thì nhân tố phụ thuộc có tương quan với nhân tố độc lập)Varimax rotation is orthogonal rotation in which assumption is that there is no intercorrelations between components.

Kết luận khi nào chạy phân tích nhân tố chung hay riêng cho biến độc lập và phụ thuộc

– Đối với mô hình hồi quy tuyến tính có 1 biến phụ thuộc: chạy efa 2 lần riêng biệt: lần 1 cho biến độc lập, lần 2 cho biến phụ thuộc.
– Đối với mô hình cấu trúc tuyến tính SEM, mô hình phức tạp, có nhiều hơn 1 biến phụ thuộc: chạy chung efa duy nhất 1 lần cho tất cả các biến.

Bạn cứ trao đổi thêm với nhóm ở đây, hoặc comment bên dưới nhé

Liên hệ nhóm thạc sĩ Hỗ trợ SPSS.

– SMS, Zalo, Viber:

phone number

– Chat Facebook: http://facebook.com/hoidapSPSS/

– Email:                 hotrospss@gmail.com