Khái niệm về sự phù hợp mô hình model fit áp dụng cho các mô hình đo lường và có thể đánh giá sự phù hợp của một mô hình phân tích nhân tố khẳng định CFA.
Khi nào mô hình fit hơn, phù hợp hơn?
CFA là một công cụ đa biến tính toán ma trận hiệp phương sai ước lượng để xem tính nhất quán về lý thuyết bằng cách sử dụng các phương trình tương ứng với cấu trúc lý thuyết. Sau đó, ma trận hiệp phương sai ước tính (estimated covariance matrix) được so sánh với ma trận hiệp phương sai thực tế(observed covariance matrix), lấy từ dữ liệu hoặc quan sát được. Khi hai ma trận này trở nên giống nhau hơn thì mô hình càng phù hợp hơn.
Các chỉ số thống kê model fit
Có nhiều chỉ số thống kê về nhiều mức độ phù hợp của mô hình phải được xem xét để giúp hiểu được mức độ phù hợp thực sự của một mô hình. Chúng bao gồm chi-square kiểm định độ phù hợp và bậc tự do df, một chỉ số phù hợp tuyệt đối (chẳng hạn như GFI hoặc RMSEA) và một chỉ số phù hợp gia tăng (chẳng hạn như TLI hoặc CFI).Thực ra không có giá trị tuyệt đối nào cho các chỉ số phù hợp cho thấy mức độ phù hợp tốt (ngoại trừ kiểm định chi bình phương), chỉ các hướng dẫn được đề xuất là hợp lý( ví dụ như GFI thường yêu cầu >0.9 , nhưng việc này không tuyệt đối). Các giá trị liên quan đến các mô hình có thể chấp nhận được thay đổi tùy theo tình huống và phụ thuộc đáng kể vào cỡ mẫu, số lượng biến đo lường và tính cộng đồng communalities của các yếu tố (giá trị communalities là mức độ một items tương quan với tất cả các items khác).
Trái ngược với hồi quy OLS hoặc các kỹ thuật phụ thuộc khác nhằm dự đoán các mối quan hệ trong một phương trình đơn lẻ, mục tiêu thống kê của SEM dựa trên hiệp phương sai là tái tạo ma trận hiệp phương sai quan sát của tất cả các biến được đo cần thiết để kiểm tra một lý thuyết. Do đó, các thước đo về độ chính xác của dự đoán đối với các kỹ thuật khác (tức là R2 cho hồi quy bội hoặc PLS-SEM…) không phải là mục tiêu thống kê chính của SEM dựa trên hiệp phương sai. Điều cần thiết là một thước đo về sự phù hợp hoặc độ chính xác giải thích phản ánh mô hình tổng thể, chứ không phải các mối quan hệ riêng lẻ. Nhà nghiên cứu “chấp nhận hoặc từ chối” mô hình lý thuyết được thử nghiệm với CB-SEM bằng cách đánh giá mức độ chặt chẽ của mô hình lý thuyết phù hợp với dữ liệu quan sát.
Vì trọng tâm là toàn bộ mô hình lý thuyết, CB-SEM dựa vào ma trận hiệp phương sai quan sát giữa các biến được đo lường, chứa đầy đủ thông tin về cách tất cả các biến tương ứng với nhau. Sự phù hợp của mô hình được xác định bởi sự giống nhau kết quả giữa ma trận hiệp phương sai quan sát được và ma trận hiệp phương sai ước tính được tạo ra từ các phương trình đại diện cho mô hình lý thuyết được đề xuất. Nếu lý thuyết được đề xuất tạo ra các phương trình tái tạo chính xác sự tương ứng giữa các biến đo lường (ma trận hiệp phương sai quan sát), thì chúng ta có thể nói lý thuyết phù hợp với thực tế.
So sánh ma trận tương quan và ma trận hiệp phương sai
Tương quan chỉ là một trường hợp đặc biệt của hiệp phương sai. Ma trận tương quan chỉ đơn giản là ma trận hiệp phương sai khi các biến chuẩn hóa được sử dụng (tức là ma trận hiệp phương sai chuẩn hóa). Chìa khóa ở điểm này là nhận ra rằng chúng ta tính toán ma trận hiệp phương sai quan sát được từ các quan sát mẫu, giống như chúng ta tính toán ma trận tương quan. Nó không được ước tính, cũng không phụ thuộc vào một mô hình do nhà nghiên cứu áp đặt.
Tưởng tượng về ma trận hiệp phương sai trong SEM
Để hiểu cách dữ liệu được nhập vào SEM, hãy nghĩ đến ma trận hiệp phương sai giữa năm biến. Ma trận hiệp phương sai quan sát được sẽ chứa 25 giá trị. Năm giá trị đường chéo sẽ đại diện cho phương sai của mỗi biến với 10 số hạng hiệp phương sai duy nhất. Bởi vì ma trận hiệp phương sai là đối xứng, 10 số hạng duy nhất sẽ được lặp lại cả trên và dưới đường chéo. Kết quả là, số lượng giá trị duy nhất trong ma trận là năm giá trị đường chéo (phương sai) cộng với 10 đường chéo duy nhất (phương sai), với tổng số là 15. Ví dụ, ma trận hiệp phương sai kết quả bao gồm các giá trị sau. Ma trận của các giá trị không trùng lặp sẽ như sau: