Tag Archives: bậc tự do

Các mô hình over-indentified, under-identified, just-identified và công thức tính bậc tự do trong CFA

Số lượng thang đo trên mỗi nhân tố và sự xác định identification

Phần giới thiệu ngắn gọn về khái niệm sự xác định (identification) được cung cấp ở đây để làm rõ lý do tại sao ít nhất ba hoặc bốn items cho mỗi nhân tố được khuyến nghị. Nói chung, sự xác định (identification) liên quan đến việc có đủ thông tin tồn tại để xác định để giải mô hình SEM hoặc CFA hay không, giải ở đây là tìm ra được các thông số cần tính toán ước lượng trong mô hình.

Thông tin được cung cấp bởi ma trận hiệp phương sai mẫu sample covariance matrix. Trong mô hình CFA hoặc SEM, một tham số có thể được ước tính cho mỗi phương sai hoặc hiệp phương sai duy nhất trong ma trận hiệp phương sai quan sát được (tức là số hạng duy nhất trong ma trận hiệp phương sai). Do đó, ma trận hiệp phương sai cung cấp bậc tự do được sử dụng để ước tính các tham số, giống như số người trả lời cung cấp bậc tự do trong hồi quy. Trên thực tế, ma trận hiệp phương sai chứa đầy đủ thông tin về dữ liệu.

Công thức tính số phương sai / hiệp phương sai duy nhất

 Nếu có p items được đo, thì chúng ta có thể tính số phương sai / hiệp phương sai duy nhất theo công thức là:

 1 / 2(p(p+1))

Trong đó p là số biến được đo.

 Ví dụ: nếu có sáu items, thì có 21 phương sai / hiệp phương sai duy nhất do áp dụng công thức  1 / 2(p(p+1))= 1 / 2(6(6+1))=21 . Sau đó, một bậc tự do được sử dụng hết cho mỗi tham số được ước tính. Một cách khác để suy nghĩ về sự xác định Identification là tốn một bậc tự do để giải phóng một tham số trong bất kỳ SEM nào.

Ba cấp độ sự xác định identification

 Mô hình, và thậm chí cả các nhân tố, có thể được đặc trưng bởi mức độ sự xác định identification của chúng, được xác định bằng bậc tự do của mô hình sau khi tất cả các tham số ước lượng được chỉ định. Chúng ta sẽ thảo luận về ba cấp độ sự xác định identification.Lưu ý sự xác định identification nhân tố, sự xác định identification của mô hình tổng thể là hai khái niệm khác nhau nhé.

Underidentified

Một mô hình chưa xác định (còn được gọi là không xác định unidentified) có nhiều tham số được ước tính hơn các phương sai và hiệp phương sai của biến chỉ báo duy nhất trong ma trận phương sai / hiệp phương sai quan sát được. Ví dụ, mô hình đo lường cho một nhân tố duy nhất chỉ có hai items được đo như trong hình sau là không xác định được.

 Ma trận hiệp phương sai sẽ là 2 x 2 gồm 4 giá trị, bao gồm một hiệp phương sai duy nhất và phương sai của hai biến. Do đó, có ba giá trị duy nhất. Tuy nhiên, một mô hình đo lường của nhân tố này sẽ yêu cầu ước tính hai hệ số tải nhân tố (LX1 và LX2) và hai phương sai sai số (e1 và e2) (giả sử phương sai nhân tố được cố định thành một giá trị, thường là 1). Tất cả cần ước lượng 4 giá trị, mà ta chỉ có 3 tham số đầu vào. Bạn cứ tưởng tượng việc này giống như giải hệ phương trình vậy, số biến số nhiều hơn số phương trình thì không giải được.  Vì vậy, một giải pháp duy nhất để giải mô hình không thể được tìm thấy.

Just-identified

Sử dụng cùng một logic, mô hình chỉ báo ba items trong Hình sau gọi là Just-identified. Điều này có nghĩa là chỉ có đủ bậc tự do để ước tính tất cả các tham số tự do.

Ta có 3 phương sai và 3 hiệp phương sai duy nhất như phần tô đậm trong ma trận trên. Và ta cũng có 6 tham số cần ước lượng là 3 hệ số tải và 3 phương sai phân dư.

Tất cả thông tin được sử dụng, có nghĩa là phân tích CFA sẽ tái tạo ma trận hiệp phương sai mẫu giống hệt nhau. Do đó, các mô hình Just-identified có sự phù hợp hoàn hảo theo định nghĩa.

Theo công thức tính bậc tự do df, bậc tự do của nhân tố có 3 item bằng 0 , bởi vì: 3(3+1)/2-6=0

 Trong thuật ngữ SEM, một mô hình có bậc tự do bằng 0 được gọi là bão hòa saturated. Kết quả là giá trị chi-square đo độ phù hợp cũng bằng 0 . Các mô hình vừa được xác định không dùng để kiểm tra giả thuyết, bởi vì sự phù hợp của chúng được xác định do hoàn cảnh, do nhân tố có 3 thang đo thì nó sẽ như vậy. Kết quả là, chúng không được các nhà nghiên cứu quan tâm đến việc kiểm định giả thuyết.

Tóm lại khi số lượng phương sai / hiệp phương sai duy nhất vượt quá số lượng tham số ước tính thì ta có mô hình chưa xác định under-identified, hoặc bằng số lượng tham số ước tính thì ta có mô hình vừa xác định just-identified.

Over-identified

Các mô hình xác định quá mức có số lượng phương sai và hiệp phương sai duy nhất nhiều hơn số tham số cần ước lượng. Do đó, đối với bất kỳ mô hình đo lường được xác định quá mức nào, có thể tìm thấy một lời giải  với các bậc tự do df >0  và một giá trị phù hợp chi-bình phương hữu ích. Ảnh bên dưới là mô hình đo lường đơn chiều gồm bốn items tạo ra một nhân tố được xác định quá mức mà giá trị phù hợp có thể được tính toán

Ta có 8 tham số cần ước lượng , có bốn ước tính tải Lx1, Lx2, Lx3, Lx4  và bốn phương sai phần dư e1, e2, e3, e4 , tổng cộng là tám và 10 giá trị phương sai/hiệp phương sai duy nhất. Bậc tự do =10-8=2. Do đó, mô hình kết quả có hai bậc tự do

 Lưu ý rằng mặc dù CFA nhân tố hai items, nếu chỉ chạy mỗi 1 mình nó thì không được xác định, nhưng nếu nó được tích hợp vào một mô hình CFA với các nhân tố khác thì mô hình tổng thể có thể được xác định quá mức. Các quy tắc sự xác định Identification tương tự vẫn áp dụng cho mô hình tổng thể như đã mô tả trước đó. Tuy nhiên, các bậc tự do phụ từ một số nhân tố khác có thể cung cấp các bậc tự do cần thiết để xác định mô hình tổng thể.

Điều này có nghĩa là nhà nghiên cứu không nên lo lắng về việc xác định các nhân tố riêng lẻ, chỉ mô hình tổng thể? Câu trả lời là không! Mặc dù mô hình tổng thể được xác định, điều này không có nghĩa là các vấn đề cơ bản với các nhân tố hai items và một items biến mất hoàn toàn khi chúng tôi tích hợp chúng vào một mô hình lớn hơn. Nói một cách chính xác, tính đơn hướng unidimensionnality của các nhân tố có ít hơn bốn chỉ số items không thể được xác định một cách riêng biệt.  Các nhân tố được đo bằng một hoặc hai items cũng làm tăng khả năng xảy ra các vấn đề về gây nhiễu diễn giải. Các thang đo một và hai items có nhiều khả năng dẫn đến các vấn đề thống kê, bao gồm các vấn đề với sự hội tụ (xác định một giải pháp toán học thích hợp).

Tóm lại, khi chỉ định số lượng chỉ báo cho mỗi nhân tố tiềm ẩn, bạn nên làm như sau:

– Sử dụng ít nhất bốn chỉ báo bất cứ khi nào có thể.

– Có ba chỉ số cho mỗi nhân tố được chấp nhận, đặc biệt khi các nhân tố khác có nhiều hơn ba.

– Nên tránh các nhân tố có ít hơn ba chỉ số hoặc nếu được sử dụng thì cần ràng buộc constrained để xác định.

Công thức tính bậc tự do degree of freedom trong cfa

Nhắc lại công thức, bậc tự do DF bằng với các số lượng phương sai/hiệp phương sai duy nhất trừ cho số tham số cần ước lượng

DF =số lượng phương sai/hiệp phương sai duy nhấtsố tham số cần ước lượng

Trong đó công thức số lượng phương sai/hiệp phương sai duy nhất= (p(p+1))/2 , với p là số biến được đo.

Bậc tự do df=0: mô hình Under-identified

Bậc tự do df<0: mô hình Just-identified

Bậc tự do df>0: mô hình Over-identified