Cỡ mẫu SEM thường được cho là yêu cầu mẫu lớn hơn so với các phương pháp tiếp cận đa biến khác. Vì trước khi chạy SEM phải chạy phân tích nhân tố EFA, nên kích thước mẫu cần thiết cho phân tích nhân tố khám phá cũng là 1 yếu tố được tính để tính cỡ mẫu SEM. Lấy càng nhiều mẫu thì thường tốn nhiều thời gian và tốn kém chi phí hơn để lấy, câu hỏi quan trọng trong SEM liên quan đến việc cần một mẫu lớn như thế nào để tạo ra kết quả đáng tin cậy.
Bốn yếu tố ảnh hưởng cỡ mẫu của SEM
Bốn cân nhắc ảnh hưởng đến kích thước mẫu cần thiết cho SEM bao gồm: (1) tính chuẩn đa biến(multivariate normality) của dữ liệu, (2) kỹ thuật ước lượng, (3) độ phức tạp của mô hình, (4) sai số trung bình phương sai giữa các chỉ số reflective indicators.
1.Multivariate Normality
Khi dữ liệu sai lệch nhiều hơn so với giả định về tính chuẩn đa biến multivariate normality, thì tỷ lệ quan sát trên các tham số cần phải tăng lên. Một tỷ lệ được chấp nhận chung để giảm thiểu các vấn đề về độ lệch so với normality là 10 người trả lời cho mỗi tham số được ước tính trong mô hình.
2.Kĩ thuật ước lượng SEM
Thủ tục ước tính SEM phổ biến nhất là ước tính khả năng xảy ra tối đa (Maximum Likelihood Estimation -MLE). Các nghiên cứu mô phỏng cho thấy rằng trong điều kiện lý tưởng, MLE cung cấp kết quả hợp lệ và ổn định cho các mô hình đơn giản với kích thước mẫu nhỏ đến 50.Như một mức tối thiểu tuyệt đối, SEM với kĩ thuật MLE không thể giải được với kích thước mẫu bằng hoặc nhỏ hơn số lượng biến được đo lường trong một mô hình.
3.Độ phức tạp của mô hình Model Complexity
Có thể thử nghiệm các mô hình đơn giản hơn với các mẫu nhỏ hơn. Theo nghĩa đơn giản, mô hình có càng nhiều biến thì yêu cầu mẫu càng nhiều. Tuy nhiên, các mô hình có thể phức tạp theo những cách khác nhau mà tất cả đều yêu cầu kích thước mẫu lớn hơn:
– Nhiều khái niệm yêu cầu nhiều tham số hơn được ước tính.
– Khái niệm có ít hơn ba biến đo lường / chỉ báo.
– Các phép phân tích đa nhóm yêu cầu một mẫu thích hợp cho mỗi nhóm.
Vai trò của cỡ mẫu là tạo ra nhiều thông tin hơn và độ ổn định cao hơn. Một khi nhà nghiên cứu đã vượt quá kích thước mẫu tối thiểu (nhiều hơn một quan sát so với số hiệp phương sai được quan sát), các mẫu lớn hơn có nghĩa là ít biến đổi hơn và tăng độ ổn định trong các giải pháp. Do đó, độ phức tạp của mô hình dẫn đến nhu cầu về các mẫu lớn hơn.
4.Sai số trung bình phương sai giữa các chỉ số reflective indicators
Nghiên cứu gần đây chỉ ra khái niệm communality là một cách phù hợp hơn để tiếp cận vấn đề cỡ mẫu. Communality đại diện cho lượng biến động trung bình giữa các biến đo lường / chỉ số được giải thích bởi mô hình đo lường. Các lý thuyết đo lường tiêu chuẩn cho phép bất kỳ biến đo lường nào chỉ tải trên một cấu trúc tiềm ẩn duy nhất. Communality của một mục có thể được tính trực tiếp bằng bình phương của hệ số tải chuẩn hóa của một biến trên cấu trúc của nó. Các nghiên cứu cho thấy rằng kích thước mẫu lớn hơn được yêu cầu khi Communality trở nên nhỏ hơn (nghĩa là các cấu trúc không được quan sát không giải thích được nhiều phương sai trong các mục được đo lường). Các mô hình có chứa nhiều cấu trúc với Communality nhỏ hơn 0,5 (tức là standardized loading nhỏ hơn 0,7) cũng yêu cầu kích thước lớn hơn để hội tụ và ổn định mô hình.
Tóm tắt về sample size cỡ mẫu của SEM
Các hướng dẫn trước đây như “luôn tối đa hóa kích thước mẫu của bạn” và “kích thước mẫu 300 là bắt buộc” là không phù hợp. Các mẫu lớn hơn thường tạo ra các giải pháp ổn định hơn, đặc biệt khi các vấn đề về dữ liệu hoặc đo lường tồn tại. Dựa trên thảo luận về cỡ mẫu, các gợi ý sau đây về cỡ mẫu tối thiểu được đưa ra dựa trên độ phức tạp của mô hình và các đặc điểm cơ bản của mô hình đo lường:
– Cỡ mẫu tối thiểu — 100: Mô hình chứa năm cấu trúc trở xuống, mỗi cấu trúc có nhiều hơn ba mục (biến quan sát) và có Communality cao (.6 hoặc cao hơn).
– Cỡ mẫu tối thiểu — 150: Mô hình có bảy cấu trúc hoặc ít hơn, Communality khiêm tốn (.5) và không có cấu trúc không xác định (underidentified constructs- là cấu trúc có ít hơn 3 thang đo)
– Cỡ mẫu tối thiểu — 300: Mô hình có bảy cấu trúc trở xuống, Communality thấp hơn (dưới .45) và / hoặc nhiều cấu trúc không xác định (ít hơn ba thang đo).
– Cỡ mẫu tối thiểu — 500: Mô hình có số lượng lớn các cấu trúc, một số có Communality thấp và / hoặc tồn tại thang đo có cấu trúc không xác định (underidentified constructs- là cấu trúc có ít hơn 3 thang đo)
- Công cụ Stats Tools Package dùng để tính độ tin cậy tổng hợp và phương sai trích tự động
- Hướng dẫn download và cài đặt phần mềm AMOS version 20
- So sánh SPSS và EVIEWS khi phân tích hồi quy, cùng một bộ số liệu
- 3 cách đặt tên nhân tố bị tách/gộp sau khi phân tích EFA
- Giá trị Q2 trong SmartPLS4 được tính như thế nào