Cách phát hiện đa cộng tuyến trong hồi quy nhị phân logit

Tác hại của đa cộng tuyến trong hồi quy nhị phân logit

Vấn đề đa cộng tuyến ảnh hưởng đến việc giải thích các hệ số trong hồi quy logistic theo cách tương tự như các phương pháp đa biến khác, có lẽ gần giống nhất với hồi quy tuyến tính đa biến. Mức độ đa cộng tuyến cao làm giảm tác động duy nhất của các biến độc lập liên quan và do đó làm sai lệch hệ số ước tính và sai số chuẩn của chúng.

Mặc dù không phải là một vấn đề đối với mức độ phù hợp của mô hình, nhưng nó có khả năng gây nhầm lẫn cho việc giải thích. Hầu hết các chương trình phần mềm chạy hồi quy logistic không cho mục chọn để kiểm tra hiện tượng đa cộng tuyến, nhưng nhà phân tích có thể dễ dàng sử dụng hồi quy đa biến tuyến tính để thu được thông tin này.

Cách phát hiện đa cộng tuyến trong hồi quy nhị phân logit

Vì đa cộng tuyến chỉ dựa trên các biến độc lập trong một mô hình, ta đưa các biến phụ thuộc và độc lập trong hồi quy nhị phân sang chạy bên hồi quy đa biến để thu được kết quả đa cộng tuyến. Lúc này các hệ số ước tính rõ ràng không được sử dụng, nhưng VIF và dung sai tolerance có thể áp dụng được.

Như với hồi quy tuyến tính đa biến thông thường, một cách tiếp cận khác là tính toán các mối tương quan nhị phân giữa các biến độc lập và bất kỳ mối tương quan giữa hai  biến nào bằng .50 hoặc lớn hơn cho thấy khả năng xảy ra các vấn đề đa cộng tuyến.