Phân tích hệ số, chiều hướng tác động trong hồi quy nhị phân

Các dạng phương trình biểu thị hồi quy nhị phân

Các hệ số ước tính cho các biến độc lập trong hồi quy nhị phân được ước tính bằng cách sử dụng giá trị logit làm thước đo phụ thuộc để đảm bảo rằng bất kỳ giá trị dự đoán nào (tức là bất kỳ giá trị logit nào) đều có thể được chuyển đổi trở lại xác suất nằm trong khoảng 0 và 1. Công thức mô hình là:

 Tuy nhiên, các hệ số ước tính trong công thức mô hình này liên quan đến các tác động đến giá trị log odds, một điều có thể khó giải thích. Vì vậy, chúng ta sẽ thấy rằng nếu chúng ta biến đổi công thức mô hình này (xem công thức mô hình bên dưới-bằng cách exponent 2 vế), chúng ta có thể có các hệ số của mô hình liên quan đến những thay đổi của tỷ lệ odds, dễ hiểu hơn

Cả hai công thức mô hình đều tương đương nhau, nhưng cái nào được chọn sẽ ảnh hưởng đến cách các hệ số được diễn giải. Nhiều chương trình phần mềm cung cấp hệ số logistic ở cả hai dạng, vì vậy người nghiên cứu phải hiểu cách diễn giải từng dạng. Chúng ta sẽ thảo luận về các vấn đề diễn giải trong phần sau. Quá trình này có thể chứa một hoặc nhiều biến độc lập và các biến độc lập có thể là số liệu hoặc phi số (nhị phân). Như chúng ta sẽ thấy ở phần sau của chúng ta về việc giải thích các hệ số, cả hai dạng của hệ số đều phản ánh cả hướng và độ lớn của mối quan hệ, nhưng được giải thích khác nhau.

Ý nghĩa thống kê của hệ số sử dụng kiểm định Wald

Giả sử ta có kết quả hồi quy logit với 2 biến độc lập là x13 và x17 như sau:

Hệ số ước lượng cho các biến độc lập và hằng số cũng có thể được đánh giá về ý nghĩa thống kê. Kiểm định Wald được sử dụng để đánh giá mức ý nghĩa theo cách tương tự như kiểm định t được sử dụng trong hồi quy đa biến. Trường hợp này cả 2 biến độc lập X13 và X17 đều có ý nghĩa thống kê trong hồi quy nhị phân do hệ số sig.<5%

Hồi quy logistic kiểm tra các giả thuyết về các hệ số riêng lẻ giống như đã được thực hiện trong hồi quy tuyến tính đa biến. Trong hồi quy tuyến tính đa biến, kiểm định thống kê là để xem liệu hệ số có khác đáng kể so với 0. Hệ số 0 cho thấy rằng hệ số không có tác động đến biến phụ thuộc. Trong hồi quy logistic, chúng ta cũng sử dụng kiểm định thống kê để xem liệu hệ số logistic có khác 0. Tuy nhiên, hãy nhớ rằng, trong hồi quy logistic sử dụng logit làm thước đo phụ thuộc, giá trị 0 tương ứng với odds là 1 hoặc xác suất của 50%. Các giá trị này cho biết xác suất là bằng nhau cho mỗi nhóm (tức là, một lần nữa không có ảnh hưởng của biến độc lập đến việc dự đoán). Trong hồi quy tuyến tính đa biến, giá trị t được sử dụng để đánh giá ý nghĩa của từng hệ số. Hồi quy logistic sử dụng một kiểm định khác, kiểm định Wald. Nó cung cấp ý nghĩa thống kê cho mỗi hệ số ước tính để việc kiểm tra giả thuyết có thể xảy ra giống như trong hồi quy tuyến tính đa biến. Nếu hệ số logistic có ý nghĩa thống kê, chúng ta có thể giải thích nó theo cách nó tác động đến xác suất ước tính và do đó dự đoán được biến phụ thuộc.

Chiều hướng tác động của biến độc lập lên biến phụ thuộc trong hồi quy nhị phân

Để đánh giá hướng của mối quan hệ của mỗi biến, chúng ta có thể kiểm tra hệ số logistic ban đầu B hoặc hệ số lũy thừa exp(B).

-Chúng ta hãy bắt đầu với các hệ số ban đầu B. Chúng ta có thể giải thích hướng của mối quan hệ trực tiếp từ dấu của các hệ số logistic ban đầu. Nếu hệ số có dấu dương, cho thấy mối quan hệ thuận giữa biến độc lập và xác suất dự đoán. Khi giá trị biến độc lập tăng lên, xác suất dự đoán sẽ tăng lên, do đó làm tăng khả năng của biến phụ thuộc xảy ra.

-Bây giờ chúng ta phân tích đến các hệ số lũy thừa exp(b), các giá trị trên 1 biểu thị mối quan hệ thuận và dưới 1 biểu thị mối quan hệ nghịch.

Trường hợp này cả 2 biến độc lập X13 và X17 đều có tác động cùng chiều đến biến phụ thuộc trong hồi quy nhị phân do hệ số B dương, exp(b) >1

Kích cỡ của sự thay đổi mối quan hệ

Phương pháp trực tiếp nhất để đánh giá mức độ thay đổi của xác suất do mỗi biến độc lập là kiểm tra các hệ số lũy thừa exponentiated coefficients exp(b). Hệ số lũy thừa trừ đi 1 bằng tỷ lệ phần trăm thay đổi của tỷ lệ odds (giống như tỷ lệ odds nhân với hệ số lũy thừa). Trong ví dụ trên,điều đó có nghĩa là tăng một điểm sẽ làm tăng odds lên 194% cho X13 và 532% cho X17. Những con số này có thể vượt quá 100% bởi vì chúng đang làm tăng tỷ lệ odds chứ không phải chính xác suất. Về tác động tương đối, chúng ta có thể thấy rằng X17 có tác động nhiều hơn hai lần đến odds trên mỗi đơn vị thay đổi so với X13.