Hướng dẫn thực hành phân tích hồi quy nhị phân binary logistic  

Chào các bạn,
Hôm nay nhóm giới thiệu video về cách thực hành chạy hồi quy binary logistic. Mô hình này dùng khi biến phụ thuộc dạng nhị phân, chỉ có hai giá trị 0  hoặc 1.
Bên dưới có hướng dẫn chi tiết ý nghĩa các bảng được đề cập trong video.

 

Về mô hình: đây là mô hình xác định khả năng trả nợ dựa vào  6 yếu tố độc lập.
Mô hình có 6 biến độc lập:

THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN

Và 1 biến phụ thuộc là TRANO. 
Biến phụ thuộc dạng nhị phân có hai giá trị 0 và 1 tương ứng với không trả được nợ và trả được nợ.
Khi chạy ra các kết quả sau:
-Omnibus Tests of Model Coefficients: Giống kiểm định F bên hồi quy đa biến, sig<5% nên bác bỏ giả thiết Ho: B1=B2=B3…=0
Omnibus Tests of Model Coefficients
 
 
Chi-square
df
Sig.
Step 1
Step
107.435
6
0
Block
107.435
6
0
Model
107.435
6
0

Bảng Model Summary

 
 
Model Summary
Step
-2 Log likelihood
Cox & Snell R Square
Nagelkerke R Square
1
129.147a
.466
.623
 
 Chỉ số -2 Log  likelihood: càng nhỏ càng tốt,cách tính ngược
lại với R bình phương của hồi quy đa biến. Nếu nhỏ thì thể hiện độ phù hợp khá
tốt của mô hình tổng thể
 
Bảng Classification Table cho thấy phân loại đối tượng trả được nợ và không trả được nợ theo hai tiêu chí : quan sát thực tế và dự đoán
 
Classification Tablea
 
Observed
Predicted
 
TRANO
Percentage Correct
 
0
1
Step 1
TRANO
0
76
14
84.4
1
19
62
76.5
Overall Percentage
 
 
80.7
a. The cut value is
.500
 
 
 
 
Ý nghĩa:
Trong 90 trường hợp quan sát ko trả được nợ, thì dự đoán có 76 trường
hợp không trả được, vậy tỉ lệ dự đoán đúng là 76/90=84.4
Trong 81 trường hợp quan sát trả được nợ, dự đoán có 62 trường hợp
trả được, vậy tỉ lệ dự đoán đúng là 62/81=76.5
Vậy trung bình dự đoán đúng (76+62)/(76+62+14+19)=138/171=80.7 phần trăm
 
Variables in the Equation
 
 
B
S.E.
Wald
Df
Sig.
Exp(B)
Step 1a
THUNHAP
0.269
0.087
9.568
1
0.002
1.309
TUOI
0.049
0.017
8.285
1
0.004
1.05
TAISAN
0.006
0.002
5.536
1
0.019
1.006
DIENTICHDAT
0.001
0
7.974
1
0.005
1.001
HOCVAN
1.139
0.378
9.063
1
0.003
3.124
SOLUONGBATDONGSAN
1.024
0.304
11.329
1
0.001
2.785
Constant
-18.937
2.978
40.445
1
0
0
a. Variable(s) entered
on step 1: THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN.
 
 

Kiểm định Wald có mục đích, ý nghĩa sau

– Trong  hồi quy đa biến, giá trị t được sử dụng để đánh giá tầm quan trọng của mỗi hệ số. Trong hồi quy logistic sử dụng một dạng thống kê khác nhau, đó là thống kê Wald. Nó cung cấp mức ý nghĩa thống kê đối với từng hệ số ước lượng để kiểm tra giả thuyết , tương tự hồi quy đa biến.
– Ý nghĩa giải thích của kiểm định Wald trong hồi quy nhị phân giống như giá trị t sử dụng để kiểm định mức ý nghĩa của các hệ số hồi quy trong hồi quy đa biến thông thường

Ví dụ một người có các thông tin cá nhân như sau, ta sẽ dùng kết quả phương trình hồi quy để dự đoán khả năng trả nợ:

THUNHAP
TUOI
TAISAN
DIENTICHDAT
HOCVAN
SOLUONGBATDONGSAN
13.5
56
493
4,011
4
3
 
Hàm xác suất trả nợ
xacsuattrano[1]

 

Thế vào, kết quả E(Y/X)= 4.90/5.90=0.83
Kết luận, khả năng trả nợ của người này là 83%, và đây là khả năng trả nợ dự đoán, và dự đoán này đúng 80.7%
 
@liên hệ nhóm MBA để được hỗ trợ khi xử lý số liệu, để đạt được ý nghĩa thống kê khi phân tích hồi quy logistic với SPSS tại mail hotrospss@gmail.com