Chào các bạn,
Hôm nay nhóm giới thiệu video về cách thực hành chạy hồi quy binary logistic. Mô hình này dùng khi biến phụ thuộc dạng nhị phân, chỉ có hai giá trị 0 hoặc 1.
Bên dưới có hướng dẫn chi tiết ý nghĩa các bảng được đề cập trong video.
Về mô hình: đây là mô hình xác định khả năng trả nợ dựa vào 6 yếu tố độc lập.
- Mô hình có 6 biến độc lập: THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN
- Và 1 biến phụ thuộc là TRANO.
Biến phụ thuộc dạng nhị phân có hai giá trị 0 và 1 tương ứng với không trả được nợ và trả được nợ.
Khi chạy ra các kết quả sau:
-Omnibus Tests of Model Coefficients: Giống kiểm định F bên hồi quy đa biến, sig<5% nên bác bỏ giả thiết Ho: B1=B2=B3…=0
Omnibus Tests of Model Coefficients
|
||||
Chi-square
|
df
|
Sig.
|
||
Step 1
|
Step
|
107.435
|
6
|
0
|
Block
|
107.435
|
6
|
0
|
|
Model
|
107.435
|
6
|
0
|
Bảng Model Summary
Model Summary
|
|||
Step
|
-2 Log likelihood
|
Cox & Snell R Square
|
Nagelkerke R Square
|
1
|
129.147a
|
.466
|
.623
|
Chỉ số -2 Log likelihood: càng nhỏ càng tốt,cách tính ngược lại với R bình phương của hồi quy đa biến. Nếu nhỏ thì thể hiện độ phù hợp khá tốt của mô hình tổng thể
Bảng Classification Table cho thấy phân loại đối tượng trả được nợ và không trả được nợ theo hai tiêu chí : quan sát thực tế và dự đoán
Classification Tablea
|
|||||
Observed
|
Predicted
|
||||
TRANO
|
Percentage Correct
|
||||
0
|
1
|
||||
Step 1
|
TRANO
|
0
|
76
|
14
|
84.4
|
1
|
19
|
62
|
76.5
|
||
Overall Percentage
|
80.7
|
||||
a. The cut value is
.500 |
Ý nghĩa:
Trong 90 trường hợp quan sát ko trả được nợ, thì dự đoán có 76 trường
hợp không trả được, vậy tỉ lệ dự đoán đúng là 76/90=84.4
hợp không trả được, vậy tỉ lệ dự đoán đúng là 76/90=84.4
Trong 81 trường hợp quan sát trả được nợ, dự đoán có 62 trường hợp
trả được, vậy tỉ lệ dự đoán đúng là 62/81=76.5
trả được, vậy tỉ lệ dự đoán đúng là 62/81=76.5
Vậy trung bình dự đoán đúng (76+62)/(76+62+14+19)=138/171=80.7 phần trăm
Variables in the Equation
|
|||||||
B
|
S.E.
|
Wald
|
Df
|
Sig.
|
Exp(B)
|
||
Step 1a
|
THUNHAP
|
0.269
|
0.087
|
9.568
|
1
|
0.002
|
1.309
|
TUOI
|
0.049
|
0.017
|
8.285
|
1
|
0.004
|
1.05
|
|
TAISAN
|
0.006
|
0.002
|
5.536
|
1
|
0.019
|
1.006
|
|
DIENTICHDAT
|
0.001
|
0
|
7.974
|
1
|
0.005
|
1.001
|
|
HOCVAN
|
1.139
|
0.378
|
9.063
|
1
|
0.003
|
3.124
|
|
SOLUONGBATDONGSAN
|
1.024
|
0.304
|
11.329
|
1
|
0.001
|
2.785
|
|
Constant
|
-18.937
|
2.978
|
40.445
|
1
|
0
|
0
|
|
a. Variable(s) entered
on step 1: THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN. |
Kiểm định Wald có mục đích, ý nghĩa sau
– Trong hồi quy đa biến, giá trị t được sử dụng để đánh giá tầm quan trọng của mỗi hệ số. Trong hồi quy logistic sử dụng một dạng thống kê khác nhau, đó là thống kê Wald. Nó cung cấp mức ý nghĩa thống kê đối với từng hệ số ước lượng để kiểm tra giả thuyết , tương tự hồi quy đa biến.
– Ý nghĩa giải thích của kiểm định Wald trong hồi quy nhị phân giống như giá trị t sử dụng để kiểm định mức ý nghĩa của các hệ số hồi quy trong hồi quy đa biến thông thường.
Ví dụ một người có các thông tin cá nhân như sau, ta sẽ dùng kết quả phương trình hồi quy để dự đoán khả năng trả nợ:
THUNHAP
|
TUOI
|
TAISAN
|
DIENTICHDAT
|
HOCVAN
|
SOLUONGBATDONGSAN
|
13.5
|
56
|
493
|
4,011
|
4
|
3
|
Hàm xác suất trả nợ
Thế vào, kết quả E(Y/X)= 4.90/5.90=0.83
Kết luận, khả năng trả nợ của người này là 83%, và đây là khả năng trả nợ dự đoán, và dự đoán này đúng 80.7%
@liên hệ nhóm MBA để được hỗ trợ khi xử lý số liệu, để đạt được ý nghĩa thống kê khi phân tích hồi quy logistic với SPSS
Xem thêm: