Hướng dẫn thực hành phân tích hồi quy nhị phân binary logistic  

Hôm nay, nhóm giới thiệu video hướng dẫn thực hành chạy hồi quy Binary Logistic trong SPSS. Đây là mô hình phân tích được sử dụng khi biến phụ thuộc có dạng nhị phân, chỉ gồm hai giá trị: 0 hoặc 1.
Bên dưới có hướng dẫn chi tiết ý nghĩa các bảng được đề cập trong video.Trong video, các bạn sẽ được hướng dẫn chi tiết cách:
-Chuẩn bị dữ liệu và kiểm tra dạng biến phù hợp cho hồi quy Binary Logistic.
-Thực hiện phân tích hồi quy trong SPSS.
-Đọc và giải thích các bảng kết quả, bao gồm:
+Omnibus Tests of Model Coefficients: Kiểm tra ý nghĩa thống kê của mô hình.
+Model Summary: Đánh giá độ phù hợp của mô hình qua các chỉ số như -2 Log likelihood, Cox & Snell R² và Nagelkerke R².
+Variables in the Equation: Ý nghĩa và tác động của từng biến độc lập lên khả năng trả nợ.

Mô hình được xây dựng để xác định khả năng trả nợ dựa trên 6 yếu tố độc lập:
THUNHAP: Thu nhập.
TUOI: Tuổi.
TAISAN: Tổng tài sản.
DIENTICHDAT: Diện tích đất sở hữu.
HOCVAN: Trình độ học vấn.
SOLUONGBATDONGSAN: Số lượng bất động sản sở hữu.
Biến phụ thuộc:
TRANO: Khả năng trả nợ, với:
0: Không trả được nợ.
1: Trả được nợ.

Biến phụ thuộc dạng nhị phân có hai giá trị 0 và 1 tương ứng với không trả được nợ và trả được nợ.
Khi chạy ra các kết quả sau:
-Omnibus Tests of Model Coefficients: Giống kiểm định F bên hồi quy đa biến, sig<5% nên bác bỏ giả thiết Ho: B1=B2=B3…=0
Omnibus Tests of Model Coefficients
Chi-square
df
Sig.
Step 1
Step
107.435
6
0
Block
107.435
6
0
Model
107.435
6
0

Bảng Model Summary

Model Summary
Step
-2 Log likelihood
Cox & Snell R Square
Nagelkerke R Square
1
129.147a
.466
.623
Chỉ số -2 Log  likelihood: càng nhỏ càng tốt,cách tính ngược lại với R bình phương của hồi quy đa biến. Nếu nhỏ thì thể hiện độ phù hợp khá tốt của mô hình tổng thể
Bảng Classification Table cho thấy phân loại đối tượng trả được nợ và không trả được nợ theo hai tiêu chí : quan sát thực tế và dự đoán
Classification Tablea
Observed
Predicted
TRANO
Percentage Correct
0
1
Step 1
TRANO
0
76
14
84.4
1
19
62
76.5
Overall Percentage
80.7
a. The cut value is
.500
Ý nghĩa:
Trong 90 trường hợp quan sát ko trả được nợ, thì dự đoán có 76 trường
hợp không trả được, vậy tỉ lệ dự đoán đúng là 76/90=84.4
Trong 81 trường hợp quan sát trả được nợ, dự đoán có 62 trường hợp
trả được, vậy tỉ lệ dự đoán đúng là 62/81=76.5
Vậy trung bình dự đoán đúng (76+62)/(76+62+14+19)=138/171=80.7 phần trăm
Variables in the Equation
B
S.E.
Wald
Df
Sig.
Exp(B)
Step 1a
THUNHAP
0.269
0.087
9.568
1
0.002
1.309
TUOI
0.049
0.017
8.285
1
0.004
1.05
TAISAN
0.006
0.002
5.536
1
0.019
1.006
DIENTICHDAT
0.001
0
7.974
1
0.005
1.001
HOCVAN
1.139
0.378
9.063
1
0.003
3.124
SOLUONGBATDONGSAN
1.024
0.304
11.329
1
0.001
2.785
Constant
-18.937
2.978
40.445
1
0
0
a. Variable(s) entered
on step 1: THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN.

Mục đích của kiểm định Wald
Trong hồi quy đa biến tuyến tính, giá trị t được sử dụng để đánh giá tầm quan trọng của từng hệ số hồi quy.
Trong hồi quy logistic, thay vì giá trị t, chúng ta sử dụng thống kê Wald để kiểm định mức độ ý nghĩa thống kê của các hệ số hồi quy.
Kiểm định này kiểm tra giả thuyết:
H0: Hệ số hồi quy của biến độc lập bằng 0 (biến không có tác động đáng kể đến biến phụ thuộc).
H1: Hệ số hồi quy khác 0 (biến có tác động đáng kể).
Ý nghĩa của kiểm định Wald
Tương tự giá trị t trong hồi quy đa biến, kiểm định Wald đo lường mức độ quan trọng của từng biến độc lập trong mô hình hồi quy logistic.
Nếu giá trị Wald lớn và p-value nhỏ (thường < 0.05):
Biến độc lập có ý nghĩa thống kê, nghĩa là biến này có ảnh hưởng đáng kể đến biến phụ thuộc.
Ngược lại, nếu p-value lớn, biến độc lập không có ý nghĩa trong mô hình.
Tóm lại
Kiểm định Wald giúp xác định biến nào nên được giữ lại trong mô hình hồi quy logistic.
Nó tương tự như việc sử dụng giá trị t trong hồi quy tuyến tính, nhằm đánh giá mức độ ý nghĩa của các hệ số hồi quy.

Ví dụ một người có các thông tin cá nhân như sau, ta sẽ dùng kết quả phương trình hồi quy để dự đoán khả năng trả nợ:

THUNHAP
TUOI
TAISAN
DIENTICHDAT
HOCVAN
SOLUONGBATDONGSAN
13.5
56
493
4,011
4
3
Hàm xác suất trả nợ
xacsuattrano[1]
Thế vào, kết quả E(Y/X)= 4.90/5.90=0.83
Kết luận, khả năng trả nợ của người này là 83%, và đây là khả năng trả nợ dự đoán, và dự đoán này đúng 80.7%
 
@liên hệ nhóm MBA để được hỗ trợ khi xử lý số liệu, để đạt được ý nghĩa thống kê khi phân tích hồi quy logistic với SPSS

– SMS, Zalo, Viber:

phone number

– Chat Facebook: http://facebook.com/hoidapSPSS/

 

 

4.5/5 - (33 bình chọn)
Theo dõi
Thông báo của
guest
0 Góp ý
Phản hồi nội tuyến
Xem tất cả bình luận