Khi nào không được dùng hồi quy tuyến tính? Những sai lầm khiến kết quả vô giá trị

Khi nào không được dùng hồi quy tuyến tính? ThS Khánh và team chỉ ra các trường hợp dùng hồi quy sai, vi phạm điều kiện và cách lựa chọn mô hình thay thế phù hợp để các bạn có thể hiểu rõ hơn nhé.

Khi nào không được dùng hồi quy tuyến tính

1. Hiểu sai bản chất của hồi quy tuyến tính

Hồi quy tuyến tính không phải lúc nào cũng dùng được, dù đây là phương pháp phổ biến nhất trong SPSS.
Nhiều sinh viên nghĩ rằng:  “Có biến độc lập và biến phụ thuộc là chạy hồi quy được. Đây là tư duy sai. Hồi quy tuyến tính chỉ phù hợp khi mối quan hệ giữa các biến là tuyến tính và thỏa các giả định thống kê nghiêm ngặt.

2. Khi biến phụ thuộc là biến định tính (Nominal / Binary)

Không được dùng hồi quy tuyến tính nếu:
-Biến phụ thuộc là Có / Không
-Nam / Nữ
-Đạt / Không đạt
Ví dụ:

– Khả năng mua hàng (có/không)

– Quyết định chọn trường (chọn/không chọn)

Trong các trường hợp này, hồi quy Logistic mới là phương pháp phù hợp.

3. Khi mối quan hệ giữa các biến không tuyến tính

Hồi quy tuyến tính giả định rằng: Khi X tăng 1 đơn vị thì Y tăng (hoặc giảm) một lượng cố định
Không dùng hồi quy tuyến tính khi:
-Dữ liệu có dạng cong (U-shape, inverted U)
-Hiệu ứng tăng nhanh rồi chậm dần
Nếu cố tình dùng hồi quy tuyến tính, mô hình sẽ:

– Giải thích sai bản chất mối quan hệ

– Cho hệ số không có ý nghĩa

Giải pháp: Biến đổi log, dùng hồi quy phi tuyến hoặc thêm biến bình phương (X²)

4. Khi vi phạm nghiêm trọng các giả định của mô hình

Hồi quy tuyến tính KHÔNG nên dùng nếu vi phạm:
-Đa cộng tuyến cao (VIF > 10)
-Phương sai sai số thay đổi (Heteroskedasticity)
-Sai số không phân phối chuẩn (trong mẫu nhỏ)
-Tự tương quan (dữ liệu chuỗi thời gian)
Nhiều sinh viên vẫn chạy và vẫn kết luận, đây là lỗi khiến hội đồng bác kết quả.

5. Khi kích thước mẫu không phù hợp

Không nên dùng hồi quy tuyến tính khi:
-Mẫu quá nhỏ so với số biến độc lập
-Có nhiều biến nhưng số quan sát hạn chế
Quy tắc thường dùng: – Tối thiểu n ≥ 50 + 8m (m: số biến độc lập)
Nếu mẫu không đủ lớn, kết quả hồi quy: không ổn định, dễ thay đổi khi thêm bớt quan sát

6. Khi dữ liệu có nhiều ngoại lệ (Outliers)

Hồi quy tuyến tính rất nhạy cảm với outliers.
Không dùng hồi quy tuyến tính khi:
-Có nhiều giá trị ngoại lai mạnh
-Outliers làm lệch hệ số hồi quy
Hệ số có thể đổi dấu, mất ý nghĩa thống kê.
Giải pháp: Loại bỏ outliers hợp lý

7. Dấu hiệu cho thấy bạn đang dùng hồi quy tuyến tính sai

Hội đồng thường nhận ra qua:

– R² thấp nhưng vẫn kết luận mạnh

– Hệ số không ý nghĩa nhưng vẫn giữ giả thuyết

– Không báo cáo kiểm định giả định, ví dụ như đa cộng tuyến

– Không giải thích được ý nghĩa hệ số

Đây là những dấu hiệu rớt tiềm ẩn khi bảo vệ luận văn.

Kết luận khi nào không được dùng hồi quy tuyến tính

Hồi quy tuyến tính không sai, sai là dùng không đúng lúc.
Biết khi nào không được dùng hồi quy tuyến tính giúp bạn:

– Chọn đúng phương pháp

– Kết quả có giá trị khoa học

– Tự tin bảo vệ trước hội đồng
phantichspss.com – Hỗ trợ kiểm tra điều kiện hồi quy, lựa chọn mô hình phù hợp và diễn giải kết quả đúng chuẩn học thuật.

Còn đây là hướng dẫn chi tiết cách chạy và phân tích hồi quy nhé:

Hướng dẫn thực hành cách phân tích hồi quy đa biến

Đánh giá bài viết
Theo dõi
Thông báo của
guest
0 Góp ý
Phản hồi nội tuyến
Xem tất cả bình luận