Hệ số B chưa chuẩn hóa so với hệ số Beta đã chuẩn hóa
Khi phân tích hồi quy có trường hợp các bạn thắc mắc khi nào sẽ dùng hệ số B chưa chuẩn hóa, khi nào sẽ dùng hệ số đã chuẩn hóa: Unstandardized Coefficients(B) và Standardized Coefficients(Beta), cũng có bạn hỏi tại sao khi viết phương trình hồi quy lại dùng beta chưa chuẩn hóa? Về bản chất, bạn có quyền dùng bất cứ cách nào, tuy nhiên bạn phải đưa ra kết luận kiến nghị ứng với cách dùng hệ số này nhé. Vì bản chất hai giá trị này khác nhau.
Dưới đây nhóm sẽ giải thích cụ thể ý nghĩa:
Hệ số B chưa chuẩn hóa phản ánh lượng biến thiên của Y khi một đơn vị X thay đổi. Trong khi đó Hệ số Beta đã chuẩn hóa phản ánh lượng biến thiên của độ lệch chuẩn (standard deviation) của Y khi một đơn vị độ lệch chuẩn của X thay đổi.
Cụ thể hơn, hệ số Beta đã chuẩn hóa là kết quả của việc giải phương trình hồi quy mà các biến độc lập, biến phụ thuộc đã được chuẩn hóa ( phương sai =1). Còn hệ số B chưa chuẩn hóa là kết quả của việc giải phương trình hồi quy mà các biến được giữ nguyên giá trị thô.
Việc chuẩn hóa hệ số beta thường dùng để trả lời câu hỏi: biến độc lập nào có tác động mạnh hơn vào biến phụ thuộc khi phân tích hồi quy đa biến, khi mà các biến đo lường độc lập có đơn vị đo lường khác nhau( ví dụ THU NHẬP được tính bằng dollars và KÍCH CỠ gia đình được tính bằng số người).
Trong phần mềm SPSS, hệ số chưa chuẩn hóa được kí hiệu là B, trong khi hệ số đã chuẩn hóa kí hiệu là Beta.
Việc chuẩn hóa một biến có lợi: là đơn vị đo lường của một biến được bỏ qua, làm cho việc so sánh dễ dàng hơn trong trường hợp các biến độc lập có đơn vị đo lường khác nhau
Công thức chuẩn hóa dữ liệu:
Đến đây có lẽ bạn sẽ hỏi làm thế nào để chuẩn hóa một biến.Việc này phần mềm tự tính, tuy nhiên nếu muốn tính bằng tay để hiểu hơn về công thức thì cách làm là: Để chuẩn hóa một biến bạn cần trừ giá trị của biến đó cho trung bình cộng của nó, sau đó chia tất cả cho độ lệch chuẩn của biến đó.
Dưới đây sẽ là bước chạy các hệ số đã được chuẩn hóa.
Trước tiên ta chạy hồi quy bình thường sẽ ra được kết quả, được bao trong hai hình màu vàng.
Sau khi chuẩn hóa bằng tay các hệ số F_KT, F_CV,…F_HL, bằng cách sử dụng công thức ở trên, còn độ lệch chuẩn tính trong excel bằng hàm STDEV.S(). Ta sẽ thực hiện chạy hồi quy lại. Kết quả là hai giá trị B và Beta là bằng nhau- đó là hai hình màu đỏ. Và hệ số Constant rất nhỏ, gần =0 ( 6.523E-16). Đó cũng là lí do trong cột Beta giá trị này không xuất hiện, do =0.
Lưu ý là giá trị đã chuẩn hóa và chưa chuẩn hóa của hệ số beta đã bằng nhau, vì trước khi chạy chúng ta đã thực hiện chuẩn hóa.
Dưới đây là một số đoạn trính từ wiki (http://en.wikipedia.org/wiki/Standardized_coefficient ) , dành cho các bạn say mê đọc tiếng anh:
In statistics, standardized coefficients or beta coefficients are the estimates resulting from an analysis carried out on independent variables that have been standardized so that their variances are 1. Therefore, standardized coefficients refer to how many standard deviations a dependent variable will change, per standard deviation increase in the predictor variable. Standardization of the coefficient is usually done to answer the question of which of the independent variables have a greater effect on the dependent variable in a multiple regression analysis, when the variables are measured in different units of measurement (for example, income measured in dollars and family size measured in number of individuals).
Before solving a multiple regression problem, all variables (independent and dependent) can be standardized. Each variable can be standardized by subtracting its mean from each of its values and then dividing these new values by the standard deviation of the variable. Standardizing all variables in a multiple regression yields standardized regression coefficients that show the change in the dependent variable measured in standard deviations.
Advantages: Standard coefficients’ advocates note that the coefficients ignore the independent variable’s scale of units, which makes comparisons easy.
Each variable can be standardized by subtracting its mean from each of its values and then dividing these new values by the standard deviation of the variable.
NHÓM HỖ TRỢ : hotrospss@gmail.com