Hồi qui (regression) trong spss!

Ở những bài viết trước, Luận Văn 2s đã hướng dẫn cho bạn tìm hiểu về nhân tố khám phá EFA, kiểm định độ tin cậy thang đo Cronbach’s Alpha, tương quan pearson… và cách thực hiện phân tích và đọc kết quả kiểm định bằng phần mềm thống kê SPSS. Tiếp tục, trong bài viết này chúng tôi sẽ gửi đến bạn toàn bộ kiến thức về lý thuyết và thực hành liên quan đến phân tíchhồi quy đa biến. Cùng khám phá nhé!

Lý thuyết về hồi quy đa biến

Hồi quy đa biến là một phần mở rộng của hồi quy tuyến tính đơn giản. Nó được sử dụng khi chúng ta muốn dự đoán giá trị của một biến dựa trên giá trị của hai hoặc nhiều biến khác. Biến chúng ta muốn dự đoán được gọi là biến phụ thuộc (hoặc đôi khi, biến kết quả, mục tiêu hoặc biến tiêu chí). Các biến chúng ta đang sử dụng để dự đoán giá trị của biến phụ thuộc được gọi là biến độc lập. Hồi quy đa biến cũng cho phép bạn xác định mức độ đóng góp nhiều, ít, không đóng góp... của từng nhân tố vào sự thay đổi của biến phụ thuộc.

Bạn đang xem: Hồi qui (regression) trong spss!

Ví dụ: Thu nhập, địa điểm sinh sống và số thành viên trong gia đình ảnh hưởng đến chi tiêu.

=>Biến độc lập:Thu nhập, địa điểm, số thành viên

=>Biến phụ thuộc: Chi tiêu

*
Lý thuyết về hồi quy đa biến

Trong nghiên cứu thống kê định lượng, phân tích hồi quy đa biến sẽ được thực hiện sau bước phân tích tương quan Pearson.

Ý nghĩa chỉ số trong hồi quy đa biến

Giá trị Adjusted R Square (R bình phương hiệu chỉnh) và R2 (R Square) phản ánh mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc. Mức biến thiên của 2 giá trị này là từ 0 - 1. Nếu càng tiến về 1 thì mô hình càng có ý nghĩa. Ngược lại, càng tiến về 0 tức là ý nghĩa mô hình càng yếu. Cụ thể hơn, nếu nằm trong khoảng từ 0.5 - 1 thì là mô hình tốt, Trị số Durbin – Watson (DW): Có chức năng kiểm tra hiện tượng tự tương quan chuỗi bậc nhất. Giá trị của DW biến thiên trong khoảng từ 0 đến 4. Nếu tương quan của các sai số kề nhau không xảy ra thì giá trị sẽ gần bằng 2. Nếu giá trị gần về 4 tức là các phần sai số có tương quan nghịch, gần về 0 thì các phần sai số có tương quan thuận. Trong trường hợp DW 3 thì khả năng rất cao xảy ra hiện tượng tự tương quan chuỗi bậc nhất.Giá trị Sig. của kiểm định F có tác dụng kiểm định độ phù hợp của mô hình hồi quy. Ở bảng ANOVA, nếu giá trị Sig. Mô hình hồi quy tuyến tính bội và tập dữ liệu phù hợp (và ngược lại).Giá trị Sig. của kiểm định t được sử dụng để kiểm định ý nghĩa của hệ số hồi quy. Nếu Sig. Biến độc lập có tác động đến biến phụ thuộc.Hệ số phóng đại phương sai VIF (Variance inflation factor): Kiểm tra hiện tượng đa cộng tuyến. Nếu VIF > 10 thì có hiện tượng đa cộng tuyến (Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005). Tuy nhiên, trên thực tế thực hành, chúng ta thường so sánh giá trị VIF với 2. Nếu VIF

Phân tích hồi quy đa biến bằng phần mềm SPSS

Cách chạy hồi quy đa biến trong SPSS

Ta xét ví dụ: Một nghiên cứu về sức khỏe của một nhà khoa học người Mỹ muốn dự đoán một chỉ số về thể lực và sức khỏe mang tên: "VO2 max" Thông thường, để thực hiện thủ tục này đòi hỏi phải có thiết bị phòng thí nghiệm đắt tiền và đòi hỏi một cá nhân phải tập thể dục tối đa. Nhưng vì cách làm này không khả thi, vì vậy ông đã làm một nghiên cứu dự đoán VO2 max của một cá nhân dựa trên các thuộc tính có thể được đo lường dễ dàng dựa trên bốn thuộc tính sau: age (tuổi), weight (cân nặng), heart rate (nhịp tim) và gender (giới tính) đối với 100 người.

Từ những dữ liệu của ví dụ, ta sẽ các biện phụ thuộc và biến độc lập như sau:

Biến phụ thuộc: VO2max (thể lực và sức khỏe tối đa)

Biến độc lập: age (tuổi), weight (cân nặng), heart rate (nhịp tim) và gender (giới tính).

Các bước thực hành phân tích hồi quy đa biến trong SPSS:

Bước 1: Để kiểm định hệ số tương quan pearson trong SPSS. Đầu tiên, tại thanh công cụ ta nhấp chọn: Analyze > Regression > Linear…

*

Bạn sẽ được kết quả như hình sau:

*

Bước 2: Chuyển biến phụ thuộc VO2 max vào ô Dependent; Chuyển các biến độc lập age, weight, heart_rate, gender vào ô Dependent bằng cách chọn và nhấn vào nút mũi tên.

*

Lưu ý: Tại Method cần phải để tùy chọn mặc định là Enter. Nếu vì lý do nào đó Enter không được chọn, bạn cần thay đổi Method trở lại tùy chọn là Enter.

Xem thêm: First Xiaomi Mi 8 Lite / Youth Edition, Xiaomi Mi 8 Youth Edition

Bước 3: Bấm vào ô Statistics. Cửa sổ Linear Regression: Statistics mở ra. Tại đây, nhấn chọn Collinearity diagnostics (để tính ra hệ số VIF – hệ số phóng đại phương sai) để đánh giá hiện tượng đa cộng tuyến. Sau đó nhấn vào ô Continue để trở lại hộp thoại Linear Regression.

*

Bước 4: Nhấn OK để output kết quả.

Đọc kết quả hồi quy đa biến trong SPSS

Sau khi hoàn thành bốn bước trong phần 1, ta sẽ được rất nhiều bảng kết quả. Tuy nhiên, chúng ta chỉ cần tập trung vào 3 bảng: Model Summary, ANOVA và Coefficients. Dựa vào ý nghĩa chỉ số trong hồi quy ở phần trước, chúng ta sẽ tiến hành đọc kết quả hồi quy đa biến trong SPSS lần lượt trong các bảng:

Bảng Model Summary:

*
Bảng Model Summary

Adjusted R Square (hệ số R bình phương hiệu chỉnh) = 0.559, tức là 4 biến độc lập đã đưa vào ảnh hưởng 55.9% sự thay đổi của biến VO2 max, 44.1% còn lại là ảnh hưởng của sai số tự nhiên và biến ngoài mô hình.

Bảng ANOVA:

*
Bảng ANOVA

Giá trị F= 32.393 với Sig. của kiểm định F =0.000 Mô hình hồi quy tuyến tính có thể có thể suy rộng và áp dụng cho tổng thể.

Bảng Coefficients:

*
Bảng Coefficients

Giá trị Sig. của kiểm định t đều nhỏ hơn 0.05 => 4 biến độc lập đều tác động có ý nghĩa thống kê đến biến phụ thuộc.

Hệ số phóng đại phương sai VIF đều bé hơn 2 = > không có hiện tượng đa cộng tuyến.

Trên đây là toàn bộ những kiến thức cơ bản về phân tích hồi quy đa biến trong SPSS. Nếu như trong quá trình thực hành, bạn gặp phải bất cứ vấn đề, sự cố nào đó, hãy liên hệ với nhóm Hỗ Trợ SPSS để được giải đáp nhanh nhất nhé! Chúc bạn thành công!

Leave a Reply

Your email address will not be published. Required fields are marked *

x

Welcome Back!

Login to your account below

Retrieve your password

Please enter your username or email address to reset your password.