Phân tích hồi quy tuyến tính trong SPSS
Phân tích hồi quy là một công cụ mạnh mẽ để xác định trọng số và chiều hướng tác động của các nhân tố độc lập đến nhân tố phụ thuộc. Nhằm giúp bạn đọc hiểu rõ hơn tầm quan trọng của hồi quy trong phân tích, bài viết dưới đây sẽ cung cấp hướng dẫn chi tiết về Phân tích hồi quy tuyến tính trong SPSS, cách đọc và diễn giải kết quả một cách chuẩn xác, cũng như cách đánh giá các giả định của mô hình thông qua biểu đồ.
Nội dung chính
1. Hồi quy tuyến tính trong SPSS
Hồi quy tuyến tính trong SPSS là một kỹ thuật thống kê được thiết kế để dự đoán biến phụ thuộc dựa trên một hoặc nhiều biến độc lập. Phân tích này cho phép các nhà nghiên cứu xác định bản chất của mối quan hệ tuyến tính giữa các biến, từ đó xây dựng một mô hình dự đoán và rút ra các kết luận mang tính định lượng
Mô hình hồi quy tuyến tính trong SPSS có dạng:
Y = β0 + β1X1 + β2X2 + … + βpXp + ε
Trong đó:
- Y: giá trị của biến phụ thuộc (outcome)
- X1, X2, …, Xp: giá trị của các biến độc lập (predictors)
- β0, β1, β2, …, βp: hệ số ước lượng (estimated coefficients) cho từng biến độc lập
- ε: sai số ngẫu nhiên (residuals)
Trong mô hình hồi quy tuyến tính, chúng ta tìm cách xác định các hệ số hồi quy sao cho tổng bình phương khoảng cách giữa các giá trị thực tế và các giá trị dự đoán là nhỏ nhất. Sai số ngẫu nhiên (ε) biểu thị sự khác biệt này. Vì vậy, mục tiêu là tối thiểu hóa sai số này, và phương pháp bình phương tối thiểu là công cụ toán học được sử dụng để ước lượng các hệ số tối ưu, từ đó giảm thiểu tổng bình phương của các sai số.
2. Hướng dẫn cách chạy hồi quy tuyến tính và đọc kết quả trên SPSS
2.1. Trình tự các bước chạy hồi quy tuyến tính trên SPSS
Thực hiện phân tích hồi quy tuyến tính bội để đánh giá sự tác động của các biến độc lập này lên biến phụ thuộc. Chúng ta vào Analyze > Regression > Linear…

Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô Independents.

Vào mục Statistics, tích chọn các mục như trong ảnh và chọn Continue.


Vào mục Plots, tích chọn vào Histogram và Normal probability plot, kéo biến ZRESID thả vào ô Y, kéo biến ZPRED thả vào ô X như hình bên dưới. Tiếp tục chọn Continue.

Các thiết lập mặc định trong hộp thoại được giữ nguyên. Về phương pháp đưa biến vào mô hình hồi quy, người nghiên cứu có thể lựa chọn giữa Enter và Stepwise, tùy thuộc vào mục đích của nghiên cứu. Với bản chất của đề tài này là nghiên cứu khẳng định, dựa trên cơ sở lý thuyết đã có, phương pháp Enter được lựa chọn để đưa tất cả các biến độc lập vào mô hình đồng thời. Sau khi hoàn tất thiết lập, thực hiện lệnh phân tích bằng cách nhấp vào OK

SPSS sẽ xuất ra kết quả, chúng ta sẽ tập trung vào các bảng ANOVA, Model Summary, Coefficients và ba biểu đồ Histogram, Normal P-P Plot, Scatter Plot.
2.2. Phân tích kết quả chạy hồi quy tuyến tính trên SPSS
Khi chạy hồi quy ta cần quan tâm đến các thông số sau:
- Hệ số Beta: hệ số hồi quy chuẩn hoá cho phép so sánh trực tiếp giữa các hệ số dựa trên mối quan hệ giải thích của chúng với biến phụ thuộc.
- Hệ số R2: đánh giá phần biến động của biến phụ thuộc được giải thích bởi các biến dự báo hay biến độc lập. Hệ số này có thể thay đổi từ 0 đến 1.
- Kiểm định ANOVA để kiểm tra tính phù hợp của mô hình với tập dữ liệu gốc.
- Nếu mức ý nghĩa của kiểm định < 0.05 thì ta có thể kết luận mô hình hồi quy phù hợp với tập dữ liệu.
a) Bảng Model Summary
Trong phân tích hồi quy, hệ số xác định R2 (R square) là một thước đo thiết yếu để đánh giá khả năng giải thích của mô hình. Cụ thể, R2 phản ánh tỷ lệ phương sai của biến phụ thuộc được giải thích bởi tập hợp các biến độc lập. Giá trị này nằm trong khoảng từ 0 đến 1 và thường được trình bày trong bảng Model Summary

Tham số R bình phương hiệu chỉnh (Adjusted R Square) cho biết mức độ (%) sự biến thiên của biến phụ thuộc được giải thích bởi biến độc lập. Theo bảng cho thấy trên R2 =92,4%. nói rằng nói sự biến các yếu tố anh hưởng đến 92,4%. KQHDKD
Để kiểm tra giả định không có tự tương quan chuỗi bậc nhất, chúng ta xem xét giá trị Durbin–Watson. Trong trường hợp này, giá trị Durbin–Watson bằng 1.774, nằm trong phạm vi chấp nhận từ 1.5 đến 2.5. Điều này cho thấy mô hình không gặp phải hiện tượng tự tương quan chuỗi bậc nhất, đảm bảo tính hợp lệ của kết quả phân tích hồi quy (tham khảo Yahua Qiao, 2011)
b) Bảng ANOVA
Kiểm định độ phù hợp của mô hình, đặt ra giả thuyết là:
H0 : Các hệ số βi =0
H1 : Các hệ số βi ≠0
Để kiểm định H0, dùng đại lượng F, nếu xác xuất F nhỏ thì giả thiết H0 bị bác bỏ, giả thiết F được lấy từ phương sai ANOVA.

Từ kết quả trên cho thấy F = 1316.027 với giá trị sig = 0,000 < 0,05) nên ta đủ cơ sở để bác bỏ H0 chấp nhân H1.
Như vậy mô hình hồi quy đã xây dựng là phù hợp với tập dữ liệu, các biến độc lập đều có tác động nhất định đến biến phụ thuộc.
Tiếp theo, phân tích hồi quy để xác định mức độ 04 đo lường việc đến KQHDKD
c) Bảng Coefficients

- Sig. < 0.05: Giả thuyết H0 bị bác bỏ. Điều này chỉ ra rằng hệ số hồi quy của biến độc lập có ý nghĩa thống kê, tức là biến độc lập đó có tác động đáng kể lên biến phụ thuộc.
- Sig. > 0.05: Giả thuyết H0 được chấp nhận. Điều này ngụ ý rằng hệ số hồi quy của biến độc lập không khác 0 một cách có ý nghĩa thống kê, đồng nghĩa với việc biến đó không có tác động rõ ràng lên biến phụ thuộc
-Kết quả hồi quy cho thấy bảng..cho thấy cả 4 yếu tố có giá trị sig < 0,05, nên tất cả 04 yếu tố này đều có ý nghĩa thống kê ở độ tin cậy 95%. Vì vậy, các yếu tố này đều thật sự ảnh hưởng đến KQHDKD, và cả 4 yếu tố đều có hệ số góc góc dương nên cả 4 yếu tố đều ảnh hưởng tương quan thuận đến đến KQHDKD.
Phương trình hồi quy được viết lại như sau:
KQHDKD= 0.168+ 0.266* GS_F + 0.205* TT_F + 0.359* QT_F + 0.255* CH_F
2.3. Đánh giá giả định hồi quy qua 3 biểu đồ
a) Biểu đồ tần số phần dư chuẩn hóa Histogram
Việc các phần dư không tuân theo phân phối chuẩn có thể là hệ quả của nhiều vấn đề trong mô hình hồi quy, bao gồm việc lựa chọn mô hình không phù hợp, phương sai của sai số không đồng nhất (heteroscedasticity), hoặc số lượng quan sát chưa đủ lớn. Do đó, việc kiểm tra giả định này là bắt buộc và có thể được thực hiện thông qua nhiều phương pháp. Trong đó, chúng tôi sẽ sử dụng biểu đồ tần số (Histogram) để trực quan hóa phân phối của phần dư, và biểu đồ P-P Plot để so sánh phân phối thực tế của phần dư với phân phối chuẩn lý thuyết.

Để kiểm tra giả định phân phối chuẩn của phần dư bằng biểu đồ Histogram, chúng ta cần xem xét một số tiêu chí. Nếu giá trị Mean của phần dư gần bằng 0, độ lệch chuẩn Std. Dev gần bằng 1 và biểu đồ hiển thị một phân phối có dạng hình chuông, ta có thể kết luận rằng phân phối của phần dư xấp xỉ chuẩn. Dựa trên hình ảnh đã cung cấp, Mean có giá trị rất nhỏ (-3.23E-15) và Std. Dev có giá trị gần 1 (0.995). Những chỉ số này, cùng với hình dạng biểu đồ, cho thấy giả định phân phối chuẩn của phần dư không bị vi phạm.
b) Biểu đồ phần dư chuẩn hóa Normal P-P Plot
Ngoài cách kiểm tra bằng biểu đồ Histogram, thì P-P Plot cũng là một dạng biểu đồ được sử dụng phổ biến giúp nhận diện sự vi phạm giả định phần dư chuẩn hóa

Biểu đồ Normal P-P Plot được sử dụng để trực quan hóa sự phù hợp của phân phối phần dư với phân phối chuẩn lý thuyết. Khi các điểm dữ liệu phần dư phân bố gần sát với đường chéo 45 độ, giả định phân phối chuẩn được xem là không bị vi phạm. Ngược lại, sự sai lệch lớn của các điểm dữ liệu so với đường chéo cho thấy phần dư có phân phối không chuẩn. Trong trường hợp cụ thể này, các điểm dữ liệu tập trung sát vào đường chéo, cho thấy phân phối phần dư là xấp xỉ chuẩn, đảm bảo tính hợp lệ của giả định này.
c) Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính
Để xác định sự tuân thủ giả định về mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập, chúng ta có thể sử dụng biểu đồ phân tán (Scatter Plot). Biểu đồ này được vẽ bằng cách sử dụng các phần dư đã được chuẩn hóa và các giá trị dự đoán đã được chuẩn hóa. Thông qua việc phân tích biểu đồ, các nhà nghiên cứu có thể phát hiện các mô hình phi tuyến tính tiềm ẩn, qua đó đánh giá xem giả định tuyến tính có bị vi phạm hay không

Để kiểm tra giả định tuyến tính, chúng ta quan sát biểu đồ phân tán. Nếu các điểm dữ liệu phần dư chuẩn hóa phân tán ngẫu nhiên và tập trung xung quanh đường tung độ 0 và có xu hướng tạo thành đường thẳng, giả định về mối liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc được xem là thỏa mãn. Cần lưu ý rằng cách bố trí của các điểm dữ liệu có thể thay đổi tùy thuộc vào bản chất của biến phụ thuộc. Dựa trên biểu đồ ví dụ, sự phân bố của các phần dư chuẩn hóa tập trung xung quanh đường tung độ 0, do đó có thể kết luận rằng giả định tuyến tính không bị vi phạm.
Trong bài viết này, chúng tôi đã hướng dẫn Phân tích hồi quy tuyến tính trong SPSS một cách hiệu quả nhất. Hy vọng những thông tin này sẽ hữu ích cho bạn trong quá trình các bài nghiên cứu.
Nếu bạn gặp khó khăn khi thực hiện Phân tích hồi quy tuyến tính trong SPSS hoặc kết quả biến bị loại quá nhiều, bạn có thể tham khảo dịch vụ chạy thuê SPSS của XulysolieuAz hoặc liên hệ trực tiếp zalo/hotline 0911.070.546

Tôi là Hoàng Long, hiện tại tôi là Quản lý nội dung của Xử lý số liệu AZ– Cung cấp dịch vụ xử lý số liệu: SPSS, Stata, Eviews, Amos,…
Cam kết uy tín chất lượng. Chúng tôi đặt lợi ích của khách hàng là ưu tiên hàng đầu. Website: https://xulysolieuaz.com/– Hotline: 0911.070.546
GẶP TƯ VẤN VIÊN
Bình chọn Nội dung chính1. Giới thiệu phần mềm SPSS 202. Tải về phần mềm SPSS 20 full crack và hướng dẫn cài đặt 1. Giới thiệu phần mềm SPSS 20 SPSS là viết tắt của Statistical Package for the Social Sciences, là một gói phần mềm mạnh mẽ và được sử dụng rộng rãi trong phân […]
Bình chọn Các phiên bản SPSS được sử dụng rộng rãi hiện nay bao gồm SPSS 20, SPSS 26 và SPSS 27. Dựa trên sự tương đồng về giao diện và tính năng, người dùng có thể lựa chọn cài đặt phiên bản phù hợp: Đối với các phiên bản 20-22: Nên cài đặt SPSS 20. […]
Bình chọn Phân tích hồi quy là một công cụ mạnh mẽ để xác định trọng số và chiều hướng tác động của các nhân tố độc lập đến nhân tố phụ thuộc. Nhằm giúp bạn đọc hiểu rõ hơn tầm quan trọng của hồi quy trong phân tích, bài viết dưới đây sẽ cung […]
Bình chọn Phân tích tương quan Pearson là một kỹ thuật thống kê được sử dụng trong các nghiên cứu định lượng, giúp đánh giá mức độ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng. Đây là một bước phân tích tiền đề, thường được thực hiện trước khi tiến […]
Bình chọn Trong quá trình thực hiện luận văn, luận án, các nhà nghiên cứu cần chú trọng xây dựng thang đo chi tiết với các chỉ báo rõ ràng. Để đảm bảo thang đo này có tính nhất quán và độ tin cậy cao, việc kiểm định là một bước không thể thiếu, đặc […]
Bình chọn Trong một nghiên cứu khoa học hoặc luận văn, việc phân tích dữ liệu định lượng bằng phần mềm SPSS đòi hỏi hai bước kiểm tra quan trọng: đánh giá độ tin cậy của thang đo (sử dụng Cronbach’s Alpha) và đánh giá giá trị của thang đo (thông qua Phân tích nhân […]
Bình chọn Trong phần phân tích thống kê tần số trên SPSS, bảng tần số tập trung vào việc thống kê số lượng và cơ cấu phần trăm của các giá trị trong biến. Ngược lại, bảng mô tả (Descriptive) chú trọng vào việc tổng quát các yếu tố mô tả cơ bản nhất, bao […]
Bình chọn Kết quả thống kê tần suất cho phép chúng ta đánh giá các đặc điểm chung của mẫu nghiên cứu, chẳng hạn như đối tượng khảo sát là nam hay nữ, chủ yếu là người già hay trẻ, nghề nghiệp của họ, nơi cư trú, và nhiều yếu tố khác. Bài viết hướng […]
Bình chọn Các phiên bản SPSS được sử dụng rộng rãi hiện nay bao gồm SPSS 20, SPSS 26 và SPSS 27. Dựa trên sự tương đồng về giao diện và tính năng, người dùng có thể lựa chọn cài đặt phiên bản phù hợp: Đối với các phiên bản 20-22: Nên cài đặt SPSS 20. […]
Bình chọn Phân tích tương quan Pearson là một kỹ thuật thống kê được sử dụng trong các nghiên cứu định lượng, giúp đánh giá mức độ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng. Đây là một bước phân tích tiền đề, thường được thực hiện trước khi tiến […]
Bình chọn Trong quá trình thực hiện luận văn, luận án, các nhà nghiên cứu cần chú trọng xây dựng thang đo chi tiết với các chỉ báo rõ ràng. Để đảm bảo thang đo này có tính nhất quán và độ tin cậy cao, việc kiểm định là một bước không thể thiếu, đặc […]
Bình chọn Trong một nghiên cứu khoa học hoặc luận văn, việc phân tích dữ liệu định lượng bằng phần mềm SPSS đòi hỏi hai bước kiểm tra quan trọng: đánh giá độ tin cậy của thang đo (sử dụng Cronbach’s Alpha) và đánh giá giá trị của thang đo (thông qua Phân tích nhân […]
Bình chọn Trong phần phân tích thống kê tần số trên SPSS, bảng tần số tập trung vào việc thống kê số lượng và cơ cấu phần trăm của các giá trị trong biến. Ngược lại, bảng mô tả (Descriptive) chú trọng vào việc tổng quát các yếu tố mô tả cơ bản nhất, bao […]
Bình chọn Kết quả thống kê tần suất cho phép chúng ta đánh giá các đặc điểm chung của mẫu nghiên cứu, chẳng hạn như đối tượng khảo sát là nam hay nữ, chủ yếu là người già hay trẻ, nghề nghiệp của họ, nơi cư trú, và nhiều yếu tố khác. Bài viết hướng […]