Hướng Dẫn 6 Bước Phân Tích Hồi Quy Đa Biến Trong SPSS Và Giải Thích Giả Định Bằng Biểu Đồ

icon  9 Tháng 10, 2025 Nguyễn Tuyết Anh Đánh giá:  
0
(0)
Tổng hợp kiến thức hồi quy đa biến
0
(0)

Phân tích hồi quy đa biến rất hữu ích cho các nhà nghiên cứu để đánh giá mối quan hệ giữa biến độc lập và biến phụ thuộc. Từ đó, người nghiên cứu biết được tầm quan trọng của yếu tố dự đoán này với yếu tố dự đoán khác.

Để hiểu rõ hơn về bản chất của hồi quy đa biến và phân tích hồi quy đa biến trong SPSS. Bạn hãy cùng Luận văn 1080 tham khảo nội dung dưới đây.

Bản chất của hồi quy đa biến

Bản chất của hồi quy đa biến

1. Lý thuyết hồi quy đa biến

1.1. Hồi quy đa biến

Khái niệm: Hồi quy đa biến là một kỹ thuật thống kê được sử dụng nhằm phân tích mối quan hệ giữa nhiều biến độc lập và một biến phụ thuộc.

Mục đích: Phương pháp này giúp xác định mức độ ảnh hưởng của từng biến độc lập đến biến phụ thuộc, từ đó dự đoán giá trị của biến phụ thuộc khi các biến độc lập thay đổi.

1.2. Hồi quy tuyến tính đa biến

Khái niệm: Hồi quy tuyến tính đa biến là phương pháp xác định mối quan hệ tuyến tính giữa một biến phụ thuộc và nhiều biến độc lập.

Phương trình hồi quy tuyến tính đa biến có thể được biểu diễn bởi công thức sau:

Y = β0 + β1X1 + β2X2 + … + βnXn + ε

Trong đó:

  • Y: Biến phụ thuộc (biến cần dự đoán)
  • X1, X2, …, Xn: các biến độc lập
  • β0: Hệ số chặn (intercept)
  • β1, β2,… βn: Hệ số hồi quy (mức độ tác động của từng biến độc lập)
  • ε là sai số ngẫu nhiên

>> Đọc thêm: Hồi Quy Tuyến Tính Bội: Giải Mã Bí Mật Mô Hình Trong Phân Tích Dữ Liệu

1.3. Ví dụ về hồi quy đa biến

Ví dụ 1. Dựa vào phân tích hồi quy tuyến tính đa biến, chúng ta sẽ xem xét tác động kết hợp của ba biến số dự báo: căng thẳng trong cuộc sống, vị trí và tuổi tác đối với biến số kết quả của sức khỏe thể chất.

Ví dụ 2. Các nhà nghiên cứu có thể tiến hành chạy hồi quy đa biến trong SPSS để dự đoán huyết áp (biến phụ thuộc) từ các biến yếu tố như chiều cao, cân nặng, tuổi, số giờ tập thể dục mỗi tuần (biến độc lập). Bên cạnh đó, họ có thể thêm vào một số yếu tố chẳng hạn như giới tính.

2. 6 bước phân tích hồi quy đa biến trên SPSS

Các bước phân tích hồi quy đa biến

Các bước phân tích hồi quy đa biến trên SPSS

Trong bài viết này, chúng tôi sẽ giới thiệu đến bạn các bước phân tích hồi quy đa biến trong SPSS thông qua một ví dụ cụ thể giúp các bạn dễ dàng nắm rõ nội dung hơn.

2.1. Bước 1. Xác định và khai báo các biến sẽ được đưa vào mô hình hồi quy

Đầu tiên, ta cần xác định các biến Fd, t, D, N, f để tiến hành phân tích hồi quy đa biến:

Trong giao diện Data View, bạn vào Analyze → Regression → Linear… như hình bên dưới:

Bước 1 Analyze > Regression > Linear…

Bước 1. Xác định và khai báo các biến sẽ được đưa vào mô hình hồi quy.

2.2. Bước 2. Chọn phương pháp đưa các biến độc lập vào mô hình hồi quy.

Tại đây, bạn tiến hành thiết lập mô hình như sau:

  • Dependent: Chọn biến phụ thuộc (ví dụ: Fd) và đưa vào ô này.
  • Independent(s): Chọn các biến độc lập (ví dụ: t, D, N, f) và đưa vào ô tương ứng.
  • Method: Lựa chọn phương pháp đưa biến độc lập vào mô hình hồi quy.

Bước 2. Chọn biến độc lập và biến phụ thuộc

Bước 2. Chọn biến độc lập và biến phụ thuộc

Một hộp thoại mới Linear Regression sẽ xuất hiện. Tại phần Method, bạn có thể chọn một trong các phương pháp sau:

  • Enter: Đưa tất cả biến vào cùng lúc (Trong ví dụ này, chúng ta sẽ chọn phương pháp mặc định Enter.)
  • Remove: Loại toàn bộ biến trong một lượt.
  • Backward: Loại dần biến không có ý nghĩa.
  • Forward: Thêm dần biến có ý nghĩa.
  • Stepwise: Kết hợp Forward và Backward, tự chọn biến phù hợp dựa trên mức ý nghĩa thống kê (Sig.).

2.3. Bước 3. Lựa chọn những chỉ số thống kê trong Statistics

Bước 3 Hộp thoại Linear Regression Statistics

Bước 3 Hộp thoại Linear Regression Statistics trong SPSS

Bước Statistics giúp người nghiên cứu lựa chọn những chỉ số thống kê cần hiển thị để đánh giá:

  • Estimates: Hiện hệ số hồi quy (mặc định).
  • Confidence Interval: Khoảng tin cậy 95% cho hệ số.
  • Covariance Matrix: Ma trận phương sai – hiệp phương sai.
  • Model Fit: Đánh giá độ phù hợp (R, R², ANOVA).
  • R² Change: Độ tăng R² khi thêm biến độc lập.
  • Descriptives: Trung bình, độ lệch chuẩn, tương quan.
  • Collinearity Diagnostics: Kiểm tra đa cộng tuyến (VIF, CI, Tolerance).
  • Part & Partial Correlation: Tương quan riêng giữa biến độc lập – phụ thuộc.
  • Durbin–Watson: Kiểm định tự tương quan phần dư.
  • Residuals: Thống kê phần dư để kiểm tra giả định.

2.4. Bước 4 chạy hồi quy đa biến: Plots

Khi trở về hộp thoại Linear Regression, bạn tiếp tục chọn Plots để vẽ các dạng đồ thị liên quan đến mô hình hồi quy đa biến.

Bước 4. Giao diện hộp thoại Linear Regression Plots

Bước 4. Giao diện hộp thoại Linear Regression Plots trong SPSS

Tại đây, biến phụ thuộc, các dạng của biến phần dư (residual) và các dạng biến độc lập sẽ xuất hiện ở danh sách biến nguồn để bạn chọn cho trục tung Y và trục hoành X. Trong đó:

  • *ZPRED: giá trị dự đoán (hay lý thuyết chuẩn hóa).
  • *ZRESID: phần dư chuẩn hóa.
  • *DRESID: phần dư loại bỏ quan sát đang xem xét.
  • *ADJPRED: giá trị dự đoán điều chỉnh.
  • *SRESID: phần dư student hóa.
  • *SDRESID: phần dư loại bỏ quan sát đang xem xét được student hóa.

Với các dạng biểu đồ như: Histogram, Normal probability plot, Standardized Residual Plots, Produce all partial plots,…

2.5. Bước 5: Lưu biến mới trong phân tích hồi quy

Trong giao diện Linear Regression, bạn tiếp tục chọn Save để sao lưu các biến mới trong phân tích hồi quy đa biến. Bước 5 Giao diện Linear Regression Save

Bước 5 Giao diện Linear Regression Save trong SPSS

SPSS sẽ tự động gán tên biến mới cho bất cứ thông số nào bạn muốn sao lưu.

2.6. Bước 6: Kiểm tra tính xác thực của dữ liệu trước khi chạy mô hình

Bước 6. Hộp thoại Linear Regression Options

Bước 6. Hộp thoại Linear Regression Options trong SPSS

Tại đây, bạn có thể điều chỉnh các tiêu chuẩn biến vào hay ra khỏi mô hình hồi quy đa biến, hay điều chỉnh việc xử lý các quan sát thiếu dữ kiện trong mục Options:

3. Đọc kết quả phân tích hồi quy tuyến tính đa biến

Sau khi chạy phân tích hồi quy đa biến trong SPSS bạn sẽ thu được khá nhiều kết quả đầu ra. Chúng ta sẽ tiến hành đọc kết quả hồi quy đa biến trong SPSS từ các bảng kết quả dưới đây:

3.1. Bảng Variables Entered/Removed

Bảng Variables Entered/Removed

Bảng Variables Entered/Removed trong SPSS

Đầu tiên, ở bảng Variables Entered/Removed chứa các biến được nhập và hoặc xóa đi.

Variables Entered chứa các biến mà chúng ta thêm vào ban đầu là f, N, D, t. Các biến phụ thuộc là Fd.

3.2. Bảng Tóm tắt Mô hình (Model Summary)

Bảng Model Summary

Bảng Model Summary trong SPSS

Bảng Tóm tắt Mô hình (Model Summary) cung cấp R, R Square, Adjusted R Square và Standard Error of the Estimate, có thể được sử dụng để xác định mức độ phù hợp của mô hình hồi quy đa biến với dữ liệu:

  • Cột ” R ” đại diện cho giá trị của R, hệ số tương quan bội . R có thể được coi là một thước đo chất lượng dự đoán của biến phụ thuộc.
  • Ta có, R = 0.961 là con số khá cao cho thấy mức độ dự đoán tốt.
  • R Square = 0.924 và Adjusted R Square = 0.920, từ kết quả này bạn có thể nói rằng mô hình mà bạn đã xây dựng có thể giải thích được 92% phương sai trong dữ liệu mà bạn có được.
  • R Square Change = 0.924 là giá trị khá tốt.

3.3. Bảng ANOVA

Bảng ANOVA

Bảng ANOVA trong SPSS

  • Tỷ lệ F trong bảng ANOVA kiểm tra xem mô hình hồi quy đa biến tổng thể có phù hợp với dữ liệu hay không.
  • Bảng cho thấy các biến độc lập dự báo đáng kể về mặt thống kê cho biến phụ thuộc, F = 232.002, p < 0,0005 (nghĩa là mô hình hồi quy phù hợp tốt với dữ liệu).

3.4. Bảng Coefficients

Bảng Coefficients

Bảng Coefficients trong SPSS

Khi thực hiện đọc kết quả hồi quy đa biến trong SPSS, bạn cần quan tâm đến kết quả nhiều bảng khác nhau để tìm ra mối quan hệ giữa các biến được đưa vào.

  • Giá trị Sig. của kiểm định t được sử dụng nhằm kiểm định ý nghĩa của hệ số hồi quy, cho biết các biến độc lập có tác động lên biến phụ thuộc hay không?
    • Nếu Sig. nhỏ hơn 0.05 nghĩa là biến độc lập có sự tác động lên biến phụ thuộc và ngược lại.
  • Trong bảng trên biến D và N có Sig. lần lượt là 0.107 và 0.947 (>0.05) cho thấy không có sự tác động lên biến phụ thuộc và bạn có thể bác bỏ giả thuyết của biến đó.
  • Hệ số phóng đại phương sai VIF giúp kiểm tra hiện tượng đa cộng tuyến:
    • Nếu hệ số VIF của một biến độc lập >10 nghĩa là đang có hiện tượng đa cộng tuyến.
    • ⇒ Nhìn bảng trên, ta thấy các giá trị đều bé hơn 10 nên có thể kết luận là không có hiện tượng đa cộng tuyến, đáp ứng giả định không tồn tại đa cộng tuyến (No Multicollinearity).
  • Sau khi chạy hồi quy đa biến, bạn sẽ nhận được giá trị hồi quy chưa chuẩn hóa (Unstandardized B) và chuẩn hóa (Standardized Beta), bạn có thể lần lượt đưa vào phương trình hồi quy dạng Y = β0 + β1X1 + β2X2 + … + βnXn + ε.
    • Ta có: Y = 1.238 + (-0.12)*t + 0.02*D + (-4.439E-7)*N + 0.601*f + ε
  • Nhìn vào cột Standardized Beta, bạn lấy trị tuyệt đối của các giá trị trong cột, nếu giá trị nào lớn nhất thì biến đó có tác động mạnh nhất lên biến phụ thuộc và ngược lại.

4. Đánh giá, kiểm tra giả định hồi quy đa biến bằng biểu đồ

4.1. Biểu đồ Histogram

Biểu đồ Histogram

Biểu đồ Histogram trong SPSS

Biểu đồ Histogram có tác dụng giúp bạn kiểm tra xem phần dư có được phân phối chuẩn hay không. Trong biểu đồ Histogram nếu giá trị Mean gần bằng 0, đường cong phân phối có dạng hình chuông, độ lệch chuẩn bằng 1 thì điều đó cho chúng ta biết được phân phối của phần dư là xấp xỉ chuẩn:

  • Trong biểu đồ trên, ta thấy Mean = 2.88E-14, St.Dev = 0.975.
  • Biểu đồ cũng có dạng hình chuông và các giá trị tập trung phần lớn ở khoảng -2 đến 2.

Nên chúng ta có thể kết luận phần dư đang được phân phối xấp xỉ chuẩn và giả định tính chuẩn đa biến không bị vi phạm.

4.2. Biểu đồ Normal P-P Plot

 Biểu đồ Normal P-P Plot

Biểu đồ Normal P-P Plot trong SPSS

Biểu đồ Normal P-P Plot cho chúng ta biết mức độ phân phối chuẩn của phần dư.

Nếu các điểm phân vị càng sát với đường chéo thì đồng nghĩa với phần dư có phân phối chuẩn, đáp ứng giả định về phân phối chuẩn của phần dư:

  • Nhìn vào biểu đồ trên hình, ta có thể thấy rằng đa phần các điểm phân vị đang nằm sát với đường chéo. Tuy nhiên, vẫn có một vài điểm nằm xa đường chéo.

4.3. Biểu đồ Scatter Plot

Biểu đồ Scatter Plot

Biểu đồ Scatter Plot trong SPSS

Để xác định được mối liên hệ tuyến tính giữa biến phụ thuộc và biến độc lập. Nếu các điểm phân tán ngẫu nhiên và tập trung xung quanh trục ngang 0, thì chúng ta có thể kết luận mối quan hệ tuyến tính giữa biến độc lập và phụ thuộc không bị vi phạm.

  • Những điều bạn thấy trong hình là phần dư được chuẩn hóa so với hồi quy được chuẩn hóa. Điều xảy ra là không có loại mẫu nào được hình thành.
  • Và khi tạo một đường hồi quy cho dữ liệu, thì điều này vẫn không thể xảy ra, chúng ta không thấy bất kỳ đường hồi quy nào, không có bất kỳ xu hướng tăng hay giảm nào ở đây.
  • Điều này cho chúng ta biết được không tồn tại mối quan hệ tuyến tính giữa biến độc lập và biến phụ thuộc. Không đáp ứng giả định về Tính tuyến tính (Linearity), giả định độc lập tuyến tính.

5. Lưu ý quan trọng khi chạy hồi quy đa biến trong SPSS

Lưu ý quan trọng khi chạy hồi quy đa biến

Lưu ý quan trọng khi chạy hồi quy đa biến trong SPSS

  • Các nhân tố được trích ra trong phân tích nhân tố sẽ được dùng cho phân tích hồi quy đa biến để kiểm định mô hình nghiên cứu và các giả thuyết kèm theo.
  • Kiểm định giả thuyết thống kê có mức ý nghĩa là 5%.
  • Nghiên cứu phân tích hồi quy đa biến theo Method: Enter thì tất cả các biến được đưa vào một lần và xem xét các kết quả thống kê liên quan.
  • Lưu ý khi chọn biến phân tích hồi quy đa biến (bước 2):
    • Các biến phải đạt tiêu chuẩn chấp nhận (Tolerance criterion) mới được đưa vào phương trình cho dù bạn áp dụng Method nào đi chăng nữa. Độ chấp nhận (Tolerance) mặc định là 0,0001. Biến sẽ không được đưa vào phương trình nếu nó làm độ chấp nhận của một biến (đã được đưa vào phương trình) xuống dưới mức Tolerance criterion.
    • Với phương pháp từng bước (Stepwise), số bước tối đa để đưa các biến vào phương trình là bằng 02 lần số biến độc lập.
    • Đối với phương pháp loại trừ dần (Backward) và đưa vào dần (Forward) thì số bước tối đa bằng với số biến thỏa mãn tiêu chuẩn đưa vào và loại ra.

Bài viết đã giới thiệu đến bạn những thông tin quan trọng về hồi quy đa biến trong SPSS. Mong rằng các bạn sẽ thực hành và áp dụng thành công trong nghiên cứu của mình. Nếu có vấn đề cần giải đáp hãy liên hệ ngay với Luận văn 1080 để nhận được phản hồi sớm nhất.

Bài đăng này hữu ích như thế nào?

Bấm vào một ngôi sao để đánh giá nó!

Đánh giá trung bình 0 / 5. Số phiếu bầu: 0

Hãy là người đầu tiên đánh giá bài viết này.

icon Share
Tác giả Nguyễn Tuyết Anh phụ trách nội dung chuyên môn chia sẻ kinh nghiệm. Với hơn 10 năm kinh nghiệm trong lĩnh vực biên soạn, chỉnh sửa, nghiên cứu học thuật cùng đội ngũ chuyên gia trong nhiều ngành đưa Luận Văn 1080 Trở thành đơn vị tiên phong về dịch vụ viết thuê luận văn thạc sĩ, tiểu luận, essay, assignment, xử lý số liệu chuyên sâu,... đối tác đáng tin cậy của học viên, nghiên cứu sinh trong và ngoài nước. - Hotline: 0969 991 080 - Email: luanvan1080@gmail.com