Cách Chạy Tương Quan SPSS Chi Tiết Nhất cho Người Mới 2025

icon  13 Tháng mười một, 2025 Nguyễn Tuyết Anh Đánh giá:  
0
(0)
Chạy tương quan SPSS là gì
0
(0)

SPSS hiện là một trong những phần mềm phân tích dữ liệu được sử dụng rộng rãi nhất trong nghiên cứu khoa học và thống kê. Với khả năng xử lý mạnh mẽ, SPSS giúp người dùng khám phá dữ liệu và trả lời các câu hỏi nghiên cứu một cách chính xác. Trong bài viết này, chúng ta sẽ cùng Luận văn 1080 tìm hiểu chi tiết cách chạy tương quan SPSS để đánh giá mối quan hệ giữa các biến một cách đơn giản và hiệu quả.

Tương quan là gì

Tương quan là gì

1. Tương quan Pearson là gì?

Tương quan là mức độ liên hệ giữa hai biến trong một điều kiện nhất định. Khi nói đến phân tích tương quan trong SPSS, ta hầu như luôn nhắc đến tương quan Pearson, một trong những hệ số phổ biến nhất để đo lường mối quan hệ tuyến tính giữa hai biến định lượng.

Hệ số tương quan Pearson

Hệ số tương quan Pearson

Hệ số tương quan Pearson r nằm trong khoảng:

  • +1: tương quan thuận hoàn hảo.
  • -1: tương quan nghịch hoàn hảo.
  • 0: không có mối quan hệ tuyến tính.

 Ý nghĩa hướng và mức độ:

  • r > 0 → biến tăng thì biến kia tăng (quan hệ cùng chiều).
  • r < 0 → biến tăng thì biến kia giảm (quan hệ ngược chiều).
  • |r| càng lớn → mối quan hệ càng mạnh.
  • |r| càng nhỏ → mối quan hệ càng yếu.

>> Đọc thêm: 7 BƯỚC Phân Tích Nhân Tố Khẳng Định CFA CHI TIẾT!

2. Tương quan và hồi quy khác nhau như thế nào?

Rất nhiều sinh viên thường nhầm rằng tương quan và hồi quy là một, nhưng đây là hai kỹ thuật hoàn toàn khác nhau trong thống kê. Bạn có thể phân biệt nhanh qua bảng sau:

Tương quan Hồi quy
Quan hệ hai chiều, không phân biệt vai trò biến Quan hệ một chiều, biến độc lập tác động lên biến phụ thuộc
Đo mức độ liên hệ giữa hai biến Dự đoán và giải thích mức độ ảnh hưởng
Không chứng minh nguyên nhân – hệ quả Kiểm tra xem ảnh hưởng có ý nghĩa thống kê hay không
Được thực hiện trước hồi quy Được thực hiện sau khi kiểm tra tương quan

3. Mục đích của hệ số tương quan person

Tương quan Pearson trong SPSS mang lại nhiều giá trị quan trọng trong phân tích dữ liệu, đặc biệt là khi bạn chuẩn bị thực hiện hồi quy tuyến tính. Cụ thể:

3.1. Kiểm tra mối quan hệ giữa biến độc lập và biến phụ thuộc

  • Sig < 0.05: hai biến có tương quan tuyến tính → nên đưa vào mô hình hồi quy.
  • Sig > 0.05: không có tương quan → nên loại, vì biến không đóng góp ý nghĩa trong mô hình.

3.2. Nhận diện nguy cơ đa cộng tuyến giữa các biến độc lập

  • Nếu |r| > 0.7 giữa hai biến độc lập → khả năng cao xảy ra đa cộng tuyến.
  • Khi đó, cần kiểm tra thêm VIF trong hồi quy để kết luận chính xác hơn.

3.3. Loại bỏ các biến yếu trước khi xây dựng mô hình

Biến không có tương quan tuyến tính với biến phụ thuộc → nên loại từ đầu để tránh làm mô hình nhiễu hoặc kém ý nghĩa.

3.4. Đánh giá mức độ phù hợp của dữ liệu đầu vào

Nếu các biến hoàn toàn không có mối quan hệ → mô hình hồi quy sẽ không giải thích được biến phụ thuộc một cách hiệu quả.

Tác dụng của hệ số tương quan

Tác dụng của hệ số tương quan

4. Điều kiện để chạy tương quan Pearson chính xác nhất

Tương quan Pearson không thể áp dụng trong mọi trường hợp. Để đảm bảo kết quả phân tích chính xác, bạn cần thỏa các điều kiện sau:

4.1. Biến phải là biến định lượng (scale, interval, ratio)

Pearson chỉ phù hợp cho dữ liệu đo lường theo thang định lượng.
Không áp dụng cho các biến danh mục như:

  • Giới tính
  • Trình độ học vấn
  • Nghề nghiệp

Với các biến dạng này, nên sử dụng Spearman hoặc Kendall.

4.2. Mối quan hệ giữa các biến phải mang tính tuyến tính

Pearson chỉ đo được mối quan hệ tuyến tính, không đo được quan hệ cong hoặc phi tuyến.
Bạn có thể kiểm tra tính tuyến tính bằng:

  • Scatter plot (biểu đồ phân tán)
  • Partial plot

4.3. Dữ liệu cần phân phối chuẩn hoặc gần chuẩn

Tính phân phối chuẩn giúp hệ số Pearson phản ánh chính xác hơn. Nếu dữ liệu lệch chuẩn hoặc không chuẩn → hãy chuyển sang Spearman.

4.4. Không có outliers mạnh

Outlier có thể kéo lệch hoặc làm sai hoàn toàn hệ số tương quan Pearson. Nếu phát hiện outlier → loại bỏ hoặc xử lý trước khi chạy tương quan.

5. Các bước thực hiện phân tích tương quan Pearson trong SPSS

5.1. Chuẩn bị dữ liệu trước khi chạy tương quan

Trước khi chạy phân tích tương quan, bạn cần chắc chắn rằng dữ liệu đã được nhập đầy đủ và đúng định dạng trong SPSS. Mỗi biến nên được đặt tên rõ ràng, đánh số hiệu và không để trống giá trị. Nói cách khác, hãy tạo một bảng dữ liệu hoàn chỉnh, nhập các con số cần phân tích, kiểm tra lại để không có dữ liệu bị thiếu. Đây là bước rất quan trọng vì nếu dữ liệu sai hoặc thiếu, kết quả phân tích sẽ không chính xác.

Cần chuẩn bị dữ liệu trước khi chạy tương quan SPSS

Cần chuẩn bị dữ liệu trước khi chạy tương quan SPSS

5.2. Hướng dẫn chạy tương quan Pearson trên SPSS (3 bước)

Sau khi chuẩn bị dữ liệu, bạn tiến hành chạy phân tích tương quan theo 3 bước cơ bản:

Bước 1: Vào menu Analyze → Correlate → Bivariate. Đây là lệnh dùng để tính hệ số tương quan.

Bước 1 Chạy tương quan SPSS

Bước 1 Chạy tương quan SPSS

Bước 2: Trong hộp thoại hiện ra, chọn các biến muốn phân tích (ví dụ Height và Weight) rồi đưa vào khung Variables. Ở phần hệ số, mặc định SPSS chọn Pearson, ngoài ra bạn có thể chọn Spearman hoặc Kendall nếu dữ liệu không thỏa điều kiện. Đồng thời, ở mục kiểm định ý nghĩa (Test of significance), có thể chọn Two-tail (kiểm định hai phía, mặc định) hoặc One-tail (kiểm định một phía, nếu đã biết trước chiều hướng mối quan hệ).

Bước 2: Chọn các biến

Bước 2: Chọn các biến

Bước 3: Nhấn OK để chạy lệnh. Kết quả trả về là một bảng gọi là ma trận tương quan, trong đó thể hiện:

  • Pearson Correlation (r): hệ số tương quan giữa các biến.
  • Sig. (2-tailed): giá trị kiểm định ý nghĩa thống kê của hệ số.
  • N: số lượng quan sát (cỡ mẫu).

Từ bảng kết quả này, bạn có thể biết được hai biến có quan hệ cùng chiều hay ngược chiều, mối quan hệ mạnh hay yếu và liệu mối quan hệ đó có ý nghĩa thống kê hay không.

6. Cách đọc và diễn giải kết quả tương quan Pearson trong SPSS

Hướng dẫn đọc kết quả sau khi chạy tương quan spss

Hướng dẫn đọc kết quả sau khi chạy tương quan spss

Khi SPSS trả về bảng kết quả, bạn sẽ thấy hệ số Pearson Correlation và giá trị Sig. (p-value).

  • Với những ô so sánh một biến với chính nó (ô chéo trên ma trận), hệ số tương quan luôn bằng 1, thể hiện mối quan hệ hoàn hảo. Ở ví dụ này, số lượng quan sát là N = 10.
  • Ở các ô còn lại, hệ số tương quan dao động từ -1 đến +1. Chẳng hạn, kết quả cho thấy r = 0.574, nghĩa là hai biến có mối quan hệ cùng chiều ở mức trung bình. Tuy nhiên, giá trị Sig. = 0.083 lại lớn hơn 0.05, cho thấy mối quan hệ này không có ý nghĩa thống kê, tức là không đủ bằng chứng để khẳng định chúng thực sự liên quan.

Tóm lại, khi đọc kết quả bạn cần nhớ:

  • Hệ số r cho biết mức độ mạnh – yếu và chiều hướng của mối quan hệ.
  • P-value (Sig.) cho biết mối quan hệ đó có đáng tin cậy hay chỉ là ngẫu nhiên. Nếu p < 0.05, mối quan hệ được coi là có ý nghĩa thống kê; nếu p ≥ 0.05 thì không có ý nghĩa.

7. Cách đánh giá tương quan giữa biến độc lập và biến phụ thuộc

Đây là bước quan trọng để quyết định một biến có đủ điều kiện đưa vào mô hình hồi quy hay không. Việc đánh giá đúng giúp mô hình chính xác hơn và tránh đưa vào các biến không có ý nghĩa.

Kỳ vọng khi đánh giá:

  • Sig < 0.05: cho thấy mối quan hệ tuyến tính có ý nghĩa thống kê.
  • Hệ số r nằm từ trung bình đến mạnh (|r| ≥ 0.3): thể hiện mức độ liên hệ đủ mạnh để phân tích tiếp.

Trường hợp Sig > 0.05

  • Biến không tồn tại mối quan hệ tuyến tính với biến phụ thuộc.
  • Không nên đưa biến này vào mô hình hồi quy vì sẽ không đóng góp ý nghĩa và có thể gây nhiễu mô hình.

Trường hợp r rất thấp nhưng Sig < 0.05

  • Mặc dù có ý nghĩa thống kê, nhưng mức độ tương quan gần như bằng không.
  • Điều này phản ánh mối quan hệ yếu về mặt thực tiễn → cần cân nhắc kỹ trước khi sử dụng trong hồi quy.

8. Đánh giá tương quan giữa các biến độc lập để kiểm tra đa cộng tuyến

Trong phân tích hồi quy, đa cộng tuyến là vấn đề nghiêm trọng xảy ra khi các biến độc lập có mức độ tương quan quá cao. Điều này khiến mô hình mất ổn định và hệ số hồi quy trở nên kém ý nghĩa. Vì vậy, việc kiểm tra tương quan giữa các biến độc lập là bước bắt buộc.

Ngưỡng đánh giá mức độ đa cộng tuyến:

  • |r| > 0.7: nguy cơ đa cộng tuyến cao
  • |r| từ 0.5 – 0.7: cần theo dõi thêm
  • |r| < 0.5: an toàn, ít lo ngại đa cộng tuyến

Cách xử lý khi nghi ngờ đa cộng tuyến:

  • Loại bỏ một trong hai biến có tương quan quá mạnh với nhau
  • Gộp nhóm biến bằng các kỹ thuật EFA hoặc PCA
  • Kiểm tra chỉ số VIF trong hồi quy để xác nhận:
    • VIF > 10: đa cộng tuyến nghiêm trọng → cần xử lý ngay
    • VIF > 5: nguy cơ cao → theo dõi và cân nhắc điều chỉnh mô hình

Có thể thấy, phân tích tương quan Pearson trong SPSS không chỉ giúp làm rõ mối quan hệ giữa các biến mà còn là bước đệm quan trọng trước khi tiến hành các phân tích nâng cao như hồi quy hay phân tích nhân tố. Hy vọng với hướng dẫn chi tiết trong bài viết, bạn có thể tự tin thực hành và áp dụng vào nghiên cứu của mình. Nếu trong quá trình làm việc với SPSS bạn gặp khó khăn hoặc cần hỗ trợ chạy spss thuê chuyên sâu, đừng ngần ngại liên hệ với Luận văn 1080 để được tư vấn và đồng hành.

Bài đăng này hữu ích như thế nào?

Bấm vào một ngôi sao để đánh giá nó!

Đánh giá trung bình 0 / 5. Số phiếu bầu: 0

Hãy là người đầu tiên đánh giá bài viết này.

icon Share
Tác giả Nguyễn Tuyết Anh phụ trách nội dung chuyên môn chia sẻ kinh nghiệm. Với hơn 10 năm kinh nghiệm trong lĩnh vực biên soạn, chỉnh sửa, nghiên cứu học thuật cùng đội ngũ chuyên gia trong nhiều ngành đưa Luận Văn 1080 Trở thành đơn vị tiên phong về dịch vụ viết thuê luận văn thạc sĩ, tiểu luận, essay, assignment, xử lý số liệu chuyên sâu,... đối tác đáng tin cậy của học viên, nghiên cứu sinh trong và ngoài nước. - Hotline: 0969 991 080 - Email: luanvan1080@gmail.com