SPSS là gì? Những thuật ngữ cần biết khi dùng SPSS

icon  6 Tháng mười một, 2025 Nguyễn Tuyết Anh Đánh giá:  
0
(0)
0
(0)

Nếu bạn đang bắt đầu học phân tích dữ liệu và thấy SPSS vừa quen mà lại vừa… rối, thì bài viết này dành cho bạn. Hãy cùng Luận văn 1080 tìm hiểu SPSS là gì, các thuật ngữ quen thuộc cho đến cách tải để bạn có thể tự tin ứng dụng trong bài luận hoặc luận văn của mình nhé

1. Giới thiệu về SPSS

1.1. SPSS là gì?

SPSS là gì?

SPSS là gì?

SPSS là viết tắt của Statistical Package for the Social Sciences. Đây là một phần mềm thống kê toàn diện được sử dụng rộng rãi trong các lĩnh vực khoa học xã hội, kinh tế, y học, giáo dục và marketing. SPSS cho phép người dùng thực hiện các bước phân tích dữ liệu từ thống kê mô tả (tóm tắt, lập bảng, biểu đồ) đến thống kê suy luận (tương quan, hồi quy, phân tích nhân tố, mô hình dự báo…).

Ban đầu, SPSS được viết bằng Fortran, sau đó chuyển sang C/C++ trong quá trình hiện đại hóa. IBM sau này tích hợp Python Plug-in, giúp người dùng tự động hóa và mở rộng phân tích linh hoạt hơn.

1.2. Lịch sử ra đời và phát triển

SPSS được khởi đầu như một dự án học thuật vào khoảng 1967–1968, do Norman H. Nie và C. Hadlai Hull tại Stanford University, cùng với Dale H. Bent tại University of Alberta (Canada) phát triển. Phiên bản đầu tiên được viết bằng Fortran IV trên hệ thống IBM mainframe của Stanford. Điều này đã được ghi lại trong tài liệu của IBM, “The initial work on SPSS was done at Stanford University with the intention to make it available for local use.”

Năm 1975, Nie và Hull thành lập SPSS Inc. có trụ sở tại Chicago, Illinois, để thương mại hóa phần mềm. Công ty phát triển mạnh nhờ nhu cầu phân tích dữ liệu trong xã hội học, y học và marketing.

Đến tháng 7 năm 2009, IBM mua lại toàn bộ SPSS Inc. với giá 1,2 tỷ USD, chính thức đổi tên sản phẩm thành IBM SPSS Statistics và tích hợp vào hệ sinh thái IBM Analytics.

Hiện nay, phiên bản mới nhất là IBM SPSS Statistics 29.0 (được phát hành  năm 2024).

>> Đọc thêm: Kiểm Định T Test | Kiểm Định Sự Khác biệt Trong SPSS

2. Các bộ phận chính của hệ thống SPSS

  • SPSS Professional Statistics: Là phiên bản cơ sở (Base Module) của hệ thống SPSS, cung cấp hầu hết các kỹ thuật phân tích dữ liệu cơ bản: thống kê mô tả, kiểm định giả thuyết (T-test, Chi-square), hồi quy tuyến tính – phi tuyến, ANOVA, và phân tích tương quan. SPSS cho phép tích hợp Python, R, và xuất/nhập dữ liệu từ Excel, CSV, SQL, giúp mở rộng khả năng xử lý và tự động hóa.
  • SPSS Advanced Statistics: Module này cung cấp các mô hình thống kê phức tạp như GLM (General Linear Model), MIXED Models, MANOVA, Logistic Regression, Survival Analysis; thích hợp cho các lĩnh vực y học, tâm lý, giáo dục và kinh tế học.
  • SPSS Custom Tables: Cho phép người dùng tạo báo cáo dạng bảng biểu tùy chỉnh, với khả năng nhóm, tính toán, trình bày kết quả và biểu đồ ở mức chuyên nghiệp; hữu ích trong nghiên cứu xã hội học và khảo sát thị trường.
  • SPSS Forecasting (trước đây là SPSS Trends): Module dùng cho phân tích chuỗi thời gian (Time Series Analysis) và dự báo (Forecasting). Hỗ trợ các mô hình ARIMA, Exponential Smoothing, Seasonal Decomposition, và dự đoán xu hướng dữ liệu đa biến phi tuyến.

3. Một số thuật ngữ quan trọng của SPSS

SPSS là gì? Các thuật ngữ trong SPSS và ý nghĩa của các thuật ngữ

SPSS là gì? Một số thuật ngữ quan trọng của SPSS

3.1. Case (trường hợp/chủ thể)

Trong SPSS, case là một đơn vị quan sát hoặc phân tích – ví dụ một người, một tổ chức, hoặc một sự kiện. Mỗi case được thể hiện bằng một dòng (row) trong Data View của SPSS và chứa toàn bộ thông tin về các biến liên quan đến chủ thể đó.

Ví dụ: 1 người với tư cách là 1 chủ thể (case) bao gồm các thông tin mà nhà nghiên cứu cần quan tâm như: tuổi, giới tính, trình độ văn hoá, những thái độ ứng xử, quan niệm, hành động…

3.2. Tệp dữ liệu trong SPSS (Data File)

Tập hợp nhiều case tạo nên tệp dữ liệu hiện hành (working data file).

Trong hệ thống tệp của SPSS:

  • Tệp dữ liệu có đuôi mở rộng là .sav
  • Tệp kết quả (output) trong các phiên bản mới có đuôi .spv (trước đây là .spo)

3.3. Measurement (Thang đo)

Các biến (variables) trong SPSS được xác định bằng các thang đo khác nhau tùy tính chất của việc đo lường. Từng phương pháp phân tích dữ liệu do vậy cũng tuỳ thuộc vào loại thang đo được sử dụng.

Có 4 loại thang đo thường gặp trong SPSS là: Định danh, thứ bậc, khoảng và tỷ lệ.

a. Thang đo định danh (Nominal Scale)

  • Là đánh số hoặc gán chuỗi dạng ngắn cho các biểu hiện của một biến (được gọi là biến định danh [nominal variable]).
  • Các trị số của biến định danh chỉ thể hiện các nhóm không có thứ bậc hơn kém (unordered categories).
  • Nếu biến định danh được đo bằng các con số thì giữa các con số ở đây không có quan hệ hơn kém. Do đó mọi phép tính đại số giữa chúng đều vô nghĩa.
  • Thang đo định danh chủ yếu để đếm tần số biểu hiện của biến nghiên cứu.
  • Thường dùng để đếm tần số hoặc tỷ lệ phần trăm.

b. Thang đo thứ bậc (Ordinal Scale)

  • Là thang đo định danh những các trị số của biến lại có quan hệ thứ bậc(ranking) hơn kém
  • Các biến được đo đạc bằng thang đo thứ bậc gọi là các biến định danh có thứ bậc (ordinal variable). Trong nhiều phép phân tích của SPSS, các biến định danh có thứ bậc thường được gọi là các biến lập nhóm có thứ bậc (ordered categorical variable)
  • Thường dùng trong phân tích phi tham số hoặc kiểm định xếp hạng.

c. Thang đo khoảng (Interval Scale)

  • Là một kiểu đánh giá phân loại sự vật, hiện tượng hay đặc tính theo những đơn vị đều nhau ở bất kỳ khoảng nào trên thanh đo.
  • Thang đo khoảng là loại thang đo trong đó số đo dùng để chỉ khoảng cách nhưng gốc 0 không có nghĩa.
  • Cho phép thực hiện các phép toán như cộng, trừ, tính trung bình, phương sai.

Các dạng thang đo khoảng thường được sử dụng trong nghiên cứu khoa học kinh doanh gồm: Thang đo Likert và thang đo đối nghĩa:

  • Thang đo Likert: là loại thang đo trong đó một chuỗi các phát biểu liên quan đến thái độ trong câu hỏi được nêu ra và người trả lời sẽ chọn một trong những câu trả lời đó. Về lý thuyết, đây là thang đo thứ bậc, nhưng thường được xử lý như thang đo khoảng trong phân tích dữ liệu.
  • Thang đo đối nghĩa (Semantic Differential): Tương tự thang đó Likert nhưng trong thang đo đối nghĩa chỉ dùng hai nhóm từ ở hai cực có nghĩa trái ngược nhau(ví dụ: “tốt – xấu”, “nhanh – chậm”). Thang này được xem là gần với thang đo khoảng, vì các khoảng cách giữa các mức thường được giả định là đều nhau.

d. Thang đo tỷ lệ (Ratio Scale)

  • Là thang đo khoảng với một điểm không (0) tuyệt đối/điểm gốc để có thể so sánh được tỷ lệ giữa các số đo.
  • Sự có mặt của số 0 giúp ta thiết lập được tỷ lệ giữa các điểm số thu được. Các phép tính toán học (cộng, trừ, nhân, chia) đều có ý nghĩa. Ví dụ, chúng ta có thể xác định chính xác vận tốc 10 km/h lớn gấp 2 lần vận tốc 5 km/h.

3.4. Các loại biến trong SPSS

Các hiện tượng mà ta muốn quan sát được gọi là các biến số (variables). Một biến có thể mang các giá trị khác nhau như học vấn, thu nhập, tính cách, khí chất… Các biến này có thể thuộc loại định tính (qualitative) hay định lượng (quantitative).

3.4.1. Phân loại

Trong nghiên cứu người ta thường phân biệt 2 loại biến số chính yếu khác nữa: Biến độc lập (independent variables) và biến phụ thuộc (dependent variables).

a, Biến định tính (Qualitative variables)

  • Là những biến mà người ta gán cho các giá trị để phân biệt hay phân loại các quan sát. Đây là biến lập nhóm (categorical variables), trị số của chúng được xác định bằng các thang đo định danh hoặc thang đo thứ bậc dưới dạng mã số hoặc chuỗi ngắn
  • Ví dụ: Giới tính (nam, nữ), trình độ học vấn (Tiểu học, THCS, THPT,…), thu nhập (thấp, trung bình, cao…)
  • Các biến này thường đo bằng thang đo định danh (Nominal) hoặc thang đo thứ bậc (Ordinal).

b, Biến định lượng (Quantitative variables)

Là những biến mà các giá trị của chúng được xác định bằng các thang đo khoảng và tỉ lệ nên trị số của chúng luôn để dưới dạng số.

Ví dụ:

  • Thu nhập: 5 triệu – 8 triệu – trên 8 triệu
  • Tuổi: Dưới 18 – từ 18, đến 25 – trên 25

c, Biến độc lập (Independent variable)

Biến độc lập được giả thiết là một biến mà sự biến đổi của nó sẽ ảnh hưởng đến biến khác.

d, Biến phụ thuộc (Dependent variable)

Biến phụ thuộc là biến mà sự biến đổi của nó chịu sự chi phối của những biến khác.

3.4.2. Quy ước đặt tên và gán nhãn biến

a, Variable name (tên biến)

  • Tên biến phải có ý nghĩa. Mỗi biến được đặt tên và không có 2 biến có tên giống hệt nhau trong mỗi tệp tin.
  • Mỗi tên biến có tối đa là 8 ký tự. Ở các phiên bản mới của IBM SPSS, tên biến có thể dài tới 64 ký tự.
  • Không được chứa khoảng trắng hoặc ký tự đặc biệt, phải ngăn cách với nhau bằng dấu gạch dưới _

Ví dụ: fruitName, dia_chi, tuoi,…

b, Variable Label (Nhãn biến)

  • Dùng để mô tả đầy đủ ý nghĩa của biến giúp dễ hiểu khi đọc kết quả.
  • Không giới hạn độ dài, có thể viết bằng tiếng Việt hoặc tiếng Anh.

Ví dụ:

  • Tên biến: thunhap
  • Nhãn biến: Mức thu nhập hàng tháng (triệu đồng)

c, Value Label (Nhãn giá trị biến)

Dùng để mô tả các giá trị cụ thể của biến định tính (categorical variable).
Ví dụ:

  • Biến: gioitinh
  • Giá trị: 1 = Nam, 2 = Nữ

Lưu ý:

Đối với việc dịch tiếng việt các thông số trong bảng SPSS ở bài luận là điều không cần thiết. Tuy nhiên, việc sử dụng các thuật ngữ từ tiếng Anh sang tiếng việt giúp người xem dễ đọc hơn, dễ trao đổi hơn.

Bởi khá nhiều thuật ngữ tiếng anh khá dài và rối rắm, nhưng đối với việc dịch kết quả trong spss chúng tôi vẫn khuyên bạn chỉ sử dụng trong văn nói và không nên sử dụng trong văn viết.  Bởi sử dụng các thuật ngữ tiếng anh sẽ sát nghĩa, khoa học và chuyên nghiệp hơn.

3.5. Cronbach Alpha

  • Cronbach’s Alpha: Giá trị Cronbach Alpha
  • N of Items: Số biến quan sát
  • Scale Mean if Item Deleted: Trung bình thang đo nếu biến này bị loại bỏ
  • Scale Variance if Item Deleted: Phương sai thang đo nếu biến này bị loại bỏ
  • Variance: phương sai.
  • Corrected Item-Total Correlation: Tương quan biến – tổng hiệu chỉnh
  • Cronbach’s Alpha if Item Deleted: Giá trị Cronbach Alpha nếu biến này bị loại bỏ

3.6. EFA

  • Kaiser-Meyer-Olkin Measure of Sampling Adequacy: Hệ số KMO
  • Bartlett’s Test of Sphericity: Kiểm định Barlett
  • Approx. Chi-Square: Giá trị Chi bình phương xấp xỉ
  • Total Variance Explained: Tổng phương sai trích
  • Factor / Component: Nhân tố
  • Initial Eigenvalues: Khởi tạo giá trị Eigenvalue ban đầu
  • Extraction Sums of Squared Loadings: Tổng bình phương tải số sau khi trích (Extraction)
  • Rotation Sums of Squared Loadings: Tổng bình phương tải số sau khi xoay (Rotation)
  • Total: Tổng cộng
  • % of Variance: Phần trăm của phương sai
  • Cumulative %: Phần trăm tích lũy
  • Component Matrix: Ma trận tải nhân tố ban đầu
  • Rotated Component Matrix: Ma trận xoay nhân tố

Bạn đang bắt đầu làm quen với phần mềm SPSS và cảm thấy bối rối và lo lắng trước những thách thức khác nhau? Đừng lo lắng quá nhiều, liên hệ ngay với dịch vụ SPSS tại Luận văn 1080 – với đội ngũ chuyên gia giàu kinh nghiệm và am hiểu sâu sắc về SPSS.

Không chỉ hỗ trợ một cách tận tình, chúng tôi còn giúp bạn xử lý số liệu một cách chính xác và hiệu quả. Hãy bắt đầu tạo nên những nghiên cứu chất lượng cao với sự trợ giúp đắc lực từ dịch vụ xử lý số liệu SPSS tại Luận văn 1080 ngay hôm nay!

3.7. Tương quan Pearson

  • Correlations: Các mối tương quan
  • Pearson Correlation: Hệ số tương quan Pearson (r)
  • Sig. (2-tailed): Giá trị sig(p-value hai phía), dùng để kiểm định giả thuyết H0
  • N: Số lượng quan sát (sample size)

3.8. Hồi quy

  • Model Summary: Tóm tắt mô hình
  • R, R Square, Adjusted R Square: Giá trị R, R bình phương, R bình phương hiệu chỉnh
  • Std. Error of the Estimate: Sai số chuẩn
  • Durbin-Watson: Giá trị Durbin-Watson của kiểm định tự tương quan phần dư
  • Regression: Hồi quy
  • Residual: Phần dư
  • Sum of Squares: Tổng bình phương sai lệch.
  • Mean Square: Trung bình bình phương
  • Constant: Hệ số chặn (intercept)
  • Coefficients: Hệ số hồi quy của các biến độc lập
  • Unstandardized Coefficients: Hệ số hồi quy chưa chuẩn hóa(B)
  • Standardized Coefficients: Hệ số hồi quy chuẩn hóa β
  • Collinearity Statistics: Thống kê đa cộng tuyến(multicollinearity)
  • Std. Error: Sai số chuẩn
  • Tolerance: Độ chấp nhận
  • VIF: Hệ số phóng đại phương sai

4. Cách tải phần mềm SPSS miễn phí

Hiện nay phần mềm SPSS khá phổ biến và bạn dễ dàng thực hiện tải chúng (SPSS download) về máy tính và thực hiện các bước theo hướng dẫn để hoàn tất quá trình cài đặt phần mềm.

Link tải: https://download.phantichspss.com/download/spss-win/

Bạn chỉ cần chạy file Cai Dat SPSS20.exe và chọn Next liên tục là được

Hy vọng qua bài viết này, bạn đã hiểu rõ SPSS là gì và vì sao phần mềm này lại được sử dụng rộng rãi trong nghiên cứu và phân tích dữ liệu. Với giao diện thân thiện và khả năng xử lý thống kê mạnh mẽ, SPSS giúp người dùng tiết kiệm thời gian, giảm sai sót và nâng cao chất lượng kết quả. Việc nắm vững SPSS sẽ là bước đệm quan trọng cho bất kỳ ai muốn tiến xa hơn trong lĩnh vực nghiên cứu khoa học hay kinh doanh.

Tài liệu tham khảo

  1. Dương thiệu Tống, Thống kê ứng dụng trong nghiên cứu khoa học giáo dục, NXB Đại học Quốc Gia HN 2000
  2. Nguyễn Công Khanh, Ứng dụng phần mềm thống kê SPSS để xử lý và phân tích dữ liệu trong khoa học xã hội(Tài liệu dùng cho học viên cao học TL -GDH), Hà Nội 2004
  3. Nguyễn Văn Liệu, Nguyễn Đình Cử, Nguyễn Quốc Anh, SPSS -Ứng dụng phân tích dữ liệu trong quản trị kinh doanh và khoa học tự nhiên -xã hội. NXB Giao thông vận tải 2000
  4. Võ Văn Huy, Võ Thị Lan, Hoàng Trọng. Ứng dụng SPSS for windows để xử lý và phân tích dữ kiện nghiên cứu marketing, quản trị, kinh tế, tâm lý, xã hội. NXB Khoa học Kỹ thuật 1997

Bài đăng này hữu ích như thế nào?

Bấm vào một ngôi sao để đánh giá nó!

Đánh giá trung bình 0 / 5. Số phiếu bầu: 0

Hãy là người đầu tiên đánh giá bài viết này.

icon Share
Tác giả Nguyễn Tuyết Anh phụ trách nội dung chuyên môn chia sẻ kinh nghiệm. Với hơn 10 năm kinh nghiệm trong lĩnh vực biên soạn, chỉnh sửa, nghiên cứu học thuật cùng đội ngũ chuyên gia trong nhiều ngành đưa Luận Văn 1080 Trở thành đơn vị tiên phong về dịch vụ viết thuê luận văn thạc sĩ, tiểu luận, essay, assignment, xử lý số liệu chuyên sâu,... đối tác đáng tin cậy của học viên, nghiên cứu sinh trong và ngoài nước. - Hotline: 0969 991 080 - Email: luanvan1080@gmail.com