반응형

SPSS 통계 이용방법 가이드: 1일차 - 시작하기

통계 분석이 처음이시거나 SPSS를 처음 접하시나요? SPSS(Statistical Package for the Social Sciences)는 데이터를 쉽게 다룰 수 있도록 돕는 강력한 소프트웨어입니다. 오늘은 SPSS 설치부터 기본적인 인터페이스 이해까지 다루며, 첫걸음을 함께 시작해 보겠습니다.


1. SPSS란 무엇인가요?

SPSS는 IBM에서 제공하는 통계 분석 소프트웨어로, 다음과 같은 작업에 주로 사용됩니다:

  • 설문 조사 결과 분석
  • 데이터 시각화
  • 가설 검정 (t-검정, ANOVA 등)
  • 회귀 분석 및 모델링

SPSS는 직관적인 인터페이스와 다양한 분석 기능 덕분에 초보자부터 전문가까지 널리 활용되고 있습니다.


2. SPSS 설치하기

설치 절차:

  1. IBM SPSS 다운로드:
    IBM 공식 웹사이트(링크)에서 평가판을 다운로드하거나, 정식 라이선스를 구매하세요.
  2. 설치 파일 실행:
    다운로드한 설치 파일을 실행하고, 설치 마법사의 안내에 따라 설치를 완료합니다.
  3. 라이선스 인증:
    설치 후 SPSS를 처음 실행하면 라이선스 인증 화면이 나타납니다. 구매한 라이선스 키를 입력하거나 평가판으로 설정하세요.
  4. 필요한 패키지 확인:
    기본 통계 외에도 고급 분석, 텍스트 분석 등의 패키지를 추가로 설치할 수 있습니다.

3. SPSS 인터페이스 살펴보기

SPSS를 실행하면 주요 화면은 다음과 같이 구성됩니다:

1) 데이터 뷰(Data View):

  • 데이터를 입력하거나 확인하는 창입니다.
  • 각 행(Row)은 관찰치(사례), 각 열(Column)은 변수를 나타냅니다.

2) 변수 뷰(Variable View):

  • 데이터를 설명하는 변수의 속성을 정의합니다.
    • Name: 변수 이름 (예: age, gender)
    • Type: 데이터 유형 (숫자, 문자열 등)
    • Label: 변수 설명 (예: "나이" 또는 "성별")
    • Values: 범주형 변수의 값 지정 (예: 1 = 남성, 2 = 여성)

3) 출력 창(Output):

  • 분석 결과가 표시되는 별도의 창입니다. 그래프, 표, 통계 결과 등을 확인할 수 있습니다.

4) 메뉴 및 도구:

  • File: 데이터 열기/저장
  • Analyze: 통계 분석 기능 (기술 통계, 회귀, ANOVA 등)
  • Graphs: 데이터 시각화
  • Transform: 데이터 변환 (계산식 추가, 재코딩 등)

4. 데이터를 SPSS에 입력하기

방법 1: 직접 입력

  1. 데이터 뷰(Data View): 빈 셀에 데이터를 직접 입력하세요.
    • 예: 첫 번째 열에 "나이", 두 번째 열에 "성별"을 입력하고 값을 추가합니다.
  2. 변수 뷰(Variable View): 데이터 입력 전에 변수 속성을 정의하면 더 정확하게 관리할 수 있습니다.
    • "나이"는 숫자형(Numeric) 변수, "성별"은 범주형(Categorical) 변수로 설정.

방법 2: 엑셀 데이터 가져오기

  1. 엑셀 파일 준비: 분석할 데이터를 엑셀에 정리하고 첫 번째 행에 변수명을 기입하세요.
  2. 파일 열기: File > Open > Data를 클릭한 후, 엑셀 파일을 선택합니다.
  3. 파일 유형 설정: 파일 형식을 "Excel (*.xls, *.xlsx)"로 선택하면 엑셀 데이터를 SPSS로 불러올 수 있습니다.
  4. 데이터 매핑: 변수 이름과 데이터 범위를 확인하고 "OK"를 눌러 불러옵니다.

5. 기초 분석 실행하기

SPSS의 기초 분석 기능 중 **기술 통계(Descriptive Statistics)**를 활용해 데이터를 요약하는 방법을 알아봅시다.

예제: 데이터의 평균과 표준편차 구하기

  1. Analyze > Descriptive Statistics > Descriptives 클릭.
  2. 분석할 변수를 선택하고 오른쪽 "Variables" 창으로 이동.
  3. "Options" 버튼을 눌러 평균(Mean), 표준편차(Standard Deviation) 등을 선택.
  4. "OK"를 클릭하면 출력 창에 결과가 표시됩니다.

6. 첫날의 목표: SPSS 기본 익히기

  1. SPSS를 설치하고 실행해보세요.
  2. 간단한 데이터를 입력하거나 엑셀 데이터를 불러와 보세요.
  3. 기술 통계를 사용해 평균, 표준편차 등을 구해보세요.

마무리

SPSS의 첫걸음을 떼셨다면 이제 데이터를 다루는 기본기를 익히신 겁니다. 다음 시간에는 데이터 변환과 그래프 그리기에 대해 알아보겠습니다.

궁금한 점이나 도움이 필요하시면 댓글로 남겨주세요. 다음 글에서 더 자세히 다뤄드리겠습니다! 😊

반응형
반응형

T-테스트: 집단 간의 평균차이 분석할 때 씁니다. 

< 두 가지 경우 >

1. 서로 다른 두 집단 (성별 등) 평균 차이를 분석 - 독립표본 t-test  (independent two sample t-test)

2. 같은 집단의 전후 평균 분석 - 대응표본 t-test  (Paired sample t-test)


1. 독립표본 t-test 

SPSS 메뉴 -> 분석 (Analyze) - 평균비교 (Compare means) - 독립표본 T 검정 (Independent Sample T Test)

2. 대응표본 t-test 

SPSS 메뉴 -> 분석 (Analyze) - 평균비교 (Compare means) - 대응표본 T 검정 (Paired Sample T Test)

[Example]

“A paired-samples t-test was conducted to compare the number of hours of sleep in caffeine and no caffeine conditions.”

“There was a significant (not a significant) difference in the scores for IV level 1 (M=___, SD=___) and IV level 2 (M=___, SD=___) conditions; t(_df_)=___, p = ____”



반응형
반응형

ANCOVA 대 회귀 분석

개요:

1. ANCOVA는 통계의 특정 선형 모델입니다. 회귀 분석은 통계 도구이기도하지만 여러 회귀 모델의 포괄적 인 용어입니다. 회귀는 또한 관계의 국가 이름입니다.
2. ANCOVA는 연속 변수와 범주 변수 모두를 다루지 만 회귀는 연속 변수만을 다룹니다.
3. ANCOVA와 회귀 분석은 하나의 특정 모델 인 선형 회귀 모델을 공유합니다.
4. ANCOVA와 회귀 분석은 특수한 소프트웨어를 사용하여 실제 계산을 수행 할 수 있습니다.


ANCOVA와 회귀 분석은 통계 기법 및 도구입니다. ANCOVA와 회귀 분석은 많은 유사점을 공유하지만 서로 뚜렷한 특징을 가지고 있습니다. ANCOVA와 회귀는 둘 다 연속 예측 변수 인 공변량을 기반으로합니다.

ANCOVA는 공분산 분석의 약자입니다. 이것은 일원 분산 분석 (분산 분석)과 회귀의 변형 인 선형 회귀 분석의 조합입니다. 범주 형 변수와 연속 변수를 모두 다룹니다. 이는 다른 변수의 변동성으로 인해 하나의 변수의 분산 범위를 결정하는 특정 통계 방법입니다.

ANCOVA는 기본적으로보다 정교하고 기존 ANOVA 모델에 연속 변수를 추가 한 ANOVA입니다. ANCOVA의 다른 형태는 MANCOVA (공변량의 다변량 분석)입니다. 또한 ANCOVA는 연속적인 결과 변수와 둘 이상의 예측 변수가있는 일반 선형 모델입니다. 두 예측 변수는 연속적이고 범주 형 변수입니다.

연속 변수에서, 데이터는 정량적이며 스케일링되는 반면, 범주 형 데이터는 명목상 및 비 스케일 형으로 특징 지어진다. ANCOVA는 주로 무작위화할 수없는 요인을 제어하는 ​​데 사용되지만 실험 디자인에서는 간격 규모로 계산할 수 있지만 관찰 디자인에서는 범주 독립 항목과 간격 종속 항목 간의 관계를 변경하는 변수 효과를 지우는 데 사용됩니다. MANCOVA는 또한 회귀 모형에서 주요 기능이 범주 형 및 간격 독립형 모두에서 회귀 분석에 적합하도록하는 용도로 사용됩니다.
ANCOVA는 종속 변수가 독립 변수에 선형이어야하는 선형 회귀에 의존하는 모델입니다. 


한편, 회귀 분석은 많은 변형에서 사용할 수있는 통계 도구이기도합니다. 변종에는 선형 회귀 모델, 단순 선형 회귀, 로지스틱 회귀, 비선형 회귀, 비모수 회귀, 강력한 회귀 및 단계별 회귀가 포함됩니다. 회귀는 연속 변수를 다룹니다.
회귀는 종속 변수와 독립 변수의 관계입니다. 이 모델에는 하나의 종속 변수와 하나 이상의 독립 변수가 있습니다. 또한 독립 변수 중 하나의 변경으로 인한 종속 변수 값의 변경을 이해하기위한 노력이 있습니다. 이 상황에서 다른 독립 변수는 고정되어 있습니다.

회귀 분석에서 선형 회귀 분석과 다중 회귀 분석의 두 가지 기본 유형이 있습니다. 선형 회귀 분석에서, 하나의 독립 변수는 'Y'(변수가 예측하려고하는)의 결과를 설명 및 / 또는 예측하는 데 사용됩니다. 반면에, 회귀가 결과를 예측하기 위해 하나 이상의 변수를 사용하는 배수가있습니다.

선형 회귀와 선형 회귀에 대한 방정식은 다음과 같습니다. Y = a + bX + u 다중 회귀 양식은 다음과 같습니다. Y = a + b1X1 + b2X2 + B3X3 + + BtXt + u.

두 방정식 모두에서 'Y'는 예측하려고하는 변수를 나타냅니다. 'X'는 'Y'변수를 예측하는 변수 도구입니다. 'a'는 절편이고 'b'는 기울기이며 'u'는 회귀 잔차의 역할을합니다. 절편, 기울기 및 회귀 잔차는 일정하다는 점에 유의해야합니다.

회귀 분석은 지속적인 결과를 예측하고 예측하는 방법입니다. 연속 결과에 사용하는 방법이며 하나 이상의 연속 예측 변수를 기반으로합니다.


반응형
반응형

[SPSS/통계분석] 아노바(ANOVA)분산 분석 총정리!

통계를 공부하면서 가장 많이 쓰는 것이 아노바와 회귀분석인 것 같습니다. 적어도 제가 공부하는 분야는요^^ 그래서 배운 것들을 조금씩 정리해 보고자 합니다. 

어떻게 우리는 두 그룹 이상을 통계 분석에서 비교할 수 있을까?

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_





반응형
반응형

다중회귀분석 (Multiple Regression model)이란?


_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

R 스퀘어 값은 변수를 더할수록 커지지만 여러 개를 더할 수록 증가도는 감소합니다. 

_

_

_

_

_




반응형
반응형

Chi-square: Analyze - Descriptive Statistics - Crosstabs - click Statistics, check Chi-square - Click Cells, check Standardized under Residuals - OK.


_

_

_




반응형
반응형

주의:  sum_range 셀에 해당하는 range 의 셀이 조건과 일치하면 sum 함수가 적용됩니다.

 A

 1

사과 

 2

배 

 3

사과 


Ex) SUMIF(A1:A3, "사과"C1:C3) = 3+7 = 10 이 되겠죠?^^ 어렵지 않죠?


다른 예를 살펴보면, 

SUMIFS 함수입니다. 

=SUMIF(A2:A6, D2, C2:C6)

A 열 중에 기준이 2000인 것을 C열에서 찾아서 더하면 됩니다.



_


SUMIF 함수를 익히셨으면 COUNTIF 함수는 그냥 하시는 거죠^^






반응형
반응형

https://surfstat.anu.edu.au/surfstat-home/tables/chi.php



위 사이트에서 카이스퀘어를 쉽게 계산할 수 있습니다. 계산을 위해 자유도와 C제곱값을 알아야 합니다. 

정석으로 계산하려면 아래 사진을 참조하세요~





df(자유도) = (row-1)(column-1) = 위 표의 경우는 (3-1)2-1) = 2 입니다. 


또는 카이스퀘어 테이블을 이용해도 됩니다!!

Chi-square-table.pdf







반응형
반응형

가설 테스트는 두 가지 반대되는 가설을 입증합니다. 영가설(귀무가설)과 대립가설. 리서치에서 어떻게 가설을 설정하는가는 실험을 통해서 무엇을 입증할 것이냐에 달려 있습니다. 

A hypothesis test examines two opposing hypotheses about a population: the null hypothesis and the alternative hypothesis. How you set up these hypotheses depends on what you are trying to show.

귀무 가설 - Null hypothesis (H0
귀무가설은 영가설이라고도 하면 차이가 없거나 의미있는 차이가 없는 경우의 가설을 말합니다. 대부분의 양적 연구에서 영가설은 실험집단과 통제집단 사이에 차이가 없다는 가설입니다. 
The null hypothesis states that a population parameter is equal to a value. The null hypothesis is often an initial claim that researchers specify using previous research or knowledge.
대립 가설 - Alternative Hypothesis (H1)
귀무가설과 대립되는 가설을 대립가설이라고 하고, 리서쳐가 연구를 통해 입증하기를 기대하는 내용이나 주장을 말합니다. 실험 집단 실험의 결과가 통제집단 실험 결과와 차이가 난다는 가설을 말합니다. 
The alternative hypothesis states that the population parameter is different than the value of the population parameter in the null hypothesis. The alternative hypothesis is what you might believe to be true or hope to prove true.

_


What are some common hypotheses?

Hypothesis to determine whether a population mean, μ, is equal to some target value μ0 include the following:
  • Ho: μ = μ0
  • H1: μ < μ0 (a lower-tailed test) or
  • H1: μ > μ0 (a upper-tailed test) or
  • H1: μ ≠ μ0 (a two-tailed test) 이 경우는 위 두 경우를 포함하는 것을 말합니다. 
Hypothesis to determine whether one population mean, μ1 is equal to different population mean μ2include the following: 
  • H0: μ1 = μ2 (두 집단 사이에 차이가 없다)
  • H1: μ1< μ2 or
  • H1: μ1> μ2 or
  • H1: μ1≠ μ2


반응형
반응형

제가 공부하는 분야에서는 (체육교육), T-test와 ANOVA를 많이 사용합니다. 처음에는 T-test 와 ANOVA 를 구분하기 어려워서 차이를 정리했었는데 정리한 것을 바탕으로 포스팅해 놓으렵니다.

쉽게 말하면 T-test와 ANOVA는 사실은 같은 방법을 사용합니다. 

분석하고자 하는 집단의 수가 T-test와 ANOVA를 결정합니다. 

T-test는 2 집단의 평균의 차이를 비교하고, ANOVA는 2 집단 이상의 평균의 차이를 비교하는데 사용합니다. 




예를 들어보자면,

1. 남자와 여자의 Physical activity level 을 비교한다고 하면, 집단(남자, 여자)로 2개이고 평균(Activity level 평균)을 비교하므로 이 경우에는 T-test를 사용해도 됩니다.  

2. 초등학교, 중학교, 고등학교 학생들의 Physical activity level 을 비교한다면, 3집단(초, 중, 고)의 평균을 비교하므로 이 경우에는 ANOVA(분산분석)를 사용합니다. 

두 가지 분석 방법(ANOVA는 T-test)들이 가지고 있는 분석 방법은 거의 비슷합니다.

또한, T-test를 하게 되면 검정 통계량 (test statistic) 은 T, ANOVA를 하게 되면 검정통계량은 F 를 이용하여 분석을 합니다. SPSS 프로그램을 사용하면 결과에 t 또는 f 값으로 나타납니다. 

아래 두 개 사진은 SPSS를 이용했을 때 얻는 결과들의 예시입니다. 




제가 언급했던 전반적인 내용을 간단하게 정리하자면 아래와 같습니다. 

                T-test               ANVOA
---------------------------------------------------------------
      차이           2 집단 평균비교     3집단이상 평균비교
            검정통계량                T                     F                
    제시통계량         평균, 표준편차       평균, 표준편차    
                                      사후검정 결과 


실제 데이터를 이용하면 이해하는 데 더 도움이 될 것 같습니다. 도움이 되셨길!!!




반응형

+ Recent posts