반응형

SPSS 통계 이용방법 가이드: 2일차 - 데이터 변환과 그래프 그리기

SPSS를 조금 더 깊이 이해하기 위해 오늘은 데이터 변환그래프 그리기를 배우겠습니다. 데이터를 분석하기 전, 데이터를 정리하거나 시각화하는 과정은 분석 결과의 품질을 높이는 데 매우 중요합니다. 2일차에서는 데이터를 효율적으로 다룰 수 있는 SPSS의 강력한 기능을 살펴보겠습니다.


1. 데이터 변환이란?

데이터 변환은 분석을 위해 데이터를 재구성하거나 새 변수로 변경하는 작업을 의미합니다. SPSS에서는 데이터 변환 작업을 쉽게 수행할 수 있는 도구를 제공합니다.

변환의 주요 작업:

  1. 값 재코딩 (Recode): 범주형 변수를 새롭게 정의하거나 값을 변경.
  2. 새 변수 생성 (Compute): 기존 데이터를 활용해 새로운 변수 계산.
  3. 데이터 분할: 특정 조건에 따라 데이터를 그룹으로 나누기.

2. 값 재코딩 (Recode into Different Variables)

예를 들어, 나이 데이터를 연령대(청년, 중년, 노년)로 나누고 싶다면 다음 단계를 따라하세요.

실습: 나이를 연령대로 재코딩

  1. 데이터 준비:
    나이(Age)라는 변수가 있는 데이터를 준비합니다.
  2. Recode 기능 선택:
    • 메뉴에서 Transform > Recode into Different Variables를 클릭합니다.
  3. 재코딩할 변수 선택:
    • Input Variable에 "Age"를 선택하고, Output Variable에 새 변수 이름(예: Age_Group)을 입력한 뒤 "Change"를 클릭합니다.
  4. 값 설정:
    • "Old and New Values" 버튼을 클릭하여 조건을 설정합니다.
      • 0~29 → 1 (청년)
      • 30~59 → 2 (중년)
      • 60 이상 → 3 (노년)
    • 각 조건을 입력 후 "Add" 버튼을 누릅니다.
  5. 적용 및 저장:
    • "Continue"와 "OK"를 눌러 재코딩을 완료합니다.
  6. 결과 확인:
    • 데이터 뷰(Data View)에서 새로 생성된 Age_Group 변수를 확인하세요.

3. 새로운 변수 계산 (Compute Variable)

실습: 평균 점수 계산하기

시험 점수 데이터에서 총점을 기준으로 평균 점수를 계산하는 변수를 생성해보겠습니다.

  1. Compute 기능 선택:
    • 메뉴에서 Transform > Compute Variable을 클릭합니다.
  2. 새 변수 이름 지정:
    • Target Variable에 새 변수 이름(예: Avg_Score)을 입력합니다.
  3. 수식 입력:
    • Numeric Expression 창에 (Score1 + Score2 + Score3) / 3을 입력합니다.
      • Score1, Score2, Score3은 데이터의 시험 점수 변수입니다.
  4. 적용:
    • "OK"를 클릭하여 새로운 변수를 생성합니다.
  5. 결과 확인:
    • 데이터 뷰에서 생성된 Avg_Score 변수를 확인합니다.

4. 그래프 그리기

SPSS는 다양한 그래프 도구를 제공하여 데이터를 시각적으로 표현할 수 있습니다. 다음은 자주 사용되는 그래프의 예입니다.

A. 막대 그래프 (Bar Chart)

  1. 메뉴에서 Graphs > Chart Builder를 클릭합니다.
  2. Chart Builder 창에서 Bar Chart를 선택합니다.
  3. x축에는 범주형 변수(예: Age_Group), y축에는 연속형 변수(예: Avg_Score)를 드래그하여 배치합니다.
  4. "OK"를 클릭하면 출력 창에 그래프가 생성됩니다.

B. 히스토그램 (Histogram)

  1. 메뉴에서 Analyze > Descriptive Statistics > Frequencies를 클릭합니다.
  2. 분석할 변수를 선택한 뒤, "Charts" 버튼을 클릭합니다.
  3. Histogram을 선택하고 "Continue"와 "OK"를 눌러 그래프를 생성합니다.

C. 파이 차트 (Pie Chart)

  1. 메뉴에서 Graphs > Chart Builder를 클릭합니다.
  2. Chart Builder 창에서 Pie Chart를 선택합니다.
  3. 범주형 변수를 차트에 배치한 뒤, "OK"를 클릭하면 출력 창에 파이 차트가 표시됩니다.

5. 오늘의 실습 목표

  1. 데이터를 변환하여 분석하기 쉽게 재구성해보세요.
    • 나이를 연령대로 재코딩하거나, 계산식으로 새 변수를 만들어보세요.
  2. 간단한 그래프(막대 그래프, 히스토그램, 파이 차트)를 생성해 데이터를 시각화해보세요.

6. 마무리

데이터 변환과 그래프 그리기는 SPSS를 활용한 데이터 분석의 핵심적인 부분입니다. 오늘 배운 내용을 바탕으로 데이터를 깔끔하게 정리하고, 시각적으로 표현해보세요. 다음 3일차에서는 **기초 통계 분석(기술 통계, 상관 분석)**을 다룰 예정입니다.

질문이나 어려운 점이 있다면 댓글로 남겨주세요! 😊 다음 글에서 자세히 설명드리겠습니다.

반응형
반응형

SPSS 통계 이용방법 가이드: 1일차 - 시작하기

통계 분석이 처음이시거나 SPSS를 처음 접하시나요? SPSS(Statistical Package for the Social Sciences)는 데이터를 쉽게 다룰 수 있도록 돕는 강력한 소프트웨어입니다. 오늘은 SPSS 설치부터 기본적인 인터페이스 이해까지 다루며, 첫걸음을 함께 시작해 보겠습니다.


1. SPSS란 무엇인가요?

SPSS는 IBM에서 제공하는 통계 분석 소프트웨어로, 다음과 같은 작업에 주로 사용됩니다:

  • 설문 조사 결과 분석
  • 데이터 시각화
  • 가설 검정 (t-검정, ANOVA 등)
  • 회귀 분석 및 모델링

SPSS는 직관적인 인터페이스와 다양한 분석 기능 덕분에 초보자부터 전문가까지 널리 활용되고 있습니다.


2. SPSS 설치하기

설치 절차:

  1. IBM SPSS 다운로드:
    IBM 공식 웹사이트(링크)에서 평가판을 다운로드하거나, 정식 라이선스를 구매하세요.
  2. 설치 파일 실행:
    다운로드한 설치 파일을 실행하고, 설치 마법사의 안내에 따라 설치를 완료합니다.
  3. 라이선스 인증:
    설치 후 SPSS를 처음 실행하면 라이선스 인증 화면이 나타납니다. 구매한 라이선스 키를 입력하거나 평가판으로 설정하세요.
  4. 필요한 패키지 확인:
    기본 통계 외에도 고급 분석, 텍스트 분석 등의 패키지를 추가로 설치할 수 있습니다.

3. SPSS 인터페이스 살펴보기

SPSS를 실행하면 주요 화면은 다음과 같이 구성됩니다:

1) 데이터 뷰(Data View):

  • 데이터를 입력하거나 확인하는 창입니다.
  • 각 행(Row)은 관찰치(사례), 각 열(Column)은 변수를 나타냅니다.

2) 변수 뷰(Variable View):

  • 데이터를 설명하는 변수의 속성을 정의합니다.
    • Name: 변수 이름 (예: age, gender)
    • Type: 데이터 유형 (숫자, 문자열 등)
    • Label: 변수 설명 (예: "나이" 또는 "성별")
    • Values: 범주형 변수의 값 지정 (예: 1 = 남성, 2 = 여성)

3) 출력 창(Output):

  • 분석 결과가 표시되는 별도의 창입니다. 그래프, 표, 통계 결과 등을 확인할 수 있습니다.

4) 메뉴 및 도구:

  • File: 데이터 열기/저장
  • Analyze: 통계 분석 기능 (기술 통계, 회귀, ANOVA 등)
  • Graphs: 데이터 시각화
  • Transform: 데이터 변환 (계산식 추가, 재코딩 등)

4. 데이터를 SPSS에 입력하기

방법 1: 직접 입력

  1. 데이터 뷰(Data View): 빈 셀에 데이터를 직접 입력하세요.
    • 예: 첫 번째 열에 "나이", 두 번째 열에 "성별"을 입력하고 값을 추가합니다.
  2. 변수 뷰(Variable View): 데이터 입력 전에 변수 속성을 정의하면 더 정확하게 관리할 수 있습니다.
    • "나이"는 숫자형(Numeric) 변수, "성별"은 범주형(Categorical) 변수로 설정.

방법 2: 엑셀 데이터 가져오기

  1. 엑셀 파일 준비: 분석할 데이터를 엑셀에 정리하고 첫 번째 행에 변수명을 기입하세요.
  2. 파일 열기: File > Open > Data를 클릭한 후, 엑셀 파일을 선택합니다.
  3. 파일 유형 설정: 파일 형식을 "Excel (*.xls, *.xlsx)"로 선택하면 엑셀 데이터를 SPSS로 불러올 수 있습니다.
  4. 데이터 매핑: 변수 이름과 데이터 범위를 확인하고 "OK"를 눌러 불러옵니다.

5. 기초 분석 실행하기

SPSS의 기초 분석 기능 중 **기술 통계(Descriptive Statistics)**를 활용해 데이터를 요약하는 방법을 알아봅시다.

예제: 데이터의 평균과 표준편차 구하기

  1. Analyze > Descriptive Statistics > Descriptives 클릭.
  2. 분석할 변수를 선택하고 오른쪽 "Variables" 창으로 이동.
  3. "Options" 버튼을 눌러 평균(Mean), 표준편차(Standard Deviation) 등을 선택.
  4. "OK"를 클릭하면 출력 창에 결과가 표시됩니다.

6. 첫날의 목표: SPSS 기본 익히기

  1. SPSS를 설치하고 실행해보세요.
  2. 간단한 데이터를 입력하거나 엑셀 데이터를 불러와 보세요.
  3. 기술 통계를 사용해 평균, 표준편차 등을 구해보세요.

마무리

SPSS의 첫걸음을 떼셨다면 이제 데이터를 다루는 기본기를 익히신 겁니다. 다음 시간에는 데이터 변환과 그래프 그리기에 대해 알아보겠습니다.

궁금한 점이나 도움이 필요하시면 댓글로 남겨주세요. 다음 글에서 더 자세히 다뤄드리겠습니다! 😊

반응형
반응형

T-테스트: 집단 간의 평균차이 분석할 때 씁니다. 

< 두 가지 경우 >

1. 서로 다른 두 집단 (성별 등) 평균 차이를 분석 - 독립표본 t-test  (independent two sample t-test)

2. 같은 집단의 전후 평균 분석 - 대응표본 t-test  (Paired sample t-test)


1. 독립표본 t-test 

SPSS 메뉴 -> 분석 (Analyze) - 평균비교 (Compare means) - 독립표본 T 검정 (Independent Sample T Test)

2. 대응표본 t-test 

SPSS 메뉴 -> 분석 (Analyze) - 평균비교 (Compare means) - 대응표본 T 검정 (Paired Sample T Test)

[Example]

“A paired-samples t-test was conducted to compare the number of hours of sleep in caffeine and no caffeine conditions.”

“There was a significant (not a significant) difference in the scores for IV level 1 (M=___, SD=___) and IV level 2 (M=___, SD=___) conditions; t(_df_)=___, p = ____”



반응형
반응형

ANCOVA 대 회귀 분석

개요:

1. ANCOVA는 통계의 특정 선형 모델입니다. 회귀 분석은 통계 도구이기도하지만 여러 회귀 모델의 포괄적 인 용어입니다. 회귀는 또한 관계의 국가 이름입니다.
2. ANCOVA는 연속 변수와 범주 변수 모두를 다루지 만 회귀는 연속 변수만을 다룹니다.
3. ANCOVA와 회귀 분석은 하나의 특정 모델 인 선형 회귀 모델을 공유합니다.
4. ANCOVA와 회귀 분석은 특수한 소프트웨어를 사용하여 실제 계산을 수행 할 수 있습니다.


ANCOVA와 회귀 분석은 통계 기법 및 도구입니다. ANCOVA와 회귀 분석은 많은 유사점을 공유하지만 서로 뚜렷한 특징을 가지고 있습니다. ANCOVA와 회귀는 둘 다 연속 예측 변수 인 공변량을 기반으로합니다.

ANCOVA는 공분산 분석의 약자입니다. 이것은 일원 분산 분석 (분산 분석)과 회귀의 변형 인 선형 회귀 분석의 조합입니다. 범주 형 변수와 연속 변수를 모두 다룹니다. 이는 다른 변수의 변동성으로 인해 하나의 변수의 분산 범위를 결정하는 특정 통계 방법입니다.

ANCOVA는 기본적으로보다 정교하고 기존 ANOVA 모델에 연속 변수를 추가 한 ANOVA입니다. ANCOVA의 다른 형태는 MANCOVA (공변량의 다변량 분석)입니다. 또한 ANCOVA는 연속적인 결과 변수와 둘 이상의 예측 변수가있는 일반 선형 모델입니다. 두 예측 변수는 연속적이고 범주 형 변수입니다.

연속 변수에서, 데이터는 정량적이며 스케일링되는 반면, 범주 형 데이터는 명목상 및 비 스케일 형으로 특징 지어진다. ANCOVA는 주로 무작위화할 수없는 요인을 제어하는 ​​데 사용되지만 실험 디자인에서는 간격 규모로 계산할 수 있지만 관찰 디자인에서는 범주 독립 항목과 간격 종속 항목 간의 관계를 변경하는 변수 효과를 지우는 데 사용됩니다. MANCOVA는 또한 회귀 모형에서 주요 기능이 범주 형 및 간격 독립형 모두에서 회귀 분석에 적합하도록하는 용도로 사용됩니다.
ANCOVA는 종속 변수가 독립 변수에 선형이어야하는 선형 회귀에 의존하는 모델입니다. 


한편, 회귀 분석은 많은 변형에서 사용할 수있는 통계 도구이기도합니다. 변종에는 선형 회귀 모델, 단순 선형 회귀, 로지스틱 회귀, 비선형 회귀, 비모수 회귀, 강력한 회귀 및 단계별 회귀가 포함됩니다. 회귀는 연속 변수를 다룹니다.
회귀는 종속 변수와 독립 변수의 관계입니다. 이 모델에는 하나의 종속 변수와 하나 이상의 독립 변수가 있습니다. 또한 독립 변수 중 하나의 변경으로 인한 종속 변수 값의 변경을 이해하기위한 노력이 있습니다. 이 상황에서 다른 독립 변수는 고정되어 있습니다.

회귀 분석에서 선형 회귀 분석과 다중 회귀 분석의 두 가지 기본 유형이 있습니다. 선형 회귀 분석에서, 하나의 독립 변수는 'Y'(변수가 예측하려고하는)의 결과를 설명 및 / 또는 예측하는 데 사용됩니다. 반면에, 회귀가 결과를 예측하기 위해 하나 이상의 변수를 사용하는 배수가있습니다.

선형 회귀와 선형 회귀에 대한 방정식은 다음과 같습니다. Y = a + bX + u 다중 회귀 양식은 다음과 같습니다. Y = a + b1X1 + b2X2 + B3X3 + + BtXt + u.

두 방정식 모두에서 'Y'는 예측하려고하는 변수를 나타냅니다. 'X'는 'Y'변수를 예측하는 변수 도구입니다. 'a'는 절편이고 'b'는 기울기이며 'u'는 회귀 잔차의 역할을합니다. 절편, 기울기 및 회귀 잔차는 일정하다는 점에 유의해야합니다.

회귀 분석은 지속적인 결과를 예측하고 예측하는 방법입니다. 연속 결과에 사용하는 방법이며 하나 이상의 연속 예측 변수를 기반으로합니다.


반응형
반응형

[SPSS/통계분석] 아노바(ANOVA)분산 분석 총정리!

통계를 공부하면서 가장 많이 쓰는 것이 아노바와 회귀분석인 것 같습니다. 적어도 제가 공부하는 분야는요^^ 그래서 배운 것들을 조금씩 정리해 보고자 합니다. 

어떻게 우리는 두 그룹 이상을 통계 분석에서 비교할 수 있을까?

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

_





반응형
반응형

다중회귀분석 (Multiple Regression model)이란?


_

_

_

_

_

_

_

_

_

_

_

_

_

_

_

R 스퀘어 값은 변수를 더할수록 커지지만 여러 개를 더할 수록 증가도는 감소합니다. 

_

_

_

_

_




반응형
반응형

Chi-square: Analyze - Descriptive Statistics - Crosstabs - click Statistics, check Chi-square - Click Cells, check Standardized under Residuals - OK.


_

_

_




반응형
반응형

주의:  sum_range 셀에 해당하는 range 의 셀이 조건과 일치하면 sum 함수가 적용됩니다.

 A

 1

사과 

 2

배 

 3

사과 


Ex) SUMIF(A1:A3, "사과"C1:C3) = 3+7 = 10 이 되겠죠?^^ 어렵지 않죠?


다른 예를 살펴보면, 

SUMIFS 함수입니다. 

=SUMIF(A2:A6, D2, C2:C6)

A 열 중에 기준이 2000인 것을 C열에서 찾아서 더하면 됩니다.



_


SUMIF 함수를 익히셨으면 COUNTIF 함수는 그냥 하시는 거죠^^






반응형
반응형

https://surfstat.anu.edu.au/surfstat-home/tables/chi.php



위 사이트에서 카이스퀘어를 쉽게 계산할 수 있습니다. 계산을 위해 자유도와 C제곱값을 알아야 합니다. 

정석으로 계산하려면 아래 사진을 참조하세요~





df(자유도) = (row-1)(column-1) = 위 표의 경우는 (3-1)2-1) = 2 입니다. 


또는 카이스퀘어 테이블을 이용해도 됩니다!!

Chi-square-table.pdf







반응형
반응형

가설 테스트는 두 가지 반대되는 가설을 입증합니다. 영가설(귀무가설)과 대립가설. 리서치에서 어떻게 가설을 설정하는가는 실험을 통해서 무엇을 입증할 것이냐에 달려 있습니다. 

A hypothesis test examines two opposing hypotheses about a population: the null hypothesis and the alternative hypothesis. How you set up these hypotheses depends on what you are trying to show.

귀무 가설 - Null hypothesis (H0
귀무가설은 영가설이라고도 하면 차이가 없거나 의미있는 차이가 없는 경우의 가설을 말합니다. 대부분의 양적 연구에서 영가설은 실험집단과 통제집단 사이에 차이가 없다는 가설입니다. 
The null hypothesis states that a population parameter is equal to a value. The null hypothesis is often an initial claim that researchers specify using previous research or knowledge.
대립 가설 - Alternative Hypothesis (H1)
귀무가설과 대립되는 가설을 대립가설이라고 하고, 리서쳐가 연구를 통해 입증하기를 기대하는 내용이나 주장을 말합니다. 실험 집단 실험의 결과가 통제집단 실험 결과와 차이가 난다는 가설을 말합니다. 
The alternative hypothesis states that the population parameter is different than the value of the population parameter in the null hypothesis. The alternative hypothesis is what you might believe to be true or hope to prove true.

_


What are some common hypotheses?

Hypothesis to determine whether a population mean, μ, is equal to some target value μ0 include the following:
  • Ho: μ = μ0
  • H1: μ < μ0 (a lower-tailed test) or
  • H1: μ > μ0 (a upper-tailed test) or
  • H1: μ ≠ μ0 (a two-tailed test) 이 경우는 위 두 경우를 포함하는 것을 말합니다. 
Hypothesis to determine whether one population mean, μ1 is equal to different population mean μ2include the following: 
  • H0: μ1 = μ2 (두 집단 사이에 차이가 없다)
  • H1: μ1< μ2 or
  • H1: μ1> μ2 or
  • H1: μ1≠ μ2


반응형

+ Recent posts