
Lab 3: Descriptive Statistics

Complete the following tasks using SPSS. Print out the outputs and submit in print. For questions you need to answer, write down the answers on the printed outputs by the table or graph.

Problem Set 1

Download the dataset “heights.sav”.

  1. Follow the directions below to create value labels for variable gender: 0 = male, 1 = female.

    Variable ViewValuesFor each different value, enter the value and label and then click Add, after all pairs are defined, click OK.

  2. Follow the directions below to create a frequency table for gender. How many males and females are there in the sample and what are the corresponding proportions?

    AnalyzeDescriptive StatisticsFrequenciesVariable(s): GENDERMake sure below the boxes “Display frequency tables” is checkedOK.

  3. Follow the directions below to select all of the male cases.

    DataSelect CasesIf condition is satisfiedIf...Select GENDER into the box on topclick “=” and then click “0ContinueOK

  4. Follow the directions below to find the following for the height of males in the dataset: mean, standard deviation, variance, max, min, range. What is the relationship between standard deviation and variance?

    AnalyzeDescriptive StatisticsDescriptivesVariable(s): HEIGHTOptions...Check all items required aboveContinueOK.

  5. Create a histogram for the heights of males. Describe the shape of the distribution.

  6. Select all cases. Then follow the directions below to create a boxplot graph to compare the distribution of heights for the two gender.

    GraphsLegacy DialogsBoxplotChoose Simple and Summaries for groups of cases Variable: HEIGHT; Category Axis: GENDER OK.

  7.  Follow the directions below to explore the dataset. Produce the following output for height for each gender: means, medians, standard deviations, min, max, range, quartiles (Q1, Q2, Q3), interquartile range, extreme values, boxplots, stem-and-leaf plots, and histograms. Interpret the results.

    AnalyzeDescriptive StatisticsExploreDependent List: HEIGHT; Factor List: GENDERPlay with the specification dialogue boxes to get all items required aboveOK. 




이번 시간에는 데이타를 가지고 그래프 (Data Visualization)를 만들어 봅시다.

Complete the following tasks using SPSS. (SPSS를 이용해서 다음 두 셋의 문제를 푸세요), 예시 파일은 맨 아래 있어요. 

Problem Set 1

“sharks.sav” 파일을 열고 데이터를 확인하세요. 데이터는 2000-2010년까지 여러 지역에 걸쳐 나타난 상어의 숫자를 나타냅니다. (Agresti & Franklin (3/e) Section 2.1 Example 2 (p.26)).

  1. 디렉션을 따라서 기본 바 그래프를 만들어봅시다. 

    GraphsLegacy DialogsBarChoose Simple and Values of individual casesBars Represent: No_Attack; Category Labels: Variable: Region; Create a titleOK

  2. 1번에서 만든 바는 오른쪽에 빈 공간들이 보입니다. 데이터에 보면 데이터셋에 빈 데이터가 있는 가로줄이 있기 때문입니다. 다음 디렉션을 먼저 따라한 후 1번 작업을 다시 해 보세요. 

    DataSelect CasesBased on time or case rangeRangeEnter the first case and the last caseOK

    만들어진 그래프를 더블클릭하면 그래프 에디터가 나오는데 여기에서 더 보기 좋은 퀄러티의 그래프를 만들 수 있습니다. 

  3. Pareto version 의 바그래프를 만들려면 다음 디렉션을 따라하세요.  

    DataSort CasesSort by: No_Attack; DescendingOK  

      2번과 1번 작업을 다시 실행합니다. 

  • world-wide vs. Florida 를 비교하기 위한 clustered bar graph 를 만들어보세요. 

GraphsLegacy DialogsBarChoose Clustered and Values of individual casesBars Represent: No_Attack; Category Labels: Variable: Region; Create a titleOK

Problem Set 2

“fla_student_survey.sav” 를 실행합니다. 

  1. 디렉션을 따라해서 히스토리그램을 만들어 보세요. 

    GraphsLegacy DialogsHistogramVariable: TV; Create a titleOK

  2.  high school GPA and college GPA를 비교하기 위해 Side-by-side boxplot 을 만들어 보세요.

    GraphsLegacy DialogsBoxplotChoose Simple and Summaries of separate variablesBoxes Represent: high_sch_GPA, collge_GPAOK

  3. 데이터를 가지고 다른 여러가지 적절한 그래프를 작성해 보고 해석해 보세요. 






랜덤 샘플링 (Excel RAND Function)

Get a random number between 0 and 1 (0과 1 사이에서 랜덤 넘버를 구하는 것이 목적!)
=RAND () 

리서치할 때 많은 데이타 중에서 랜덤으로 샘플링을 해야 할 때가 있습니다. 그럴 때 랜덤 함수를 사용하면 자동은 0에서 1 사이에서 숫자를 생성합니다. 생성된 숫자는 예를 들어 이런 식으로 나타납니다. -> 0.422245717

문제는 랜덤 함수를 이용할 때마다 각 셀에 대한 랜덤 숫자가 바뀌어서 생성이 된다는 것인데요, 그것을 방지하기 위해서 랜덤 함수를 사용해서 랜덤 넘버를 생성한 후 셀을 복사해서 Paste Special > Values to convert to text 기능을 사용합니다. 

0과 1 사이의 넘버 외에 숫자를 지정해주고 싶다면 다음의 공식을 사용합니다 : RAND() * (b - a) + a


엑셀(excel)에서 셀 안에 텍스트의 길이가 셀보다 길 경우 텍스트 전체가 안보이거나 옆 셀로 텍스트가 넘어가는 경우가 있습니다. 

위 그림은 제가 리서치 중인 데이타인데 D 열은 줄바꿈 설정을 하지 않은 것이고 E 열은 설정을 해서 글씨가 잘 보이네요. 

E열의 경우에 텍스트 줄바꿈 기능을 이용해서 한 셀에서 여러 줄로 텍스트가 모두 보이도록 해 보겠습니다. 아래 그림과 같이 홈 메뉴에서 'Wrap Text'라는 메뉴가 보입니다. 한글 메뉴로는 '텍스트 줄바꿈'이라고 뜹니다. 아래 셀과 같은 경우는 D 열 전체가 설정이 필요하므로 D 열 전체를 선택한 다음 'Wrap Text' 버튼을 눌러 설정을 해줍니다. 

말씀드린 대로 일단 D 열 전체설정을 해주고, Wrap Text (텍스트 줄바꿈) 을 꾹 눌러 주세요!

자, 아래 그림을 보시면 셀 안 텍스트가 두 줄로 바뀐 거 보이시죠? 

문장이 길 경우 E 열처럼 텍스트가 여러 줄로 나타납니다. 

참 쉬운 기능인데 가끔 기억이 안나서 헤맬 때가 있어요.^^

이상! 간단한 엑셀 줄바꾸기 팁이었습니다. 

유용한 정보라 생각되시면 공감 버튼 꾹 눌러주세요!


SPSS 통계 프로그램 24 버젼 무작정 따라하기!


Lab 1: Entering and Importing Data 데이타 입력하기

Problem Set 1. Follow the steps below to enter the data displayed.

1. Open SPSS 24 and start a new (blank) dataset. SPSS 24 를 실행해서 새로운 데이타셋을 열기

2. Click on Variable View at the bottom of the window. 창 아래 'Variable View' 클릭하기

3. Enter the specifications of all variables seen in the picture그림에 있는 모든 변수 입력하기

4. Click on Data View at the bottom of the window. Now in the data view you should see the columns labeled with the variable names you just created. Enter the values of each variable as seen on the picture. 'Data View' 클릭하고, 그림에 보이는 각각의 데이터 입력하기

5. If needed, go back to the Variable View and modify the specification of the variables. Pay attention to the number of decimal places (Decimals), value labels (Values), and the type of variable (Measure). 필요하면 'Variable View'로 다시 가서 Decimals, Values, and Measure 등의 값들을 지정해 주기

6. Save the created SPSS dataset by clicking File à Save. Specify the location and dataset name. Note .sav is the file extension for SPSS dataset files. 만든 SPSS 데이터셋 파일을 특정한 폴더를 지정해 저장하기

Problem Set 2. CSV 확장자 파일을 엑셀에서 봤을 때와 비교해 보기.

1. Open the short_nels.csv file with Excel and browse the data layout. 엑셀 파일 열기(파일은 아래 있습니다.)

2. Open SPSS and start a new (blank) dataset. SPSS 실행하기

3. Click the following in the drop-down menu: File à Import Data à CSV Data. Locate the .csv file that you just downloaded and click Open. CSV 데이타 불러오기

4. SPSS will scan through the .csv file and determine the appropriate specifications at its best knowledge. You should carefully examine the specifications automatically populated by SPSS and make sure they are correct. (Advanced settings are available in Advanced Options (Text Wizard). Click OK. SPSS 프로그램이 .csv 파일을 둘러보고 파일에 임포트할 때 맞게 임포트되었는지 신중하게 봐야합니다. 고급 세팅에서 더 세심하게 옵션을 지정할 수 있습니다. 그렇지 않으면 일반적으로 그냥 OK 클릭. 

5. Browse the created SPSS dataset. Compare with the .csv file opened in Excel. Make sure the import is correct. 엑셀 파일과 SPSS 파일을 비교해 보고 맞게 임포트되었는지 확인합니다. 

6. Click on Variable View at the bottom of the window. Change the Measure Column of the first three variables (stu_id, sch_id, sstratid) to Nominal.  'Variable View'로 가서 처음 세 변수들을 Nominal로 바꿉니다. 

7. Save the created SPSS dataset. 데이타셋 저장.



