0320 경영통계학
Shared on June 10, 2026
통계학 기초: 변수 유형과 빈도분포
개요
본 강의는 통계학의 기초 개념을 다루며, 변수 유형과 빈도분포를 중심으로 설명합니다. 통계 자료를 수집·분석할 때 필요한 기본 용어와 절차를 정리하고, 실제 데이터 예시를 통해 이해를 돕습니다.
핵심 개념
-
변수(Variable)
- 명목형(Nominal): 순서가 없는 범주 (예: 성별, 직업)
- 서열형(Ordinal): 순서가 있지만 간격이 일정하지 않은 범주 (예: 교육 수준)
- 등간형(Interval): 순서와 간격이 일정한 연속형 변수 (예: 온도(섭씨))
- 비율형(Ratio): 순서, 간격, 절대 0이 있는 연속형 변수 (예: 무게, 키)
-
양적 자료(Quantitative Data)
- 이산형(Discrete): 개수형(0,1,2…) (예: 배송 건수)
- 연속형(Continuous): 실수형(0.5, 1.75…) (예: 체중, 시청 시간)
-
빈도분포(Frequency Distribution)
- 빈도수(Frequency): 각 값이 나타난 횟수
- 상대 빈도(Relative Frequency): 전체 빈도 대비 비율 (빈도 ÷ 총 관측치)
- 누적 빈도(Cumulative Frequency): 특정 값 이하까지의 합계
- 누적 상대 빈도(Cumulative Relative Frequency): 누적 빈도를 전체로 나눈 비율
-
도표와 그래프
- 도수분포표(도수표): 값·빈도·상대빈도·누적빈도·누적상대빈도 순서
- 막대그래프(Bar Chart): 범주별 빈도(또는 상대빈도)를 시각화
- 선그래프(Line Graph): 누적 상대 빈도(혹은 누적 빈도)를 연결해 분포 형태를 확인
- 누적 빈도곡선(Cumulative Frequency Curve): 데이터 분포의 누적 경향을 시각적으로 보여줌
상세 내용
1. 변수 유형과 데이터 종류
| 변수 유형 | 특징 | 예시 |
|---|---|---|
| 명목형 | 순서 없음, 구분만 가능 | 성별, 직업 |
| 서열형 | 순서 있음, 간격 비고정 | 교육 수준, 만족도 |
| 등간형 | 순서·간격 일정 | 온도(섭씨) |
| 비율형 | 순서·간격·절대 0 | 무게, 키, 수입 |
양적 자료는 이산형(예: 배송 건수)과 연속형(예: 체중)으로 나뉨. 연속형은 소수점 이하까지 표현 가능하므로 구간을 설정해 분석한다.
2. 빈도분포표 작성
- 값(Value): 관측된 구간 혹은 개별 값
- 빈도수(Frequency): 해당 값이 나타난 횟수
- 상대 빈도(%): 빈도 ÷ 총 관측치 × 100
- 누적 빈도(Cumulative): 이전까지의 빈도 합
- 누적 상대 빈도(%): 누적 빈도 ÷ 총 관측치 × 100
- 구간 설정: 연속형 데이터는 구간 폭을 균일하게 맞추고, 구간 끝값은 반열(예: 24.5 이상 ~ 29.5 미만)으로 정의한다.
- 구간 수: 보통 5~10개의 구간이 적절하며, 데이터 특성에 따라 조정한다.
- 구간 폭 공식:
[ \text{구간 폭} = \frac{\text{최대값} - \text{최소값}}{\text{구간 수}} ] 필요 시 첫/마지막 구간은 “이상/이하” 표기.
3. 도표와 그래프 활용
- 막대그래프
- 범주형 데이터: 명목형·서열형 변수에 사용.
- 연속형 데이터: 구간별 빈도(또는 상대 빈도)를 막대로 표시.
- 선그래프
- 누적 빈도곡선: 데이터의 누적 분포를 한눈에 파악.
- 누적 상대 빈도곡선: 0~100% 누적 비율을 시각화, 50% 지점(중앙값) 확인 가능.
- 시각화 팁
- 범주 간 간격을 일정하게 두고, 막대의 높이와 색상을 구분해 이해를 돕는다.
- 누적곡선은 막대 위에 점을 찍어 연결하면 직관적이다.
4. 실제 예시
- 배송 건수(이산형)
- 구간: 0건, 1건, 2건, 3건, 4건 이상
- 빈도표 작성 후 막대그래프 및 누적곡선으로 시각화.
- 체중(연속형)
- 구간: 30
39.9kg, 4049.9kg, …, 80~89.9kg - 구간 폭 10kg, 누적 빈도 곡선으로 평균·중앙값 추정.
- 구간: 30
- 키 분포
- 50명 학생의 키 데이터 → 구간 폭 5kg, 누적 상대 빈도곡선으로 50% 지점(평균) 확인.
5. 요약
- 변수 유형을 정확히 구분하면 데이터 분석 방법이 결정된다.
- 빈도분포표와 그래프를 통해 데이터를 시각적으로 파악하면 추세와 중심 경향을 빠르게 이해할 수 있다.
- 연속형 데이터는 구간 설정이 핵심이며, 누적 상대 빈도곡선은 중앙값 및 퍼센트 위치를 쉽게 확인해준다.
이러한 기초 개념을 바탕으로 통계 분석의 전 과정을 체계적으로 수행할 수 있다.