alt

0320 경영통계학

Shared on June 10, 2026

통계학 기초: 변수 유형과 빈도분포

개요

본 강의는 통계학의 기초 개념을 다루며, 변수 유형빈도분포를 중심으로 설명합니다. 통계 자료를 수집·분석할 때 필요한 기본 용어와 절차를 정리하고, 실제 데이터 예시를 통해 이해를 돕습니다.

핵심 개념

  • 변수(Variable)

    • 명목형(Nominal): 순서가 없는 범주 (예: 성별, 직업)
    • 서열형(Ordinal): 순서가 있지만 간격이 일정하지 않은 범주 (예: 교육 수준)
    • 등간형(Interval): 순서와 간격이 일정한 연속형 변수 (예: 온도(섭씨))
    • 비율형(Ratio): 순서, 간격, 절대 0이 있는 연속형 변수 (예: 무게, 키)
  • 양적 자료(Quantitative Data)

    • 이산형(Discrete): 개수형(0,1,2…) (예: 배송 건수)
    • 연속형(Continuous): 실수형(0.5, 1.75…) (예: 체중, 시청 시간)
  • 빈도분포(Frequency Distribution)

    • 빈도수(Frequency): 각 값이 나타난 횟수
    • 상대 빈도(Relative Frequency): 전체 빈도 대비 비율 (빈도 ÷ 총 관측치)
    • 누적 빈도(Cumulative Frequency): 특정 값 이하까지의 합계
    • 누적 상대 빈도(Cumulative Relative Frequency): 누적 빈도를 전체로 나눈 비율
  • 도표와 그래프

    • 도수분포표(도수표): 값·빈도·상대빈도·누적빈도·누적상대빈도 순서
    • 막대그래프(Bar Chart): 범주별 빈도(또는 상대빈도)를 시각화
    • 선그래프(Line Graph): 누적 상대 빈도(혹은 누적 빈도)를 연결해 분포 형태를 확인
    • 누적 빈도곡선(Cumulative Frequency Curve): 데이터 분포의 누적 경향을 시각적으로 보여줌

상세 내용

1. 변수 유형과 데이터 종류

변수 유형특징예시
명목형순서 없음, 구분만 가능성별, 직업
서열형순서 있음, 간격 비고정교육 수준, 만족도
등간형순서·간격 일정온도(섭씨)
비율형순서·간격·절대 0무게, 키, 수입

양적 자료는 이산형(예: 배송 건수)과 연속형(예: 체중)으로 나뉨. 연속형은 소수점 이하까지 표현 가능하므로 구간을 설정해 분석한다.

2. 빈도분포표 작성

  1. 값(Value): 관측된 구간 혹은 개별 값
  2. 빈도수(Frequency): 해당 값이 나타난 횟수
  3. 상대 빈도(%): 빈도 ÷ 총 관측치 × 100
  4. 누적 빈도(Cumulative): 이전까지의 빈도 합
  5. 누적 상대 빈도(%): 누적 빈도 ÷ 총 관측치 × 100
  • 구간 설정: 연속형 데이터는 구간 폭을 균일하게 맞추고, 구간 끝값은 반열(예: 24.5 이상 ~ 29.5 미만)으로 정의한다.
  • 구간 수: 보통 5~10개의 구간이 적절하며, 데이터 특성에 따라 조정한다.
  • 구간 폭 공식:
    [ \text{구간 폭} = \frac{\text{최대값} - \text{최소값}}{\text{구간 수}} ] 필요 시 첫/마지막 구간은 “이상/이하” 표기.

3. 도표와 그래프 활용

  • 막대그래프
    • 범주형 데이터: 명목형·서열형 변수에 사용.
    • 연속형 데이터: 구간별 빈도(또는 상대 빈도)를 막대로 표시.
  • 선그래프
    • 누적 빈도곡선: 데이터의 누적 분포를 한눈에 파악.
    • 누적 상대 빈도곡선: 0~100% 누적 비율을 시각화, 50% 지점(중앙값) 확인 가능.
  • 시각화 팁
    • 범주 간 간격을 일정하게 두고, 막대의 높이와 색상을 구분해 이해를 돕는다.
    • 누적곡선은 막대 위에 점을 찍어 연결하면 직관적이다.

4. 실제 예시

  1. 배송 건수(이산형)
    • 구간: 0건, 1건, 2건, 3건, 4건 이상
    • 빈도표 작성 후 막대그래프 및 누적곡선으로 시각화.
  2. 체중(연속형)
    • 구간: 3039.9kg, 4049.9kg, …, 80~89.9kg
    • 구간 폭 10kg, 누적 빈도 곡선으로 평균·중앙값 추정.
  3. 키 분포
    • 50명 학생의 키 데이터 → 구간 폭 5kg, 누적 상대 빈도곡선으로 50% 지점(평균) 확인.

5. 요약

  • 변수 유형을 정확히 구분하면 데이터 분석 방법이 결정된다.
  • 빈도분포표그래프를 통해 데이터를 시각적으로 파악하면 추세와 중심 경향을 빠르게 이해할 수 있다.
  • 연속형 데이터는 구간 설정이 핵심이며, 누적 상대 빈도곡선은 중앙값 및 퍼센트 위치를 쉽게 확인해준다.

이러한 기초 개념을 바탕으로 통계 분석의 전 과정을 체계적으로 수행할 수 있다.

0320 경영통계학 | Alt