Mathology
수학중학교 1학년

중1 통계 정복: 복잡한 자료도 한눈에! 줄기와 잎 그림부터 도수분포다각형까지

방대한 자료를 깔끔하게 정리하고 분석하는 통계 단원! 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형의 핵심 개념을 파헤쳐 봅니다.

개요

여러분, 우리 주변에는 셀 수 없이 많은 정보와 자료들이 넘쳐납니다. 친구들의 키, 지난달 용돈 사용 내역, 우리 반 학생들이 좋아하는 과목 등 모든 것이 '자료'가 될 수 있죠. 그런데 이 자료들이 뒤죽박죽 섞여 있다면 어떤 정보를 알아낼 수 있을까요? 아마 머리만 아플 거예요!

그래서 우리는 이 복잡한 자료들을 누구나 쉽게 이해할 수 있도록 깔끔하게 정리하고, 그 속에 숨겨진 의미를 찾아내는 방법을 배웁니다. 이것이 바로 '통계'입니다. 이번 단원에서는 자료를 보기 좋게 나타내는 여러 가지 방법에 대해 자세히 알아볼 거예요. 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형을 배우면 여러분도 자료 정리의 달인이 될 수 있습니다!


핵심 개념

1. 줄기와 잎 그림

우리가 처음 배우는 자료 정리 방법은 '줄기와 잎 그림'입니다. 말 그대로 자료를 '줄기'와 '잎'으로 나누어 나타내는 그림이죠. 주로 자료의 수가 많지 않을 때, 개별 자료의 값과 분포를 한눈에 알아보기 쉽게 정리할 때 사용합니다.

정의: 자료의 값을 자릿값에 따라 줄기 부분과 잎 부분으로 나누어 나타내는 그림입니다.

원리:

  • 자료의 공통된 부분을 '줄기'로, 변화하는 부분을 '잎'으로 정합니다. 예를 들어, 12, 15, 21, 28이라는 자료가 있다면 10의 자리를 줄기로, 1의 자리를 잎으로 정할 수 있습니다.
  • 줄기는 세로선 왼쪽에 작은 값부터 차례대로 쓰고, 잎은 세로선 오른쪽에 줄기에 해당하는 값을 작은 값부터 순서대로 씁니다. 이때, 같은 잎은 중복해서 모두 씁니다.
  • 가장 중요한 것은 '범례'입니다. '줄기 | 잎'이 어떤 값을 의미하는지 반드시 표시해야 합니다. (예: 1 | 2는 12를 나타냄)

핵심: 줄기와 잎 그림은 개별 자료의 값을 살리면서 전체적인 분포를 파악할 수 있는 정리 방법입니다.

예제: 우리 반 학생 10명의 지난주 독서 시간(단위: 분)은 다음과 같습니다. 15, 23, 10, 31, 28, 12, 25, 30, 18, 20

이 자료를 줄기와 잎 그림으로 나타내 봅시다.

  1. 줄기와 잎을 정합니다. 여기서는 10의 자리를 '줄기'로, 1의 자리를 '잎'으로 정하는 것이 좋겠네요.
  2. 줄기를 세로선 왼쪽에 쓰고, 잎을 오른쪽에 씁니다.
    • 줄기 1 (10분대): 0, 2, 5, 8
    • 줄기 2 (20분대): 0, 3, 5, 8
    • 줄기 3 (30분대): 0, 1
      줄기 | 잎
      ----- 
        1  | 0  2  5  8
        2  | 0  3  5  8
        3  | 0  1
      (범례: 1 | 0은 10분)

이 그림을 보면 독서 시간이 10분대가 4명, 20분대가 4명, 30분대가 2명이라는 것을 쉽게 알 수 있습니다. 가장 짧은 시간은 10분, 가장 긴 시간은 31분이라는 것도 바로 보이죠.

2. 도수분포표

줄기와 잎 그림은 자료의 수가 적을 때 유용하지만, 자료의 수가 아주 많아지면 또 복잡해집니다. 이럴 때 사용하는 것이 바로 '도수분포표'입니다. 자료를 일정한 간격으로 나눈 구간(계급)별로 정리하여 나타냅니다.

정의: 자료를 몇 개의 계급으로 나누고, 각 계급에 속하는 자료의 수를 정리하여 나타낸 표입니다.

원리:

  1. 계급: 자료가 속하는 구간을 말합니다. 예를 들어, '10분 이상 20분 미만', '20분 이상 30분 미만'과 같이 일정한 간격으로 나눕니다.
    • 계급의 크기: 계급의 너비(간격)를 말합니다. (예: 20분 - 10분 = 10분)
    • 계급의 개수: 전체 계급의 수를 말합니다. (보통 5~10개가 적당합니다.)
  2. 도수: 각 계급에 속하는 자료의 개수를 말합니다.
  3. 총도수: 전체 자료의 개수, 즉 각 계급의 도수를 모두 더한 값입니다.

핵심: 도수분포표는 많은 양의 자료를 계급별로 묶어 정리함으로써 자료의 분포 상태를 파악하기 쉽게 해줍니다.

예제: 위 독서 시간 자료를 도수분포표로 나타내 봅시다. 계급의 크기는 10분으로 하겠습니다. 15, 23, 10, 31, 28, 12, 25, 30, 18, 20

  1. 계급을 정합니다.
    • 10분 이상 20분 미만
    • 20분 이상 30분 미만
    • 30분 이상 40분 미만
  2. 각 계급에 해당하는 자료의 수를 셉니다 (도수).
    • 10분 이상 20분 미만: 15, 10, 12, 18 (4명)
    • 20분 이상 30분 미만: 23, 28, 25, 20 (4명)
    • 30분 이상 40분 미만: 31, 30 (2명)
  3. 표로 정리합니다.
      독서 시간(분)   | 도수(명)
      -----------------|---------
      10 이상 ~ 20 미만 |   4
      20 이상 ~ 30 미만 |   4
      30 이상 ~ 40 미만 |   2
      -----------------|---------
           합계        |   10

도수분포표를 통해 독서 시간이 10분 이상 20분 미만인 학생이 4명, 20분 이상 30분 미만인 학생이 4명, 30분 이상 40분 미만인 학생이 2명이라는 것을 알 수 있습니다.

3. 히스토그램

도수분포표로 정리된 자료를 막대그래프 형태로 나타낸 것이 '히스토그램'입니다. 시각적으로 자료의 분포를 이해하기에 매우 효과적인 방법입니다.

정의: 도수분포표의 각 계급을 가로축에 계급의 크기만큼의 간격으로 나타내고, 세로축에 도수를 나타내어 직사각형 모양으로 나타낸 그래프입니다.

원리:

  1. 가로축에는 각 계급의 양 끝값을 쓰고, 세로축에는 도수를 나타냅니다.
  2. 각 계급에 해당하는 직사각형을 그립니다. 이때 직사각형의 가로 길이는 '계급의 크기'와 같고, 세로 길이는 '도수'와 같습니다.
  3. 직사각형들은 서로 붙어 있도록 그립니다.
  4. 직사각형의 넓이는 각 계급의 도수에 비례합니다. (넓이 = 계급의 크기 x 도수)
  5. 전체 직사각형의 넓이의 합은 (계급의 크기) x (총도수)와 같습니다.

핵심: 히스토그램은 도수분포표의 내용을 직사각형 막대로 시각화하여 자료의 전체적인 분포와 경향을 한눈에 파악하기 쉽게 해줍니다.

예제: 위 도수분포표를 이용하여 히스토그램을 그려 봅시다.

  • 가로축: 10, 20, 30, 40 (독서 시간)
  • 세로축: 0, 1, 2, 3, 4 (도수)
  1. 10분 이상 20분 미만 계급: 도수 4명이므로, 10과 20 사이를 밑변으로 하고 높이가 4인 직사각형을 그립니다.
  2. 20분 이상 30분 미만 계급: 도수 4명이므로, 20과 30 사이를 밑변으로 하고 높이가 4인 직사각형을 그립니다.
  3. 30분 이상 40분 미만 계급: 도수 2명이므로, 30과 40 사이를 밑변으로 하고 높이가 2인 직사각형을 그립니다.

(여기서는 그림을 그릴 수 없으므로 설명으로 대체합니다. 실제 시험에서는 직접 그리거나 그려진 그림을 해석하게 됩니다.)

이 히스토그램을 보면, 독서 시간이 10~20분인 그룹과 20~30분인 그룹이 가장 많고, 30~40분인 그룹이 상대적으로 적다는 것을 막대의 높이를 통해 바로 알 수 있습니다.

4. 도수분포다각형

히스토그램의 각 직사각형의 가운데 점들을 이어서 만든 선 그래프가 '도수분포다각형'입니다. 히스토그램과 마찬가지로 자료의 분포 상태를 시각적으로 보여주는 데 유용합니다.

정의: 히스토그램에서 각 직사각형의 윗변의 가운데 점들을 선분으로 연결하고, 양 끝에는 도수가 0인 가상의 계급을 추가하여 가로축과 연결한 다각형 모양의 그래프입니다.

원리:

  1. 히스토그램을 먼저 그립니다.
  2. 각 직사각형 윗변의 가운데 점(계급값)을 찍습니다.
    • 계급값: 각 계급을 대표하는 값으로, '계급의 양 끝값의 합 ÷ 2'로 구합니다. (예: 10분 이상 20분 미만의 계급값은 (10 + 20) ÷ 2 = 15분)
  3. 찍은 점들을 선분으로 차례대로 연결합니다.
  4. 히스토그램 양 끝에 있는 계급의 바로 앞, 바로 뒤에 도수가 0인 가상의 계급을 만들고, 그 계급값을 찾아 가로축과 연결하여 다각형을 완성합니다. (예: 10분 이상 20분 미만 계급 앞에는 0분 이상 10분 미만 계급을 가정하고 계급값 5에 도수 0인 점을 찍어 연결)
  5. 도수분포다각형의 넓이는 히스토그램의 전체 직사각형 넓이의 합과 같습니다.

핵심: 도수분포다각형은 여러 자료의 분포를 한 그래프에 비교하거나, 분포의 변화 경향을 부드러운 곡선 형태로 파악할 때 유용합니다.

예제: 위 히스토그램을 이용하여 도수분포다각형을 그려 봅시다.

  1. 각 계급의 계급값을 구합니다.
    • 10 이상 ~ 20 미만: (10 + 20) ÷ 2 = 15
    • 20 이상 ~ 30 미만: (20 + 30) ÷ 2 = 25
    • 30 이상 ~ 40 미만: (30 + 40) ÷ 2 = 35
  2. 히스토그램의 각 직사각형 윗변의 가운데 점(계급값에 해당하는 도수)을 찍습니다.
    • (15, 4), (25, 4), (35, 2)
  3. 이 점들을 선분으로 연결합니다.
  4. 양 끝 계급 앞뒤로 가상의 계급을 만듭니다.
    • (가상 계급 0 이상 ~ 10 미만의 계급값 5, 도수 0)과 (15, 4) 연결
    • (35, 2)와 (가상 계급 40 이상 ~ 50 미만의 계급값 45, 도수 0) 연결 (여기서는 그림을 그릴 수 없으므로 설명으로 대체합니다. 실제 시험에서는 직접 그리거나 그려진 그림을 해석하게 됩니다.)

도수분포다각형은 히스토그램과 정보는 같지만, 여러 그룹의 자료를 비교할 때 겹쳐 그릴 수 있어 분포의 차이를 한눈에 알아보기 쉽습니다.


공식 정리

계급값 = (계급의 양 끝값의 합) ÷ 2 — 각 계급을 대표하는 값입니다.

도수의 총합 = 각 계급의 도수의 합 — 전체 자료의 개수와 같습니다.

히스토그램의 직사각형 넓이 = 계급의 크기 x 도수 — 각 계급의 자료 수를 시각화합니다.

도수분포다각형의 넓이 = 히스토그램 직사각형 넓이의 총합 — 히스토그램과 동일한 정보를 담고 있습니다.


시험에 이렇게 나와요

유형 1: 자료 정리 및 해석

주어진 자료를 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형 중 하나의 형태로 정확하게 그릴 수 있는지 묻는 문제입니다. 또는 이미 그려진 표나 그래프를 보고 특정 계급의 도수, 전체 자료의 수, 가장 많은/적은 자료가 있는 계급 등을 파악하는 문제입니다.

  • 출제 패턴:
    • 줄기와 잎 그림에서 '잎'의 개수 세기, 특정 자료값 찾기.
    • 도수분포표에서 특정 계급의 도수, 계급의 크기, 총도수, 또는 빠진 도수 채우기.
    • 히스토그램이나 도수분포다각형에서 가로/세로축 값 읽기, 직사각형 넓이 계산, 전체 넓이 구하기.
  • 접근법:
    • 각 자료 정리 방법의 정의와 작성 원리를 정확히 이해하고 있어야 합니다.
    • 특히, '이상'과 '미만'의 의미를 정확히 구분하여 계급에 자료를 올바르게 포함시켜야 합니다.
    • 범례나 축의 단위 등을 꼼꼼히 확인하는 습관을 들여야 합니다.

유형 2: 그래프의 특징 및 비교

히스토그램과 도수분포다각형의 특징을 비교하거나, 두 가지 이상의 자료를 하나의 도수분포다각형에 겹쳐 그려 분포의 차이를 해석하는 문제입니다.

  • 출제 패턴:
    • 히스토그램과 도수분포다각형의 넓이가 같음을 이용한 문제.
    • 어떤 그래프가 더 자료의 분포 경향을 잘 보여주는지 묻거나, 어떤 상황에 적합한지 묻는 문제.
    • 두 개 이상의 도수분포다각형을 보고 "A반보다 B반이 성적이 더 높다"와 같은 비교 분석 질문.
  • 접근법:
    • 히스토그램은 각 계급의 도수를 직관적으로 보여주며, 도수분포다각형은 전체적인 분포의 변화를 부드럽게 연결하여 보여준다는 차이점을 명확히 알아야 합니다.
    • 두 그래프의 넓이가 같다는 중요한 특징을 기억해야 합니다.
    • 두 자료를 비교할 때는 그래프의 모양(왼쪽으로 치우쳤는지, 오른쪽으로 치우쳤는지 등)을 보고 평균적인 경향을 파악할 수 있어야 합니다.

학습 팁

  1. 용어와 정의를 정확히 외우세요! 계급, 도수, 계급의 크기, 계급값 등 통계 용어는 정확한 의미를 알고 있어야 혼란 없이 문제를 풀 수 있습니다.
  2. 직접 그려보면서 익히세요! 눈으로만 보지 말고, 연습장에 직접 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형을 그려보면서 각 방법을 완전히 자기 것으로 만들어야 합니다. 특히, 숫자가 많을 때 실수하지 않도록 연습하는 것이 중요합니다.
  3. '이상', '이하', '초과', '미만'을 정확히 구분하세요! 계급을 나눌 때 이 용어들을 잘못 적용하면 자료가 엉뚱한 계급에 들어가게 됩니다. 헷갈린다면 수직선을 그려놓고 해당 숫자가 포함되는지 안 되는지 표시해보는 연습을 해보세요.

이 단원은 앞으로 배우게 될 더 복잡한 통계의 기초가 됩니다. 차근차근 꾸준히 공부하면 누구나 통계의 재미에 푹 빠질 수 있을 거예요! 화이팅!

#중1수학#통계#자료정리#줄기와잎그림#도수분포표#히스토그램#도수분포다각형#수학#통계