중1 통계 정복: 복잡한 자료도 한눈에! 줄기와 잎 그림부터 도수분포다각형까지
방대한 자료를 깔끔하게 정리하고 분석하는 통계 단원! 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형의 핵심 개념을 파헤쳐 봅니다.
개요
여러분, 우리 주변에는 셀 수 없이 많은 정보와 자료들이 넘쳐납니다. 친구들의 키, 지난달 용돈 사용 내역, 우리 반 학생들이 좋아하는 과목 등 모든 것이 '자료'가 될 수 있죠. 그런데 이 자료들이 뒤죽박죽 섞여 있다면 어떤 정보를 알아낼 수 있을까요? 아마 머리만 아플 거예요!
그래서 우리는 이 복잡한 자료들을 누구나 쉽게 이해할 수 있도록 깔끔하게 정리하고, 그 속에 숨겨진 의미를 찾아내는 방법을 배웁니다. 이것이 바로 '통계'입니다. 이번 단원에서는 자료를 보기 좋게 나타내는 여러 가지 방법에 대해 자세히 알아볼 거예요. 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형을 배우면 여러분도 자료 정리의 달인이 될 수 있습니다!
핵심 개념
1. 줄기와 잎 그림
우리가 처음 배우는 자료 정리 방법은 '줄기와 잎 그림'입니다. 말 그대로 자료를 '줄기'와 '잎'으로 나누어 나타내는 그림이죠. 주로 자료의 수가 많지 않을 때, 개별 자료의 값과 분포를 한눈에 알아보기 쉽게 정리할 때 사용합니다.
정의: 자료의 값을 자릿값에 따라 줄기 부분과 잎 부분으로 나누어 나타내는 그림입니다.
원리:
- 자료의 공통된 부분을 '줄기'로, 변화하는 부분을 '잎'으로 정합니다. 예를 들어, 12, 15, 21, 28이라는 자료가 있다면 10의 자리를 줄기로, 1의 자리를 잎으로 정할 수 있습니다.
- 줄기는 세로선 왼쪽에 작은 값부터 차례대로 쓰고, 잎은 세로선 오른쪽에 줄기에 해당하는 값을 작은 값부터 순서대로 씁니다. 이때, 같은 잎은 중복해서 모두 씁니다.
- 가장 중요한 것은 '범례'입니다. '줄기 | 잎'이 어떤 값을 의미하는지 반드시 표시해야 합니다. (예: 1 | 2는 12를 나타냄)
핵심: 줄기와 잎 그림은 개별 자료의 값을 살리면서 전체적인 분포를 파악할 수 있는 정리 방법입니다.
예제: 우리 반 학생 10명의 지난주 독서 시간(단위: 분)은 다음과 같습니다. 15, 23, 10, 31, 28, 12, 25, 30, 18, 20
이 자료를 줄기와 잎 그림으로 나타내 봅시다.
- 줄기와 잎을 정합니다. 여기서는 10의 자리를 '줄기'로, 1의 자리를 '잎'으로 정하는 것이 좋겠네요.
- 줄기를 세로선 왼쪽에 쓰고, 잎을 오른쪽에 씁니다.
- 줄기 1 (10분대): 0, 2, 5, 8
- 줄기 2 (20분대): 0, 3, 5, 8
- 줄기 3 (30분대): 0, 1
줄기 | 잎
-----
1 | 0 2 5 8
2 | 0 3 5 8
3 | 0 1
(범례: 1 | 0은 10분)
이 그림을 보면 독서 시간이 10분대가 4명, 20분대가 4명, 30분대가 2명이라는 것을 쉽게 알 수 있습니다. 가장 짧은 시간은 10분, 가장 긴 시간은 31분이라는 것도 바로 보이죠.
2. 도수분포표
줄기와 잎 그림은 자료의 수가 적을 때 유용하지만, 자료의 수가 아주 많아지면 또 복잡해집니다. 이럴 때 사용하는 것이 바로 '도수분포표'입니다. 자료를 일정한 간격으로 나눈 구간(계급)별로 정리하여 나타냅니다.
정의: 자료를 몇 개의 계급으로 나누고, 각 계급에 속하는 자료의 수를 정리하여 나타낸 표입니다.
원리:
- 계급: 자료가 속하는 구간을 말합니다. 예를 들어, '10분 이상 20분 미만', '20분 이상 30분 미만'과 같이 일정한 간격으로 나눕니다.
- 계급의 크기: 계급의 너비(간격)를 말합니다. (예: 20분 - 10분 = 10분)
- 계급의 개수: 전체 계급의 수를 말합니다. (보통 5~10개가 적당합니다.)
- 도수: 각 계급에 속하는 자료의 개수를 말합니다.
- 총도수: 전체 자료의 개수, 즉 각 계급의 도수를 모두 더한 값입니다.
핵심: 도수분포표는 많은 양의 자료를 계급별로 묶어 정리함으로써 자료의 분포 상태를 파악하기 쉽게 해줍니다.
예제: 위 독서 시간 자료를 도수분포표로 나타내 봅시다. 계급의 크기는 10분으로 하겠습니다. 15, 23, 10, 31, 28, 12, 25, 30, 18, 20
- 계급을 정합니다.
- 10분 이상 20분 미만
- 20분 이상 30분 미만
- 30분 이상 40분 미만
- 각 계급에 해당하는 자료의 수를 셉니다 (도수).
- 10분 이상 20분 미만: 15, 10, 12, 18 (4명)
- 20분 이상 30분 미만: 23, 28, 25, 20 (4명)
- 30분 이상 40분 미만: 31, 30 (2명)
- 표로 정리합니다.
독서 시간(분) | 도수(명)
-----------------|---------
10 이상 ~ 20 미만 | 4
20 이상 ~ 30 미만 | 4
30 이상 ~ 40 미만 | 2
-----------------|---------
합계 | 10
도수분포표를 통해 독서 시간이 10분 이상 20분 미만인 학생이 4명, 20분 이상 30분 미만인 학생이 4명, 30분 이상 40분 미만인 학생이 2명이라는 것을 알 수 있습니다.
3. 히스토그램
도수분포표로 정리된 자료를 막대그래프 형태로 나타낸 것이 '히스토그램'입니다. 시각적으로 자료의 분포를 이해하기에 매우 효과적인 방법입니다.
정의: 도수분포표의 각 계급을 가로축에 계급의 크기만큼의 간격으로 나타내고, 세로축에 도수를 나타내어 직사각형 모양으로 나타낸 그래프입니다.
원리:
- 가로축에는 각 계급의 양 끝값을 쓰고, 세로축에는 도수를 나타냅니다.
- 각 계급에 해당하는 직사각형을 그립니다. 이때 직사각형의 가로 길이는 '계급의 크기'와 같고, 세로 길이는 '도수'와 같습니다.
- 직사각형들은 서로 붙어 있도록 그립니다.
- 직사각형의 넓이는 각 계급의 도수에 비례합니다. (넓이 = 계급의 크기 x 도수)
- 전체 직사각형의 넓이의 합은 (계급의 크기) x (총도수)와 같습니다.
핵심: 히스토그램은 도수분포표의 내용을 직사각형 막대로 시각화하여 자료의 전체적인 분포와 경향을 한눈에 파악하기 쉽게 해줍니다.
예제: 위 도수분포표를 이용하여 히스토그램을 그려 봅시다.
- 가로축: 10, 20, 30, 40 (독서 시간)
- 세로축: 0, 1, 2, 3, 4 (도수)
- 10분 이상 20분 미만 계급: 도수 4명이므로, 10과 20 사이를 밑변으로 하고 높이가 4인 직사각형을 그립니다.
- 20분 이상 30분 미만 계급: 도수 4명이므로, 20과 30 사이를 밑변으로 하고 높이가 4인 직사각형을 그립니다.
- 30분 이상 40분 미만 계급: 도수 2명이므로, 30과 40 사이를 밑변으로 하고 높이가 2인 직사각형을 그립니다.
(여기서는 그림을 그릴 수 없으므로 설명으로 대체합니다. 실제 시험에서는 직접 그리거나 그려진 그림을 해석하게 됩니다.)
이 히스토그램을 보면, 독서 시간이 10~20분인 그룹과 20~30분인 그룹이 가장 많고, 30~40분인 그룹이 상대적으로 적다는 것을 막대의 높이를 통해 바로 알 수 있습니다.
4. 도수분포다각형
히스토그램의 각 직사각형의 가운데 점들을 이어서 만든 선 그래프가 '도수분포다각형'입니다. 히스토그램과 마찬가지로 자료의 분포 상태를 시각적으로 보여주는 데 유용합니다.
정의: 히스토그램에서 각 직사각형의 윗변의 가운데 점들을 선분으로 연결하고, 양 끝에는 도수가 0인 가상의 계급을 추가하여 가로축과 연결한 다각형 모양의 그래프입니다.
원리:
- 히스토그램을 먼저 그립니다.
- 각 직사각형 윗변의 가운데 점(계급값)을 찍습니다.
- 계급값: 각 계급을 대표하는 값으로, '계급의 양 끝값의 합 ÷ 2'로 구합니다. (예: 10분 이상 20분 미만의 계급값은 (10 + 20) ÷ 2 = 15분)
- 찍은 점들을 선분으로 차례대로 연결합니다.
- 히스토그램 양 끝에 있는 계급의 바로 앞, 바로 뒤에 도수가 0인 가상의 계급을 만들고, 그 계급값을 찾아 가로축과 연결하여 다각형을 완성합니다. (예: 10분 이상 20분 미만 계급 앞에는 0분 이상 10분 미만 계급을 가정하고 계급값 5에 도수 0인 점을 찍어 연결)
- 도수분포다각형의 넓이는 히스토그램의 전체 직사각형 넓이의 합과 같습니다.
핵심: 도수분포다각형은 여러 자료의 분포를 한 그래프에 비교하거나, 분포의 변화 경향을 부드러운 곡선 형태로 파악할 때 유용합니다.
예제: 위 히스토그램을 이용하여 도수분포다각형을 그려 봅시다.
- 각 계급의 계급값을 구합니다.
- 10 이상 ~ 20 미만: (10 + 20) ÷ 2 = 15
- 20 이상 ~ 30 미만: (20 + 30) ÷ 2 = 25
- 30 이상 ~ 40 미만: (30 + 40) ÷ 2 = 35
- 히스토그램의 각 직사각형 윗변의 가운데 점(계급값에 해당하는 도수)을 찍습니다.
- (15, 4), (25, 4), (35, 2)
- 이 점들을 선분으로 연결합니다.
- 양 끝 계급 앞뒤로 가상의 계급을 만듭니다.
- (가상 계급 0 이상 ~ 10 미만의 계급값 5, 도수 0)과 (15, 4) 연결
- (35, 2)와 (가상 계급 40 이상 ~ 50 미만의 계급값 45, 도수 0) 연결 (여기서는 그림을 그릴 수 없으므로 설명으로 대체합니다. 실제 시험에서는 직접 그리거나 그려진 그림을 해석하게 됩니다.)
도수분포다각형은 히스토그램과 정보는 같지만, 여러 그룹의 자료를 비교할 때 겹쳐 그릴 수 있어 분포의 차이를 한눈에 알아보기 쉽습니다.
공식 정리
계급값 = (계급의 양 끝값의 합) ÷ 2 — 각 계급을 대표하는 값입니다.
도수의 총합 = 각 계급의 도수의 합 — 전체 자료의 개수와 같습니다.
히스토그램의 직사각형 넓이 = 계급의 크기 x 도수 — 각 계급의 자료 수를 시각화합니다.
도수분포다각형의 넓이 = 히스토그램 직사각형 넓이의 총합 — 히스토그램과 동일한 정보를 담고 있습니다.
시험에 이렇게 나와요
유형 1: 자료 정리 및 해석
주어진 자료를 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형 중 하나의 형태로 정확하게 그릴 수 있는지 묻는 문제입니다. 또는 이미 그려진 표나 그래프를 보고 특정 계급의 도수, 전체 자료의 수, 가장 많은/적은 자료가 있는 계급 등을 파악하는 문제입니다.
- 출제 패턴:
- 줄기와 잎 그림에서 '잎'의 개수 세기, 특정 자료값 찾기.
- 도수분포표에서 특정 계급의 도수, 계급의 크기, 총도수, 또는 빠진 도수 채우기.
- 히스토그램이나 도수분포다각형에서 가로/세로축 값 읽기, 직사각형 넓이 계산, 전체 넓이 구하기.
- 접근법:
- 각 자료 정리 방법의 정의와 작성 원리를 정확히 이해하고 있어야 합니다.
- 특히, '이상'과 '미만'의 의미를 정확히 구분하여 계급에 자료를 올바르게 포함시켜야 합니다.
- 범례나 축의 단위 등을 꼼꼼히 확인하는 습관을 들여야 합니다.
유형 2: 그래프의 특징 및 비교
히스토그램과 도수분포다각형의 특징을 비교하거나, 두 가지 이상의 자료를 하나의 도수분포다각형에 겹쳐 그려 분포의 차이를 해석하는 문제입니다.
- 출제 패턴:
- 히스토그램과 도수분포다각형의 넓이가 같음을 이용한 문제.
- 어떤 그래프가 더 자료의 분포 경향을 잘 보여주는지 묻거나, 어떤 상황에 적합한지 묻는 문제.
- 두 개 이상의 도수분포다각형을 보고 "A반보다 B반이 성적이 더 높다"와 같은 비교 분석 질문.
- 접근법:
- 히스토그램은 각 계급의 도수를 직관적으로 보여주며, 도수분포다각형은 전체적인 분포의 변화를 부드럽게 연결하여 보여준다는 차이점을 명확히 알아야 합니다.
- 두 그래프의 넓이가 같다는 중요한 특징을 기억해야 합니다.
- 두 자료를 비교할 때는 그래프의 모양(왼쪽으로 치우쳤는지, 오른쪽으로 치우쳤는지 등)을 보고 평균적인 경향을 파악할 수 있어야 합니다.
학습 팁
- 용어와 정의를 정확히 외우세요! 계급, 도수, 계급의 크기, 계급값 등 통계 용어는 정확한 의미를 알고 있어야 혼란 없이 문제를 풀 수 있습니다.
- 직접 그려보면서 익히세요! 눈으로만 보지 말고, 연습장에 직접 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형을 그려보면서 각 방법을 완전히 자기 것으로 만들어야 합니다. 특히, 숫자가 많을 때 실수하지 않도록 연습하는 것이 중요합니다.
- '이상', '이하', '초과', '미만'을 정확히 구분하세요! 계급을 나눌 때 이 용어들을 잘못 적용하면 자료가 엉뚱한 계급에 들어가게 됩니다. 헷갈린다면 수직선을 그려놓고 해당 숫자가 포함되는지 안 되는지 표시해보는 연습을 해보세요.
이 단원은 앞으로 배우게 될 더 복잡한 통계의 기초가 됩니다. 차근차근 꾸준히 공부하면 누구나 통계의 재미에 푹 빠질 수 있을 거예요! 화이팅!