Mathology
수학중학교 3학년

알쏭달쏭 자료의 비밀을 파헤치다! 중3 통계 완전 정복!

중학교 3학년 수학 '통계' 단원, 대푯값, 산포도, 상관관계 개념을 쉽고 재미있게 배우고 실생활 속에서 데이터를 이해하는 힘을 길러 보세요!

개요

안녕하세요, 여러분! 중학교 3학년 수학 선생님이자 교육 콘텐츠 작가 류샘입니다. 우리 주변을 둘러보면 수많은 자료와 숫자들이 가득하죠? 뉴스에서 나오는 평균 기온, 스포츠 경기 선수들의 기록, 친구들의 시험 점수, 심지어 인기 아이돌 그룹의 앨범 판매량까지! 이 모든 것들이 바로 '통계'와 관련이 깊습니다.

이번 단원에서는 이렇게 복잡하고 많은 자료들을 어떻게 정리하고, 핵심을 파악하며, 숨겨진 관계까지 찾아낼 수 있는지 그 방법을 배울 거예요. 단순히 숫자를 계산하는 것을 넘어, 자료가 우리에게 말해주는 의미를 정확하게 이해하고, 합리적인 판단을 내릴 수 있는 능력을 키우는 것이 목표입니다. 어렵게만 느껴질 수 있는 통계, 선생님과 함께라면 재미있고 쉽게 정복할 수 있을 거예요!


핵심 개념

1. 대푯값: 자료를 대표하는 하나의 수

자료 전체의 특징을 가장 잘 나타내는 하나의 값을 '대푯값'이라고 합니다. 우리 반 평균 키, 시험 평균 점수처럼 여러 자료를 한눈에 알아보기 쉽게 요약해 주는 값이죠. 대푯값에는 평균, 중앙값, 최빈값이 있습니다.

  • 평균: 가장 많이 사용되는 대푯값으로, 모든 자료의 값을 더한 후 자료의 개수로 나눈 값입니다.

    평균 = (자료의 총합) ÷ (자료의 개수)

    예를 들어, 친구 5명의 키가 160cm, 162cm, 165cm, 168cm, 170cm라면, 이 친구들의 평균 키는 (160+162+165+168+170160 + 162 + 165 + 168 + 170) ÷ 5 = 165cm가 됩니다.

  • 중앙값: 자료를 크기 순서대로 나열했을 때 가장 가운데에 위치하는 값입니다. 자료 중 아주 크거나 작은 극단적인 값이 있을 때 평균보다 자료의 특징을 더 잘 나타낼 수 있습니다.

    • 자료의 개수가 홀수: 가운데 있는 값이 중앙값입니다.
    • 자료의 개수가 짝수: 가운데 있는 두 값의 평균이 중앙값입니다.

    예를 들어, 시험 점수가 50점, 60점, 70점, 80점, 100점이라면 크기 순서대로 정렬되어 있으므로 가운데 값인 70점이 중앙값입니다. 만약 50점, 60점, 70점, 80점 4개의 점수만 있다면, 가운데 두 값인 60점과 70점의 평균인 (60+7060 + 70) ÷ 2=652 = 65점이 중앙값입니다.

  • 최빈값: 자료에서 가장 많이 나타나는 값입니다. 여러 개일 수도 있고, 없을 수도 있습니다. 수치 자료뿐만 아니라 '좋아하는 색깔'처럼 수치가 아닌 자료에서도 활용될 수 있습니다.

    예를 들어, 친구들이 좋아하는 과일이 사과, 바나나, 사과, 포도, 바나나, 사과라면 '사과'가 3번으로 가장 많이 나왔으므로 최빈값은 사과입니다.

핵심: 자료의 특징을 하나의 값으로 요약할 때 사용하며, 자료의 종류와 상황에 따라 적절한 대푯값을 선택해야 합니다.

예제: 어떤 반 학생 7명의 스마트폰 사용 시간이 다음과 같았습니다. (단위: 시간) 3, 5, 2, 7, 5, 6, 5 이 자료의 평균, 중앙값, 최빈값을 구해봅시다.

풀이:

  1. 평균: (3+5+2+7+5+6+53 + 5 + 2 + 7 + 5 + 6 + 5) ÷ 7=33÷77 = 33 \div 7 ≈ 4.71시간
  2. 중앙값: 자료를 크기 순서대로 나열하면 2, 3, 5, 5, 5, 6, 7 입니다. 7개의 자료 중 가운데 있는 값은 5입니다. 따라서 중앙값은 5시간입니다.
  3. 최빈값: 가장 많이 나타나는 값은 5입니다. (3번 나타남) 따라서 최빈값은 5시간입니다.

2. 산포도: 자료가 흩어진 정도를 나타내는 값

대푯값만으로는 자료의 특징을 충분히 알 수 없을 때가 있습니다. 예를 들어, 두 반의 평균 수학 점수가 똑같이 70점이라고 해도, 한 반은 대부분의 학생이 70점 근처에 모여 있고, 다른 한 반은 점수가 아주 높은 학생과 아주 낮은 학생이 섞여 있을 수 있죠. 이처럼 자료가 흩어져 있는 정도를 하나의 수로 나타낸 것을 '산포도'라고 합니다. 산포도에는 분산과 표준편차가 있습니다.

  • 편차: 각 자료의 값이 평균으로부터 얼마나 떨어져 있는지를 나타내는 값입니다.

    편차 = (자료의 값) - (평균)

    편차가 양수이면 평균보다 크고, 음수이면 평균보다 작습니다. 중요한 특징은 모든 편차의 합은 항상 0이라는 것입니다.

  • 분산: 편차의 합이 0이 되는 문제를 해결하기 위해, 각 편차를 제곱하여 더한 후 자료의 개수로 나눈 값입니다. 편차를 제곱하는 이유는 음수를 없애고, 편차가 큰 값을 더 강조하기 위함입니다.

    분산 = (편차의 제곱의 총합) ÷ (자료의 개수)

  • 표준편차: 분산의 양의 제곱근입니다. 분산은 단위를 제곱했기 때문에 원래 자료의 단위와 달라 해석하기 어려울 수 있습니다. 표준편차는 단위가 원래 자료와 같아 자료가 흩어진 정도를 직관적으로 이해하기 좋습니다.

    표준편차 = 분산\sqrt{\text{분산}}

    표준편차가 작을수록 자료가 평균 주변에 가깝게 모여 있어 고르다고 할 수 있고, 표준편차가 클수록 자료가 평균으로부터 멀리 흩어져 있어 고르지 않다고 할 수 있습니다.

핵심: 자료가 평균을 중심으로 얼마나 흩어져 있는지를 하나의 숫자로 나타내는 값입니다. 표준편차가 작을수록 자료는 고르게 분포되어 있습니다.

예제: 어떤 학생의 3회에 걸친 시험 점수가 60점, 70점, 80점입니다. 이 자료의 분산과 표준편차를 구해봅시다.

풀이:

  1. 평균 구하기: (60+70+8060 + 70 + 80) ÷ 3=703 = 70
  2. 각 자료의 편차 구하기:
    • 60점의 편차: 60 - 70 = -10
    • 70점의 편차: 70 - 70 = 0
    • 80점의 편차: 80 - 70 = 10 (편차의 합: -10+0+10=010 + 0 + 10 = 0)
  3. 편차를 제곱하여 더하기: $(-10)^2 + 0^2 + 10^2 = 100 + 0 + 100 = 200
  4. 분산 구하기: 200 ÷ 3 = 2003\frac{200}{3}
  5. 표준편차 구하기: 2003\sqrt{\frac{200}{3}} = 1063\frac{10\sqrt{6}}{3}

3. 상관관계: 두 변량 사이의 관계를 시각적으로 보여주는 산점도

우리는 종종 두 가지 자료 사이에 어떤 관계가 있는지 궁금해합니다. 예를 들어, '공부 시간과 성적'은 관계가 있을까요? '여름철 기온과 아이스크림 판매량'은 어떨까요? 이처럼 두 변량(자료) 사이에 어떤 경향이 있는지를 파악하는 것을 '상관관계'라고 합니다.

  • 산점도: 두 변량의 순서쌍을 좌표평면 위에 점으로 나타낸 그림입니다. 산점도를 보면 두 변량 사이의 관계를 한눈에 파악할 수 있습니다.

    • 양의 상관관계: 한 변량이 증가할 때 다른 변량도 함께 증가하는 경향을 보입니다. (예: 공부 시간과 성적, 키와 몸무게) 점들이 오른쪽 위로 향하는 모양을 이룹니다.

    • 음의 상관관계: 한 변량이 증가할 때 다른 변량은 감소하는 경향을 보입니다. (예: 운동 시간과 체지방량, 겨울철 기온과 난방비) 점들이 오른쪽 아래로 향하는 모양을 이룹니다.

    • 상관관계 없음: 두 변량 사이에 뚜렷한 관계나 경향을 찾기 어려운 경우입니다. (예: 시력과 좋아하는 음식, 발 사이즈와 수학 점수) 점들이 특별한 방향 없이 흩어져 있는 모양을 이룹니다.

  • 강한 상관관계 / 약한 상관관계: 점들이 한 직선에 가깝게 모여 있을수록 상관관계가 강하다고 하고, 점들이 넓게 흩어져 있을수록 상관관계가 약하다고 합니다.

핵심: 두 변량 사이의 관계를 산점도로 파악하며, 양의 상관관계, 음의 상관관계, 상관관계 없음으로 구분하여 설명할 수 있습니다. 단, 상관관계가 있다고 해서 반드시 인과관계(원인과 결과)가 있다고 할 수는 없습니다!


공식 정리

평균 = (자료의 총합) ÷ (자료의 개수) — 자료를 대표하는 가장 일반적인 값

중앙값 = 자료를 크기 순으로 나열했을 때 가운데 값 (짝수 개일 경우 가운데 두 값의 평균) — 극단적인 값의 영향을 덜 받음

최빈값 = 자료에서 가장 많이 나타나는 값 — 비수치 자료에도 사용 가능

편차 = (자료의 값) - (평균) — 각 자료가 평균으로부터 얼마나 떨어져 있는지 나타냄 (편차의 총합은 항상 0)

분산 = (편차의 제곱의 총합) ÷ (자료의 개수) — 자료가 흩어진 정도를 나타내는 지표

표준편차 = 분산\sqrt{\text{분산}} — 분산에 루트를 씌워 원래 자료와 단위를 맞춘 것. 작을수록 자료가 고름

산점도 해석 = 점들의 분포가 오른쪽 위를 향하면 양의 상관관계, 오른쪽 아래를 향하면 음의 상관관계, 특별한 경향이 없으면 상관관계 없음


시험에 이렇게 나와요

유형 1: 대푯값 계산 및 의미 해석

주어진 자료에서 평균, 중앙값, 최빈값을 정확하게 계산하는 문제는 기본적으로 출제됩니다. 특히 자료에 아주 큰 값이나 작은 값이 섞여 있을 때 어떤 대푯값이 더 적절한지 그 이유를 설명하는 문제가 자주 나옵니다. 예를 들어, '연봉 자료에는 평균보다 중앙값이 더 적절한 이유'를 묻는 식이죠. 자료의 개수가 짝수일 때 중앙값 구하는 방법과 최빈값이 여러 개이거나 없을 때도 당황하지 않고 답할 수 있어야 합니다.

유형 2: 산포도 계산과 자료의 고른 정도 비교

분산과 표준편차를 계산하는 과정은 편차 구하기, 편차 제곱하기, 편차 제곱의 합 구하기, 분산 구하기, 표준편차 구하기의 여러 단계를 거칩니다. 각 단계에서 실수가 없도록 꼼꼼하게 계산하는 연습이 중요합니다. 또한, 두 집단의 표준편차를 비교하여 어느 집단의 자료가 더 고른지 판단하는 문제도 자주 출제됩니다. 예를 들어, '두 반의 수학 성적 중 어느 반이 더 고른 편인가?'와 같은 문제입니다.

유형 3: 산점도 분석 및 상관관계 판단

제시된 산점도를 보고 양의 상관관계, 음의 상관관계, 상관관계 없음 중 어떤 유형에 해당하는지 정확하게 판단하는 문제가 나옵니다. 나아가, 상관관계의 강도(강하다/약하다)까지 파악해야 할 수도 있습니다. 가장 중요한 것은 상관관계가 인과관계와는 다르다는 점을 이해하고 설명할 수 있어야 합니다. 즉, 두 변수가 함께 움직이는 경향이 있다고 해서 한 변수가 다른 변수의 원인이라고 단정할 수 없다는 것을 아는 것이 중요합니다.

유형 4: 미지수를 포함한 자료의 대푯값/산포도 활용

자료 중에 특정 값이 미지수(x)로 주어지고, 평균이나 분산 등의 정보가 주어졌을 때 미지수 x의 값을 찾아내는 문제가 출제될 수 있습니다. 이 유형은 대푯값이나 산포도의 정의와 공식을 정확히 이해하고 있어야 풀 수 있는 심화 문제에 해당합니다. 예를 들어 '평균이 5일 때, 자료 3,x,7,2,83, x, 7, 2, 8에서 x의 값을 구하시오'와 같은 문제입니다.


학습 팁

  1. 개념의 정의를 정확히 외우세요! 평균, 중앙값, 최빈값, 편차, 분산, 표준편차, 상관관계 등 각 개념이 무엇을 의미하는지, 어떤 상황에서 쓰이는지를 명확하게 이해하는 것이 가장 중요합니다. 수학 기호나 공식 암기보다 개념 자체를 이해하는 것에 집중하세요.

  2. 공식은 '왜' 나오는지 원리를 이해하세요! 무작정 공식만 외우기보다는, 예를 들어 분산에서 왜 편차를 제곱하는지, 표준편차는 왜 분산에 루트를 씌우는지 그 이유를 이해하면 공식이 더 쉽게 기억되고 응용 문제에도 강해집니다.

  3. 다양한 예제를 직접 풀어보세요! 눈으로만 읽지 말고, 손으로 직접 대푯값과 산포도를 계산해보고 산점도를 그려보면서 개념을 적용하는 연습을 해야 합니다. 특히 계산 실수가 없도록 꼼꼼하게 연습하는 것이 중요합니다.

  4. 산점도는 '그림'으로 이해하세요! 산점도는 두 변량 사이의 관계를 시각적으로 보여주는 도구입니다. 점들이 어떤 방향으로 모여 있는지, 얼마나 촘촘하게 모여 있는지를 그림의 형태로 파악하는 연습을 꾸준히 하세요.

  5. 오답 노트를 활용하여 약점을 보완하세요! 틀린 문제가 있다면, 단순히 답을 베끼는 것이 아니라 왜 틀렸는지, 어떤 개념을 놓쳤는지 분석하고 다시 풀어보는 과정을 꼭 거쳐야 합니다. 비슷한 유형의 문제를 다시 풀어보며 자신의 약점을 보완해 나가세요.

#중3수학#통계#대푯값#산포도#상관관계#평균#중앙값#최빈값#분산#표준편차#산점도#수학블로그#내신대비#수학#통계