📊 평균보다 중앙값을 봐야 하는 이유 — 데이터의 진짜 중심을 읽는 법

by J.D. Inform | Daily Data @ DailyScienceTech


데이터 그래프와 숫자 분석 장면
그림 1. 숫자 하나의 평균이 아닌, 데이터의 분포를 함께 보는 것이 진짜 분석입니다. (Unsplash)

🎯 왜 평균은 때로 거짓말을 할까?

“우리 회사의 평균 연봉은 8천만 원입니다.” 하지만 실제로는 몇몇 임원만 억대 연봉이고, 대부분은 5천만 원 수준이라면 이 수치는 현실을 왜곡하죠. 이렇게 평균은 극단값(outlier)에 크게 흔들립니다. 데이터의 “중심”을 보려면, 중앙값(median)을 함께 봐야 합니다.

평균(mean)은 “모든 값을 더한 뒤 나눈 값”, 중앙값(median)은 “정렬된 데이터의 정중앙 값”입니다.

📐 평균 vs 중앙값 — 한눈에 비교

지표의미영향 요인적합한 상황
평균 (Mean)모든 값을 더한 후 개수로 나눈 값극단값에 민감데이터가 균등하게 분포된 경우
중앙값 (Median)정렬 후 중앙 위치의 값극단값 영향 적음편향된 분포나 이상치가 많은 경우

📊 간단한 예시

다음과 같은 7명의 월급 데이터가 있습니다.

[300, 310, 320, 330, 340, 350, 2000]

  • 평균 = (300+310+320+330+340+350+2000) ÷ 7 = 564
  • 중앙값 = 정렬된 값의 중앙, 즉 330

평균은 564로 크게 치우쳐 있지만, 실제 대부분의 직원은 300~350 사이입니다. 평균은 “실제 체감”을 반영하지 못하는 셈이죠.

엑셀에서 =MEDIAN() 함수로 중앙값을 구할 수 있습니다.
그림 2. 엑셀에서 =MEDIAN() 함수로 중앙값을 구할 수 있습니다. (Unsplash)

💡 엑셀에서 평균 vs 중앙값 구하기

=AVERAGE(B2:B8)
=MEDIAN(B2:B8)

  • AVERAGE는 전체 평균
  • MEDIAN은 중앙값

두 결과를 비교하면, 데이터에 극단값이 있을 때 중앙값이 훨씬 안정적임을 확인할 수 있습니다.

📈 중앙값이 유용한 실제 사례

  • 급여·소득 분석: 상위 소수의 고액 소득에 영향을 덜 받음.
  • 부동산 가격: 일부 초고가 거래로 인한 왜곡 방지.
  • 응답시간/성능 분석: 평균보다 실제 사용자 체감을 반영.
  • 시험 점수 분석: 한두 개의 0점·만점에 휘둘리지 않음.
데이터 차트 시각화 화면
그림 3. 분포형 데이터에서는 평균보다 중앙값이 ‘대표값’으로 적합합니다. (Unsplash)

🧠 평균 대신 중앙값을 써야 하는 경우

  • 데이터에 이상치(outlier)가 존재할 때
  • 샘플 수가 작고, 분포가 비대칭일 때
  • “전형적인 값”보다 “대부분의 사람이 체감하는 값”을 알고 싶을 때

⚡ 실무 팁

보고서 작성 시 평균과 중앙값을 나란히 표시하면, 숫자 이면의 분포를 한눈에 파악할 수 있습니다. 또한 엑셀의 =PERCENTILE()이나 =QUARTILE() 함수를 함께 쓰면 상위·하위 25% 구간도 쉽게 시각화할 수 있습니다.

📌 오늘의 요약

“평균은 전체의 목소리를 담지만, 중앙값은 대다수의 현실을 보여줍니다.” 데이터의 ‘중심’을 볼 때, 중앙값을 함께 보세요.


#중앙값 #평균 #데이터분석 #엑셀 #DailyData #DailyScienceTech

댓글 남기기