통계학에서 데이터의 분포는 그 형태에 따라 왜도(Skewness)와 첨도(Kurtosis)라는 두 가지 주요 지표로 설명됩니다. 이러한 지표들은 데이터 분포의 특성을 파악하고 정규 분포와의 차이를 이해하는 데 도움이 됩니다.
1. 왜도 (Skewness):
왜도는 데이터 분포의 비대칭 정도를 나타내는 지표입니다. 왜도는 분포의 꼬리가 어느 쪽으로 치우쳐 있는지를 측정합니다.
왜도가 0인 경우: 데이터 분포가 대칭적인 정규 분포에 가깝습니다.
왜도가 양수인 경우: 오른쪽 꼬리가 길어져 분포가 오른쪽으로 치우친 분포입니다. 긍정적 왜도(Positive Skewness)라고도 합니다.
왜도가 음수인 경우: 왼쪽 꼬리가 길어져 분포가 왼쪽으로 치우친 분포입니다. 부정적 왜도(Negative Skewness)라고도 합니다.
왜도는 데이터 분포의 대칭성을 판단하는 데 도움이 되며, 왜도의 절대값이 크면 클수록 비대칭 정도가 더 큽니다.
2. 첨도 (Kurtosis):
첨도는 데이터 분포의 꼬리 부분의 뾰족함을 나타내는 지표입니다. 정규 분포와 비교하여 데이터 분포의 꼬리 부분이 얼마나 뾰족한지를 측정합니다.
첨도가 3인 경우: 정규 분포와 동일한 꼬리 모양을 가지고 있습니다. 이를 더빈-피어슨 정규 분포라고 합니다.
첨도가 3보다 작은 경우: 정규 분포보다 뾰족하지 않은 분포로 간주되며, 이를 음수 첨도(Negative Kurtosis)라고 합니다.
첨도가 3보다 큰 경우: 정규 분포보다 뾰족한 분포로 간주되며, 이를 양수 첨도(Positive Kurtosis)라고 합니다.
첨도는 데이터 분포의 꼬리 부분이 어떤 모양을 가지고 있는지를 판단하는 데 도움이 되며, 첨도의 값이 클수록 꼬리 부분이 뾰족합니다.
이렇게 왜도와 첨도는 데이터의 분포 형태를 파악하고 비교하는 데 중요한 통계적 지표입니다. 데이터 분석에서 데이터의 정규성을 평가하거나 특정 모델을 선택할 때 이러한 지표들을 활용할 수 있습니다.
'빅데이터 분석기사,ADsP와 ADP' 카테고리의 다른 글
회귀분석에서의 변수 선택법: 전진선택법, 후진소거법, 단계별 방법 (0) | 2023.09.28 |
---|---|
회귀분석: 데이터 분석의 핵심 도구 (0) | 2023.09.27 |
통계에서의 중요한 산포 측정 지표들 (0) | 2023.09.25 |
평균, 중앙값, 최빈값: 데이터의 대푯값 (0) | 2023.09.24 |
인과관계와 산점도: 종속변수와 독립변수 간의 상호작용 (0) | 2023.09.23 |
댓글