범주형 자료 (Categorical Data):
범주형 자료는 명목형 자료와 순서형 자료로 나눌 수 있습니다.
1. 명목형 자료 (Nominal Data): 명목형 자료는 서로 다른 범주 또는 그룹으로 구분되는 데이터를 나타냅니다. 이러한 범주는 순서가 없습니다. 예를 들어, 성별, 혈액형, 도시 이름은 명목형 자료의 예입니다.
2. 순서형 자료 (Ordinal Data): 순서형 자료는 범주 사이에 상대적인 순서 또는 등급이 있는 데이터를 의미합니다. 예를 들어, 학점 (A, B, C), 고객 만족도 (매우 만족, 만족, 불만족), 교육 수준 (초졸, 고졸, 대졸)은 순서형 자료의 예입니다.
범주형 자료의 시각화:
범주형 자료를 시각화하기 위한 주요 방법은 다음과 같습니다:
1. 막대 그래프 (Bar Chart): 명목형 자료의 각 범주별 빈도수 또는 순서형 자료의 등급을 나타내는 그래프입니다. 막대 그래프를 통해 범주 간 빈도 또는 상대적 등급을 비교할 수 있습니다.
2. 원 그래프 (Pie Chart): 명목형 자료의 범주 비율을 나타내는 그래프로, 전체에 대한 각 범주의 상대적 비율을 확인할 때 사용됩니다.
3. 모자이크 플롯 (Mosaic Plot): 명목형 두 변수 간의 연관성을 시각화하는 그래프로, 범주형 자료의 교차표를 시각적으로 표현합니다.
4. 도트 플롯 (Dot Plot): 명목형 자료의 각 범주별 관측치를 점으로 나타내는 그래프로, 점의 분포를 통해 빈도나 밀도를 파악할 수 있습니다.
연속형 자료 (Continuous Data):
연속형 자료는 측정된 결과가 연속적인 값을 가지며 무한히 많은 가능한 값이 존재합니다. 예를 들어, 키, 몸무게, 온도, 시간은 연속형 자료의 예입니다.
연속형 자료의 시각화:
연속형 자료를 시각화하기 위한 주요 방법은 다음과 같습니다:
1. 히스토그램 (Histogram): 연속형 자료의 분포를 시각화하는 그래프로, 데이터를 구간 또는 밴드로 나눠 각 구간의 빈도를 나타냅니다.
2. 선 그래프 (Line Chart): 시간에 따른 연속형 데이터의 변화를 보여주는 그래프로, 시계열 데이터 분석에 자주 사용됩니다.
3. 상자 그림 (Box Plot): 연속형 데이터의 다섯 가지 요약 통계치(최솟값, 1사분위수, 중앙값, 3사분위수, 최댓값)를 시각화하는 그래프로, 이상값을 식별할 때 유용합니다.
4. 밀도 그림 (Density Plot): 데이터의 밀도 분포를 시각화하는 그래프로, 히스토그램보다 부드러운 분포 곡선을 제공합니다.
5. 산포도 (Scatter Plot): 두 연속형 변수 간의 상관 관계를 시각화하는 그래프로, 점으로 데이터의 분포를 나타냅니다.
범주형 자료와 연속형 자료는 각각의 특성에 따라 적합한 시각화 방법을 선택하여 데이터를 이해하고 통계적 분석을 수행하는 데 활용할 수 있습니다.
'빅데이터 분석기사,ADsP와 ADP' 카테고리의 다른 글
피어슨 상관계수 (Pearson Correlation Coefficient),스피어만 순위 상관계수 (Spearman's Rank Correlation Coefficient) (0) | 2023.10.20 |
---|---|
인과관계 (Causality) vs 상관분석 (Correlation) (1) | 2023.10.19 |
변수의 구간화(Variable Binning 또는 Bucketing) (0) | 2023.10.17 |
요약 변수(Summary Variable)와 파생 변수(Derived Variable) (0) | 2023.10.16 |
데이터 마트(Data Mart) (0) | 2023.10.15 |
댓글