본문 바로가기
빅데이터 분석기사,ADsP와 ADP

주성분 분석(Principal Component Analysis, PCA)과 요인분석(Factor Analysis)

by 귀주대 2023. 10. 1.

 

주성분 분석(Principal Component Analysis, PCA)과 요인분석(Factor Analysis)은 다변량 통계 분석 기법으로, 데이터의 차원을 축소하고 숨겨진 구조를 파악하는 데 사용됩니다. 그러나 이 두 기법은 목적과 가정 면에서 차이가 있습니다.

주성분 분석 (PCA):

 

PCA는 다차원 데이터를 주성분(Principal Component)이라고 하는 새로운 변수로 변환하는 기법입니다. 이 주성분은 데이터의 분산을 최대화하는 방향으로 설정됩니다. 주성분은 서로 독립적이며, 원래 변수들 사이의 상관관계를 고려하지 않습니다. 주로 데이터의 차원을 축소하거나 노이즈를 제거하여 데이터를 더 간결하게 만드는 데 사용됩니다.

주성분 분석의 주요 단계는 다음과 같습니다:

1. 데이터 표준화: 변수들을 평균이 0이고 표준편차가 1인 표준화된 변수로 변환합니다.
2. 공분산 행렬 계산: 변수들 간의 공분산 행렬을 계산합니다.
3. 공분산 행렬의 고유값 분해: 공분산 행렬을 고윳값과 고유벡터로 분해합니다.
4. 고윳값의 크기 순으로 고유벡터 선택: 고윳값이 큰 순서대로 고유벡터를 선택하여 주성분을 구성합니다.

 

요인분석 (Factor Analysis):
요인분석은 관측된 변수들 간의 상관 관계를상관관계를 고려하여 숨겨진 요인 또는 구조를 추출하는 기법입니다. 이 요인은 관측된 변수들 사이의 상관관계를 설명하는 데 사용됩니다. 주로 데이터의 차원을 축소하고 변수들 간의 상호 의존성을 이해하는 데 사용됩니다.

요인분석의 주요 단계는 다음과 같습니다:

1. 공통성 분석: 관측된 변수들의 변동을 공통 요인과 특이 요인으로 분해합니다.
2. 공통 요인 추출: 공통 요인을 추출하고, 요인이 어떻게 변수들 간의 상관 관계를 설명하는지 확인합니다.
3. 요인 회전: 요인들의 해석을 용이하게 하기 위해 요인을 회전시킵니다.
4. 요인 해석: 추출된 요인을 해석하여 변수 간의 상호 의존성을 이해하고 설명합니다.

 

주성분 분석은 변수들 간의 독립성을 강조하는 데 사용되며, 요인분석은 변수들 간의 상관 관계를 이해하고 구조를 파악하는 데 사용됩니다. 선택하기 전에 분석하려는 데이터와 목적에 맞는 기법을 선택하는 것이 중요합니다.

 

댓글