시계열 분석에서 정상성(Stationarity)은 매우 중요한 개념이며 시계열 데이터가 정상성을 만족할 때, 통계적 분석 및 모델링이 더 용이해집니다. 정상성은 다음과 같은 세 가지 조건을 충족해야 합니다:
1. 일정한 평균 (Constant Mean):
시계열 데이터의 평균은 시간이 지남에 따라 일정해야 합니다. 즉, 모든 시점에서 평균이 일정한 값을 가져야 합니다.
2. 일정한 분산 (Constant Variance):
시계열 데이터의 분산(또는 표준편차)은 시간에 따라 변동하지 않아야 합니다. 데이터의 분산은 모든 시점에서 안정되어야 합니다.
3. 공분산의 일정성 (Constant Covariance):
시계열 데이터 내의 관측치들 간의 공분산 또는 상관관계는 시간에 따라 변하지 않아야 합니다. 즉, 관측치 간의 상관성이 일정해야 합니다.
시계열 데이터가 정상성을 만족하지 않으면, 통계적 분석이 어려워지며 모델링에 대한 결과가 불안정할 수 있습니다. 정상성을 만족하지 않는 시계열 데이터의 예시로는 계절적인 트렌드나 추세, 주기성, 랜덤 요소 등이 포함될 수 있습니다.
정상성을 가정하는 시계열 모델인 ARIMA(AutoRegressive Integrated Moving Average)는 데이터를 정상성을 갖는 데이터로 변환한 후 모델링하는 데 사용됩니다. 정상성을 얻기 위해 데이터 차분(Differencing)을 사용하거나 다른 변환 기술을 사용할 수 있습니다.
'빅데이터 분석기사,ADsP와 ADP' 카테고리의 다른 글
데이터 마이닝(Data Mining)의 이해(통계분석과 차이) (0) | 2023.10.25 |
---|---|
다차원 척도법(Multidimensional Scaling, MDS) (0) | 2023.10.24 |
회귀분석의 종류 (0) | 2023.10.22 |
회귀분석의 검정방법 (0) | 2023.10.21 |
피어슨 상관계수 (Pearson Correlation Coefficient),스피어만 순위 상관계수 (Spearman's Rank Correlation Coefficient) (0) | 2023.10.20 |
댓글