본문 바로가기

ESD2

이상값 인식, ESD (Extreme Studentized Deviate) 방법 ESD (Extreme Studentized Deviate) 방법: ESD 방법은 평균에서 얼마나 멀리 떨어져 있는 이상값을 찾는 데 사용되는 통계적 방법 중 하나입니다. 이 방법을 사용하여 특정한 이상값을 탐지하기 위해서는 다음과 같은 단계를 따릅니다: 1. Z-점수(Z-Score) 계산: 데이터 집합의 각 데이터 포인트에 대한 Z-점수를 계산합니다. Z-점수는 다음과 같이 정의됩니다: Z = (X - μ) / σ 여기서, X는 개별 데이터 포인트, μ는 데이터 집합의 평균, σ는 데이터 집합의 표준 편차입니다. 2. 가장 큰 Z-점수 식별: Z-점수 중 가장 큰 값을 찾습니다. 이 값은 데이터 집합 내에서 가장 이상적으로 여겨질 수 있는 이상값입니다. 3. 임계값 설정: 사용자가 설정한 유의 수준(일.. 2023. 10. 9.
이상값, 인식과 처리 방법 이상값(Outliers)은 데이터 집합에서 일반적인 패턴에서 벗어나 극단적인 값으로 나타나는 데이터 포인트를 의미합니다. 이상값은 데이터 분석을 왜곡시키거나 잘못된 결론을 이끌어낼 수 있으므로 이를 올바르게 처리하는 것이 중요합니다. 이제 이상값에 대한 설명과 R에서의 인식 방법, 그리고 처리 방법에 대해 알아보겠습니다. 이상값의 특징: 이상값은 주로 데이터 집합의 일반적인 분포에서 벗어나 더 높거나 낮은 값으로 나타납니다. 이상값은 단일 변수 또는 다변수 상황에서 나타날 수 있으며, 다른 데이터 포인트와 차이가 큽니다. 이상값은 측정 오류, 특이한 사건 또는 시스템 이상과 관련될 수 있습니다. 이상값 인식 방법: 1. ESD (Extreme Studentized Deviate): ESD는 Z-점수(Z-.. 2023. 10. 8.