본문 바로가기
빅데이터 분석기사,ADsP와 ADP

KDD 분석 방법론의 5단계 이해하기

by 귀주대 2023. 9. 16.

 

KDD(Knowledge Discovery in Database)는 데이터베이스에서 지식을 발견하는 과정을 체계화한 데이터 마이닝 프로세스입니다. KDD 분석 방법론은 다음과 같은 5단계로 구성됩니다.

1. 데이터셋 선택

데이터 마이닝을 수행하기 위해서는 먼저 분석에 필요한 데이터를 선택해야 합니다. 이 단계에서는 분석의 목표와 범위를 고려하여 적절한 데이터셋을 선택해야 합니다.


2. 데이터 전처리

데이터셋을 선택한 후에는 데이터 전처리 단계를 거쳐 데이터를 정제하고 가공해야 합니다. 데이터 전처리에는 다음과 같은 작업이 포함됩니다.

결측값 처리
이상치 처리
데이터 변환
표준화

3. 데이터 변환

데이터 전처리를 거친 데이터를 분석하기에 적합한 형태로 변환하는 단계입니다. 데이터 변환에는 다음과 같은 작업이 포함됩니다.

특성 선택
특성 추출
특성 축소

4. 데이터 마이닝

데이터 전처리와 변환을 거친 데이터에서 유용한 패턴이나 지식을 발견하는 단계입니다. 데이터 마이닝에는 다음과 같은 방법이 사용됩니다.

분류
회귀
군집화
연관 분석
이상 탐지

5. 결과 평가

데이터 마이닝을 통해 발견한 패턴이나 지식의 유용성을 평가하는 단계입니다. 결과 평가에는 다음과 같은 방법이 사용됩니다.

정확도
재현율
민감도
F1 스코어
데이터셋 선택


 

댓글