본문 바로가기
빅데이터 분석기사,ADsP와 ADP

데이터 처리 기술 - CDC

by 귀주대 2023. 11. 21.

 

변경 데이터 캡처(Change Data Capture, CDC)는 데이터베이스에서 변경된 데이터를 식별하고, 기록하며, 이를 추적하는 기술입니다. 주로 데이터베이스의 변경사항을 감지하고, 이를 기록하거나 복제하는 데 사용됩니다. CDC는 데이터 변경 시 발생하는 이벤트와 관련된 정보를 캡처하고, 이 정보를 사용해 데이터를 추적하고 분석합니다.

CDC의 작동 방식:


1. 로그 기반 변경 캡처: 대부분의 CDC 시스템은 데이터베이스의 로그를 기반으로 작동합니다. 데이터베이스에서 발생하는 각각의 변경이 로그에 기록되며, CDC는 이 로그를 모니터링하고 변화를 식별합니다.

2. 변경 식별 및 추출: CDC 시스템은 데이터베이스 로그를 분석하여 새롭게 발생한 변경사항을 식별하고, 이러한 변경 사항을 추출하여 캡처합니다.

3. 변경사항 기록 및 전달: 식별된 변경 사항은 주로 데이터 웨어하우스, 데이터 마트 또는 다른 시스템으로 전달되거나 기록됩니다. 이는 데이터 분석, 실시간 레포팅, 의사 결정 등에 활용됩니다.

CDC의 활용:


데이터 복제: 다른 시스템이나 데이터베이스로 데이터를 복제할 때 주로 사용됩니다. 변경된 데이터만을 추출하여 다른 데이터베이스에 반영합니다.

 

실시간 분석 및 모니터링: 데이터의 변경사항을 실시간으로 추적하고 분석하여 실시간 모니터링 및 의사 결정을 지원합니다.

 

ETL 프로세스 개선: ETL(Extract, Transform, Load) 프로세스를 개선하여 신속하고 효율적으로 변경된 데이터를 처리할 수 있도록 합니다.

 

CDC의 장점:


실시간 데이터 분석: 실시간으로 변경된 데이터를 추적하고 분석하여 신속한 의사 결정을 가능하게 합니다.

 

데이터 무결성 유지: 변경사항을 정확하게 추적하고 기록하여 데이터의 무결성을 유지합니다.

 

비즈니스 운영 향상: 데이터의 변경사항을 신속하게 파악하여 비즈니스 운영 및 의사 결정에 활용할 수 있습니다.

 

CDC는 데이터베이스의 변경을 효율적으로 추적하고, 변경된 데이터를 다른 시스템에 전달하여 실시간 데이터 처리와 분석을 지원하는 중요한 기술 중 하나입니다.

 

'빅데이터 분석기사,ADsP와 ADP' 카테고리의 다른 글

데이터 처리 기술 - ESB  (1) 2023.11.26
데이터 처리 기술 - EAI  (0) 2023.11.22
데이터 처리 기술 - ODS  (0) 2023.11.20
데이터 처리 기술 - ETL  (0) 2023.11.19
텍스트 마이닝  (0) 2023.11.18

댓글