본문 바로가기

빅데이터 분석기사,ADsP와 ADP158

시각화 인사이트 프로세스 주요 단계 - 탐색(Exploration), 분석(Analysis), 활용(Utilization) 시각화 인사이트 프로세스는 주로 탐색(Exploration), 분석(Analysis), 그리고 활용(Utilization)이라는 세 가지 주요 단계로 구성됩니다. 각 단계는 데이터 시각화를 통해 정보를 찾고 해석하며, 최종적으로는 의사 결정이나 행동에 활용됩니다. 1. 탐색 (Exploration): 목적: ● 데이터셋을 탐험하고, 패턴이나 추세를 찾는 것. ● 데이터의 구조, 특징, 이상치를 발견하는 단계. 활동: ● 데이터 시각화 선택: 초기에는 다양한 시각화 기법을 사용하여 데이터를 탐험합니다. 산점도, 히스토그램, 상자수염도 등을 활용합니다. ● 기본 통계 및 요약: 평균, 중앙값, 분산 등의 기본 통계를 계산하고, 데이터의 요약 정보를 확인합니다. ● 트렌드 및 패턴 탐지: 선 그래프, 히트맵 .. 2024. 2. 1.
시각화 인사이트 프로세스(Visual Insight Process) "시각화 인사이트 프로세스(Visual Insight Process)"는 데이터 시각화를 통해 데이터로부터 의미 있는 정보와 통찰력을 얻는 과정을 말합니다. 이 프로세스는 데이터 시각화를 통한 효과적인 분석과 의사 결정을 위해 따라야 할 일련의 단계로 구성됩니다. 아래는 시각화 인사이트 프로세스의 주요 단계에 대한 설명입니다: 1. 문제 정의 및 목표 설정: 첫 번째 단계는 분석하고자 하는 문제를 명확하게 정의하고 목표를 설정하는 것입니다. 어떤 종류의 정보나 통찰력을 얻고자 하는지를 명확히 이해해야 합니다. 2. 데이터 수집 및 전처리: 필요한 데이터를 수집하고 전처리를 수행합니다. 이 단계에서는 데이터의 정확성과 완전성을 확인하고, 필요한 경우 데이터를 정제하거나 결측치를 처리합니다. 3. 시각화 디.. 2024. 1. 31.
Edge Betweenness Edge Betweenness는 그래프 내의 엣지(간선)가 중요한 역할을 하는 정도를 측정하는 방법 중 하나로, 그래프의 중심성을 평가하는 데 사용됩니다. 이 방법은 그래프 내에서 정보의 흐름이 얼마나 특정 엣지에 의존하는지를 나타냅니다. Edge Betweenness를 계산하면, 어떤 엣지가 그래프 내에서 다른 노드 간의 최단 경로를 얼마나 많이 통제하고 있는지를 파악할 수 있습니다. Edge Betweenness를 계산하는 주요 단계와 개념은 다음과 같습니다: 1. 최단 경로 찾기: 그래프 내의 모든 노드 쌍 간의 최단 경로를 찾습니다. 이를 위해 대표적으로 다익스트라(Dijkstra) 알고리즘이나 플로이드-와샬(Floyd-Warshall) 알고리즘이 사용됩니다. 2. 최단 경로 중 엣지 수 계산: .. 2024. 1. 30.
Walktrap 알고리즘 Walktrap 알고리즘은 그래프 또는 네트워크에서 커뮤니티(community) 구조를 감지하는 데 사용되는 알고리즘 중 하나입니다. 이 알고리즘은 노드 간의 랜덤 워크(Random Walk)를 이용하여 유사한 커뮤니티를 찾아내는 방법을 기반으로 합니다. Walktrap 알고리즘은 특히 계층적인 커뮤니티 구조를 잘 찾아내는 특징이 있습니다. 아래는 Walktrap 알고리즘의 주요 단계와 작동 방식에 대한 자세한 설명입니다. 1. 랜덤 워크 수행: 먼저, 랜덤 워크를 수행합니다. 각 노드에서 시작하여 랜덤하게 이웃 노드로 이동하는 과정을 여러 번 반복합니다. 이렇게 생성된 워크(경로)는 그래프 상에서 노드들 간의 유사성을 포착하게 됩니다. 2. 거리 행렬 계산: 랜덤 워크의 결과로 얻은 워크들 간의 거리를.. 2024. 1. 29.