본문 바로가기

빅데이터 분석기사,ADsP와 ADP158

사회연결망 분석에서 커뮤니티 사회연결망 분석에서 커뮤니티는 밀접한 관련성을 가진 노드들의 집합으로 정의됩니다. 커뮤니티를 측정하는 방법은 여러 가지가 있습니다. 이 중에서 주요한 방법들에 대해 자세히 설명하겠습니다. 1. 모듈러리티(Modularity): 모듈러리티는 그래프를 여러 부분집합 또는 모듈로 나눌 수 있는 정도를 나타내는 지표입니다. 높은 모듈러리티는 그래프 내에서 강한 커뮤니티 구조가 있다는 것을 의미합니다. ​ 2. 최대우도 추정(Maximum Likelihood Estimation, MLE): 커뮤니티 감지를 최대우도 추정으로 다루는 방법이 있습니다. 이는 그래프 내에서 어떤 커뮤니티가 가장 확률적으로 존재할 지를 추정하는 방식입니다. 이를 위해 각 노드가 속한 커뮤니티의 확률을 최대화하는 방향으로 최적화하는 과정을.. 2024. 1. 28.
연관분석을 평가할 때는 몇 가지 주의점 연관분석은 데이터 간의 관계를 찾아내는 데 사용되는 데이터 마이닝 기법 중 하나로, 특히 상품의 구매 패턴 등에서 유용하게 활용됩니다. 연관분석을 평가할 때는 몇 가지 주의점을 고려해야 합니다. 이에 대한 자세한 설명은 다음과 같습니다. 1. 지지도 (Support)의 적절한 설정: 연관분석의 첫 번째 지표인 지지도는 특정 항목 집합이 전체 데이터에서 차지하는 비율을 나타냅니다. 너무 높거나 낮은 지지도는 의미 있는 규칙을 찾기 어렵게 만들 수 있습니다. 적절한 지지도 기준을 설정하여 흥미로운 규칙을 찾을 수 있도록 합니다. 2. 신뢰도 (Confidence)와 신뢰도-지지도 그래프 확인: 신뢰도는 조건 아이템이 주어졌을 때 결과 아이템이 함께 발생하는 확률을 나타냅니다. 이 값이 너무 높으면 관련성이 .. 2024. 1. 27.
조합의 기본이해 조합은 주어진 요소들 중 일부를 선택하여 만들어지는 모든 가능한 그룹을 나타냅니다. 순열과 비슷하지만 순서가 중요하지 않습니다. 즉, 같은 요소들의 조합이라면 순서가 달라도 동일한 것으로 간주됩니다. 이를 이해하기 위해 예시를 들어보겠습니다. 조합의 정의 조합은 다음과 같이 정의할 수 있습니다. n개의 서로 다른 요소 중에서 r개를 선택하여 만들어지는 모든 가능한 그룹. 여기서 n은 요소의 총개수를, r은 선택할 요소의 개수를 나타냅니다. 조합의 특징 1. 순서가 중요하지 않다: ABC와 CBA는 같은 조합으로 간주됩니다. 즉, 동일한 요소로 이루어진 그룹이면 순서에 상관없이 동일한 것으로 취급됩니다. 2. 서로 다른 요소들로 구성: 조합은 주어진 요소들로 만들어지는 모든 가능한 그룹을 의미합니다. 조합.. 2024. 1. 21.
순열의 기본이해 순열은 서로 다른 요소들을 조합하여 만들어지는 모든 가능한 배열 또는 순서를 나타냅니다. 예를 들어, A, B, C 세 개의 문자가 있을 때 가능한 순열은 ABC, ACB, BAC, BCA, CAB, CBA로 총 6가지가 있습니다. 이를 수식으로 나타내면 3개의 요소를 가진 순열은 3! (3 팩토리얼)로 표현됩니다. 순열의 정의 순열은 다음과 같이 정의할 수 있습니다. n개의 서로 다른 요소로 만들 수 있는 모든 가능한 순서 또는 배열. 여기서 n은 요소의 개수를 나타냅니다. 순열의 특징 1. 순서가 중요하다: ABC와 CBA는 서로 다른 순열입니다. 순열은 요소들의 배열이므로 순서에 따라 구분됩니다. 2. 서로 다른 요소들로 구성: 순열은 주어진 요소들로 만들어지는 모든 가능한 배열을 나타냅니다. 순열.. 2024. 1. 20.