유사성 평가1 유사성 평가(Similarity Evaluation) - 임베딩 모델의 성능을 평가 임베딩 모델의 성능을 평가하기 위한 한 가지 방법은 유사성 평가(Similarity Evaluation)입니다. 이 방법은 임베딩된 단어 벡터 간의 유사성을 측정하여 임베딩 모델이 의미적으로 유사한 단어들을 벡터 공간에서 얼마나 잘 표현하는지를 평가합니다. 유사성 평가 방법 1. 단어 유사도 측정: 코사인 유사도(Cosine Similarity)를 가장 많이 사용합니다. 코사인 유사도는 두 벡터 간의 각도를 기반으로 벡터의 유사성을 측정합니다. 두 벡터가 같은 방향을 향하고 있을수록 1에 가까운 값을 가지며, 유사성이 높음을 의미합니다. 2. 평가 데이터셋 구성: 평가를 위해 사전에 유사성을 측정할 단어 쌍이나 문장 쌍을 수집하여 데이터셋을 구성합니다. 대표적으로 WordSim-353, WordSimil.. 2023. 12. 17. 이전 1 다음