본문 바로가기
Mathematics

Similarity Measure (기본적인 유사도 측정법)

by BaekDaBang 2024. 5. 14.

1. Euclidean distance (유클리디안 거리)

두 벡터 거리 간의 직선 거리 측정법

 

2. Manhattan Distance (맨해튼 거리)

데카르트 좌표계 상, 두 벡터 차의 절댓값의 합

빨간색, 파란색, 노란색 선은 모두 맨해튼 거리를 나타내는 것이고, 초록색은 유클리드 거리를 나타냄

 

3.Minkowski Distance (민코프스키 거리)

유클리드 거리와 맨해튼 거리를 일반화

 

n 차원 점 X, Y에 대해 p차 민코프스키 거리

  • p = 1일 경우 맨해튼 거리와 동일, L1 norm
  • p = 2일 경우 유클리드 거리와 동일, L2 norm
  • p = ∞일 경우 체비쇼프 거리(Chebyshev Distance)와 동일, L max norm

p값에 따라 달라지는 단위원

 

4. Cosine Similarity (코사인 유사도)

두 벡터가 이루는 각도를 통해 유사도를 측정

두 벡터가 이루는 각이 작을 수록 유사도가 높은 것이고, 각이 클수록 유사도가 작음

벡터의 크기를 고려하지 않음