Data Science/Basic ML

Distance Metrics

준나이 2018. 11. 13. 20:58

하나의 벡터와 다른 벡터의 차이를 측정하는 방법은 여러가지가 있다. 그중에서 Distance 기반의 측정 방법은 말 그대로 벡터간의 물리적 길이를 기반으로 측정하는 방법이다. 길이에 가중치를 주는 방법에 따라 여러가지 지표로 나타 낼 수 있고, 이 방법에 의해 underfitting, overfitting을 야기시킬 수도 있다.


1) Manhattan distance (L1) : stepped path
2) Chebychev distance
3) Euclidean distance (L2) : straight line
4) Minkowski distance



• Overview of each distance

1) Manhattan distance : L1 distance라고 불리며 stepped path 형태를 띤다. 두 점 사이의 거리 좌표상의 절대 차이값들의 합이다.





2) Chebychev distance : 한 점으로부터 인접한 8개의 모든 셀들을 같은 거리로 처리하는 것이 다르다.





3) Euclidean distance : L2 distance라고 불리며 straight line 형태를 띤다. 두 점 사이의 직선거리이다.





4) Minkowski distance : Euclidean과 Manhattan distance을 일반화 한 형태이다. Lp라고 표현할 수 있다.

Image result for minkowski distance




Image result for minkowski distance


* Manhattan vs. Euclidean





https://lyfat.wordpress.com/2012/05/22/euclidean-vs-chebyshev-vs-manhattan-distance/
https://www.quora.com/What-is-the-difference-between-Manhattan-and-Euclidean-distance-measures
http://taewan.kim/post/norm/
http://www.chioka.in/differences-between-the-l1-norm-and-the-l2-norm-least-absolute-deviations-and-least-squares/

'Data Science > Basic ML' 카테고리의 다른 글

Lp space / Lebesgue spaces (L1, L2, ...)  (0) 2018.11.14