Distância de Mahalanobis
A distância de Mahalanobis leva em consideração a variância de cada atributo, assim como a covariância entre eles. Transforma os dados em dados normalizados não correlacionadas e calcula a distância euclidiana para os dados transformados. É invariante à escala (não depende da escala das medições) e similar ao z-score.
Definição
Formalmente, a distância de Mahalanobis entre um grupo de valores com média
e matriz de covariância para um vetor multivariado é definida como:Dado dois vetores
e , e a matriz de covariâncias, a distância de Mahalanobis é definida como sendo:- Se a matriz de covariâncias for uma matriz identidade, essa distância é igual a distância Euclidiana