Distância de Mahalanobis

De Augusto Baffa Wiki
Ir para navegação Ir para pesquisar

A distância de Mahalanobis leva em consideração a variância de cada atributo, assim como a covariância entre eles. Transforma os dados em dados normalizados não correlacionadas e calcula a distância euclidiana para os dados transformados. É invariante à escala (não depende da escala das medições) e similar ao z-score.

Definição

Formalmente, a distância de Mahalanobis entre um grupo de valores com média [math]\mu =(\mu_1, \mu_2, \mu_3, \dots ,\mu_p)^T[/math] e matriz de covariância [math]S[/math] para um vetor multivariado [math]x=(x_1, x_2 ,x_3, \dots, x_p)^T[/math] é definida como:

[math]D_M(x)={\sqrt {(x - \mu)^T S^{-1} (x - \mu)}}[/math]

Dado dois vetores [math]\vec{x}[/math] e [math]\vec{y}[/math], e a matriz de covariâncias, a distância de Mahalanobis é definida como sendo:

[math]d(x, y) = {\sqrt {(\vec{x} - \vec{x})^T S^{-1} (\vec{x} - \vec{y})}}[/math]
  • Se a matriz de covariâncias for uma matriz identidade, essa distância é igual a distância Euclidiana

Ver também