Distância de Mahalanobis

De Augusto Baffa Wiki
Revisão de 14h57min de 30 de janeiro de 2019 por Abaffa (discussão | contribs) (Criou página com 'A distância de Mahalanobis leva em consideração a variância de cada atributo, assim como a covariância entre eles. Transforma os dados em dados normalizados não correlac...')
(dif) ← Edição anterior | Revisão atual (dif) | Versão posterior → (dif)
Ir para navegação Ir para pesquisar

A distância de Mahalanobis leva em consideração a variância de cada atributo, assim como a covariância entre eles. Transforma os dados em dados normalizados não correlacionadas e calcula a distância euclidiana para os dados transformados. É invariante à escala (não depende da escala das medições) e similar ao z-score.

Definição

Formalmente, a distância de Mahalanobis entre um grupo de valores com média [math]\mu =(\mu_1, \mu_2, \mu_3, \dots ,\mu_p)^T[/math] e matriz de covariância [math]S[/math] para um vetor multivariado [math]x=(x_1, x_2 ,x_3, \dots, x_p)^T[/math] é definida como:

[math]D_M(x)={\sqrt {(x - \mu)^T S^{-1} (x - \mu)}}[/math]

Dado dois vetores [math]\vec{x}[/math] e [math]\vec{y}[/math], e a matriz de covariâncias, a distância de Mahalanobis é definida como sendo:

[math]d(x, y) = {\sqrt {(\vec{x} - \vec{x})^T S^{-1} (\vec{x} - \vec{y})}}[/math]