Distância de Mahalanobis

De Augusto Baffa Wiki
Revisão de 15h01min de 30 de janeiro de 2019 por Abaffa (discussão | contribs) (→‎Definição)
Ir para navegação Ir para pesquisar

A distância de Mahalanobis leva em consideração a variância de cada atributo, assim como a covariância entre eles. Transforma os dados em dados normalizados não correlacionadas e calcula a distância euclidiana para os dados transformados. É invariante à escala (não depende da escala das medições) e similar ao z-score.

Definição

Formalmente, a distância de Mahalanobis entre um grupo de valores com média μ=(μ1,μ2,μ3,,μp)T e matriz de covariância S para um vetor multivariado x=(x1,x2,x3,,xp)T é definida como:

DM(x)=(xμ)TS1(xμ)

Dado dois vetores x e y, e a matriz de covariâncias, a distância de Mahalanobis é definida como sendo:

d(x,y)=(xx)TS1(xy)
  • Se a matriz de covariâncias for uma matriz identidade, essa distância é igual a distância Euclidiana