Postagem em destaque

Autoeficácia nas palavras do próprio Albert Bandura

Este artigo traduzido faz parte dos meus estudos de doutorado. Ele fornece um referencial teórico importante para estudantes e professores...

domingo, 18 de março de 2012

Gostaria de saber a diferença das correlações de Spearman e Kandall? Quando posso usar uma ou outra? Além disso, se tenho dados com distribuição normal e dados que não apresentam distribuição normal, posso fazer algum tipo de correlação?

Dentre os tipos de correlações utilizadas destaca-se a clássica correlação de Pearson (entre duas variáveis contínuas), que é um teste paramétrico.

A correlação de Spearman (ou rho) é uma correlação de "rankings" ou "postos", e por isso é um teste não-paramétrico, isto é: não exige nenhum pressuposto de distribuição normal e pode ser utilizado para variáveis ordinais. Quando a relação entre as variáveis não é linear, mas uma função monotônica, Spearman pode resultar num coeficiente maior que a correlação de Pearson. Isto é bom, mas o lado ruim é que o coeficiente de correlação de Spearman é menos sensível a "outliers" (casos distantes da curva).

A correlação de Kendall (ou tau) vai na mesma linha não-paramétrica da correlação de Spearman, ao ser uma correlação de "rankings". A vantagem de usar o Kendall, segundo os estatísticos, é ter uma estrutura algebraica mais simples e uma interpretação mais universalizável. A desvantagem: ser sensível demais ao número de observações pequeno quando usada como medida de associação entre variáveis, resultando em coeficientes menores.

Na prática use Pearson sempre que possível.
Se houver um desvio muito grande da normalidade ou heterocedasticidade, ou ainda se você tiver variáveis ordinais, escolha Kendall ou Spearman. Kendall tem mais sustentação teórica e você deverá preferí-lo se o N for adequado. Spearman costuma resultar em coeficientes maiores, contudo, especialmente se o N for pequeno.

Há ainda a correlação ponto-bisserial (generalização da correlação de Pearson para quando uma das variáveis é dicotômica), a correlação bisserial (estimativa da correlação de Pearson quando uma das variáveis é artificialmente dicotomizada), a correlação phi (quando as duas variáveis são genuinamente dicotômicas) e a correlação tetracórica (duas variáveis contínuas com distribuição normal artificialmente dicotomizadas).

Escolha a sua!
Related Posts Plugin for WordPress, Blogger...