Postagem em destaque

Autoeficácia nas palavras do próprio Albert Bandura

Este artigo traduzido faz parte dos meus estudos de doutorado. Ele fornece um referencial teórico importante para estudantes e professores...

quinta-feira, 3 de fevereiro de 2011

Testes post-hoc para análise de variância (ANOVA): um tutorial básico

Sugiro ao leitor novato do blog que antes de prosseguir neste post que dê uma lida na minha análise crítica sobre o uso do p nos testes de hipóteses, um prelúdio interessante e divertido para este artigo. Clique aqui para lê-lo.

Após a realização da análise de variância (ANOVA), testes post hoc são necessários para identificar quais dos pares de grupos diferem.

Nessas comparações múltiplas, o desafio é equacionar o binômio representado pelo poder
estatístico, ou seja, 1 - erro beta (erro tipo II, ou "chance de falsos negativos") e o erro tipo I (alfa, ou "chance de falsos positivos").

Para quem gosta de correção conceitual estatística essa é uma simplificação grosseira pois na verdade a hipótese testada é sempre a hipótese nula (a de que não há diferença entre os grupos), a qual é rejeitada ou aceita. Como já lhe disse no começo, vale a pena ler mais sobre erros alfa e beta nos testes de hipótese clicando aqui.

Dependendo da obediência a certos pressupostos, testes post hoc específicos são indicados. Vamos a eles!

Se os valores de N forem iguais nos grupos e variâncias forem similares: usar REGWQ (Ryan, Einot, Gabriel ou Welsch Q (que têm bom poder e bom controle sobre erro tipo I) ou ainda o Tukey (que tem mais poder que Dunn e Scheffé - mais conservadores -, além de ser melhor para números grandes de grupos).

Para valores de N pouco diferentes entre os grupos: use Gabriel's.

Para Ns muito diferentes: Hochberg's GT2 (ressalva: impreciso se variâncias diferentes).

Dúvida sobre similaridade/homogeneidade de variâncias (faça o teste de Levene para verificar isso e tirar a dúvida): usar Games-Howell (mais poderoso e com acurácia mesmo com Ns diferentes). Opções nesse caso: Tamhane's T2 (conservador), Dunnett's T2 e Dunnett's C (controle de erro tipo I rígido).

Para maior garantia de controle de erro tipo I: usar Bonferroni, que tem mais poder que Tukey; porém é melhor para número pequeno de grupos (nível de significância é dividido pelo número de grupos - 5 grupos fazem o nível de significância baixar de 0,05 para 0,01).

O LSD (de least-significance difference e não de dietilamida do ácido lisérgico) é o oposto do Bonferroni: não tenta controlar erro tipo I; equivale a múltiplos testes t e requer que o ANOVA seja significativo.

O Studentized Newman Keuls (SNK) é um teste post-hoc liberal, pouco controle sobre erro.

O Sidak é uma generalização do Dunn.

Curiosamente, pelo menos na minha percepção, tenho reparado nos trabalhos científicos muito uso de Tukey, Dunn, Bonferroni e Scheffé. Penso que poderíamos ter um uso bem maior de Games-Howell, REGWQ, Welsch Q e Gabriel.

Quem sabe com o aumento do nível de conhecimento da galera sobre esses testes isso não ocorre?

Era isso, espero que tenham gostado.

Abs,


CFC

Related Posts Plugin for WordPress, Blogger...