COMO SABER SE MEUS DADOS SÃO NORMAIS?

Um dos principais desafios enfrentados pelos usuários iniciantes de estatística é saber se os seus dados são NORMAIS, o que de fato é um ponto determinante para os métodos que serão utilizados na análise dos dados. O que acontece é que muitos ignoram essa análise preliminar e acabam utilizando testes inadequados em suas pesquisas.


Então... “O que é distribuição normal?”; “Por que buscamos a distribuição normal? e “Como verificar se os dados seguem uma distribuição normal?”.



- O que é distribuição normal? Uma distribuição de probabilidades é uma função matemática usada para descrever o padrão de variação de uma variável contínua. A função matemática que representa a distribuição normal envolve dois parâmetros (média e variância), a curva que a descreve tem forma de “sino” e sua principal propriedade é a simetria em torno da média. A curva normal é também conhecida como “curva de Gauss” devido à suposição de que Gauss foi o primeiro a fazer uso de suas propriedades para aplicações práticas.


-Por que buscamos a distribuição normal? Os métodos paramétricos baseiam-se na suposição de que os dados observados na amostra são provenientes de uma população com distribuição de forma teórica conhecida. A suposição de que os dados seguem uma distribuição normal é assumida para a maioria dos métodos estatísticos mais utilizados na pesquisa médica, como o teste t de Student, ANOVA, regressão linear e intervalos de confiança. Este fato somado a resultados teóricos fundamentais (teorema do limite central) faz com que a distribuição normal seja a distribuição teórica mais importante em estatística.


-Como verificar se os dados seguem uma distribuição normal? Em qualquer análise de dados, a etapa inicial é fazer uma boa análise descritiva. A normalidade dos dados pode ser analisada descritivamente por meio de histogramas, box-plots, análise da distância entre média e mediana e coeficientes de assimetria e curtose, que medem, respectivamente, o grau de desvio ou afastamento da simetria e do achatamento da distribuição. Além dos métodos descritivos, existem testes de hipóteses que avaliam a normalidade, como por exemplo, os testes de Kolmogorov-Smirnov e de Shapiro-Wilks. No entanto, é importante ressaltar que esses testes são extremamente rigorosos e facilmente rejeitam a hipótese de normalidade. Portanto, devemos ter cautela e não basear a decisão apenas nos níveis descritivos (valores de p) desses testes.


Após a análise preliminar dos dados, o pesquisador escolherá as ferramentas mais indicadas para trabalhar, com base nos modelos paramétricos (dados normais) e não-paramétricos.


Créditos: PAES

2 comentários: