|
Quando a curva de distribuição normal é assumida, a média é um valor útil. Mas em estatística paramétrica (onde há assimetria, ou seja, os valores tendem a ser maiores ou menores que a média), a mediana é utilizada para determinar o valor central de um lote de dados. Ao contrário da média, a mediana não está sujeita aos efeitos dos outliers. A mediana é definida como o valor que se situa no centro da distribuição dos dados, ordenados crescente ou decrescentemente. Suponha o conjunto de dados: 10, 14, 15, 11, 9, 13, 12, 16, 45, 13, 18, 20, 16. Para encontrar a mediana, deve-se primeiramente ordenar os dados em ordem crescente ou decrescente: 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 45 A mediana é o valor central, ou seja, o número 14. Quando o número de indivíduos for ímpar, a mediana é definida como 1/2(n+1), e quando for par, (1/2n +1). Note que a média destes valores é 16,3, portanto 2,3 maior que a mediana. Esta disparidade dá-se pelo fato de a média ser afetada pela presença do outlier 45. A mediana não é afetada por este valor. Note que se o valor 45 for trocado por 10.000, a mediana continuará inalterada, enquanto que a média assumirá o valor de 782,08, extremamente afetada por este outlier. A diferença entre a média e a mediana dá uma idéia da assimetria da distribuição dos dados. Quando a mediana e a média assumem valores próximos, tem-se que os dados distribuem-se de maneira aproximadamente simétrica, enquanto que valores muito diferentes, como no último exemplo, denotam acentuada assimetria dos valores, promovida pelo outlier 10.000.
|