
Numa distribuição de dados, os índices de dispersão desempenham um papel muito importante. Estas medidas complementam as da chamada posição central, caracterizando a variabilidade dos dados.
O índices de dispersão complementam os de tendência central. Eles também são essenciais na distribuição de dados. Isso porque caracterizam sua variabilidade. A sua relevância na formação estatística foi destacada por Wild e Pfannkuch (1999).
A percepção da variabilidade dos dados é um dos componentes básicos do pensamento estatístico, pois nos fornece informações sobre a dispersão dos dados em relação a uma média.
A interpretação da média
O média aritmética é amplamente utilizado na prática, mas muitas vezes pode ser mal interpretado. Isso acontece quando os valores das variáveis são muito escassos. Nestas ocasiões é necessário acompanhar os índices médios de dispersão (2).
Os índices de dispersão possuem três componentes importantes relacionados à variabilidade aleatória (2):
- A percepção de sua onipresença no mundo que nos rodeia.
- A competição pela sua explicação.
- A capacidade de quantificá-la (o que implica compreender e saber aplicar o conceito de dispersão).

Para que são usados os índices de dispersão?
Quando é necessário generalizar os dados de uma amostra de uma população índices de dispersão são muito importantes pois influenciam diretamente no erro com o qual trabalhamos . Quanto mais dispersão coletarmos em uma amostra, maior será o tamanho necessário para trabalhar com o mesmo erro.
Por outro lado, estes índices ajudam-nos a determinar se os nossos dados estão longe do valor central. Eles nos dizem se esse valor central é adequado para representar a população estudada. Isto é muito útil para comparar distribuições e compreender riscos no processo de tomada de decisão (1).
Esses índices são muito úteis para comparar distribuições e compreender os riscos na tomada de decisões. Quanto maior a dispersão, menos representativo é o valor central .
Os mais utilizados são:
- Faixa.
- Desvio estatístico .
- Variância.
- Desvio padrão ou típico.
- Coeficiente de variação.
Funções de índices de dispersão
Faixa
O uso da classificação é para comparação primária. Desta forma, considera apenas as duas observações extremas . É por isso que só é recomendado para amostras pequenas (1). É definido como a diferença entre o último valor da variável e o primeiro (3).

Desvio estatístico
O desvio médio indica onde os dados estariam concentrados se todos estivessem à mesma distância da média aritmética (1). Consideramos o desvio do valor de uma variável como a diferença em valor absoluto entre o valor dessa variável e a média aritmética da série. É, portanto, considerada como a média aritmética dos desvios (3).
Variância
A variância é uma função algébrica de todos os valores apropriado para tarefas estatísticas inferenciais (1). Pode ser definido como desvio quadrático (3).
Desvio padrão ou típico
Para amostras retiradas de uma mesma população o desvio padrão é um dos mais utilizados (1). É a raiz quadrada da variância (3).
Coeficiente de variação
É uma medida usada principalmente para comparar a mudança entre dois conjuntos de dados medidos em unidades diferentes. E. Por exemplo altura e peso corpo de estudantes em uma amostra. É utilizado para determinar em qual distribuição os dados estão mais agrupados e a média é mais representativa (1).

O coeficiente de variação é um índice de dispersão mais representativo que os anteriores por se tratar de um número abstrato. Em outras palavras é independente pelas unidades em que aparecem os valores das variáveis. Em geral este coeficiente de variação é expresso em percentagem (3).
Conclusões sobre índices de dispersão
Os índices de dispersão indicam, por um lado, o grau de variabilidade da amostra. Por outro lado, a representatividade do valor central pois se obtiver um valor baixo significa que os valores estão concentrados em torno desse centro. Isso significaria que há pouca variabilidade nos dados e o centro representa tudo bem.
Pelo contrário, se obtiver um valor elevado significa que os valores não estão concentrados mas sim dispersos. Isto significa que há muita variabilidade e o centro não será muito representativo. Por outro lado, ao fazer inferências, precisaremos de uma amostra maior se quisermos reduzir o erro aumentou precisamente devido ao aumento da variabilidade.