As estatísticas descritivas são usadas para resumir ou descrever as características básicas dos dados de um estudo. Eles fornecem resumos simples sobre a amostra e as medidas. Através da estatística descritiva, podemos apresentar descrições quantitativas de forma gerenciável. Em um estudo de pesquisa, podemos ter muitas medidas. As estatísticas descritivas ajudam-nos a simplificar grandes quantidades de dados de uma forma sensata.
Existem dois tipos principais de estatísticas descritivas:
Média: A média é a média de todos os números e às vezes é chamada de média aritmética. Você calcula a média somando todos os valores e dividindo pela contagem de números. A fórmula para a média é:
\( \textrm{Significar} = \frac{\sum_{i=1}^{n} x_i}{n} \)onde \(x_i\) representa cada valor no conjunto de dados e \(n\) é o número de valores.
Mediana: A mediana é o valor central em uma lista de números. Para encontrar a mediana, você precisa organizar seus números em ordem crescente e encontrar o número do meio. Se houver um número par de observações, a mediana será a média dos dois números do meio.
Moda: A moda é o valor que aparece com mais frequência em um conjunto de dados. Um conjunto de dados pode ter um modo, mais de um modo ou nenhum modo.
Intervalo: O intervalo é a diferença entre os valores mais altos e mais baixos em um conjunto de dados. É a medida mais simples de variabilidade.
Variância: a variância mede o quanto os números em um conjunto de dados diferem da média. A variância é calculada tomando a média das diferenças quadradas da Média. A fórmula para variância ( \(\sigma^2\) ) é:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Significar})^2}{n} \)Desvio Padrão: O desvio padrão é uma medida da quantidade de variação ou dispersão de um conjunto de valores. É a raiz quadrada da variância, fornecendo assim uma medida que está nas mesmas unidades dos dados. A fórmula para o desvio padrão ( \(\sigma\) ) é:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Significar})^2}{n}} \)A estatística descritiva também pode envolver o uso de gráficos e plotagens para resumir visualmente a distribuição, tendência central e variabilidade de um conjunto de dados. As representações gráficas comuns incluem:
Considere um conjunto de dados que consiste nas notas dos testes de 20 alunos em uma turma:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
Para resumir esses dados, podemos calcular as medidas de tendência central e variabilidade:
A compreensão dessas estatísticas descritivas básicas nos permite obter um rápido resumo das pontuações, identificar o quanto elas variam e encontrar a tendência geral do desempenho da turma.
As estatísticas descritivas são cruciais para resumir e compreender os dados. Eles são o primeiro passo na análise de dados, fornecendo uma base para análises estatísticas mais complexas. Ao identificar as medidas centrais e a variabilidade, podemos obter insights significativos sobre a natureza dos dados e tomar decisões informadas com base nesses insights.