Le statistiche descrittive vengono utilizzate per riassumere o descrivere le caratteristiche di base dei dati in uno studio. Forniscono semplici riepiloghi sul campione e sulle misure. Attraverso la statistica descrittiva, possiamo presentare descrizioni quantitative in una forma gestibile. In uno studio di ricerca, potremmo avere molte misure. Le statistiche descrittive ci aiutano a semplificare grandi quantità di dati in modo sensato.
Esistono due tipi principali di statistiche descrittive:
Media: la media è la media di tutti i numeri ed è talvolta chiamata media aritmetica. Si calcola la media sommando tutti i valori e dividendo per il conteggio dei numeri. La formula per la media è:
\( \textrm{Significare} = \frac{\sum_{i=1}^{n} x_i}{n} \)dove \(x_i\) rappresenta ciascun valore nel set di dati e \(n\) è il numero di valori.
Mediana: la mediana è il valore medio in un elenco di numeri. Per trovare la mediana, devi disporre i numeri in ordine crescente e trovare il numero centrale. Se il numero di osservazioni è pari, la mediana è la media dei due numeri centrali.
Modalità: la modalità è il valore che appare più frequentemente in un set di dati. Un set di dati può avere una modalità, più di una modalità o nessuna modalità.
Intervallo: l'intervallo è la differenza tra i valori massimo e minimo in un set di dati. È la misura più semplice della variabilità.
Varianza: la varianza misura quanto i numeri in un set di dati differiscono dalla media. La varianza viene calcolata prendendo la media delle differenze quadrate dalla media. La formula per la varianza ( \(\sigma^2\) ) è:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Significare})^2}{n} \)Deviazione standard: la deviazione standard è una misura della quantità di variazione o dispersione di un insieme di valori. È la radice quadrata della varianza, quindi fornisce una misura che è nelle stesse unità dei dati. La formula per la deviazione standard ( \(\sigma\) ) è:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Significare})^2}{n}} \)La statistica descrittiva può anche comportare l’uso di grafici e grafici per riassumere visivamente la distribuzione, la tendenza centrale e la variabilità di un set di dati. Le rappresentazioni grafiche comuni includono:
Consideriamo un set di dati costituito dai punteggi dei test di 20 studenti in una classe:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
Per riassumere questi dati, possiamo calcolare le misure di tendenza centrale e variabilità:
Comprendere queste statistiche descrittive di base ci consente di ottenere un rapido riepilogo dei punteggi, identificare quanto variano e trovare la tendenza generale del rendimento della classe.
Le statistiche descrittive sono cruciali per riassumere e comprendere i dati. Costituiscono il primo passo nell'analisi dei dati, fornendo una base per analisi statistiche più complesse. Identificando le misure centrali e la variabilità, possiamo ottenere informazioni significative sulla natura dei dati e prendere decisioni informate sulla base di tali informazioni.