La mediana è un tipo di media che rappresenta il valore medio in un set di dati quando è ordinato in ordine crescente o decrescente. A differenza della media, che richiede la somma di tutti i valori, la mediana divide un set di dati in due metà uguali. Nel contesto della matematica e della statistica, comprendere la mediana è fondamentale per l'analisi dei dati, poiché aiuta a riassumere un insieme di dati in base alla sua tendenza centrale.
In matematica il concetto di mediana è semplice. Se il numero di osservazioni in un set di dati è dispari, la mediana è il numero centrale. Tuttavia, se il numero di osservazioni è pari, la mediana è la media dei due numeri centrali. La rappresentazione matematica per trovare la mediana varia a seconda che il set di dati abbia un numero pari o dispari di osservazioni.
Per un numero dispari di osservazioni: se un set di dati ha \(n\) valori ordinati in ordine crescente e \(n\) è dispari, allora la mediana, \(M\) , è il valore nella posizione \(\frac{n+1}{2}\) .
Per un numero pari di osservazioni: Se \(n\) è pari, allora la mediana, \(M\) , è la media dei valori nelle posizioni \(\frac{n}{2}\) e \(\frac{n}{2} + 1\) .
Nelle statistiche, la mediana è ampiamente utilizzata come misura della tendenza centrale, soprattutto quando i dati sono distorti o contengono valori anomali, che possono distorcere la media. La mediana fornisce una rappresentazione più accurata del centro del set di dati, rendendola preziosa nelle attività di analisi dei dati nel mondo reale.
Una delle caratteristiche principali della mediana è la sua robustezza rispetto ai valori anomali, che sono valori estremi che differiscono significativamente da altre osservazioni. Poiché la mediana riguarda solo il valore medio, non è influenzata da valori anomali. Questa caratteristica rende la mediana particolarmente utile in campi come quello immobiliare, finanziario ed economico, dove alcuni valori estremi potrebbero distorcere la media, fornendo così informazioni fuorvianti.
Esempio 1: considera l'insieme di numeri: 2, 3, 4, 5, 6. Poiché ci sono cinque numeri, una quantità dispari, la mediana è semplicemente il numero centrale, che in questo caso è 4.
Esempio 2: Per il set di dati: 1, 2, 3, 4, 5, 6, con un numero pari di osservazioni, la mediana sarebbe la media del terzo e del quarto numero: \(\frac{3 + 4}{2} = 3.5\) .
Manipolazione di un set di dati: per comprendere l'effetto dei valori anomali sulla mediana, considera un set di dati: 100, 200, 300, 400, 500. La mediana è 300. Se aggiungiamo due valori estremi, come 10.000 e 20.000, al set di dati, rendendolo: 100, 200, 300, 400, 500, 10.000, 20.000, la mediana si sposta solo alla media di 300 e 400, che è 350, dimostrando la robustezza della mediana a fronte dei valori anomali.
Mediana vs media: per comprendere la differenza tra mediana e media, considerare un set di dati sui redditi familiari in una piccola comunità: 30.000, 35.000, 40.000, 45.000 e un valore anomalo di 1.000.000. Il reddito medio sarebbe significativamente più alto a causa del valore anomalo, suggerendo uno standard di vita più elevato di quello accurato per la maggior parte della comunità. Tuttavia, il reddito mediano rappresenterebbe accuratamente la tendenza centrale del reddito della comunità, non influenzato dal valore anomalo.
La mediana offre un metodo semplice ma affidabile per comprendere la distribuzione e la tendenza centrale di un set di dati. Concentrandosi sul valore medio, anziché sulla somma di tutti i valori, la mediana fornisce un riflesso fedele del punto centrale sia nei set di dati di dimensioni pari che dispari. La sua immunità all’influenza dei valori anomali la rende una misura preferita in vari campi della matematica e della statistica, rafforzando l’importanza della mediana nell’analisi e nell’interpretazione dei dati.