Termin „średnia” odnosi się do punktu „środkowego” lub „centralnego”. Termin ten odnosi się do liczby, która jest typową reprezentacją grupy liczb lub zbioru danych. Średnie można obliczyć na różne sposoby, tutaj omawiamy najczęściej stosowane: średnią, medianę i modę. Kiedy termin „średnia” jest używany w znaczeniu matematycznym, zwykle odnosi się do średniej, zwłaszcza gdy nie podano żadnych innych informacji. Tendencja centralna jest bardziej odpowiednim słowem odnoszącym się do średniej, mediany i modu. Miarą tendencji centralnej jest pojedyncza wartość, która próbuje opisać zestaw danych poprzez określenie centralnej pozycji w tym zestawie danych.
Średnią danych niezgrupowanych lub surowych uzyskuje się przez dodanie wszystkich obserwacji i podzielenie sumy przez liczbę obserwacji. Jeśli x 1 , x 2 , x 3 ,...x n będzie n obserwacji, to ich średnią oznaczamy \(\bar x\) .
\(\bar x = \frac{x_1+x_2+x_3+...+x_n}{n} = \frac{\sum x}{n}\)
Średnia = Suma obserwacji/Liczba obserwacji
Przykład 1: Oceny uzyskane przez uczniów klasy ósmej to 3, 5, 7, 10, 4, 6, 8 i 9. Określ średnie oceny.
Liczba uczniów w klasie to 8.
Suma zdobytych ocen , \(\sum x = 3 + 5 + 7 + 10 + 4 + 6 + 8 + 9 = 52\)
∴ \(\bar x = \frac{52}{8} = 6.5\)
Przykład 2: Jeśli średnia z 9, 14, x + 3, 12, 2x - 1 i 3 wynosi 9. Znajdź wartość x.
Liczba obserwacji to 6
\(\sum x = 9 + 13+ x + 3 + 12 + 2x - 1 + 3\\ \sum x =39 + 3x\)
\(\frac{39 + 3x} {6} = 9\) => 3x = 54 - 39 => 3x = 15
∴ x = 5
Średnia arytmetyczna danych tabelarycznych
Jeśli częstość n obserwacji x 1 , x 2 , x 3 ,...x n wynosi odpowiednio f 1 , f 2 , f 3 ,...f n , to ich \(\bar x\) wynosi
\(\bar x = \frac{f_1x_1+f_2x_2+f_3x_3+...+f_nx_n}{f_1+f_2+f_3+...+f_n} \)
\(\bar x= \frac{\sum fx}{\sum f}\)
Przykład 1: Znajdź średnią dla następującego rozkładu
X | 5 | 6 | 7 | 8 | 9 |
F | 4 | 8 | 14 | 11 | 3 |
Rozwiązanie:
X | F | fx |
5 | 4 | 20 |
6 | 8 | 48 |
7 | 14 | 98 |
8 | 11 | 88 |
9 | 3 | 27 |
\(\sum f = 40\) | \(\sum fx = 281\) |
\(\bar x= \frac{281}{40} = 7.025\)
Tryb danych statystycznych jest zmienną, która występuje najczęściej. Zatem tryb jest wartością tej zmiennej, która ma maksymalną częstotliwość . Na przykład w kolejnych danych 2, 3, 4, 5, 4, 4, 5, 3, 7
Numer 4 występuje 3 razy (maksymalnie), więc 4 to tryb tej serii.
Nie jest konieczne, aby w danych istniał tylko jeden tryb. Zobaczmy kilka przykładów:
Przykład 1: Znajdź tryb następujących danych: 2, 3, 8, 9, 4
Ponieważ każda liczba występuje tylko raz i dlatego nie ma trybu.
Przykład 2: W danych 2, 2, 2, 3, 4, 4, 6, 6, 6, 7- 2 i 6 to oba tryby.
Przykład 3: Znajdź tryb następujących danych:
Rozmiar koszuli (w calach) | 32 | 34 | 36 | 40 |
Ilość sprzedanych koszulek | 45 | 35 | 15 | 40 |
W rozkładzie częstotliwości modą jest wartość tej zmiennej, która ma najwyższą częstotliwość. Trybem tej dystrybucji jest koszula 32".
Jeśli dane obserwacje są ułożone w kolejności, najlepiej od najmniejszej do największej, medianę określa się jako środkową obserwację, jeśli liczba obserwacji jest nieparzysta. Jeśli liczba obserwacji jest parzysta, to średnia z dwóch środkowych obserwacji jest medianą. Dlatego będzie taka sama liczba obserwacji powyżej i poniżej mediany.
Jeśli liczba obserwacji wynosi n, to
Mediana = wartość \(\frac{(n + 1)}{2 }\) tej obserwacji, jeśli n jest nieparzyste
= średnia z \(\frac{n}{2}\) th i \((\frac{n}{2} + 1)\) th obserwacji, jeśli n jest parzyste
Przykład 1: Wyznacz medianę wartości: 15, 6, 7, 14, 8, 10, 12
Uporządkuj dane w porządku rosnącym: 6, 7, 8, 10, 12, 14, 15.
Skoro n wynosi 7, to mediana jest wartością (7+1)∕2 = 4. obserwacja . 10 to mediana.
Przykład 2: Znajdź medianę wartości: 30, 32, 36, 25, 28, 29, 31, 40
Uporządkuj dane w porządku rosnącym: 25, 28, 29, 30, 31, 32, 36, 40
Ponieważ n wynosi 8, mediana jest średnią czwartej i piątej obserwacji. = (30 + 31) ∕ 2 = 61/2 = 30,5
Jaka jest najlepsza miara tendencji centralnej?
Średnia jest najczęściej używaną miarą tendencji centralnej, ponieważ wykorzystuje wszystkie wartości w zbiorze danych do obliczenia średniej. Ale w przypadkach, gdy dane mają wartości odstające, mediana jest lepszą opcją. Wartości odstające to wartości, które są niezwykłe w porównaniu z resztą zestawu danych, ponieważ są szczególnie małe lub duże pod względem wartości liczbowej. Tryb jest jedyną miarą, której można użyć do danych kategorycznych, których nie można uporządkować.