Термін «середній» відноситься до «серединної» або «центральної» точки. Термін відноситься до числа, яке є типовим представленням групи чисел або набору даних. Середні значення можна обчислювати різними способами, тут ми розглядаємо найбільш часто використовувані: середнє значення, медіану та моду. Коли термін «середній» використовується в математичному значенні, він зазвичай відноситься до середнього значення, особливо коли не надається інша інформація. Центральна тенденція є більш доречним словом для позначення середнього значення, медіани та моди. Міра центральної тенденції — це одне значення, яке намагається описати набір даних шляхом визначення центральної позиції в цьому наборі даних.
Середнє значення незгрупованих або необроблених даних отримують додаванням усіх спостережень і діленням загальної суми на кількість спостережень. Якщо x 1 , x 2 , x 3 ,...x n — це n спостережень, то їхнє середнє позначається \(\bar x\) .
\(\bar x = \frac{x_1+x_2+x_3+...+x_n}{n} = \frac{\sum x}{n}\)
Середнє значення = сума спостережень/кількість спостережень
Приклад 1: Учні восьмого класу отримали 3, 5, 7, 10, 4, 6, 8 і 9 балів. Визначте середні бали.
Кількість учнів у класі 8.
Сума набраних балів, \(\sum x = 3 + 5 + 7 + 10 + 4 + 6 + 8 + 9 = 52\)
∴ \(\bar x = \frac{52}{8} = 6.5\)
Приклад 2: якщо середнє 9, 14, x + 3, 12, 2x - 1 і 3 дорівнює 9. Знайдіть значення x.
Кількість спостережень 6
\(\sum x = 9 + 13+ x + 3 + 12 + 2x - 1 + 3\\ \sum x =39 + 3x\)
\(\frac{39 + 3x} {6} = 9\) => 3x = 54 - 39 => 3x = 15
∴ x = 5
Середнє арифметичне табличних даних
Якщо частота n спостережень x 1 , x 2 , x 3 ,...x n дорівнює f 1 , f 2 , f 3 ,...f n відповідно, то їх \(\bar x\) дорівнює
\(\bar x = \frac{f_1x_1+f_2x_2+f_3x_3+...+f_nx_n}{f_1+f_2+f_3+...+f_n} \)
\(\bar x= \frac{\sum fx}{\sum f}\)
Приклад 1: Знайдіть середнє для наступного розподілу
x | 5 | 6 | 7 | 8 | 9 |
f | 4 | 8 | 14 | 11 | 3 |
рішення:
x | f | fx |
5 | 4 | 20 |
6 | 8 | 48 |
7 | 14 | 98 |
8 | 11 | 88 |
9 | 3 | 27 |
\(\sum f = 40\) | \(\sum fx = 281\) |
\(\bar x= \frac{281}{40} = 7.025\)
Режим статистичних даних — це змінна, яка зустрічається найчастіше. Таким чином, режим - це значення тієї змінної, яка має максимальну частоту . Наприклад, у наступних даних 2, 3, 4, 5, 4, 4, 5, 3, 7
Число 4 зустрічається 3 рази (максимум), тому 4 є модою цього ряду.
Необов'язково, що в даних може бути тільки один режим. Давайте подивимося кілька прикладів:
Приклад 1. Знайдіть режим таких даних: 2, 3, 8, 9, 4
Оскільки кожне число зустрічається лише один раз і, отже, воно не має режиму.
Приклад 2: у даних 2, 2, 2, 3, 4, 4, 6, 6, 6, 7- 2 і 6 є обома режимами.
Приклад 3. Знайдіть моду таких даних:
Розмір сорочки (в дюймах) | 32 | 34 | 36 | 40 |
Кількість проданих сорочок | 45 | 35 | 15 | 40 |
У частотному розподілі мода - це значення тієї змінної, яка має найвищу частоту. Спосіб розповсюдження — сорочка 32 дюйми.
Якщо дані спостереження розташовані в порядку, переважно від найменшого до найбільшого, медіана визначається як середнє спостереження, якщо кількість спостережень непарна. Якщо кількість спостережень парна, тоді середнє значення двох середніх спостережень є медіаною. Тому буде однакова кількість спостережень над і під медіаною.
Якщо кількість спостережень дорівнює n, тоді
Медіана = значення \(\frac{(n + 1)}{2 }\) -го спостереження, якщо n непарне
= середнє \(\frac{n}{2}\) -го та \((\frac{n}{2} + 1)\) го спостережень, якщо n парне
Приклад 1: Визначити медіану значень: 15, 6, 7, 14, 8, 10, 12
Розташуйте дані в порядку зростання: 6, 7, 8, 10, 12, 14, 15.
Оскільки n дорівнює 7, то медіана є значенням (7+1)∕2 = 4- е спостереження. 10 — медіана.
Приклад 2: Знайдіть медіану значень: 30, 32, 36, 25, 28, 29, 31, 40
Розташуйте дані в порядку зростання: 25, 28, 29, 30, 31, 32, 36, 40
Оскільки n дорівнює 8, медіана є середнім значенням 4 -го та 5- го спостережень. = (30 + 31) ∕ 2 = 61/2 = 30,5
Який найкращий показник центральної тенденції?
Середнє значення є найбільш часто використовуваним показником центральної тенденції, оскільки воно використовує всі значення в наборі даних для обчислення середнього. Але у випадках, коли ваші дані мають викиди, медіана є кращим варіантом. Викиди – це значення, які є незвичайними порівняно з рештою набору даних через те, що вони особливо малі чи великі за числовим значенням. Режим — це єдина міра, яку можна використовувати для категоріальних даних, які не можна впорядкувати.