Google Play badge

статистика


Введення в статистику

Статистика — це розділ математики, який займається збором, аналізом, інтерпретацією та представленням даних. Це потужний інструмент для розуміння світу навколо нас, який допомагає приймати рішення на основі даних, а не припущень.

Види статистики

Є дві основні галузі статистики: описова статистика та інференційна статистика .

Описова статистика

Показники центральної тенденції використовуються для узагальнення набору даних шляхом визначення центральної позиції в цьому наборі даних. Найпоширенішими показниками є середнє значення, медіана та мода.

Міри варіації описують, як дані розподіляються або поширюються. Найпоширенішими показниками є діапазон, дисперсія та стандартне відхилення.

Інференційна статистика

Інференційна статистика робить висновки на основі даних, які піддаються випадковій варіації. Це включає помилки спостережень, варіації вибірки тощо. Йдеться про те, щоб робити висновки щодо сукупності на основі вибірки.

Перевірка гіпотези - це метод статистичного висновку. Він використовується, щоб вирішити, чи підтверджують дані конкретну гіпотезу чи ні. Це передбачає порівняння p-значення або спостережуваної значущості із заздалегідь визначеним рівнем значущості, часто 0,05.

Довірчі інтервали – це діапазон значень, отриманих із вибіркових даних, які, як вважається, містять значення невідомого параметра генеральної сукупності на певному рівні довіри. Наприклад, 95% довірчий інтервал для середнього означатиме, що якщо ту саму сукупність буде відібрано кілька разів і обчислено інтервали, то приблизно 95% цих інтервалів міститимуть справжнє середнє значення сукупності.

Регресійний аналіз — це статистичний метод, який досліджує зв’язок між двома чи більше змінними. Наприклад, лінійну регресію можна використовувати для прогнозування значення однієї змінної на основі значення іншої. Рівняння для простої лінії лінійної регресії має вигляд \(y = \beta_0 + \beta_1x\) , де \(y\) — залежна змінна, \(x\) — незалежна змінна, а \(\beta_0\) і \(\beta_1\) — це коефіцієнти, які представляють точку перетину y та нахил лінії відповідно.

Методи збору даних

Збір даних є важливим кроком у процесі статистичного аналізу. Дані повинні бути зібрані належним чином, щоб гарантувати дійсність і надійність результатів. Загальні методи включають опитування, експерименти та спостереження.

Імовірність у статистиці

Імовірність відіграє основоположну роль у статистиці, оскільки дозволяє кількісно визначити невизначеність. Ймовірність можна розглядати як імовірність події, і вона коливається від 0 (неможливо) до 1 (певно).

Основна формула ймовірності : P(A) = кількість сприятливих результатів ∕ загальна кількість можливих результатів

Де:

Одним із важливих правил є правило додавання , яке стверджує, що ймовірність виникнення будь-якої однієї з двох або більше взаємовиключних подій дорівнює сумі їхніх окремих ймовірностей. Формула така: \(P(A \textrm{ або } B) = P(A) + P(B)\) , припускаючи, що \(A\) і \(B\) взаємовиключні.

Іншим важливим поняттям є правило множення , яке використовується під час обчислення ймовірності двох або більше незалежних подій, що відбуваються разом. Формула така: \(P(A \textrm{ і } B) = P(A) \times P(B)\) .

Розуміння цих концепцій та інструментів статистики може надати людям можливість приймати обґрунтовані рішення на основі даних, а не припущень. Він закладає основу для аналізу складних наборів даних, вносячи значний внесок у прогрес у різних галузях, таких як економіка, наука та охорона здоров’я.

Download Primer to continue