Google Play badge

описова статистика


Введення в описову статистику

Описова статистика використовується для підсумовування або опису основних характеристик даних у дослідженні. Вони надають прості підсумки про вибірку та заходи. За допомогою описової статистики ми можемо представити кількісні описи в керованій формі. У дослідницькому дослідженні ми можемо мати багато заходів. Описова статистика допомагає нам розумно спростити великі обсяги даних.

Типи описової статистики

Існує два основних типи описової статистики:

Міри центральної тенденції

Середнє: Середнє значення є середнім усіх чисел, яке іноді називають середнім арифметичним. Ви обчислюєте середнє, додаючи всі значення та ділячи їх на кількість чисел. Формула для середнього:

\( \textrm{Середній} = \frac{\sum_{i=1}^{n} x_i}{n} \)

де \(x_i\) представляє кожне значення в наборі даних, а \(n\) — кількість значень.

Медіана: Медіана є середнім значенням у списку чисел. Щоб знайти медіану, потрібно розташувати числа в порядку зростання і знайти середнє число. Якщо є парна кількість спостережень, медіаною є середнє значення двох середніх чисел.

Режим: режим – це значення, яке найчастіше з’являється в наборі даних. Набір даних може мати один режим, більше одного режиму або взагалі не мати режиму.

Міри мінливості

Діапазон: діапазон – це різниця між найвищим і найнижчим значеннями в наборі даних. Це найпростіша міра мінливості.

Дисперсія: дисперсія вимірює, наскільки числа в наборі даних відрізняються від середнього. Дисперсію обчислюють, беручи середнє значення квадратів різниць із середнього. Формула дисперсії ( \(\sigma^2\) ) така:

\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Середній})^2}{n} \)

Стандартне відхилення: стандартне відхилення є мірою величини варіації або дисперсії набору значень. Це квадратний корінь із дисперсії, що дає міру в тих самих одиницях, що й дані. Формула стандартного відхилення ( \(\sigma\) ) така:

\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Середній})^2}{n}} \)
Візуальне представлення даних

Описова статистика також може передбачати використання графіків і графіків для візуального узагальнення розподілу, центральної тенденції та мінливості набору даних. Загальні графічні представлення включають:

Приклад: розуміння даних за допомогою описової статистики

Розглянемо набір даних, що складається з тестових результатів 20 учнів у класі:

85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82

Щоб узагальнити ці дані, ми можемо розрахувати показники центральної тенденції та мінливості:

Розуміння цих основних описових статистичних даних дозволяє нам отримати швидкий підсумок балів, визначити, наскільки вони різняться, і визначити загальну тенденцію успішності класу.

Висновок

Описова статистика має вирішальне значення для узагальнення та розуміння даних. Вони є першим кроком в аналізі даних, забезпечуючи основу для більш складного статистичного аналізу. Визначивши основні показники та мінливість, ми можемо отримати значуще розуміння природи даних і приймати обґрунтовані рішення на основі цих даних.

Download Primer to continue