Описова статистика використовується для підсумовування або опису основних характеристик даних у дослідженні. Вони надають прості підсумки про вибірку та заходи. За допомогою описової статистики ми можемо представити кількісні описи в керованій формі. У дослідницькому дослідженні ми можемо мати багато заходів. Описова статистика допомагає нам розумно спростити великі обсяги даних.
Існує два основних типи описової статистики:
Середнє: Середнє значення є середнім усіх чисел, яке іноді називають середнім арифметичним. Ви обчислюєте середнє, додаючи всі значення та ділячи їх на кількість чисел. Формула для середнього:
\( \textrm{Середній} = \frac{\sum_{i=1}^{n} x_i}{n} \)де \(x_i\) представляє кожне значення в наборі даних, а \(n\) — кількість значень.
Медіана: Медіана є середнім значенням у списку чисел. Щоб знайти медіану, потрібно розташувати числа в порядку зростання і знайти середнє число. Якщо є парна кількість спостережень, медіаною є середнє значення двох середніх чисел.
Режим: режим – це значення, яке найчастіше з’являється в наборі даних. Набір даних може мати один режим, більше одного режиму або взагалі не мати режиму.
Діапазон: діапазон – це різниця між найвищим і найнижчим значеннями в наборі даних. Це найпростіша міра мінливості.
Дисперсія: дисперсія вимірює, наскільки числа в наборі даних відрізняються від середнього. Дисперсію обчислюють, беручи середнє значення квадратів різниць із середнього. Формула дисперсії ( \(\sigma^2\) ) така:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Середній})^2}{n} \)Стандартне відхилення: стандартне відхилення є мірою величини варіації або дисперсії набору значень. Це квадратний корінь із дисперсії, що дає міру в тих самих одиницях, що й дані. Формула стандартного відхилення ( \(\sigma\) ) така:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Середній})^2}{n}} \)Описова статистика також може передбачати використання графіків і графіків для візуального узагальнення розподілу, центральної тенденції та мінливості набору даних. Загальні графічні представлення включають:
Розглянемо набір даних, що складається з тестових результатів 20 учнів у класі:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
Щоб узагальнити ці дані, ми можемо розрахувати показники центральної тенденції та мінливості:
Розуміння цих основних описових статистичних даних дозволяє нам отримати швидкий підсумок балів, визначити, наскільки вони різняться, і визначити загальну тенденцію успішності класу.
Описова статистика має вирішальне значення для узагальнення та розуміння даних. Вони є першим кроком в аналізі даних, забезпечуючи основу для більш складного статистичного аналізу. Визначивши основні показники та мінливість, ми можемо отримати значуще розуміння природи даних і приймати обґрунтовані рішення на основі цих даних.