Описательная статистика используется для обобщения или описания основных характеристик данных в исследовании. Они предоставляют простые сводки об образце и показателях. С помощью описательной статистики мы можем представить количественные описания в удобной форме. В научном исследовании у нас может быть множество показателей. Описательная статистика помогает нам разумно упростить большие объемы данных.
Существует два основных типа описательной статистики:
Среднее значение: Среднее значение представляет собой среднее всех чисел и иногда называется средним арифметическим. Среднее значение вычисляется путем сложения всех значений и деления на количество чисел. Формула среднего значения:
\( \textrm{Иметь в виду} = \frac{\sum_{i=1}^{n} x_i}{n} \)где \(x_i\) представляет каждое значение в наборе данных, а \(n\) — количество значений.
Медиана. Медиана — это среднее значение в списке чисел. Чтобы найти медиану, вам нужно расположить числа в порядке возрастания и найти среднее число. Если имеется четное количество наблюдений, медиана представляет собой среднее значение двух средних чисел.
Режим: Режим — это значение, которое чаще всего появляется в наборе данных. Набор данных может иметь один режим, несколько режимов или вообще не иметь режима.
Диапазон: диапазон — это разница между самым высоким и самым низким значениями в наборе данных. Это простейшая мера изменчивости.
Дисперсия. Дисперсия измеряет, насколько числа в наборе данных отличаются от среднего значения. Дисперсия рассчитывается путем взятия среднего значения квадратов разностей от среднего значения. Формула дисперсии ( \(\sigma^2\) ):
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Иметь в виду})^2}{n} \)Стандартное отклонение: Стандартное отклонение является мерой величины вариации или дисперсии набора значений. Это квадратный корень из дисперсии, который дает меру, выраженную в тех же единицах, что и данные. Формула стандартного отклонения ( \(\sigma\) ):
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Иметь в виду})^2}{n}} \)Описательная статистика также может включать использование графиков и графиков для визуального обобщения распределения, центральной тенденции и изменчивости набора данных. Общие графические представления включают:
Рассмотрим набор данных, состоящий из результатов тестов 20 учеников в классе:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
Обобщая эти данные, мы можем рассчитать меры центральной тенденции и изменчивости:
Понимание этой базовой описательной статистики позволяет нам получить краткую сводку оценок, определить, насколько широко они различаются, и выявить общую тенденцию успеваемости класса.
Описательная статистика имеет решающее значение для обобщения и понимания данных. Это первый шаг в анализе данных, обеспечивающий основу для более сложного статистического анализа. Определив основные показатели и изменчивость, мы можем получить значимое представление о характере данных и принять обоснованные решения на основе этих знаний.