Google Play badge

описательная статистика


Введение в описательную статистику

Описательная статистика используется для обобщения или описания основных характеристик данных в исследовании. Они предоставляют простые сводки об образце и показателях. С помощью описательной статистики мы можем представить количественные описания в удобной форме. В научном исследовании у нас может быть множество показателей. Описательная статистика помогает нам разумно упростить большие объемы данных.

Типы описательной статистики

Существует два основных типа описательной статистики:

Меры центральной тенденции

Среднее значение: Среднее значение представляет собой среднее всех чисел и иногда называется средним арифметическим. Среднее значение вычисляется путем сложения всех значений и деления на количество чисел. Формула среднего значения:

\( \textrm{Иметь в виду} = \frac{\sum_{i=1}^{n} x_i}{n} \)

где \(x_i\) представляет каждое значение в наборе данных, а \(n\) — количество значений.

Медиана. Медиана — это среднее значение в списке чисел. Чтобы найти медиану, вам нужно расположить числа в порядке возрастания и найти среднее число. Если имеется четное количество наблюдений, медиана представляет собой среднее значение двух средних чисел.

Режим: Режим — это значение, которое чаще всего появляется в наборе данных. Набор данных может иметь один режим, несколько режимов или вообще не иметь режима.

Меры изменчивости

Диапазон: диапазон — это разница между самым высоким и самым низким значениями в наборе данных. Это простейшая мера изменчивости.

Дисперсия. Дисперсия измеряет, насколько числа в наборе данных отличаются от среднего значения. Дисперсия рассчитывается путем взятия среднего значения квадратов разностей от среднего значения. Формула дисперсии ( \(\sigma^2\) ):

\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Иметь в виду})^2}{n} \)

Стандартное отклонение: Стандартное отклонение является мерой величины вариации или дисперсии набора значений. Это квадратный корень из дисперсии, который дает меру, выраженную в тех же единицах, что и данные. Формула стандартного отклонения ( \(\sigma\) ):

\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Иметь в виду})^2}{n}} \)
Визуальное представление данных

Описательная статистика также может включать использование графиков и графиков для визуального обобщения распределения, центральной тенденции и изменчивости набора данных. Общие графические представления включают:

Пример: понимание данных с помощью описательной статистики

Рассмотрим набор данных, состоящий из результатов тестов 20 учеников в классе:

85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82

Обобщая эти данные, мы можем рассчитать меры центральной тенденции и изменчивости:

Понимание этой базовой описательной статистики позволяет нам получить краткую сводку оценок, определить, насколько широко они различаются, и выявить общую тенденцию успеваемости класса.

Заключение

Описательная статистика имеет решающее значение для обобщения и понимания данных. Это первый шаг в анализе данных, обеспечивающий основу для более сложного статистического анализа. Определив основные показатели и изменчивость, мы можем получить значимое представление о характере данных и принять обоснованные решения на основе этих знаний.

Download Primer to continue