記述統計は、調査データの基本的な特徴を要約または説明するために使用されます。サンプルと測定基準に関する簡単な概要を提供します。記述統計を使用すると、扱いやすい形式で定量的な説明を提示できます。調査研究では、測定基準が多数ある場合があります。記述統計は、大量のデータを合理的な方法で簡素化するのに役立ちます。
記述統計には主に 2 つの種類があります。
平均:平均はすべての数値の平均であり、算術平均と呼ばれることもあります。平均は、すべての値を合計し、数値の数で割ることで計算されます。平均の計算式は次のとおりです。
\( \textrm{平均} = \frac{\sum_{i=1}^{n} x_i}{n} \)ここで、 \(x_i\)データセット内の各値を表し、 \(n\)値の数です。
中央値:中央値は、数値リストの中央の値です。中央値を見つけるには、数値を昇順に並べ、中央の数値を見つける必要があります。観測値が偶数の場合、中央値は中央の 2 つの数値の平均です。
モード:モードは、データ セット内で最も頻繁に出現する値です。データセットには、1 つのモード、複数のモード、またはモードがまったく存在しない場合があります。
範囲:範囲は、データセット内の最高値と最低値の差です。これは変動性を測る最も単純な尺度です。
分散:分散は、データセット内の数値が平均からどれだけ異なるかを測定します。分散は、平均からの差の二乗の平均を取ることによって計算されます。分散 ( \(\sigma^2\) ) の式は次のとおりです。
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{平均})^2}{n} \)標準偏差:標準偏差は、一連の値の変化または分散の量を測る尺度です。これは分散の平方根であり、データと同じ単位の尺度となります。標準偏差 ( \(\sigma\) ) の式は次のとおりです。
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{平均})^2}{n}} \)記述統計では、グラフやプロットを使用して、データセットの分布、中心傾向、変動性を視覚的に要約することもできます。一般的なグラフ表現には次のものがあります。
クラスの生徒 20 人のテストのスコアで構成されるデータセットを考えてみましょう。
85、82、88、95、70、90、78、84、80、96、72、88、92、94、94、90、76、97、84、82
このデータを要約すると、中心傾向と変動性の尺度を計算できます。
これらの基本的な記述統計を理解することで、スコアの概要を素早く把握し、スコアがどの程度変動するかを特定し、クラスのパフォーマンスの全体的な傾向を見つけることができます。
記述統計は、データを要約して理解するために不可欠です。これはデータ分析の最初のステップであり、より複雑な統計分析の基礎となります。中心となる指標と変動性を特定することで、データの性質に関する有意義な洞察が得られ、その洞察に基づいて情報に基づいた意思決定を行うことができます。