Google Play badge

平均


「平均」という用語は、「中間」または「中心」点を指します。この用語は、数値またはデータ セットのグループの典型的な表現である数値を指します。平均はさまざまな方法で計算できます。ここでは、最も一般的に使用される平均、中央値、最頻値について説明します。 「平均」という用語が数学的な意味で使用される場合、特に他の情報が与えられていない場合、通常は平均を指します。中心傾向は、平均値、中央値、最頻値を表すより適切な言葉です。中心傾向の尺度は、データ セット内の中心位置を特定することによって、データ セットを説明しようとする単一の値です。

平均

グループ化されていないデータまたは生データの平均は、すべての観測値を加算し、その合計を観測数で割ることによって得られます。 x 1 、 x 2 、 x 3 、... x n がn 個の観測値である場合、それらの平均は\(\bar x\)で示されます。
\(\bar x = \frac{x_1+x_2+x_3+...+x_n}{n} = \frac{\sum x}{n}\)

平均 = 観測値の合計/観測値の数

例 1:クラス 8 の生徒の得点は 3、5、7、10、4、6、8、9 です。平均点を求めます。
クラスの生徒数は8人です。
得点の合計\(\sum x = 3 + 5 + 7 + 10 + 4 + 6 + 8 + 9 = 52\)
\(\bar x = \frac{52}{8} = 6.5\)

例 2: 9、14、x + 3、12、2x - 1、および 3 の平均が 9 の場合。x の値を求めます。
観測数は6
\(\sum x = 9 + 13+ x + 3 + 12 + 2x - 1 + 3\\ \sum x =39 + 3x\)

\(\frac{39 + 3x} {6} = 9\) => 3x = 54 - 39 => 3x = 15
∴×=5


集計データの算術平均

n 個の観測値 x 1 、x 2 、x 3 、...x nの度数がそれぞれ f 1 、f 2 、f 3 、...f nである場合、それらの\(\bar x\)

\(\bar x = \frac{f_1x_1+f_2x_2+f_3x_3+...+f_nx_n}{f_1+f_2+f_3+...+f_n} \)

\(\bar x= \frac{\sum fx}{\sum f}\)

例 1:次の分布の平均を求めます

バツ5 6 7 8 9
4 8 14 11 3

解決:

バツFX
5 4 20
6 8 48
7 14 98
8 11 88
9 3 27
\(\sum f = 40\) \(\sum fx = 281\)

\(\bar x= \frac{281}{40} = 7.025\)


モード

統計データのモードは、最も頻繁に発生する変量です。したがって、モードは、最大周波数を持つ変数の値です。たとえば、次のデータでは 2, 3, 4, 5, 4, 4, 5, 3, 7
数字の4は3回(最大)発生するので、4がこのシリーズのモードです。
データ内にモードが 1 つしかない必要はありません。いくつかの例を見てみましょう:
例 1:次のデータの最頻値を求める: 2、3、8、9、4
各数値は 1 回しか発生しないため、モードはありません。

例 2:データ 2、2、2、3、4、4、6、6、6、7-2 および 6 は両方のモードです。

例 3:次のデータの最頻値を見つけます。

シャツサイズ(インチ) 32 34 36 40
販売枚数45 35 15 40

頻度分布では、最頻値は頻度が最も高い変量の値です。この配信のモードは 32" シャツです。


中央値

与えられた観測値が、できれば小さいものから大きいものの順に並べられている場合、観測値の数が奇数の場合、中央値は中央の観測値として定義されます。観測値の数が偶数の場合、中央の 2 つの観測値の平均が中央値になります。したがって、中央値の上下に同数の観測値があります。

観測数が n の場合
中央値 = \(\frac{(n + 1)}{2 }\)番目の観測値 (n が奇数の場合)
= n が偶数の場合\(\frac{n}{2}\)番目\((\frac{n}{2} + 1)\)番目の観測値の平均

例 1:値の中央値を決定します: 15、6、7、14、8、10、12
データを昇順に並べ替えます: 6、7、8、10、12、14、15。
n は 7 なので、中央値は (7+1)/2 = 4番目の観測値です。 10が中央値です。

例 2:値の中央値を見つける: 30、32、36、25、28、29、31、40
データを昇順に並べ替える: 25、28、29、30、31、32、36、40
n が 8 なので、中央値は 4番目と 5番目の観測値の平均です。 = (30 + 31) ∕ 2 = 61/2 = 30.5


中心傾向の最良の尺度は何ですか?
平均は、データ セット内のすべての値を使用して平均を計算するため、最も一般的に使用される中心傾向の尺度です。ただし、データに外れ値がある場合は、中央値の方が適しています。外れ値とは、数値が特に小さいまたは大きいことによって、残りのデータ セットと比較して異常な値です。モードは、順序付けできないカテゴリ データに使用できる唯一のメジャーです。

Download Primer to continue