前回、分散は単位が揃わない欠点があると述べましたが、それを改善したのが下記の(5)です。
(5)平均との差の2乗の合計をデータの総数で割った値(分散)の正の平方根(=標準偏差)
標準偏差を表す文字には、\(\sigma\)(シグマ)または \(s\) が使われます。\(\sigma\) で表すときは母集団の標準偏差を、
\(s\) で表すときは標本の標準偏差を表すことが多いです。母集団の例としては「日本人1億2577万人全
体」等が、標本の例としては「英検2級を受験した3000人の日本人」等があります。ここでは \(s\) を用
いて数式で表すと \(s=\sqrt{\displaystyle\frac{1}{n}\displaystyle\sum_{k=1}^{n}(x_k-\overline{x})^2}\) となります。
ここまで読んで「(4)の分散で充分では?」「わざわざ\(\sqrt{ }\)を使わなくても…」「単位を揃える意味
は?」と思った方もいらっしゃるでしょう。確かに、分散だけでも「データのバラつきの大きさ」は分
かります。しかし、\(\sqrt{ }\)を使って標準偏差にすると非常に便利なことがあります。「68%95%ルー
ル」と偏差値計算への適用です。
この続きは次回に… 文責:金藤
コメントはありません。