17.1.9 標準偏差

合計や平均の処理も,データ統計処理の一部ですが,平均と一緒によく計算されるのが 標準偏差 (standard deviation) です. この値は,ごく一般的なデータの分布を仮定したときに, "平均値−標準偏差"から"平均値+標準偏差"の範囲内に全データの3分の2強が含まれる値となっています. ですから,標準偏差が小さいデータの集まりは「バラツキが小さい」ことになります.

今扱っているデータはある一人の学生の成績ですから,標準偏差を出す意味はほとんどありませんが, 計算することはできます.表計算では,平均と同じように標準偏差を計算する関数 STDEV が用意されています.操作は平均の場合と同じです.表につけ加えてみましょう.

ABCDEFGHI
1科目英語数学国語社会理科合計平均標準偏差(計算式)
21年生408040538830160.222.5(=STDEV(B2:F2))
32年生654666825231162.214.0(=STDEV(B3:F3))
43年生675465736532464.86.9(=STDEV(B4:F4))
5合計172180171208205936187.2
6平均57.3605769.368.331262.4

これを見ると,数値的には1年生から2年生,そして3年生になるにしたがって標準偏差が小さくなってきています.これは,科目による点数のバラツキが小さくなってきていることを示します. いうなれば,弱い科目がないと同時に得意科目もとくにない,というところでしょうか.

この例でも平均の例でもそうですが,統計処理はその意味をよく考える必要があります. 表計算などの便利な道具ができたので「データ処理」は簡単にできますが,その適切な利用をするための学習も大切です.

advanced

標準偏差は,分散の平方根として定義されます. ところで,分散には2種類のものがあります.

これらは計算式が異なり,異なる値になります (後者の方が大きくなります). 後者の分散は特に不偏分散と呼ばれます. 単に分散と言うと前者の分散を指すのが普通です.

これに伴い,標準偏差にも2種類のものがあることになります. 関数 STDEV で計算されるものは不偏分散の平方根です. 前者の分散の平方根である標準偏差は,関数 STDEVP で計算できます.

なお,前者の分散は関数 VARP で,後者の不偏分散は関数 VAR で計算できます.

何のデータを処理するのかによってこれらの関数を使い分ける必要があります.