KYOWA KIRIN

このサイトは、日本国内の医療関係者(医師、薬剤師、看護師、技師・技士等)を対象に、弊社が販売する医療用医薬品を適正にご使用いただくための情報を提供しています。国外の医療関係者、一般の方に対する情報提供を目的としたものではありませんのでご了承ください。

第3回 ばらつきのものさし ―分散と標準偏差―

  

クイッククイズ

ばらつきの重要性

計子先生

前回は、どんな種類のものさしがあるかを説明したけど、今回はさらに踏み込んで、数値化して評価する尺度(間隔尺度、比尺度)を扱う際に必ず出てくる「平均値」「標準偏差」について紹介するわね。

新太郎くん

「平均」はわかりますが、「標準偏差」だなんて急にとっつきにくくなります...

計子先生

そうね。だいたいこのあたりで統計・確率にアレルギーを示す人が多いわね。
あらためてゼロから説明するわ。
まずはクイズです。ある学力テストのAさんとBさんの結果から、二人の学力を評価してみましょう。Aさんの結果は90点、Bさんは60点でした。さて、どちらがよくできたでしょう?

新太郎くん

それはAさんじゃないですか。明らかに点数が上ですから。

計子先生

でも、もしAさんは200点満点中90点、Bさんは100点満点中60点だとしたらどう?

新太郎くん

え?AさんとBさんの受けたテストは違うテストなんですか?
(それを先に言ってくださいよ...)

計子先生

同じテストとはひと言も言ってないわ。違うテストならば基準を揃えることが重要ね。では、基準を揃えてみましょう。
Aさんは100点中45点、Bさんは100点中60点だとしたら?

新太郎くん

Bさんのほうが良い成績のような気がしますが...。(またひっかけかも...)
違うテストならば難しさが違うかも。

計子先生

そうね。素の値で評価しても、テストの難しさが考慮されないわ。
ならば平均点を明示してみましょう。

Aさん:100点満点中45点(平均40点)
Bさん:100点満点中60点(平均70点)

新太郎くん

なるほど。今度はAさんのほうが平均を上回っているから良い成績のように見えますね。
基準を揃えて、平均からの差で評価することが大切なんですね。

計子先生

そうね。でも、実はもう一つだけ考えなくてはならない要素があるの。
次のような場合、AさんとBさんどちらの成績が良いかしら?

Aさん:100点満点中70点(平均60点)
Bさん:100点満点中70点(平均60点)

新太郎くん

Aさん、Bさんとも平均+10点だから、同じではないでしょうか?

計子先生

どちらも同じに見えるわよね?でもさっき言ったとおり、もう一つ考慮しなくてはならない要素があるわ。それが「ばらつき」よ。
ばらつきが違う中で、平均からの差を単純に求めてもうまくいかないわ。ばらつきを加味して判定することが重要ね。

解説【3-1】

研究デザインの種類

Aさんが受けたテストはばらつきが小さい。
Bさんが受けたテストはばらつきが大きい。

ばらつきを表す「分散」と「標準偏差」

新太郎くん

さきほど説明いただいた「ばらつき」ですが、ばらつきの大小をどうやって評価するんでしょうか?

計子先生

まず、この表を見て。この表の中でそれぞれのデータ(一人一人の点数)が平均から大きくずれていれば「ばらつきが大きい」、平均の近くに収まっていれば「ばらつきが小さい」となるわね。

16人のテスト成績一覧(平均点60点)
名前 テストの点数 テストの点数-平均点(60点)
(ばらつき)
Aさん 70 70-60=10
Bさん 59 59-60=-1
Cさん 61 61-60= 1
Dさん 60 60-60= 0
Eさん 61 61-60= 1
Fさん 62 62-60= 2
Gさん 60 60-60= 0
Hさん 58 58-60=-2
Iさん 57 57-60=-3
Jさん 59 59-60=-1
Kさん 56 56-60=-4
Lさん 55 55-60=-5
Mさん 58 58-60=-2
Nさん 59 59-60=-1
Oさん 52 52-60=-8
Pさん 73 73-60=13

新太郎くん

なるほど、一人一人の点数の平均からのずれを足し合わせればいいんですね!

計子先生

では、実際に計算してみて。

新太郎くん

えーっと。10-1+1+0+1...
あっ!ゼロになってしまいました!

計子先生

新太郎くんの考え方で基本的には良いのですが、実は「個々のデータの平均からのずれ」は、どんな場合でも単純に足し算するとプラスマイナスで相殺されて必ずゼロになってしまうのよ。

新太郎くん

そうか...。では、絶対値をとるか、2乗すればどうでしょう?

計子先生

そのとおり!ただ、絶対値だと後でさまざまな計算をするのが厄介になるわね。
プラスの値とマイナスの値が混在していて、間違えないように後から元の値に戻すのは大変でしょ?
だから、「個々のデータの平均からのズレ」を2乗して足し算するのが一般的なのよ。
ただし、データ数が多くなるほど足し算の値は大きくなってしまうので、足し算の合計をデータ数(テストを受けた人数)で割るの。この値がばらつきの指標「分散(Variance)」よ。

新太郎くん

さっきの表の平均は60だから...

(70-60)2 + (59-60)2 + (61-60)2 + ... = 400

これをデータの個数16で割ると...、25ですね!

16人のテスト成績一覧(平均点60点)
名前 テスト
の点数
テストの点数-平均点(60点)
(ばらつき)
(テストの点数-平均点)2
Aさん 70 70-60=10 (70-60)2=100
Bさん 59 59-60=-1 (59-60)2=1
Cさん 61 61-60=1 (61-60)2=1
Dさん 60 60-60=0 (60-60)2=0
Eさん 61 61-60=1 (61-60)2=1
Fさん 62 62-60=2 (62-60)2=4
Gさん 60 60-60=0 (60-60)2=0
Hさん 58 58-60=-2 (58-60)2=4
Iさん 57 57-60=-3 (57-60)2=9
Jさん 59 59-60=-1 (59-60)2=1
Kさん 56 56-60=-4 (56-60)2=16
Lさん 55 55-60=-5 (55-60)2=25
Mさん 58 58-60=-2 (58-60)2=4
Nさん 59 59-60=-1 (59-60)2=1
Oさん 52 52-60=-8 (52-60)2=64
Pさん 73 73-60=13 (73-60)2=169
  合計= 0 合計= 400
この合計をデータの個数で割ると... 分散=400÷16=25

計子先生

そうね。ここでまたもう一つちょっとした問題が出てくるの。
平均点の単位は「点」。ここでは「60点」よね。
では、分散の単位はどうかしら?

新太郎くん

うーん、「25点2」でしょうか?
なんか違和感ありますね。

計子先生

単位が違うと少し扱いづらくなるので、「点2」を「点」に戻す必要があるのよ。
つまり、元に戻すために平方根をとるの。
この値が「標準偏差(standard deviation)」よ。
記号は分散はσ2、標準偏差がσ(シグマ)、平均はμ(ミュー)で表すことが多いのよ。

解説【3-2】

研究デザインの種類

分散はσ2、標準偏差がσ(シグマ)、平均はμ(ミュー)で表すことが多い。

平均からの測り方

計子先生

では、ばらつきの評価の話に戻るけど、ばらつきが大きいと分散や標準偏差の値はどうなるかしら?

新太郎くん

平均からのズレを測っていますから、ばらつきが大きいと分散や標準偏差も大きくなりますよね?

計子先生

そうね。ただし、分散も標準偏差も「分散が5以上ならばらつきが大きい、5未満なら小さい」などの明確な基準はないの。
「中間テストの標準偏差が10。期末テストの標準偏差は5。だから中間テストのほうがばらつきが大きい」、という相対的な評価になるのよ。

さて、さっきの例にもどりましょう。
分散や標準偏差が大きいのはどちらのテストでしょうか?

Aさんが受けたテストはばらつきが小さい。
Bさんが受けたテストはばらつきが大きい。

新太郎くん

ばらつきが大きい、Bさんのテストのほうです。

計子先生

そういうことね。そして、AさんもBさんも「平均から何点離れている?」と考えると、どちらも同じ「平均点+10点」となってしまうので、「平均から何σ(標準偏差)離れているか?」をものさしにして評価するのよ。

計子先生

では問題です!空欄に入る数字はいくつかしら?

Aさんのテストの分散が25、Bさんのテストの分散が100だったら

「Aさんの点数は平均から(ア)σ離れている」
「Bさんの点数は平均から(イ)σ離れている」
(ウ)のほうが良くできた

新太郎くん

(ア)2、(イ)は1、(ウ)はAさん!ですね。

計子先生

そのとおり!
「同じ基準で、平均からのズレを標準偏差をものさしにして比べる」は、この後のすべての基本となるから、必ず覚えておいてね!

解説【3-3】

正しい比較とは...

  • 基準を揃えて

  • 素の値でなく平均値との差をとって

  • そのままの差ではなく、「標準偏差でいくつ分離れているか?」を評価する。

きれいな分布とは?

計子先生

さっきのAさんのテストの点数、平均+2σだったわよね。
これはどのくらい「良くできた」と思いますか?

新太郎くん

なんとなくですけど、上位5%くらいでしょうか?

計子先生

惜しい!実は上位2〜3%程度に入っているのよ。

新太郎くん

テストを受けた人数もわからないのに...それ、どうやって計算するんですか?

計子先生

この計算をする際に必要な前提条件があるのよ。
それは、得点の分布が絵で示したような、「きれいな」分布になっていることが条件なのよ。

解説【3-4】

  • きれいな分布

    ①のように山が1つだけで、左右同じように裾が伸びている。
    これは数学的にはさらに色々条件がつくが、正規分布という。
    一方、「きれいでない」分布は例えば②や③のように山が2つあったり、左右どちらかに偏ってるいるものを指す。

計子先生

正規分布は、統計の授業では、必ず出てくる言葉よ。
点数とその頻度をプロットしてみたら、正規分布に近いグラフができた...
ことを「点数はほぼ正規分布に従う」(ノート1)とも表現するのよ。

新太郎くん

「従う」って、ちょっと不思議な表現ですね。でも、この正規分布と標準偏差と、どんな関係があるんでしょう?

計子先生

データが正規分布に近いときには、「平均から標準偏差(σ)でいくつ分離れているか」で、だいたいの順位を計算できるのよ。
Aさんの平均+2σは「上位何%にあるか?」を考えたわよね。
これを絵で示すと下記のようになるわ。
ある点からの右側の面積が、全体の何%になるか考えればいいわけ。

数表を使った計算法

新太郎くん

プラス2σ以上の面積を計算するんですね。
でも、この微妙な形の面積ってどうやって計算するんですか?

計子先生

特別な正規分布について、「上位何%?」を簡単に計算できる表があるのよ!
ノート2を見てみましょうか。

この表の使い方を教えるわね。
表の縦方向は1の位と小数第1位、横方向は小数第2位を表しているの。
さて、プラス2σ、すなわち2.00σのところの値はいくつ?

新太郎くん

縦方向が2.0の行と、横方向が0.00の列がクロスするところですね。
値は0.9772です!

計子先生

表の使い方はOKよ。この0.9772は、「2.00以下の部分(図の左側の色つきの部分)は、全体の97.72%」ということを示しているの。

新太郎くん

2.00以下が97.72%...。ということは、2.00以上は100-97.72=2.28%ですね!

計子先生

そのとおり!だから、平均+2σの人は上位2.3%程度に入っている、ということになります。ちなみに平均-2σだったらどうなるかしら?

新太郎くん

プラスの時は上位2.3%だったから、マイナスなら下位2.3%で合ってますか?

計子先生

そのとおり!正規分布のグラフは、左右対称だから「平均プラス〇σ以上の部分」と「平均マイナス〇σ以下の部分 」は同じ面積になるのよ。
だから、「平均+2σ」の割合と、「平均-2σ」の割合は、全く同じ2.3%になるのよ。

新太郎くん

ところで、この表(ノート2)で見ると、1や2の数字しか載っていないですが、「標準偏差(σ)をものさしにして測る」のσはどこに行ってしまったんでしょうか?

計子先生

さっき言ったことを思い出してみて。
特別な正規分布」と言ったけど、この数表の元になっている正規分布は、平均がゼロ、標準偏差(σ)が1の正規分布なのよ。
だから、2.00のときは2σ、1.50のときは1.5σ...と考えて問題ないわ。
ちなみに、平均ゼロ、標準偏差1の正規分布を「標準正規分布」と呼ぶのよ。

新太郎くん

なるほど!わかりました!

計子先生

最後にくどいけど、大事だから念押ししておくことが一つあるわ。
標準偏差と数表を使って「上位●%以内」の議論ができるのは、散らばり方のグラフが正規分布に近いときだけよ。
あまりにも違うグラフになったら意味をもたなくなるから注意してね。

解説【3-5】

標準偏差と数表による評価

元々のデータが正規分布に近いときのみ、数表の値によって全体の順位を評価できる。

ノート1

身長やテストの点数などを含め、自然界にあるデータで正規分布でちらばるものは多い。
グラフの形が関数式で表現できるので、計算によって数表(ノート2)を作成することができる。

「学校保健統計調査 平成27年度 身長の年齢別分布(17歳男性)」より作図

ノート2 正規分布表

正規分布グラフ
a 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
0.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998
3.5 .99977 .99978 .99978 .99979 .99980 .99981 .99981 .99982 .99983 .99983
3.6 .99984 .99985 .99985 .99986 .99986 .99987 .99987 .99988 .99988 .99989
3.7 .99989 .99990 .99990 .99990 .99991 .99991 .99992 .99992 .99992 .99992
3.8 .99993 .99993 .99993 .99994 .99994 .99994 .99994 .99995 .99995 .99995
3.9 .99995 .99995 .99996 .99996 .99996 .99996 .99996 .99996 .99997 .99997
4.0 .999968 .999970 .999971 .999972 .999973 .999974 .999975 .999976 .999977 .999978
4.1 .999979 .999980 .999981 .999982 .999983 .999983 .999984 .999985 .999985 .999986
4.2 .999987 .999987 .999988 .999988 .999989 .999989 .999990 .999990 .999991 .999991
4.3 .999991 .999992 .999992 .999993 .999993 .999993 .999993 .999994 .999994 .999994
4.4 .999995 .999995 .999995 .999995 .999996 .999996 .999996 .999996 .999996 .999996
4.5 .9999966 .9999968 .9999969 .9999971 .9999972 .9999973 .9999974 .9999976 .9999977 .9999978
4.6 .9999979 .9999980 .9999981 .9999982 .9999983 .9999983 .9999984 .9999985 .9999986 .9999986
4.7 .9999987 .9999988 .9999988 .9999989 .9999989 .9999990 .9999990 .9999991 .9999991 .9999992
4.8 .9999992 .9999992 .9999993 .9999993 .9999994 .9999994 .9999994 .9999994 .9999995 .9999995
4.9 .9999995 .9999995 .9999996 .9999996 .9999996 .9999996 .9999996 .9999997 .9999997 .9999997

表の数値をkとおくと、kは「aσ以下の数値をとる確率Q(aσ)」に等しい

KK-16-10-16156

サイトリニューアルに伴うログインについてのお知らせ

サイトリニューアルに伴い、ログイン用のIDをメールアドレスに変更いたしました。ログインできない場合はこちらのパスワード再設定画面で再設定いただくか、 こちらにお問い合わせください。

おすすめ情報

  • おすすめ情報は、協和キリンのウェブサイトにおける個人情報の取扱い方針に基づき、お客様が閲覧したページのアクセス情報を取得し、一定の条件に基づき自動的に表示しています。
    そのため、現在ご覧いただいているページの情報との関連性を示唆するものではございません。

くすり相談窓口

弊社は、日本製薬工業協会が提唱するくすり相談窓口の役割・使命に則り、くすりの適正使用情報をご提供しています。
弊社医薬品に関するお問い合わせは、下記の電話窓口で承っております。

フリーコール

0120-850-150

受付時間 9:00~17:30
(土・日・祝日および弊社休日
を除く)

※お電話の内容を正確に承るため、また、対応品質の維持・向上等のため通話を録音させていただいております。あらかじめご了承ください。

お問い合わせ