KYOWA KIRIN

このサイトは、日本国内の医療関係者(医師、薬剤師、看護師、技師・技士等)を対象に、弊社が販売する医療用医薬品を適正にご使用いただくための情報を提供しています。国外の医療関係者、一般の方に対する情報提供を目的としたものではありませんのでご了承ください。

第5回 割合の検定

  

クイッククイズ

内閣支持率の評価

割合の変化の検定(帰無仮説と対立仮説の設定)

計子先生

前回は起こった出来事が偶然なのかどうかを判断する基準として、我慢の限界=有意水準の話をしたわよね?
今回は、前回説明した仮説検定の手法を実際に使って問題を解決するわ。
例として内閣支持率調査で内閣支持率が変わったか?変わらないか?の仮説検定をやってみましょう。

新太郎くん

最近、内閣支持率とか大統領の支持率とかよく聞きますね...

計子先生

ではさっそく、支持率の世論調査の例題です!

(例題)

前回の内閣支持率調査では、支持率は40%であった。今回、100人に調査を行ったところ、100人中52人が「支持する」と答えた。このとき、支持率は変わったといえるか?

まずは前回と同じように、帰無仮説と対立仮説を設定できるかしら?

新太郎くん

はい。100人中52人は52%だから...帰無仮説が「支持率は40%のまま」、対立仮説が「支持率は40%から上昇した」、でしょうか?

計子先生

惜しい! 前回の「コインのイカサマ」とは違って、内閣支持率は上がる・下がるのどちらにも可能性があるわよね?

新太郎くん

あっ、そうか!
両側検定」になって、対立仮説は「支持率は40%から変化した」となるんですね!
では、「支持率は40%のまま」が帰無仮説で、「支持率は40%から変化した」が対立仮説でしょうか?

帰無仮説:支持率は40%のまま

対立仮説:支持率は40%から変化した

解説【5-1】

帰無仮説と対立仮説の設定

成功確率pの実験をn回行ったところX回成功した。成功確率pは変化したか?

帰無仮説 成功確率pは変化していない(支持率は40%のまま)
対立仮説 成功確率pは変化した(支持率は40%から変化した)

新太郎くん

この帰無仮説を仮定して、その上で観測された現象が起こる確率を求める...ですよね?

計子先生

そのとおり!具体的には、「支持率が40%のとき、100人中52人以上が『支持する』と答える確率」を計算するの。もっと一般化すると、「支持率40%」を成功確率40%と考えて、「成功確率が40%の実験を100回繰り返したときに、52回以上成功する確率」を求めるのよ。

支持率が40%のとき、
100人中52人以上が「支持する」と答える確率

=成功確率が40%の実験を100回繰り返したときに、52回以上成功する確率

計子先生

さっきも説明したとおり、「40%から上昇した」ではなく、「40%から変化した」が対立仮説なので、支持率(成功率)が下がった場合も考慮しないといけないのだけど、どのように考慮したら良いかしら?

新太郎くん

「上がった」ときは「100人中52人以上が『支持する』まで考慮したんだから...「下がった」ときは、「100人中52人以上が『支持しない』」ですか?

計子先生

発想は間違っていないけど、「52人『支持する』」を「52人『支持しない』」と裏返してしまうと、「支持率40%」がどこかに消えてしまうわよね。 ところで、支持率が40%で、100人に聞いたら、一番ありそうなのは何人が「はい」と答える場合でしょう?

新太郎くん

えーと...100人で40%なら、100×0.4で40人?単純すぎますか?

計子先生

とても単純だけど、数学的にはそれで良いの。「52人支持する」は、一番ありそうな40人と比較して、「40+12人が支持する」ととらえ直すのよ。第3回で話した「平均からのズレで評価する」イメージよ。

新太郎くん

52人以上というのは、40+12人・40+13人・...40+60人と考えるんですね。じゃあ、下がったときは、40-12=28人から始めればよいですか?

計子先生

そのとおり!

新太郎くん

なるほど!支持率が40%のときに、「40+12=52人以上が『支持する』と答える確率」と、「40-12=28人以下が『支持する』と答える確率」とを求めればいいんですね。

二項分布の正規近似

計子先生

さて、ここまでの話で求めるべき確率は、以下のようにまとめることができるわ。

(求めるべき確率)

=「支持率が40%で、100人に聞いたとき、『支持する』と答える人数が52人以上もしくは28人以下となる確率」

新太郎くん

40人から、上か下かに12人以上ずれる確率ですね。

計子先生

はい。では問題です!
「支持率40%のとき、100人中52人以上が『支持する』と答える」確率は何%ですか?

新太郎くん

え~と、、、『支持する』と答える人数が52人以上もしくは28人以下...
あっ!もしかして52人以上ということは、53人、54・55・56...100人
支持する場合の確率をすべて計算しなきゃいけないんですか?

計子先生

前々回の「偏差値」の話をした際、「珍しさ」を「上位●%以内」と定義して計算したわよね。
この「以内」がポイントで、起きた出来事の珍しさを評価する際には、それよりもさらに珍しいことも同時に評価する必要があるのよ。テストの点数であれば、平均+10点だったら、平均+11点、12点...(以下満点まで)をすべて引っくるめてはじめて「上位●%」の評価ができるのよ。今回の内閣支持率なら「100人52人が『支持する』」ことだけでなく、「100人中53人、54人、...99人、100人が『支持する』」と答える確率をすべて足し合わせないといけないわ。

新太郎くん

うわあ、すごく厄介そうです...。

計子先生

そうね。本当は52人、53人...100人支持する場合をすべて計算しなければいけないわ。
「支持率40%のとき、100人中52人が「支持する」と答える」確率の計算法は「ノート1」で説明するけど、今回の例題で「○○人()()支持する」確率の簡単な求め方を今から説明しましょう。

新太郎くん

簡単な方法!?ぜひお願いします!

計子先生

では、早速やってみましょう。コンピュータを使って計算してみるわ。

新太郎くん

ええ...(簡単な方法ってコンピュータ?)

計子先生

さて、コンピュータの力を借りて、「支持する」と答える人数と確率の関係をプロットしてみたわ。もちろん、そのまま足し算すれば確率は出せるけど、この形を見て、何か気づかないかしら?

支持率40%のもとで、100人中n人が「支持する」と答える確率のグラフ

新太郎くん

あ!値はとびとびだけど、何となく前回の正規分布のグラフに似ていますね。

計子先生

そのとおり!支持する人数は0から100までの整数しか取れないから、どうしてもとびとびのグラフになるけど、線をつないでいくと正規分布のように見えてくるわね。
実は数学的にも、「線をつないでよい」、すなわち「正規分布に近似してよい」ことは証明されているのよ。

新太郎くん

近似できると、何かいいことあるんですか?

計子先生

正規分布への近似ができると、第3回でやった正規分布表(第3回ノート2)を利用して、「上位何パーセントの位置にあるか?」を評価できるのよ。だから、「100人中53人、54人、...99人、100人が『支持する』」と答える確率を何回も計算しなくてもいいのよ。

新太郎くん

すごい!でも「支持率が40%のときに100人中52人以上か、28人以下が『支持する』」というのを、どうやって数表(正規分布表)に置き換えるんでしょう?

平均からズレで計算

計子先生

いい所に気づいたわ。ここで、第3回で話した考え方が役に立つわ。「えらさ」「珍しさ」は、どんなものさしで評価するんだっけ?

新太郎くん

たしか、平均値からのズレを、標準偏差をものさしにして評価するんでしたよね。(第3回「平均からの測り方」参照)

計子先生

そのとおり!そして、今回も同じ考え方を使うのよ。「支持率が40パーセントで、100人に聞いたときに、『はい』と答える人数」をXとおいたとき、Xの平均値と標準偏差がわかればいいの。

新太郎くん

なるほど...平均は、さっき出てきた100×0.4=40人で良いんでしょうか?でも、標準偏差がわかりません。

計子先生

平均は40人でOKね。そして、標準偏差にもとても便利な式があるのよ。
支持率すなわち成功確率pが決まっていて、聞いた人数すなわち試行回数nも決まっているとき、成功回数Xの平均と分散σ2(標準偏差の2乗)は、次のような式になるの。

解説【5-2】

成功確率pの実験をn回行うとき、
成功回数Xの平均μ、分散σ2は次の式で求められる。

平均μ:np(= 試行回数×成功確率)
分散σ2:np(1-p)(= 試行回数×成功確率×失敗確率)

→「成功回数Xは確率p、試行回数nの二項分布に従う」

この例題では
平均 µ = np = 100 × 0.4 = 40
分散 σ2 = 100 × 0.4 × (1-0.4)

なお、統計の本などでは、「Xは確率p・試行回数nの二項分布に従う」と表現するの。「二項」の意味合いは、「『成功』か『失敗』の2つの値しかとらない」くらいに考えておけばいいわ。pとnが決まってしまえば、コイン投げでも、支持率でも、何でも「二項分布に従って」くれるわ。

新太郎くん

分布に従う?

計子先生

まあ、今のところは前の正規分布と同様、「平均と分散がpとnだけで計算できて、グラフの概形が1つに決まる」くらいに考えておけば、実質的に問題ないわ。 では、この式を使って標準偏差σを計算してみて。

新太郎くん

はい。人数が100人、支持率が40%、不支持率が60%だから、Xの分散σ2は100×0.4×0.6=24。そして標準偏差σは、その平方根で√24=4.89ですね。

計子先生

では、「人数が52人以上・28人以下」を平均と標準偏差を使って言い換えてみましょうか。

新太郎くん

平均が40人で、ズレが±12人ですよね。「12人ずれている」のを、標準偏差をものさしにして測り直すのだから、12÷√24=2.45。つまり、「平均から±2.45σずれている」ことになります。

グラフ

計子先生

そのとおり!ここから先は、第3回と全く同じよ。数表(第3回ノート2)の正規分布のところを見て、±2.45σ以上のズレが全体の何%なのかを判断すればいいの。

新太郎くん

数表で2.45のところを見ればいいんだから...2.4と0.05との交点で...0.9929。
だから、1-0.9929=0.0071で、上位0.71%。「+2.45σ以上」だけじゃなくて、「-2.45σ以下」も考えて、0.71×2=1.42%ですね?

計子先生

そのとおり!繰り返しになるけど、「とびとびの値をとる二項分布でも連続値をとる場合は正規分布の数表を使って良い」ということで、二項分布の正規近似になるのよ。

解説【5-3】

式

→正規分布の数表に、そのまま当てはめてOK

結果の料理法① p値

計子先生

さて、これまでの計算結果から、例題の検定結果を出してみましょう!

新太郎くん

有意水準(我慢の限界)が5%だったから、1.42はそれより小さいですね。だから、帰無仮説を棄却して、「支持率には変化があった」といえます。

計子先生

お疲れ様でした!検定はこれで終了よ。今の大小比較の際に求めた「1.42%」、すなわち帰無仮説が正しいと仮定した状態で、起きた現象が観察される確率をp値と呼ぶのよ。論文では、「p=0.0142」とか、5%より小さいことを強調して「p<0.05」という表記になることが多いわ。

解説【5-4】

p値:帰無仮説が正しいとき、観測された出来事が起こる確率

p値<有意水準5%:帰無仮説を棄却し、対立仮説を採用できる

p値>有意水準5%:帰無仮説を棄却できない

クイック・クイズ解答

(例題)内閣支持率の評価

前回の内閣支持率調査では、支持率は40%であった。今回、100人に調査を行ったところ、100人中52人が「支持する」と答えた。このとき、支持率は変わったといえるか?

解答

が起こる確率(p値)は1.42%。このp値は有意水準5%より小さいので帰無仮説を棄却し、対立仮説(支持率は40%から変化した)を採用!

新太郎くん

これが論文などでよく見るp値なんですね!やっと意味がわかりました!

結果の料理法②「1.96σ」

計子先生

p値を出すのとは別に、実はもう一つ判定方法があるのよ。
まず、正規分布表(ノート2)で有意水準(我慢の限界)である5%が、平均からどれだけずれているか確認してみて。

新太郎くん

ええと...今回は両側検定だから、片側が2.5%のときのズレを確認すればいいんですね。
つまり、この表では「.9750」のところだから...
片側2.5%のところは平均より1.96σのズレです!

計子先生

よくできました!つまり「平均±1.96σの範囲に、全体の95%が含まれる」。

正規分布表とグラフ

裏を返せば、「平均から上下1.96σずれた値は、全体の5%」なのよ。「平均から上下1.96σのずれ」と、「平均から2.45σ以上のずれ」、全体に占める割合(%)はどちらが大きくなるかしら?

新太郎くん

1.96σのほうが2.45σよりも平均に近いんだから、「平均から上下1.96σ以上のズレ」の割合(%)のほうが大きくなるはずです。

グラフ

計子先生

そのとおり!そして、ズレが±1.96σのときに、ちょうど全体の5%。
だとしたら、ズレが1.96σより大きかったら...。

新太郎くん

あ、必ず5%より小さくなりますね!

計子先生

そうよ。だから、p値の正確な値を計算しなくとも、この場合は「1.96<2.45より、p<0.05」といえるの。検定は「p値が有意水準を下回るかどうか」のYES・NOだけで判断するから、求めたズレの値が1.96σを上回ってしまえば、それだけで帰無仮説を棄却できるわ。
「1.96」という値は仮説検定の場合、とても重要な役割を果たすから、ぜひ頭に入れておいてね。

解説【5-5】

1.96との大小関係から、帰無仮説を棄却できるかどうか判断する

平均からのズレ > ±1.96σ 帰無仮説を棄却できる
平均からのズレ < ±1.96σ 帰無仮説を棄却できない

計子先生

さて、今回はもとの集団(母集団)の分散(母分散)が計算できる(わかっている)二項分布について、正規分布への近似を使って検定してみたわ。次回は母分散がわからないときの検定、t検定の方法について説明するわよ。実際によく使われるのは、こちらのt検定なのよ。

新太郎くん

わかりました!

ノート1 成功確率pのとき、実験N回中r回成功する確率の計算式(反復試行の確率の定理)

計子先生

さて、「支持率40%のとき、100人中52人が『支持する』と答える」確率を計算してみましょう。

新太郎くん

うーん...高校時代にやったような気はするけど...降参です!わかりません!

計子先生

まあ、普段こういう計算する機会がないと計算の仕方を忘れて当然ね。
これは下記の計算式を使うのよ。
2つに分けて計算する感じで、まずは100人から52人、「支持する」と答える人を選ぶのよ。選び方は何通り?

新太郎くん

あ、それならわかるかもしれません。PだかCだかですよね...この場合は順番を考慮しないから、コンビネーション(C)の方で、100C52

計子先生

そう、100C52(=約9×1028)通りあるわ。
第2段階として100人中52人が「支持する」、48人が「支持しない」と答える確率を計算してみて。

新太郎くん

「支持する」が40%、「支持しない」が100%-40%=60%だから...「52人が支持する」のは の52乗。「残り48人は支持しない」は を48乗。これでいいでしょうか?

計子先生

そうね。あとは、この3つをかけ合わせるだけよ。

新太郎くん

で...確率は0.00424になりました。

計子先生

一見複雑に見えるけど、「100人中から支持者を52人選ぶ組み合わせは何通り?」×「52人が支持する確率」×「100-52人が不支持になる確率」で大丈夫なのよ。一般化した式だと、成功確率がpの実験(失敗確率が1-p)をn回繰り返したときに、r回成功する確率は以下のようになるのよ。

解説

成功確率p、失敗確率1-p、実験N回中r回成功する確率の計算式
(反復試行の確率の定理)

(「N回からr回選ぶ組み合わせ数」×「r回成功する確率」×「N-r回失敗する確率」)

KK-16-12-16842

サイトリニューアルに伴うログインについてのお知らせ

サイトリニューアルに伴い、ログイン用のIDをメールアドレスに変更いたしました。ログインできない場合はこちらのパスワード再設定画面で再設定いただくか、 こちらにお問い合わせください。

おすすめ情報

  • おすすめ情報は、協和キリンのウェブサイトにおける個人情報の取扱い方針に基づき、お客様が閲覧したページのアクセス情報を取得し、一定の条件に基づき自動的に表示しています。
    そのため、現在ご覧いただいているページの情報との関連性を示唆するものではございません。

くすり相談窓口

弊社は、日本製薬工業協会が提唱するくすり相談窓口の役割・使命に則り、くすりの適正使用情報をご提供しています。
弊社医薬品に関するお問い合わせは、下記の電話窓口で承っております。

フリーコール

0120-850-150

受付時間 9:00~17:30
(土・日・祝日および弊社休日
を除く)

※お電話の内容を正確に承るため、また、対応品質の維持・向上等のため通話を録音させていただいております。あらかじめご了承ください。

お問い合わせ