標本分布 - 小樽商科大学

������������������������������������
標本分布
小樽商科大学ビジネススクール教授 西山 茂
Contents
3.1 統計量と標本分布................................................................ 2
3.1.1 母集団と標本 ..................................................................... 2
3.1.2 データと統計量 ................................................................ 2
3.2 標本平均 X の分布 ................................................................ 4
3.2.1 X の不偏性 .......................................................................... 4
3.2.2 正規分布の再生性 ............................................................ 5
3.2.3 中心極限定理 ..................................................................... 6
3.2.4 大数の法則.......................................................................... 7
2
3.3 標本分散 S の分布 .............................................................. 8
3.3.1 カイ二乗( )分布 ...................................................... 9
2
3.3.2 統計 S の分布の特徴 ..................................................... 10
3.4 正規分布から派生する分布 ............................................. 11
3.4.1 ステューデントの T 分布.............................................. 11
3.4.2 スネデカーの F 分布 ....................................................... 12
検出力はデータ数や二つの仮説で変化する
1
データ数=20
データ数=5
検
出
力
29%
14%
0.05
帰無仮説
μ=60
65
検デ
出�
力タ
は数
上が
が増
るえ
る
と
対立仮説
違いが大きくなると
検出力は上がる
第3章 標本分布
第 2 章では確率分布について述べた。確率分布とは観
データ収集に先立って置くこともあるが、考え方として
察されたデータが示す度数分布とは区別された「理論的
は日本人の身長分布の特徴を観察した 100 人のデータか
に想定される分布」のことだった。その確率分布を特徴
ら明らかにしようと考える。
付けるには、やはり平均値や分散という特性値を求めれ
一部の情報から全体の分布に関する知識を得ようとす
ばよいことがわかった。それらは期待値を計算すること
るこのような統計学を推測統計学と呼んでいる。この呼
によって求めた。
び方は、集めたデータに含まれている情報を上手に整理
本章では、特定の分布を有する母集団から、ある変量
について何個かのデータを無作為に抽出するとき、デー
して重要な特徴を引き出す方法を論じる記述統計学と対
照させた用語である。
タがどのような分布特性を示すかについて考える。本章
推測統計学の基礎となるのは本章で考察する標本分布
の狙いは標本分布について理解を得ることである。標本
である。そこでは、関心の対象、もしくは考察の対象と
分布は、ある意味で確率分布なのだが、何の分布をとり
なっている集団とその集団の中から実際に変量を測定し
あげているかが鍵になる。標本分布論は統計学の基礎理
た部分との区別が概念的には極めて重要になる。上の例
論にあたるので、読者は第 4 章に進む前に本章をよく理
に則して言えば、関心の対象となっている日本人全体を
解しておく必要がある。
母集団、それに対して実際に測定対象となった 100 人を
標本ないしサンプルという。標本にとられる個体の数を
3.1 統計量と標本分布
標本サイズ、サンプルサイズといっている。上の例では
標本サイズを 100 人にしている。簡単にいえば標本サイ
ズとはデータの数である。
3.1.1 母集団と標本
母集団と標本の区別は統計学を勉強する上でも大変重
要な箇所で、この辺りの理解が曖昧だと統計学は文字通
日本人全体の身長に関心があるとしよう。統計的なも
りの計算練習に終わってしまうおそれがある。集められ
のの見方は、日本人の身長について何かを知りたいとき、 たデータには必ず「データの出所」がある点がポイント
か、その分布にどんな特徴があるのかというとらえ方を
である。たとえば血圧に関する同じ 5 人の測定値
91, 119, 105, 138, 122
する。統計学は常に「分布」という観点からものごとを
をとりあげるとき、これらのデータが「65 歳以上の老齢
みるのである。分布とは、多くの値が一定の集団の中で
者全体」から得られたものか、「健康であるはずの若年
混在している状態を指している。いまは日本人という一
層全体」から得られたものか、「特に範囲を限定しない
定の集団を観察対象とするわけである。
日本人全体」から得られたものであるかによって、デー
日本人という集団の中で身長がどのように分布している
日本人の身長分布を観察することは、その分布の特徴
タが教えてくれる内容の解釈は全く異なってくる。
を知るということに他ならない。だから、身長分布の代
データが教えてくれるのは、データが採られてきた母
表値である平均値、散布度である標準偏差の値を知る試
集団についてであって、母集団に含まれていない外部の
みに帰着する。もしも身長分布の形に非対称性など、そ
集団については何も教えてはくれない。これは当然のよ
の他の特性があると想定されるなら、そのような特徴に
うだが非常に大切である。
ついても知っておきたいと思うだろう。
分析テーマに応じて先ず母集団を定め、次にデータを
2
日本人の身長分布が、正規分布 N(µ, σ ) であると前提
抽出する段階へと進む。母集団は一定の定義された範
することもある。通常、データを集めるため実験や観察
囲であるから、何を測定するにせよ母集団の分布は既に
を行なう際は、全体に当てはまっている真の分布のこと
与えられている。分布が与えられているから、母集団の
は知らないのが普通だから、真の分布が分かっていると
平均値も分散も既に確定した定数である。それに対して、
いうのは、あくまでも暫定的な仮定である。しかし、分
標本は最初から測定対象を決めているわけではなく、原
布の形状が正規分布であると想定できるなら、分布の歪
則としては無作為にデータを集めるので、データの分布
みや尖りは考慮しなくともよいことになるので、単純化
は常に変化し、予想がつかないという性質を持つ。定義
のためにしばしば分布の正規性が仮定される。正規性の
された母集団の分布の特性値を母数と呼んでいる。その
仮定がおかれれば、身長分布について知るべき特性値は
値が分からない場合は未知母数と言っている。
平均値 µ の値と標準偏差 σ の値の二つにしぼられる。
そこで、日本人の身長の傾向や特徴を知るために 100
3.1.2 データと統計量
人のデータを集めるとしよう。このとき、手元に集まっ
てくる 100 人の測定値は、日本人全体の身長分布につい
て、何をどれだけ正確に教えてくれるだろうか。
推測統計学の主な目的は、一定の標本情報を利用して、
母集団の特性を明らかにすることである。無作為に集め
統計学では、このように分布の正規性のような前提を
たデータから分かることで、母集団の平均値や分散を知
‒ 2 ‒
図 3.1
データ抽出と標本分布の関係
データ
統計量
データ抽出実験
平均値の
標本分布
X 10 の標本分布
X 1 の標本分布
分散の標本分布
復して行うことができる。図 3.1 では、抽出したデータ
る上で有用なものがあるだろうか。
いま標本サイズを 10 人としよう。それぞれのデータ
をすべて記載しているわけではなく、4 回目の途中まで
の値を X1, X2, ... X10 とおく。このデータの値から色々な
を記録している。無作為データ抽出を行う場合、どんな
ことが明らかになる。たとえば、
日本人が最初に選ばれてもよいわけだから、X1 の値とし
て現れる可能性がある値は日本人の数だけある。X1 は日
本人全体の中から偶然に選ばれる人の身長である。この
ことは 2 回目の無作為抽出でも 3 回目以降でも同じであ
などは、全て集められたデータから値が決まる。これら
る。
仮に 10 個のデータを無作為抽出する反復実験を行え
のようにデータ全体から値が定まるもの、すなわちデー
タの関数 T(X1,X2,...X10) を一般に統計量と呼んでいる。
ば、図 3.1 で「X1 の分布」と名前を付けている領域に、
標本分布は統計量がとる値が確率変数であることを了
X1 の分布が観察されるはずである。データ抽出を無限に
解した段階で自然に発想されてくる確率分布である。な
反復すれば、X1 の分布と記されている領域に日本人全員
ぜそうなるのか。この点を詳しく考えてみよう。
が登場してくることになろう。ということは、X1 の分布
まず大事な点はデータ収集、あるいはデータ抽出とい
う時には、それは無作為抽出であることだ。たとえば、
は母集団である日本人の身長分布と一致すると考えてよ
い。同様の議論は X2 から X10 についても当てはまる。
最初に身長の高い人が観察されたときには、次に低い身
図 3.1 の最右列には 10 個のデータから計算される代表
長の人を探して観察するという集め方をすると、二番目
的な統計量として平均値 X と分散 S の欄を設けている。
のデータ X2 の出所は日本人全体ではなく、日本人の中
でも身長の低い人達に限定されてしまう。そうなると
X2 の値は日本人全体の身長について正確には教えてくれ
2
これらの値もデータを抽出するごとに異なった値をとる。
2
無限にデータ抽出を反復すれば X と S の値は一定の形に
分布するだろう。このように、確率変数であるのは、そ
なくなる。低めのバイアスを持つことになるからである。 れぞれのデータだけではなく、その関数である統計量も
10 人のデータを集める目的が、日本人全体の身長分布を
同じである。本章でとりあげる標本分布は、無作為デー
知ることにあるのなら、各データは何の作為も操作もな
タ抽出を反復するときに現れてくる X や S の分布である。
2
2
く、前後の値とは関係させず、ランダムに集めることが
図 3.1 では X と S のみを示しているが、データから
必要となる。したがって標本は常に無作為に抽出されな
値が決まる全ての統計量は一定の標本分布をもっている。
ければならない。
関心のありようによっては、データの最大値 Max Xi や
3
さて、無作為抽出を行うとすれば、X1 ばかりではなく、 三乗の平均値 ∑X /N を求めることもあろう。これらもデ
X2,X3, ... X10 まで、すべてのデータは偶然に値が定まる確
ータを反復抽出すれば、色々な値をとる可能性があり一
率変数だと考えられる。個々のデータが確率変数だとす
定の標本分布をする。
10 個のデータを集めるときは、通常、10 個のデータ
れば、データから計算される統計量はすべて偶然に値が
決まる確率変数ということになる。
を一度集めれば作業は終了し、次の課題は集まったデー
このことは図 3.1 からも確かめられよう。
タの値を吟味する段階に移る。2 回目以降に抽出される
図 3.1 に示されているように、一口に「10 個のデータ」
はずのデータなどは考慮に入れないものである。しかし
を集めると言っても、無作為のデータ抽出は何回でも反
ながら、データから計算される平均値や分散は、無数の
‒ 3 ‒
値が確率分布している中の一つの値が実現したものと見
り、すべてのデータ Xi の標本分布は図 3.1 でも見たよう
なしてよい。いかなる標本分布から得られた値なのかと
には母集団分布と同じになるので、
いう目でデータの結果を見ることが大変重要である。
3.2 標本平均 X の分布
となって最初の結果が確かめられる。
データの平均値である X を標本平均と呼んでいる。標
次に、無作為データの値は互いに独立であると考えら
本平均は第 2 章で導入した確率分布の母平均と対比され
れるので「合計の分散=分散の合計」が成り立つケース
る。
である。そこで
たとえば日本人の身長を考えると、一人一人の身長は
言うまでもなく異なっている。そこで身長を X としよう。
そうすると、日常の観察から明らかなように X の値と
して頻繁に現れる値(160 センチから 170 センチという
となる。確率変数を定数倍するときには、分散はその定
値は頻繁に観察される)とごく少数しか観察されない値
数の二乗倍になることを使っている。右辺の「合計の分
(200 センチを上回るひとは少ない)がある。日本人とい
散」はそれぞれの分散の合計になるから
う母集団で身長分布が定まっていることから、これは当
然のことでもある。変数 X の確率分布は「真の分布」と
いう意味である。今の場合、身長 X の確率分布は日本人
の身長分布という具体的な分布を指している。
のように結論が得られる。
要約すれば、変数 X が何であれ、母集団分布が X の
上の証明の中で、確率変数 X がどんな分布型に従うか
確率分布に相当する。確率分布という数学的な概念をこ
という何の前提も置かれていないことに注意してほしい。
のように利用するのが統計分析だと言ってもよい。だか
つまり、この定理は分布の形を問わず、無作為に抽出さ
ら母平均 E[X]=µ は日本人の平均身長、母分散 V[X]=σ
2
れたデータなら常に成り立つ標本平均 X の性質を示すも
は日本人の身長の分散を指す。したがって母平均や母分
のである。
散は定数として取り扱われる。
定 理 1 を 用 い る と、 日 本 人 全 体 の 身 長 分 布 が
2
それに対して、標本平均 X や標本分散 S は統計量だか
N(170,152) で、これを母集団に無作為に 10 人のデータを
2
抽出するとき、標本平均の分布が N(170,15 /10) となるこ
ら確率変数である。
母平均と標本平均の間には、定数と変数の違いがある
2
とがわかる。あるいは、母集団分布が N(168,10 ) であれ
ことを読者には正確に認識してほしい。
ば 10 個のデータの平均値の標本分布は N(168,10) になる。
3.2.1 X の不偏性
布の散らばりは母分散をデータ数で除した値になること
X の標本分布において分布の中心は母平均と合致し、分
は標本平均がもつ非常に大切な性質である。
それでは、10 個のデータの平均値である X はどんな分
布をするだろうか。次の定理がもっとも基本的である。
分布の中心が母集団の平均 µ と一致するという性質
を 不 偏 性(Unbiasedness) と 呼 ん で い る。 不 偏 性 は
この定理の証明はちょうど良い練習問題にもなる。
としても同じである。
はデータの
示す平均値と真の平均値との乖離である。誤差といって
定理1(標本平均の分布)
2
母平均が µ、母分散が σ である無限母集団から無作為
に n 個のデータを抽出するとき、標本平均 X について
もよいだろう。統計量 X を用いるとき母平均との誤差が
平均的に 0 になる。
図 3.2
データ数と標本分布
�����
������
������
������
が成り立つ。
定理1(標本平均の分布)の証明:
まず定理で述べて
いるように分布する確率変数を X としよう。
期待値に関する基本公式から
である。ところが、無作為にデータ抽出を行っている限
���
‒ 4 ‒
���
���
���
���
次に、とるデータ数 n が増えるにしたがって、標本平
均の標準偏差
は小さくなる。つまり、 X の分布の中
心は µ のままだが、分布の広がりが 0 に近づく。最終的
となる。つまり、「みた」と回答する者の割合は0‐1
にはデータ数の増加の結果、標本平均は母平均の値をほ
データの標本平均と同じである。
ぼ確実にとるようになる。この点は第 3.2.4 節で改めて
この点に気がつけば の分布はすぐに上の定理1から
とりあげる。図 3.2 にはこの様子が示されている。真の
得られる。いまの場合、母集団分布はバイナリー分布で
平均が 168 であれば、集めるデータ数を無限に増やして
2
あり µ=p、母分散 σ =p(1-p) である。したがって
いけば、 X はほぼ確実に 168 という値をとるようになる。
例題1 正しいサイコロを 6 回振って出る目の数の平
均値を X とする。 X の標本分布の平均
これが設問 [3] の解答になる。このように定理1(標
と標準偏差
を求めよ。
本平均の分布)は、母集団分布を問わず、標本平均とい
う統計量がもつ一般的な性質を示すものである。比率の
例題1の解答 正しいサイコロを振って出る目の数を X
ように一見すると平均値のようではないケースの中にも、
と す る と E[X]=3.5、V[X]=2.92 と な る。 し た が っ て、6
本例のように標本平均として解釈できるケースがある。
個 の 無 作 為 デ ー タ の 標 本 平 均 の 分 布 は、
と な る。 こ の 分 散 の 値 か ら
例題3 ある自動車工場で生産している乗用車のブレー
と見込まれる。標準偏差は「中
キは、時速 40km から急ブレーキを 踏んだときに停止す
心からの偏差の目安」だから目の数の平均値は 3.5 ± 0.7
るまでの制動距離が 40 メートルであるように設計され
とされる。個別にみるとサイコロの目は 1 から 6 までど
てい る。但し、実際に走行テストをしてブレーキ性能
の値が出てもおかしくないが、6 回の平均値となると概
を測定するときには、ブレーキを踏むタイミングや路面
ね 3.5 前後になるはずだという結論になる。
状況などから 1 メートルの標準偏差が生じることがわか
、
っている。いま 10 台の乗用車を無作為に抜き取り、1 台
例題2 無作為に選んだ 50 人の学生に対して、特定の
を 1 回ずつ走らせブレーキ性能検査をすることになった。
日にある TV 番組を「みた」か、
「みなかった」かを質
10 回の走行テストの平均停止距離を X (メートル)とす
問することにした。50 人のうち「みた」と回答する者の
る。 X の標本分布の平均と分散を求めよ。但し、乗用車
比率を とする。社会全体でこの番組をみた人の比率を p
のブレーキはすべて正常とする。
として、以下の設問に答えよ。
[1] 質問される i 番目の人が「みた」と回答すると 1、
「み
例題3の解答 10 回の走行テストの結果を X1,...X10 とす
なかった」と回答すると 0 となる変数 Xi, i=1,2,...50
る。これが標本だが母集団はどのように定められている
を考える。各 Xi はどんな分布にしたがうか。その平
のだろうか。母集団とは「データの元になる分布」であ
均と分散も求めよ。
る。この例では、ブレーキが正常である車を走らせ時速
[2] を X1,X2,...X50 で表せ。
40km から急ブレーキをかけた時に停止するまでの距離
[3] の平均と分散を求めよ。
を測っているので、毎回の停止距離として現れうる値の
全体を指している。その母集団分布の平均が 40 メート
例題2の解答 設問 [1] については、まず集める 50 個
のデータは 0 か 1 の二つの値のみからなる。このこと
ルである。ブレーキはそのように製造されているからで
2 2
ある。また、母分散が σ =1 であることもわかっている。
したがって今回行われた 10 回の測定が無作為になさ
は母集団、つまり社会を構成する全員に対しても「み
た」ならば 1、
「みなかった」ならば 0 である変数 X を
れたとすれば
とれば同じ状況である。X はバイナリー分布で E[X]=p、
V[X]=p(1-p) である。つまり真の視聴率 p が母平均となる。
データが無作為に集められるなら、どのデータ Xi の分
布も母集団分布と同じでなければならない。したがって
となり、走行テストの平均値は設計どおり 40 メートル
i=1, ... 50 について
になるはずであるが、路面状況などから
(メ
ートル)くらいの違いが発生してもおかしくないという
結論になる。
となる。
次に設問 [2] については X1 から X50 までの変数のうち
3.2.2 正規分布の再生性
で値 1 をとるものの比率が だから
例題 3 で停止距離の母集団分布はどんな型をしている
か指定されていなかった。いま母集団分布が正規分布で
‒ 5 ‒
あると分かっていたとする。そのとき 10 回の走行テス
しかし、実際に統計学を応用する際に対象となる母集
トの標本平均の分布について、どんなことが新たに分か
団は必ずしも正規分布に従ってはいない。正規母集団以
るだろうか。
外に、たとえば 0‐1 データを活用するアンケート調査
この問題を考えるときの基本になるのが次の定理2で
が行われている。この場合、母集団分布はバイナリー分
ある。この定理の眼目は母集団の分布が正規分布である
布である。それでもなお標本平均の分布は正規分布だと
ときに無作為抽出するデータから標本平均を求めるとす
扱っても大きな問題はないことがわかっている。
れば、標本平均は正規分布にしたがって値が得られると
中心極限定理は「標本平均は正規分布にしたがう」と
いうことである。
一般的に想定するための非常に強力な根拠になっている。
定理2(正規分布の再生性)
定理3(中心極限定理)
互いに独立な確率変数 X と Y のしたがう分布をそれぞ
平均が µ、分散が σ である母集団から無作為に抽出した
れ正規分布
n 個のデータの平均を X とする。
、
とする。このとき
2
(
)/
の
ように X を標準化した変数 Z を考えると、データ数 n が
となる。
無限に大きくなるにともない、変数 Z の標本分布は限
上 の 定 理 に お い て X+Y の 平 均 値 と 分 散 が そ れ ぞ れ
µx+µy、
となることは、平均と分散に関する基本
りなく N(0,1) に近づく。言い換えると、 X の標本分布は
2
正規分布 N(µ,σ /n) に近づく。
公式から容易に確かめられる。本定理の眼目は、X と Y
が正規分布にしたがって分布しているならば、二つの合
中心極限定理の骨子は「元の母集団が何であっても標
計 X+Y も正規分布にしたがう確率変数であるという点に
本平均を標準化すると分布は N(0,1) となり正規分布の数
ある。この性質を正規分布の再生性と呼んでいる。
値表が利用できる」ということにつきる。これは標本平
合計が正規分布をすれば、合計を定数である標本サイ
均が常に正規性(Normality)を持っており、大変扱いや
ズ n で割った X も正規分布にしたがう。上の定理は「標
すい性質を有していることを意味する。「元の母集団が
本平均の分布は正規分布だ」と考えてよい一つのケース
何であっても」と上で述べたが、母集団分布に対して文
なのである。
字通り何の条件も課されないわけではない。しかし、平
同じ分布型に従ういくつかの独立な変数を加えたとき
均と分散が定まっている母集団で、データの抽出が無作
に、その和も同じ型の分布になるという性質を再生性と
為であれば、中心極限定理は無条件に成立する(国沢清
呼んでいる。再生性は正規分布以外にも当てはまる例が
典「確率論とその応用」(岩波書店)148 頁を参照)
。
多く、ポアソン分布や二項分布も同じ性質を有している。
標本平均は正規分布する
例 題 4 例 題 3 に お い て 停 止 距 離 の 分 布 が 正 規 分 布
N(40,12) であるとして、10 回の走行テストの平均停止距
定理を証明するには積率母関数という考え方を応用す
る。長くなるので e-Book 版では証明を割愛する。書籍
離が 41 メートルを超える確率を求めよ。
版 113 ∼ 115 頁を参照されたい。
2
例題4の解答 毎回の停止距離は正規分布 N(40,1 ) に従
この中心極限定理を用いると、多数の人を対象にある
って色々な値をとる。このような分布から無作為に抽出
質問をして「はい」か「いいえ」の回答をもらうという
する 10 個のデータの標本平均は定理1(標本平均の分
アンケート調査によくみられる質問形式に対しても、正
2
布)から N(40,1 /10) となる。 X の標準偏差は 0.32 である。 規分布を応用できる。その理由は例題 2 で説明したよう
この値を用いると
に、「はい」を1、「いいえ」を0に決めておけば、
「は
い」と回答する人の割合は母集団分布をバイナリー分布
としたときの標本平均になるからである。
バイナリー分布という正規分布とはかけ離れた分布で
自動車のブレーキ性能が正常なら 10 回の走行テスト
あっても、結果が標本平均として解釈できることで、正
の平均停止距離が 41 メートルを超えることはまずない
規分布の確率法則を適用して色々な推測が可能になる。
ものと思ってよいことがわかる。
ここに中心極限定理の威力がある。
3.2.3 中心極限定理
似できる」ということである。たとえば 100 人に対する
ただし中心極限定理で述べているのは「正規分布で近
視聴率調査の結果は「みた」と答えた場合に値 1 をとる
第 3.2.2 節で述べたことは「正規母集団から無作為抽
として、視聴率は
出されたデータの標本平均は正規分布にしたがう」とい
うことである。
‒ 6 ‒
図 3.3
割合の分布 (n=100, p=0.3)
のかという疑いを抱かざるを得ないだろう。データはそ
の 1 個 1 個がすべて母集団に関する情報である。情報の
����
数が無限に増えれば、母集団の性質は無限に正確に明ら
かになるのではないかと考えることはそれほど非合理な
����
要求ではない。大数の法則はこうした疑問に答えている。
大数の法則を述べるには色々なバリエーションがあるが、
����
次の定理を示しておく。
����
定理4(大数の法則)
2
平均が µ、分散が σ である母集団から無作為に n 個
����
���
���
���
���
���
���
のデータを抽出する。このとき標本平均 X について以下
のことが成り立つ。
任意の正数εに対して
のように 101 通りの値しかとりえないので連続ではない。
簡単にいうと、「データ数を増やすことによって、標
正規分布にしたがう変数は連続型だから、厳密に「みた」
本平均と母平均の違いをほぼ確実にいくらでも小さくで
と回答する人の割合が正規分布するとは言えない。しか
きる」ということである。偶然によって値が変わるはず
し、データ数 n を 100、社会全体の真の視聴率 p を 0.30
の標本平均が常に一定の値を示すように結局はなること
として、100 人のうちで「みた」と回答する人の割合 の
なので、この性質を標本平均の一致性 (Consistency) と
標本分布を描いてみると図 3.3 のようになる。
呼んでいる。
図 3.3 をみると、確かに分布の形は左右対称の正規分
上の定理を証明するにはまず次の補題「チェビシェフ
布に近い。100 人についての視聴率がある区間、たとえ
の不等式を」が有用である。これも有名な不等式だから
ば区間 [0.28, 0.32] の中に入る確率を求めるには、上の標
とりあげておこう。
本分布を正規分布
補題(チェビシェフの不等式
に近似した上で、
2
確率変数 X の平均と分散をそれぞれ µ、σ とおく。こ
のとき λ > 1 なる正数に対して不等式
のように、標準値に変換してから標準正規分布の数値表
が成り立つ。
を利用すれば容易に確かめられる。
(証明)
3.2.4 大数の法則
左辺の確率記号の中身を次のように書き換えても同じ
ことである。
データを集めることの時間や費用を無視することがで
き、いくらでも多くのデータを集めることさえできるな
らば、どのような形の母集団分布であれ、集めたデータ
からその形を正確に知ることは可能なのかという問題が
ある。これに関連するのが大数の法則である。
たとえば分布の中心である母平均をとってみよう。母
だから
平均を確率変数である標本平均から正確に知ることがで
を求めればよい。
分散の定義を思い出すと、X の確率密度関数を f(x) と
平均は母集団の平均値だから定数である。定数である母
して、
きるのかと問われれば、そもそもそんなことは不可能で
あるといわざるを得ない。母集団の平均や分散をデータ
から正確に知ることができるためには、データから計算
する適当な統計量が、データとは関係なく一定の値を常
にとるということを含意するからである。
この右辺の積分範囲を
の二つに分けると、
しかし、どれほど多数のデータを集めても、母集団の
特性を正確に知ることはデータからは決してできない
のであれば、そもそも何のために多くのデータを集める
‒ 7 ‒
と
期待値計算をした結果が、大標本では一致してくるはず
だ、というのが大数の法則が言おうとしていることなの
である。いま用いた用語「大標本」は中心極限定理や大
数の法則を適用してもよいサイズの標本を指す用語であ
り小標本と対で用いられる。
3.3 標本分散 S2 の分布
2
標本平均に対して標本分散 S はどんな特徴をもった標
となるので、
本分布に従うのだろうか。
第 1 章で散布度の指標としてとりあげたように、デー
2
タ X1,X2, ... Xn から求められる標本分散 S は
が示される。
上の補題の証明では分散の定義以外に―母平均や母分
2
散が値として存在するということ以外は―何の仮定もな
という式で求められる値である。S もデータから計算さ
い。したがってチェビシェフの不等式は極めて広範囲に
れる統計量だから X と同じく確率変数であり標本分布を
成り立つ一般的な結論である。
持つ。この様子は図 3.1 の最右列にも示されている。
ここで実験をしてみよう。日本人全体を母集団として
例題5 定理4(大数の法則)を証明せよ。
図 3.4
例題5の解答 チェビシェフの不等式を X に当てはめる
無作為データ抽出の実験(200 回)
標本平均の分布
標本分散の分布
とおくと、チェビシェフの不等式
0
となるので、
0
10
10
20
左辺の確率の中身は
20
30
30
40
40
と
160
165
170
175
180
0
50
100
150
200
2
身長分布が N(168,10 ) であるとしよう。いま図 3.1 のよ
は
うに、この母集団から無作為に 10 人のデータを抽出し
2
ては X と S を算出するという反復実験をする。何回目か
2
で打ち切り、それまでに得られた X と S をヒストグラム
となる。この右辺をみると、任意の正数 ε に対して、デ
に描き分布の形を見る。そうすれば標本平均と標本分散
ータ数 n を十分大きくすることにより、右辺の値をいく
の分布を視覚的に確かめることができる。
図 3.4 は 200 回の反復実験の結果である。左が標本平
らでも小さくできる。ゆえに
均の分布、右が標本分散の分布である。
が常に成り立つ。これが大数の法則で確かめるべき結論
標本平均の分布は多少歪んでいるようにも見えるが、
ほぼ左右対称で分布の中心の X 座標が母平均に等しい
だった。
168 程度である点が確認できる。図は 200 回の反復結果
上の例題ではデータ数が増えるにともない X が E[X] に
2
3
だが、更に繰り返した場合に、標本平均の分布が正規
一致してくることをとりあげた。さらに X や X をと
分布 N(168,10) に近づくことは、ある程度予想できよう。
っても同じである。大数の法則はデータから計算される
他方、標本分散 S の分布は左右非対称の形になっている。
平均値について成り立つ定理である。たとえば、データ
2
2
母集団の分散は σ =100 だから S の値も平均的には 100
2
から計算する二乗の平均 ∑X /n が母集団分布での期待値
2
前後の値を示すように思われるが、図は必ずしもそうな
E[X ] に一致してくることは大数の法則から確かめられ
2
っているわけではない。むしろ図 3.4 に示されている標
る。
本分散の分布のモードは 70 近辺にあると思われ、真の
データから平均計算をして得られる値と母集団分布で
分散である 100 よりは小さい値を頻繁にとっている。
‒ 8 ‒
2
このように統計量 S の標本分布では、その平均値が母
2
分散 σ の値に一致してくれるかどうか定かではない。
3.3.1 カイ二乗(
に
を代入すれば
)分布
2
標本分散 S の分布を考える上で基本となるのがカイ二
乗(
布の対称性による。標準正規変量 Z の確率密度関数 f(z)
となる。
)分布である。
2
カイ二乗変量の定義 標準正規分布 N(0,1) にしたがう独
立な k 個の変数 Z1,Z2, ... Zk がある。このとき、二乗和
これは 1 個の Z の合計がしたがう分布だから自由度 1
分布である。その分布は図 3.5 の中に示されている。
の
図 3.5
布のことを自由度 k のカイ二乗(
カイ二乗分布と自由度
0.6
を自由度 k のカイ二乗変量といい、この値がしたがう分
)分布と呼んでいる。
カイ二乗変量を表すのにしばしば W を用いる。あるい
でカイ二乗変量を表すことも
0.5
は自由度 k を添字にして
k=1
多い。一定の自由度をもったカイ二乗変量は一定の分布
2
0.4
に従う確率変数である。何個の Z を合計するのかとい
うその個数を「自由度」という名称で呼んでいることに、
k=2
0.3
それほど不自然な感はないだろう。N(0,1) にしたがって
分布する独立な k 個の Z は、互いに影響しあうことなく
k=3
0.2
自由に値をとれる、という意味合いで使われている。
k=4
0.1
例題6 標準正規分布 N(0,1) を母集団分布として、1 個
2
のデータ Z を無作為に抽出しその値を二乗する。W=Z
0.0
の値はどんな標本分布にしたがうか。確率密度関数を求
めたうえ分布図を描画せよ。
0
2
3
4
5
図 3.5 では、自由度が 1 の
例題6の解答 Z は標準正規分布にしたがうので確率密
度関数を f(z)、分布関数を F(z) とすれば、
1
6
7
8
9
10
分布のほか、2、3、4 の
場合をとりあげて分布の形状の変化が示されている。図
からわかるように、自由度が増えるにしたがって分布は
右方へシフトする。自由度が増すということは合計する
Z2 の個数が多くなるわけであるから、合計値である
2
値
である。いま W=Z のしたがう確率密度関数を g(w)、分
が平均的に大きくなることは容易に了解されよう。分布
布関数を G(w) とおく。確率変数から新たに定義される
図の形としては左右非対称であり、右方へ大きく裾を引
変数の分布を知るには分布関数から先に求めるのが計算
いている点が特徴である。しかし、自由度が増えるにと
上の定石である。そこで W の分布関数 G(w) を先に求め、 もない分布の非対称性は徐々に目立たなくなり、次第に
分布関数を微分して確率密度関数 g(w) を導くことにする。 左右対称な形状に近づくという傾向も見てとれる。そし
まず分布関数の定義から
て、何よりも
分布の形は、図 3.4 に示されている標本
2
分散 S の分布と似ている点が注目される。
定理5(カイ二乗分布の平均と分散)
である。この最右辺を Z の分布関数を用いて書き直すと
自由度 k のカイ二乗(
)分布にしたがう確率変数 W
の平均と分散は以下のように示される。
を得る。両辺を変数 w で微分すると
(証明)
自由度 k のカイ二乗変量 W は、標準正規分布にしたが
2
う独立な k 個の Z の合計だから、
上の 3 番目の等号で f(–w)=f(w) としているのは正規分
と表される。そこで
‒ 9 ‒
... (*1)
となり
分布の平均値が確認される。
分散が 2k になることを確かめるには
分布の確率密
度関数を利用する必要がある。これについては書籍版
となる。上式右辺の第 2 項は以下のように変形すると見
やすいだろう。
133 頁以降の Appendix を参照されたい。
...
一般的な正規分布とカイ二乗分布:
(*2)
自由度 k のカイ二
乗変量は、標準正規分布 N(0,1) を母集団として、k 個の
2
母集団分布の平均と分散が µ、σ であることから、標
2
無作為標本をとるときに定義される値だった。しかし実
本平均 X の分布は正規分布 N(µ,σ /n) である。したがっ
際に分析対象となる母集団は色々な平均や分散の値をと
て、上式 (*2) の右辺は、確率変数 X を標準化する式にな
2
る。一般的に正規分布 N(µ,σ ) を母集団として、そこか
っている。つまり式 (*1) の第 2 項は、1 個の標準正規変
ら k 個のデータ X1,X2, ... Xk を無作為に抽出するとき、
量 Z を二乗したものと考えられる。したがって、式 (*1)
分布はどのように関係してくるだろうか。
は、n 個の標準正規変量の二乗和から 1 個の標準正規変
量の二乗を引いた値になり、自由度は n ではなく n–1 と
考えられる。
定理6(正規分布とカイ二乗変量―1)
2
正規分布 N(µ,σ ) から無作為に抽出される値 X1,X2, ... Xn
別の説明の仕方をすれば、確かに
に対し、
は n 個の値の二乗和になっているが、これら n 個の変数
のように変数 W を定義すると、W は自由度 n の
分布
の間には
に従う。
(証明)
2
右辺の母分散 σ を総和記号の中に入れる。すると各項
という一本の制約がある。だから n–1 個の値が決まれば
残りの 1 個も決まってしまう。つまり自由に値をとれる
になる。これは確率変数 Xi の標準化変数にな
は
変数の個数は n–1 個しかない。それで自由度は n ではな
く n–1 になると考えてよい。
っているので変数 Zi と同じ N(0,1) に従う。ゆえに W は
独立な n 個の標準正規変量の二乗和となるので、自由度
nの
例題7 標準正規分布を母集団として無作為に 6 個の値
Z1, ... Z6 を抽出し、W=∑Zi2 を求めるとする。変数 W の
分布にしたがう。
上の定理と似てはいるが、結論が異なる次の定理は応
値が 10 を超える確率を求めよ。
用に際して大変重要である。
厳密な証明ではなくなぜ自由度が n ではな n–1 になる
例題7の解答 互いに独立な Z1, ... Z6 から定まる W は自
由度 6 の
定理(正規分布とカイ二乗変量―2)
分布にしたがう。求める確率は
2
正規分布 N(µ,σ ) から無作為に抽出される値 X1,X2, ... Xn
に対し、
多くのテキストに掲載されている数値表にはカイ二乗
分布のパーセント点しか示されていない(書籍版巻末の
付表もそうである)。そのような場合は以下のように比
例補間を行うとよい。
によって定められる変数 W は自由度 n–1 の
分布に従
う。
のかという理由を示しておこう。データ X1,X2, ... Xn の平
均を X 、µ を母平均とすると
と偏差二乗和を変形できる。
この等式を利用すると、
3.3.2 統計 S2 の分布の特徴
2
標本分散 S の分布が
2
分布に似ていることは既に指
摘した。しかし S はいくつかの標準正規変量の二乗和に
‒ 10 ‒
はなっていないので
変量との関係を明らかにしておか
Exercise
なければならない。
定理7(正規分布とカイ二乗変量―2)を利用すると
[1] 統計量
S2 は次のように書ける。
2
が母分散 S に対して不偏性をもつことを示
せ。
[2]V[
] を求めよ。
3.4 正規分布から派生する分布
正規分布とカイ二乗分布は、最も頻繁に利用される統
2
したがって、統計量 S は自由度 n–1 のカイ二乗変量
と一対一の対応関係にある。ということは、
2
計量である X と S と関係しており、統計学全般の中で基
変量が
本的な役割を果たす分布である。しかし、統計分析で利
ある区間の中に入る確率と、その区間に対応する区間に
用されている統計量はこの他にもある。新たな統計量を
2
S が入る確率とは同じ値である。その結果、カイ二乗分
2
布と標本分散 S の分布は形としては同じになる。ただ、
2
分布の形状は同形であるが、S の標本分布を
分布とは
呼ばないので注意してほしい。
使い始めるとき、しばしば新しい確率分布が発見されて
いる。本節では、「ステューデントの T 分布」と「スネ
デカーの F 分布」をとりあげておこう。どちらも第 4 章
で解説する統計的推測には欠かせない分布である。
標本分散の分布について平均と分散を計算してみよう。
3.4.1 ステューデントの T 分布
2
まず E[S ] だが
T 分布は互いに独立な確率変数 Z と W がそれぞれ標
準正規分布 N(0,1)、自由度 n の
2
となる。この式をみると、統計量 S の分布における平均
分布にしたがうとき、
T
は母分散と一致せず、母分散よりも小さい値になる。つ
まり標本平均とは異なり、標本分散は母分散に対して不
によって定められる値 T が示す確率分布として定義され
偏性を有していない。
次 に、 標 本 分 散 の 分 布 に お け る 散 布 度、 す な わ ち
2
V[S ] を求めると、
る。
2
分布はいくつかの Z を合計した値として定義さ
れたが、T 分布は二つの独立な変数の商が示す分布とし
て定義されている。
分母の
変量は、自由度 n の値が異なれば、異なった
分布を示すので、変数 T の分布も
分布の自由度がいく
らであるかによって分布の形が変化することになる。そ
こで分母の
分布の自由度が n である T 分布を自由度 n
2
2
となる。データ数 n が増えるにしたがって E[S ] は σ に
の T 分布と呼んでいる。また、変数 T のことを T 値、あ
2
収束し、V[S ] は 0 に収束するので、標本分散について
るいは小文字で t 値といっている。
図 3.6 は自由度が 1、5、25 の T 分布と標準正規分布の
も
確率分布である。図のように、T 分布は標準正規分布に
近い形をしており、左右対称でモードは値 0 である。図
となり、大数の法則が当てはまる。
2
2
上に述べたように、統計量 S は母分散 σ に対して不
の中には、自由度が 1、5、25 の T 分布が描かれているが、
偏性を有していないが、
図 3.6
2
で定義される統計量 は、母分散 σ に対して不偏性をも
つ。それで
を分散の不偏推定量と呼んでいる。この
はデータの平均二乗偏差ではなく、また母集団の分散 σ
2
とも区別される値である。データの分散を求める場合に、
2
標本分散 S を常用するべきか、不偏推定量 を用いるべ
きかという点について正解があるわけではないが、デー
タを抽出した母集団が明確に定義されている場合は
を
利用するほうが習慣になりつつある。
‒ 11 ‒
T 分布と自由度
自由度 1 の T 分布は、他の分布に比べると値 0 の確率密
度が最も低く、両裾を最も高くひいている実線で示され
2
例題9 正規分布 N(168,10 ) を母集団とし、5 個の無作
ている。自由度が増すにともない、T 分布は左右の裾が
為データ X1, ... X5 を抽出したうえで、データから計算さ
低く、頂上がより高くなり、標準正規分布の形に近づく
れる X と を用いて
ことが見てとれる。
標準正規分布は、T 分布に比べると、左右の両裾が最
も低く、頂上は最も高い。要約すれば、T 分布にしたが
う確率変数は標準正規分布にしたがう変数に比べて、絶
を計算する。確率 P(T > 2.0) を求めよ。
対値の大きな値がより頻繁に現れがちである。つまり、
平均は 0 であるが標準偏差が 1 を上回るという特徴があ
例題9の解答 標本サイズ n=5 であるから上の例題から
る。T 分布の確率密度関数については書籍版第 3 章末の
T ∼ T4
Appendix を参照していただきたい。
がいえる。したがって P(T > 2.0)=0.058 となる。
書籍版巻末の付表は T 分布のパーセント点を求める形
2
例題8 正規母集団 N(µ,σ ) から無作為に抽出された n
になっているので、次のように比例補間をするとよい。
個のデータから
ちなみに T 値を標準値と受け取ってしまうと値 2.0 を
で定義される変数 T を計算すると T は自由度 n–1 の T 分
超える確率は 0.023 と評価することになる。母分散では
布にしたがう。このことを簡潔に示せ。
なく不偏推定量
を用いて標準化すると T 値は 2 倍以上
の確率で 2 を超えることがわかる。
例題8の解答 式中の
2
が σ であれば、変数 T を定義
している右辺は X の標準化と一致するので、確率変数 T
2
は N(0,1) に従う。母分散 σ でなく統計量
T 分布は大きい値が出やすい
を使うと標
本分布が N(0,1) ではなく自由度 n–1 の T 分布となること
3.4.2 スネデカーの F 分布
を示すのが、この例題の趣旨である。
いま
互いに独立な二つの確率変数 W1 と W2 はそれぞれ自
由度 n1、n2 の
分布にしたがうとする。このとき
∴
また、
の定義と定理7(正規分布とカイ二乗変量―
2)を思い出すと
で定義される変数 F は、自由度 (n1,n2) の F 分布にしたが
う。また、このように計算された値のことを F 値という。
図 3.7
F 分布と自由度
(10,10)
(10,30)
(1,1)
が得られる。但し、記号∼は確率変数が従う分布を示す
意味で広く使われている。
0.5
この二つから T 値を次のように定義できる。
この左辺がこの例題の右辺と一致することは容易に確
かめられる。
T 値は標準値 Z の代わりである
には X と が互いに独立であることを示す必要があるが、
この点は省略する。
0.0
T 分布になるためには、分母と分子の独立性、具体的
0
‒ 12 ‒
1
2
3
4
5
6
7
8
9
10
分布の平均はその自由度に一致する。F 値を定義し
ている分母、分子はカイ二乗変量とその平均値の比にな
っているので、平均的には分母、分子とも値は 1 である。
したがって、式を一見するだけで、F 値は概ね 1 前後の
値をとるはずであると見当がつく。理論的に計算をすれ
ば、E[F]=n2/(n2-2) であることが分かるので、多少 1 を上
回る値となるが、分母の自由度が大きいときには、ほぼ
1 と考えてよい。分母の自由度が 2 以下の場合、F 分布
の平均値は計算できない。
図 3.7 には自由度が (10,10)、(10,30)、(1,1) の場合の F
分布が示されている。具体的な確率密度関数については
書籍版第 3 章末の Appendix を参照されたい。
2
2
例題10 二つの正規母集団 N(µ1,σ 1) と N(µ2,σ 2) から
それぞれ n1 個、n2 個のデータを無作為に抽出し、
を計算する。但し、
1と
2 は抽出した二つの標本から
計算される分散の不偏推定量である。変数 F の分布は、
σ21=σ22 が成り立つならば、自由度が (n1–1,n2–1) の F 分
布となることを示せ。
例 題 1 0 の 解 答 抽 出 し た 二 つ の 標 本 を
、
とする。
2
2
だから、σ 1=σ 2 が成り立つ場合は、F 分布の定義から
Exercise
[3] T 分布の自由度を無限に大きくするにともない T 分
布は限りなく標準正規分布に近づく。その理由はな
ぜかを考察してみよ。
[4] T 値を二乗した値は自由度が (1,n) の F 分布にしたが
って分布することを示せ。
‒ 13 ‒