第 章 標本分布

第 章 標本分布
ある集団において現象する偶然的現象を解析するためにどのよう
な数理モデルを作るかということが問題である 本章では そのよう
な集団の数理モデルが確率空間として表され その集団における偶
然的現象がその確率空間上の確率変数として表される場合を考える
このとき その確率変数の変域を母集団といい その母集団から
採取した標本を用いてその確率変数の確率分布に関する知識を得る
ことが問題である
そのために 標本から定められる統計量の標本分布を定める必要
がある 本章では 様々な統計量の標本分布について理論的に考察
する
母集団と標本
一つの集団を考えて その集団のある偶然的特性についての統計
学的資料について統計学的に見てある判断が正しいか あるいは有
意であるかということを考える
そのとき その集団の数理モデルは確率空間
として表
される
その集団について 調査対象とする偶然的特性は その集団の各要
素に一つの数値を対応させることによって得られる確率変数 と
して表される
このとき 変数 の出現値の全体の集合である
の変域 を
の母集団という
の個々の実現値を母集団 の個体という
本書で考察する母集団は無限に多くの個体からなる無限母集団で
あると仮定する
このことは
の母集団から 必要な回数だけ多数回にわたって
一つ一つ個体を取り出せることを意味する
このようにして母集団から取り出した個体の列
を標本といい をその標本の大きさという
統計学では このような有限の大きさの標本を用いて 母集団の
統計的性質すなわち変数 の確率分布に関する知識を得ることが
問題である
標本の大きさが相当大きい場合にこれを大標本といい 標本の大
きさが比較的小さい場合にこれを小標本という 標本の大きさが大
きいほど これに基づいて行われる統計的判断は一般に容易で し
かも正確になる
母集団から無作為的に個体を取り出すことによって採取された標
本を無作為標本あるいは任意標本という
今後 本書において考察する標本はすべて無作為標本であるとする
そのために 標本採取に当たっては 可能な限り無作為的にする
ために くじ引きをしたり 「乱数表」を用いたり 様々な工夫をし
なければならない
変数 の母集団から採取した標本を用いて 度数分布表あるいは
度数表を作ったり 度数多角形やヒストグラムでその変数の分布状
態を図示したりする
さらに その標本を代表する値として 標本平均値 メジアン モー
ドなどを用いることがある
その標本の個体のちらばりを測る量として 標本分散や標本標準
偏差が用いられる
その他に 変数標本に対して 標本平均値 標本分散 標本標準
偏差 標本共分散 標本相関係数などを考える
上に考察した統計資料としてのデータの扱い方について詳しいこ
とは伊東
第 章を参照してもらいたい
変数 の母集団から一定の大きさの標本を多数回採取したとき
標本平均値などの量は偶然的に変動すると考えられる
このとき このように標本から定められる関数を統計量という
このとき この統計量を確率変数と考えて その確率分布を決め
ることを考える このような統計量の確率分布を標本分布という
ここで考える統計量とその標本分布に対して 次の数理モデルを
考える
いま 確率変数 の確率分布が分布関数
によって与えられ
ているとする このとき 確率変数の列
は独立で そ
は と同じ分布関数
をもつとする このと
の各々の変数
き 変数の組
を の母集団から採取した無作為
標本という これが無作為標本の数学的表現である
このとき
の関数としての確率変数
を統計量という
ここで この統計量 の標本分布を決めることが問題である す
の確率分布あるいは分布関数を定めることが問題である
なわち
以下の節において 様々な統計量の標本分布を考察する
標本平均値の分布
変数
均値を
の母集団から標本
を採取したとき 標本平
とする
ここでは 特にことわらない限り無作為標本を考える
このとき 統計量 の標本分布を考える
いま
の分布関数が
であるとき
の平均値
分散
標準偏差 をそれぞれ母平均値 母分散 母標準偏差という
考えている標本が無作為標本であるということは 確率変数の列
は独立で その各々の変数 は
と同じ分布関数
を持つということである
したがって 各変数 の平均値 分散 標準偏差は と同じで そ
れぞれ
である
したがって 次の定理が成り立つ
定理
の母集団から採取した一定の大きさ の無作為
標本の標本平均値 の平均値を
分散を
標準偏差を
とす
ると 等式
が成り立つ
証明 定理
によって
を得る ゆえに 定理が証明される
この定理
によれば 一つの母集団から標本を採取するとき
標本平均値 は母平均値 を中心として分布し 標本の大きさ
を大きくすればするほど
の分布のちらばりは小さくなるという
ことがわかる
特に
が正規分布
に従う場合に の母集団を正規母
集団
という
このとき 次の定理が成り立つ
定理
正規母集団
の無作為標本
から採取した一定の大きさ
の標本平均値
は正規分布
に従う したがって 変数変換
によって得られる変数 は標準正規分布
証明 前半は定理
より従う 後半は
に従う
節
項より従
う
注意
の分布が正規分布でない場合でも 標本の大きさ
が十分大きい場合には 標本平均値 の分布は正規分布
に近いと考えられる 中心極限定理
標本分散の分布
分布
変数 の母集団から一定の大きさ
を採取したとき 標本分散
の無作為標本
の分布について考える ここで
の母平均値を
する
このとき 次の定理が成り立つ
定理
上の記号を用いるとき 等式
母分散を
と
が成り立つ
証明 の定義よって 等式
を得る このとき 定理
によって
を得る
いま
とおく
このとき 次の系が成り立つ
系
が成り立つ
上の記号を用いるとき 等式
系
が成り立つので
この事実に関しては後述の
特に 変数 が正規分布
立つ
は分散 の不偏推定量であるという
節を参照してもらいたい
に従う場合に次の定理が成り
定理
正規母集団
から採取した一定の大きさ
の無作為標本の標本分散 の確率密度
は等式
によって与えられる
定理
らいたい
定理
定理
の標本
とおくとき
の証明に関しては 伊東
頁
節を参照しても
より直ちに次の定理が成り立つ
正規母集団
から採取した一定の大きさ
の標本分散を とし
の確率密度
によって与えられる
証明 確率素分の等式
は等式
にいて
であるから
となる したがって 定理
によって定理
が証明される
一般に 一つの正の変数
の確率密度が上記の
であると
き 変数
は自由度 の
分布に従うという
この分布は理論上においても実際上においても重要である
したがって 自由度 の様々な値に対して 関係式
によって
の様々な値に対応する
の値が計算されていて その
数値表が作られている これについては 巻末の付録の統計数値表
を参照してもらいたい
分布の性質
ここでは
いて考察する
定理
とおくと
分布
分布
節において定義された
が正規分布
は自由度 の
分布に関連する定理につ
に従うとき
分布に従う
証明 いま
とおくと
の確率密度
は
で与えられる このとき
である
ここで
の一つの実現値を考え 十分小さい正の数
をとる
このとき
となる正の数
をとると 等式
が成り立つ
ゆえに
の確率密度を
が成り立つ
ゆえに
と一致する
は定理
とすれば 等式
の
系
正規母集団
標本を採取し その標本平均値を
は自由度 の
分布に従う
において
から一定の大きさ
とするとき
とした場合
の無作為
証明 定理
と定理
より系が従う
定理
次元確率変数
次元正規分布に従うとき
は自由度
の
分布に従う
証明 伊東
頁 定理
定理
に従うとすると
は自由度
証明 である いま
の関係式
が成り立つ
が定義
の証明を参照してもらいたい
は独立で それぞれ自由度
の
の
の
分布
分布に従う
の確率密度を
の確率密度を
とすると
とすれば 確率素分
このとき 関数行列式は
であるから
を得る
いま
の確率密度を
が成り立つ ただし
ここで ベータ関数の公式
を用いると
とすると
とおいた
を得る これは 定理
場合である
定理
に従うとすると
の
において
は独立で それぞれ自由度
の確率密度
とした
の
分布
は
によって与えられる
証明 ある
いま
の確率密度
の確率密度を
が成り立つ
このとき 関数行列式は
であるから
は定理
の証明と同じで
とすると 確率素分の関係式
が成り立つ
したがって
が成り立つ ただし
とおいた
ここで
である
ゆえに 定理
が証明される
一般に 正値の変数 の確率密度が定理
の
であ
るとき
は自由度
の 分布に従うという この分布は理
論的にも実際的にも重要であるので 自由度
の様々な値に対
して 関係式
によって
の様々な値に対応する
の値が計算されて その数値
表が作られている これについては巻末の付録の統計数値表を参照
してもらいたい
特に
に対応する
の値を 分布の パーセントの点
といい
に対応する
の値を 分布の パーセントの点
という
系
二つの正規母集団の母分散が等しいとする いま 一方
の正規母集団から採取した一定の大きさ の無作為標本
に対し 母分散の不偏推定量を
とする また これとは独立に他方の正規母集団から採取した一定
の大きさ の無作為標本
に対し 母分散の不偏推定量を
とおく このとき 変数
は自由度
の
分布に従う
証明 両母集団の母分散を
とする
とし
の標本分散を とするとき
は自由度
の
の標本分散を
分布に従い
は自由度
の
分布に従う これに関しては定理
を参照してもらいたい
両方の標本は独立に採取したのであるから
と
は独立であ
ると考えられる ゆえに
は自由度
は定理
の
分布に従う これに関して
を参照してもらいたい
系
母平均値 の正規母集団から採取した一定の大きさ
の無作為標本
に対し その標本平均値を とし 母分
散の不偏推定量を
とする このとき 変数
は自由度
証明 母分散を
の
分布に従う
とすると
は自由度
の
分布に従う これについては系
てもらいたい
他方 標本分散を とすると
を参照し
は自由度
の
分布に従う これについては 定理
を参照してもらいたい
このとき
と
は独立である この事実は次の
節において
証明される
したがって
は自由度
の
このとき 次の定理が成り立つ
分布に従う
定理
の確率密度
系
と同じ記号を用いるとき 変数
は 等式
によって与えられる
証明 いま
とおくと は標準正規分布
に従い
は自由度 の
布に従う
系
の証明より と
は独立であることがわかる
したがって
の確率密度
は等式
によって与えられる
そこで
の確率密度を
が成り立つから 関係式
分
とすると 確率素分の関係式
が成り立つから 関数行列式は
となる したがって
が成り立つ ゆえに
が成り立つ これによって定理が証明される
定理
の変数 は自由度 の 分布に従うという これは
年にゴセットによって導入され
年にフィッシャーによって証
明された ゴセットのペンネームがスチューデントであったので こ
の分布をスチューデントの 分布ということがある これは新しい
統計理論である推測統計学の目覚しい発展のきっかけをつくったも
のとみなされている
定理
次元確率変数
は定義
の 次元正規分
布に従うとし その母相関係数が であるとする いま
の
変域 からなる母集団から採取した一定の大きさ の無作為標本
とする ここで 標本相関係数
を
は 等式
によって与えられる
このとき
であると仮定すると
は自由度
さらに
は
散
の 分布に従う
であると仮定すると
が相当に大きいならば 近似的に母平均値
の正規分布に従う
母分
定理
における の式を 変換といい 計算の便宜のために
変換の数値表が作られている これに関しては巻末の統計数値表を
参照してもらいたい
系
定理
ると仮定すると
は自由度
と同じ記号を用いる このとき
であ
の 分布に従う
コクランの定理
系
の証明において保留した点は 本節のコクランの定理に
よって解決される 一般に コクランの定理はある種の統計量の独
分布に従うことを証明するた
立性を検証し また同時にそれらが
めに応用される
まず 正値 次形式に対する線形代数学の一つの補題を示す
補題 個の変数
についての
個の非負
があって さらに それらの階数はそれぞれ
であって 等式
が成り立っているとする さらに 条件
が成り立っているとする このとき 適当な直交変換
次形式
を行って
が成り立つようにできる
証明 伊東
頁
節を参照してもらいたい
定理
コクランの定理 変数
は独立で 各
は標準正規分布
に従うとする
は
いずれも
の非負 次形式とし それらの階数はそれぞれ
で 等式
が成り立っているとする このとき
自由度 の
分布に従う ただし
件は
は独立で 各
が
ための必要十分条
が成り立つことである
証明 伊東
頁 定理
を参照してもらいたい
ここで コクランの定理を用いて 系
た点の証明を行う
系
の証明の補足 いま 系
の証明において保留し
の証明と同じ記号を用いて
とおく
ここで
とおくと
う
このとき 関係式
は独立で 各
は標準正規分布
が成り立つ
ここで
となるから
また 等式
は
を用いて計算すると
の 次形式として階数 である
に従
を得る したがって
は
の 次形式として階数
であることがわかる 明らかに
はともに非負である ゆえ
に コクランの定理によって
は独立である 同時に
はそれぞれ自由度
の
分布に従うことが証明される