統計学 第5回 西山 第4回のまとめ 主な確率分布 バイナリー分布(0‐1分布) 一様分布 正規分布 N(平均、分散) 正規分布の確率の求め方 1. 標準値に直す ⇒ 平均0、分散1 2. 数値表の使い方 1シグマ 区間じゃ 復習クイズ 1.確率変数Xは正規分布N(168,100)に従っている.確率 P(158 ≦ X ≦ 178)を求めなさい.更に、同じ分布で確率 P(170 ≦ X < 180)を求めなさい. 2.一様分布U[0,1]に従う確率変数Xから新たにY=2X+1 のように変数Yを定義する。E[Y]とV[Y]を求めなさい. 3.確率変数Xの確率分布は次の式で表される. ax, 0 x 2 f ( x) 0, その他 定数aの値を求め、さらにE[X]とSD[X]を求めなさい. 2シグマ区間 はどうなる? で、確率は? 3シグマも たまあに使 うぞ! 第5回目の目標 標本分布とは何のことか? データの平均値(=標本平均)の分 布とばらつき方 ここが最初の 難関かも知れ んな 教科書: 第3章の頁99~108、特に 108頁の例題29 第3章に進みます 1. 2. 3. 第3章は難所です. 第3章は統計理論の急所です. 第3章はポイントだけをとりあげます. まず、データは無作為が原則です! サイコロを10回ほど振ってみましょう・・・ 不規則というか ランダムだなあ 1、1、4、6、4、3、2、3、6、5 得点状況をちょっと10人くらい見てみるか・・・ 15、95、70、73、88、25、98、69、71、73 ン?これは作為がありますヨ、 図星でしょ! なぜ無作為データであるべきか? 1.故意にとるデータは捏造と呼びます. 2.ランダムであるとき必然性が現れます. つまりランダムにとったデータの結果だ けは、定理や法則が知られています. では、ちょっと実験してみよう 正しいサイコロを2個振って出る目の平均を とろう・・・どうなる? データ1 1回目 2回目 3回目 4回目 5回目 平均 分散 データ2 4 2 1 5 1 2.6 2.64 ここに出てくる 分布を標本分 布と言うな 2 5 5 5 3 4 1.6 標本平均 標本分散 3 1 3.5 2.25 3 4 5 0 2 1 3.3 1.65 0.96 1.89 ちょっと5回 やってみたん じゃが・・・ 平均値はや るたびに違う のう 5回くらいじゃ分からん!1000回やれ! 標本平均の分布 180 160 140 120 100 80 60 40 20 0 最大値 最小値 平均値 分散 1- 1.5- 2- 2.5- 3- 3.5- 4- 4.5- 5- 5.51.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6 1 3.475 1.439314 着目点は分布の 中心とバラツキ じゃ 1.これまた別の分布の形になりましたね 2.平均は元の値だが、分散は2.92の2分の1になりました. データ数を増やすと・・・ 2個のサイコロだと う~む、何か法則 がありそうじゃのう 10個に増やすと 標本平均の分布 標本平均の分布 250 180 160 140 120 100 80 60 40 20 0 200 150 100 50 1- 1.5- 2- 2.5- 3- 3.5- 4- 4.5- 5- 5.51.5 2 2.5 3 3.5 4 4.5 5 5.5 6 最大値 最小値 平均値 分散 6 1 3.475 1.439314 1. 51 1. .86 86 -2 2. .22 22 -2 2. .58 58 -2 . 2. 94 94 -3 3. .3 33 3. .66 66 -4 4. .02 02 -4 4. .38 38 -4 . 4. 74 74 -5 .1 0 最大値 最小値 平均値 分散 5.1 1.5 3.4806 0.312917 理論としてはこうなる! 第3章の定理8が 基本じゃが、 定理10までは落と せんな 平均がμ、分散がσ2 である集団から無作為に取り出した n 個のデータを X 1 , X 2 , X n と し、データから求められる標本平均を X とおく。このとき、 X の標本分布の平均と分散は それぞれ E X V X となる。 形は常に正規分 布と思っていいの じゃ・・・ 2 n 教科書106頁 とにかくこれを使い こなすのがポイント じゃ 理論的に求めよう・・・ 2個の正しいサイコロを振って出る目の平均と分散は さっきの表を見な がら定理8を証明 してごらん E X 3.5 V X 2.92 1.46 2 2.92 2 3 .5 では10個のサイコロを振ったときについて同じ質問! 実験結果と 合ってるじゃ ろう? E X 3.5 V X 2.92 0.292 2 2.92 10 3 .5 データの結果もばらつきます いくつかのデータの結果を統計量と言いま す.代表例は平均値と分散、標準偏差. 統計量は特有の確率法則にしたがいます. この分布のことを標本分布と言います. 特に標本平均(=データの平均)の標本分 布は重要です. 練習問題(1) ある乗用車のブレーキはかけてから40メートルで停止するよう に作られている.ただ踏み込むときの強さなどから停止距離に はバラツキがあり、その標準偏差は1メートルとおいてよい.い ま10回反復してブレーキのテストを行うと、10回の停止距離の 平均値はどの程度の値になるか.1シグマ区間で解答しなさい. EX 40 1 V X 0.1 SDX 0.1 0.32 10 2 練習問題(2) 旅客機利用客の体重は全体として平均55Kg、標準偏差 10Kgで分布していると言われる。では定員400人が満席の 時の旅客総ウェイトの最大値をいくらと見込むとよいか? 標本平均の分布 合計をきいてい るが、合計と平 均は紙一重じゃ 250 200 150 100 0 -5 3. 53 .83 83 -5 4. 54 .14 14 -5 4. 54 .44 44 -5 4. 54 .75 75 -5 5. 55 .05 05 -5 5. 55 .35 35 -5 5. 55 .66 66 -5 5. 55 .96 96 -5 6. 56 .26 26 -5 6.5 7 こうなることは理論 的にわかっておっ た!定理8じゃ! 50 53 .53 総ウェイト= 400 (400人の平均体重 ) 最大値 最小値 平均値 分散 56.56709 53.53117 55.00031 0.256368 実験結果 じゃ 練習問題(2)の解答 全体として平均55kg、標準偏差10kgで分布している. つまりμ=55、σ2=102だから 平均値の分布 E X 55 10 2 V X 0.25 SDX 0.25 0.5 400 図を描いて、2 シグマ区間を 示しなさい 最大値は3シグマ区間の上限で憶測するのが簡単な方法だから Xの最大値 55 3 0.5 56.5 心配なら4シグマ をとればまあ安心 じゃ.最大57kg じゃナ! 次回への予習のポイント 次回は 標本平均の分布について問題が解けるよう になってもらいます 教科書の関係部分:頁104~116までの特 に例題を参照してください
© Copyright 2024 ExpyDoc