VE NT AT I 虎 学 統計学 暫定版 川 歩 最終更新 2015 年 1 月 8 日 TE 随時更新中 NT AT I TE VE 最初 願 印刷 使 , 本 現在更新中 , ,完成後 書 始 ,R , 大 . , 例題 作 限 方 論文式試験 愛 止 我 R 取 関 , 分野 猛虎軍,阪神 甚 掲載 疑問 ,完成 確 式 付 関連 残 数 ). 暁 R (現在進行形). 未完 ,完成 気長 待 利用 . TE 思 当初,本文 「 , , 例題 野球 付 関数 .統計 取 利用 2015 年 1 月 8 日現在, 統計学 作成 思 (本当 形 身 選択科目 . Tips 出 本 書 TEX 網羅 羅列 使 手 統計学 担当 上,公認会計士 出題範囲 ,著者 必要 . 行 少 時「 利用 , 理由 本 沿 値例 印刷 方 数値計算 R ,短絡的 発想 原点 例 無理 高 .PDF ,興味 身 TEX 率 閲覧 . 本 特 .更新頻度 NT AT I 思 暫定版扱 PDF 使 VE i , 」調 容赦 改 」調 書 予定 .両方 ,手 文体 入 混 随 状態 . 2015 年 1 月 8 日 著者 NT AT I TE VE iii VE 目次 i 第1章 記述統計 1 持 意味 . . . . . . . . . . . . . . . . . . . . . . . . . . NT AT I 1.1 1.2 1 次元 代表値 . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2.1 中心 表 代表値 . . . . . . . . . . . . . . . . . . 3 1.2.2 広 表 代表値 . . . . . . . . . . . . . . . . . 5 他 代表値 . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.3 1.3 図 1.4 2 次元 1.5 1 次元 整理 . . . . . . . . . . . . . . . . . . . . 15 代表値 . . . . . . . . . . . . . . . . . . . . . . . . 20 各種指標 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 曲線 係数 . . . . . . . . . . . . . . . . . . 24 物価指数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.5.1 1.5.2 第2章 1 確率 33 2.1 標本空間 確率 基本 . . . . . . . . . . . . . . . . . . . . . . . . 33 2.2 根元事象 数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.2.1 順列 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.2.2 組合 41 条件 TE 2.3 2.3.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 確率 条件 2.3.2 第3章 3.1 3.2 確率変数 定理 . . . . . . . . . . . . . . . . . . . . 43 確率 . . . . . . . . . . . . . . . . . . . . . . . . . 43 定理 . . . . . . . . . . . . . . . . . . . . . . . . . 45 分布 49 確率分布関数・確率密度関数 . . . . . . . . . . . . . . . . . . . . 49 3.1.1 確率変数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.1.2 離散確率変数 . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.1.3 連続確率変数 . . . . . . . . . . . . . . . . . . . . . . . . . 50 代表値 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 確率変数 52 分布 3.2.1 平均値 分散・標準偏差 . . . . . . . . . . . . . 目次 iv 3.2.2 分布関数 第4章 4.1 53 . . . . . . . . . . . . . . . . . . . . . . . . . . 54 3.3.1 分布 . . . . . . . . . . . . . . . . . . . . . . . . 54 3.3.2 二項分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.3.3 多項分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.3.4 分布 . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.3.5 指数分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.3.6 一様分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.3.7 正規分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 確率変数 応用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.4.1 同時確率関数 . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.4.2 . . . . . . . . . . . . . . . . . . . . . . . . 70 NT AT I 3.4 基本的 期待値 . . . . . . . . . . . . . . . . . . . . . . . VE 3.3 確率変数 標本分布 77 標本平均 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 4.1.1 無作為標本 4.1.2 分布関数 4.1.3 有限標本 標本平均 . . . . . . . . . . . . . . . . . . . . . 77 標本平均 . . . . . . . . . . . . . . . . . . . . . . 79 標本平均 . . . . . . . . . . . . . . . . . . . 84 法則 . . . . . . . . . . . . . . . . . 85 不等式 . . . . . . . . . . . . . . . . . . . . . 85 法則 . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 4.3 中心極限定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 4.4 標本分散 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 4.5 標本平均 標本標準偏差 比 98 4.6 標本分散比 不等式 4.2 4.2.1 4.2.2 第5章 母数 5.2 5.3 分布 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 推定 母平均 TE 5.1 大数 大数 推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 105 5.1.1 母分散既知 場合 母平均 推定 . . . . . . . . . . . . . . . 105 5.1.2 母分散未知 場合 母平均 推定 . . . . . . . . . . . . . . . 107 推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 母分散 5.2.1 母平均既知 場合 母分散 推定 . . . . . . . . . . . . . . . 108 5.2.2 母平均未知 場合 母分散 推定 . . . . . . . . . . . . . . . 110 推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 成功率 第6章 仮説検定 6.1 仮説検定 115 基礎 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 6.1.1 仮説検定 考 方 . . . . . . . . . . . . . . . . . . . . . . . 115 6.1.2 仮説検定 2 過誤 . . . . . . . . . . . . . . . . . . . . . 117 v 6.3 母平均 関 検定 . . . . . . . . . . . . . . . . . . . . . . . . . 118 6.2.1 母分散既知 場合 . . . . . . . . . . . . . . . . . . . . . . . 118 6.2.2 母分散未知 場合 . . . . . . . . . . . . . . . . . . . . . . . 119 差 検定 . . . . . . . . . . . . . . . . . . . . . . . . . 121 母平均値 6.3.1 母分散既知 場合 . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 母分散未知 等 6.3.3 母分散未知 等 6.4 母分散比 6.5 母分散 場合 121 . . . . . . . . . . . . . . . . . . . 122 VE 6.2 場合 . . . . . . . . . . . . . . . . . 124 検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 6.5.1 母平均既知 場合 . . . . . . . . . . . . . . . . . . . . . . . 127 6.5.2 母平均未知 場合 . . . . . . . . . . . . . . . . . . . . . . . 128 6.6 適合度 6.7 独立性 6.8 2 乗検定 . . . . . . . . . . . . . . . . . . . . . . . . 129 130 母成功率 検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 6.9 母成功率 差 検定 . . . . . . . . . . . . . . . . . . . . . . . . . 132 6.10 無相関 検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 NT AT I 検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 第7章 7.1 第8章 8.1 付録 A A.1 線形関係 推定 135 線形回帰 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 分散分析 139 分散分析法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 付表 145 標準正規分布表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 2 乗分布表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 A.3 F 分布表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 A.4 t 分布表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 TE A.2 索引 149 NT AT I TE VE 1 VE 第1章 記述統計 後日,図 統計学 計 差 替 大 分類 収集 , 扱 . NT AT I 章 記述統計 平均 示 傾向 .以下 取 推測統計 分散,標準偏差 性質 把握 記述統計 上 代表値 手法 用 . 種々 代表値 分布 明 章 記述統計 指標 意味 計算方法 . 持 意味 1.1 記述統計 ■ 用語 測 代表値 指標 触 触 . 量的 情報,後者 質的 TE 数値化 数字 表 調査 情報 年齢 母集団 統計学全般 .例 呼 一番正確 , 用 実験 観 ,文字 *1 呼 扱 *1 前者 定量的, 後者 定性的 呼 . ,量的 扱 重要 日 . 考 限 . .例 *2 , ,実際 順序 表 意味 持 母集団 甲子園球場 場合 標本 開催 調査対象 少 阪神 全観客 巨人戦 . 触 観客 観客全体 . 方法 ,4 万人以上 観客 行 統計学 . 標本 調 調査 5 段階 回答 数字 表 質的 年齢 , 必 量的 目 ■母集団 量的 , ,数値 ,統計学 質的 前 .一般的 情報 考 .前者 界 計算 .記述統 全観客 年齢 行 非常 労力 要 ,一部 観客 年齢 聞 取 方法 聞 取 . ( 集計 統計 世 *2 5 件法 呼 第1章 2 調査). 実際 母集団全体 実際 本( ) 呼 値 計算式 個々 変数 形 値 xi 以下 特 統計学 呼 全数調査), .後 触 ,標本 場合 調査 ,添字 個々 ,標本 総数( 場合 断 限 ,標本 用 ,標本 傾向 見 意味 ,例 5年 順位 用 適切 総数 . 観測個数 呼 性質 代表値 推測 推測 . 順位 1 考 方 統計的推測 , 全標本 性質 標本 母集 ● . , *5*6 性 2002 年 2011 年 . ● ● 3 ● ● ● ● ● 5 TE 6 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 間 用 順位 年 2011 年 阪神 順位 変動 ,{4, 1, 4, 1, 2, 3, 3, 4, 2, 4}*7 ,各代表値 説明 400 . ● ● 総数 4 万人強 *4 総数 見 用 例 2 , , . . 理解 4 . 呼 全体 図 1.1: 2002 年 ,監督 交代 1 年 目(2002 年,2004 年,2009 年) 不思議 4位 表 . 間 阪神 本来順位 順 序尺度 代表 値 求 適切 ,例 目 *7 {x1 , x2 , . . . , xn } .例 先 甲子園球場 観客 年齢構成 場合,例 理解 *6 表 ,標 代表値 ,眺 順位 全体 全標 必 . 用 *3 ,例 *5 集合 明確 骨 折 母集団全体 正 400 人) 少 質 . 場合 代表 NT AT I 席数 呼 観測値 方法 必要 ( 値 n) 母集団 1.2 1 次元 47,757 席 標本 全数調査 ,都度実際 値 書 表 標本 . 団 表 ■代表値 役割 , 集合 ( , 全標本 調査対象 *4 年齢 VE 本 簡単 ,実際 母 集団 性質 反映 標本 得 容易 場合 観客 . 標本 言 一部 観測 異 要 *3 調査 記述統計 (図 1.1 参照).以下 . 1.2 1 次元 代入 Tips.1.2.1: ,{4, 1, 4, 1, 2, 3, 3, 4, 2, 4} 使 R 3 用 便利 .例 次 . 1: 2: , 変数 x 上記 可. 基本形状 “plot()” 関数 用 作成 . plot(years, x, xlab="年", ylab="順位", ylim=c(6,1), las="1", tcl="0.25", type="b", lab=c(10, 6, 10)) 次 変数 years .連続 NT AT I 横軸用 形式 記述 n:m 4: 5: . 中心 表 最初 中心 表 ■標本平均値 n 本平均値 x 計算 TE 例 1.2.1: 阪神 先 ,x = 2.8 代表値 代表値 総数,xi . . 取 上 .. (i = 1, 2, . . . , n) , 総和 総数 (1.1) 式 標 割 1∑ 1 x= xi = {x1 + · · · + xn } n i=1 n n 順位 (1.1) 標本平均値 順位 場合, 総数 n 10, 総和 28 . R 使 R Tips.1.2.2: 標本平均値 (1.1) 式 標本平均 求 変数 x 1: 数値 years = c(2002:2011) years = seq(2002, 2011, by=1) 1.2.1 得 指定 x <- c(4,1,4,1,2,3,3,4,2,4) x = c(4,1,4,1,2,3,3,4,2,4) ,図 1.1 3: 取 扱 VE R 代表値 “mean()” 関数 利用 必要 . . mean(x) # 標本平均値 I 第1章 4 記述統計 Tips.1.2.2: 標本平均値 (続 ) R , 総数 n 総和 n ∑ 計算 xi “lenght()” i=1 “sum()” 関数 利用 総数 length(x) # sum(x) # 相和 VE 2: 3: . ■中央値(中位数) 標本平均値 異常値 影響 強 受 .中央値 場合 中央 2 個 平均 例 1.2.2: 阪神 順位 先 表 並 真 . 中 値 昇順, 小 値 大 値 順 並 直 . 1 中央値 1 2 偶数個 ,5 番目 3 . 2 3 3 4 4 4 4 6 番目 平均 , , 3 Tips.1.2.3: 中央値 中央値 求 “median()” 関数 利用 . median(x) # 中央値 TE 1: . 中央値 順位 次 R 降順 NT AT I 偶数個 昇順, ,中央値 利用 ■最頻値 例 1.2.3: 阪神 ,1992 年 中 最 多 順位 順位 現 値 表 . 最頻値 場合 ,(悲 2001 年 最頻値 )4 位 6位 , 最頻値 . . 代表値 5 広 1.2.2 得 表 代表値 通常 1 点 同 値 中心 表 広 持 ,通常 代表値 . 異 値 周 分布 . ■標本分散 標本分散 代表値 個々 xi 総数 − 1), ( 距離 (n − 1) 表 2 乗 相当 割 ,CPA n ∑ 求 } 1 { (x1 − x)2 + · · · + (xn − x)2 (xi − x) = n−1 i=1 四則演算 (1.2) 式 容易 場合 *9 多 (1.3) 式 導 計算 ,分解公式 変形 変形 n ∑ . i=1 部分 出 (1.3) 扱 変形 最右辺 n ∑ 注意 次 i=1 例 1.2.4: 阪神 順位 (1.1) 式 利用 n ∑ 2 xi + nx = i=1 n ∑ 1.51 標本分散 順位 例 場合 , 計算 次 i=1 i=1 式 i=1 xi 2 − 2nx2 + nx2 10 ∑ 先 i=1 . xi − 2x 2 定数 x ,(1.3) 式 導 TE 変形 第 2 項,第 3 項 i=1 . xi 2 = 92 場合 度自分 n n n n n ∑ ∑ ∑ ∑ ∑ 2 2 2 2 (xi − x) = (xi − 2xxi + x ) = xi − 2xxi + x2 i=1 参照 *9 . i=1 96 (1.3) 式 利用 定数 取 割 理 偏差 n x2 n−1 xi 2 − 標本平均値 x .偏差平方和 強 n (1.2) . 1 n−1 S2 = 容易 電卓 個数 n−1 由 2 試験 求 (1.2) 式 偏差平 *8 1 S = n−1 平方和 用 分布 . 2 計算 標本平均 x 代表値 表 NT AT I i=1 *8 , .標本平均 x n ∑ 方和 (xi − x)2 .広 VE 1.2 1 次元 ,(1.3) , 判断 都 第1章 6 記述統計 Tips.1.2.4: 標本分散 標本分散 R 1: 求 “var()” 関数 用 var(x) # 標本分散 ■全標本( )分散 例 ,得 (1.4) 式 全標本 場合,全標本平均値 µ 値x . (1.1) 式 見 上 VE R 同 与 . 1∑ µ= xi n i=1 n ,標本平均 NT AT I (1.4) 全標本分散 式 異 (1.5) 式 与 .違 総数 n 割 .µ xi . 1∑ 1∑ 2 2 σ = (xi − µ) = xi − µ2 n i=1 n i=1 n n 2 , 総数 n ,n *10 意味 明確 異 一致 R 小 ,標本分散 十分大 一致 ,特 標本 標本分散 ■標本標準偏差 . 例 1.2.5: 阪神 大 標本平均 多 直接求 関数 次 用意 変換 利用 平均 *10 . (1.2) 式 (1.3) 式 v u √ u S = S2 = t 順位 . . 分散 (length(x)-1)/length(x)*var(x) # TE 1: 差異 分散 分散 Tips.1.2.4 . 区別 Tips.1.2.5: R 全標本分散 (1.5) 標本分散 平方根 計算 1 ∑ 2 n xi − x2 n − 1 i=1 n−1 n (1.6) 標本標準偏差 順位 例 場合 √ , 1.51 = 1.23 . 1.2 1 次元 代表値 7 Tips.1.2.6: 標本標準偏差 標本標準偏差 求 R 次 関数 利用 . sd(x) # 標本標準偏差 sqrt(var(x)) 1: 2: ■範囲 呼 . . VE R 最大値 最小値 存在 幅 表 (1.7) 式 考 . R = max (xi ) − min (xi ) i=1,...,n 順位 先 R 範囲 (1.7) NT AT I 例 1.2.6: 阪神 i=1,...,n 場合 ,4 − 1 = 3 順位 例 与 . Tips.1.2.7: 範囲 範囲 求 R 最大値演算 最小値演算 組合 . max(x)-min(x) # 範囲 1: 演算 range , 接利用 最小値 . 代入 最大値 表示 無理矢理求 直 可能 … 2: 3: TE r=range(x) ; r[2]-r[1] range(x)[2]-range(x)[1] # ■四分位点 影響 大 四分位点 位点 75% 広 受 表 . 用 範囲 対 異常値 計算 最小値 25% 含 比較的影響 .四分位点 第 3 四分位点 半数 標本分散 ,異常値 .第 1 四分位点 値 可 場合, 受 代表値 第 1 四分位点 値,第 3 四分位点 値 最小値 . 第 1 四分位点 差 含 四分位範囲 呼 . 範囲内 . 四分位範囲 = 第 3 四分位点 − 第 1 四分位点 ■ 第 3 四分 点 四分位点 100α (0 ≤ α ≤ 1) 一般化 相当 考 値 方 点 表 .任意 (1.8) . 最小 点 対 第1章 8 *11 R 法 計算方 方式 応 存在 場合 (1.9) 式 按分 記述統計 *11 求 点:(1 − p) × xm+1 + p × xm+2 昇順 並 替 (n − 1) × α 標本,m 例 1.2.7: 阪神 順位 例 番目 総数 .昇順 用 時 3 番目 .同様 四分位範囲 1 2 2 3 . . NT AT I 1 4 ,m = 6, p = 0.75 ,“4” 4 並 ,“2” (10 − 1) × 0.75 = 6.75 8 番目 (10 − 1) × ,第 1 四分位点 10 ,(1.9) 式 m + 2 番目 . 四分位点 2 第 3 四分位点 R 小数部分 ,m = 2, p = 0.25 0.25 = 2.25 7 番目 m + 1 番目 整数部分,p , (1.9) VE xm+1 , xm+2 . 3 4 4 4 4 . 2 Tips.1.2.8: 四分位点 四分位点 関 R 1: 2: 計算結果 得 “summary()” 利用 . summary(x) # 最小値, 第 1 四分位点, 中央値, 平均値, 第 3 四分位点, 最大値 最小値,第 1 四分位点,中央値,平均値,第 3 四分位点,最大値 表示 . ,四分位範囲 求 順 結果 “IQR()” 関数 利用 . IQR(x) # 四分位範囲 TE 3: 他 1.2.3 1.2.1 1.2.2 代表値 説明 基本的 代表値以外 , 次 代表値 . ■刈 込 平均 刈 込 平均 ,最小値,最大値付近 計算 .通常 最小値,最大値,各 1 最小値 *12 対 採点 使 . 除外 用 刈 込 平均 除外 多 (1.10) 式 (1.1) 式 標本平均 影響 受 除外 .例 . 改善 平均値 最大値 異常値 方策 *12 . 代表値 1 = n−2 xtrim 例 1.2.8: 阪神 9 順位 先 { n ∑ } xi − max (xi ) − min (xi ) i=1,...,n i=1 刈 込 平均 例 ,最小値 最大値 1 4 , 1 ,2.9 2 計算 2 3 3 4 . 込 .刈 込 幅 平均 相加平均 Tips.1.2.2 除外 比率 0 ≤ trim ≤ 0.5 範囲 指定 4 .例 片側 m 個刈 込 利用 刈 込 場合 , mean(x, trim=m/length(x)) # 刈 込 平均 ■幾何平均 倍率 (相加平均) 適切 “mean()” 関数 . trim = m/length(x) 1: 同 引数 trim 指定 除外 1 NT AT I 刈 R 方 4 Tips.1.2.9: 刈 込 平均 R (1.10) i=1,...,n VE 1.2 1 次元 , 積 場合 (1.11) 式 性質 場合,(1.1) 式 総数 .n n 乗根 総数,xi *13 求 √ n 表現 通常 平均 幾何平均 (i = 1, 2, . . . , n) *13 . x1 × x2 × · · · × xn 持 (1.11) 試験 TE 例 1.2.9: 幾何平均 例 , (相加平均 1.2 1.4 0.9 ,幾何平均 0.8 求 1.6 √ 5 1.93536 = 1.14 1.18). Tips.1.2.10: 幾何平均 R R 幾何平均 求 x1 × x2 × · · · × xn , 求 , “prod()” 関数 n 乗根 求 要素 積 . CPA 試験 込 n 乗根 I 電卓 計算 ,CPA 出 第1章 10 記述統計 Tips.1.2.10: 幾何平均 (続 ) prod(x)^(1/length(x)) # 幾何平均 1: ■加重平均 相加平均 手段 各 ,各 平均値 影響 等 仮定 影響度 個々 得 影響度 総数,xi 重 対 重 場合 各 (1.12) 式 計算 wi = 1 i=1 満 n . . NT AT I n ∑ 何 .加重平均 n ∑ ,wi > 0 . . 算出 (i = 1, 2, . . . , n) wi VE R wi xi = w1 x1 + w2 x2 + · · · + wn xn (1.12) i=1 ,(1.1) 式 相加平均 一致 i = 1, . . . , n 例 1.2.10: 阪神 (1.12) 式 重 全 等 場合 wi = 1/n, . 順位 加重平均 例 0.0 0.5 0.0 0.5 重 {4, 1, 4, 1, 2, 3, 3, 4, 2, 4} R 0.0 用 wi 加重平均 TE ■移動平均 標本 重 0.0 順位 …以下略 (笑). 格納 w 採取 値 , 「監督 大 変 ,順位 雑音 0.0 ,加重平均 求 . weighted.mean(x,w) # 加重平均 1: 不明 0.0 ,阪 神 求 “weighted.mean()” 関数 用 言 ,真偽 . 0.0 Tips.1.2.11: 加重平均 x *14 0.0 影響 移動平均 何 一過性 変動 年 軽減 ,加重平均 特定 .阪神 前年 実力以上 要因 悪 手法 時系列 方針 」 場合 移動平均 適用 用 他 順位 異 , *14 例 浸透 . . . 1.2 1 次元 代表値 移動平均 時刻 t 用 値 2種 呼 過去 値 .前者 算出 時刻 t 単純移動平均,後者 前後 中心化移動平均 . 例 ,5 期間 単純移動平均 xt = (1.13) 式 1 (xt−4 + xt−3 + xt−2 + xt−1 + xt ) 5 5 期間 中心化移動平均 xt = 中心化移動平均 (4 期間 (1.13) VE 値 11 (1.14) 式 表 . 1 (xt−2 + xt−1 + xt + xt+1 + xt+2 ) 5 場合,期間 偶数 (1.15) 式 場合 例). (1.14) 求 NT AT I 1 1 (xt−2 + xt−1 + xt + xt+1 ) + (xt−1 + xt + xt+1 + xt+2 ) 4 xt = 4 2 1 1 1 1 1 = xt−2 + xt−1 + xt + xt+1 + xt+2 8 4 4 4 8 経済学 用 四半期移動平均 (1.15) 式 計算 ● ● 1 ● ● ● 順位 4期間移動平均 ● ● ● ● ● 3 順位 . ● 2 4 (1.15) ● ● ● ● ● ● 5 6 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 年 TE 図 1.2: 2002 年 当然 .例 順位変動 4 期間中心化 移動平均 ,移動平均 ,2002 年 中心化移動平均 順位変動 2011 年 阪神 求 必要 2011 年 阪神 2004 年 2009 年 間 4 期間中心化移動平均 求 時点 必要 順位 例 計算 結果 図 1.2 ,4 期間 .実際 示 *15 *15 . ,右肩下 傾向 認 Tips.1.2.12: 移動平均 R 例 次 入 x . 4 期間 移動平均 求 関数 I 第1章 12 Tips.1.2.12: 移動平均 (続 ) move.ave(x,4,"c") # 移動平均 1: 次 移動平均 求 中心化移動平均,s 関数 一例 単純移動平均 計算 .3 番目 引数 .省略時 c 中心化 VE R . move.ave <- function(x, c, type="c"){ # type c:中心化,s:単純 n<-length(x) # x 長 y<-numeric(length=n) # 結果 返 作成 for(i in 1:n) y[i]<-NA # NA 初期化 if(type=="s") # 単純移動平均 for(i in c:n) y[i]<-mean(x[(i-c+1):i]) else{ # 中心化移動平均 w<-floor(c/2) # 移動平均 片側 幅 d<-1-(c%%2) # 偶数幅 時 補正 偶数:1,奇数:0 for(i in (w+1):(n-w)){ # w+1 n-w 分計算 y[i] <- (mean(x[(i-w):(i+w-d)]) + mean(x[(i-w+d):(i+w)])) /2 } } return(y) } NT AT I 2: 3: 4: 5: 6: 7: 8: 9: 10: 11: 12: 13: 14: 15: 16: 調 .例 求 重 “f ilter” 計算 1: 2: 中心化平均 R .引数 関数 “f ilter” 設定 4 期間 場合 利用 中心化移動平均 次 例 . w4=c(1/8,1/4,1/4,1/4,1/8) filter(x, filter=w4, method="convolution", sides=2) (1.15) 式 重 TE “f ilter” 設定 設定 移動平均 作 ■加重移動平均 .“method” . 中心化移動平均 相当 可能 記述統計 “sides” “convolution” 単純移動平均,“2” “1” . “move.ave()” 時系列 対 .移動平均 重 消 加重平均 変化 ··· 残 移動 形 適用 雑音除去(平滑化) 効果 得 . ■変動係数 2002 年 ,同 期間 2011 年 阪神 阪神 順位 勝 数 変動 次 変動 例 . 66 87 代表値 66 87 84 標準偏差 13 76 76.1 82 結論 2.8 大 .順位 . 表 代表値 標本平均値 x S CV = = x 例 1.2.11: 阪神 順位 勝 数 x2 数 標本平均値 大 2 v u u =t 対 (1.16) 式 求 . 散 意味 標本平均値 76.1 影響 .変動係数 (1.1) 式 計算 *16 変動) 意味 順位 問題 *16 . (1.16) 0.12 順序尺度 本質的 標本 1.23 n ∑ 1 n xi 2 − 2 n−1 (n − 1)x i=1 変動幅(相対的 小 0.44 勝 標本平均値 数 方 標本分 . Tips.1.2.13: 変動係数 変動係数 R 平均値 1: ■変数 求 関数 用意 標本標準偏差 Tips.1.2.6 ,Tips.1.2.2 求 sd(x)/mean(x) # 変動係数 標準化 TE 群 変動係数 間 ,阪神 標本平均値 異 群 必要 呼 個々 数値 野手 ,両者 z 得点 標本 . 考慮 . 平均 順位 (1.16) 式 順位 変動係数 変動係数 ,標本平均値 R S2 標本標準偏差 NT AT I 数 √ 標本平均値 ? ,勝 変動係数 用 (1.3) 式 標本分散 S 変動 数 」 言 . 異 勝 68 変動小 危険 広 勝 78 8.76 , 「順位 方 勝 数 直 67 VE 1.2 1 次元 . ,標本平均値 直接比較 打率 投手 直接比較 標本平均値 .xi 標本平均値 1 勝率 標準化 変換 zi = 式 標本分散 当然標本平均値 .比較 標本標準偏差 変数 比較 異 意味 意味 操作 0,標本標準偏差 広 一致 呼 個々 x,標本標準偏差 (1.17) 式 1 (xi − x) S .例 標本分散 意味 . 2 異 持 , 値 標準化 変換 値 ,標本 S . (1.17) 他 計算 , 楽 ) 形 書 ,電卓 点 形 一番 (主観 第1章 14 例 1.2.12: 阪神 勝 数 標準化変換 ( 阪神 勝 記述統計 数 例 標準化 xi − 76.1 zi = 8.76 ) 次 . 66 -1.15 87 1.24 66 -1.15 87 1.24 84 0.90 76 -0.01 82 0.67 Tips.1.2.14: 標準化変換 R R 標準化変換 行 場合 標本平均値 個々 値 68 -0.92 計算 標本標準偏差 Tips.1.2.6 78 0.22 . 求 NT AT I Tips.1.2.2 ,(1.17) 式 67 -1.04 VE xi zi . (x-mean(x))/sd(x) # 標準化変換 1: ,自動的 要素分,計算 x 可能 scale(x) ■偏差値 標準化 下 偏差値 50 以 学校 0,標本標準偏差 1 変換 . 標本平均値 *17 標本平均値 一般 zi *17 計算 “scale()” . 2: . . 50,標本標準偏差 変換 10 値 , 偏差値 . 50 + 10zi 物言 TE 例 1.2.13: 阪神 先 勝 数 阪神 (1.18) 偏差値 勝 数 z 得点 偏差値 計算 次 . zi -1.15 38.5 偏差値 50 大 値 下 標準偏差幅 1.24 62.4 -1.15 38.5 平均以上,逆 外側 1.24 62.4 0.90 59.0 小 値 -0.01 49.9 0.67 56.7 -1.04 39.6 平均以下,60 以上 . 0.22 52.2 -0.92 40.8 40 以 1.3 図 1 次元 整理 15 Tips.1.2.15: 偏差値 R 偏差値 R 求 場合 ,Tips.1.2.14 利用 次 求 . 1.3 図 1 次元 観測 数 図示 理解 整理 大 代表値 容易 特徴 場合 把握 , . . 代表的 NT AT I 整理方法 VE 10*(x-mean(x))/sd(x)+50 # 偏差値 1: ■度数分布表 次 . 75 82 80 78 85 73 64 92 89 78 70 82 阪神 80 84 87 84 84 81 94 84 79 82 83 77 体重 93 88 84 86 83 78 2011 年 63 88 86 78 76 102 66 88 87 95 83 80 標本平均値 85 86 93 80 95 63 72 77 84 119 86 78 図 80 選手 体重(単位:kg ) 80 95 77 110 93 80 99 90 80 79 84 70 93 91 80 79 83.5[kg],標本標準偏差 83 78 82 75 92 9.4[kg] .最小値,第 1 四分位点,中央値,第 3 四分位点,最大値 78[kg],83[kg],88[kg],119[kg] 情報 得 . 計算 .確 , 分布 形状 度数分布表 度数分布図 TE 表 1.1: 2011 年阪神 用 72 94 83 82 93 計算 63[kg], 代表値 代表値 想像 利用 . 80 選手 体重分布 階級(以上∼未満) 階級値 度数 累積度数 60∼65 65∼70 70∼75 75∼80 80∼85 85∼90 90∼95 95∼100 100∼105 105∼110 110∼115 115∼120 62.5 67.5 72.5 77.5 82.5 87.5 92.5 97.5 102.5 107.5 112.5 117.5 3 1 5 15 26 12 11 4 1 0 1 1 3 4 9 24 50 62 73 77 78 78 79 80 難 第1章 16 選手 値 何 高精度 引 加減 重要 値 場合,1[kg] 刻 , 幅 *18 数 頻度 .押 例 用 上 65[kg] 未満 *18 体重 持 . 呼 , . 階級値 区間 . 精度 階級 度数 示 ,度数,累積度数 累積相対度数 呼 . 階級値 和 総数 ,度数 思 分布 階級 ,階級幅, 大 影響 .逆 受 呼 決定 呼 決 , 利用 総数 n 階級 相対度数, 分割 度数 0 階級 方 絶対普遍的 基準 式, (1.20) 式 . log10 n = 1 + 3.32 · log10 n log10 2 1 + log2 n = 1 + (1.19) √ n 阪神 重 幅 結果 従 外 値 *19 通常 特別 広 多 理由 場合 階級 度数 8 階級 未満 点 設定 階級幅 区間幅 設定 ■度数分布図 図示 避 最初 階級幅 方 ,前者 場合 . 7.5[kg] 場合 測定値 8,後者 7 最小測定単位以下 . ,横軸 階級,縦軸 度数分布図,別名 5[kg] . 階級 60[kg] 以上 67.5[kg] . 度数分布表 度数分布図 一例 ,60[kg] , .例 不均一 取 階級幅 . 考慮 階級 実質上定 56[kg] 考 .特定 受 2 番目 階級 67.5[kg] 以上 75[kg] 未満 比 ,実質的 因 異 例 場合, TE , 等 水増 階級 , . 下限,上限 扱 ,他 7.3,(1.20) 式 12 階級 階級幅 ,最小階級,最大階級 階級 (1.20) 9 階級 8 考慮 恣意的 整数値 場合 ,(1.19) 式 選手 体重 . 8.9 *19 中央 .表 1.1 細 (1.19) 式 場合 属 度数 細 特定 .階級数 .通常 .分割 粗 数 NT AT I 含 属 何名 , . ■階級数 容易 想像 60[kg] 以 各区間 累積度数 割 . ,例 階級,階級 代表値 測定 低下 分割 区間 階級 値 VE 阪神 記述統計 度数 .図 1.3 相対度数 表 1.1 作成 . 6[kg] 変化 図 1.4 変化 . 1.3 図 1 次元 整理 17 60 70 80 90 100 体重[kg] 図 1.3: 2011 年阪神 120 80 選手 体重 度数分布(階級幅 5[kg]) 30 25 20 15 10 5 0 NT AT I 度数[人] 110 VE 度数[人] 30 25 20 15 10 5 0 60 70 80 90 100 110 120 体重[kg] 図 1.4: 2011 年阪神 R 80 選手 体重 度数分布(階級幅 6[kg]) Tips.1.3.1: 度数分布図 図 1.3 度数分布図 先 80 選手 体重 例 ,“hist()” 関数 1: 作成 . hist(weight, right=FALSE, las=1, ylim=c(0,30), xlab="体重 [kg]", ylab="度数 [人]", tcl=0.25) # 度数分布図 階級上限 right=FALSE TE 以上∼階級上限未満」 指定 ■度数分布 例 weight 利用 全 代表値 用 . 極 煩瑣 表値 近似的 ■標本平均値 計算 計算 先 阪神 例 標本分散 特 簡便的 , 「階級下限 全階級数 80 選手 体重 代表値 電卓 手法 *20 方法 近似計算 .(1.1) 式 計算 大 . 含 . 標本平均値 総数 n 階級 計算 紙 鉛筆 ,階級値 計算 度数 場合 利用 , 代 *20 . m,j 番目 階級値 標本平均値 x (1.21) 式 cj ,j 番目 度数 近似的 計算 fj 小 値 意! 総数 正確 乖離 場合 注 第1章 18 記述統計 . 1∑ x= c j · fj n j=1 m (1.22) 式 計算 n= 度数総和 m ∑ fj j=1 一致 . VE 総数 n (1.21) (1.22) ■標本分散・標本標準偏差 近似計算 (1.21) 式 同様 考 方 (1.3) 式 計算 似的 標本分散 階級値 cj 計算 x2 . 階級 度数 fj (1.21) 式 求 (1.2) 式 (1.23) 式 用 標本平均値 . n 1 ∑ 2 cj fj − S = x2 n − 1 j=1 n−1 NT AT I m 2 (1.23) 式 平方根 標本標準偏差 例 1.3.1: 選手体重 表 1.1 値 (1.23) 式 計算 . 変 図 1.4 正確 対応 標本平均値 値 83.9[kg],標本標準偏 83.5[kg],9.4[kg] 度数分布 標本標準偏差 例 限 . 80 選手 体重 標本平均値 標本標準偏差 9.4[kg] 階級幅 (1.23) 近似計算 阪神 (1.21) 式 差 代表値 計算 近 同様 計算 84.1[kg],9.3[kg] 近似 . ,標本平均 ,若干異 . , 一致 , 左右片側 . 歪 TE ■度数分布 広 度数分布図 描 形状 央値 . 標本平均値 関係 歪 ,歪 直観的 呼 捉 左裾 長 広 .標本平均値 < 中央値 正 歪 右裾 長 広 .標本平均値 > 中央値 標本歪度 (1.24) 式 標本分散 S 2 計算 .中 . 負 歪 参考 裾野 (1.3) 式 標本平均値 x (1.1) 式 用 . n ∑ (xi − x)3 n i=1 (√ )3 (n − 1)(n − 2) S2 ∑ n = (n − 1)(n − 2) i=1 n ( xi − x S )3 (1.24) 1.3 図 1 次元 整理 (1.24) 式 別 見方 19 ,(1.17) 式 得 z 得点 3 乗和 . 分散 σ 2 . n ∑ 3 (xi − µ) i=1 n · σ3 (1.24) 式 (1.25) 式 場合 歪度 > 0 (1.5) 式 用 1∑ = n i=1 n ,負 ( xi − µ σ 歪 標本歪度 (1.25) 歪度 < 0,正 80 選手 体重 場合 ,(1.24) 式 用 R . 0.68 , 左右対称 歪 求 NT AT I 阪神 計算 )3 場合 . 例 1.3.2: 選手体重 (1.25) 式 VE 歪度 , 正 歪 . R Tips.1.3.2: 標本歪度 標本歪度 R 求 (1.24) 式 右辺 形式 用 有用 . ,Tips:1.2.14 予 変数 x 格納 . 1: (length(x))/(length(x)-1)/(length(x)-2) * sum((x-mean(x))/sd(x)) 何度 2: 3: 出 length(x) 煩 n <- length(x) n/(n-1)/(n-2)*sum((x-mean(x))/sd(x)) # 標本歪度 変数 代入 TE 適当 ■累積相対度数分布 . 表 1.1 .累積相対度数 累積度数 図示 累積相対度数分布図 「 適 点 読 ,例 表 取 . 特徴 読 取 図 1.5 , 縦軸 読 可能 累積相対度数 」 図 縦軸 .例 割 0.25 取 (図 1.5 分布 形状 把握 (1.9) 式 定義 対応 横軸 可能 読 取 階級値 .同様 四 76.2[kg]). 累積相対度数分布 ,後 第 3 章 扱 累積確率分布関数 似 意味 . 得 . 階級 度数 大 ,第 1 四分位点 分位範囲 総数 n 第1章 20 70 80 90 100 体重 図 1.5: 2011 年阪神 ■2 次元 80 選手 体重 累積相対度数分布 代表値 1 次元 1.2 得 2 次元 {x1 , x2 , . . . , xn } {y1 , y2 , . . . , yn } 表 表 .言 換 扱 代表値 扱 . . ,同 .n 個 1組 注意 ,同 添字 持 例 扱 120 NT AT I 1.4 2 次元 110 VE 累積相対度数 1.0 0.8 0.6 0.4 0.2 0.0 60 行 記述統計 n個 . 1 次元 1 次元 ,2 次元 処理 (xi , yi ) 数 , 2 次元 . 1.3 例 用 手 身長(単位:cm) 同 順序 2011 年阪神 例 用 .各選手 順序 1.3 ,80 選 体重 (背番号順). TE 176 185 179 180 182 198 189 181 177 175 184 181 185 191 180 182 例 1.4.1: 選手身長 180 179 177 180 178 184 180 192 182 180 189 184 180 180 191 180 186 182 187 184 184 180 184 179 173 184 180 183 185 180 185 187 169 183 181 178 180 184 177 183 180 184 181 176 170 180 181 176 177 180 178 183 181 180 191 180 176 184 187 184 181 181 183 188 代表値 身長 準偏差 80 選手 体重 加 1 次元 代表値 求 181.8[cm] 4.7[cm] 位点,中央値,第 3 四分位点,最大値 順 184.0[cm],198.0[cm] . ,標本平均値 . 標本標 最小値,第 1 四分 169.0[cm],180.0[cm],181.0[cm], 1.4 2 次元 代表値 21 度数分布表 省略 ,度数分布図 描 *21 図 1.6 *21 . 体重以上 身 長 50 40 30 20 10 0 165 170 175 180 185 190 身長[cm] 図 1.6: 2011 年阪神 例 図 1.3 用 図 見比 身長 両者 体重 横軸 xi . 2 .両者 身長,縦軸 yi 見 関係 用 . 見 . 与 間 関係 調 2 次元 単純 散布図 図示 作成 直観的 散布図 *22 図 把握 .直観的 方法 身長 体重 変化 . 110 TE 体重[kg] 100 90 80 70 60 170 175 180 185 190 195 200 身長[cm] 図 1.7: 2011 年阪神 方法 呼 .図 1.7 120 165 , , 体重 取 ,各選手 値 描 変量間 関係 各選手 扱 200 80 選手 身長 度数分布 80 選手 身長 体重 間 関連 例 例 195 NT AT I ■散布図 分布 VE 度数[人] 美 80 選手 身長 体重 散布図 . 80 選手 傾向 同 *22 図 1.7 値 方 見 扱 適切 第1章 22 記述統計 Tips.1.4.1: 散布図 R 散布図 y 対応 1: 2: 描 “plot()” 関数 利用 形 格納 x . plot(x, y, xlab="x", ylab="y", las=1, tcl=0.25, pch=19) # 散布図 ■標本共分散 散布図 可能 . 必要 描 両者 .2 変量 間 標本平均 y 定性的 関係 定量的 変化 傾向 2 議論 表 x,y 変量 間 関係 把握 ,代表値 導入 代表値 標本共分散 標本共分散 Sxy 2 (1.26) 式 NT AT I x . VE R . 与 . n 1 ∑ 1 ∑ {(xi − x)(yi − y)} = xi yi − = xy n − 1 i=1 n − 1 i=1 n−1 n Sxy 2 標本共分散 負 正 値 時 正 n 値 取 取 2 変量 変化 方向 一致 2 変量 変化 方向 逆 散布図 右上 (1.26) 傾向 認 ,負 , 表 時 逆 . 右下 傾向 認 . 例 1.4.2: 身長 図 1.7 体重 標本共分散 阪神 散 求 80 選手 標本共分 . 31.3 Tips.1.4.2: 標本共分散 TE R 標本共分散 求 R 利用 1: x 標本分散 求 対応 y 形 var 2 次元 格 . var(x,y) # 標本共分散 ■標本相関係数 成 ,Tips.1.2.4 . 納 関係 (1.26) 式 用 立 図 1.7 見 代表値 標本相関係数 身長 体重 間 線形関係, .2 変量 間 線形関係 .標本相関係数 rxy 強 正比例 定量的 ,標本共分散 Sxy 2 表 x y 標 1.4 2 次元 代表値 本分散 Sx 2 ,Sy 2 23 (1.27) 式 計算 . Sxy 2 rxy = √ Sx 2 × Sy 2 (1.27) (1.26) 式 標本共分散,(1.3) 式 標本分散 代入 *23 . n ∑ rxy = √( xi yi − n x y i=1 n ∑ ) xi 2 − n x2 ( × i=1 −1 標本相関係数 0 近 正 近 無相関(円状 −1 近 例 1.4.3: 身長 図 1.7 数 相関(右上 (1.28) 持 意味 ) 広 ) 負 相関(右下 ) 体重 標本相関係数 阪神 80 選手 場合 ,正 0.71 ,身長 体重 間 相関 標本相関係 . Tips.1.4.3: 標本相関係数 標本相関係数 求 R x 形 傾向 表 変化 原因 変量 取 扱 2 次元 . 格納 . cor(x,y) # 標本相関係数 ,標本相関係数 場合 ,“cor()” 関数 利用 対応 y TE 1: 第3 ) yi 2 − n y 2 .標本相関係数 . 1 R i=1 値 1 n ∑ NT AT I 次 (1.28) 式 注意 ,標本相関係数 ,例 標本相関係数 1 保証 存在 . . , 媒介 相関係数 標 本(不偏) , (全 標本) 同 式 VE *23 変形 単 2 変量 変化 ,一方 .例 関連 他方 隠 見 2 変量間 線形関係 詳細 分析 第 7 章 線形関係 推定 第1章 24 記述統計 1.5 各種指標 経済学 経営学 . *24 実 論文式 CPA 標本 分布 分野 標本 代表的 *24 上 代表値 表 方法 指標 見 計算 , . 曲線 ■ 曲線 図 階級 度数 考察 全体 均一 階級間 利用 ) 横軸 階級 程度 図示 度数分布 階級 集中 調 . 方法 累積相対度数 qj ,縦軸 45 度 直線 . . 曲線 曲線 曲線 , 累積相対価値(例 年 .各階級 均等 価値 分配 直線 完全平等線 呼 .他方特定 場合 底辺 右 縦軸 一致 (逆 L 字) ,完全不平 底辺 大 次 ,度数分布表 ,特定 不均一 不平等度 1 個人 価値 集中 度 処理 .例 ,両者 関係 表 傾 等 係数,物価指数 取 . 曲線 俸 度数分布 関係 以外 評価 NT AT I , 係数 標本 1.3 ,標本 曲線, 出題 1.5.1 . VE 標本 右縦軸 一致 完全平等線 .定量的 直線 囲 評価 後 2011 年 阪神 完全不平等線 図形 係数 面積 呼 大 説明 不平等 . 支配下選手 80 人 年俸(単位:万円) . TE 900 1800 1500 1200 1300 2300 3250 600 540 440 1500 3500 1400 3600 720 840 480 540 520 300 最小値 万円 1.2 度数分布表 得 表 1.2 ,階級 .例 40000 4300 2000 10000 580 1100 10000 1700 3500 300 240 万円,最大値 9 個 階級 設 度数分布図 描 俸) 26000 20000 1170 1000 700 900 4200 4300 600 300 , 7500 1500 3000 3200 900 2400 1400 900 400 240 1300 5000 40000 1100 1000 1000 1100 580 550 300 16000 1300 4000 2400 17000 650 600 600 400 300 40000 7700 20000 18000 9000 4000 600 20000 300 400 4 億円 度数 数 ,階級幅 .表 形 5,000 表 . 図 1.8 . 度数 階級値 積 各階級 価値( 第 1 階級 例 場合 階級年 ,64 × 2500 = 160000 計算 . 1.5 各種指標 25 表 1.2: 2011 年阪神 1 2500 0 5000 64 0.8000 0.8000 160000 0.3265 0.3265 階級値[万円] 階級下限(以上) 階級上限(未満) 度数[人] 相対度数:pj 累積相対度数:qj 階級年俸[万円] 相対年俸:rj 累積相対年俸 2 7500 5000 10000 4 0.0500 0.8500 30000 0.0612 0.3878 3 12500 10000 15000 2 0.0250 0.8750 25000 0.0510 0.4388 4 17500 15000 20000 3 0.0375 0.9125 52500 0.1071 0.5459 5 22500 20000 25000 3 0.0375 0.9500 67500 0.1378 0.6837 6 27500 25000 30000 1 0.0125 0.9625 27500 0.0561 0.7398 度数[人] NT AT I 70 60 50 40 30 20 10 0 0 5000 15000 総和 9 42500 40000 45000 3 0.0375 1.0000 127500 0.2602 1.0000 80 1.0000 VE 階級:j 80 選手 年俸 分布 25000 35000 490000 1.0000 45000 年俸[万円] 図 1.8: 2011 年阪神 80 選手 年俸 度数分布 階級度数 階級価値 相対値 相対度数 pj rj , 算 累積相対度数 qj 累積総体価値( 表 1.2 数計算 ,度数 0 階級( 相対価値( 場合,相対年俸) 場合,累積相対年俸) . , 曲線 作図 例 第 7,8 階級) 不要 計 後述 表 係 削除 . 表 1.2 累積相対度数 qi 得 .図 1.9 TE 曲線 図 1.9 , ,2011 年 *25 横軸,累積相対年俸 実線 配分 平等 ,折 曲線,破線 曲線 完全平等線 年俸 縦軸 線 完全平等線 下方向 乖離 ,一部 選手 描 . 偏 *25 . R 曲線 図 1.9 曲線 例 salary 最初 Tips.1.3.1 salaryHist 4 億円 (城島,金本,藤川) 4分 1 占 Tips.1.5.1: R . hist 受 取 使 描 手順 次 . 入 . 年報 度数分布表 計算 ( 渡 . 結果 ). I 第1章 26 記述統計 1.0 ローレンツ曲線 完全平等線 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 累積相対度数 R 80 選手 年俸 曲線 (続 Tips.1.5.1: 1: 曲線 ) salaryHist = hist(salary, breaks=seq(0,45000,5000), right=F) 階級 分割 手動 行 場合 上記 5000 間隔 指定).階級値 得 累積和 2: 3: 4: 5: 6: salaryHist$mids,度数 関数 ( salaryHist$counts 次 計算 . . p = (salaryHist$counts / sum(salaryHist$counts)) # 相対度数 q = cumsum(p) # 累積相対度数 r = salaryHist$mids * salaryHist$counts # 階級価値 rr = r/sum(r) # 累積価値 plot(c(0,q),c(0,cumsum(rr)),type="l",xlab="累積相対度数 ", ylab="累積相対年俸") TE 曲線 ,0 定 求 指定 breaks .相対度数,累積相対度数,累積価値 cumsum 描 場合 ,原点 (0, 0) 追加 . 折 追加 必要 線 c(0, q) ,type = ”l” 指 . ■完全不平等線 曲線 関 注意 今,当 考 . ,5 人 ,q1 ≃ 1 人以外 標本 考 1本 . .例 累積相対度数 q1 = 4/5 = 0.8 分大 1.0 NT AT I 図 1.9: 2011 年阪神 VE 累積相対年俸 0.8 ,5 人 引 完全不平等線 仮 一致 100 万人連 . 例 . 組 見 当 完全不平等線 1 十 1.5 各種指標 係数 積 図 1.9 大小 係数 不平等度 定性的 ,度数分布 作成 用 *26 曲線 . .0 係数 表 曲線 把握 . 曲線 次 完全平等 完全平等線 r3 指標 0 値 取 1 図 1.10: q1 ( j 番目 階級 相対度数,qj j 番目 階級 相対価値 相対価値 ri . 三角形 TE 面積 1/2 上側 引 .以上 分解 係数 = 2 表 m ∑ j=1 多角形 全面積 . j=1 2 相対価値 ri 囲 *27 − 1 2 =2 m ∑ j=1 (1.29) 面積 灰色 曲線 ) 階級 累積相対 計算 長方形 pj rj 三角形 面積 2 (1.30) 式 qj rj − 面積 . 示 m ∑ pj rj 多角形 求 ,完全平等線 式 特 2 倍 必要 ,最大値 1 方 指標 見 理由 推測 場合) j 番目 累積相対度数 qi 全部 長方形 面積 総和 曲線 *26 1 曲線 囲 ,図 1.10 度数 pi q2 係数 計算過程(m = 3 係数 = 2 × 完全平等線 度数,rj 指標 . NT AT I p1 0 側 表 p2 r1 0 m,pj 比較 p3 r2 方法 定量的 完全不平等 表 1 今,階級数 面 不平等度 (1.29) 式 計算 ,1 囲 VE ■ 27 相対 qj × rj 総和 引 完全平等線 上 多角形 得 面積 *27 . qj rj − m ∑ j=1 pj rj − 1 (1.30) 曲線 下側 台形 面積 求 方 早 場合 ,無理 (1.30) 式 使 必要 第1章 28 階級 m ∑ rj j=1 = m 1 m 相対度数 関係 用 等 次 m ∑ 1 j ,pj = ,qj = m m 場合 (1.31) 式 変形 記述統計 pj rj = j=1 . m+1 2 ∑ j × rj − m j=1 m m 例 1.5.1: 選手年俸 表 1.2 係数 係数 .図 1.9 0.52 不平等 定量的 説明 明 . NT AT I , R 係数 80 選手 年俸 (1.31) VE 係数 = 係数 Tips.1.5.2: 係数 R 計算 手順 .Tips.1.5.1 年報 salary 累積相対度数,累積価値 既 係数 1: 次 次 入 計算 p, q, rr 計算 . 相対度数, .(1.30) 式 . 係数 gini = 2*sum(q*rr) - sum(p*rr) - 1 # 1.5.2 物価指数 ■物価指数 価格 “ 単純 価格 扱 変動” , 表 財 TE 購入量 . Qti ,基準年 .物価指数 分子 呼 n 計算式 用具名 価格 評価年 , 物価 指数 理解 ,表 表 1.3: 野球用具 P0i ,購入量 比” 計算 種 価格 Q0i 計算 提案 仮想例 使 説明 ) 評価年 価格 : P0i 購入量 : Q0i 価格 : Pti 購入量 : Qti 3000 200 6000 20 100 3 4000 150 7000 15 150 4 Pti , 表 .分母 .以下 価格 購入量(仮想 基準年 特徴 .今,財 i 番目 財 i 番目 財 違 何 例 年(t 年) “基準年 対 .物価指数 量 価格 .購入数量 類 全部 指数 説明 . 1.5 各種指標 29 ■ 価格指数 消費者物価指数 身近 物価指数 *28 用 価格指数 . ,“基準年 評価年 ,基準年 0 . n ∑ (1.32) 式 (Pti × Q0i ) i=1 n ∑ PL = = (P0i × Q0i ) n ∑ 価 共通 購入量 Q0i i=1 比較 . (P0i × Q0i ) *29 評価 . 価格 指数 財 重 基準年 購入 物 加重平均 応用例 一 価格 P0i 価格 Pti 判明 面,購入量 基準年 大 否 . 例 1.5.2: , 計算可能 乖離 値 例 場合, 持 価格指数 価格指数 通 決 即応性 意味 ,評価年 財 . 反 疑問符 価格指数 表 1.3 ■ 購入量 Q0i 用 評価 計算 価格指数 点 .(1.33) 式 n ∑ 違 計算 . 1.184 ,評価年 t 購入量 共 . (Pti × Qti ) i=1 n ∑ PP = (1.33) TE (P0i × Qti ) 評価年 価 i=1 購入量 Qti ,評価年 比較 算 基準年 .例 . 大 例 1.5.3: 表 1.3 購入 物 指数 ,評価年 購入量 Pti . 乖離 財 ,GDP 価格指数 比 計算 指数 価格 場合, ,購入動向 価格 . 価格指数 計算 1.116 計 判明 価格指数 例 100 倍 100 定義 , i=1 . 通常価格指数 用 多 ,単 指数 書 場 合 価格指数 指 多 (1.32) (1.32) 式 第 2 式 示 重 *28 *29 NT AT I ,(P0i × Q0i )/ n ∑ 基準年 用 ,購入量 計算 i=1 ,評価年 同 値” P0i × Q0i Pti n ∑ P (P0i × Q0i ) oi i=1 基準年 購入量 購入量 分母 基準年 物価,分子 評価年 物価 用 Q0i .価格指数 , VE . 生産者物価指数 . 1 0 0 第1章 30 ■ 論文 数量指数 数量指数 価格指数 CPA 式 出題 ,数量指数 数量指数 価格 P0i 共通 用 (P0i × Qti ) i=1 n ∑ QL = = (P0i × Q0i ) 基準年 購入 量 結局計算 , 価格指数 即応性 残念 価格 P0i .(1.34) 式 i=1 (P0i × Q0i )/ n ∑ P0i × Q0i n ∑ (P0i × Q0i ) i=1 ,評価年 比較 相当 基準年 購入量 財 .(1.32) 式 (P0i × Q0i ) Qti Q0i 計 (1.34) 購入 価格指数 ,評価年 i=1 例 1.5.4: 表 1.3 ■ . 異 物 同様,重 *31 流用 NT AT I 評価年 同一 *30 評価 n ∑ i=1 *31 購入量 . n ∑ 価 基準年 “評価年 基準年 価格 同一” ,基準年 算 評価年 VE *30 記述統計 . 数量指数 例 場合, 数量指数 数量指数 同様 評価 計算 数量指数 .(1.35) 式 計算 ,評価年 価格 Pti 共通 用 . n ∑ QP = . 1.010 (Pti × Qti ) i=1 n ∑ (1.35) (Pti × Q0i ) i=1 評価年 価格 Pti ,評価年 基準年 購入量 財 比較 数量指数 例 TE 表 1.3 場合, 物価指数 整理 価格指数 購入量 数量指数 価格 同一 指数 数量指数 次 指数 評価年 . 計算 0.953 . . 同一 基準年 同一 同一 指数 計算 物価 . 例 1.5.5: ■ 購入 √ F = ( 指数 指数) × ( 指数 用 指数) ,(1.36) 式 (1.36) 1.5 各種指標 指数 31 ,(1.11) 式 指数 2 幾何平均 価格指数 ≥ 求 .通常, 価格指数 ≥ 価格指数 多 . 表 1.3 指数 例 場合, 価格指数 (1.184) 指数 計算 価格指数 ,購入量 基準年 , 大 変化 *32 購入量 基準年 物価指数 価格指数 算出 利用 価格指数 用 . 固定 . ,(1.37) 式 *32 NT AT I 行 価格指数 (1.116) . 1.149 ■ VE 例 1.5.6: PP − PL PL 絶対値 大 基準年 場合 見直 必要 示 例 価格指数 , (1.37) 価格指数 . 例 1.5.7: 表 1.3 場合, 行 R . -0.057 Tips.1.5.3: 物価指数 (1.32) 式 R 財 1: 2: 3: 4: 5: 6: ■給与 (1.37) 式 物価指数 計算 入力 PL=sum(pt*q0)/sum(p0*q0) PP=sum(pt*qt)/sum(p0*qt) QL=sum(p0*qt)/sum(p0*q0) QP=sum(pt*qt)/sum(pt*q0) F=sqrt(PL*PP) # Pcheck=(PP-PL)/PL # 比較 指数 . 手順 示 手順 次 基準年価格,基準年購入量,評価年価格,評価年購入量 p0, q0, pt, qt TE . 用 価格指数 . 価格指数 # # # # 価格指数 数量指数 数量指数 指数 聞 説明 考 方 .異 組織 ,物価 ,例 比較 給与 “異 用 場合 比較 組織 思 人 給与水準 比較” ,“基準年”,“比較年” (1.37) 式 定 義 以外 ,1− PL /PP 定義 場合 第1章 32 “基準組織” 例 1.5.8: 給与水準 表 1.4 “比較組織” 置 換 記述統計 . 比較 阪神 読売巨人 一軍 陣 給与水準 比較 表 1.4: 2012 年 阪神 読売巨人 比較 阪神平均年俸 (P0i ) 阪神構成員数 (Q0i ) 巨人平均年俸 (Pti ) 給与水準 監督 戦略 打撃 投手 守備 8000 1 15000 1 2000 1 3250 2 1350 2 3000 2 1450 2 3000 3 1425 4 3000 3 NT AT I 巨人構成員数 (Qti ) VE . 今,阪神 基準 ,阪神 基準年,巨人 格”,“構成員数” 相当 . ,表 1.4 “平均年俸” “価 . 指数 , (1.38) 式,(1.39) 式 . 15000 + 3250 + 3000 × 2 + 3000 × 2 + 3000 × 4 = 1.98 8000 + 2000 + 1350 × 2 + 1450 × 2 + 1425 × 4 (1.38) 15000 + 3250 × 2 + 3000 × 2 + 3000 × 3 + 3000 × 3 = 1.95 8000 + 2000 × 2 + 1350 × 2 + 1450 × 3 + 1425 × 3 (1.39) 両球団 . PL = PP = 比較年 “数量” 読 替 指数 計算 ,巨人 給与 比較対象 TE 指数 給与水準 1.97, 大 差 −0.016 . 33 VE 第2章 確率 確率 言葉 結果 人 不確 現象 確率 扱 思 .私 多 *1 NT AT I 常生活 聞 確率 基本的 考 方 計算方法 取 上 日 . *1 章 . 象 正 2.1 標本空間 確率 基本 最初 確率 関連 言葉 意味,基本的 「 葉 界 性質 . ■確率 「 確率 不確 事柄 .例 対象 扱 起 ,「阪神 今日 起 可能性 ■根元事象 偶然 0 不確 . ,勝 ,負 確率 (尺度) 役割 担 1 1 実数値 表 .完全 確実 起 確率 ,逆 0 近 値 予 結果 ,逆 低 .確率 結果 起 可 .起 1 *2 近 値 0 結 *2 . , 確率 扱 対象 共通 特徴 言 支配 場合 . 対 確率 扱 結果 得 .例 」 言 表 程度 境 不明瞭 理論 適切 . , 果 扱 ,確率 不確 . 確率 可能性 高 事柄 .言 換 可能性 可能性 能性 」 不確 対象 原因 ,試合修了後 表現 TE 起 勝 生 確率 結果 起 果 試合 明確 伴 . 」 不確 ,引 分 推測 言 結果 試合 行 測 適 確率 扱 行動 ,各試行 結果 試行 結果 偶然 換 呼 根元事象 「○○ 支配 . . .特 結果 基本事象 総数 呼 200% 結 数 . 意味 可能性 」 全 無 表現 第2章 34 確率 例 2.1.1: 根元事象 例 引 ,阪神 分 試合結果 .各根元事象 ” 例 次 表 ,根元事象 添字 i 使 Ai “勝 ”,“負 ”,“ 表 ,阪神 . ■標本空間 可能 根元事象 集 VE { } { } { } , A2 = 負 , A3 = 引 分 A1 = 勝 集合 標本空間 S 例 2.1.2: 標本空間 場合,標本空間 S 次 書 . . NT AT I 例 2.1.1 呼 { } S = 勝 ,負 ,引 分 標本空間 S ■事象 . “試合結果 出 ” 表 標本空間 S 任意 根元事象 Ai . 部分集合 (subest), 事象 一部分 事象 E 呼 . 例 2.1.3: 事象 例 2.1.2 場合,次 事象 考 . { } { } E1 = 勝 , 引 分 , E2 = 勝 , 負 “負 事象,E2 ” TE E1 例 場合,事象 ∪ 表 事象 成立 . ,一般 和事象 呼 . 場合 「A1 A3 」 包含関係 .図 2.1 (2.1) 式 事象 間 次 (2.1) 式 関係 . S⊇E ⊇ 特別 次 関係 . . 標本空間 (2.1) 式 間 事象 ” E1 = A1 ∪ A3 , E2 = A1 ∪ A2 和集合 意味 根元事象 “勝負 表 ,標本空間 S (2.1) 事象 E 図 表 ,標本空間自体 全事象,空集合 含 意味 . 空事象 ∅ 呼 . 2.1 標本空間 確率 基本 35 S E 全事象 根元事象 表 図 次 部分集合 (2.2) 式 . 3 ∪ S = A1 ∪ A2 ∪ A3 = i=1 全事象 起 確率 1,空事象 起 確率 . Ai (2.2) . 0 NT AT I 公理 定義 表現 VE 図 2.1: 次 確率 例 2.1.4: 全事象 例 ,例 2.1.2 率 考 ,全事象 ■確率 公理 確率 場合,“勝 ”,“負 ”,“引 分 ” 確率 必 次 定義域 任意 事象 E Pr(E) 一致 公理 満 起 起 確率 必要 確率 表 確 . 1 事象 E 起 . 0 以上 1 以下 . . 0 ≤ Pr(E) ≤ 1 全事象 確率 全事象 S 起 確率 (2.3) . 1 Pr(S) = 1 排反事象 TE 排反事象 合 事象 . 図 2.2 共通 .今 A 起 A∩B 根元事象 互 B 確率 起 A 積事象 呼 含 2 事象, 排反 時,A B 確率 起 ,2 B 和事象 事象 共通 (2.4) 積集合 A∪B 確率 和 事象 表 空集 確率, 計算 . A ∩ B = ∅ −→ Pr(A ∪ B) = Pr(A) + Pr(B) (2.5) 式 図 表 (2.5) . 例 2.1.5: 排反事象 例 2.1.2 . “勝 ” “勝 “負 ” 同時 起 負 ” 確率 排反事象 確率 和 . 第2章 36 確率 S A ■確率 性質 AC 方以外 A 書 方 使 人 , C 書籍 A 用 . 書 余事象 「事象 A AC 1 A 公理 導 起 性質 」事象 起 確率 排反事象 A 次 説明 . 余事象 AC 引 *3 呼 計算 Pr(AC ) = 1 − Pr(A) . 図 2.3 (2.6) 式 図 表 . A AC 余事象 . (2.6) NT AT I *3 確率 図 VE 図 2.2: B S 図 2.3: 図 余事象 説明 例 2.1.6: 余事象 例 2.1.2 」 単調性 確率 事象 A { } A= 負 事象 B 例 2.1.7: 確率 例 2.1.2 部分集合 出 E ,B S 計算 ,B 起 「負 . 確率 方 A 起 . A ⊆ B −→ Pr(A) ≤ Pr(B) (2.7) 単調性 { ,A = 勝 } { ,B = 負 Pr(A) = 0.6, Pr(B) = 0.7 先 ,AC , ,Pr (A) = 0.3 Pr(AC ) = 1 − Pr(A) = 0.7 大 TE 確率 ,仮 図 2.1 } { } = 勝 ,引 分 ,(2.7) 式 (2.1) 式 事象 E 場合 相当 成 立 全事象 S 次 E ⊆ S −→ Pr(E) ≤ Pr(S) 表 ,仮 . 関係 A . 2.1 標本空間 確率 基本 加法定理 加法定理 与 37 ,排反 事象 A 2 和事象 A ∪ B B 次式 . Pr(A ∪ B) = Pr(A) + Pr(B) − Pr(A ∩ B) 第 3 項 Pr(A ∩ B) 除 通分集合 ,先 ,2 事象 考 分 . 排反 事象 A ∪ B 事象 確率 (2.5) 式 図 表 A 排反 場合 共 確率 一致 . 0 図 2.4 図 2.4: 和 . B A∪B 積事象 A ∩ B 図 場合 積事象 A ∩ B . NT AT I A∩B 重複 事象 A, B ,第 3 項 Pr(A ∩ B) 空集合 出 共通 VE 右辺 (2.8) 和事象 A ∪ B 説明 例 2.1.8: 加法定理 例 2.1.2 “1 勝 “2 試合行 連勝 { } 合,A = 第 1 戦 勝 勝 確率 勝 . 勝 Pr(B) 0.5 空事象 ∅ 起 ” 二重 , 確率 , ,各目 出 確率 . 確率 ,少 1 . , 1 − 0.84 = 0.16 割 連敗 “2 試合 計算 勝 ” . . 0 Pr(∅) = 0 根元事象 .例 確率 . 相当 説明 . 1 試合勝 ” 余事象 確率 “ 勝 Pr(A ∩ B) ” 0.75 “少 場 0.6 “2 試合 詳細 1.2 − 0.36 = 0.84 ,連敗 ■等確率 “2 試合 . . Pr(A) (2.24) 式 確率 考 } Pr(A) × Pr(B) = 0.36 TE 試合勝 限 0.6 1 試合勝 ”, , 44 Pr(A ∩ B) 空事象 仮 . 出 確率 ” 1.2 数 後 { ,B = 第 2 戦 勝 確率” 加 少 特定 根元事象 各目 根元事象 等 (2.9) 各根元事象 確率 等 場合 , . 場合,根元事象 総数 第2章 38 個々 根元事象 起 確率 全事象 確率 . Pr(S) = 根元事象 総数 × 個々 根元事象 起 全事象 確率 Pr(S) 与 起 確率 確率 Pr(Ai ) (2.10) . Pr(Ai ) = 例 2.1.9: 等確率 根元事象 場合 根元事象 (2.10) 総数 確率 ,根元事象 1 6 総数 ,各目 6 . 出 確率 NT AT I 知 1 VE 式 ,個々 根元事象 Ai 1 確率 根元事象 確率 等 , 事象 E 起 確率 (2.11) 式 与 . Pr(E) = 事象 E 含 根元事象 根元事象 総数 例 2.1.10: 等確率根元事象 例 2.1.9 根元事象 目 3 6 含 出 = 数 数 」 {2, 4, 6} ”確率 ,偶数 事象 1 2 3 . ,等確率 根元事象 象 (2.11) 事象 確率 偶数 “ 数 重要 「 事象 含 根元事 並 .例 . TE 2.2 根元事象 数 2.2.1 順列 ■順列 異 n個 r個 取 ,阪神 打順 選 24 名( 選 9 番目 決 入 場合 相当 9名 選 場合,1 番目 .2 番目 1名 既 選 25 × 24 通 25 − 8 = 17 名 選 考慮 25 名 . 25 通 25 − 1 名) 順番 . 25 名 1名 1 番目 . ,先発 自由 1名 残 25 通 順 計算 並 方 「n 個 , r個 2.2 根元事象 数 順列」 呼 39 ,(2.12) 式 n Pr n! 計算 . 階乗 表 ,(2.13) 式 n n! (n − r)! = n × · · · × (n − r + 1) = 1 (2.12) 自然数 積 定義 n . n! = 1 × 2 × · · · × (n − 1) × n 階乗 n 個 取 順列 定義 1 VE n個 (2.12) 式 計算 分母 . 0! = 1 ,n 個 n 個 取 順列 ,0 0! (2.14) (2.15) 式 計算 . = n! (2.15) NT AT I n Pn (2.13) 例 2.2.1: 順列 先 阪神 例 ,(2.12) 式 R ,25 名 9 名 取 順列 使 25 P9 計算 場合 = 25! = 25 × · · · × (25 − 9 + 1) (25 − 9)! ,741,354,768,000 通 . Tips.2.2.1: 順列 R ,階乗 ■重複順列 (2.12) 式 順列 . 個 対 合 繰 対象 並 順列 並 繰 . r 個取 ,前提条件 ,同 r個 取 . 関数 組 factorial(n)/factorial(n-r) # n 個 TE 1: 順列 求 返 並 対象 一度 利用可能 重複順列 呼 利用 条件 ,(2.16) 式 n≥r 返 利用 順列 ,n 計算 . n Πr = nr (2.16) 例 2.2.2: 重複順列 例 , .一度取 子供 出 異 選手 戻 5枚 順 野球 並 場合 持 通常 順列 ,一 I 第2章 40 確率 例 2.2.2: 重複順列 (続 ) 出 記録 重複順列 場合 . 極端 通常 元 戻 場合 5 枚 取 同 出 場合 選手 考 = 5! = 5 × 4 × 3 × 2 × 1 = 120 重複順列 5 Π5 = 55 = 3125 . 円状 n 個 配置 順列 円順列 呼 .最初 NT AT I ■円順列 置 任意 , . 順列 5 P5 計算 重複順列 VE 度取 自由 決 . ,残 (2.17) 式 与 n−1 Pn−1 1個 置 位 (n − 1) 個 配置 問題 . = (n − 1)! (2.17) 例 2.2.3: 円順列 例 ,宴会 丸 丸 席順 嫌 対 上司 ,横長 6 通 ,順列 場合 含 円順列 4 人掛 2通 12 通 24 通 場合 順列 n 個 TE ,各種類 個数 種類 並 nk Pnk 中 . ,確率 総 1/3 並 順列 数 k 種類 同 含 ,n = n1 +· · ·+nk . . n1 , n2 , . . . , nk n個 同 順列 . . 1/2 同 座 ,通常 順列 数 円順列 場合 ■同 隣 相当 (2.18) 式 与 . n! n1 ! × n2 ! × · · · × nk ! 中 nk 個 = nk ! 順番 区別 nk 個並 割 補正 .通常 順列 (2.18) 順列 数 並 . . 2.2 根元事象 数 例 含 順列 , 子供 持 , 並 (2.18) 式 次 計算 5 × ··· × 1 5! = = 10 2! × 3! 2×1×3×2×1 } { 種類 区別 ,次 . 並 方 対 仮 順列 . } { } 金本 1, 金本 2, 藤川 1, 藤川 2, 藤川 3 , 金本 1, 金本 2, 藤川 1, 藤川 3, 藤川 2 , { } { } 金本 1, 金本 2, 藤川 2, 藤川 1, 藤川 3 , 金本 1, 金本 2, 藤川 2, 藤川 3, 藤川 1 , { } { } 金本 1, 金本 2, 藤川 3, 藤川 1, 藤川 2 , 金本 1, 金本 2, 藤川 3, 藤川 2, 藤川 1 , { } { } 金本 2, 金本 1, 藤川 1, 藤川 2, 藤川 3 , 金本 2, 金本 1, 藤川 1, 藤川 3, 藤川 2 , { } { } 金本 2, 金本 1, 藤川 2, 藤川 1, 藤川 3 , 金本 2, 金本 1, 藤川 2, 藤川 3, 藤川 1 , { } { } 金本 2, 金本 1, 藤川 3, 藤川 1, 藤川 2 , 金本 2, 金本 1, 藤川 3, 藤川 2, 藤川 1 . NT AT I { 順列 金本 2 枚,藤川 3 枚 , 金本,金本,藤川,藤川,藤川 例 同 野球 VE 例 2.2.4: 同種 41 2! × 3! = 12 順序 , 考慮 数 1 意味 ,直後 2.2.2 12 組合 考 割 . 方 同 . 2.2.2 組合 ■組合 組合 投手 順列 2.2.1 順序 興味 対象 興味 対象 ,含 場合 総数 TE 組合 n Cr = r Pr 組合 .例 同 区別 呼 計算 = 順列 気 取 個 出 ,3 連戦 通 先発 「能見,榎田,藤浪」 必要 . 異 順 順序 r個 取 . n! n × · · · × (n − r + 1) n Pr = = r! × (n − r)! r! r! r Pr 同 順 .n 個 順列 , ,順列 数 割 合 ,順序 場合 組合 次式 n Pr 考慮 場合,「能見,藤浪,榎田」 投手 考慮 同 並 .先 考 方 用 (2.19) 1個 数 2.2.1 同 含 場 . 例 2.2.5: 組合 例 ( ,先 打順 入 気 25 名 ) (2.19) 式 9 名 先発 次 計算 選 組合 ,2,042,975 I 第2章 42 例 2.2.5: 組合 (続 ) . 25 C9 25 × · · · (25 − 9 + 1) = 2, 042, 975 9 × ··· × 1 = Tips.2.2.2: 組合 R 組合 R 求 ,“choose()” 関数 choose(n,r) # n 個 r個 組合 用 計算 . NT AT I 1: VE 通 ■重複組合 組合 列 ,一度選 同 .n 個 式 確率 一度取 出 重複 許 (2.20) 式 直観的 理解 {A, B, C} 出 場合 候補 許 {A, B, C, D} 加 呼 総数 次 (2.20) r 個取 出 必要 r−1個 同 重複 D 組合 = n+r−1 Cr 考慮 3個 異 重複順 重複組合 r個 取 ,再選択可能 r 個並 対 . n Hr ,取 組合 n≥r . 全部同 . 再度利用可能 異 計算 選 . 追加 ,最大 条件 可能 必要 2 個組合 総数 .今, 考 2 個 取 組合 . 次 . {A, B, C, D} −→ {AB, AC, AD, BC, BD, CD} 含 組 TE D 次 E 簡単 試 自分 試 追加 A, B, C . AD → AA , BD → BB , CD → CC 1 個増 *4 読 替 ,重複 許 3 個 組合 {A, B, C, D, E} 場合 3 個 取 組合 *4 置 換 ,新 考 , D, E . 例 2.2.6: 重複組合 例 , 子供 異 3 枚取出 重複 許 5枚 野球 並 重複組合 持 (2.20) 式 . 次 計 I 確率 定理 例 2.2.6: 重複組合 算 43 (続 ) . 5 H3 通常 5枚 2.3 条件 3 枚取出 並 組合 確率 2.3.1 条件 10 通 定理 確率 確率 等確率 根元事象 , 根元事象 個数 事象 E 根元事象 個数 比 与 . 事象 E 確率 Pr(E) 説明 小 . ,何 ) 行 .例 場合, 球団 競合球団数分 残 条件 引 事象 A 引 (2.21) 式 与 引 確率 確率 選手 球団 引 引 当 引 確率 , . 1/2 条件(当 生 残 A ) 条件 B 確率 ,事 呼 . . Pr(B|A) = 図 当 生 ) 全事象 変化( 目当 ,先 2 球団 (2.11) 式 指名会議 競合 生 引 逆数 象 B (当 考 , 全事象 S 既 NT AT I ■条件 7×6×5 = 35 3×2×1 = 7 C3 = VE 2.3 条件 表 A∩B 含 A 含 根元事象数 Pr(A ∩ B) = Pr(A) 根元事象数 (2.21) . 図 2.5 S TE A ■確率 呼 ■互 率 等 乗法定理 A∩B 図 2.5: 条件 図 確率 B 条件 確率 (2.21) 式 変形 (2.22) 式 確率 乗法定理 . Pr(A ∩ B) = Pr(B|A) Pr(A) 独立 事象 A 場合 B 互 独立 ,(2.23) 式 ,条件 満 Pr(A|B) = Pr(A) or Pr(B|A) = Pr(B) (2.22) 確率 条件 確 . (2.23) 第2章 44 互 独立 事象 積事象(共通集合) 確率 ,(2.24) 式 象 確率 積 与 , 事 . Pr(A ∩ B) = Pr(A) Pr(B) 使 確率 例 . ,阪神 2 試合行 ,各試合 勝 0.6 × 0.6 = 0.36 積事象 起 確率 言 . 従属 個々 事象 互 計算 事象 0.6 独立 . 確率 積 場合,互 NT AT I 従属 試合 勝 確率 確率 ,連勝 ■互 (2.24) VE 例 2.3.1: 独立事象 例 2.1.8 Pr(A ∩ B) ̸= Pr(A) Pr(B) 例 2.3.2: 従属事象 例 試合 ,両 勝 直接対決 ,同 確率 試合 A,読売巨人 試合 勝 確率 (2.24) 式 計算 両 . 勝利 事 (笑). 表現 複数 事象 組合 2 個 場合 分割表 独立,従属 表現 与 ,考慮 .今,2 AC ,B C 余事象 確率 勝 確率 A ∩ B 象 起 ■分割表 (2.25) 確率 ,阪神 B . . 事象 積事象 積事象 ,周辺確率 対 同時確率 確率 確率 事象 2 呼 TE 表 2.1 分割表 周辺確率 作成 表 2.1 事象 A,B , (2.26) 式 同時 起 . Pr(A ∩ B) = a, Pr(A ∩ B C ) = b, Pr(AC ∩ B) = c, Pr(AC ∩ B C ) = d 値 確率 (2.26) . 表 2.1: 分割表 A AC 周辺確率 欄 B a c a+c BC b d b+d (2.27) 式 示 周辺確率 a+b c+d a+b+c+d=1 事象 確率 表 . Pr(A) = a + b, Pr(AC ) = c + d, Pr(B) = a + c, Pr(B C ) = b + d (2.27) 確率 定理 右下 a+b+c+d 例 ,(2.21) 式 45 ,Pr(S) 1 条件 確率 Pr(B|A) . Pr(B|A) = 「事象 A 互 B 表 全事象 確率 一致 周辺確率 同時確率 比 . 計算 a a+b 独立」 表 2.1 中 同時確率 a, b, c, d 表 VE 2.3 条件 .(2.24) 式 a = (a + b)(a + c) = a2 + ab + ac + bc = a(a + b + c + d) − ad + bc ,a + b + c + d = 1 (2.28) 式 両辺 消去 a ,移項 . ad = bc 独立事象 (2.28) 確率 NT AT I 例 2.3.3: 分割表 整理 例 2.3.1 使 独立事象 a, b, c, d 阪神 連勝 確率 ,ad = bc = 0.0576 0.36, 0.24, 0.24, 0.16 場合, 成 立 . 直観的 与 ,事象 互 (2.24) 式 用 独立 条件 同時確率 (2.29) 式 表 周辺確率 積 . Pr(A ∩ B) = Pr(A) Pr(B), Pr(AC ∩ B) = Pr(AC ) Pr(B), Pr(A ∩ B C ) = Pr(A) Pr(B C ), Pr(AC ∩ B C ) = Pr(AC ) Pr(B C ) 定理 2.3.2 ■ 定理 ,逆 定理 条件 TE 時 (2.29) 与 ,Pr(B|A) 確率, Pr(A|B) 条件 計算 確率 定理 与 ,(2.30) 式 . A Pr(A|B) = 原因 Pr(A) 条件 (2.30) 式 条件付 時 ,逆 表 起 間接的 呼 導出 条件 (2.30) 確率 Pr(B|A) 結果 起 A 事後確率 (2.22) 式 用 確率 結果 B 確率 Pr(A|B) 事前確率,Pr (A|B) Pr(B|A) Pr(A) Pr(B|A) Pr(A) + Pr(B|AC ) Pr(AC ) 時 計算 A 原因 B . Pr(A) . .事象 A B 積事象 A ∩ B . Pr(B|A) Pr(A) = Pr(A|B) Pr(B) −→ Pr(A|B) = 確率 Pr(B|A) Pr(A) Pr(B) 第2章 46 S = A ∪ AC , (図 2.6 . 黄色 部分) . (2.22) 式 用 ( ) B = (A ∩ B) ∪ AC ∩ B 積事象 B 積事象 和 Pr(B) 変形 確率 表 (2.30) 式 分母 一致 . 図 2.6 図 (2.30) 式 図示 S VE Pr(B) = Pr(A ∩ B) + Pr(AC ∩ B) = Pr(B|A) Pr(A) + Pr(B|AC ) Pr(AC ) . AC A A∩B AC ∩ B BC B 図 定理 説明 NT AT I 図 2.6: ,互 排反 一般化 包括的 原因 複数 k 場合 定理 次 . Pr(B|Ai ) Pr(Ai ) Pr(B|A1 ) Pr(A1 ) + · · · + Pr(B|Ak ) Pr(Ak ) Pr(Ai |B) = 排反 A1 , A2 , . . . Ak 包括的 原因 ,事象 B (2.31) 次式 満 . B = (B ∩ A1 ) ∪ (B ∩ A2 ) ∪ · · · ∪ (B ∩ Ak ) 例 2.3.4: (2.32) 定理 例 ,阪神 . 勝 事象 勝 確率 Pr(A) = 0.55 確率 Pr(B|A) = 0.8 負 采配 TE . Pr(A|B) A,監督 采配 当 外 勝 勝 当 ,采配 条件 事象 采配 当 条件 B 条件 C 確率 Pr(B|A ) = 0.3 当 勝 条件 確率 確率 Pr(A|B C ) . 問題中 ,事象 A, AC 明示的 示 1 − Pr(A) = 0.45 . 代入 Pr(AC ) = 計算 . Pr(A|B) = 分母 (2.30) 式 排反 0.575 0.8 × 0.55 0.44 = = 0.765 0.8 × 0.55 + 0.3 × 0.45 0.575 ,Pr(B C ) = 0.425. Pr(B) (A ∩ B) ∪ (A ∩ B ) C A 条件 確率 A = 表 Pr(A) = Pr(A|B) Pr(B) + Pr(A|B C ) Pr(B C ) I 2.3 条件 確率 定理 例 2.3.4: 代入 47 定理 (続 ) 整理 , ,Pr(A|B C ) = 0.259 定理 “ 問題 確率 問題 定理 問 作 使 出題 気 ” 疑 .一番難 方 TE NT AT I 件 用 . VE 0.55 = 0.765 × 0.575 + Pr(A|B C ) × 0.425 .条 (笑). NT AT I TE VE 49 確率変数 章 分布 後日,部分的 . 残 第2章 例題 ”調 追加 表現方法 事象 基 確率 ,身 対象 “ , , “ 統一 行 ”調 平 . NT AT I 仄 合 VE 第3章 回 連続的 . 触 触 事象 .事象 変化 個々 区別 一般化 区別 数 確率変数 数 困難 基 確率 .第 2 章 ,例 「阪 」,「引分」 (根元)事象 . 3.1 確率分布関数・確率密度関数 3.1.1 確率変数 ■確率変数 神 確率変数 試合結果」 取 扱 TE 順 1, 0, −1 例的 X 一般的 表 試合 得点」 対 .確率変数 場合 考 確率変数 X . 方 用 表 事象 対 何 事象 数値化 」,「引分」,「負 ,「阪神 勝 *1 .他方,確率変数 小文字 x ,「勝 表 X=1 大文字 」,「負 扱 . 表 用 説明 ,「勝 試合結果」 事象 確率変数 . 当 「阪神 方 考 . 数値(実数) 割 先 考 用 . 場合 取 . 「阪神 , 」 確率変数 個々 用 」 慣 実数値 1 *1 表記 ({ }) X 勝 = ({ }) 1,X 引分 = ({ }) 0,X 負 = −1 書 第3章 50 確率変数 分布 3.1.2 離散確率変数 ■離散確率変数 離散確率関数 確率 p(x1 ), p(x2 ), . . . , p(xn ) . 離散確率変数 確率 2.1 関数 実数 公理 確率変数 単 確率 定義域 確率変数 呼 導 性質 公理 ,他 実数値 (3.1) 式 関係 関数 p (·) . 満 ,読売巨人 . 数 阪神 値 自然数 取 離散確率関数 関数 p(xi ) 値 0 ■離散確率関数 取 勝 数 ,累積確率分布関数 F (x) 与 33 x = {0, 1, 2, 3} 確率変数 X 確率 確率変数 X . . 離散確率 . p(0), p(1), p(2), p(3) 累積確率分布関数 呼 (3.1) NT AT I 場合,勝 3 連戦 離散確率関数 . Pr(X = xi ) ≡ p(xi ) 例 p(x) = 0 VE 0 . 実数値 x1 < x2 < · · · < xn 確率変数 X (3.1) 式 離散確率関数 p(·) ,実数 x 以下 確率 和 (3.2) 式 . F (x) = Pr(X ≤ x) = j ∑ p(xi ) (3.2) i=1 ,j xj ≤ x < xj+1 満 例 *2 章 先 節 出 二項 分布 勝 確率 0.6 整数 . ,巨人戦 *2 勝 数 離散確率関数 値 次 与 . p(0) = 0.064, p(1) = 0.288, p(2) = 0.432, p(3) = 0.216 B(3, 0.6) 「勝 数 TE 計算 次 1 試合以下」 計算 確率 (3.2) 式 累積確率分布関数 F (x) . F (1) = Pr(X ≤ 1) = p(0) + p(1) = 0.352 3.1.3 連続確率変数 ■連続確率変数 考 分布関数 . 限 見離散値 ,事実上数 標本空間 身 .例 回 事象 ,阪神 思 事象 必 有限個 標本空間 選手 体重 ,高精度 測定 不可能 . 場合 有限個 確率 場合 確率変数 ,連続 実数 標本空間 S 連続区間 .一 3.1 確率分布関数・確率密度関数 確率変数 連続確率変数 布関数)F (x) 呼 51 .連続確率変数 X (3.3) 式 与 累積分布関数( 単 . F (x) = Pr(X ≤ x) 率 ,分布関数 F (x) 和 表 .例 X ≤ 80, F (80) ■確率密度関数 単 密度関数)f (x) 選手 80[kg] 以下 確率 導関数( 分布関数 F (x) , 密度関数 f (x) [−∞, x] 実数値 x 以下 体重 *3 上述 定積分 *4 表 , *3 . 確率 (3.4) 確率 表 . 表 対 , *4 . ∫ x F (x) = f (t)dt (3.5) −∞ ■分布関数 区間 性質 分布関数 F (x) 入 確率 次 性質 確率変数 X Pr(a ≤ X ≤ b) = F (b) − F (a) = ,阪神 率密度関数 式 . 区間 [a, b] ∫ 例 満 入 ∫ b −∞ f (t)dt − 確率 . f (x) 次 70[kg] 表 (3.6) 式 満 ∫ a −∞ . b f (t)dt = f (t)dt (3.6) a 選手 体重 確率変数 X , 分布関数 F (x), 区間 確率 80[kg] 入 確 (3.6) . ∫ 80 Pr (70 ≤ X ≤ 80) = F (80) − F (70) = f (t)dt 70 確率 公理 TE 定義域 (3.7) 式 満 (3.7) 式 満足 必要 . 0 ≤ F (x) ≤ 1 , F (−∞) = 0 , F (∞) = 1 ,(3.8) 式 確率密度関数 f (x) ∫ 全面積 1 (3.7) 必要 . ∞ F (∞) = f (t)dt = 1 (3.8) −∞ 単調性 分布関数 単調増加 . (3.9) 式 満足 必要 . 例 ,阪神 率 80[kg] 以下 x1 < x2 −→ F (x1 ) ≤ F (x2 ) 選手 確率 体重 分布関数 必 小 F (70) ≤ F (80) 考 . 分布関数 F (x) 各x 接戦 傾 求 分布関数 F (x) NT AT I 面積 確率変数 X 1 次微分) 確率密度関数( dF (x) = F ′ (x) dx 高 X≤x x 確 表 . 呼 ,(3.4) 式 定義 f (x) = f (x) ,確率変数 阪神 分布関数 F (x) (3.3) VE (3.3) 式 分 (3.9) ,70[kg] 以下 確 求 密度関数 f (x) 囲 面積 第3章 52 確率変数 分布 3.2 分布 代表値 3.2.1 確率変数 平均値 分散・標準偏差 対 確率 密度関数 確率変数 連続型 関連 特徴 限界 分布 把握 方法 以下 ■確率変数 .1.2 節 説明 図示 把握 触 平均値 中心,広 確率分布 有効 表 中心 示 .連続確率変数 X ,自 記述統計 代表値 (3.10) 式 与 導入 分布関数 代表値 .重心 平均値 µ 密度関数 NT AT I 呼 実数値 確率関数・確率 ,第 1 章 . 平均値 , 分布関数 . 特徴 用 . 重要 . 代表値 ,離散型 VE ■確率変数 把握 計算 1次 f (x) . ∫ ∞ E(X) = µ = xf (x)dx (3.10) −∞ 離散確率変数 X p(x2 ), . . . , p(xn ) 対 ,X 対 x1 , x2 , . . . , xn 正 (3.11) 式 計算 与 E(X) = µ = x1 p(x1 ) + x2 p(x2 ) + · · · + xn p(xn ) = 確率 p(x1 ), . n ∑ xi p(xi ) (3.11) i=1 (3.11) 式 確率関数 p(xi ) 総和 ,(1.12) 式 1 加重平均 . ■分散 標準偏差 ,(3.12) 式 連続確率変数 与 分散 V (X) = σ 2 ( V (X) = σ = E (X − µ) TE 離散確率変数 用 対 先 p(xi ) 2 ) ∫ ∞ = −∞ 用 2 (x − µ) f (x)dx ,(3.13) 式 与 (3.12) . ( ) V (X) = σ 2 = E (X − µ)2 確率変数 . 密度関数 f (x) . 2 同様 前出 2 2 = (x1 − µ) p(x1 ) + · · · + (xn − µ) p(xn ) = n ∑ 2 (xi − µ) p(xi ) (3.13) i=1 標準偏差 , (3.12) 式,(3.13) 式 平方根 計算 3.2 分布 代表値 53 3.2.2 確率変数 期待値 関数 期待値 確率変数 関数 平均値 期待値 E (g(X)) g(X) . 定義 連続確率変数 ∫ ∞ E (g(X)) = 離散確率変数 対 任意 (3.14) 式 与 g(x)f (x)dx −∞ 同様 .確率変数 VE ■期待値 (3.15) 式 与 (3.14) . E (g(X)) = g(x1 )p(x1 ) + · · · + g(xn )p(xn ) = n ∑ g(xi )p(xi ) (3.15) i=1 前出 平均値 (3.10) 式,(3.11) 式 分散 (3.12) 式,(3.13) 式 関数 g(·) 2 g(X) = X ,g(X) = (X − µ) NT AT I 場合 期待値 ■期待値 関連 性質 定数 期待値 定数 対 期待値計算 関 元 ∫ 定数 次 知 . . ∫ ∞ E(a) = 性質 . ∞ af (x)dx = a −∞ f (x)dx = a (3.16) −∞ 1 次式 1 次式 期待値 ,期待値 1 次式 . 定数 a, b . E(aX + b) = E(aX) + E(b) = aE(X) + b 確率変数 和 期待値 確率変数 期待値 確率変数 和 独立 ,確率変数 . c, d 定数 和 (3.17) 期待値 . E(cX + dY ) = cE(X) + dE(Y ) 確率変数 定数 確率変数 積 確率変数 分散式 変形 変形 和 確率変数 関数 和 期待値 和 . . TE c, d 関数 (3.18) E{cg(X) + dh(X)} = cE{g(X)} + dE{h(X)} 期待値 期待値 確率変数 積 独立 ,確率変数 積 (3.19) 期待値 . E(XY ) = E(X)E(Y ) 確率変数 分散 確率変数 平均値 E(X) = µ (3.20) 用 (3.21) 式 . V (X) = E{(X − µ)2 } = E{X 2 − 2µX + µ2 } = E(X 2 ) − 2µE(X) + E(µ2 ) = E(X 2 ) − 2µ2 + µ2 = E(X 2 ) − µ2 (3.21) 第3章 54 確率変数 1 次式 分散 確率変数 定数 a, b 1 次式 分散 確率変数 (3.22) 式 . . V (aX + b) = a2 V (X) 変形 分布 (3.21) 式 (3.17) 式 (3.22) 利用 E(aX + b) = aµ + b . VE V (aX + b) = E{(aX + b)2 } − (aµ + b)2 = E(a2 X 2 + 2abX + b2 ) − (aµ + b)2 = E(a2 X 2 ) + E(2abX) + E(b2 ) − (aµ + b)2 = a2 E(X 2 ) + 2abE(X) + b2 − (a2 µ2 + 2abµ + b2 ) = a2 E(X 2 ) − a2 µ2 = a2 {E(X 2 ) − µ2 } = a2 V (X) 確率変数 和 分散 Y . 定数 c, d 独立 ,確率変数 . NT AT I (3.23) 式 確率変数 X 和 分散 V (cX + dY ) = c2 V (X) + d2 V (Y ) 確率変数 . 標準化 平均値 E(X) = µ,分散 V (X) = σ 2 確率変数 X (3.24) 式 変換 ,Z Z= ■確率分布 X 下 点 100α% 点 確率 連続 値 持 . E(Z) = 0, V (Z) = 1 1 (X − µ) σ 確率変数 X (3.25) 式 満 100α% (3.23) 与 x 与 分布関数 (3.24) . F (x) . 確率変数 t以 . F (x) = Pr(X ≤ x) = α , 0<α<1 (3.25) 3.3 基本的 分布関数 確率変数 対 形状 取 TE 意 分布関数 適 事象 共通 定 例 ,金本 (余事象 失敗 . 分布 成功 確率 現象 . 取 任 事例 知 分布関数 , 上 多 基本 . 分布 分布 成功 ,先験的 分布関数 適用可能 3.3.1 ■ 基本的 条件 満 . 表現 的 3.1 節 示 事象 分布 打 ) 事象 , 2 種類 呼 p,失敗 確率 (余事象 , . q = 1−p 繰 打 ),藤川 事象 余事象 返 確率変数 X 試行 1 (3.26) 式 Pr(X = 1) = p, Pr(X = 0) = q = 1 − p 導 0 取 表 .例 . (3.26) 3.3 基本的 分布関数 x 0 55 変数 1 ,確率関数 (3.27) 式 . Pr(X = x) = px · (1 − p)1−x , x = 1, 0 ,金本 打率 確率 考 ,金本 . 0.250 1回 打席 打 ,(3.27) 式 p = 0.250, q = 0.750 打率 用 次 打 確率 (成功) 余事象 確率 VE 例 (3.27) 表 . Pr(X = x) = 0.250x · 0.7501−x 分布 平均値 分散 (3.28) 式 表 . E(X) = p , V (X) = pq = p(1 − p) 簡単 誘導 . NT AT I 次 (3.28) E(X) = 1 ∑ x · px · (1 − p)1−x = 1 · p1 · 0 + 0 = p x=0 1 ∑ V (X) = (x − p)2 · px · (1 − p)1−x = p2 · 1 · (1 − p) + (1 − p)2 · p x=0 2 = p − p3 + p − 2p2 + p3 = p(1 − p) 金本 打 確率 例 ,E(X) = 0.250, V (X) = 0.1875 . 3.3.2 二項分布 ■二項分布 通常,金本 試行 試行 複数回繰 複数回繰 試行 TE . 1 試合 1 回打 返 返 得 二項分布 試行 総数 n 確率変数 例 *5 二項分布 呼 n Cx 成功回数 打率 1 試合 仮 母数 呼 確率分布関数 例 成功確率 4 回打席 回 X · px · q n−x , x = 0, 1, . . . , n 二項分布 n, p . . 定 従 (3.29) ,B(n, p) (3.30) 式 表記 表 X ∼ B(n, p) 確率関数 金本 ,n 回中 試行 成功確率 p 母数 n,p 分布 決定 B(10, 0.3) 確率分布関数 (3.29) 式 与 Pr(X = x) = p(x) = 立 打席 . n 回繰 返 実施 ,二項分布 確率関数 . ,何回 . (3.30) .図 3.1 B(20, 0.5),B(20, 0.3), . ,今 p = 0.250 ,金本 仮定 . x 本打 確率 *5 最近 不調 代打 1 回限 … , 第3章 56 0.4 1.0 B(20,0.5) B(20,0.3) B(10,0.3) ● ● 0.3 ● ● ● ● ● ● ● 0.1 ● 0.0 ● ● ● ● ● ● ● ● ● ●● ●●●● ● 0 5 ● ● ● 0.6 ● 0.4 ● ● ● ● ● 0.2 ● 10 15 ● ● ● ● ● ● ● ● ● ● ●● ●● ●●●●● ●●●●● 0.0 20 ●●● ● ●●●● 0 x B(20,0.5) B(20,0.3) B(10,0.3) ● ● 5 10 15 20 x 図 3.1: 二項分布 確率関数 次 . 確率分布関数 NT AT I Pr(X = x) = p(x) ●●●●● ●●●●● ●●●●●●● ● ● ● ● ● ● 分布 VE p (x ) ● 0.2 ● 0.8 F (x ) ● ● ● 確率変数 p(0) = 4 C0 · 0.250 · 0.754 = 0.316, p(1) = 4 C1 · 0.251 · 0.753 = 0.422, p(2) = 0.211, p(3) = 0.047, p(4) = 0.004 R Tips.3.3.1: 二項分布 R 二項分布 率変数,n 計算 次 試行総数,p 確率関数 成功確率 関数 用意 . 確 x 表 . dbinom(x,n,p) 確率分布関数 pbinom(x,n,p) Pr(X ≤ x) = α lower.tail x qbinom(α,n,p,lower.tail=TRUE) 点 TE 二項分布 次 平均値 分散 (3.31) 式 表 対 . E(X) = np , V (X) = npq = np(1 − p) (3.31) . E(X) = 分解 上側確率 . 導出 試行総数 n 下側確率,FALSE TRUE n ∑ x · n Cx p q x n−x x=0 n ∑ n ∑ n × · · · × (n − x) x n−x p q = x x! x=0 (n − 1) × · · · × (n − x) x−1 n−x p q · np (x − 1)! x=1 {n−1 } ∑ (n − 1) × · · · × (n − 1 − x) = px q n−1−x · np = np x! x=0 = x 掛 .確率分布関数 定義 試行総数 n − 1 n−1 二項分布 二項分布 総和 1 np 積 np 3.3 基本的 分布関数 . V (X) = = = n ∑ (x − np)2 x=0 n ∑ n × · · · × (n − x) x n−x p q x! (x2 − 2npx + n2 p2 ) x=0 n ∑ { n × · · · × (n − x) x n−x p q x! x(x − 1) + (1 − 2np)x + n2 p2 x=0 VE 導 57 } n × · · · × (n − x) x n−x p q x! = n(n − 1)p2 + (1 − 2np)np + n2 p2 = n2 p2 − np2 + np − 2n2 p2 + n2 p2 = −np2 + np = np(1 − p) = npq 平均値 導出 時 利用 n(n − 1)p2 積 分解 ,先 金本 0.75 x(x−1) 併 掛 試行総数 n−2 利用 導 打 確率 B(4, 0.25) 場合 二項 .例 NT AT I 分布 方 ,E(X) = 1, V (X) = . ■二項分布 B(m, p) 再生性 従 成功確率 確率変数 Y ,B(n, p) p 独立 ,確率変数 従 確率変数 X 和X +Y ,二項分布 従 . B(n + m, p) X + Y ∼ B(n + m, p) 成功確率 値 分散 共通 (3.32) 式 与 点 . ,確率変数 X + Y . E(X + Y ) = (n + m)p , V (X + Y ) = (n + m)p(1 − p) 例 金本 10 打席 確率 B(20, 0.3) 打 確率 B(10, 0.3) 和 ,B(30, 0.3) TE ● ● ● ● ● ● ● ● ● 0.1 5 ● ● ● ● 0.6 ● 0.4 ● ● ● ● ● 15 20 ● ● 0.0 ● ● ● 10 ● ● ● ● ● ● ●● ●● ●●●●● ●●●●● ● ● B(30,0.3) B(20,0.3) B(10,0.3) ●●●●● ● ● 0 x 5 10 x 図 3.2: 二項分布 打 ● 0.2 ● ● ● ● ● ●●● ●● 20 打席 ●●●●● ●●●●●●● ●●●●● ● ● ● ● ● ● ● ● 0 ●●● ●● ● ● ● 0.8 F (x ) p (x ) ● ● B(30,0.3) B(20,0.3) B(10,0.3) (3.32) . 1.0 0.3 0.0 鳥谷 従 .図 3.2 0.4 0.2 平均 再生性 15 20 第3章 58 確率変数 分布 3.3.3 多項分布 結果 二項分布 3.3.2 . 二項分布 “成功” “失敗” 固定 . pi .多項分布 xi 一般化 多項分布 与 異 k ∑ 満 k ∑ pi = 1 , . 複 既 試行 一種類 試行間 , 各結果 次 得 認 . (2.16) 式 重複順列 考 方 利用 各結果 i = 1, . . . , k 順番 回数 xi = n i=1 紹介 .二項分布 NT AT I 確率関数 導 k 個 結果 取 条件 i=1 多項分布 成功確率 p .合計 n 回 確変量 n 回繰 返 多項分布 , 対 成功確率 分布 3.3.1 VE ■多項分布 並 起 順列 導 重 x1 , . . . , xk ,(x1 , . . . , xk ) 組 対 順列 総数 (2.16) 式 計算 n! x1 ! × · · · × xk ! . 確率 各試行 独立 n 回 試行 (x1 , . . . , xk ) p1 x1 × · · · × pk xk , 確率関数 (3.33) 式 MD(x1 , . . . , xk ; p1 , . . . , pk ) = (3.33) 式 TE Xi 導出 二項分布 3.3.4 ■ 分布 ,2 試合 与 exp(−λ) e−λ 持 同 意味 二項分布 B(n, p1 ) 分散 一致 . (3.34) 式 計算 . V (Xi ) = npi (1 − pi ) E(Xi ) = npi , 平均値 (3.33) n! p1 x1 (1 − p1 )n−x1 = B(n, p1 ) x1 ! × x2 ! 平均値 E(Xi ),分散 V (Xi ) 導出 方法 同様 考 (3.34) 方 行 . 分布 例 ,金本 1 試合 3 本以上 期間内 *6 n! p1 x1 × · · · × pk xk x1 ! × · · · × xk ! p2 = 1 − p1 k=2 MD(x1 , x2 ; p1 , p2 ) = 多項分布 . 確率関数 ,発生回数 X 1本 打 確率 発生回数 与 分布 呼 確率関数 打 表現 ,各発生回数 .正 知 定数 λ > 0 (3.35) 式 表 *6 . . 起 区間内 確率 発生回数 3.3 基本的 分布関数 59 λx exp(−λ) , x! Pr(X = x) = p(x) = *7 exp(1) = e = 2.71828183 . . . 表 . 決 分 分布 λ 表 Po(λ) x = 0, 1, . . . , ∞ ,自然対数 (3.35) 底 ,λ 数 母数 呼 .母数 λ *7 . X ∼ Po(λ) ,(3.36) 式 成 性質 数 立 . ∞ ∑ VE 確率関数 ∞ ∑ λx exp(−λ) p(x) = =1 x! x=0 x=0 分布 Po(λ) 平均値 (3.37) 式 分散 (3.36) 与 . V (X) = λ (3.37) NT AT I E(X) = λ, 平均値 次 E(X) = = ∞ ∑ 導出 xp(x) = x=0 ∞ ∑ . ∞ ∑ xλx exp(−λ) x! x=0 ∞ ∑ λ · λx−1 exp(−λ) λx exp(−λ) =λ (x − 1)! x! x=1 x=0 =λ·1=λ 同様 分散 V (X) = ((3.36) 式 次 ∞ ∑ x2 p(x) − λ2 = x=0 ∞ ∑ (x − 1 x ) ) 導出 . ∞ ∑ x2 λx exp(−λ) x! x=0 − λ2 ∞ ∑ {(x − 1) + 1}λx exp(−λ) xλ exp(−λ) = − λ2 = − λ2 (x − 1)! (x − 1)! x=1 x=1 = x ∞ ∑ λ2 · λx−2 exp(−λ) (x − 2)! TE x=2 = λ2 ∞ ∑ λx exp(−λ) x! x=0 + ∞ ∑ λ · λx−1 exp(−λ) x=1 +λ (x − 1)! ∞ ∑ λx exp(−λ) x=0 x! − λ2 − λ2 =λ +λ−λ =λ 2 分布 図 3.3 例 確率分布関数 場合 λ = 2, 3, 5 示 . 先 示 知 区間 . 2 確率関数 考 金本 ,2 試合 1 試合 3 本以上 ,区間内 分布 Po(2) . p(x) = d x a = ax dx 満 a 1本 打 過去 打 確率 計算 .今「2 試合」 本数(発生回数)λ 確率関数 p(x) 2x exp(−2) x! 次 結果 表 1×2=2 定義 第3章 60 1.0 0.30 ● ●● ● 0.25 0.8 ●● ●●● ● 0.10 ● ● ● ● ● ● ● ● 0.05 0.00 ● ● 0.6 0.4 ●● 0.2 ● ● ● ● 0 ● ● ● ● ●● ●● ●●●●●●●● ●●●●● 5 10 15 0.0 20 *8 . ● λ=2 λ=3 λ=5 ● ● 0 5 10 15 分布 確率関数 20 」 「 発生回数 確率分布関数 0,1,2 本 」 NT AT I 打 ,p(0), p(1), p(2) 試験 ,通常必要 exp(−λ) 値 問題中 書 ● x 図 3.3: CPA ● ●● ● x *8 ● ● ● 「3 本以上 ● ● ● ● ●●●●●●●●●●●●●● ●● ●● ●● ● ● ● VE 0.15 ● 分布 ● ● λ=2 λ=3 λ=5 ● F (x ) p (x ) 0.20 確率変数 計算 ,1 引 . 次 余事象 計算 22 exp(−2) 1 − p(0) − p(1) − p(2) = 1 − exp(−2) − 2 exp(−2) − 2! = 1 − exp(−2)(1 + 2 + 2) = 1 − 0.677 = 0.323 R 分布 Tips.3.3.2: 分布 R 確率変数,lambda 確率関数 求 ,次 区間内 発生回数 関数 用意 . x 表 . dpois(x,lambda) 確率分布関数 ppois(x,lambda) Pr(X ≤ x) = α TE lower.tail ■ x qpois(α,lambda,lower.tail=TRUE) 点 分布 再生性 互 X2 ) = λ1 + λ2 独立 . 対 確率変数 X1 , X2 確率変数 和 X1 + X2 平均値 λ1 , λ2 平均値 λ1 + λ2 従 . X1 + X2 ∼ Po(λ1 + λ2 ) Pr(X1 + X2 = x) = 合成 上側確率 . 分布 従 分布 下側確率,FALSE TRUE (λ1 + λ2 )x exp(−(λ1 + λ2 )) , x = 0, 1, . . . , ∞ x! 分布 .前掲 平均値 図 3.3 分散 (3.38) E(X1 + X2 ) = λ1 + λ2 ,V (X1 + 分布 再生性 例 . 3.3 基本的 分布関数 分布近似(小数 法則) 二項分布 B(n, p) 小 p ,(3.39) 式 Po(np) x n−x ∼ n Cx p q 図 3.4 .図 3.4 B(1000, 0.02) 0.06 方 明 0.04 0.02 0.00 0 10 20 30 40 二項分布 同 図 描 近似 ●● ● ● ● ● ● ● ● Po(20) B(1000,0.02) ● ● ● NT AT I 0.06 0.08 p (x ) 0.08 p (x ) 0.10 ●● ● ●●● ● Po(20) ● ●● ● B(100,0.2) ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ●● ●● ●●● ● ●●● ● ●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●● (3.39) 分布 Po(20) . 0.10 . n = 1000,p = 0.02 母数 np = 20 右図 近似 (np)x exp(−np) x! 母数 n = 100,p = 0.2 B(100, 0.2),B(1000, 0.02) 十分大 n VE ■二項分布 61 ● ● 0.04 ● ● ● 0.02 0.00 50 ● ● ● ● ● ●●● ●●●●●●●●●●●●●●●●●● ● ● ● ● ●●●●●●●●● 0 10 20 x 30 40 50 x 図 3.4: 小数 法則 3.3.5 指数分布 ■指数分布 時間内 導出 事象 事象 分布 発生回数 x 回発生 確率 TE 少 発生回数 λ . λ = λy 扱 母数 , ,y 単位時間 確率 p(x, y) = . 単位時間内 (λy)x exp(−λy) x! 「y 時間以下 事象 発生 確率 Pr(Y ≤ y)」 考 .Pr(Y ≤ y) 1 回発生 発生 余事象 ,全 確率 p(0, y) 与 . Pr(Y ≤ y) p(0, y) = (λy)0 exp(−λy) = exp(−λy) 0! 確率分布関数 (3.40) 式 与 . F (y) = Pr(Y ≤ y) = 1 − exp(−λy) 確率密度関数 f (y) (3.40) 式 微分 f (y) = (3.41) 式 dF (y) = F ′ (y) = λ exp(−λy) dy (3.40) . (3.41) 第3章 62 (3.40) 式,(3.41) 式 「 単位時間内 対 ,指数分布 率」 表 確率分布 λ 回発生 「 事象 単位時間 指数分布 x 回発生 λ 回発生 確率密度関数 確率分布関数 λ=2 λ=1 λ = 0.5 F (y ) f (y ) 0.8 1.0 0.5 0.6 0.4 y 時間間隔 発生 4 6 8 10 0 2 4 6 y 図 3.5 (3.41) 式 例 確率密度関数 λ=2 確率変数 y 確率分布関数 ,甲子園球場 注意 売 子 10 分間 5 分間以下 発生数 . λ=2 ,積分値 . 2杯 1 杯買 . y = 5/10 = 0.5 ,連続確率変数 表 調整 .単位時間当 10 確率分布関数 f (0) = 2 生起確率 1 . 8 y 図 3.5: 指数分布 確率密度関数 5分 指数分布 NT AT I 0.0 2 確 λ=2 λ=1 λ = 0.5 0.2 0.0 例 表 λ = 2, 1, 0.5 1.0 0 分 . 2.0 1.5 . 確率」 事象 .図 3.5 呼 分布 VE 布 定義 確率変数 確率 単位時間 買 考 10 分 (3.40) 式 F (0.5) = Pr(Y ≤ 0.5) = 1 − exp(−2 × 0.5) = 1 − exp(−1) = 1 − 0.368 = 0.632 *9 指数分 相 計算 50% 点 . F (y) = 0.5 TE 布 当 *9 3.5 分 y . Tips.3.3.3: 指数分布 R R 指数分布 変数,lambda 求 ,次 関数 単位時間内 発生回数 用意 . y 確率 表 . 確率密度関数 dexp(y,lambda) 確率分布関数 pexp(y,lambda) Pr(Y ≤ y) = α lower.tail 点 y qexp(α,lambda,lower.tail=TRUE) TRUE . 下側確率,FALSE 上側確率 対 3.3 基本的 分布関数 ■指数分布 63 平均値,分散 決 指数分布 平均値 E(Y ) 1 , λ V (Y ) = 母数 λ . E(Y ) = 部分積分 部分微分 公式 *10 利用 1 λ2 (3.42) *10 . 公式 VE 導出 分散 V (Y ) d f (y)g(y) = f (y)g ′ (y) + f ′ (y)g(y) dy ,移項 d f (y)g(y) − f ′ (y)g(y) dy f (y)g ′ (y) = 積分 部分積分 公式 得 . NT AT I ,両辺 ∫ ∫ ′ f (y)g (y)dy = f (y)g(y) − 次 E(Y ), V (Y ) 表 ∫ . ∫ ∞ E(Y ) = ∞ V (Y ) = ∞ yp(y)dy = 0 ∫ f ′ (y)g(y)dy y · λ exp(−λy)dy 0 ∫ ∞ y p(y)dy − E(Y ) = 2 2 0 y 2 · λ exp(−λy)dy − E(Y )2 0 g(y) = − exp(−λy), g ′ (y) = λ exp(−λy) 着目 ,部分積分 . 公式 平均値 平均値 E(Y ) [ TE −y E(Y ) = exp(λy) 同様 f (y) = y ,分散 次 ]∞ 計算 ∫ − f (y) = y 2 . ∞ (− exp(−λy)) dy [ ]∞ −y 1 1 = = lim + y→∞ exp(λy) λ exp(λy) 0 λ 分散 V (Y ) [ 次 計算 0 0 . ]∞ ∫ ∞ −y 2 1 V (Y ) = − 2y(− exp(−λy))dy − 2 exp(−λy) 0 λ 0 ∫ ∞ 2 1 2 1 1 =0+ yλ exp(−λy)dy − 2 = · E(Y ) − 2 = 2 λ 0 λ λ λ λ 以下 人 思 興味 第3章 64 確率変数 分布 3.3.6 一様分布 分布 0 一様分布 呼 .確率密度関数 f (x) = 宝 転 打 使 円盤 込 抽選器 抽選 回 矢 例 単位 0 otherwise 角度 ,回転速度 x 度 (3.43) 式 一定 ,矢 刺 一様分布 次 f (x) = . . (3.43) 基準 決 R a≤x≤b *11 ,区間外 (3.43) 式 与 1 b−a ,回転抽選 一定 1 360 0 ≤ x < 360 0 otherwise . NT AT I *11 連続区間 (a ≤ x ≤ b) 確率関数 VE ■一様分布 確率変数 X 位置 基準 場合,角度 Tips.3.3.4: 一様分布 R 一様分布 変数,a 求 下限,b ,次 上限 表 関数 用意 . x 確率 . 確率密度関数 dunif(x,a,b) 確率分布関数 punif(x,a,b) Pr(X ≤ x) = α lower.tail x qunif(α,a,b,lower.tail=TRUE) TRUE 点 3.3.7 正規分布 上側確率 対 . 平均値 TE 一様分布 下側確率,FALSE 分散 (3.44) 式,(3.45) 式 1 E(X) = b−a ∫ b xdx = a 2 a+b 2 V (X) = E(X 2 ) − {E(X)} = 1 E(X ) = b−a ∫ b 2 x2 dx = a (b − a)2 12 a2 + ab + b2 3 与 . (3.44) (3.45) 3.3 基本的 分布関数 ■正規分布 1.3 節 例 使 ,周辺 *12 発見者 名 呼 呼 体重 身長 分布 度数 低 傾向 分 布 65 示 多 .例 . 分布 .正規確率変数 X 式,(3.47) 式 与 表 ,平均値 付近 ,表 1.1 体重分布 確率分布関数 (3.46) . 1 F (x) = Pr(X ≤ x) = √ 2πσ µ,σ 2 平均値 ∫ VE { } 1 (x − µ)2 f (x) = √ exp − 2σ 2 2πσ } { (t − µ)2 dt exp − 2σ 2 −∞ x ,N(µ, σ 2 ) 分散 表 (3.46) X ∼ N(µ, σ 2 ) √ 前 1/ 2πσ 表 ∞ (3.47) 式 積分 時 exp , F (∞) F (x ) f (x ) 0.2 0.4 −5 0 5 10 −10 −5 0 x 平均値 TE ■標準正規分布 呼 . 固定 0 確率分布関数 (3.46) 式 特 平均値 標準正規分布 計算 N(µ, σ 2 ) . z 変換 呼 場合 正規分布 確率密度 0,分散 x 1 正規分布 標準正規分布 用 z , ( 2) 1 z f (z) = √ exp − 2 2π z= 変換 10 . 確率変数 X 従 5 確率分布関数 1, 22 , 52 ,分散 示 表 . N(0, 1) N(0, 1) N(0, 22) N(0, 52) x 図 3.6: 正規分布 確率密度関数 Z a = 0.0 −10 ■標準変換 e 0.6 0.2 従 (3.48) 変換 確率変数 x−µ ←→ x = σz + µ σ . 用 ,(3.49) 式 重要 変換 標準正規分布表 . 積分 −ax2 √−∞ π a 0.8 0.0 z *13 ∫ ∞ . 1.0 0.1 N(0, 1) *13 必要 N(0, 1) N(0, 22) N(0, 52) 0.3 関数 −∞ ,f (x) 1 0.4 図 3.6 (3.47) . NT AT I (3.46) 式 高 正規分布 *12 確率密度関数 確率密度関数 度数 (3.49) 用 確率 dx = , 1 2 2σ √ 2πσ 得 第3章 66 点 Pr(Z ≤ z) 表 ,例 先 触 確率分布関数 . 0 標準正規分布 100α% 点 (3.50) 式 与 断 ,Pr(Z ≥ z) = α 合 *14 CPA 式 率 試験 Pr(Z ≤ z) = α 場合 論文 上側確 *14 .図 3.7 ∫ ( z t2 exp − 2 −∞ 下側 100α% 点 ) dt = α 指 1.0 N(0, 1) 0.8 上側 100α% 点 N(0, 1) 0.4 0.1 0.2 z = − 0.842 0.0 −4 −2 0 z = − 0.842 0.0 2 4 −4 −2 0 z 多 R 一発 計算 簡単 値 表 形式 付録 A 示 z = 0.84 読 点(20% 点) . 予 表 示 確率変数 分布表 . α = 0.2 呼 対応 *16 得 . 確率分布関数 代表的 z ≥0 付録 A.1 場合,標準正規分布表 z = −0.84 取 値 1−α .α < 0.5 .例 4 100α% 点 確率密度変数 値 求 . 分布表 範囲 −z *15 示 TE 分布 分布関数 値 (確率) , 分布関数 確率 対応 確率変数 値 示 ,所与 多 布関数 *16 分布関数 2 z 図 3.7: 標準正規分布 使 用 0.6 F (z ) f (z ) 0.2 場 . NT AT I 0.3 (3.50) ,統計的検定 下側 20% 点 例 0.4 *15 100α% 点 呼 . z . Pr(Z ≤ z) = 1 − α α = 0.2 確率 実数値 値 与 1 F (z) = Pr(Z ≤ z) = √ 2π 特 任意 , 90% Z≤z 確率変数 1 分布 VE ■ 確率変数 z 表 確率分 α ≥ 0.5 読 取 , 値 α = 0.8 . Tips.3.3.5: 正規分布 R R 正規分布 変数,mean 求 平均,sd ,次 標準偏差 関数 表 用意 . x 確率 . 確率密度関数 dnorm(x,mean,sd) 確率分布関数 pnorm(x,mean,sd) Pr(X ≤ x) = α lower.tail x qnorm(α,mean,sd,lower.tail=TRUE) TRUE 下側確率,FALSE 上側確率 対 I 3.3 基本的 分布関数 67 Tips.3.3.5: 正規分布 (続 ) 点 ■正規分布 . 再生性 互 N(µ2 , σ2 2 ) 独立 従 . 正規確率変数 X1 + X2 N(µ1 + µ2 , σ1 2 + σ2 2 ) 2 E(X1 ) = µ1 , V (X1 ) = σ1 2 , E(X2 ) = . µ2 , V (X2 ) = σ2 2 2 従 2 .一般 2 確率変数 Xi (i = 1, . . . , n) 重 任意 n ∑ 1 次関数 一般 ( (3.18) 式 対 ) 2 次式 ai Xi 再生性 従 n ∑ ai Xi ∼ N ( n ∑ i=1 例 3.3.1: 正規分布 例 能見 正規分布 分布 指 . i=1 藤浪 1 試合 従 失点 . N(9, 62 ),同様 能見 能見 1 試合,藤浪 藤浪 3 試合 一致 失点 , N(8, 52 ), . 値 組 . 合 確率 考 場合 “pnorm(5,9,6)” 簡 利用 Excel 変換後 場合 正規分布表 R 場合 用 目的 , 確 能見 3 試合 場合 z= ,付録 A.1 ,1 R (3.49) 式 標準変換 .例 従 能見 3 試合 .残念 TE 求 場合 N(7, 40) = N(7, 6.3242 ), 場合 5 点以下 ,例 場合 1 試合登板 N(6, 92 ) 場合 使 登板 N(2, 32 ) σ 2 = 32 × 22 = 36 = 62 2 試合登板 登板 1 (3.51) N(3, 22 ) 仮 2 試合,藤浪 3 試合 合計失点 例 値 2 i=1 3 試合 µ = 3 × 3 = 9, 案分 (ai σi ) 3 試合 能見 藤浪 登板 .能見 率 求 ) 再生性 次 確率変数 ai µi , n ∑ ,互 ,定数列 ai NT AT I 表 (3.23) 式 a1 X1 + a2 X2 正規分布 正規分布 N µi , σi i=1 単 定数 a1 , a2 従 . N(a1 µ1 + a2 µ2 , a1 σ1 + a2 σ2 ) 独立 N(µ1 , σ1 2 ) 正規確率変数 X1 , X2 VE R 5−9 = −0.667 6 正規分布表 引 0.66 .0.66 値 0.67 0.7454,0.67 読 取 0.7486 3 × 0.7454 + 7 × 0.7486 = 0.74764 10 引 0.25236 . .能見 2 試合,藤浪 1 試合 R 求 値 0.25249 0.27425,能見 1 試合,藤 I 第3章 68 例 3.3.1: 正規分布 R ) 0.37591,藤浪 3 試合 計算 .悪 (手 0.45576 応用 ,同時確率関数 株式 紹介 経済学 . 取 NT AT I 3.4.1 同時確率関数 ■同時確率関数 複数 個々 X 確率変数 確率変数 関 確率関数 ,同時確率関数 Y 同時確率関数 (3.52) 式 表 p(xi , yj ) , i = 1 , . . . , n ; j = 1 , . . . , m (3.52) 式 表 表 表 3.1 書 TE ■周辺確率関数 周辺確率関数 ··· ··· .. . x1 p(x1 , y1 ) .. . p(x1 , yj ) .. . p(x1 , ym ) pX (x1 ) ··· ··· ··· .例 ,X . pX (xi ) = ··· .. . ··· ··· 計算 (3.55) 式 与 xn p(xn , y1 ) .. . p(xn , yj ) .. . p(xn , ym ) pX (xn ) ,個々 関 . . (3.52) m ∑ pY (y1 ) .. . pY (yj ) .. . pY (ym ) 1 確率変数 周辺確率関数 p(xi , yj ) 導出 (3.53) 式 (3.53) j=1 ■平均値・分散 同時確率関数 各確率変数 関 用 呼 一般形 ··· ··· xi p(xi , y1 ) .. . p(xi , yj ) .. . p(xi , ym ) pX (xi ) 同時確率関数 p(xi , yj ) 呼 上 . 表 3.1: 同時確率関数 y1 .. . yj .. . ym 抜 ). 3.4 確率変数 応用 確率変数 分布 VE 浪 2 試合 再生性 (続 確率変数 .例 ,X 平均値,分散 周辺確率関数 平均値 E(X),分散 V (X) (3.54) 式, . E(X) = µX = n ∑ i=1 xi pX (xi ) (3.54) 3.4 確率変数 応用 69 V (X) = n ∑ xi 2 pX (x1 ) − µX 2 (3.55) i=1 確率変数 X 定義 . 共分散 COV(X, Y ) Y (3.56) 式 (3.57) 式 VE ■共分散 COV(X, Y ) = E {(X − µX )(Y − µY )} m n ∑ ∑ (xi − µX )(yj − µY ) · p(xi , yj ) = i=1 j=1 = E(XY ) − µX µY = n ∑ m ∑ xi · yj · p(xi , yj ) − µX µY 用 (3.57) NT AT I i=1 j=1 ■相関係数 相関係数 ρXY 共分散 COV(X, Y ) (3.58) 式 定義 (3.56) 分散 V (X) . COV(X, Y ) ρXY = √ V (X) · V (Y ) ■独立性 同時確率関数 独立 分布 周辺確率関数 .(3.59) 式 満 積 表 (3.58) ,確率変数 X 確率関数 ■条件 確率関数 0 同時確率関数 定義 .例 (3.60) 式 与 TE 関数 共分散 Y . p(xi , yj ) = pX (xi ) · pY (yj ) 独立 確率変数 V (Y ) ,相関係数 0 , 条件 事象 ,X = xi (3.59) . 付 Y = yj 場合 条件 条件 確率 . Pr ({Y = yj |X = xi }) = p(xi , yj ) pX (xi ) (3.60) 例 3.4.1: 同時確率関数 一般形 理解 ,表 3.2 人工的 例 考 . 表 3.2: 同時確率関数 yj \ x i 0 1 pX (xi ) 0 0.1 0.3 0.4 1 0.2 0.4 0.6 例 pY (yj ) 0.3 0.7 1.0 I 第3章 70 確率変数 分布 例 3.4.1: 同時確率関数 (続 ) 平均値 周辺確率 (3.54) 式 用 , 次 計算 . 同様 分散 算 平均値 周辺確率 (3.55) 式 用 . VE E(X) = 0 · 0.4 + 1 · 0.6 = 0.6 , E(Y ) = 0 · 0.3 + 1 · 0.7 = 0.7 , 次 計 V (X) = 12 · 0.6 − 0.62 = 0.24 , V (Y ) = 12 · 0.7 − 0.72 = 0.21 他方,共分散 (3.57) 式 次 計算 . NT AT I COV(X, Y ) = 1 · 1 · 0.4 − 0.6 · 0.7 = −0.08 相関係数 (3.58) 式 ρXY = √ ,例 表 3.2 次 . −0.08 −0.08 −0.08 =√ = = −0.356 0.2245 0.24 × 0.21 0.0504 次 (3.59) 式 満 独立 . p(0, 0) = 0.1 , pX (0) · pY (0) = 0.4 × 0.3 −→ p(0, 0) ̸= pX (0) · pY (0) 条件 確率 (3.60) 式 ,例 次 Pr(Y = 1|X = 1) = 計算 . 0.4 = 0.667 0.6 TE 3.4.2 ■収益 変数 用 行 .未来 *17 値 呼 収益率 期待 期待収益率 率 期待値 A 理論 B 債権 .株式 a 収益率 (3.61) 式 分散 扱 ,収益率 b 定 与 分析 ,確率変数 *17 標準偏差 σ E(A) = µA , E(B) = µB 呼 ,次式 呼 . B 収益 . (3.61) . V (A) = σA 2 , V (B) = σB 2 収益率 A 確率 . (3.62) 3.4 確率変数 応用 71 将来 収益率(予想収益率)ai 益率 期待値 (3.11) 式 用 (3.64) 式 発生 (3.63) 式 計算 確率 p(ai ) 得 , 場合,収 (3.13) 式 用 . E(A) = n ∑ ai p(ai ) (3.63) VE i=1 n n ∑ ∑ 2 (ai − µA ) p(ai ) = ai 2 · p(ai ) − µA 2 V (A) = i=1 ■ i=1 株式 動 時 有利 働 特定 株式 利回 影響 ,不利 働 投資 軽減 考 場合, 株価 出 手法 変動 .例 下落 際 株式 組 合 投資 ,(3.65) 式 関係 . 損失 収益率 .変 手持 資金 被 NT AT I 損失 w 債権 (3.64) . . C ,振 分 率 . C = wA + (1 − w)B 期待収益率 (3.18) 式 用 (3.66) 式 計算 (3.65) . E(C) = µC = wµA + (1 − w)µB 次式 数 与 . 期待収益率 (3.66) 相関係 . ρAB { } V (C) = E (C − µC )2 = σC 2 { } = E (wA + (1 − w)B − µC )2 { } = E w2 A2 + 2w(1 − w)AB + (1 − w)2 B 2 + µC 2 − 2µC (wA + (1 − w)B) TE µC 2 − 2µC (wA + (1 − w)B) =(wµA + (1 − w)µB )2 − 2(wµA + (1 − w)µB )(wA + (1 − w)B) =w2 µA 2 + 2w(1 − w)µA µB + (1 − w)2 µB 2 − 2w2 µA A − 2w(1 − w)µB B − 2w(1 − w)µB A − 2(1 − w)2 µB B , 期待値 求 , { } E µC 2 − 2µC (wA + (1 − w)B) = w2 µA 2 + 2w(1 − w)µA µB + (1 − w)2 µB 2 − 2w2 µA E(A) − 2w(1 − w)µB E(B) − 2w(1 − w)µB E(A) − 2(1 − w)2 µB E(B) = −w2 µA 2 − 2w(1 − w)µA µB − (1 − w)2 µB 2 第3章 72 得 . 元 式 戻 計算 (3.67) 式 得 確率変数 分布 . { } V (C) = E (C − µC )2 { } = E w2 A2 + 2w(1 − w)AB + (1 − w)2 B 2 VE − w2 µA 2 − 2w(1 − w)µA µB − (1 − w)2 µB 2 { } { } = w2 E(A2 ) − µA 2 + (1 − w)2 E(B 2 ) − µB 2 − 2w(1 − w) {E(AB) − µA µB } = w2 σA 2 + (1 − w)2 σB 2 + 2w(1 − w)COV(A, B) = w2 σA 2 + (1 − w)2 σB 2 + 2w(1 − w)σA σB ρAB (3.68) 式 , . (3.67) √ w2 σA 2 + (1 − w)2 σB 2 + 2w(1 − w)COV(A, B) √ = w2 σA 2 + (1 − w)2 σB 2 + 2w(1 − w)σA σB ρAB NT AT I σC = 振 分 率w 収益率 (3.69) 式 計算 w 2 種類 場合 微分 最小 . 0 . µC − µB µA − µB w= 債権 (3.68) 微分 振 分 率w 式 次 (3.69) (3.67) 式 . dσC 2 = 2σA 2 w + σB 2 (−2 + 2w) + σA σB ρAB (2 − 4w) dw = 2(σA 2 − 2σA σB ρAB + σB 2 )w − 2(σB 2 − σA σB ρAB ) 0 (3.70) 式 得 整理 w . 2(σA 2 − 2σA σB ρAB + σB 2 )w − 2(σB 2 − σA σB ρAB ) = 0 2(σA 2 − 2σA σB ρAB + σB 2 )w = 2(σB 2 − σA σB ρAB ) σB 2 − σA σB ρAB σB 2 − COV(A, B) = σA 2 − 2σA σB ρAB + σB 2 σA 2 − 2COV(A, B) + σB 2 TE w= (3.71) 式 表 益率 E(C) 債権 Ai V (C) 3 種以上組合 n ∑ wi · Ai 期待収 . (3.71) i=1 E(C) = n ∑ wi · E(Ai ) = i=1 wi C (3.72) 式,(3.73) 式 計算 C= (3.70) n ∑ i=1 n ∑ i=1 wi = 1 wi · µAi (3.72) 3.4 確率変数 応用 . V (C) = ( ··· w1 wi σA1 2 .. . COV(A1 , Ai ) .. . COV(A1 , An ) 例 ■ ··· ) ··· .. . ··· .. . COV(Ai , A1 ) .. . ··· COV(Ai , An ) · · · ··· .. . ··· .. . σAi 2 .. . 以下 数値例 例 3.4.2: 使 COV(An , A1 ) w1 .. .. . . wi COV(An , Ai ) . .. . . . σAn 2 wn (3.73) 見 例1 阪急阪神 景気局面 NT AT I 例 wn VE 満 73 与 3.3 完全 . 架空 説明 都合上適当 . 収益率 数値 割 表 当 . 表 3.3: 収益率 例 収益率 好景気 阪急阪神 HD 4% 20% 0.4 生起確率 阪急阪神 変化 8% 6% 0.3 , 10% −2% 0.3 収益率 .期待収益率 収益率 計算 景気悪化 (3.63) 式 T H ,Bs (3.64) 式 次 . µT H = 0.04 · 0.4 + 0.08 · 0.3 + 0.1 · 0.3 = 0.07 σT H 2 = 0.042 · 0.4 + 0.082 · 0.3 + 0.12 · 0.3 − 0.072 = 0.00066 µBs = 0.2 · 0.4 + 0.06 · 0.3 + (−0.02) · 0.3 = 0.092 TE σBs 2 = 0.22 · 0.062 · 0.3 + (−0.02)2 · 0.3 − 0.0922 = 0.008736 景気局面 気” 他方 両方 企業 等 影響 “景気悪化” 角成分, 表 3.1 (3.57) 式 計算 局面 p(xi , yi ) 以外 ,言 換 片方 “好景 発生 . 同時確率 0 . 対 共分散 . COV(T H, Bs) = 0.04 · 0.2 · 0.4 + 0.08 · 0.06 · 0.3 + 0.1 · (−0.02) · 0.3 − 0.07 · 0.092 = −0.0024 振 分 率 w , 期待収益率 µC I 第3章 74 例 3.4.2: 確率変数 分布 例 1 (続 ) 次 σC . µC = 0.07 · w + 0.092 · (1 − w) √ 0.00066 · w2 + 0.008736 · (1 − w)2 − 0.0048 · w(1 − w) VE σC = 0.095 w=0 期待収益率 0.090 0.085 0.080 NT AT I 0.075 ● 0.070 ● w=1 0.00 0.04 0.08 ボラティリティ 図 3.8: 横軸 ,縦軸 軌跡 描 合 例 期待収益率 図 3.8 負 組 小 . 相関係数 2 点 結 直線 . TE 先 変化 場合 赤 場合 −0.9995 相関係数 破線 示 w=0 分 率w (3.70) 式 求 0 0.0747, . 例2 例 架空 求 . ),単独 期待収益率 例 3.4.3: 載 振 , 0.0006 合 場合 1 範囲 . 最少 0.784 1 ,適切 組 .図 3.8 −1 0 .図 3.8 (相関係数 w=1 ,w 用 ,過去 .例 .月 簡便的 株価変動 上場企業 収益率 先月終値 当月 終値 当月始値 先月 仮定 利用 株価 時系列 終値 簡便的 掲 計算 . 当月終値 − 当月始値 当月終値 − 先月終値 = 先月終値 当月始値 表 3.4 阪急阪神 HD 2013 年 8 月 2014 年 8 月 株価 I 3.4 確率変数 応用 75 例 2 (続 ) 終値 計算 収益率 . 表 3.4: 阪急阪神 HD 月 株価終値 2014 年 8 月 年月 株価 阪急阪神 HD 収益率 阪急阪神 HD 阪急阪神 HD 2013/9 545 1595 0.026 0.178 2013/10 550 1686 0.009 0.057 2014/1 522 1590 -0.081 -0.139 2014/2 558 1500 0.069 -0.057 2014/5 565 1614 0.009 0.093 2014/6 578 1679 0.023 0.040 2013/11 565 1865 0.027 0.106 2013/12 568 1847 0.005 -0.010 2014/3 562 1453 0.007 -0.031 2014/4 560 1477 -0.004 0.017 2014/7 603 1693.5 0.043 0.009 2014/8 613 1570 0.017 -0.073 NT AT I 株価 ) 2013/8 531 1354 年月 収益率(2013 年 8 VE 例 3.4.3: 収益率 阪急阪神 HD 年月 両社 株価 阪急阪神 HD 収益率 阪急阪神 HD 期待収益率 収益率 本共分散 .従 以下結果 示 . 単純 標本平均,標本分散 .共分散 標 (1.1) 式,(1.2) 式,(1.26) 式 計算 . µT H = 0.0126 , σT H 2 = 0.00125 , µBs = 0.0158 , σBs 2 = 0.00752 COV(T H, Bs) = 0.00124 , ρT HBs = 0.404 振 分 率 次 TE σC σC = , w . µC = 0.0126 · w + 0.0158 · (1 − w) √ 0.00125 · w2 + 0.00752 · (1 − w)2 + 0.00248 · w(1 − w) 横軸 変化 ,縦軸 軌跡 相関 律 描 ,w .両社 架空 両社 ,図 3.8 小 0 相関係数 率w 求 .今回用 実際 0.9964 例 両社 範囲 1 0.404 正 単独 ,同程度 . 分 期待収益率 図 3.9 高 振 期待収益率 µC 期待収益 (3.70) 式 最少 単独 大 小 異 I 第3章 76 例 3.4.3: 分布 例 2 (続 ) σBs 2 = 0.00752), . 負 銘柄 同程度 銘柄 ,併 組合 方 効果的 期待収益率 0.016 小 共分散 0.015 0.014 ● w=1 ● NT AT I 0.012 0.03 0.05 0.07 ボラティリティ TE 図 3.9: 十分 . w=0 0.013 比 VE (σT H 2 = 0.00125 小 確率変数 例2 0.09 77 VE 第4章 標本分布 3章 確率変数 確率分布 標本 取 確率 出 考 方 得 触 . 標本分布 章 3章 触 紹介 NT AT I 布 用 取 出 元 確率分布 章,6 章 基礎 母集団 母数 推定 . 標本分 利用 ,続 5 . 4.1 標本平均 4.1.1 無作為標本 標本平均 ■無作為標本 例 . 日 “ 甲子園球場 全入場者 年齢 調 手間暇 事実 *1 調 . 全標本 標本 呼 全数 . ,小数 抽出 {X1 , . . . , Xn } 表 同 分布 入場者 100 分 標本 標本 従 年齢 呼 集 甲子園 . 非常 入場者数 100 人 推測 抽出 .大 表 数 n ,X1 , . . . , Xn 入場者 *1 収集 特徴 標本 確率変数 X .先 ,n 標本 偏 調 集 1 母集団全体 無作為標本 ,各個体 平均値” 甲子園球場 各入場口 一部 母集団 .偏 日 “ 例 調査 . TE 方 先 . . 年齢 (1.1) 式 計算 . 年齢” 確率変数 考 年齢 入場者数 年齢 例 考 分 重要 無作為標本 互 R 無作為標本 .確率変数 返 (replace) 1: 取 出 偏 ,Xi . . 関数 “sample()” “x” 入 取 出 場合 ,例 次 sample(x, size=100, replace=FALSE) 1 独立 性 Tips.4.1.1: 無作為標本 抽出 R 面倒 例 用意 100 個 (size),繰 . I 裏 100 人数分 集 可能 . 確実 偏 第4章 標本分布 .例 甲子園 入場者 .他方,TRUE 取 78 Tips.4.1.1: 無作為標本 抽出 (続 ) “replace” 再利用不可 FALSE 年齢調査 場合 標本 再利用化 2: .例 . 確率変数 X1 , . . . , Xn 統 計 量 s (X1 , . . . , Xn ) 置 無作為標本 換 得 標本平均 母集団 母平均値 *2 先 .例 甲子園 . 偏 呼 . 以下 選 , 相当 全入場者 無作為標本 年齢 . 平均値 求 µ,分散 平均値 抽出 調 標本平均 X” 出 . . 考 分散 n 統計量 .X (4.1) 式 1 1∑ (X1 + · · · + Xn ) = Xi n n i=1 n ( ) 平均値 E X . σ /n 母平均値 µ 標本 n 一致 割 , (4.1) (( )2 ) µ,分散 V (X) = E X − µ (4.2) 式 2 (4.3) 式 散 σ2 統計値 呼 σ2 年齢 合計 n 個 X= X 統計量 観測値 確率変数 X µ,母分散 例 . 統計量 今対象 入場者 “無作為標本 {X1 , . . . , Xn } 求 関数 s (X1 , . . . , Xn ) 統計値 標本標準偏差 σ2 , 表 . 確 率 変 数 X1 , . . . , X n s (x1 , . . . , xn ) 標本平均 ■無作為標本 人 相当 NT AT I x1 , . . . , x n 通常 .母集団 代表値 知 対象 . 目 sample(seq(1:6), size=100, replace=TRUE) ■統計量・統計値 *2 出 出 VE R “無作為標本 標本平均” 平均値 “無作為標本 標本平均” 分散 求 一致 性質 母分 . TE n n ( ) 1 1∑ 1∑ 1 E X = E (X1 + · · · + Xn ) = E (Xi ) = µ = × nµ = µ (4.2) n n i=1 n i=1 n (( ) )2 ) 1 ( 2 X −µ = 2 E {(X1 − µ) + · · · + (Xn − µ)} n n ( ) ∑ ∑ 1 2 E (Xi − µ) + 2 E ((Xi − µ) (Xj − µ)) = 2 n V (X) = E i=1 i̸=j n ) 1 ∑ ( σ2 1 2 2 = 2 E (Xi − µ) = 2 × nσ = n i=1 n n (4.3) 式 変形 現 . 過程 ,E ((Xi − µ) (Xj − µ))( E ((Xi − µ) (Xj − µ)) 確率変数 Xi (4.3) ( 2 ,i ̸= j ) E (Xi − µ) Xj 共分散 ) 4.1 標本平均 79 ■統計量 分布 作為標本 独立 統計量 繰 返 求 標本平均 説明 無作為標本 必要 .例 本 繰 標本平均 平均値 分散 m 回繰 返 大 , 本的 . m 個 標本 一致 . 話 . ,繰 返 ,無作為抽出 確率変数 分布関数 統計量 無作為標 n ,続 必 元 4.1.2 項 順 母集団 *3 標本 大 (= n) “標本 回数 ”,標 本 抽 出 繰 返 数 (= .繰 m) “標本数” 3.3 節 紹介 NT AT I 一般的 求 計算 *3 2 場合 上 返 大 標本平均 .後 例 示 µ,σ /n ,無 . 繰 σ 2 /n 必要 得 母集団 ,m 個 標本平均 得 µ,分散 回数 m 分布 .例 計算 無作為標本 1 . 統計量 分布 得 ,母平均値 µ,母分散 σ 2 十分大 返 去 求 . 平均 平均値 m 返 標本平均 抽出 同 操作 消 0 VE ,確率変数 互 基 . 4.1.2 分布関数 標本平均 ■標本成功率 標本平均 母集団 母数 ,無作為標本 返 標本平均 X 回数 n 成功率 計算 ,観測値 x 表 p, n .標本平均 分母 試行 p 求 分数値 繰 ,(4.4) 式 . ( ) 1 2 pX (x) = Pr X = x , x = 0, , , . . . , 1 n n 平均 求 前 確率変数 和Y = n ∑ 二項分布 Xi 従 (4.4) . i=1 Y ∼ B(n, p) TE (4.5) 式 X = Y /n 分散 表 . p (y) = n Cy py (1 − p) 二項分布 n−y 平均値,分散 , y = 0, 1, 2, . . . , n 公式 (3.31) 式 (4.6),(4.7) 式 ( ) V X =V (4.2),(4.3) 式 1 Y n ( 1 Y n ) = 1 1 E (Y ) = np = p n n (4.6) *4 ) 一致 平均値 . ( ) E X =E ( ,X (4.5) = 1 1 p (1 − p) V (Y ) = 2 np (1 − p) = 2 n n n *4 . 程 (4.7) 導 出 不 要 (3.28) 式 (4.2),(4.3) 式 適用 . 導 過 第4章 標本分布 Tips.4.1.1 利用 ,任意 成功 80 分布 標本平均 Tips.4.1.2: {0, 1} 分布 確率変数 . 確率 p p = 0.75 1: 取 prob = c(1 − p, p) 場合 n = 100 回繰 返 観測 .下 場合 相当 例 . . mean(sample(c(0,1), size=100, replace=TRUE, prob=c(0.25,0.75))) 計算 平均値 分散 求 ,標本平均 NT AT I 返 形式 格納 処理 便利 .例 p = 0.75,観測値 個数 n = 100,標本平均値 個数 m = 50 平均値 分散 xmean 1: 2: 3: 4: 5: 6: 7: m . 処理 ,理論値 程度 次 標本平均 . µ = p = 0.75,σ 2 /n = p(1 − p)/n = 確認 .R “hist()” 関数 利用 様子 確認 TE 図 描 変 乖離 0.001875 8: 計算 時 成功確率 p=0.75 n=100 m=50 xmean=numeric(m) # 長 m for(i in 1:m) xmean[i] = mean(sample(c(0,1), size=n, replace=TRUE, prob=c(1-p,p))) mean(xmean) var(xmean) 処理 認 成功確率 sample(c(0,1), size=100, replace=TRUE, prob=c(0.25,0.75)) m 回繰 例 R 0.5 100 個 観測値 標本平均 次 2: 分散 ,先 成功確率 設定 平均値 VE R 利用 ,標本平均値 “xmean” 簡単 確 度数分布 . hist(xmean, right=FALSE) ■二項分布 標本平均 母分布 母数 m,p(成功確率 布 B(m, p) n 回 無作為試行 観測 得 .同 二項分布 B(m, p) (3.32) 式 二項分布 再生性 得 p 試行数 m) 二項分 標本平均 X n 個 確率変数 総和 Y = 考 n ∑ i=1 二項分布 B(nm, p) Y ∼ B(nm, p) 従 . Xi 4.1 標本平均 81 二項分布 平均値,分散 式 (3.31) 式 E(Y ) = nmp , V (Y ) = nmp(1 − p) (3.17) 式 (3.22) 式 . ( E(X) = E ( V (X) = V 標本平均 平均値 Y n ) = Y n ) (4.8) 式,(4.9) 式 1 nmp E(Y ) = = mp n n (4.8) 1 nmp(1 − p) mp(1 − p) V (Y ) = = 2 2 n n n (4.9) = VE . 定義式 (4.2),(4.3) 式 分散 R 得 Tips.4.1.3: 二項分布 標本平均 平均値 分散 分布 場合 ,二項分布 R 個数 無作為抽出用 1: 2: 3: 4: 5: 6: 7: 8: 標本平均 TE 」 相当 分布 形式 xmean 格納 観測値 標本平均 . 打 確率 . 1 試合 5 打席 (m = 5) 立 100 試合 (n = 100) 分調 k 回繰 返 標本平均 分布 打者 表示 hist(xmean, right=FALSE) ■ 分布 . 標本平均 分布 Po(λ) i=1 利用 p,1 回 無作為抽出 . k 「打率 3 割 (p = 0.3) 利用 n ∑ 関数 “rbinom()” p=0.3 m=5 n=100 k=50 xmean=numeric(k) # 長 k for(i in 1:k) xmean[i] = mean(rbinom(n, m, p)) mean(xmean) var(xmean) 例 9: m,成功確率 n,無作為抽出 反復 例 同 “sample()” 関数 利用 Tips.4.1.2 場合 .二項分布 標本 Y = 結果 NT AT I . ,同 .同 Xi ,(3.38) 式 母分布 n回 単位時間当 無作為抽出 分布 Po(λ) 分布 従 発生回数 λ 得 標本平均 独立 再生性 母数 , 考 確率変数 Xi 和 分布 Po(nλ) 従 第4章 82 . 確率密度関数 pY (k) Y 次式 表 標本分布 . (nλ) e−nλ Y ∼ Po(nλ) , pY (k) = , k = 0, 1, . . . , ∞ k! k 平均値 Y 分散 (3.37) 式 , 次 . 分布,二項分布 (3.22) 式 場合 平均値 同様 VE E(Y ) = nλ , V (Y ) = nλ 考 ,X = Y /n (4.10) 式,(4.11) 式 ) ( ( ) 1 1 1 Y = E (Y ) = nλ = λ E X =E n n n X 分散 (3.17) 式 ( 1 Y n ) = (4.10) 1 1 λ V (Y ) = nλ = n2 n2 n NT AT I ( ) V X =V . (4.11) 二項分布 同様,標本平均 平均値 分散 定義式 (4.2),(4.3) 式 結果 得 R . 分布 Tips.4.1.4: 分布 位時間当 場合 .単 n,無作為抽出 反復 格納 m xmean TE lambda=2 n=5 m=100 xmean=numeric(m) # 長 m for(i in 1:m) xmean[i] = mean(rpois(n, lambda)) mean(xmean) var(xmean) 2 本 (lambda = 2) m 回繰 返 打 打者 」 相当 本数 . 標本平均 表示 hist(xmean, right=FALSE) 利用 ■正 規 分 布 ( ) N µ, σ 2 用意 . 5 試合 (n = 5) 分調 8: 分散 関数 “rpois()” 標本平均 次 例 「1 試合当 分布 平均値 lambda,標本 分布 . 標本平均 無作為抽出 発生回数 . 1: 2: 3: 4: 5: 6: 7: ,同 . 標本平均 n回 母分布 無作為抽出 母 平 均 µ,母 分 散 σ 2 得 標本平均 母数 正規分布 考 4.1 標本平均 .(3.51) 式 83 正規分布 ( 正規分布 N nµ, nσ 2 ) 再生性 ,独立 正規確率変数 Xi 和Y = n ∑ Xi i=1 従 . ( ) Y ∼ N nµ, nσ 2 (3.17) 式 (4.12) 式,(4.13) 式 (3.22) 式 . ( ) E X =E ( ) V X =V ( ( 1 Y n 1 Y n ) = 平均値 (4.12) 1 1 σ2 2 V (Y ) = nσ = n2 n2 n (4.13) ,同 結果 得 NT AT I 標本平均 平均値 分散 定義式 (4.2),(4.3) 式 . 従 正規分布 標本平均 X . 分散 1 1 E (Y ) = nµ = µ n n = ) X VE 他 分布 同様,X = Y /n 分布 母数 µ, σ 2 /n ( ) ( σ2 X ∼ N µ, n Tips.4.1.5: 正規分布 標本平均 平均値 分散 R 正規分布 分布 場合 母平均 無作為抽出 mean,母標準偏差 .母分散 m . . xmean 正規分布 次 ,平方根 母標準偏差 標本平均 格納 TE 9: 利用 指定 . mean=30 sd=10 n=50 m=100 xmean=numeric(m) # 長 m for(i in 1:m) xmean[i] = mean(rnorm(n, mean, sd)) mean(xmean) var(xmean) 入場者 相当 .母 n,無作為抽出 反復 例 「母平均 mean = 30,母標準偏差 sd = 10 場 用意 sd,標本 指定 注意 1: 2: 3: 4: 5: 6: 7: 8: 関数 “rnorm()” n = 50 人 選 . xmean 分布 表示 hist(xmean, right=FALSE) . 年齢 調 調査 ) 正規分布 N µ, σ 2 /n 正規分布 従 甲子園球 m 回繰 返 」場合 第4章 84 4.1.3 有限標本 標本平均 ■有限母集団 標本平均 無限母集団 ,有限母集団 標本平均 阪神 本 N 考 .例 80 選手 体重分布 有限母集団 標本平均 母集団 平均値 µ,分散 σ 2 1.3 節 使 有限 .全標 VE 表 1.1 標本分布 (4.14) 式 与 . N 1 1 ∑ 2 2 µ= (x1 + x2 + · · · + xN ) , σ = (xi − µ) N N i=1 個々 x1 , x2 , . . . , xN 抽出 求 表 ( ) 標本平均 期待値 E X . . 有限母集団 ( ) 分散 V X ( ) E X =µ n 個 標本 (4.15) 式,(4.16) NT AT I 式 要素 (4.14) (4.15) ( ) N − n σ2 V X = N −1 n 分散 (N − n) / (N − 1) (4.16) 式 十分大 致 補正項 . 本平均 全数抽出 分散 計算 散 .全標本 標本平均 ,補正項 n=N 全数調査 N 分散 一 ,標 0 (4.14) 式 全標本 平均値 同 値 , 相当 分 . 例 4.1.1: 有限母集団 有限母集団 利用 求 格納 無作為抽出 場合 length(x) 1: 2: 3: 4: 表 1.1 考 ,標本 xmean 標本平均 .例 TE 均 相当 呼 ,無限母集団 ,何度繰 返 0 数 近 1 . 0 補正項 (4.16) 平均値 R 分散 Tips.4.1.1 阪神 . . . 次 “sample()” 関 80 選手 体重 n,無作為抽出 反復 得 紹介 正規分布 x m 標本平均 標本平 80 選手分 体重 . 全標本 格納 . x=c(75,64,80,94,93,63,66,85,72,80,99,70,83,72,82,92, 84,84,88,88,88,86,77,95,90,93,78,94,80,89,87,79, 84,86,87,93,84,77,80,91,82,83,78,78,84,82,86,78, 95,80,119,110,79,80,75,82,85,70,84,83,83,76,83,95, 86,93,84,79,92,93,73,82,81,77,78,102,80,63,78,80) n=20 m=10 xmean=numeric(m) # 長 m I 不等式 4.2 例 4.1.1: 有限母集団 法則 標本平均 85 平均値 分散 (続 for(i in 1:m) xmean[i] = mean(sample(x, n, replace=FALSE)) mean(xmean) var(xmean) (4.14) 式 平均 分散 計算 µ = 83.5 , σ 2 = 86.9 . 8: 9: 分散 Tips.1.2.5 注意 . NT AT I 必要 蛇足 ,例 ,素直 有限母集団 N = 80 n = 80 m=1回 m = 10 回繰 返 n=8 調 方 不等式 大数 結果 得 . 法則 不等式 4.2.1 ■ R N=length(x) (N-1)/N*var(x) 用 4.2 ) VE 5: 6: 7: 大数 不等式 母平均 Z = (X − µ) /σ 率変数 . 正 (4.17) 式 関係 満 確率変数 Z σ2 µ,母分散 確率変数 X 実数 λ . 不等式 TE 標準化 (4.18) 式 σλ 呼 .(4.17) 式 確率 ,1/λ2 以下” 外側 λ 行 確率変数 X 置 換 1 λ2 (4.19) 式 確率変数 (4.20) 式 求 区間 c 以外 確率 平均値 . (4.18) 式 成 立 . 1 λ2 (4.18) 表 . Pr (|X − µ| ≥ c) = Pr (X − µ ≤ −c) + Pr (c ≤ X − µ) ≤ (4.19) 式 (4.17) “確率変数 Z 表 Pr (|X − µ| ≥ σλ) ≤ c 確 ,標準化 Pr (|Z| ≥ λ) = Pr (Z ≤ −λ) + Pr (λ ≤ Z) ≤ (4.17) 式 標準化 ,逆 σ2 c2 区間内 (4.19) 確率 . Pr (|X − µ| ≤ c) = Pr (−c ≤ X − µ ≤ c) ≥ 1 − σ2 c2 (4.20) 第4章 86 例 4.2.1: 不等式 標準正規確率変数 X 計算 .R 使 pnorm() 1: 2: 3: 4: 標本分布 場合 (4.17) 式 Tips.3.3.5 不等式 正規分布 次 確率分布関数 数値例 計算 関数 . 例 VE lambda=2 mean=0 sd=1 pnorm(-lambda,mean,sd) + 1-pnorm(lambda,mean,sd) lambda = 2 1 = 0.25 22 NT AT I Pr (|Z| ≥ 2) = 0.0455 ≤ , 不等式 成 立 . 粗 近似 0.25 注意 0.0455 . 4.2.2 大数 法則 ■大 数 弱法則 {X1 , . . . , Xn } 母平均 考 定数 c 以上 数 弱法則 確率 呼 µ,母 分 散 . 確率変数 X 極限 0 ({ n→∞ 誘導 TE ■大 数 (4.21) 式 表 正 関係 大 µ X X σ 2 /n (4.21) 置 換 . . (4.19) ( ) σ2 Pr |X − µ| ≥ c ≤ 2 nc ,右辺 .大数 母平均 µ 0 強法則 {X1 , . . . , Xn } 母平均 µ . (4.21) 式 誘導 大 無作為標本 }) |X − µ| ≥ c = 0 平均値 分散 n → ∞ ,標本平均 . 不等式 (4.22) 式 (4.22) 式 標本平均 X (4.19) 式 (4.2) 式,(4.3) 式 式 確率変数 X . lim Pr (4.21) 式 σ2 正 右辺 ,無作為標本 標本平均 X 確率 標本 , 0 求 n 極 . µ,母 分 散 . 無限大 定数以上 表 母平均 考 弱法則 差 近 分母 (4.22) σ2 (4.23) 式 確率変数 X 大数 強法則 ) X1 + · · · + Xn Pr lim =µ =1 n→∞ n 無作為標本 成 立 . ( (4.23) 4.3 中心極限定理 87 確実 収束 大数 弱法則 標本 n 標本 表 大数 標本平均値 X 限 n 強法則 標本 近 思 標本平均値 母平均 収束 考 X1 , . . . , X n 理解 無作為標本 (4.3) 式 無作為標本 説明 分布 大 正規確率変数 ( 母平均 収束 除 性質 ) 正規分布 N µ, σ /n 2 中心極限定理 大 n 区間 確率 近似 大 (4.25) 式 利用 区間 [a, b] 入 . ( ) Pr a ≤ X ≤ b = Pr TE n 和 関 ( 確率 知 近似 無作為標本 X1 , . . . , Xn 関係 満 n 倍,分散 . 分布 知 (4.24) 統計量 Z . 場合,標本平均 中心極限定理 正規分布 任意 近似的 用 母平均 . (4.25) 区間 確 求 (4.26) 式 µ,母分散 入 計算 ) (4.26) σ2 確率変数 X 標本 和 Y Y = X1 + · · · + Xn = nX . Y n2 倍 (3.17) 式 . 無作為標本 標本平均 X (4.27) 式 近似 標準化 標本平均 X 1√ 1√ n (a − µ) ≤ Z ≤ n (b − µ) σ σ 中心極限定理 4.2 節 紹介 √ ) n( Z= X − µ ≈ N(0, 1) σ (4.24) 式 ■無作為標本 . 標準正規分布 近似 入 .例 呼 標本 . ( ) σ2 X ≈ N µ, n ■任意 率 (4.2) 式 標本平均 標本平均 X 特徴 分布 ,標本平均値 確率変数 X µ,σ 2 /n 大 n ,n . 4.1 節 (4.3) 式 NT AT I 標本 一般 .既 平均値 分散 平均 X σ2 µ,母 分 散 . 近 0 4.3 中心極限定理 母平均 無作為 意味 . ■中 心 極 限 定 理 大 n 標本平均値 分散 σ 2 /n , 母平均 µ . 母平均 µ 大 大 VE 大数 強法則 ,標本平均 X ( (3.22) 式 n X 十分大 ) 分布 正規分布 N µ, σ 2 /n 従 分布 平均値 ,(4.24) 式 ,標本 和 Y . ( ) ( ) σ2 2 Y ≈ N n × µ, n × = N nµ, nσ 2 n (4.27) 第4章 88 標本 n ∑ 和Y = 標準化 Xi 統計量 分布 大 n 標本分布 標準正規分布 i=1 . 1 Z= √ σ n ( ) n ∑ Xi − nµ i=1 ■中心極限定理 分布 分布 Po(λ) . 従 標本平均 X ,平均値 λ,分散 λ/n ,(4.29) 式 母平均 λ n 個 無作為標本 X1 , . . . , Xn 得 分散 標本 正規分布 (4.28) λ,母分散 平均値 . λ/n (4.25) 式 正規分布近似 確率変数 X 無作為標本 λ 式 n 1 ∑ = √ (Xi − µ) ≈ N(0, 1) σ n i=1 VE 近似 N (0, 1) (4.10) 式,(4.11) 式 十分大 n 近似 . ,(4.24) 標準 X 標準正規分布 近似 Z . NT AT I √ ) ( λ n , Z= (X − λ) ≈ N(0, 1) X ≈ N λ, n λ 例 4.3.1: 分布 (4.29) 式 影響 n 標本平均 正規分布 近似 使 見 λ = 2,n = 50 正規 0.4 0.5 0.0 0.0 2 3 1.0 1.5 2.0 TE 計算 度数分布図 描 . 描 分布 標本平均 左 標本 . 3.0 正規分布近似 n = 5,右 . 縦軸 頻度 ( ) λ (4.29) 式 正規分布 N λ, n 一致 比 思 . n = 50 . , n = 50 m = 1000 回繰 返 .n = 5 一致 2.5 X 図 4.1: 標本平均 X 重 5 X 分布 母数 λ = 2 図 4.1 4 正規 1.0 0.2 1 ポアソン 1.5 確率密度 0.6 確率密度 2.0 ポアソン 0 標本 . λ = 2,n = 5 0.8 (4.29) 正規分布近似 分布 標本平均 X R , 得 分布 確率密度 確率密度関数 比較 方 度数分布 正規分布 n 大 I 4.3 中心極限定理 89 例 4.3.1: 分布 正規分布近似 (続 ) 処理 R 凡例 示 省略 次 .右側 .軸 λ = 2,n = 50 9: 10: for(i in 1:m) xmean[i]=mean(rpois(n,l)) hist(xmean,right=F, freq=F, breaks=seq(xmin,xmax,length.out=10), ylim=c(ymin,ymax), xlim=c(xmin,xmax), xlab="", ylab="",las="1", main="", col="yellow") par(new=T) plot(seq(xmin,xmax,0.01), dnorm(seq(xmin,xmax,0.01),l,sqrt(l/n)), ylim=c(ymin,ymax), xlim=c(xmin,xmax), type="l", axes=F, xlab="", ylab="") R Tips.3.3.5 分布 Tips.4.1.4 正規分布 確率密度関数 思 無作為標本 和 Y 十分大 算出法 平均値 参照 (3.38) 式 算出法 何 分布 分布 Po(nλ) , Z 標本平均 R 処理 . 考 nλ,母分散 nλ 標準化 . VE m=1000 xmean=numeric(m) l=2 n=50 xmin=1; xmax=3; ymin=0; ymax=2 方 例 NT AT I 1: 2: 3: 4: 5: 6: 7: 8: 標本平均 . n 和 分布 正規分布 N (nλ, nλ) ,(4.27) 式 再生性 十分大, 近似 ,(4.30) 式 ,母平均 nλ . 標準正規分布 Y 近似 TE . (4.30) 式 十分大 1 Y ≈ N(nλ, nλ) , Z = √ (Y − nλ) ≈ N(0, 1) nλ nλ λ 読 替 分布 Po(λ) ( Y 正規分布 N(λ, λ) (4.30) 確率変数 X 近似 )λ 意味 . X ,Y ,X 1 X ∼ Po(λ) ≈ N(λ, λ) , Z = √ (X − λ) ≈ N(0, 1) λ 区間 [a, b] 入 確率 .(4.32) 式 (4.31) 表 第4章 90 標本分布 . ■連続性補正 近似 際 ,閉区間 間 上限 “X 大” “X 31 以 上” 読 替 同 結果 得 30 範囲 近似精度 引 0.5 .例 )29.5 除 ,除 方 改善 .従 (4.32) 式 (4.33) 式 Pr (a − 0.5 ≤ X ≤ b + 0.5) = Pr 連続性補正 有無 正規分布近似 連続補正 30 以上” 30 ,“X . ) 1 1 √ (a − λ − 0.5) ≤ Z ≤ √ (b − λ + 0.5) λ λ (4.33) 一致 方 正規分布 度合 示 図 4.2 一致 ● ●● ● ●● 0.6 ●● ●● 0.4 ● 0.8 ●● 確率分布 確率分布 0.8 1.0 ●●●● 補正なし 補正あり ●● ●● 0.6 ●● ●● 0.4 ●● ●● 0.2 0.2 ●● ●● 0.0 ●● 2 TE 0 4 8 10 0 5 10 分布 単位期間 分布 Po(13) 従 2 桁勝利 30 分布 正規分布近似 正規分布近似 連続性補正 投手 .1 20 x 図 4.2: 例 確率 6 ●● ●● ●● ●● ●●●●● ●●●●●●● x 例 4.3.2: . ●●●●●●● ●●●●●●●●● ●●●● ●●●● ●● ●● ●● 補正なし 補正あり ●● 0.0 .赤色 λ = 13 1.0 ● 30 30.5 λ=5 上 . 閉区 30.5 補正 正規 方法 大” 30 区間 (4.32) 離散分布 ,“X .“X ( 示 二項分布 NT AT I *5 分布 0.5 広 (閉区間 以下” , 加 ,下限 0.5 含 *5 連続性補正 (√ VE √ ) n n (a − λ) ≤ Z ≤ (b − λ) λ λ ( ) 1 1 Pr (a ≤ Y ≤ b) = Pr √ (a − nλ) ≤ Z ≤ √ (b − nλ) nλ nλ ( ) 1 1 Pr (a ≤ X ≤ b) = Pr √ (a − λ) ≤ Z ≤ √ (b − λ) λ λ ( ) Pr a ≤ X ≤ b = Pr 13 勝 1 考 考 (10 勝以上 9 勝以下 余事象 勝 試合 発生確率 λ = 13 . 1 )確率 考 9 勝以下 .10 勝以 確率 1 引 求 I 4.3 中心極限定理 91 例 4.3.2: 分布 正規分布近似 連続性補正 (続 ) . , Pr (10 ≤ X) = 1 − Pr (X ≤ 9) 1: 1-ppois(9,13) ,0.834 簡単 計算 . 計算 x = 0, . . . , 9 中心極限定理 .(4.32) 式 使 和 求 正規分布 N(13, 13) 標準化変換 (3.35) 式 計算 必要 .計算量 近似的 式 使 Z 1 1 − Pr Z ≤ √ (9 − 13) 13 ) .本来 2: , 多 = 1 − Pr(Z ≤ −1.1094) 標準正規分布表 A.1 場合 計算 NT AT I ( 読 取 ,R 1-pnorm((9-13)/sqrt(13),0,1) 計算 少 VE R ,0.866 求 . 分布 求 0.834 . (4.33) 式 用 . ( ) 1 1 − Pr Z ≤ √ (9 − 13 + 0.5) = 1 − Pr(Z ≤ −0.9707) 13 . 3: R 計算 1-pnorm((9-13+0.5)/sqrt(13),0,1) ,0.834 分布 求 値 一致 TE . ■中心極限定理 二項分布 二項分布 B(n, p) 中心極限定理 母成功率 p X1 , . . . , X n 従 総和 . Y 利用 (4.34) 式 返 数 n,成功率 p 正規分布 . 総和 Y (4.27) 式 分布 Y 近似 母数 .今, 分布 無作為標本 4.1.2 項 説明 二項分布 B (np, np(1 − p)) ,中心極限定理 . 近似 繰 分布 平均値 np,分散 np (1 − p) 十分大 正規分布近似 . n 正規分布 N (np, np (1 − p)) 二項分布 B(n, p) 正規分布 N(np, np(1 − p)) . B(n, p) ≈ N (np, np(1 − p)) (4.34) 第4章 92 (4.35) 式 標準化 行 ,二項分布 B(n, p) 標準正規分布 標本分布 従 . 1 Z=√ (Y − np) ≈ N(0, 1) np (1 − p) 確率 行 区間 入 次式 確率 求 .例 . 分布 近似 b 以下 同様,連続性補正 VE (4.32) 式 同様 (4.35) . ( ) 1 Pr (Y ≤ b) = Pr Z ≤ √ (b − np + 0.5) np (1 − p) 図 4.3 二項分布 分布 正規分布 場合 近似 同様,赤丸 示 補正 効果 方 . 示 正規分布 NT AT I 一致 連続性補正 B(5, 0.8) 1.0 ● 補正なし 補正あり ● ● 0.8 ●● 確率分布 確率分布 0.8 0.6 0.4 0.2 ●● ●● 0.6 ●● ●● 0.4 ●● ●● 0.2 ●● ●● ●● ●● ●●●●●● ●●●●●●●●●● ●● 0.0 ●●●● 0 2 4 6 確率分布 8 ●●●●●● ●● ●●●●●●●● ●●●● ●● ●● ●● 補正なし 補正あり ●● 0.0 . B(50, 0.5) 1.0 ●●●●●●●●●●●● ● (4.36) 10 10 20 30 x 40 x 図 4.3: 二項分布 正規分布近似 TE 4.4 標本分散 分布 ■χ2 分布 分散 性質 率変数 標本平均 見 Z1 , . . . , Zk W 自由度 k X1 , . . . , Xk 性質 見 ,次 .標準正規分布 N(0, 1) .今,Zi 2 乗和 W χ2 確率変数 従 独立 標準正規確 考 . (4.37) 式 表 . W = Z12 + Z22 + · · · + Zk2 ∼ χ2 (k) 平均 µ,分散 σ 2 ,標準化変換 行 正規分布 N(µ, σ 2 ) (4.38) 式 自由度 k W = k 2 ∑ (Xi − µ) i=1 標本 σ2 2 従 正規確率変数 χ 確率変数 ∼ χ2 (k) (4.37) . (4.38) 4.4 標本分散 分布 93 指標 ,確率変数 .例 (4.37) 式 決定 再生性 例 個数 自由度 m 和 k 数値的 n 自由度 k 何 表現 制約 . χ2 確率変数 X, Y 2 確率変数 X + Y (4.37) 式 設定 (4.38) 式 場合,各確率変数 互 ,確率変数 ■χ2 分布 自由 χ2 確率変数 従 自由度 m + n 考 k = n+m . . . VE “自由度” ,容易 理解 X ∼ χ2 (m) , Y ∼ χ2 (n) −→ X + Y ∼ χ2 (m + n) ■χ2 分布 平均値・分散 .確率密度関数 2k (4.37) 式 誘導 計算 簡易的 (3.48) 式 分散 V (Z1 ) .標準正規分布 計算 , 確率密度 ( 2) 1 z f (z) = √ exp − 2 2π W = Z2 . 数W *6 誘導 k ,分散 手間 平均値 E(Z1 ) k=1 (4.39) 式 利用 関数 期待値 平均値 NT AT I , 2 乗分布 χ2 (k) 自由度 k (4.39) 値 w 以下 満 確率変数 W 考 . 確率変 確率 √ √ Pr(W ≤ w) = Pr(Z 2 ≤ z) = Pr(− z ≤ Z ≤ z) 書 . 確率分布関数 F (w) ∫ F (w) = √ − z w = z2 . ∫ √ z √ f (z)dz = 2 0 関係 用 z 表 ( 2) 1 z √ exp − dz 2 2π 積分 変数変換 行 . √ dw = 2z · dz = 2 w · dz 関係 利用 TE ∫ 式 w F (w) = 0 ( w) 1 √ exp − dw 2 2πw 確率密度関数 f (y) k=1 ( 変形 F (w) (3.4) 式 ( w) 1 f (w) = √ exp − 2 2πw f (w) = 0).確率密度関数 誘導 w<0 平均値 E(W ) 1 E(W ) = √ 2π 計算 ∫ ∞ 0 ,(3.10) . ( w) w 1 √ exp − dw = √ 2 w 2π ∫ ∞ 0 ( w) 1 w 2 exp − dw 2 *6 興味 無視 読 人 飛 . 第4章 94 ,dw = 2 · dt 変数変換 w = 2t ∫ 1 E(W ) = √ 2π 0 変形 ∫ 2 (2t) exp(−t) · 2 · dt = √ π 1 2 ∞ 1 t 2 exp(−t)dt 0 定積分 ∫ ∞ 0 関数 ( 1 t exp(−t)dt = Γ 1 + 2 ) 1 2 知 √ π = 2 VE . ∞ 関係 用 標本分布 . √ π 2 =1 E(W ) = √ · π 2 得 .同様 計算 計算 .(3.21) 式 g(W ) = w2 .(3.14) 式 ,先 利用 , 同様 w = 2t 変 NT AT I E(W 2 ) 分散 V (W ) 数変換 利用 1 E(W ) = √ 2π ∫ . ( w) w2 1 √ exp − dw = √ 2 w 2π ∞ 2 0 ∫ ∞ 3 (2t) 2 exp(−t) · 2 · dt 0 整理 4 E(W ) = √ π ∫ ∞ 2 . 3 t 2 exp(−t)dt 0 定積分 ∫ ∞ 0 ( 1 t exp(−t)dt = Γ 2 + 2 関数 ) 3 2 知 , = 3√ π 4 用 4 3√ E(W 2 ) = √ · π=3 π 4 分散 V (W ) TE ,求 V (W ) = E(W 2 ) − E(W )2 = 3 − 12 = 2 .一般 自由度 k .W1 + · · · + Wk 布 (3.18) 式 W1 + · · · + Wk 平均値 (3.23) 式 関係 用 分散 χ2 分布 再生性 E(W ) = 1 V (W ) = 2 χ2 分 結果 k個 和 E(W ) = E(W1 + · · · + Wk ) = 1 + · · · + 1 = k V (W ) = V (W1 + · · · + Wk ) = 2 + · · · + 2 = 2k ,自由度 k k = 1, 2, 5, 10 場合 χ2 分布 平均値 k ,分散 2k 2 導 .図 4.4 χ 分布 確率密度関数 確率分布関数 図示 自由度 . 4.4 標本分散 分布 95 0.5 1.0 k=1 k=2 k=5 k=10 0.8 0.3 0.2 0.1 0.6 0.4 k=1 k=2 k=5 k=10 VE 確率分布 確率密度 0.4 0.2 0.0 0.0 0 5 10 15 20 0 w 5 10 15 20 w NT AT I 図 4.4: χ2 分布 Tips.4.4.1: χ2 分布 R χ2 分布 確率密度関数,確率分布関数, 2 χ 分布 従 乱数 次 確率変数 1: 2: 3: 4: w,確率 dchisq(w, pchisq(w, qchisq(p, rchisq(n, pchisq() df) df) df) df) , .自由度 df , . n 確率 p 以下 確率変数値 自由度 df 2 乗分布 qchisq() n 個 乱数 取出 引数 lower.tail lower.tail = F 左右反転 利用 .規定値 p 以上 確率変数値 得 譲 (4.40) 式 . 確率変数値 χ2 分布 確 ,自由度 k 表 . ( w) k 1 2 −1 exp w − ( ) k 2 2 2 Γ k2 f (w) = (4.40) 関数 ( 1 Γ n+ 2 表 ) ∫ ∞ = n 奇数 1 tn− 2 exp(−t)dt = 0 . . 値, 確率分布関数 誘導 他 書籍 1 計算 qchisq(p, df, lower.tail=F) # 確率 p 以上 率密度関数 確率変数 確率密度関数 # # # # .確率分布関数 TE 5: 利用 p,取 出 乱数 個数 lower.tail = T 得 関数 R 確率以下 “!!” 二重階乗 積,偶数 0!! = 1,(−1)!! = 1 関係 2 呼 (2n − 1)!! √ π 2n ,例 n . k!! (4.41) 偶数 (4.41) 式 奇数 n 積 n= k 2 − 1 2 第4章 96 ■標本分散 (4.42) 式 得 . ( ) ∫ ∞ k k (k − 2)!! √ Γ = t 2 −1 exp(−t)dt = π k−1 2 2 2 0 分布 正規分布 N(µ, σ 2 ) 無作為抽出 *7 平方和 自由 度 割 平均平方 呼 散 S2 . n 個 標本 {X1 , · · · , Xn } 母集団 母平均 µ *7 (4.43) 式 従 (4.42) 未知 . 標本 標本分 VE 書 直 標本分布 . )2 1 ∑( S = Xi − X n − 1 i=1 n 2 (4.43) 式 平方和 母分散 σ 2 . 標本平均 X 割 用 (4.43) χ2 分布 ,(4.38) 式 W n 個 確率変数 完全 独立 定 . NT AT I (X1 − X) + · · · + (Xn − X) = 0 n − 1 個 自由 決定 制約 . 受 ,残 1個 χ2 分布 自由度 . (4.44) 式 表 標本平均 満 n−1 低下 1 式 . n )2 1 ∑( (n − 1) S 2 χ (n − 1) ∼ W = 2 Xi − X = σ i=1 σ2 2 (4.44) 式 (4.43) 式 標本分散 S 2 S2 = (4.45) 式 . ,標本分散 S 2 ( TE 利用 場合 母平均 µ 分散 用 割 2 ( ,標本分散 S 2 . 入 確率 (4.45) (4.46) 式 計算 ) n−1 n−1 2 a ≤ χ (n − 1) ≤ b σ2 σ2 ,標本分散 S 2 既知 (4.45) 式 得 σ2 χ2 (n − 1) (n − 1) 区間 [a, b] ) Pr a ≤ S ≤ b = Pr 母平均 µ 書 直 (4.44) 計算 標本平均 X (4.47) 式 代 (4.46) 母平均 µ . 1∑ S = (Xi − µ)2 n i=1 n 2 場合 n 個 確率変数 完全 独立 量 自由度 n 標本分散 S 2 (4.47) 2 χ 分布 従 ,平方和 . n 1 ∑ nS 2 2 χ (n) ∼ W = 2 (Xi − µ) = 2 σ i=1 σ 2 (4.49) 式 表 S2 = 母 σ2 2 χ (n) n (4.48) . (4.49) 4.4 標本分散 分布 97 標本分散 S 2 区間 [a, b] 入 確率 (4.50) 式 計算 . (n ( ) n ) Pr a ≤ S 2 ≤ b = Pr 2 a ≤ χ2 (n) ≤ 2 b σ σ (4.47) 式 計算式 (4.47) 式 含 平方和 n ∑ ,標本平均 X 異 理由 平方和 考 2 考 E ( n ∑ 期待値 ) 2 (Xi − µ) = 平方和 2 E (Xi − µ) i=1 割 値 母分散 n ∑ ( ) .他方 (4.43) 式 含 平方和 (4.47) 式 推定値 Xi − X )2 n倍 = n · σ2 ,(4.47) 式 NT AT I n (4.43) 式 母分散 σ 2 (3.12) 式 n ( ∑ i=1 (4.43) 式 . i=1 . 違 . 期待値 (Xi − µ) 母平均 µ VE 標本分散 S 2 同 (4.50) 期待値 導出 導 若干複雑 i=1 . n ∑ ( Xi − X )2 ( )2 ( )2 = X1 − X + · · · + Xn − X i=1 µ−µ 加 n ∑ ( Xi − X )2 = i=1 n ∑ ( )2 (Xi − µ) − (X − µ) i=1 . ( )2 ( ) ( )2 2 (Xi − µ) − (X − µ) = (Xi − µ) − 2 (Xi − µ) X − µ + X − µ 変形 X −µ . i 含 定数 扱 , TE n n ∑ { ( )} ( )∑ ( )( ) 2 (Xi − µ) X − µ = 2 X − µ (Xi − µ) = 2 X − µ nX − nµ i=1 i=1 , .同様 n ∑ )} ( )2 { ( 2 (Xi − µ) X − µ = 2n X − µ i=1 , n ∑ ( )2 ( )2 X −µ =n X −µ i=1 変形 .従 n ∑ ( i=1 , Xi − X )2 = n ∑ i=1 ( )2 2 (Xi − µ) − n X − µ 第4章 98 立 ( E . 平方和 n ∑ ( )2 Xi − X 期待値 ) ( =E (Xi − µ) 2 ( ( )2 ) −E n X −µ i=1 母分散 σ 2 ,第 1 項 n 倍,第 2 項 確率変数 標本平均 分散 定義式 σ 2 /n (4.3) 式 ) n ∑ i=1 考 n−1倍 母分散 σ 2 ( E n ∑ ( Xi − X )2 ) = nσ 2 − n σ2 = (n − 1)σ 2 n 母分散 推定値 i=1 n−1 平方和 割 導 . 広 表 代表値 出 (4.43) 式 不偏分散 呼 標本分散 ,(4.43) 式 .1 章 記述統計 1.2.2 項 (1.2) 式 ,標本平均 利用 . NT AT I (4.43) 式 不偏分散 相当 . VE 関係 成 標本分布 4.5 標本平均 標本標準偏差 比 分布 ■t 分布 Z 変数 表 標準正規分布 . Z 確率変数,W 独立 W 自由度 k Y 従 分布 t 分布 . t 分布 平均値 E(Y ) 題 興味 読 飛 人 問 . 導出 W 均値 互 0,分散 V (Y ) *8 次 独立 0 平均値 ( TE ) Z 見 ,Z .Z 平 . (√ ) ( ) √ k 1 = E(Z)E √ =0· k·E √ =0 W W ( V (Y ) = E(Y ) − E(Y ) = E(Y ) = E (3.16) 式 定数 g(w) = w−1 平均値 E(Y ) 期待値 積 分解 2 使 . . 平均値 E(Y ) = 0 .(3.20) 式 E k/ (k − 2) . (4.51) W/k 0 √ W/k E(Y ) = E 分散 V (Y ) Z (3.20) 式 Y (4.51) 式 . t (k) ∼ Y = √ *8 χ2 分布 従 確率 自由度 k ( Z2 W/k 2 分解 2 ,標準正規分布 期待値 定数 ) ( 2 = E(Z )E(k)E E(W −1 ) 期待値 分散 ) E(Z 2 ) = 1 性質 利用 1 W ) ( =1·k·E 定義式 (3.14) 式 χ2 分布 期待値 計算 Z2 W/k 1 W ) g(W ) = W −1 .(4.40) 式 χ2 分 4.5 標本平均 標本標準偏差 比 分布 布 99 確率密度関数 定義式 ( E W −1 ) ∫ ∞ = w−1 0 . (4.42) 式 ( w) k 1 2 −1 exp w − dw ( ) k 2 2 2 Γ k2 関数 定義 漸化式 成 立 VE ( ) ( ) k (k − 2)!! √ k − 2 (k − 4)!! √ k−2 k−2 π= π= Γ = · Γ k−1 k−3 2 2 2 2 2 2 2 2 . w−1 · w 2 −1 = w k k 22 = 2 · 2 k−2 2 −1 k−2 2 関係 . 関数 ∫ 1 ∞ ( w) k−2 1 −1 2 exp − dw ( )w k−2 2 2 2 Γ k−2 2 NT AT I ( ) E W −1 = k−2 2 積分 全定義域 ·2 0 部分 自由度 k − 2 (4.42) 式 積分 ∫ χ2 分布 確率密度 ,当然 1 ∞ 0 . ( w) k−2 1 2 −1 exp − w dw = 1 ( ) k−2 2 2 2 Γ k−2 2 E(W −1 ) = 1 k−2 分散 V (Y ) V (Y ) = E(Z 2 )E(k)E(W −1 ) = 1 · k · 導 . 0.4 1.0 TE 0.2 0.8 確率分布 k=1 k=2 k=5 k=10 N(0,1) 0.3 確率密度 1 k = k−2 k−2 0.1 k=1 k=2 k=5 k=10 N(0,1) 0.4 0.2 0.0 −4 0.6 0.0 −2 0 2 4 −4 y −2 0 2 4 y 図 4.5: t 分布 図 4.5 示 自由度 k = 1, 2, 5, 10 . t 分布 確率密度関数 確率分布関数 図 第4章 標本分布 確率変数 値,t 100 Tips.4.5.1: t 分布 t 分布 確率密度関数,確率分布関数, 分布 従 乱数 次 変数 y ,確率 1: 2: 3: 4: dt(y, pt(y, qt(p, rt(n, R ■t 分布 自由度 df 確率変数値 t 分布 n 個 乱数 取出 紹介 lower.tail = F ,上側確率 計算 正規近似 自由度 k 成 大 立 . 大数 . 近似 自由度 k . 確率 p 以下 大 t 確率変数 c 以下 大 標準正規分布 ,標準正規分布 確率 形状 k∼W 強法則 自由度 k .図 4.5 df ,確率 . n 確率分布関数 下側確率 ,W/k ∼ 1 分布 .自由度 確率密度関数 # # # # Tips.4.4.1 qt() 計算 NT AT I pt() 関数 利用 R p,取 出 乱数 個数 df) df) df) df) 確率以下 VE R t 分布 標準正規 合 描 . 近 (4.52) 式 標準正規分布 近似 . Pr (Y ≤ c) ≈ Pr (Z ≤ c) ■t 統計量 分布 ( 正規母集団 N µ, σ 2 . X −µ 量√ S 2 /n 従 計算 考 ) (4.52) n 個 無作為標本 X1 , . . . , Xn 標本平均 X .標本平均 X 母平均 µ 標本分散 S 2 (4.2) 式,(4.3) 式 ( 抽出 標準化 ) N µ, σ 2 /n . X −µ Z∼√ σ 2 /n TE X −µ √ S 2 /n (4.53) 式 変形 (4.45) 式 . X −µ X −µ Z √ √ =√ =√ S 2 /n σ 2 /n S 2 /σ 2 S 2 /σ 2 標本分散 (4.54) 式 (4.53) 式 最右辺 式 母分散 書 比 自由度 n − 1 (4.53) χ2 分布 従 . χ2 (n − 1) S2 = σ2 n−1 (4.54) 式 代入 Z Z √ =√ S 2 /σ 2 χ2 (n − 1)/(n − 1) (4.54) 4.6 標本分散比 分布 変形 101 . 自由度 n − 1 (4.51) 式 自由度 n − 1 t 分布 従 t 分布 .(4.53) 式 (4.55) 式 導 . √ ) X −µ n( t (n − 1) = √ = X −µ S S 2 /n 本平均 X 任意 区間 [a, b] ( 未知 入 確率 ) Pr a ≤ X ≤ b = Pr 標本分散 S 2 ,代 利用 ,標 VE ,母分散 σ 2 (4.55) 式 利用 (4.55) *9 推定 (√ *9 . ) √ n n (a − µ) ≤ t(n − 1) ≤ (b − µ) S S 4.6 標本分散比 分布 (4.56) 推定 簡単 言 ,n 大 場合 正規分布表 発 由度 今2 独立 χ 分布 V 考 W 確率変数 V /m 両者 比 W/k 自由度 各自由度 m F 確率変数 平均値 平均値 計算 割 V /m F 分布 F (m, k) k 結果 流用 ( E V /m W/k ) ( =E χ2 分布 平均値 E(V ) 図 4.6 描 自 V /m ) . . W/k (4.57) k≥3 自由度 独立 ,t 分布 . ( E 従 考 k W ) 自由度 m 1 = E(V ) E m ( 1 W ) ,χ2 分布 k 逆数 平均値 人 関係書 1 自由度 −2 逆数 利用 k−2 ( ) V /m 1 1 k E =m· · ·k = W/k m k−2 k−2 TE 物 . 導 V m 比 W/k V /m W/k k/ (k − 2) .平均値 導出 E(1/W ) m,W W ∼ χ2 (k) F (m, k) = 数 自由度 . k V ∼ χ2 (m) , 分散 .V NT AT I ■F 分布 2 . 分散 web 調 確率密度関数 自由度 (5, 100) . 複雑 ,興味 . (100, 5) F 分布 確率密度関数 確率分布関 十分 標準 近似 計算 . 一 R . 第4章 102 0.8 1.0 F(100,5) F(5,100) 0.8 確率分布 0.4 0.6 0.4 0.2 F(100,5) F(5,100) VE 確率密度 0.6 0.2 0.0 0.0 0 2 4 6 8 10 0 x 2 4 6 8 10 x NT AT I 図 4.6: F 分布 R 標本分布 Tips.4.6.1: F 分布 F 分布 確率密度関数,確率分布関数, 分布 従 乱数 次 R 確率変数 p,取 出 乱数 個数 1: 2: 3: 4: x,確率 df(y, pf(y, qf(p, rf(n, R pf () df1, df1, df1, df1, df2) df2) df2) df2) F 分布 TE F (k, m) 示 1: 確率 p 以下 利用 確率変数値 自由度 (df1,df2) F 分布 n 個 乱数 取出 lower.tail = F ,上側確率 確率 . df 1, df 2, . n 計算 . ,自由度 k 入 替 (4.58) 式 関係 成 立 ( ) 1 Pr (F (m, k) ≤ x) = Pr ≤ F (k, m) x 利用 例 4.6.1: F 分布 .自由度 確率分布関数 確率分布 x 以下 F (m, k) 計算 紹介 自由度 m 確率変数 値,F 確率密度関数 下側確率 2 F (m, k) .例 # # # # Tips.4.4.1 qf () R 関数 利用 確率以下 間 F (k, m) x 1 x 逆数 以上 F 分布 上側確率表 F 分布 2 . (4.58) 確率 等 下側確率 知 . 上側下側確率 ,(4.58) 式 F (5, 100) 関係 pf () 利用 確認 x = 0.5 pf(0.5,5,100) # F(5,100) 0.5 以下 確率 I 4.6 標本分散比 分布 2: 上側下側確率 (続 ) pf(2,100,5,lower.tail=F) # F(100,5) 関数 実行 2 以上 確率 ,確認 0.2244105 ■F 統計量 . VE 例 4.6.1: F 分布 103 分布 今 2 正規分布 従 母集団 ( ) ( ) N µ1 , σ1 2 ,N µ2 , σ2 2 . 母集団 個 標本 無作為抽出 . 標本分散 ,(4.59) 式 S1 2 ,標本分散 母分散 書 表 比 (4.45) 式 . n1 個 (4.59) 式 比 考 (4.57) 式 ,χ2 確率変数 TE F 統計量 自由度 (n1 − 1, n2 − 1) F比 呼 表 S2 2 χ2 (n2 − 1) = σ2 2 n2 − 1 F 分布 χ2 (n1 − 1) /(n1 − 1) S12 /σ12 = = F (n1 − 1, n2 − 1) S22 /σ22 χ2 (n2 − 1) /(n2 − 1) (4.60) 式 n2 S2 2 NT AT I S1 2 χ2 (n1 − 1) = , σ1 2 n1 − 1 .母数 . (4.59) . (4.60) NT AT I TE VE 105 母数 後日,例題,R 第4章 一定 備 追加 表現方法 Tips 統一 行 . NT AT I 章 推定 VE 第5章 紹介 標本 無作為抽出 . 完全 仮定 目的 条件 1 標本 標本 推定 推定 第4章 説明 母数 推定 . 確率分布 行 方法 利用 紹介 . 統計量 章 推定 通常困難 条件 章 . 母数 ,第 3 章 確率分布 続 第6章 利用 仮説検定 準 . 5.1 母平均 推定 5.1.1 母分散既知 場合 母平均 推定 ■母平均 表 点推定 .特 場合 推定 場合 数 文字通 母数 形状 ,大 1 既 決 点推定 重要 区間推定 数値 推定 方法 限 近 . 母数 定 説明 ■不偏性 母平均 µ,母分散 σ 2 無作為標本 3.2 節 触 52 3.3 節 説明 54 TE 分布関数 確率分布 確率密度関数 数式化 意味 .標本 持 分 .例 数値 母数 形状 .点推定 “母平均 与 方法 母数 母 10” 言 .最初 点推 行 n個 . 得 X1 , . . . , Xn 標本平均 X 正規分布 N(µ, σ 2 ) (4.1) 式 X= . 計算 . 1 (X1 + · · · + Xn ) n 無作為抽出 σ2 既知 . 第 5 章 母数 106 致 ,推定量 推定量 . 不偏分散推定量 呼 不偏性 特 .従 中 母平均 µ ,X 分散 最 不偏推定量 近 期待値 母平均 小 . 母数 一 関 不偏 推定量 最少 . 推定値 大 n 得 ,推定量 一致推定量 弱法則 言 推定量 従 . 母平均 ,標本 母数 不偏推定量 今標本平均 X 標本平均 持 ) VE (4.12) 式 ■一致性 ( ,正規分布 N µ, σ 2 /n (3.51) 式 正規分布 再生性 ( ) E X =µ . X 推定 言 .例 ,X µ (4.21) 式 .一般 母数 収束 ,標本平均 X 場合 収束 ,母数 既 説明 保証 対 大数 . ( ) lim Pr |X − µ| ≥ c = 0 NT AT I n→∞ 標本平均 X ■母平均 区間推定 母数 値 “値 存在 母数 *1 α 推定 危険率 . 数 表 母平均 µ 存在 呼 点推定 母数 区間”” 区間 区間推定 値 推定 ,区間推定 区間 値 入 確率” 用 推定 呼 . 成功率 信頼係数 100 (1 − α) % 関 0 以上 1 以下 実数 . 1 “ 信頼区間 .信頼係数 “母平均 µ 一致推定量 区間 値 入 確率 *1 表 信頼区間” . 信頼係 .通常 使 .α 100 (1 − α) % 信頼区間 上限 下限 信頼限界 呼 . . L U 表 信頼区間 (5.1) 式 書 . Pr (L ≤ µ ≤ U ) = 1 − α 図 5.1 斜線 確率 α/2 範囲 α 示 両側 . 信頼区間外 確率 α 図 5.1 左図 同 標準正規分布 N(0, 1) 右図 示 0.4 0.15 0.3 0.10 0.1 0.00 0.0 10 U 15 −4 z 1−α 2 z 図 5.1: 正規分布 例) 信頼区間外 満 0.2 0.05 5 L , .(5.2) 式 0.20 f (z ) f (z ) TE 率 左図 (5.1) 信頼区間(上側・下側 100α/2% 点,図 0 zα 2 z α = 0.1 4 確 確率 5.1 母平均 推定 変数 値 zα/2 107 上側 100α/2% 点 呼 . ( ) Pr z ≥ zα/2 = α/2 同様 (5.3) 式 満 分布 平均値 確率変数 関 対称性 . 値 z1−α/2 (5.2) 下側 100α/2% 点 上側 100α/2% 点 符号 呼 .正規 反転 一致 上側下側 100α/2% 点 標準正規分布 . VE ( ) ( ) Pr z ≤ z1−α/2 = Pr z ≤ −zα/2 = α/2 (5.3) (5.1) 式 書 直 (5.4) 式 ( ) Pr −zα/2 ≤ z ≤ zα/2 = 1 − α X −µ √ σ/ n 標準化 式 利用 ,(5.4) 式 NT AT I z= (5.4) ) ( X −µ √ ≤ zα/2 = 1 − α Pr −zα/2 ≤ σ/ n 表 .引数 部分 取 σ √ n 出 掛 σ σ −zα/2 √ ≤ X − µ ≤ zα/2 √ n n 各辺 引 X σ σ −X − zα/2 √ ≤ −µ ≤ −X + zα/2 √ n n 各辺 −1 掛 大小関係 反転 , σ σ X + zα/2 √ ≥ µ ≥ X − zα/2 √ n n 得 ,(5.1) 式 (5.5) 式 多 未知 100α/2% 点 表 U ( σ σ Pr X − zα/2 √ ≤ µ ≤ X + zα/2 √ n n 統計 R L 信頼区 . TE 間 . 利用 ,(5.4) 式 場合 (5.4) 式 場合 ) =1−α ,標準正規分布表 与 (5.5) 式 利用 ,4.3 節 中心極限定理 (5.5) . ,正規分布近似 (5.5) 式 適用 母分布 場合 . 5.1.2 母分散未知 場合 母平均 推定 ■母平均 区間推定 無作為抽出 行 5.1.1 同 母平均 µ,母分散 σ 2 n 個 標本 X1 , . . . , Xn 得 ( 正規分布 N µ, σ 2 .5.1.1 ) “ 第 5 章 母数 108 既知” 未知” 推定 母分散 既知 前提 母平均 µ 場合 場合 考 同様 (4.1) 式 ,母平均 一致推定量 ,5.1.1 . 1 (X1 + · · · + Xn ) n 従 信頼区間 ,標本分散 S 2 不偏 標本平均 X 正規分布 N(µ, σ 2 /n) 同様,X “母分散 σ 2 , .母平均 µ X= 5.1.1 推定 VE 母分散 σ 2 推定 計算 標準化 母分散 σ 2 . 母分散 σ 2 . . 未知 代 √ ) X −µ n( √ = X − µ = t (n − 1) S S 2 /n (4.55) 式 自由度 n − 1 4.5 節 説明 信頼区間 t 分布 利用 求 . .5.1.1 NT AT I 母平均 µ t 分布 既知 場合 100α/2% 点 同様,両側 信頼区間 (5.6) 式 考 ,例 信頼限界 母分散 t 分布 上側 . ( ) Pr t (n − 1) ≥ tα/2 (n − 1) = α/2 点 t 分布 原点 対称 標準正規分布 場合 同様 上側 100(1 − α/2)% 点, (5.6) 下側 100α/2% t1−α/2 (n − 1) = −tα/2 (n − 1) 関係 . 信頼区間 (5.7) 式 表 . ( ) √ ) n( Pr −tα/2 (n − 1) ≤ X − µ ≤ tα/2 (n − 1) = 1 − α S (5.7) µ 整理 ,(5.8) 式 信頼区間 表 ) ( S S Pr X − tα/2 (n − 1) √ ≤ µ ≤ X + tα/2 (n − 1) √ =1−α n n TE (5.7) 式 図 5.2 自由度 n = 5 2 箇所 面積 和 上側・下側 5% 点 示 .赤 . (5.8) 斜線 示 無作為抽出 n . α = 0.1 5.2 母分散 推定 5.2.1 母平均既知 場合 母分散 推定 ■母分散 個 *2 標本分散 書 母平均未知 合 区別 ,次 場 σ ˆ2 . 母平均 µ,母分散 σ 2 標本 X1 , . . . , Xn .母平均 µ S2 使 点推定 得 既知 ( 正規分布 N µ, σ 2 . 場合 無作為標本 µ ) 既知 標本分散 σ ˆ2 ,σ 2 未知 *2 .(4.47) 5.2 母分散 推定 109 0.4 0.2 0.1 0.0 −4 t 1−α 2(n − 1) 0 t α 2(n − 1) y = t (n − 1) 図 5.2: t 分布 4 信頼区間(上側・下側 100α/2% 点,図 例) 自由度 n = 5, NT AT I α = 0.1 式 VE f (y ) 0.3 1∑ 2 σ ˆ = (Xi − µ) n i=1 n 2 .既 ,σ ˆ2 4.4 節 説明 σ2 不偏 一致推定量 . ■母分散 区間推定 χ2 分布 自由度 n (4.38) 式 n 1 ∑ 2 (Xi − µ) χ (n) = 2 σ i=1 2 .両辺 割 ,σ 2 n 掛 σ ˆ2 ,右辺 . χ2 (n) σ 2 1∑ 2 = (Xi − µ) = σ ˆ2 n n i=1 n (5.9) 式 得 TE 整理 母平均 布 区間推定 χ2 (n) = 上側 100(1 − α/2)% 点 σ2 ( 整理 方向 χ21−α/2 (n),χ2α/2 間 信頼区間 区間 Pr 1 χ21−α/2 与 . (5.10) 式 (n) 引数 不等式 逆数 取 注意 ( ,χ2 分 . ) nˆ σ2 2 (n) ≤ 2 ≤ χα/2 (n) = 1 − α σ ,Pr() 逆転 (5.9) 上側 100α/2% 点 χ21−α/2 Pr nˆ σ2 σ2 ,信頼係数 100 (1 − α) % 同 信頼限界 等号 . (n) ≥ 2 1 σ ≥ 2 2 nˆ σ χα/2 (n) ) =1−α (5.10) .逆数 取 不 第 5 章 母数 110 各辺 ( Pr 図 5.3 掛 不等号 変 (5.11) 式 得 nˆ σ2 nˆ σ2 2 ≤ σ ≤ χ2α/2 (n) χ21−α/2 (n) 自由度 n = 5 2 箇所 面積 向 上側・下側 5% 点 0.20 0.15 f (w ) ) =1−α (5.11) 表 . α = 0.1 . .赤 斜線 示 VE .nˆ σ2 推定 0.10 NT AT I 0.05 0.00 2 2 0 χ 1−α 2(n ) 10 χ α 2(n ) 20 w = χ (n ) 2 図 5.3: χ2 分布 信頼区間(上側・下側 100α/2% 点,図 自由度 n = 5, 例) α = 0.1 5.2.2 母平均未知 場合 母分散 推定 ■母分散 ( ) N µ, σ 2 σ 2 点推定 母平均既知 無作為抽出 未知 同様,母平均 µ,母分散 σ 2 場合 n 個 標本 X1 , . . . , Xn .母平均 µ 未知 得 場合 標本分散 S 2 正規分布 .今度 µ (4.43) 式 )2 1 ∑( Xi − X n − 1 i=1 n TE S2 = 平均未知 .母平均既知 場合 同様,4.4 節 場合 不偏 一致推定量 母分散 ■母分散 区間推定 関係 分布 (4.45) 式 .母平均 既知 上側 100(1 − α/2)% 点 χ2α/2 (n − 1) 使 ,標本分散 S 2 χ2 (n − 1) = 表 場合 ,標本分散 S 2 説明 . χ2 分布 間 (n − 1) S 2 σ2 同様,信頼区間 上側 100α/2% 点 (5.12) 式 得 母 間 自由度 n − 1 χ2 区間 χ21−α/2 (n − 1), . ( ) (n − 1) S 2 2 2 Pr χ1−α/2 (n − 1) ≤ ≤ χα/2 (n − 1) = 1 − α σ2 (5.12) 5.3 成功率 推定 場合 ,(5.11) 式 同様,Pr() 得 ( Pr 引数 不等式 逆数 (n − 1) S 2 (n − 1) S 2 2 ≤ σ ≤ χ2α/2 (n − 1) χ21−α/2 (n − 1) 点推定 母成功率 p 得 X1 , . . . , X n . 1/n ■母成功率 容易 区間推定 pˆ 無作為抽出 母成功率 標本平均 (5.14) 式 Z n個 不偏 np 分散 表 p (1 − p) n pˆ − p pˆ − p Z=√ ≈√ p (1 − p) /n pˆ (1 − pˆ) /n 十分大 含 知 ,Z 標準正規分布 分布 近似 . pˆ (1 − pˆ) 近似 n ,信頼区間 (5.15) 式 ) zα/2 pˆ − p Pr −zα/2 ≤ √ ≤ zα/2 pˆ (1 − pˆ) /n 信頼区間 √ TE Pr pˆ − zα/2 ■母成功率 上限 場合 pˆ (1 − pˆ) ≤ p ≤ pˆ + zα/2 n 片側区間推定 100α/2% 点 使 zα 以下 (5.16) 式 整理 p ( (5.15) 式 設定 信頼区間 片側区間推定 √ ( Pr √ pˆ − p pˆ (1 − pˆ) /n ( Pr pˆ − zα √ . =1−α (5.16) 上側 下側 ,上側 100α% 点 方 .信頼区間 . (5.15) ) 信頼区間 状況 求 . =1−α pˆ (1 − pˆ) n 有効 母数 p . 書 直 (5.16) 式 . 確率 分母 p (1 − p) n 十分大 100α/2% 点 ( (5.14) ,中心極限定理 標準正規分布 N(0, 1) ,n 標本 . 分布 標準化 (5.13) n 個 和, 導 (4.7) 式 (5.14) 式 分布 形状 n ,E(Xi ) = p pˆ = p . . n 考 =1−α n 個 標本平均 pˆ 1∑ pˆ = Xi n i=1 期待値 E (ˆ p) ) NT AT I , 分布 .(4.6) 式 一致推定量 pˆ 整理 . 5.3 成功率 推定 ■母成功率 σ2 取 VE 母平均既知 111 場合 (5.17) 式 (5.18) 式 使 . 表 ) ≤ zα =1−α ) pˆ (1 − pˆ) ≤p =1−α n (5.17) (5.18) 第 5 章 母数 推定 ,標本成功率 離散 112 ■区間推定 連続性補正 (4.35) 式,(4.36) 式 触 値 ,標本 n 似 制度 大 .確率変数 Xi 項分布 B(n, p) . 大 n 十分 . 便宜上 z = 0 1−α 下限 分割 範囲 ( Pr −zα/2 ( 確率 正規分布 符号 0.5 必要 (5.19) 式 ( = Pr −zα/2 行 . 表 連続性補正 近 Y 二 (4.34) 式 利用 異 ,両側推定 区間 . 方 近似 入 場合 確率 ) ( ) nˆ p − np − 0.5 nˆ p − np + 0.5 ≤ √ < 0 + Pr 0 ≤ √ ≤ zα/2 np(1 − p) np(1 − p) ) ( ) nˆ p − np − 0.5 nˆ p − np + 0.5 ≤ √ < 0 + Pr 0 ≤ √ ≤ zα/2 nˆ p(1 − pˆ) nˆ p(1 − pˆ) ) ( ) pˆ − p − 0.5/n pˆ − p + 0.5/n ≤ √ < 0 + Pr 0 ≤ √ ≤ zα/2 = 1 − α pˆ(1 − pˆ)/n pˆ(1 − pˆ)/n (5.19) NT AT I ≈ Pr −zα/2 入 二項分布 連続性補正 連続性補正 Y = X1 + · · · + Xn 和 区間 中心極限定理 上限 場合 VE 取 (5.19) 式 z<0 pˆ − p − 0.5/n = −(|ˆ p − p| + 0.5/n) 関係 利用 (5.20) 式 表 ( |ˆ p − p| + 0.5/n ≤ zα/2 2 × Pr 0 ≤ √ pˆ(1 − pˆ)/n ■n 大 場合 近似 無作為抽出 関係 xU n ∑ xL ∑ x=0 =1−α (5.20) 中心極限定理 (5.19) 式 利用 使 信頼区間 標本 Xi 場合 求 n 個 和 標本成功率 pˆ Xi ∼ B(n, pˆ) i=0 .左辺 立 求 ) 値 n 下側 100α/2% 点 分布 TE . 上側 用 成 区間推定 ,(5.15) 式,(5.16) 式 .二項分布 可能 母成功率 . ,n 期待値 既 説明 , np n−x np ∼ B(n, pˆ) = n Cx pˆx (1 − pˆ) ,x 割 ˆx (1 − pˆ) n Cx p 0 n 得 n−x ≥ α/2 , 変 (5.21) 式 満 最少 xL 最大 . n ∑ x=xU ˆx n Cx p n−x (1 − pˆ) ≥ α/2 (5.21) 5.3 成功率 推定 二項分布 点 得 自然数 場合 *3 方 ,真 多 . 意味 R 上側 統計 下側 100α/2% 用 場合 *3 . R “qbinom()” “The quantile is defined as the smallest value x such that F(x) ≥ p, where F is the distribution function”. 書 TE NT AT I VE 同様 113 NT AT I TE VE 115 仮説検定 章 現在加筆修正中 行 5章 . 無作為抽出 .特 区間推定 信頼区間 標本 信頼区間 使 確率分布 信頼係数 “母数 調 章 後日,例題,R Tips 追加 表現方法 NT AT I 統一 . VE 第6章 考 値 . 母数 方 母数 方法 利用 関 説明 無作為標本 確率的 ” 方法 推定 計算 程度正 仮説検定 5 章 同様,確率分布 母数 仮説検定 行 方法 呼 . 紹介 . 6.1 仮説検定 基礎 6.1.1 仮説検定 考 方 ■仮説 実験 調査 行 有効 地域 “ 予測 結果 TE 理論 ” 種 .統計学 仮説 立 別 理論 仮説検定 正 H1 : µ ̸= 3.1 手法 従来 手法 差 何 ” 集 言 母数 検証 対 “帰無仮説” . 方法 集 仮説検 “対立仮説” . 仮説. 何 操作,作業 行 理論 有効 ,元 変 仮説. 表記 対立仮説 (alternative hypothesis):H1 変化 所得 開発 証拠 調 帰無仮説 (null hypothesis):H0 H0 : µ = 3.1 “新 地域 裏付 統計的 定 ,例 仮説. 表記 理論 何 有効 操作,作業 結果,元 仮説. 状態 2 第6章 116 対立仮説 採択 ,検定 (reject the null hypothesis) 実験 調査 元 理論 棄却 有意 . 検証 “帰無仮説 採択 無仮説 棄却 . “真” ,“偽” “真” 得 差 例 示 立場 少 考 , 状況 仮説 種類 検定 用 . 分類 別 仮説 . “差 対 差 示 ” ,“差 ” . 帰無仮説 取 消極 示 無理 仮説 結果的 対立仮説 値 説明 次 分類 NT AT I ■仮説 検証 ,“帰 表現 用 言 示 1 対立仮説 表現 通常 用 ” (fail to reject the null hypothesis)” .積極的 的 有効性 帰無仮説 VE 棄却 , (accept the alternative hypothesis) 仮説検定 . 単純仮説 仮説 単独 値 複合仮説 仮説 単独 値 場合.例 場合.例 ■検定 種類 検定 片側検定 対立仮説 両側検定 対立仮説 帰無仮説 否定 与 何 条件 検定 用 対立仮説 検定” .元 片側 検定 値 帰無仮説 検定 TE ■検定 用 保証 場合 母数 一方向 次 場合 0.4 0.3 0.3 0.2 0.1 調 設定 . 0.2 0.1 0.0 0.0 − zα 2 0 Z0 図 6.1: 仮説検定 関 zα 2 両側 “改良 変化 値 計算 0.4 −4 ,例 H1 : µ ̸= µ0 . f (Z 0) f (Z 0) 片側検定 . H1 : µ < µ0 場合.例 .片側検定 用 下側 分類 場合.例 当 ,上側 次 与 対立仮説 多 H1 : µ < µ0 範囲 設定 不等号 知見 H0 : µ = µ0 4 −4 − zα 0 4 Z0 値:正規分布両側(左図) 片側検定(右図) 6.1 仮説検定 基礎 117 検定統計量 標本 計算 臨界値 帰無仮説 棄却 否 標本統計量 判断 値.境界値 採択 見 ,臨界値 領域(図 6.1 棄却域 赤 超 対立仮説 面積, p 値 検定統計量 棄却域 .例 確率.事前 求 定 正 )” 設定 事象 推定 ,帰無仮説 起 . 確率 1% 以下 対立仮説 )起 採択 ■仮説検定 斜線部 外 確率 下 , 統計的 起 p 確率 0.01 以下 偶然 NT AT I 起 赤 場合,検定統計量 棄却域 入 0.01(= α) 有意水準以下 (p ≤ α) 値 領域.対立仮説 (図 6.1 確率 “帰無仮説 真( ,有意水準 側 斜線部) 面積) 上記 呼 L,U ,z1−α/2 ,zα/2 ) 棄却域 帰無仮説 有意水準 検定 VE (図 6.1 母数 ( ,帰無仮説 棄却 . 手順 実際 実験 調査 仮説検定 行 場合 手順 . 1 検定 母数 以外 2 量 決定 ,帰無仮説 母数 場合 従 確率分布 対立仮説 未知/既知 立 別 明 →検定統計 決 3 有意水準 両側/片側検定 別 定 4 母集団 標本 無作為抽出 5 検定統計量 棄却域 計算 . 検定統計量 6 検定統計量 棄却域 比較 棄却域 含 場合 6.2 節以降 ,上記 手順 帰無仮説 棄却 帰無仮説 従 母数 .p 値 棄却 推定 場合 具体的 手順 説 . TE 明 有意水準以下 p 値 計算 6.1.2 仮説検定 ■仮説検定 過誤 2 過誤 生 可能性(危険性) 過誤 第1種 仮説検定 正 手順 . 過誤 (type I error) 処理 行 判断 判断 誤 第2種 過誤 呼 過誤 (type II error) 誤 . 分 . ■第 1 種 過誤 却 第 1 種 過誤 ,帰無仮説 H0 対立仮説 H1 ,検定時 採択 有意水準 α 誤 等 . . 正 第1種 過誤 第1種 , 棄 発生 確率 過誤 小 第6章 118 小 .第 1 種 (false positive), ■第 2 種 過誤 第2種 対立仮説 H1 . 偽陽性 過誤 ,逆 呼 誤 , 対立仮説 H1 第 2 種 過誤 発生 確率 ,対立仮説 H1 定時 一般 (false negative), 困難 呼 表 6.1: 仮説検定 誤 分布 通常不明 過誤 , . 棄却) 真(H1 偽) ○(真陽性) H0 偽(H1 真) 第 2 種 過誤(偽陰性) 棄却(H1 H0 第1種 却 組 合 種 ,帰無仮説 H0 ,過誤 表 6.1 過誤 第2種 過誤 ○(真陰性) 第2種 過誤 ( ( 1 方法 対立仮説 (対立仮説 H1 ( 帰無仮説 H0 多 ,通常 棄却 第1種 TE 小 両者 .標本 共 大 取 実際 ),効果 ) 第 1 種 過誤 方 ),効果 ) 小 .実験 調査 採択 第 2 種 過誤 過誤 小 6.2 母平均 関 過誤 棄却 採択 H1 通常,第 1 . 言 帰無仮説 H0 間違 ,効果 ,第 1 種 困難 過誤 小 非棄却/棄 . 多々 ,通常 効果 勘違 表 大 望 ,2 真偽 帰無仮説 H0 関係 採択) 過誤(偽陽性) NT AT I H0 ■過誤 関係 以上 ,検 過誤 2 非棄却(H1 H0 棄却 .第 2 種 偽陰性 , . 帰無仮説 H0 正 過誤 VE ,有意水準 仮説検定 見落 重要視 多 . 検定 6.2.1 母分散既知 場合 正規分布 ■母分布 場合 ,検定統計量 検定 母数 母分布 ,母平均 場合 均X 量 不偏 呼 対応 統計的 仮説検定 標本統計量 用 検定統計量 計算 帰無仮説 帰無仮説 µ0 一致推定量 .帰無仮説 5.1.1 検定 触 標本平均 X 対立仮説 判断 検定 行 . 既知 .母分散 σ 2 無作為標本 X1 , . . . , Xn 帰無仮説 “母平均 µ = µ0 ” 次 行 . 母分散 σ 2 正規分布 . 標本値個々 . 条件 下 既知 標本平 検定統計 検定 帰無仮説 µ = µ0 対立仮説 µ ̸= µ0 臨界値 119 標準正規分布表 布 上側 100α/2% 点 標準化変換 標準化統計量 n,分布 母分散 σ 2 有意水準 満 上側 必要 利用 ,X .無作為標本 (6.1) 式 従 . (6.1) ,臨界値 片側検定 . 次 Z0 棄却域 含 否 NT AT I 両側検定 |Z0 | ≥ |zα/2 | 片側検定 |Z0 | ≥ |zα | *1 帰無仮説棄却.対立仮説採択 示 有意水準 値α P値 0.4 0.4 0.3 0.3 0.2 0.1 付記 . −4 2 0 zα 2 4 1 0.2 −4 − zα 0 Z0 図 6.2: 母分散既知 母平均 正規分布両側検定(左図) TE 定(右図):有意水準(P 値)0.10 ■母分布 未知 母分散 大 ,中心極限定理 4 Z0 場合 既知 場合 母分布 片側検 場合 未知 標本 標準正規分布 近似 十分 ,上 説明 方法 . 6.2.2 母分散未知 場合 ■母分布 正規分布 従 検定 場合 母分布 母平均 µ .6.2.1 行 , 母分散 σ 2 母分散 σ 2 母分散 σ 2 未知 正規分布 N(µ, σ 2 ) 既知 場合 母平均 検定 .母分散未知 場合 ,既知 場合 同様,母平均 不偏 用 検定統計量 値 絶対値 0.0 − zα Z0 > 0 Z0 ≥ Zα/2 Z0 < 0 Z0 ≤ −Zα/2 一方 0.1 0.0 適用 判断 帰無仮説棄却.対立仮説採択 *1 f (Z 0) f (Z 0) 詳細 場合 下側 100α% 点 zα ,両側検定 場合 両側 100α/2% . 検定結果 分 標本 X − µ0 √ ∼ N(0, 1) σ/ n 標準正規分布 N(0, 1) −zα/2 点 zα/2 分布 取 ,標準化統計量 Z0 Z0 = 標準化統計量 Z0 読 VE 6.2 母平均 関 µ0 考 一致推定量 , 臨界 取 第6章 120 .帰無仮説 帰無仮説 µ = µ0 対立仮説 µ ̸= µ0 今n個 無作為標本 X1 , . . . , Xn 標準化 ,σ 2 対立仮説 次 用 未知 .母分散既知 ,代 標本分散 S n 検定統計量 T0 2 場合 (6.2) 式 用 . 表 . X − µ0 √ ∼ t(n − 1) S/ n (6.2) NT AT I T0 = (6.2) 式 標準化統計量 t 統計量 呼 自由度 n − 1 (4.55) 式 .臨界値 片側検定 下側 100α% 点 tα (n − 1),両側検定 −tα/2 (n − 1) 同様 X )2 1 ∑( Xi − X n − 1 i=1 S2 = 標準化 . VE 標本平均 X 仮説検定 . 場合 有意水準 満 . T0 上側 両側 100α/2% 点 tα/2 (n − 1) 場合 棄却域 T0 t 分布 従 含 否 判断 . |T0 | ≥ |tα/2 (n − 1) | 片側検定 |T0 | ≥ |tα (n − 1) | 帰無仮説棄却.対立仮説採択 帰無仮説棄却.対立仮説採択 0.4 0.3 0.3 f (T 0) 0.4 0.2 0.2 0.1 0.1 0.0 0.0 TE f (T 0) 両側検定 −4− t α 2(n − 1) 0 t α 2(n − 1) −4− t α(n − 1) 0 4 T0 図 6.3: 母分散未知 T0 t 分布両側検定(左図) 片側検定 (右図):自由度 4(= n − 1),有意水準(P 値)0.10 場合 ■母分布 未知 場合 ,中心極限定理 法 適用 . 場合 4 母分布 母平均 未知 場合 母分布 標準正規分布 近似 ,標本 十分大 ,上 説明 方 6.3 母平均値 差 検定 121 6.3 母平均値 差 検定 6.3.1 母分散既知 場合 数 µ1 , σ1 2 母分散既知 µ2 , σ2 2 場合 独立 2 X1 ,X2 n1 個 母分散 σ12 σ22 . 標本平均 差 検定 , . N(µ2 , σ2 2 ) ∼ X2 n2 個 無作為標本 抽出 既知 ,2 問題 母 従 N(µ2 , σ2 ) 母平均 µ1 . µ2 平均値 差 検定 呼 . 等 2 言 . 場合,2 NT AT I 検定 2 正規分布 N(µ1 , σ1 ) N(µ1 , σ1 2 ) ∼ X1 , 母集団 2 VE ■正規母集団 X = X1 − X2 標本平均 ( ) E X 差 正規分布 ( ) 分散 V X 次 再生性 X1 X2 正規分布 独立 従 . ,(3.18) 式 X 期待値 (3.23) 式 . ( ) ( ) ( ) ( ) E X = E X 1 − X 2 = E X 1 − E X 2 = µ1 − µ2 ( ) ( ) ( ) ( ) σ2 σ2 V X = V X1 − X2 = V X1 + V X2 = 1 + 2 n1 n2 用 標本平均 差 ,標準正規分布 従 標準化変換 検定統計量 Z0 . ) ( X 1 − X 2 − (µ1 − µ2 ) √ Z0 = σ12 σ2 + 2 n1 n2 帰無仮説 対立仮説 次 H0 : µ1 = µ2 対立仮説 H0 : µ1 ̸= µ2 TE 帰無仮説 (6.3) 式 Z0 . X1 − X2 Z0 = √ σ12 σ2 + 2 n1 n2 含 否 検定 参照). 両側検定 |Z0 | ≥ |zα/2 | 片側検定 |Z0 | ≥ |zα | (6.3) . (6.4) 式 書 直 棄却域 (6.3) 式 与 帰無仮説棄却.対立仮説採択 帰無仮説棄却.対立仮説採択 (6.4) (図 6.2 第6章 122 6.3.2 母分散未知 等 ■正規母集団 場合 母分散未知 母数 µ1 , σ1 2 仮説検定 等 場合 µ2 , σ2 2 独立 母集団 X1 , X2 2 正規分布 N(µ1 , σ1 2 ) N(µ2 , σ2 2 ) , 従 . X1 ,X2 n1 個 母分散 n2 個 無作為標本 抽出 ,σ 2 = σ12 = σ22 未知 母平均 µ1 本平均 差 X2 ∼ N(µ2 , σ2 2 ) VE X1 ∼ N(µ1 , σ1 2 ) , 期待値 前出 . 等 µ2 . 検定 母分散 既知 場合 考 .標 同様 NT AT I X = X1 − X2 ( ) ( ) E X = E X 1 − X 2 = µ1 − µ2 . 標本平均 分散 ( ) σ1 2 σ2 = , V X1 = n1 n1 ( ) V X = σ2 σ2 . X1 偏性 導出 方法 ( 1 1 + n1 n2 未知 偏差平方 X2 ( ) σ2 2 σ2 V X2 = = n2 n2 ) ,推定値 和 期待値 σ 2 = σ12 = σ22 用 必要 .(4.43) 式 考 . 標本分散 不 利用 (n ) n2 1 ∑ ( )2 ∑ ( )2 E X1i − X 1 + X2i − X 2 = (n1 − 1)σ1 2 + (n2 − 1)σ2 2 i=1 i=1 TE = (n1 + n2 − 2)σ 2 分散 . 不偏推定量 偏差平方 和 ( ) Vˆ X 書 割 (6.5) 式 母 . 1 Sˆ2 = n1 + n2 − 2 , n1 + n2 − 2 標本分散 Sˆ2 = {n 1 ∑ ( X1i − X 1 )2 + i=1 n2 ∑ ( X2i − X 2 )2 } (6.5) i=1 用 { } 1 (n1 − 1) S1 2 + (n2 − 1) S2 2 n1 + n2 − 2 .(6.5) 式 ( ) Vˆ X = Sˆ2 Sˆ2 ( 用 1 1 + n1 n2 標本平均 ) 分散 推定値 6.3 母平均値 差 検定 . 123 X 標準化 検定統計量 T0 (6.6) 式 ( ) X 1 − X 2 − (µ1 − µ2 ) √ ( T0 = ∼ t (n1 + n2 − 2) ) 1 1 Sˆ2 + n1 n2 . (6.6) (6.6) 式 T0 自由度 n1 + n2 − 2 t 分布 従 次 説明 2 ˆ S 標本平均 対 χ2 分布 定義 χ2 分布 再生性 σ2 { } n1 n2 ( ( )2 )2 1 ∑ Sˆ2 1 1 ∑ X1i − X 1 + 2 X2i − X 2 = σ2 n1 + n2 − 2 σ 2 i=1 σ i=1 VE . { 2 } 1 χ (n1 − 1) + χ2 (n2 − 1) n1 + n2 − 2 χ2 (n1 + n2 − 2) = n1 + n2 − 2 表 NT AT I = . ( Sˆ2 母分散 σ 2 ) X 1 − X 2 − (µ1 − µ2 ) √ ( Z= ∼ N(0, 1) ) 1 1 + σ2 n1 n2 標準正規分布 従 ,(4.51) 式 ) X 1 − X 2 − (µ1 − µ2 ) Z ∼ t(n1 + n2 − 2) T0 = √ ( ) ˆ2 = √ 2 χ (n1 + n2 − 2) 1 1 S σ2 + · 2 n1 + n2 − 2 n1 n2 σ ( 示 .帰無仮説 対立仮説 帰無仮説 H0 : µ1 = µ2 対立仮説 H0 : µ1 ̸= µ2 T0 . (6.7) 式 書 直 . ( ) X1 − X2 T0 = √ ( ) ∼ t (n1 + n2 − 2) 1 1 Sˆ2 + n1 n2 TE (6.6) 式 次 棄却域 含 否 検定 (6.7) (図 6.3 参照). 片側 場合 |T0 | ≥ |tα (n1 + n2 − 2) | 両側 場合 |T0 | ≥ |tα/2 (n1 + n2 − 2) | “母分散 未知 等 6.4 節 母分散比 検定 先 行 必要 *2 . 帰無仮説棄却.対立仮説採択 帰無仮説棄却.対立仮説採択 ” “母分散 違 仮定 ,後述 ” 調 *2 不 等 ” 仮定 用 不明 場合 6.3.3 最初 適用 考 明 “母 分 散 第6章 124 6.3.3 母分散未知 等 ■正規母集団 場合 母分散未知 等 母数 µ1 , σ1 2 , 仮説検定 場合 µ2 , σ2 2 独立 母集団 X1 , X2 2 正規分布 N(µ1 , σ1 2 ) N(µ2 , σ2 2 ) 従 . X1 ,X2 n1 個 母分散 σ12 母平均 µ1 期待値 µ2 σ22 X2 ∼ N(µ2 , σ2 2 ) n2 個 無作為標本 抽出 等 仮定 等 ,未知 検定 前出 母分散 VE X1 ∼ N(µ1 , σ1 2 ) , 既知 . . 考 場合 同様 .標本平均 差 NT AT I X = X1 − X2 ( ) ( ) E X = E X 1 − X 2 = µ1 − µ2 . 標本平均 ( ) σ1 2 V X1 = , n1 . 標本分散 分散 ( ) σ2 2 V X2 = , n2 σ22 母分散 σ12 未知 ( ) σ1 2 σ2 2 V X = + n1 n2 標本平均 差 分散 推定値 用 ( ) S1 2 S2 2 Vˆ X = + n1 n2 . 標準化 X 検定統計量 T0 (6.8) 式 ( ) X 1 − X 2 − (µ1 − µ2 ) √ T0 = ∼ t(ˆ ν) 2 2 S1 S2 + n1 n2 自由度 νˆ t 分布 従 *3 興味 読 飛 . 人 T0 合 (6.9) 式 計算 νˆ )2 S1 2 S2 2 + n1 n2 νˆ = ( ( 2 )2 2 )2 S1 S2 n1 n2 + n1 − 1 n2 − 1 t 分布 従 係数 . (6.8) . ( TE T0 . 次 (6.9) *3 示 .標本分散 Si 2 ci ( n ∑ i=1 ci Si 2 ≈ χ2 (ˆ ν) , νˆ = n ∑ )2 ci Si 2 i=1 ( n ∑ i=1 ci Si 2 νi )2 線形結 6.3 母平均値 差 検定 今 (6.8) 式 分母 “W elch―Satterthwaite 式” . 自由度 各標本分散 νi 根号内 着目 母分散 S1 2 S2 2 + = n1 n2 ( σ1 2 σ2 2 + n1 n2 . c= · ν 2 σ2 2 σ1 + n1 n2 式 適用 真値 ν . 変形 S1 2 S2 2 + n1 n2 σ1 2 σ2 2 + n1 n2 ν NT AT I W elch―Satterthwaite ν ) νi = ni − 1 自由度 χ2 分布 近似 自由度 νˆ VE . 125 S2 2 S1 2 + c 2 c 2 n n2 2 ν 12 ν) 2 = n S1 + n S2 ≈ χ (ˆ σ2 σ1 1 2 + n1 n2 χ2 分布 自由度 νˆ 由度 計算式 . W elch―Satterthwaite 式 自 適用 ( )2 )2 ( 2 c 2 S2 2 c 2 S1 S1 + S2 + n1 n2 n1 n2 νˆ = ( )2 ( )2 = ( 2 )2 ( 2 )2 c 2 c 2 S1 S2 S1 S2 n1 n2 n1 n2 + + n1 − 1 n2 − 1 n1 − 1 n2 − 1 (6.9) 式 定 問題 得 書 . 直 次 含 ν , 関係 ( σ1 2 σ2 2 + n1 n2 ) · χ2 (ˆ ν) νˆ (6.8) 式 分母 根号 代入 ( ) X 1 − X 2 − (µ1 − µ2 ) Z T0 = √( ∼√ ∼ t (ˆ ν) ) χ2 (ˆ ν) σ1 2 σ2 2 χ2 (ˆ ν) + · νˆ n1 n2 νˆ ,自由度 νˆ ,最 分布 νˆ . S1 2 S2 2 + = n1 n2 TE ν = νˆ . t 分布 整数 ν ′ 近 点 値 按分 . . 近似 必要 , 両側 *4 一般 整数 .帰無仮説 νˆ 自由度 対立仮説 整数 t *4 R 由度 数 用 場合 正 自 実 ,ν ˆ 帰無仮説 H0 : µ1 = µ2 使 第6章 126 仮説検定 H0 : µ1 ̸= µ2 (6.8) 式 (6.10) 式 書 直 . ( ) X1 − X2 T0 = √ ∼ t(ˆ ν) S1 2 S2 2 + n1 n2 棄却域 T0 含 否 検定 (図 6.3 参照). 両側検定 |T0 | ≥ |tα/2 (ˆ ν) | 片側検定 |T0 | ≥ |tα (ˆ ν) | (6.10) VE 対立仮説 帰無仮説棄却.対立仮説採択 NT AT I 帰無仮説棄却.対立仮説採択 6.4 母分散比 検定 ■正規母集団 母分散比 検定 独立 母数 µ1 , σ1 2 µ 2 , σ2 2 母集団 X1 , X2 2 正規分布 N(µ1 , σ1 2 ) X1 ∼ N(µ1 , σ1 2 ) , X1 ,X2 *5 標本分散 由度 掛 自 n1 個 分散 比 考 S12 . ≥ S22 . . 偏差平方 . F 分布 定義 TE 対立仮説 χ2 分布 自由度 比 ,(6.11) 式 自由度 n1 − 1,n2 − 1 次 帰無仮説 H0 : σ1 2 = σ2 2 対立仮説 H1 : σ1 2 ̸= σ2 2 (6.11) 式 比 考 (6.12) 式 書 直 棄却域 含 否 , F 分布 従 (6.11) . . F0 = F0 母 (n2 − 1)S2 2 ∼ χ2 (n2 − 1) σ2 2 (n1 − 1) S1 2 /σ1 2 S1 2 /σ1 2 (n1 − 1) F0 = = 2 ∼ F (n1 − 1, n2 − 1) (n2 − 1) S2 2 /σ2 2 S2 /σ2 2 (n2 − 1) 帰無仮説 標本分 *5 (4.45) 式 χ2 分布 . . X2 ∼ N(µ2 , σ2 2 ) (n1 − 1)S1 2 ∼ χ2 (n1 − 1) , σ1 2 (4.57) 式 従 n2 個 無作為標本 抽出 S12 ,S22 散 N(µ2 , σ2 2 ) , S1 2 S2 2 検定 (6.12) . 前提 6.5 母分散 検定 127 0.8 F(3,7) F (x ) 0.6 0.2 VE 0.4 F α 2(n 1 − 1, n 2 − 2) 0.0 0 2 4 6 x 図 6.4: 母分散比 10 両側検定(上側 100α/2% 点,図 例) 自由度 n1 − 1 = NT AT I 3, n2 − 1 = 7,α = 0.1 S1 2 ≥ S2 2 慮 8 ,F0 ≥ 1 仮定 ,上側 100α/2% 点 考 . F0 ≥ Fα/2 (n1 − 1, n2 − 1) 両側検定上側 帰無仮説棄却.対立仮説 採択 6.5 母分散 検定 6.5.1 母平均既知 場合 ■母平均既知 場合 母分散 検定 母数 µ,σ 2 無作為抽出 既知 ,母分散 σ 2 抽出 検定 .n 個 . 標本 求 従 母集団 母平均 µ 標本分散 .(4.48) 式 TE S2 n 個 標本 X1 , . . . , Xn 正規分布 N(µ, σ 2 ) n 1 ∑ nS 2 2 χ (n) ∼ W = 2 (Xi − µ) = 2 σ i=1 σ 2 .帰無仮説 対立仮説 帰無仮説 H0 : σ 2 = σ0 2 対立仮説 H0 : σ ̸= σ0 2 検定統計量 W0 次 (6.13) 式 . W0 = W0 棄却域 含 否 . nS 2 σ0 2 検定 (6.13) . 第6章 128 両側検定 W0 ≤ χ21−α/2 (n) W0 ≥ χ2α/2 (n) W0 ≤ χ21−α (n) W0 ≥ χ2α (n) 仮説検定 帰無仮説棄却.対立 仮説採択 片側検定 1 条件 満 0.20 0.15 0.15 0.10 0.10 0.05 0.05 0.00 0.00 2 2 0χ 1−α 2(n )10χ α 2(n ) 20 VE 0.20 f (w ) f (w ) 帰無仮説棄却.対立仮説採択 (n ) 10 2 1−α 20 NT AT I 0χ w = χ (n ) w = χ (n ) 2 2 χ2 分布両側検定(左図) 片側検定 (右図):自由度 5,有意水準(P 値)0.10 場合 図 6.5: 母分散既知 場合 母分散 6.5.2 母平均未知 場合 ■母平均未知 場合 分布 N(µ, σ 2 ) 従 母分散 母集団 .今度 母平均 µ 求 標本平均 検定 母平均既知 無作為抽出 S2 X ,標本分散 同様,母数 µ,σ 2 n 個 標本 X1 , . . . , Xn 母分散 σ 2 未知 場合 検定 正規 抽出 .n 個 標本 .(4.44) 式 n )2 1 ∑( (n − 1)S 2 χ (n − 1) ∼ W = 2 Xi − X = σ i=1 σ2 2 TE .帰無仮説 対立仮説 帰無仮説 H0 : σ 2 = σ0 2 対立仮説 H0 : σ ̸= σ0 2 検定統計量 W0 W0 棄却域 次 (6.14) 式 . . W0 = (n − 1)S 2 σ0 2 否 検定 含 (6.14) (図 6.5 参照). 両側検定 W0 ≤ χ21−α/2 (n − 1) 却.対立仮説採択 W0 ≥ χ2α/2 (n − 1) 帰無仮説棄 6.6 適合度 2 乗検定 129 W0 ≤ χ21−α (n − 1) 片側検定 帰無仮説棄却.対立仮説採択 χ2 検定 6.6 適合度 ■理論度数 観測度数 . 適合度 検定 今n個 k個 観測度数 Ci . Oi 標本 分類 Ci k ∑ 満足 . 得 Oi Oi = n 観測度数 Oi 理論確率 pi .各 母集団 標本 Ci ··· Ck 合計 観測度数 O1 ··· Oi ··· Ok n 理論確率 p1 ··· pi ··· pk 1 理論度数 np1 ··· npi ··· npk n ,npi . 表 6.2 問題 .(3.34) 式 E(Xi ) = npi , TE 各 npi . 多項分布 χ2 検定 ··· . . 検定 C1 n 従 得 理論度数 表 6.2: 適合度 扱 得 NT AT I 検定 観測 (i = 1, . . . , k ).各 i=1 pi 1 条件 VE 満 W0 ≥ χ2α (n − 1) 表 6.2 既 説明 3.3.3 各 平均値 扱 理論確率 問題 多項分布 問題 分散 V (Xi ) = npi (1 − pi ) 十分大 W = k ∑ (Oi − npi )2 i=1 自由度 k − 1 中心極限定理 ∼ χ2 (k − 1) npi χ2 分布 従 .npi 十分大 ,Oi 正規分布近似 (Oi − npi )2 (Oi − npi )2 = (1 − pi ) ∼ (1 − pi )Zi 2 ∼ (1 − pi )χ2 (1) npi npi (1 − pi ) .χ2 分布 W = 再生性 k ∑ (Oi − npi )2 i=1 2 npi ∼ k k k ∑ ∑ ∑ (1 − pi )χ2 (1) = χ2 (1) − pi χ2 (1) i=1 i=1 i=1 = χ (k) − (p1 + · · · + pk )χ(1) = χ (k − 1) .帰無仮説 対立仮説 2 次 . 第6章 130 帰無仮説 H0 : O1 = np1 , . . . , Ok = npk 対立仮説 H1 : O1 = np1 , . . . , Ok = npk (6.15) 式 W0 = . k 2 ∑ (Oi − npi ) npi i=1 Oi = npi 較 場合 ,自由度 k − 1 0 片側検定 片側検定 χ2 分布 上側 100α% 点 . W0 ≥ χ2α (k − 1) (6.15) VE 検定統計量 W0 仮説検定 比 帰無仮説棄却,対立仮説採択 NT AT I 0.20 f (w ) 0.15 0.10 0.05 0.00 2 10 χ α(k − 1) 20 0 w = χ2(k − 1) 図 6.6: 適合度 例) α = 0.05 ■注意 *6 例 図 3.1 要 np < 5 B(n, p) 形状 検定統計量 W0 *6 .満 利用 Oi ≥ 5 場合, 場合 満 隣接 合併 (例 必 O1 + O2 ) . TE 思 自由度 k − 1 = 5, χ2 乗検定(上側 100α% 点,図 6.7 独立性 検定 ■独立性 検定 6.6 節 適合度 確率変数 間 独立性 後日加筆 χ2 検定 利用 3.4.1 (3.59) 式 検定 同時確率関数 .詳細 示 , . 6.8 母成功率 検定 ■標準正規分布近似 抽出 検定 n 個 標本 X1 , . . . , Xn .(5.14) 式 n 十分大 母数 p 得 分布 . 場合 成功率 従 母集団 母成功率 p 標本平均 pˆ 無作為 検定 標準正規分布 6.8 母成功率 検定 131 近似 N(0, 1) . pˆ − p nˆ p − np Z=√ =√ p(1 − p)/n np (1 − p) 対立仮説 次 帰無仮説 H0 : p = p0 対立仮説 H1 : p ̸= p0 検定統計量 Z0 (6.16) 式 Z0 = √ . pˆ − p0 p0 (1 − p0 ) /n ,分母 = √ pˆ nˆ p − np0 (6.16) np0 (1 − p0 ) p0 用 計算 NT AT I p = p0 . . VE 帰無仮説 棄却域 Z0 含 否 検定 (図 6.2 参照). 両側 場合 |Z0 | ≥ |zα/2 | 片側 場合 |Z0 | ≥ |zα | ■連続性補正 行 帰無仮説棄却.対立仮説採択 場合 検定 統計量 (6.16) 式 若干異 間推定 外側 当 . 区間推定 棄却域 含 |Z| = 連続性補正 行 行 場合 下限 広 検定 母成功率 |Z| ≥ zα/2 区間 引 0.5 連続性補正 . 場合下限 .帰無仮説 説明 .(5.20) 式 部分 |nˆ p − np| 帰無仮説棄却.対立仮説採択 区 検定 補正 . . |nˆ p − np| − 0.5 |ˆ p − p| − 0.5/n √ = √ np(1 − p) p(1 − p)/n 対立仮説 連続性補正 行 場合 同様, 次 TE . 帰無仮説 H0 : p = p0 対立仮説 H1 : p ̸= p0 (6.17) 式 検定統計量 Z0 Z0 . |nˆ p − np0 | − 0.5 |ˆ p − p0 | − 0.5/n = √ |Z0 | = √ np0 (1 − p0 ) p0 (1 − p0 )/n 棄却域 含 否 検定 参照). 両側 場合 |Z0 | ≥ |zα/2 | 片側 場合 |Z0 | ≥ |zα | 帰無仮説棄却.対立仮説採択 帰無仮説棄却.対立仮説採択 (6.17) (図 6.2 第6章 132 利用 場合 正規分布近似 場合 (5.21) 式 利用 下 標本 ,n 大 nA ∑ x n Cx p (1 標本成功数 nA 以上 − p)n−x 確率 n ∑ n Cx p x 正規分布近似 利用 . 帰無仮説 H0 : p = p0 対立仮説 H1 : p ̸= p0 上側 P = 下側 nA ∑ P 値 計算式 x n Cx p0 (1 − p0 ) n−x (6.18) 式 , 場合 同様, x n Cx p0 (1 − p0 )n−x (6.18) x=nA 両側検定 場合 上側 帰無仮説 下側 上側 P 値 有意水準 α/2 棄却,片側検定 帰無仮説 両側検定 . n ∑ P = x=0 小 ,標本成功数 nA 以 NT AT I 次 対立仮説 区間推定 (1 − p)n−x x=nA .帰無仮説 母成功率 nA x=0 , 中心極限定理 場合 .母成功率 p,標本成功数 確率 大 n VE ■正規分布近似 仮説検定 下側 棄却 場合 利用 小 P 値 有意水準 α . P 値 < 有意水準 α/2 帰無仮説棄却.対 立仮説採択 利用 TE 片側検定 P 値 < 有意水準 α 帰無仮説棄却.対立仮説採択 6.9 母成功率 差 検定 ■母成功率 母集団 差 検定 無作為抽出 X2 = X21 , . . . , X2n2 定 (4.6) 式 母成功率 p1 .X1 p2 n1 個 得 . X2 独立 n2 個 2 分布 ( ) E X2 = p2 , 2 標本 X1 = X11 , . . . , X1n1 母成功率 標本平均 X 1 = pˆ1 , X 2 = pˆ2 差 期待値 (4.7) 式 ( ) E X1 = p1 , 従 ( ) p1 (1 − p1 ) V X1 = n1 ( ) p2 (1 − p2 ) V X2 = n2 検 分散 6.9 母成功率 差 検定 . 133 差 X1 − X2 標本平均 期待値 分散 (3.18) 式 (3.23) 式 . 用 VE ) ( E X1 − X2 = p1 − p2 ( ) p1 (1 − p1 ) p2 (1 − p2 ) V X1 − X2 = + n1 n2 標本成功率 差 pˆ1 − pˆ2 標本平均 差, 標準正規分布 N(0, 1) 近似 . 標準化 pˆ1 − pˆ2 − (p1 − p2 ) Z=√ p1 (1 − p1 ) /n1 + p2 (1 − p2 ) /n2 帰無仮説 対立仮説 帰無仮説 次 . NT AT I H0 : p1 = p2 H1 : p1 ̸= p2 対立仮説 検定統計量 Z0 (6.19) 式 . pˆ1 − pˆ2 Z0 = √ pˆ (1 − pˆ) (1/n1 + 1/n2 ) 母比率 p1 = p2 = p 推定値 pˆ pˆ = 加重平均 用 標本平均 加重平均 (6.19) . n1 × pˆ1 + n2 × pˆ2 n1 + n2 , 標本比率 (6.20) 式 検定統計量 考 推定値 p1 = pˆ1 ,p2 = pˆ2 *7 方 *7 . pˆ1 − pˆ2 Z0 = √ pˆ1 (1 − pˆ1 ) /n1 + pˆ2 (1 − pˆ2 ) /n2 Z0 棄却域 否 |Z0 | ≥ |zα/2 | 片側 場合 |Z0 | ≥ |zα | TE 両側 場合 ■母成功率 差 成功率 検定 付 含 差 加 検定 .pˆ1 帰無仮説棄却.対立仮説採択 連続性補正 関 場合 場合 (6.21) 式 Z0 = . 行 行 0.5/n1 ,pˆ2 対立仮説 . 帰無仮説棄却.対立仮説採択 連続性補正 検定統計量 Z0 帰無仮説 検定 (6.20) 6.8 節 母成功率 検定 同様,母 (6.19) 式 関 (6.17) 式 同様 補正項 0.5/n2 引 . |ˆ p1 − pˆ2 | − 0.5(1/n1 + 1/n2 ) √ pˆ (1 − pˆ) (1/n1 + 1/n2 ) 連続性補正 行 場合 同様, (6.21) 次 一般 (6.19) 式 (6.20) 式 検 定 統計量 一致 第6章 134 帰無仮説 H0 : p1 = p2 対立仮説 H1 : p1 ̸= p2 条件 連続性補正 行 場合 同様,Z0 棄却域 含 仮説検定 否 検定 . |Z0 | ≥ |zα/2 | 片側 場合 |Z0 | ≥ |zα | 帰無仮説棄却.対立仮説採択 VE 両側 場合 帰無仮説棄却.対立仮説採択 更新済 6.10 無相関 検定 t 検定 2 正 規 確 率 変 数 X, Y n 組 NT AT I ■母 相 関 係 数 {(X1 , Y2 ) , · · · , (Xn , Yn )} 推定 合,次 . 抽出 . t 分布 従 利用 検定 |T0 | ≥ |tα (n − 2) | 両側 場合 |T0 | ≥ |tα/2 (n − 2) | 場 ,t 分布 √ rxy n − 2 T0 = √ 2 1 − rxy 片側 場合 TE 標本相関係数 rxy 帰無仮説 H0 : ρ = 0,対立仮説 H1 : ρ ̸= 0 検定統計量 自由度 n − 2 点 比較 .母相関係数 ρ 無作為標本 帰無仮説棄却.対立仮説採択 帰無仮説棄却.対立仮説採択 (6.22) 135 線形関係 章 関 推定 現在加筆中 必要 . 作成 NT AT I ,後日全体 仕上 .講義 VE 第7章 7.1 線形回帰 回帰値 ■残差 . 観測値 組 (xi , yi ) 対 残差 ei (7.1) 式 表 ei = yi − (a + bxi ) = yi − yˆi 観測値 xi 対 回帰直線上 値(推定値) 回帰値 yˆi 呼 (7.1) . yˆi = a + bxi ■最小 2 乗法 a, b 方向 推定 考 偏差 残差 ei . 推定 残差 ei 2 乗和 (7.1) 式 2 ei = i=1 0 呼 .最小値 . 平方和) 最小 2 乗法 n ∑ 観測値 組 (xi , yi ) 考 方 2 乗和( , 最小化 y軸 推定(決 . (7.3) 式 n { ∑ 回帰係数 表 2 (yi − a − bxi ) . } (7.3) i=1 (7.3) 式 最小化 乗推定値 今,n 個 .最小化 考 方 TE 定) 回帰係数 (7.2) a 与 b a, b 求 . 残差 2 乗和 回帰係数 a, b 最小 2 偏微分 第7章 136 回帰係数 a 推定 考 a (7.3) 式 線形関係 推定 (7.4) 式 変形 . ei 2 = i=1 n { } ∑ 2 (yi − a − bxi ) i=1 n { } ∑ 2 = a2 − 2 (yi − bxi ) a + (yi − bxi ) i=1 { = na − 2 2 n ∑ VE n ∑ } n { } ∑ 2 (yi − bxi ) a + (yi − bxi ) 次 (7.4) 式 偏微分 a (7.4) i=1 i=1 (他 定数 ). NT AT I { n } n n } ∑ ∂ ∑ 2 d 2 d ∑{ d 2 a+ ei = n a − 2 (yi − bxi ) (yi − bxi ) ∂a i=1 da da da i=1 i=1 = 2na − 2 n ∑ (yi − bxi ) (7.5) i=1 (7.5) 式 0 (7.6) 式 得 . n ∑ n ∑ na + b xi = i=1 回帰係数 b n ∑ 推定 ei 2 = { n ∑ i=1 (xi ) (7.3) 式 (7.7) 式 変形 { n } n { } ∑ ∑ 2 2 (yi − a) xi b + b −2 (yi − a) b } 2 i=1 (7.6) i=1 . (7.7) i=1 . (7.7) 式 先 a 同様 b 偏微分 { n } { n } n n } ∑ ∑ ∂ ∑ 2 d d d ∑{ 2 ei = xi 2 (yi − a) xi (yi − a) b2 − 2 b+ ∂b i=1 db db db i=1 i=1 i=1 =2 n ∑ TE 次 同様 yi i=1 (7.8) 式 (7.6) 式 (7.6) 式 xi 2 b − 2 i=1 n ∑ (yi − a) xi (7.8) i=1 整理 0 a n ∑ xi + b i=1 (7.9) 式 得 n ∑ 2 xi = i=1 n ∑ . xi yi (7.9) i=1 (7.9) 式 正規方程式 呼 . 回帰係数 a (1.1) 式 与 (7.10) 式 標本平均値 . x 3 . 1∑ 1∑ a= yi − xi · b = y − xb n i=1 n i=1 n y n (7.10) 7.1 線形回帰 消去 a 137 求 b ,(7.10)) 式 (7.9) 式 代入 . n n n n n n ∑ ∑ 1∑ ∑ 1∑ ∑ 2 yi − xi · b + xi · b = xi yi xi xi n i=1 i=1 n i=1 i=1 i=1 i=1 (7.12) 式 得 n ∑ b= xi yi − i=1 n ∑ n−1 割 = i=1 n ∑ Sxy 2 Sx 2 (7.12) (1.26) 式 標本共分散 = xi 2 − nx2 i=1 xi 手順 xi yi − nx · y 22 標本分散 Sx 2 . 標本平均値 x, y ,標本分散 Sx 2 , Sy 2 , , NT AT I 求 n ∑ ,分子 (1.3) 式 5 ,回帰係数 標本共分散 Sxy 2 順 求 ,(7.12) 式 結果 代入 b n n 1∑ ∑ yi xi n i=1 i=1 n n 1∑ ∑ 2 xi − xi xi n i=1 i=1 i=1 (7.12) 式 分母分子 Sxy 2 ,分母 . VE 整理 b ■残差 性質 回帰係数 a (7.6) 式 n ∑ na = a (7.6) 式 回帰係数 b *1 求 (7.9) 式 関係 (7.11) 着目 残差 (7.10) 式 *1 . 満 ,左辺 計算 ,次 性質 変形 導 . (7.13) 式 . 関係数 考 理 i=1 n ∑ (a + bxi ) = i=1 (7.2) 式 左辺 .置 ,(7.1) 式 n ∑ 残差 ei (yi − yˆ) = 0 −→ i=1 和 n ∑ TE n ∑ 換 右辺 移項 性質 導 0 ei = 0 . (7.14) ,和 xi {yi − (a + bxi )} = 0 (7.15)) (7.15) i=1 (7.2) 式 回帰値 yˆi ,説明変数 (7.1) 式 残差 ei 残差 直交 n ∑ 時間 関係 xi (yi − yˆ) = 0 −→ i=1 ■残差 2 乗和 (7.13) i=1 (7.9) 式 ,左辺 右辺 移項 ,xi . 得 yi i=1 回帰値 yˆi (7.14) 式 同様 n ∑ 導 n ∑ 使 書 (7.16) 式 . x i ei = 0 (7.16) i=1 ,後日 直 (申 訳 ) 一見無駄 ,回帰 係数 単独 計算 ,一緒 求 相 実 第7章 138 間 yi 定 紹介 線形関係, 際 心事 結果 線形 回帰直線 .説明力 先 紹介 線形関係 推定法 仮定 .最小 2 乗法 程度,被説明変数 高 表 変動 数値的 ,決定係数 」 評価 回帰値 変動,RSS . n ∑ 2乗 (7.17) 式 T SS = 推 用 . 与 考 . (7.17) 残差 変動 表 .全変動 NT AT I (7.18) 式 表 決定係数 被説明変数 変動 全変動,ESS T SS 回帰係数 関 (1.28) 式 標本相関係数 T SS = ESS + RSS 被説明変数 表 指標 . 「 ,説明変数 xi 推定 VE ■決定係数 線形関係 2 (yi − y) = (n − 1) Sy 2 (7.18) i=1 (1.2) 式 直線 n−1 倍 説明 . 部分 相当 (7.17) 式中 TE 後日 (重 ESS = i=1 n ∑ T SS 重 申 訳 割合 回帰 2 (ˆ yi − y) 2 (yi − y) i=1 続 占 ,決定係数 R2 n ∑ R2 = ESS ) (7.19) 139 VE 第8章 分散分析 章 後日,“ 例題,R , ”調 追加 表現方法 ”調 平仄 合 統一 行 仮説検定 章 ,2 方法 上 . . NT AT I Tips , “ 8.1 分散分析法 ■分散分析法 差 上 例 適用課題 既 検定 増 場合 ,母集団 ,2011 年 問題 母平均値 6 球団 相当 必 母集団 同 表 .各母集団 母集団 標本 観測値 xij 複数 ■変動 分解 偏差 xij − x (8.1) 式 数 行 表 母集団 添字 . 分散分析 (Analysis 属 標本 全 扱 一般的 (8.1) 式 添字 表 j . n = n1 + · · · + nm 総数 ,i 番目 表 T SS = 対 . 観測値 xij 観測値 総平均 x . xij − x = (xij − xi ) + (xi − x) 全変動 TSS m 総数 標本 Xij ,分散分析 検定 行 .各観測値 xij 分解 総数 i 番目 母集団 区別 総数 .母集団 .各母集団 i , 値 用 2 乗和 以 3 差 手法 7 章 変動 分解 回帰係数 推定 変動 分解 , 母集団 検定 異 {Xi1 , Xi1 , · · · , Xini } . 母平均値 . 必要 TE ni 母集団 , 差 検定 化 分散分析 . . 1 選手 . of variance: ANOVA) 法 ■対象 取 独立 (8.2) 式 表 ni m ∑ ∑ i=1 j=1 2 (xij − x) (8.1) . (8.2) 第8章 140 *1 級内変動 群 内変動,級間変動 群間変動 呼 次 (8.3) 式 級内変動 *1 (8.4) 式 級間変動 考 ni m ∑ ∑ 級内変動 = 分散分析 . 2 (xij − xi ) (8.3) i=1 j=1 級間変動 = 2 (xi − x) = m ∑ i=1 j=1 ni m ∑ ∑ i=1 j=1 1 xij = ∑ m i=1 (8.2) 式 次 m ∑ ni ni x i (8.6) i=1 T SS = i=1 書 直 ni m ∑ ∑ . 2 {(xij − xi ) + (xi − x)} i=1 j=1 ni { m ∑ ∑ 2 2 (xij − xi ) + (xi − x) + 2 (xij − xi ) (xi − x) = . (8.5) NT AT I ni (8.4) (8.5) 式,(8.6) 式 与 ni 1 ∑ xij xi = ni j=1 1 x= ∑ m 2 i=1 総平均 x 級内平均 xi ni (xi − x) VE ni m ∑ ∑ } (8.7) i=1 j=1 (8.7) 式 第 3 項 展開 ,(8.5) 式 用 変数 xij (8.5) 式 ni ∑ , ,j 関 和 使 xij = ni xi 求 変形 際 変形 .第 3 項 他 定数 添字 j 含 扱 . . j=1 ni m ∑ ∑ {(xij − xi ) (xi − x)} = TE i=1 j=1 全変動 ■母平均 差 十分小 以上 xij (xi − x) − ni m ∑ ∑ i=1 j=1 m ∑ m ∑ i=1 i=1 xi (xi − x) i=1 j=1 ni xi (xi − x) − ni xi (xi − x) =0 級内変動 T SS = 級間変動 ni m ∑ ∑ (8.8) 和 . 2 (xij − xi ) + i=1 j=1 検定 (8.9) 式 . 3 = ni m ∑ ∑ 例 ,全変動 変動 ,母集団間 母平均 無作為標本 母平均 差 2 (xi − x) (8.9) i=1 j=1 2 母集団間 ni m ∑ ∑ 検定 µ,母分散 σ2 級内変動 比較 級間変動 ,級内変動 差 上述 分解 対 級間変動 .分散分析 2 . 変動 比 行 . 8.1 分散分析法 141 無作為標本 Xij (8.10) 式 考 .添字 j 分布 再生性 関 総和 自由度 ni − 1 ,(4.38) 式 ,自由度 偏差平方和 母分散 σ 2 級内標本平均 X i m ∑ ,無作為標本 標準化 χ2 分布 和 (ni − 1) = n − m 総和 . χ2 分布 割 求 χ2 (4.39) 式 . i=1 VE )2 ∑ ni ( m ∑ m ∑ Xij − X i ∼ χ2 (ni − 1) σ i=1 j=1 i= (m ) ∑ (ni − 1) ∼ χ2 (n − m) ∼ χ2 i=1 次 級内標本平均 X i 考 .添字 j 全平均 X 含 ,内側 (4.43) 式 j 関 , 和 √ σ/ ni 単 割 (8.11) 式 ni 倍 規分布 2乗 . 和 . ,各項 標準正 NT AT I 無作為標本平均 分散 母分散 σ 2 偏差平方和 (8.10) 自由度 m − 1 (4.38) 式 χ2 分布 . )2 ni ( m ∑ ∑ Xi − X σ i=1 j=1 同様 無作為標本 Xij 自由度 n − 1 χ2 分布 )2 Xi − X ∼ ni σ i=1 )2 m ( ∑ Xi − X ∼ ∼ χ2 (m − 1) √ σ/ n i i=1 m ∑ 全平均 X ( 偏差平方和 母分散 σ 2 (8.11) 割 . )2 ni ( m ∑ ∑ Xij − X ∼ χ2 (n − 1) σ i=1 j=1 (8.10) 式 (8.11) 式 自由度 割 TE (8.12) 比 考 )2 ni ( m ∑ ∑ Xi − X σ 式 (4.57) 式 自由度 m − 1 級内変動 平均平方 ,自由度 (m − 1, n − m) 割 比 級間変動 平均平方 F 分布 . / (m − 1) χ (m − 1) / (m − 1) i=1 j=1 = m ni ( 2 χ (n − m) / (n − m) ∑ ∑ Xij − X i )2 / (n − m) σ i=1 j=1 2 左辺 () 式 . (8.13) 右辺 (8.3) 式 自由度 n − m (8.4) 割 . ni m ∑ ∑ ( F (m − 1, n − m) ∼ F0 = Xi − X )2 / (m − 1) i=1 j=1 ni m ∑ ∑ ( )2 Xij − X i / (n − m) i=1 j=1 (8.14) 第8章 142 母平均 差 検定 帰無仮説 H0 :「母平均 立仮説 H1 :「母平均 差 (µ1 = · · · = µm )」,対 差 」 有意水準 α% 自由度 (m − 1, n − m) 検定統計量 F0 検定 F 分布 (8.14) 式 100α% 点 比較 . F0 ≥ Fα (m − 1, n − m) 上側 ■分散分析表 表 形式 ,通常 級間,級内 自由度 多 Sb ,(8.2) 式 全変動 式 級間変動 必要 値 帰無仮説棄却.対立仮説採択 分散分析 手順 紹介 平方,平均平方 表 8.1 .(8.3) 式 . ST . 級内変動 変動要因 平方和 級間 Sb = m ∑ ( )2 ni X i − X i=1 級内 Sw = 全体 ST = ni m ∑ ∑ ( i=1 j=1 ni m ∑ ∑ Xij − X i ( Xij − X )2 )2 自由度 平均平方 m−1 Sb m−1 n−m Sw n−m n−1 ST n−1 i=1 j=1 ■例題 実際 数値例 使 分散分析 6 球団 規定打席数 達 . 用 TE 0.311 0.263 0.316 0.302 0.293 0.266 打率 ,帰無仮説 H0 差 .表 8.2 差 各球団 6 球団 規定打席数 達 2 3 4 5 6 7 . ni 球団 打率 , 有意水準 母平均 差 打者 打率 ni ∑ xij xi j=1 0.300 0.232 0.279 0.292 0.278 0.260 0.295 0.232 0.262 0.269 0.241 0.253 0.282 0.269 0.268 0.252 0.244 0.228 表 .球団数 6 総和 添字 i F値 Sb n−m F0 = Sw m−1 . 表 8.2: 2011 年 TH DG YG YS HC YB 打者 母平均 . ,対立仮説 H1 1 確認 ,各 分散分析 球団 行 Sw ,(8.4) 分散分析 行 NT AT I 表 8.1: 分散分析表 5% . VE 行 間 間 分散分析 ,添字 j 阪神 (TH) 球団内 n1 = 5, 選手 (YS) n4 = 7 1.457 0.727 0.857 1.855 0.812 0.779 6.487 0.2914 0.2423 0.2857 0.2650 0.2707 0.2597 0.2703 m=6 他 ,3 . 8.1 分散分析法 , 右 記 追加 . .各球団 全 総和 総和 総数 24 (8.4) 式,(8.3) 式 級間変動,級内変動 求 平方和 算出 表 8.3 求 割 ,表 全平均 x (xi − x)2 ni (xi − x)2 ni ∑ 2 (xij − xi ) 必要 TH 0.000446 0.002228 DG 0.000782 0.002345 YG 0.000236 0.000709 YS 0.000028 0.000196 HC 0.000000 0.000000 YB 0.000113 0.000339 0.001061 0.000641 0.001525 0.004102 0.001433 0.000085 分散分析表 直接用 表 8.4 . ,時間 限 全体 平方和 NT AT I ,検定 求 *2 偏 偏差平方和 計算 j=1 表 8.3 .各 . 表 8.3: 分散分析 用 算 平均値 xi . 次 差 総数 n = 24 VE 8.2 143 計 計算 必要 *2 級間 級内 平方和 正 計 算 . 表 8.4: 2011 年 変動要因 打者打率 分散分析表 平方和 自由度 平均平方 F値 2.367 級間( 間) 0.005817 5=6−1 0.001163 級内( 内) 0.008846 18 = 24 − 6 0.000491 0.014663 23 = 24 − 1 0.000638 全体 (8.14) 式 母自由度 18 ,検定統計量 F0 求 F 分布 上側 5% 点 F0.05 (5, 18) 2.367 F 分布表 有効 .分子自由度 5,分 読 取 2.77 . F0 ≤ F0.05 (5, 18) ,各球団 母分散 等 母平均 差 TE 打率 言 帰無仮説 棄却 . ,各球団 NT AT I TE VE 145 VE 付録 A 付表 A.1 標準正規分布表 NT AT I ( 2) 1 z ■標準正規分布表 標準正規分布 f (z) = √ exp − 2 2π ( 2) ∫ z 1 t dt = α 与 . 率 √ exp − 2 2π −∞ −∞ z 確 表 A.1: 標準正規分布表 0.00 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.01 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 TE z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 0.02 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.03 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.05 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.06 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 A.2 χ2 分布表 ■χ2 分布表 自由度 m χ2 分布 上側 100α% 点 与 . 0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 付録 A 付表 146 表 A.2: χ2 分布表 0.990 0.975 0.950 0.500 0.250 0.100 0.050 0.025 0.010 1 0.00 0.00 0.00 0.45 1.32 2.71 3.84 5.02 6.64 2 0.02 0.05 0.10 1.39 2.77 4.61 5.99 7.38 9.21 3 0.11 0.22 0.35 2.37 4.11 6.25 7.81 9.35 11.34 4 0.30 0.48 0.71 3.36 5.39 7.78 9.49 11.14 13.28 5 0.55 0.83 1.15 4.35 6.63 9.24 11.07 12.83 15.09 6 0.87 1.24 1.68 5.35 7.84 10.64 12.59 14.45 16.81 7 1.24 1.69 2.17 6.35 9.04 12.02 14.07 16.01 18.48 8 1.65 2.18 2.73 7.34 10.22 13.36 15.51 17.53 20.09 9 2.09 2.70 3.33 8.34 11.39 14.68 16.92 19.02 21.67 10 2.56 3.25 3.94 9.34 12.55 15.99 18.31 20.48 23.21 NT AT I VE m\α A.3 F 分布表 ■F 分布表 分子 自由度 m,分母 自由度 k F 分布 上側 5% 点 与 . 表 A.3: F 分布表 1 2 3 4 5 6 7 8 9 10 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 9 5.12 4.26 3.87 3.63 3.48 3.37 3.29 3.23 3.18 3.14 10 4.97 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 TE m\k A.4 t 分布表 147 A.4 t 分布表 ■t 分布表 自由度 df t 分布 上側 100α% 点 与 . df \ α 0.250 0.100 0.050 0.025 1 1.000 3.078 6.314 12.710 2 0.817 1.886 2.920 4.303 3 0.766 1.638 2.354 3.182 4 0.741 1.533 2.132 2.777 5 0.727 1.476 2.015 2.571 6 0.718 1.440 1.943 2.447 7 0.711 1.415 1.895 8 0.706 1.397 9 0.703 10 VE 表 A.4: t 分布表 0.005 31.820 63.660 6.965 9.925 4.541 5.841 3.747 4.604 3.365 4.032 3.143 3.708 2.365 2.998 3.500 1.860 2.306 2.897 3.355 1.383 1.833 2.262 2.822 3.250 0.700 1.372 1.813 2.228 2.764 3.169 11 0.698 1.363 1.796 2.201 2.718 3.106 12 0.696 1.356 1.782 2.179 2.681 3.055 13 0.694 1.350 1.771 2.161 2.650 3.012 14 0.693 1.345 1.762 2.145 2.624 2.977 15 0.691 1.341 1.753 2.132 2.602 2.947 TE NT AT I 0.010 NT AT I TE VE 149 F F 統計量 103 P p値 117 101, 120, 123, 126 帰無— 対立— 単純— 複合— 仮説検定 117 117 118 115 115 115 116 116 115 棄却域 117 第1種 第2種 仮説 58 — 統計量 1 — — 統計値 統計量 78 78 二項分布 — 再生性 — 正規分布近似 — 統計量 標本 標本数 55 57 91 56 2 79 → 第2種 過誤 分布 再生性 正規分布近似 統計量 連続性補正 55 母集団 58 60 89 59 90 1 無作為標本 — 標本平均 — 標本平均 77 78 78 — — — — NT AT I T t 統計量 過誤 — 統計量 VE 索引 分散 有意水準 117 臨界値 117 → 第1種 検定統計量 117 過誤 連続性補正 二項分布 TE 多項分布 58 分布 54 — 分布 — 90 92 90
© Copyright 2024 ExpyDoc