統計学基礎Ⅱ

2006年度
統計学講義内容
担当者 河田正樹
E-mail [email protected]
統計学とは
• 日常生活において、われわれは不確実なことがらに
さまざまな情報を用いて、予測し、意思決定をおこ
なっている。
(例) 駅までバスでいくときには、
〇 通常の所要時間の情報 に加え
〇 曜日、季節、時間帯、天候などによる混雑度の情報
を用いて、所要時間を予測し、行動する。
• 通常の所要時間の情報、混雑度の情報をどのように
入手し、どのように利用しているのであろうか?
– 普段からよく乗るバスであれば、大体の所要時間を記録
(多くの人は脳の中で)している。
– 平均所要時間と最大所要時間を大まかに計算している。
– さらに、曜日・時間帯・天候などで場合分けし、それぞれの
場合の平均所要時間と最大所要時間を大まかに計算して
いる。
⇒ 実は無意識のうちに「統計学的なものの考え方」
を用いている。
• 統計学とは、分析目的に対応してデータを収集し、分
析することによって、予測や意思決定のための材料
を提供する学問である。
統計学
分析目的
データの収集
分析
予測・
意思決定
データを収集し、分析する統計学の立場には次の2
種類が考えられる。
• まず、得られたデータの特徴を何らかの数値(例えば
平均)や表・グラフにまとめたりすることが考えられる。
⇒ 記述統計(または統計的記述)という。
• 次に、データの記述にもとづき、そのデータを生成し
た集団や構造(これを母集団という)についての推論
をおこなうことが考えられる。
⇒ 推測統計という。
毎日すべての時間帯のバスに乗り、所要時間のデー
タを収集することは不可能であるので、その中の一部
を標本(サンプル)として選ぶ。
母集団
標本
× ×
×
× ×
× ×
× × ×
×
×
• 標本から得た母集団についての情報は、誤差を持っ
ている。
• たとえば、晴れた平日の夕方にバスに乗ってデータ
収集をおこなった場合、その人が運の悪い人で、信
号に何度もつかまり、所要時間がやたらとかかること
もありうる。 ⇒ 標本誤差
• 推測統計では、標本から得られる情報にもとに、確率
を用いて、誤差の大きさを評価し、母集団についての
情報を推論する。
推測統計の例 -視聴率ー
• ドラマやスポーツなどのテレビ番組の視聴率は、ビ
デオリサーチ社が調査している。
• 全国を各地区に分け、視聴率を調べているが、新聞
などで大きく取り上げられるのは、関東地区の結果
である。
• 関東地区の場合、約1580万世帯のうち、600世帯を
標本(サンプル)として選び調査している。
母集団(1580 万世帯)
標本(600 世帯)
× ×
×
× ×
× ×
× × ×
×
×
(例) World Baseball Classic 決勝(2006.3.21放送)
の視聴率は43.4%であった。
– テレビ局の論理
1580万世帯×0.434 = 686万世帯が視聴している。
視聴率が1%増えるということは、関東地区だけで
1580万世帯×0.01 = 15万世帯増加
全国では4700万世帯×0.01 = 47万世帯(その世帯に住
む人数を考えると約100万人の増加)
⇒ 標本誤差を考慮せず、標本から求めた視聴率が母集団
から求めた視聴率に等しいとしている。
– 統計学の論理
標本の600世帯×0.434 = 260世帯が視聴しているという
こと。
視聴率が1%増えるということは、600世帯×0.01 = 6世帯
がたまたまその番組を見ていたことである。
1%程度の視聴率は標本誤差によって変わる可能性があ
る。
• では、標本調査で43.4%という結果を得た場合、母
集団の視聴率はどの程度なのだろうか?
⇒ これに答えるのが統計的推定
• 視聴率40%以上の番組を作った場合、プロデュー
サーの査定に役立つ。本当に40%を超えたのだろう
か?
⇒ これに答えるのが統計的検定
※ 2003年10月に発覚した、視聴率操作事件をおこした日本テレビプロ
デューサーは、視聴率のわずかな差にこだわっていたが、統計学の立場
からすると、わずかな差にこだわるのはバカバカしい。
経済学と統計学
• 経済学を学ぶ場合、マクロ経済学やミクロ経済学な
どの経済理論を学ぶとともに、それらが現実経済と
一致するかを検証しなくてはならない。
一致?
経済理論
現実経済
• 現実経済の状態を把握するために、記述統計が用
いられる。
– 完全失業率を算出する
– 株価の動きをグラフ化する
– 所得税減税効果と、消費増大の関係について、回帰分析
をおこなう。
→ 所得税を○○%引き下げることによって、消費が
△△%増大する
• さらに、現状把握をもとに予測し、意思決定をおこな
うためには、推測統計が用いられる。
– 完全失業率は、これは日本全国15歳以上(1億人)から10
万人を標本として選んだ調査の結果である。この数値が
前月と比べて0.1%増えたところで、誤差の範囲内ではな
いだろうか?
– 所得税を○○%引き下げることによって、消費が△△%
増大することが回帰分析によってわかった。しかし、この
分析は標本にもとづいて分析されたものであり、実際には
± □% の誤差がある。
講義内容
第1章 記述統計の復習
第2章 確率と確率分布
第3章 統計的推定
第4章 統計的検定
第5章 回帰分析入門