2008年度 統計学講義内容 担当者 河田正樹 E-mail [email protected] このスライドの内容 • 統計学とはどのようなものか データの収集、分析をおこなう統計学は、学問として存在 しているばかりでなく、日常生活の中で無意識のうちにそ の考え方が用いられているものである。 • 経済学と統計学 経済学部という文系の学部で統計学という数学のような ものはあまり関係ないように思われるが、経済学を学ぶ 上で統計学は非常に重要なものであり、現実経済の把握 や将来の予測には統計学が必ず用いられる。 統計学とはどのようなものか • 日常生活において、われわれは不確実なことがらに さまざまな情報を用いて、予測し、意思決定をおこ なっている。 (例) 駅までバスでいくときには、 〇 通常の所要時間の情報 に加え 〇 曜日、季節、時間帯、天候などによる混雑度の情報 を用いて、所要時間を予測し、行動する。 • 通常の所要時間の情報、混雑度の情報をどのように 入手し、どのように利用しているのであろうか? – 普段からよく乗るバスであれば、大体の所要時間を記録 (多くの人は脳の中で)している。 – 平均所要時間と最大所要時間を大まかに計算している。 – さらに、曜日・時間帯・天候などで場合分けし、それぞれの 場合の平均所要時間と最大所要時間を大まかに計算して いる。 ⇒ 実は無意識のうちに「統計学的なものの考え方」 を用いている。 • 統計学とは、分析目的に対応してデータを収集し、分 析することによって、予測や意思決定のための材料 を提供する学問である。 統計学 分析目的 データの収集 分析 予測・ 意思決定 データを収集し、分析する統計学の立場には次の2 種類が考えられる。 • まず、得られたデータの特徴を何らかの数値(例えば 平均)や表・グラフにまとめたりすることが考えられる。 ⇒ 記述統計(または統計的記述)という。 • 次に、データの記述にもとづき、そのデータを生成し た集団や構造(これを母集団という)についての推論 をおこなうことが考えられる。 ⇒ 推測統計という。 毎日すべての時間帯のバスに乗り、所要時間のデー タを収集することは不可能であるので、その中の一部 を標本(サンプル)として選ぶ。 母集団(個体数N) × × 標本(個体数n) × × × × × × × × × × • 標本から得た母集団についての情報は、誤差を持っている。 • たとえば、晴れた平日の夕方にAさんとBさんがそれぞれ別の 日にバスに乗ってデータ収集をおこなう。 – Aさんは10回乗ったところ、目的地まで平均15分でついた。 – Bさんは運の悪い人で、乗ったバスが信号に何度もつかまり、10回乗っ たところ平均時間は20分であった。 ⇒ 選んだ標本(サンプル)から求めた平均所要時間には誤差 がある。 ⇒ 標本誤差の問題 • 推測統計では、標本から得られる情報にもとに、確率を用い て、誤差の大きさを評価し、母集団についての情報を推論す る。 推測統計の例 -視聴率- • ドラマやスポーツなどのテレビ番組の視聴率は、ビデオリ サーチ社が調査している。 • 全国を各地区に分け、視聴率を調べているが、新聞などで 大きく取り上げられるのは、関東地区の結果である。 • 関東地区の場合、約1580万世帯のうち、600世帯を標本(サ ンプル)として選び調査している。 母集団(1580万世帯) × × 標本(600世帯) × × × × × × × × × × (例) 名古屋国際女子マラソン(2008.3.9放送)の視聴 率は25.7%であった。 – テレビ局の論理 1580万世帯×0.257 = 406万世帯が視聴している。 視聴率が1%増えるということは、関東地区だけで 1580万世帯×0.01 = 15万世帯増加 全国では4700万世帯×0.01 = 47万世帯(その世帯に住 む人数を考えると約100万人の増加) ⇒ 標本誤差を考慮せず、標本から求めた視聴率が母集団 から求めた視聴率に等しいとしている。 – 統計学の論理 標本の600世帯×0.257 = 154世帯が視聴しているという こと。 視聴率が1%増えるということは、600世帯×0.01 = 6世帯 がたまたまその番組を見ていたことである。 1%程度の視聴率は標本誤差によって変わる可能性があ る。 • では、標本調査で25.7%という結果を得た場合、母 集団の視聴率はどの程度なのだろうか? ⇒ これに答えるのが統計的推定 • 視聴率25%以上の番組を作った場合、プロデュー サーの査定にプラスになるという内規があったとす る。しかし、この番組は本当に25%を超えたのだろう か? ⇒ これに答えるのが統計的検定 ※ 2003年10月に発覚した、視聴率操作事件をおこした日本テレビプロ デューサーは、視聴率のわずかな差にこだわっていたが、統計学の立場 からすると、わずかな差にこだわるのはバカバカしい。 経済学と統計学 • 経済学を学ぶ場合、マクロ経済学やミクロ経済学な どの経済理論を学ぶとともに、それらが現実経済と 一致するかを検証しなくてはならない。 一致? 経済理論 現実経済 • 現実経済の状態を把握するために、記述統計が用 いられる。 – 完全失業率を算出する – 株価の動きをグラフ化する – 所得税減税効果と、消費増大の関係について、回帰分析 をおこなう。 → 所得税を○○%引き下げることによって、消費が △△%増大する • さらに、現状把握をもとに予測し、意思決定をおこな うためには、推測統計が用いられる。 – 完全失業率は、これは日本全国15歳以上(1億人)から10 万人を標本として選んだ調査の結果である。この数値が 前月と比べて0.1%増えたところで、誤差の範囲内ではな いだろうか? – 所得税を○○%引き下げることによって、消費が△△% 増大することが回帰分析によってわかった。しかし、この 分析は標本にもとづいて分析されたものであり、実際には ± □% の誤差がある。 ⇒ 誤差をふまえたうえでの意思決定が必要 マーケティングと統計学 • マーケティングと統計学は密接な関係がある。 – コンビニなどのPOSシステムのデータは、天候、時間、年 齢、性別などによってどのような商品が売れるのかを解 析するために用いられている。 – 市場調査のためにアンケートをおこなう場合には、調査 対象者をどのぐらいの規模でどのようにして選ぶかなど には統計学の知識が必要不可欠である。(統計的推定に 含まれるサンプリング(標本抽出法)の話) スポーツと統計学 • スポーツの戦術、トレーニング方法などを科学的に 解明する場合、統計学の助けが必要となる。 – 野球の戦術において、打率、防御率などはどの選手をどのように起 用するか(打順、登板順など)に用いられるし、投手の配球を読む上 で統計学は非常に役に立つ。選手の起用に際して、メジャーリーグの アスレチックスを起源とするでは「セイバーメトリクス」という統計的分 析手法が出てきており、OPS(On-base Plus Slugging)という出塁 率+長打率で求められる指標が、得点との関連が高いことがいわれ ている。 – トレーニングの面では、2つのトレーニング方法があった場合、どちら がより効果的なトレーニング方法であるかなどは、統計的検定によっ て検証される。 講義内容 第1章 記述統計の復習 第2章 確率と確率分布 第3章 統計的推定 第4章 統計的検定 第5章 回帰分析入門
© Copyright 2024 ExpyDoc