平成 27 年度統計入門I (1) 初回ガイダンス − 統計学とは − 原 尚幸 . . 新潟大・経済 http://www.econ.niigata-u.ac.jp/˜hara/stat1/ [email protected] H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 1 / 25 基本情報 開講時限:第 1 学期・火曜日 4 限 教室 :E160 (ここです ) 担当教員:原 尚幸 (経済学部経済学科) 居室 :人社系棟 (この建物)・5 階 C548 室 E-mail : [email protected] オフィスアワー : 月曜日 3 限 (事前にメールで連絡) 講義のウェブサイト http://www.econ.niigata-u.ac.jp/˜hara/stat1 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 2 / 25 この講義の扱い 入学年度によりこの科目の扱いが若干異なるので注意すること 平成 24 年度入学者: 『統計入門 I (学部共通専門基礎科目) 』 平成 20∼23 年度入学者: 『統計入門 I (自由選択科目) 』 平成 19 年度以前入学者: 『統計入門 (経済学科専門基礎科目) 』 冬学期の「統計入門 II」とあわせて通年 4 単位 必ず第 1 学期に履修登録をすること H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 3 / 25 この講義の扱い 入学年度によりこの科目の扱いが若干異なるので注意すること 平成 24 年度入学者: 『統計入門 I (学部共通専門基礎科目) 』 平成 20∼23 年度入学者: 『統計入門 I (自由選択科目) 』 平成 19 年度以前入学者: 『統計入門 (経済学科専門基礎科目) 』 冬学期の「統計入門 II」とあわせて通年 4 単位 必ず第 1 学期に履修登録をすること H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 3 / 25 この講義の扱い 入学年度によりこの科目の扱いが若干異なるので注意すること 平成 24 年度入学者: 『統計入門 I (学部共通専門基礎科目) 』 平成 20∼23 年度入学者: 『統計入門 I (自由選択科目) 』 平成 19 年度以前入学者: 『統計入門 (経済学科専門基礎科目) 』 冬学期の「統計入門 II」とあわせて通年 4 単位 必ず第 1 学期に履修登録をすること H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 3 / 25 統計学とは・ ・ ・ 統計学 平たく言うと・ ・ ・ データ解析の科学 . もう少し 詳し く言うと データから有益な情報を定量化して引き出すための方法論的科学 [例] 国別の所得のデータから所得格差の現状を調べる 日経平均株価の値動きから景気の動向を調べる . 学歴と所得の関係を調べる クラスの大きさと教育効果の関係を調べる 電力需要と発電能力のデータから原発の要否の考察をする POS データから顧客の商品の購買パターンを調べる etc H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 4 / 25 統計学の分類 1 標本調査・実験計画 データを収集するための調査や実験の方法 2 記述統計 収集されたデータを見やすく整理したり, データの規則性を 見つけだす方法 3 推測統計 限られたデータから背後にある法則やデータ発生メカニズムを 推論する方法 4 確率論 統計的推測の数学的基礎 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 5 / 25 統計学 = データの科学 さまざまなデータ 天候データ 降水確率, 気温 etc 金融データ 日経平均, 国債価格 etc 景気指標 失業率, 有効求人倍率 etc GDP 政党支持率・内閣支持率 地震のデータ 放射線量のデータ 模擬試験の成績のデータ ・ ・ ・ H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 6 / 25 各国の一人あたり GDP 世界 173ヶ国の 2009 年名目一人あたり GDP(US dollar) 出典:World Bank data の Web site http://data.worldbank.org データ自体はただの数字の羅列 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 7 / 25 記述統計 記述統計 データが持っている全体の分布, 傾向, 特徴など有益な情報を 見やすく整理すること データの縮約という言い方もする . 記述統計の例 グラフに可視化 データの分類 データのソート 度数分布表やヒストグラムの作成 平均や分散などの特徴量の計算 H. Hara (Niigata U.) 初回ガイダンス . Apr 14, 2015 8 / 25 各国の一人あたり GDP 日本は何位? 最大の国は? ルクセンブルク (108,332 ド ル ) 最小の国は? 93 位 ブルンジ (181 ド ル ) 平均は? 上位 10ヶ国は? 1 2 3 4 5 6 7 8 9 10 11,298 ド ル ルクセンブルク ノルウェー カタール スイス アラブ首長国連邦 デンマーク オースト ラリア スウェーデン アメリカ オランダ H. Hara (Niigata U.) 16 位 (42,820 ド ル ) 中国は何位? (4,382 ド ル ) 30,000 ド ル以上の国数 27ヶ国 5,000 ド ル以下の国数 93ヶ国 1,000 ド ル以下の国数 37ヶ国 初回ガイダンス Apr 14, 2015 9 / 25 40 30 frequencies 20 10 度数 33 60 28 29 18 4 1 0 階級 (ド ル ) 100 ∼ 1000 1000 ∼ 5000 5000 ∼ 10000 10000 ∼ 30000 30000 ∼ 50000 50000 ∼ 100000 100000 ∼ 150000 50 60 度数分布表とヒストグラム 500 3000 7500 20000 40000 75000 125000 US dollar 所得格差が大きいことがうかがえる このようなデータの散らばり具合のことを分布と呼ぶ 記述統計 ⇔ データの分布に関する情報の整理 統計学 ⇔ データの分布に関する情報の抽出 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 10 / 25 推測統計 母集団:興味ある対象の全体 世界の所得の例:母集団は世界の国全体 国勢調査:国民全体 統計学 ⇔ データの母集団の分布に関する情報の抽出 母集団全体のデータを取ることは一般には困難 例 1 家計調査 例 2 テレビの視聴率調査 母集団 = 家計全体 すべての世帯で調査を行うことはコスト 的にも困難 ⇓ 母集団の一部を抽出 抽出されたものを標本と呼ぶ 標本から母集団分布を推測 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 11 / 25 推測統計 推測統計 . 母集団から抽出された標本を用いて母集団分布を推測すること . これに対して, 記述統計は母集団すべてのデータが得られている 状況という考え方もできる 統計的推測には確率論という数学を用いる H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 12 / 25 統計学の分類 1 記述統計 (統計入門 I・第 1 学期) 収集されたデータを見やすく整理したり, データの規則性を 見つけだす方法 2 推測統計 (統計入門 II・第 2 学期) 限られたデータから背後にある法則やデータ発生メカニズムを 推論する方法 3 確率論 (統計入門 I・第 1 学期) 統計的推測の数学的基礎 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 13 / 25 統計科学の位置付け 統計学はあらゆる学問分野と境界をなす横断的な学問分野 学問分野間・知の統合のキープレ イヤー H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 14 / 25 21 世紀社会からの要請 20 世紀社会 不特定多数への大量生産・大量消費を目指した 成長指向の社会 ⇓ 学問分野・産業の細分化 細分化された各分野で合理的な利益の追求 ⇓ 地球環境問題 ⇓ 細分化された各分野の知を統合して, 地球全体にとって 合理的な行動とは何かを考え直す必要が出てきた 横断分野である統計学の役割は大きい H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 15 / 25 21 世紀社会からの要請 リスク:将来の不確実性 近年はリスクの概念が多様化 金融資産価格の変動 天候・自然災害 etc リスクの定量化・リスク管理にも統計学は用いられる 東日本大震災∼原発事故 1000 年に一度というのは確率ゼロでない 原発事故は今に至るまで社会の大きな不安定要因 今後のエネルギー政策はどうしたらいいのか? 短期的に原発は必要なのか? 社会が困難な選択にせまられた時こそ,それぞれの選択肢を 定量的に評価し , 的確な判断が下せるような基盤を与えること が,統計学の使命である H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 16 / 25 情報化社会における統計学をとりまく環境 情報化社会の発展・深化に伴い データ環境やデータ処理能力に 劇的な変化 データの大規模化 GB∼TB∼PB データへのアクセシビリティの 飛躍的向上 ワンクリックで世界中の情報 にアクセス可能 コンピュータの性能の向上 パソコン∼スパコン H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 17 / 25 情報化社会における統計学をとりまく環境 情報化社会の発展・深化に伴い データ環境やデータ処理能力に 劇的な変化 データの大規模化 GB∼TB∼PB データへのアクセシビリティの 飛躍的向上 ワンクリックで世界中の情報 にアクセス可能 コンピュータの性能の向上 パソコン∼スパコン H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 17 / 25 ビッグデータ時代 「ビッグデータ」 汎用パソコンでは処理できないような大規模データ 2012 年, オバマ政権がビッグデータを用いた政治・経済分析の研究 支援を表明 それ以降, 「ビッグデータ時代の到来」と言われている ビッグデータからの情報抽出技術の研究開発が劇的に進歩 データサイエンティスト は最も脚光を浴びている職種のひとつ H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 18 / 25 本講義の目標 経済学・ファイナンス・経営学への応用を特に意識しながら , さらに 21 世紀社会の統計学への展開をも視野に入れて, 古典的な統計学を学習する 政府統計などのデータに親しむ データを Excel などを用いて自分の素手で解析できるようにする 統計学固有の概念に親しむ 最低限の数学的背景を理解する H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 19 / 25 講義の内容 ガイダンス 記述統計 度数分布・ヒストグラム 分布の特性値 ローレンツ曲線・ジニ係数 基礎確率論 標本空間・事象 確率の性質 確率分布 分布の独立性・独立同一分布 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 20 / 25 講義の特色 やや数学的。しかも後半の確率論はやや抽象的。 統計学の場合はこの点はある程度あきらめてください 確率論はゲーム理論などの経済理論でも用いられているように, 現代経済理論を理解する上での基本的概念のひとつである 最終的には実践派を目指したい Excel を用いたデータ解析の基礎的な話も取り入れたい 「理屈はよくわからないけど , 見よう見まねでデータを素手でいじっ てみようという」気持ちも統計学をものにする上では非常に大事 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 21 / 25 お願い 「統計入門 I」は第 2 学期の「統計入門 II」と 1 セット 「統計入門 I」の学習内容は , 統計学を学習するための 準備という意味合いが強い 統計学の醍醐味はむし ろ「統計入門 II」で学習する 「統計入門 II」+「計量経済学」と学習をすすめると , 統計解析に関しては学部レベルでは十分な知識が身につく ですので , 第 2 学期の「統計入門 II」も履修して下さい H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 22 / 25 教科書 『入門統計解析』 倉田博史・星野崇宏 著 新世社, 2009 年, 本体 2,500 円 スタンダード な統計理論の入門書 文系の学生にも読みやすい良い本だと思う 講義は基本的には教科書に沿って行う 統計入門 I では , 1∼5 章まで目標とする 冬学期の統計入門 II でそれ以降を扱う H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 23 / 25 参考書 『統計学 (第 2 版) 』 田中勝人 著 新世社, 2009 年, 本体 1,900 円 社会科学系学生向けに書かれた 読みやすい本 倉田・星野より若干数学的 H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 24 / 25 参考書 『 Excel による統計入門』 【 Excel2007 対応版】 縄田和満 著 朝倉書店, 2007 年, 本体 2,800 円 Excel を用いた実践的な統計解析の解説書 Excel の基本的な操作法も講義内で扱う (予定) H. Hara (Niigata U.) 初回ガイダンス Apr 14, 2015 25 / 25
© Copyright 2024 ExpyDoc