Ê¿À®27ǯÅÙÅý·×ÆþÌç£É(1)

平成 27 年度統計入門I (1)
初回ガイダンス
− 統計学とは −
原 尚幸
.
.
新潟大・経済
http://www.econ.niigata-u.ac.jp/˜hara/stat1/
[email protected]
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
1 / 25
基本情報
開講時限:第 1 学期・火曜日 4 限
教室 :E160 (ここです )
担当教員:原 尚幸 (経済学部経済学科)
居室 :人社系棟 (この建物)・5 階 C548 室
E-mail : [email protected]
オフィスアワー : 月曜日 3 限 (事前にメールで連絡)
講義のウェブサイト
http://www.econ.niigata-u.ac.jp/˜hara/stat1
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
2 / 25
この講義の扱い
入学年度によりこの科目の扱いが若干異なるので注意すること
平成 24 年度入学者:
『統計入門 I (学部共通専門基礎科目) 』
平成 20∼23 年度入学者:
『統計入門 I (自由選択科目) 』
平成 19 年度以前入学者:
『統計入門 (経済学科専門基礎科目) 』
冬学期の「統計入門 II」とあわせて通年 4 単位
必ず第 1 学期に履修登録をすること
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
3 / 25
この講義の扱い
入学年度によりこの科目の扱いが若干異なるので注意すること
平成 24 年度入学者:
『統計入門 I (学部共通専門基礎科目) 』
平成 20∼23 年度入学者:
『統計入門 I (自由選択科目) 』
平成 19 年度以前入学者:
『統計入門 (経済学科専門基礎科目) 』
冬学期の「統計入門 II」とあわせて通年 4 単位
必ず第 1 学期に履修登録をすること
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
3 / 25
この講義の扱い
入学年度によりこの科目の扱いが若干異なるので注意すること
平成 24 年度入学者:
『統計入門 I (学部共通専門基礎科目) 』
平成 20∼23 年度入学者:
『統計入門 I (自由選択科目) 』
平成 19 年度以前入学者:
『統計入門 (経済学科専門基礎科目) 』
冬学期の「統計入門 II」とあわせて通年 4 単位
必ず第 1 学期に履修登録をすること
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
3 / 25
統計学とは・
・
・
統計学
平たく言うと・
・
・
データ解析の科学
.
もう少し 詳し く言うと
データから有益な情報を定量化して引き出すための方法論的科学
[例]
国別の所得のデータから所得格差の現状を調べる
日経平均株価の値動きから景気の動向を調べる
.
学歴と所得の関係を調べる
クラスの大きさと教育効果の関係を調べる
電力需要と発電能力のデータから原発の要否の考察をする
POS データから顧客の商品の購買パターンを調べる
etc
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
4 / 25
統計学の分類
1
標本調査・実験計画
データを収集するための調査や実験の方法
2
記述統計
収集されたデータを見やすく整理したり, データの規則性を
見つけだす方法
3
推測統計
限られたデータから背後にある法則やデータ発生メカニズムを
推論する方法
4
確率論
統計的推測の数学的基礎
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
5 / 25
統計学 = データの科学
さまざまなデータ
天候データ
降水確率, 気温 etc
金融データ
日経平均, 国債価格 etc
景気指標
失業率, 有効求人倍率 etc
GDP
政党支持率・内閣支持率
地震のデータ
放射線量のデータ
模擬試験の成績のデータ
・
・
・
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
6 / 25
各国の一人あたり GDP
世界 173ヶ国の 2009 年名目一人あたり GDP(US dollar)
出典:World Bank data の Web site
http://data.worldbank.org
データ自体はただの数字の羅列
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
7 / 25
記述統計
記述統計
データが持っている全体の分布, 傾向, 特徴など有益な情報を
見やすく整理すること
データの縮約という言い方もする
.
記述統計の例
グラフに可視化
データの分類
データのソート
度数分布表やヒストグラムの作成
平均や分散などの特徴量の計算
H. Hara (Niigata U.)
初回ガイダンス
.
Apr 14, 2015
8 / 25
各国の一人あたり GDP
日本は何位?
最大の国は?
ルクセンブルク (108,332 ド ル )
最小の国は?
93 位
ブルンジ (181 ド ル )
平均は?
上位 10ヶ国は?
1
2
3
4
5
6
7
8
9
10
11,298 ド ル
ルクセンブルク
ノルウェー
カタール
スイス
アラブ首長国連邦
デンマーク
オースト ラリア
スウェーデン
アメリカ
オランダ
H. Hara (Niigata U.)
16 位 (42,820 ド ル )
中国は何位? (4,382 ド ル )
30,000 ド ル以上の国数
27ヶ国
5,000 ド ル以下の国数
93ヶ国
1,000 ド ル以下の国数
37ヶ国
初回ガイダンス
Apr 14, 2015
9 / 25
40
30
frequencies
20
10
度数
33
60
28
29
18
4
1
0
階級 (ド ル )
100 ∼ 1000
1000 ∼ 5000
5000 ∼ 10000
10000 ∼ 30000
30000 ∼ 50000
50000 ∼ 100000
100000 ∼ 150000
50
60
度数分布表とヒストグラム
500
3000
7500
20000
40000
75000
125000
US dollar
所得格差が大きいことがうかがえる
このようなデータの散らばり具合のことを分布と呼ぶ
記述統計 ⇔ データの分布に関する情報の整理
統計学 ⇔ データの分布に関する情報の抽出
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
10 / 25
推測統計
母集団:興味ある対象の全体
世界の所得の例:母集団は世界の国全体
国勢調査:国民全体
統計学 ⇔ データの母集団の分布に関する情報の抽出
母集団全体のデータを取ることは一般には困難
例 1 家計調査
例 2 テレビの視聴率調査
母集団 = 家計全体
すべての世帯で調査を行うことはコスト 的にも困難
⇓
母集団の一部を抽出
抽出されたものを標本と呼ぶ
標本から母集団分布を推測
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
11 / 25
推測統計
推測統計
.
母集団から抽出された標本を用いて母集団分布を推測すること
.
これに対して, 記述統計は母集団すべてのデータが得られている
状況という考え方もできる
統計的推測には確率論という数学を用いる
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
12 / 25
統計学の分類
1
記述統計 (統計入門 I・第 1 学期)
収集されたデータを見やすく整理したり, データの規則性を
見つけだす方法
2
推測統計 (統計入門 II・第 2 学期)
限られたデータから背後にある法則やデータ発生メカニズムを
推論する方法
3
確率論 (統計入門 I・第 1 学期)
統計的推測の数学的基礎
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
13 / 25
統計科学の位置付け
統計学はあらゆる学問分野と境界をなす横断的な学問分野
学問分野間・知の統合のキープレ イヤー
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
14 / 25
21 世紀社会からの要請
20 世紀社会
不特定多数への大量生産・大量消費を目指した
成長指向の社会
⇓
学問分野・産業の細分化
細分化された各分野で合理的な利益の追求
⇓
地球環境問題
⇓
細分化された各分野の知を統合して, 地球全体にとって
合理的な行動とは何かを考え直す必要が出てきた
横断分野である統計学の役割は大きい
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
15 / 25
21 世紀社会からの要請
リスク:将来の不確実性
近年はリスクの概念が多様化
金融資産価格の変動
天候・自然災害 etc
リスクの定量化・リスク管理にも統計学は用いられる
東日本大震災∼原発事故
1000 年に一度というのは確率ゼロでない
原発事故は今に至るまで社会の大きな不安定要因
今後のエネルギー政策はどうしたらいいのか?
短期的に原発は必要なのか?
社会が困難な選択にせまられた時こそ,それぞれの選択肢を
定量的に評価し , 的確な判断が下せるような基盤を与えること
が,統計学の使命である
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
16 / 25
情報化社会における統計学をとりまく環境
情報化社会の発展・深化に伴い
データ環境やデータ処理能力に
劇的な変化
データの大規模化
GB∼TB∼PB
データへのアクセシビリティの
飛躍的向上
ワンクリックで世界中の情報
にアクセス可能
コンピュータの性能の向上
パソコン∼スパコン
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
17 / 25
情報化社会における統計学をとりまく環境
情報化社会の発展・深化に伴い
データ環境やデータ処理能力に
劇的な変化
データの大規模化
GB∼TB∼PB
データへのアクセシビリティの
飛躍的向上
ワンクリックで世界中の情報
にアクセス可能
コンピュータの性能の向上
パソコン∼スパコン
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
17 / 25
ビッグデータ時代
「ビッグデータ」
汎用パソコンでは処理できないような大規模データ
2012 年, オバマ政権がビッグデータを用いた政治・経済分析の研究
支援を表明
それ以降, 「ビッグデータ時代の到来」と言われている
ビッグデータからの情報抽出技術の研究開発が劇的に進歩
データサイエンティスト は最も脚光を浴びている職種のひとつ
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
18 / 25
本講義の目標
経済学・ファイナンス・経営学への応用を特に意識しながら ,
さらに 21 世紀社会の統計学への展開をも視野に入れて,
古典的な統計学を学習する
政府統計などのデータに親しむ
データを Excel などを用いて自分の素手で解析できるようにする
統計学固有の概念に親しむ
最低限の数学的背景を理解する
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
19 / 25
講義の内容
ガイダンス
記述統計
度数分布・ヒストグラム
分布の特性値
ローレンツ曲線・ジニ係数
基礎確率論
標本空間・事象
確率の性質
確率分布
分布の独立性・独立同一分布
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
20 / 25
講義の特色
やや数学的。しかも後半の確率論はやや抽象的。
統計学の場合はこの点はある程度あきらめてください
確率論はゲーム理論などの経済理論でも用いられているように,
現代経済理論を理解する上での基本的概念のひとつである
最終的には実践派を目指したい
Excel を用いたデータ解析の基礎的な話も取り入れたい
「理屈はよくわからないけど , 見よう見まねでデータを素手でいじっ
てみようという」気持ちも統計学をものにする上では非常に大事
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
21 / 25
お願い
「統計入門 I」は第 2 学期の「統計入門 II」と 1 セット
「統計入門 I」の学習内容は , 統計学を学習するための
準備という意味合いが強い
統計学の醍醐味はむし ろ「統計入門 II」で学習する
「統計入門 II」+「計量経済学」と学習をすすめると ,
統計解析に関しては学部レベルでは十分な知識が身につく
ですので , 第 2 学期の「統計入門 II」も履修して下さい
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
22 / 25
教科書
『入門統計解析』
倉田博史・星野崇宏 著
新世社, 2009 年, 本体 2,500 円
スタンダード な統計理論の入門書
文系の学生にも読みやすい良い本だと思う
講義は基本的には教科書に沿って行う
統計入門 I では , 1∼5 章まで目標とする
冬学期の統計入門 II でそれ以降を扱う
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
23 / 25
参考書
『統計学 (第 2 版) 』
田中勝人 著
新世社, 2009 年, 本体 1,900 円
社会科学系学生向けに書かれた
読みやすい本
倉田・星野より若干数学的
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
24 / 25
参考書
『 Excel による統計入門』
【 Excel2007 対応版】
縄田和満 著
朝倉書店, 2007 年, 本体 2,800 円
Excel を用いた実践的な統計解析の解説書
Excel の基本的な操作法も講義内で扱う
(予定)
H. Hara (Niigata U.)
初回ガイダンス
Apr 14, 2015
25 / 25