統計分析/統計基礎理論 ガイダンス資料 - 京都大学

統計分析 ガイダンス:統計学とは何か?
「データ」を使って

統計分析/
統計基礎理論

「国」を知る。「景気」を知る。 「会社」を知る。
「市場」を知る。 「顧客」を知る。「相手」を知る。。。
⇒知るためには「測る」必要がある
ものごとを数字でとらえる=測る(測定)
身長、体重
年間所得
 満足度、 好意度
:測りやすい
:測りやすい
:測るのが難しい

ガイダンス:統計学とは何か?


京都大学 経営管理大学院
松井啓之
例:データを使って「国」を知る
人口
国土面積
 GNP
 平均寿命
 犯罪件数…


大きな国
成長している国
安全な国
2
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
統計学(Statistics)とは(1)


統計 = STATISTICS
 STATE(=国)

統計学(Statistics)とは(2)
集団データの分析法に関する科学
 データから、本来の社会全体を再構成し、また仮説を検証
と同一語源
するための原理
 ある集団について知りたい。しかし、人間の把握力や処理
統計学(法)の意味
能力には限界がある
 データの収集
 平均や範囲といったデータの機能

 後に意思決定するための、データの数量化、分析、解釈の
技法

 それらの技法を創造し適用するための科学
※文脈によって、多様な使われ方


統計=「計って統べる(=一つにまとめる/支配する)」
3
集団の数値の特徴を一言で表現する「数値の要約・
記述」が必要
⇒記述統計
少しのデータだけ集めて、そこから
集団データの特徴を「推測」できないか ⇒推測統計
「推測」した数値が妥当であるかどうか、
(推計学)
「検定」によって統計学的に判断する
※統計学は、あくまでも科学的手続きに則り、価値判断を差し挟まない客観的
な特徴を表す分析結果を提示して、価値判断の材料を与えるだけ
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
統計学の2つの立場

記述統計と推測統計
記述統計
記述統計
 得られた全体のデータの特徴を数量化すること。

4
母集団
ある一つの集団から得られたデータの羅列を整理して、度数分布、
平均値、標準偏差、メジアン、範囲、パーセンタイルなどをもとめ、そ
の集団の持つ特性を論じる
推測統計
母集団
標本
⇒「データを要約する」

推測統計
 集団の一部(標本)のデータから集団全体の特徴や傾向を
明らかにする方法。

社会を構成する全要素の把握を直接することはできないので、サン
プリングによる標本調査が行われたり、いくつかの尺度で社会の断
面を切り取ったりして調査データを得る。そのデータから、本来の社
会全体を再構成し、また仮説を検証する
⇒「データを使って仮説を主張する」
5
母集団そのものを調べる
(要約/縮約)
母集団から抽出した
(された)標本により
母集団を推測する6
1
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
マネジメントにおける統計学

経済学における統計学/確率論
データが多い場面に利用する統計学:記述統計
⇒要約することで知見を得る
計量経済学

 経済学の理論に基づいて経済モデルを作成し、統計学の
方法によってその経済モデルの妥当性に関する実証分析
を行う学問。
 要約のための統計学は、元データを眺めるだけでは、あ
まりにも量が多く、何を語っているのか分からないときに/
かえって知見を得にくい場合に、貴重な少数意見が失わ
れかねないリスクを踏まえた上で、大枠を掴む。


データが少ない場合に利用する統計学:推測統計
⇒一部のデータでものを言う(主張する)
 現代ポートフォリオ理論←リスク理論

 一部のデータで断言できないならば、答えを確定した値で

一部のデータで主張すれば、当然外れる場合がある
⇒外れる可能性の大きさを事前に示しておく
外れる度合いの計算に確率の考え方が必要
合理的な投資家が分散投資を行い、自身のポートフォリオを最適
化し、また、自身のリスク資産をどう価格設定するかを決める理論
 数理ファイナンス(デリバディブの価格理論)←確率過程論
はなく、推定値として、幅を持たせて主張する

回帰モデルや時系列解析が代表的、最近ではベイジアンも利用
金融工学


7
証券市場の数理モデルを作り、その中で証券価格がいかに決定さ
れるかというメカニズムを研究する学問。証券価格は、ブラック
ショールズ方程式に代表されるように、ある確率微分方程式に従う
という定式化をするため、高度な確率論の知識が必要。
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
公共政策分野における統計学

統計学(Statistics)の学習範囲
社会や経済・企業などの様々な状況を知るために、
様々な「指標」を得るための統計調査が実施
⇒「指標」を比較することで、状況判断が可能に
不確実
性を取り
扱うため
の道具
 統計指標(人口、生産、家計、、、、)
 不平等、経済状況、企業価値、関連などを測る指標



人口動態統計、貿易統計、犯罪統計、金融統計など
総務省統計局 http://www.stat.go.jp/
政策立案・決定のための情報としての「世論調査」
9
統計分析 ガイダンス:統計学とは何か?
社会調査法
国勢調査
 記述統計学
 推測統計学(推計学)
推定、検定
品質管理
統計用ソフトウェア
R、SPSS、SASなど
金融工学
計量経済学
多変量解析
10
統計分析 ガイダンス:統計学とは何か?
講義予定
第1回(4/11)
第2回(4/18)
第3回(4/25)
第4回(5/9)
第5回(5/16)
第6回(5/23)
第7回(5/30)
第8回(6/6)
第9回(6/13)
第10回(6/20)
第11回(6/27)
第12回(7/4)
第13回(7/11)
第14回(7/18)
第15回(7/25)
 統計学史
 統計学の応用
業務統計(政府の業務統計)

統計学

法律(統計法)に基づき、被調査者の調査への協力が法的に義務
づけられている。
調査方法によって、全数調査と標本調査
意思決定論



確率論
調査統計(指定統計)

8
教科書・参考文献(1)
イントロダクション、記述統計(1):データの種類
記述統計(2) :データの整理
PCを利用した
演習補講を予定
記述統計(3) :データを測る
記述統計(4) :多変量データのまとめ・相関分析
平均の推定:サンプリングと正規分布確率
平均の仮説検定
確率と確率変数
確率分布(1):離散分布
確率分布(2):連続分布
PCを利用した
標本分布
演習補講を予定
推定・仮説検定
受講者に合わせた
応用を個別に扱う
実践的仮説検定(ビジネス向け)
確率過程の基礎(ファイナンス向け)
データ分析(公共政策向け)
11



基礎レベル(レベルⅠ)
①鳥居泰彦,『はじめての統計学』,日本経済新聞社,1994
②高橋信,トレンドプロ,『マンガでわかる統計学』,オーム社,2004
③Dawn Giffiths/黒川利明,木下哲也,黒川洋,黒川めぐみ,『Head First Statistics』,
オライリー・ジャパン,2009
④向後千春,冨永敦子,『統計学がわかる』,技術評論社,2007
⑤白砂堤津耶,『例題で学ぶ初歩からの統計学』,日本評論社,20092009
一般レベル(レベルⅡ):講義の水準
⑥白旗慎吾,『Minervaベイシック・エコノミックス 統計学』,ミネルヴァ書房,2008
⑦Amir D. Aczel,Jayavel Sounderpandian/鈴木一功,手嶋宣之,原田喜美枝,『ビジ
ネス統計学〈上〉』,ダイヤモンド社,2007
⑧大屋幸輔,『コア・テキスト統計学』,新世社,2003
⑨倉田博史・星野崇宏,『入門統計解析』,新世社/サイエンス社,2009
数理的な理解のため:基礎レベル
⑩馬場敬之,久池井茂,『スバラシク実力がつくと評判の確率統計キャンパス・ゼミ』,
マセマ出版,2003
⑪宮川公男,『基本統計学[第3版]』
⑫蓑谷千凰彦,『統計学入門』,東京図書,2004
⑬薩摩順吉,『確率・統計』,岩波書店,1989
12
⑭一石賢,『道具としての統計解析』,日本実業出版社,2004
2
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
教科書・参考文献(2)


講義受講に際しての注意(1)
統計学をより良く理解するため
⑮石井俊全,『まずはこの一冊から 意味が分かる統計学』,ベレ出版,2012
⑯永田靖,『統計的方法のしくみ―正しく理解するための30の急所 』,日科技連出版社,
1996
⑰宮川公男,『統計学でリスクと向き合うーあなたの数字の読み方は確かか[新版]』,
東洋経済新報社,2007
1)佐々木亮,『エクセルで政策評価―すごくよくわかる実践的統計分析マニュアル』,多
賀出版,2007
2)慶應SFCデータ分析教育グループ,『データ分析入門・第6版』,慶應義塾大学出版
会,2006
3)Daivid Salsburg/竹内恵行・熊谷悦生,『統計学を拓いた異才たち 経験則から科学
へ進展した一世紀』,日経ビジネス文庫,2010
4)Peter Bernstein/青山護,『リスク 神々への反逆』(上・下),日経ビジネス文庫,2001
1)、2)は公共政策の学生向け、3)は統計学の歴史、4)はファイナンスの学生向け
パソコンを利用した統計分析のために
⑱岸学,吉田裕明,『ツールとしての統計分析 Excelの基本からデータ入力・集計・分
析まで』,オーム社,2010
⑲山田剛史,杉澤武俊,村井潤一郎,『「R」によるやさしい統計学』,オーム社,2008
⑳小田利勝,『ウルトラ・ビギナーのためのSPSSによる統計解析入門』,プレアデス出 13
版,2007

各種連絡や講義の関連資料の紹介などは、基
本的にWebページで行います。
 http://www.phm.gsm.kyoto-u.ac.jp/

オフィスアワーは随時です。ただし、電子メール
などで事前にアポイントをとってください。
 講義終了時に声をかけてくだされば、日時の調整を行
います。

それ以外でも随時受け付けますが、その他、質
問などがある場合には、基本的に電子メールで
お願いします。
 [email protected]
14
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
講義受講に際しての注意(2)

講義受講に際しての注意(3)
講義資料について

 講義資料はWebページで事前に公開しますので、各自で
 課題の提出は、メールでの添付もしくはハンドアウト(大
用意してください。



学院掛レポート提出ボックス)とし、その違いにおいて一
切区別はしません。
 電子メールの場合、指定されたサブジェクト(件名)を付け、
[email protected]宛てに送ること
同時に、事前に予習をしておいてください。
都合により公開が遅れた場合には、教員側で用意します。
成績評価に関して
 講義時に課す課題レポート(60%)+最終試験(40%)

レポート提出に関して

補講に関して
本文テキストもしくは添付ファイルを利用すること。添付ファイル
の際は、利用ソフト名を記載すること。
 レポートの提出期限は、原則として1週間後の12時30分
 経営管理、公共政策に合わせた補講を予定(13~15回)
とします。講義時には一切受け取りません。
※レポートの剽窃に注意すること。もし複数人で相談してレ
ポートを作成したのであれば、その旨を必ず記載すること。
 データ分析の活用能力をつけるために、希望者を対象に
本講義の時間とは別にコンピュータを利用した演習を2回
程度(EXCEL中心の記述統計、SPSS/R中心の推測統
計)予定しています。PCの台数制約などがあるので注意 15

記載がない場合は対象となるレポートは全て剽窃と判断する。な
お、このルールは、統計分析のみ適応なので注意すること!
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
参考:統計学の源流(1)

参考:統計学の源流(2)
(ドイツ)国状学/国情学/国勢学(Staatskunde)

(イギリス)政治算術
 為政者の政策に役立たせることを目的とした国家基本
 イギリスの社会・経済の現状を専ら経験に基づいて、
制度(=国家顕著事項)の関する学問
 国家や社会の現状認識:各国の土地・人民・政体・憲
法・行政・政府などの比較
 17C、ぺティ(W.Petty)が命名、イギリスの社会・経済

16
数、重量、尺度を用いて数量的に実証
の現状を定量的に実証することを目指す。
 17C、グラント(J.Graunt)、多数の統計資料を観察、
スコラ哲学の影響⇒数量的認識に欠ける
分析(大数観察)することによって一定の規則性を発見、
「生命表」
 コンリング(H.Conling)が1660年に創始、
アッヘンウォール(G.Achenwall)が代表的論者

(フランス)古典的確率論
 不確実な現象の全体が持つ法則性
 英語のstatisticsは、ラテン語で国家を意味するstatus
 パスカルによる賭博の研究が始まり、ラプラスによる
を語源として18世紀半ばにドイツの哲学者アッヘン
ウォールが作った言葉の流用
集大成により古典的確率論が完成
17
 その後、ガウスによる誤差論や正規分布論
18
3
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
参考:近代統計学の成立
参考:(ドイツ)社会統計学
ケトレー(A.Quetelet)の統計学


前期ドイツ主義:マイヤー(G.v.Mayr)の統計学
 国情学/政治算術(=社会の現状認識)
 社会現象の歴史性や特殊性を重視し、自然現象との
+古典的確率論(大数法則)⇒一定の社会法則

違いを前提とする。そのうえで統計調査として社会集団
を対象とする全数調査を原則とし、そこで獲得された統
計資料に基づいて社会現象における特質や法則の解
明を目的とする。
自然認識の方法を社会認識の方法へ導入して統計理論の体系
化を図った⇒社会物理学
 正規分布の代表値としての平均(重心)に注目
⇒平均人:人間社会の要として社会現象の理解へ
統計学の成立


後期ドイツ主義:フランクフルト学派
 1834年、英国王立統計協会設立による「統計学」成立
において「人間に関係することがらで、数量で表現するこ
とが可能で、一般的な法則を導き出すのに十分なだけ積
み重ねられたもの」と定義
 (ドイツ)社会統計学
 (イギリス)数理統計学⇒現在の「推測統計」
 数理統計学の成果の導入


記述(数量的把握)と推計(確率的な法則性の把握)
社会科学的概念と社会現象(統計データ、計量)の関連
※ケトレー統計学の社会科学的側面を継承
19
20
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
参考:(イギリス)数理統計学(1)
参考:(イギリス)数理統計学(2)

遺伝学の数理的理論:ゴルトン(F.Galton)

統計的推測理論の確立:フィッシャー(R.Fisher)
 標本と母集団を区別し、標本値から標本分布を介して母
 進化論の数学的検証、(種の違いを原因とし生物の)統
集団を特徴付ける値を推測する方法論を確立
計的な変動の分析手法を確立、相関や回帰
 標本分布論、t分布やF分布、実験計画法など

近代統計学の数理的基礎:ピアソン(K.Pearson)

ネイマン・ピアソン理論:J.Neymann、E.Pearson
 ゴルトンの統計学を数学的に定式化、積率相関係数や
 フィシャーの有意性検定を再構築した仮説検定論、対立
モーメントやχ2適合度など
 大量(大標本)の記述=全体(母集団)の記述と想定

仮説の概念の導入して数学的定式化を図る
※ケトレー統計学の数理科学的側面を継承
小標本理論:ゴセット(W.Gosset、Student)

現代の統計へ:新しい統計学の登場
 平均値の検定を目的としたz分布、t分布
 統計的決定理論、
ベイズ統計(ベイジアンネットワーク)
 探索的データ解析←コンピュータの発達

統計的推測理論(推定、検定)の登場
 ファイナンス・金融工学←確率過程、べき分布、、、
21
統計分析 ガイダンス:統計学とは何か?
統計分析 ガイダンス:統計学とは何か?
参考:統計を学ぶ予備知識

22
参考:統計処理とコンピュータ
ギリシャ文字の読み方


大量のデータ処理/統計処理を行う上でコンピュータの利用は必
要不可欠、統計解析ソフトの習得は統計の本格利用に必須。
代表的な統計処理ソフト(経営管理で利用可能なもの)
EXCEL:「分析ツール」アドインで基本的な統計分析が可能だが、精度や
処理方法にかなり問題有り。本格的利用には難あり。
 SPSS(IBM SPSS Statistics):使いやすさ、解りやすさを追求した統計解
析ソフトのスタンダード。初級から中級。
 http://www.spss.co.jp/software/pasw/index.html
 Eviews:計量経済学データ分析ソフト。中級。
 http://www.lightstone.co.jp/eviews/index.htm
 R:フリーの強力な統計解析ソフト。様々な解析手法が多くのユーザーに
よって提供されている。おすすめ!


数学的知識の確認

(和)と(積)

指数関数(法則)(⇔対数関数(法則))

1次変換(線形変換)



微分、積分
23
http://www.okada.jp.org/RWiki/
STATA:データの分析、管理、グラフ化に必要なあらゆる種類の機能を
提供する統合型統計パッケージ。中級から上級。近々利用可。

http://www.lightstone.co.jp/stata/index.htm
24
4