スライド 1 - 富山国際大学 | ホーム

統計で富山を知る
―情報システムの進化・普及と
統計の活用―
2013年8月1日
富山国際大学
教授 浜松誠二
Ⅰ.統計処理を巡る話題
―我々の知識には根拠がなかった―
1.最強の学問―統計ブーム―
• 「統計学が最強の学問である」
西内啓著 ダイヤモンド社 2013年
EBM(Evidence-Based Medicine)
科学的根拠に基づく医療
(前史)
• イグナッツ・ゼンメルワイスの発見(1840)
産院での女性の死亡率
12%⇒2%
手を洗うことの励行で産褥熱感染の回避
EBM宣言
ゴードン・ガイヤット、デヴィト・サケット
(1992)
• 治療法の選択は、最高の根拠に基づくべきで、
最高の根拠とはできれば統計からくるべきだ。
「10万人の命」宣言
• ドン・バーウック (2004)
• 回避可能な死の防止のために
6つの変化の導入
肺感染、静脈感染の防止など
治療方法の確認 ⇒ 根拠のある治療
• 分析が可能に
カルテの電子化と共有
事実の発見
• 海外の様子が見えだす(日本)
共有化、国際化、日本へも情報
日本での医療を巡る話題
• がん検診の評価
• メタボの評価
• サプリメントの評価
H.G.ウェールズ
• 「統計学的思考が読み書きと同じように良
き社会人としての必須の能力になる日がく
る。」 (1903年)
H.ヴァリン
Google チーフエコノミスト
• 「これから10年もっともセクシーな職業は
統計家である。 」(2009年)
データサイエンティストの時代
• 情報通信白書
将来的に25万人不足
2.統計処理の変化
─情報技術の深化の中で─
(1) 統計学
• A.ケトレー (近代統計学の父)
社会事象の正規分布
• ナイチンゲール
戦場での死因(統計の有効活用)
• 19c末~20c初
F.ゴールトン 指紋の発見者
生物測定研究所 生物学に数学的厳密さを
回帰 平均への回帰 親子の身長
相関 計測の尺度
K.ピアソン
進化論の追跡 『科学概論』1880s
決定論的見方に追加すべきものを認識
フィッシャー
実験計画
ロザムステッド農事試験場のデータ解析
W.ゴセット
ステュデントのt検定
標本調査と統計学
マスコミの隆盛
新聞社の模擬投票 20cに入って盛んに
世論調査社の設立
アメリカ大統領選挙
ギャッラップの大成功(1936)と大失敗(1948)
センサス局等の活動 標本調査の価値
→ 標本調査の理論
統計学の実践
• 数表活用
↓
• Excelでの計算
• 解析的解法
↓
• シミュレーション等による解法
(2) 日常的統計処理
• データの入手
普段の活動で蓄積
インターネットでの提供
• データの加工
Excelで簡便に
多様な表現
• 成果の発信
○ 統計体系の再構築(日本)
• 統計法 改正2007年
全面施行 2009年
基幹統計
国民経済計算、国勢調査、・・・
経済センサス
2009年7月1日実施
政府統計の総合窓口
• 体系的整理
インターネット経由での入手
データベースシステム
○ 世界の統計
• 各国の統計システム
• 国際機関の統計
無料化
データの加工
• Excelによる統計表の整理、
検定
χ2検定
• Excelによるグラフの作成
散布図で多様なグラフのテンプレート
(3) 体系的検証
勘による対応から根拠のある対応へ
(Evidence-Based)
• 年毎の新たなワインの質
(オーリー・アッシェンフェルター)
=12.145+0.00117×冬の降雨
+0.00614×育成期平均気温
-0.00386×収穫期降雨
• 貢献出走塁
(ビル・ジェイムズ)
=(ヒット数+四球)
×総塁数
÷(死球以外の打席数+四球数)
• 自動販売機で新たな需要発見
• GPS等で建設機械の稼働状況を把握
• ツイッター情報から風邪の流行を予測
• リポーターの情報を集約から
ゲリラ雷雨の予測
(4) 仮説の構築
• データの蓄積
• 相関から意味の発見
• ビッグデータ
Volume 大量
Variety 多様
Velocity 高速
取引情報
ビッグデータの争奪
・インターネットの利用がそのままデータに
位置情報、検索情報、交信情報、・・・
グーグル
アップル
フェースブック
アマゾン
・・・
(5) 人工知能 (AI Ⅲ)
•
•
•
•
翻訳
チェス
自動車の自動運転
・・・・・
3.知識の根拠は脆弱
• 【知識についての考え方】
(1)我々の知識の根拠
ほとんど全てが
・権威(先生・マスコミ)からもらったもの
・生活体験からつかんだもの
多くは従っておいてよい
真実を知ろうとしたときは
一歩、抜け出ることが必要
(2) 正しい知識を持っているか
①都合のよい判断
• ベンジャミン・フランクリン
• 酸っぱいブドウ
B.フランクリンの格言
•
理性のある動物、人間とは、まことに都合
のいいものである。したいと思うことなら、何
にだって理由を見つけることも、理窟をつける
こともできるのだから。
無意識のフィルター
• 脳科学の発展
• 多様な実験
権威に従う
先入観で判断する
記憶も歪む
原子力村
• 仲間内で集まってもだめ
公共事業の暴走
下水道、ダム、道路、砂防、・・・
• 審議会も機能せず
誰を委員とするか
• 社外役員の重要性
②無反省な弁明
• 富山の特徴に関する多様な言説があるが根
拠に乏しい。
• 日常的認識での誤りが多い。
③ヒューリスティクな判断
• 「人間は生きていくために物事を適当に判断
するようにできている」
• 錯覚は人にとって必要
ヒューリスティクな誤りの類型
•
•
•
•
•
•
•
ベースレートの誤信 乳がん検診陽性でのがんの確率
ギャンブラーの誤信 失敗続きの後は
利用可能性への過度の依存 私の知人はこうであった
因果関係の存在への期待 ハリネズミの失敗
アンカリングの習性 先入観の囚われ
後知恵の追加 自らの正当化のみ
大量情報処理の恣意的整理 8以上の序列化は無理
このため、正しい判断には工夫が必要
⇒知性は理性的でない
こう考えると
いろいろな課題を謙虚に考え
真実を得るための努力を
意識的に行うことができる
4. 真実を得るための仕掛け
• 積極的に仕掛けを構築する必要がある
(1) 調査研究の手法
•
•
•
•
•
•
•
•
•
統計二次分析
実験
調査票調査
インタビュー調査
参与観察
踏査
ドキュメント分析
(比較研究)
(既存研究調査)
調査の広がり
(2) 統計的調査/事例的調査
事例的調査
• 網羅的情報収集
一定のやり方で見た情報・聞いた情報は
全て記録する
• 全ての情報での仮説構築
集まった情報は勝手に破棄しない
統計的調査
• 確実な統計的手続き
• 仮説の検証
(いつまでも仮説を逃れられない)
• 相関があっても因果関係とはいえない
(因果関係を説明する数学的方法論はない)
事例/定性
統計/定量
代表性に懸念
サンプリング、回収率
調査対象に影響
調査対象への影響を回避
直接意識を聴く・触れる
Wording等の不確かさ
因果を体験、直に聴く・触れる
豊かな内容
推論の不確実性
限定された情報
回答の信頼性
検討困難
(信頼できるインフォーマントの獲得) 非回答者の偏向
仮説生成が可能
仮説検証が主体
グラウンディド・セオリー
厚い記述
数値的解析
洗練された理論への昇華
時間的・精神的負担
(参与観察が典型)
金銭的負担
○ ビッグテータと調査の変化
• 多種多様な変数の膨大な標本データが入手できるよ
うになった。
↓
• 事例的調査・統計的調査の手順に拘束されなくなった。
• 統計的調査で直接仮説構築が可能になり同時に検
証もできるようになった。
• 事例的調査の不確かさが乗り越えられるようになった。
Ⅱ.統計処理の実践
○ 表グラフを読む力
• 表・グラフになじむことが大切
○資料がなかったとは言わない
―情報システムで容易に入手、分析―
◎地域を知ろう
―富山の常識・非常識―
【富山の話題】
舞台・産業・生活・郷土
【グラフの技法】
1.富山の舞台
地
図
○ 富山の自然は豊かか
フリーソフト
MAPWIN
○ 富山県の火災発生率はなぜ低いか
相
関
分
析
ク
リ
モ
グ
ラ
フ
○地球温暖化
国際データ
スカイライングラフ
原単位と総量
横棒グラフの調整
○人口
多
重
折
れ
線
グ
ラ
フ
2.富山の産業
三角グラフ
○産業構造と職業
ブロックグラフ
○ 農業県か
スカイライングラフ 特化度
フローチャート VISIO
○
景
気
動
向
○産業構造の変化
スカイライングラフ 変化寄与度
3.富山の生活
○ 生地での居住・大きな家族
○ 富山の家計所得はなぜ高いか
スカイライングラフ 全体との比較
○助け合いの気風
○
高
齢
者
は
地
域
資
源
○
和
を
乱
さ
な
い
○苦手な新しいコミュニティ形成
4.富山の郷土(土地・基盤施設)
○土地利用制度の柔軟な運用
地図データ
○都市の非形成
○充実した基盤施設
散布図と階層区分
御清聴
有り難うございました