統計で富山を知る ―情報システムの進化・普及と 統計の活用― 2013年8月1日 富山国際大学 教授 浜松誠二 Ⅰ.統計処理を巡る話題 ―我々の知識には根拠がなかった― 1.最強の学問―統計ブーム― • 「統計学が最強の学問である」 西内啓著 ダイヤモンド社 2013年 EBM(Evidence-Based Medicine) 科学的根拠に基づく医療 (前史) • イグナッツ・ゼンメルワイスの発見(1840) 産院での女性の死亡率 12%⇒2% 手を洗うことの励行で産褥熱感染の回避 EBM宣言 ゴードン・ガイヤット、デヴィト・サケット (1992) • 治療法の選択は、最高の根拠に基づくべきで、 最高の根拠とはできれば統計からくるべきだ。 「10万人の命」宣言 • ドン・バーウック (2004) • 回避可能な死の防止のために 6つの変化の導入 肺感染、静脈感染の防止など 治療方法の確認 ⇒ 根拠のある治療 • 分析が可能に カルテの電子化と共有 事実の発見 • 海外の様子が見えだす(日本) 共有化、国際化、日本へも情報 日本での医療を巡る話題 • がん検診の評価 • メタボの評価 • サプリメントの評価 H.G.ウェールズ • 「統計学的思考が読み書きと同じように良 き社会人としての必須の能力になる日がく る。」 (1903年) H.ヴァリン Google チーフエコノミスト • 「これから10年もっともセクシーな職業は 統計家である。 」(2009年) データサイエンティストの時代 • 情報通信白書 将来的に25万人不足 2.統計処理の変化 ─情報技術の深化の中で─ (1) 統計学 • A.ケトレー (近代統計学の父) 社会事象の正規分布 • ナイチンゲール 戦場での死因(統計の有効活用) • 19c末~20c初 F.ゴールトン 指紋の発見者 生物測定研究所 生物学に数学的厳密さを 回帰 平均への回帰 親子の身長 相関 計測の尺度 K.ピアソン 進化論の追跡 『科学概論』1880s 決定論的見方に追加すべきものを認識 フィッシャー 実験計画 ロザムステッド農事試験場のデータ解析 W.ゴセット ステュデントのt検定 標本調査と統計学 マスコミの隆盛 新聞社の模擬投票 20cに入って盛んに 世論調査社の設立 アメリカ大統領選挙 ギャッラップの大成功(1936)と大失敗(1948) センサス局等の活動 標本調査の価値 → 標本調査の理論 統計学の実践 • 数表活用 ↓ • Excelでの計算 • 解析的解法 ↓ • シミュレーション等による解法 (2) 日常的統計処理 • データの入手 普段の活動で蓄積 インターネットでの提供 • データの加工 Excelで簡便に 多様な表現 • 成果の発信 ○ 統計体系の再構築(日本) • 統計法 改正2007年 全面施行 2009年 基幹統計 国民経済計算、国勢調査、・・・ 経済センサス 2009年7月1日実施 政府統計の総合窓口 • 体系的整理 インターネット経由での入手 データベースシステム ○ 世界の統計 • 各国の統計システム • 国際機関の統計 無料化 データの加工 • Excelによる統計表の整理、 検定 χ2検定 • Excelによるグラフの作成 散布図で多様なグラフのテンプレート (3) 体系的検証 勘による対応から根拠のある対応へ (Evidence-Based) • 年毎の新たなワインの質 (オーリー・アッシェンフェルター) =12.145+0.00117×冬の降雨 +0.00614×育成期平均気温 -0.00386×収穫期降雨 • 貢献出走塁 (ビル・ジェイムズ) =(ヒット数+四球) ×総塁数 ÷(死球以外の打席数+四球数) • 自動販売機で新たな需要発見 • GPS等で建設機械の稼働状況を把握 • ツイッター情報から風邪の流行を予測 • リポーターの情報を集約から ゲリラ雷雨の予測 (4) 仮説の構築 • データの蓄積 • 相関から意味の発見 • ビッグデータ Volume 大量 Variety 多様 Velocity 高速 取引情報 ビッグデータの争奪 ・インターネットの利用がそのままデータに 位置情報、検索情報、交信情報、・・・ グーグル アップル フェースブック アマゾン ・・・ (5) 人工知能 (AI Ⅲ) • • • • 翻訳 チェス 自動車の自動運転 ・・・・・ 3.知識の根拠は脆弱 • 【知識についての考え方】 (1)我々の知識の根拠 ほとんど全てが ・権威(先生・マスコミ)からもらったもの ・生活体験からつかんだもの 多くは従っておいてよい 真実を知ろうとしたときは 一歩、抜け出ることが必要 (2) 正しい知識を持っているか ①都合のよい判断 • ベンジャミン・フランクリン • 酸っぱいブドウ B.フランクリンの格言 • 理性のある動物、人間とは、まことに都合 のいいものである。したいと思うことなら、何 にだって理由を見つけることも、理窟をつける こともできるのだから。 無意識のフィルター • 脳科学の発展 • 多様な実験 権威に従う 先入観で判断する 記憶も歪む 原子力村 • 仲間内で集まってもだめ 公共事業の暴走 下水道、ダム、道路、砂防、・・・ • 審議会も機能せず 誰を委員とするか • 社外役員の重要性 ②無反省な弁明 • 富山の特徴に関する多様な言説があるが根 拠に乏しい。 • 日常的認識での誤りが多い。 ③ヒューリスティクな判断 • 「人間は生きていくために物事を適当に判断 するようにできている」 • 錯覚は人にとって必要 ヒューリスティクな誤りの類型 • • • • • • • ベースレートの誤信 乳がん検診陽性でのがんの確率 ギャンブラーの誤信 失敗続きの後は 利用可能性への過度の依存 私の知人はこうであった 因果関係の存在への期待 ハリネズミの失敗 アンカリングの習性 先入観の囚われ 後知恵の追加 自らの正当化のみ 大量情報処理の恣意的整理 8以上の序列化は無理 このため、正しい判断には工夫が必要 ⇒知性は理性的でない こう考えると いろいろな課題を謙虚に考え 真実を得るための努力を 意識的に行うことができる 4. 真実を得るための仕掛け • 積極的に仕掛けを構築する必要がある (1) 調査研究の手法 • • • • • • • • • 統計二次分析 実験 調査票調査 インタビュー調査 参与観察 踏査 ドキュメント分析 (比較研究) (既存研究調査) 調査の広がり (2) 統計的調査/事例的調査 事例的調査 • 網羅的情報収集 一定のやり方で見た情報・聞いた情報は 全て記録する • 全ての情報での仮説構築 集まった情報は勝手に破棄しない 統計的調査 • 確実な統計的手続き • 仮説の検証 (いつまでも仮説を逃れられない) • 相関があっても因果関係とはいえない (因果関係を説明する数学的方法論はない) 事例/定性 統計/定量 代表性に懸念 サンプリング、回収率 調査対象に影響 調査対象への影響を回避 直接意識を聴く・触れる Wording等の不確かさ 因果を体験、直に聴く・触れる 豊かな内容 推論の不確実性 限定された情報 回答の信頼性 検討困難 (信頼できるインフォーマントの獲得) 非回答者の偏向 仮説生成が可能 仮説検証が主体 グラウンディド・セオリー 厚い記述 数値的解析 洗練された理論への昇華 時間的・精神的負担 (参与観察が典型) 金銭的負担 ○ ビッグテータと調査の変化 • 多種多様な変数の膨大な標本データが入手できるよ うになった。 ↓ • 事例的調査・統計的調査の手順に拘束されなくなった。 • 統計的調査で直接仮説構築が可能になり同時に検 証もできるようになった。 • 事例的調査の不確かさが乗り越えられるようになった。 Ⅱ.統計処理の実践 ○ 表グラフを読む力 • 表・グラフになじむことが大切 ○資料がなかったとは言わない ―情報システムで容易に入手、分析― ◎地域を知ろう ―富山の常識・非常識― 【富山の話題】 舞台・産業・生活・郷土 【グラフの技法】 1.富山の舞台 地 図 ○ 富山の自然は豊かか フリーソフト MAPWIN ○ 富山県の火災発生率はなぜ低いか 相 関 分 析 ク リ モ グ ラ フ ○地球温暖化 国際データ スカイライングラフ 原単位と総量 横棒グラフの調整 ○人口 多 重 折 れ 線 グ ラ フ 2.富山の産業 三角グラフ ○産業構造と職業 ブロックグラフ ○ 農業県か スカイライングラフ 特化度 フローチャート VISIO ○ 景 気 動 向 ○産業構造の変化 スカイライングラフ 変化寄与度 3.富山の生活 ○ 生地での居住・大きな家族 ○ 富山の家計所得はなぜ高いか スカイライングラフ 全体との比較 ○助け合いの気風 ○ 高 齢 者 は 地 域 資 源 ○ 和 を 乱 さ な い ○苦手な新しいコミュニティ形成 4.富山の郷土(土地・基盤施設) ○土地利用制度の柔軟な運用 地図データ ○都市の非形成 ○充実した基盤施設 散布図と階層区分 御清聴 有り難うございました
© Copyright 2024 ExpyDoc