応用確率統計学(第3回) - STReP in IRIDeS and CNEAS

行動計量分析
Behavioral Analysis
•何のために,他人の行動を計量するか?
–人間行動の科学的理解
–うまい商売のため
•人間行動の将来予測
•比較的短期,実験でもよい
•特定の集団の行動だけでよい
–都市システムの計画・管理のため
•行動の奥に潜む評価構造
•長期将来的,代表性が求められる
1
(非集計)行動分析の役割
多くの一般の人が,将来とるであろう行動の予測
(トレンド予測,マクロな回帰式でも十分)
それぞれの特性を持つ人の考え方(評価)の理解
(非集計行動モデルの役割)
2
RPとSP、柔軟性とバイアス
• RP:Revealed Preference 顕示選好
– その時、あなたは実際にどう行動しましたか?
– 経験のない状況に対する行動はわからない
• SP:Stated Preference 表明選好
–
–
–
–
もし、このような状況になったら、あなたはどうしますか?
現在存在しない状況も、仮想的に設定できる(柔軟性)
仮想的価値評価法CVM(Contingent Valuing Method)
回答と、実際の行動とには大きな差(バイアス)
•
•
•
•
•
被験者が、仮想的な状況を理解しずらい
特にメリットに比べ、デメリットの認識がしずらい
調査者の意向を先読みして、好意的回答をする
質問の順序や、言葉遣いが影響を与える
自分の考えより、一般的な道徳規準に合わせた回答
3
リスクの認知や対応行動の調査
• 災害のように実経験が少ない事象を扱うため、ど
うしてもSP(表明選好)に頼りがち
• バイアスの影響が出やすい
– 「災害への備えをした方がいい」ことはよくわかってい
るが、実際には「他のことの後回しになって、なかなか
できない」という「後ろめたさ」
– 真偽が問われないアンケート調査で、わざわざ自分
の後ろめたい状況を報告する必要なし
– 実際の自分の状況ではなく、そうあるべき自分の姿を
回答してしまう傾向がある
• 影響を受けそうな直接的な表現を避ける、同じ質問を形を変
えて何回か尋ねるなどの工夫が不可欠
• そのような工夫は、答えにくさにつながり、回答率が減少 4
計画系の研究対象
• 都市空間,交通や公共の施設は,多くの
人々に使用されて便益を発生させる.
– 費用は公共的にファイナンスされる(税金)
• 公的資金の投入が正当化されるために
– 施設が,どのように使われるか?
– 誰のためになるのか?
– その整備は公共のお金で進めるべきか?
• 空間(時間)の中での人々の行動が問題
– モノの力学・材料学 vs 人の力学・材料学
5
公共施設(交通機関)の特性
• 交通路の設備やVehicleの費用が大きい
– 建設費:地下250億円/km、高架100億円/km
– 鉄道車両:1両1億円
• 旅客が少なくても、必ず一定の固定費用がかかる
費用
平均費用
総費用
可変費用
固定費用分
固定費用
可変費用分
旅客数
旅客数
6
公共施設(交通機関)の特性
• 公共交通のよさは、利用人員が多いときに発揮
できる。
• 利用人数が少ないと、一人当たりの費用(平均
費用)が高くなり、サービス水準が下がる
• 頻度の減少が利便性を低下させる
• その結果、競争に負け、さらに利用人数が減る
悪循環に陥る危険性がある
利用に見合ったサービス計画を立てることが重要
(利用者の行動理解→それに合わせた計画)
システムに見合った利用者を確保することも重要
(計画的意図→利用者の行動の管理,誘導)
7
行動の科学的研究と
工学的な応用との違い
• 人間行動の科学的な研究では
– 外部からは観測できないような個々人の能力や知識,
癖,気分などをよりたくさん考慮すれば,より正確なモ
デルができる
• 工学的な応用を考えると
– そのような特徴を持つ人が将来ともその場所にいると
は限らない
– 外的条件の変化の予測が難しい
• 目の前のサンプルにより良く当てはまるモデル
は,将来予測には使うことが難しい
8
モデルの複雑さと精度
モデルによる誤差
構造的誤差
モデル作成時
の再現誤差
予測誤差
将来の説明変
数の想定値の
予測誤差
モデルの複雑さ(説明変数の数)
9
施設計画と需要予測
評価
(便益)
施設容量
サービスレベル
頻度運賃
需要
(利用者数)
設計から始めると,高評価につながるかどうかが不明
評価から始めて、遡る方向の検討が必要
10
需要予測用の行動モデルが評価の出発点
統計学の目的
• 沢山のデータを要約し、中に含まれている情報を
把握しやすくするための手段
• 例:学生100人の体重のデータがある.
その100個の数値持っている情報を簡単に表わしたい
データ,データ,
データ,データ,
データ,データ,
データ,データ,
データ,データ
要約値
(統計量)
判断
計画
平均値:「100人の学生の体重はだいたい60kgぐらいである」
11
+標準偏差: 「100人の日本人の体重はだいたい50~70kgである 」
統計学(Statistics)の発展
• 統計学の始まり(紀元前3000年~2300年)
古代エジプト:ピラミッド建設のための基礎調査
古代中国:人口調査
17世紀頃:国勢調査の学問 status(国家)→statistics
• 記述統計学( 19世紀末~20世紀初頭)
ゴールトン(Francis Galton)、ピアソン(Karl Pearson)
データを要約し調査対象の情報を数学的に記述する方法
• 推測統計学(1925年)
フィッシャー(Rinald Aylmer Fisher) 「研究者のための統計的方法」
標本集団の要約値から母集団の要約値を確率的に推測し、それに
よって母集団の様子を記述する
• ノンパラメトリック手法
母集団の確率分布を事前に仮定しない方法
• ベイズ統計学
観測値に基づき,母集団に関する知見を順次修正する
12
記述統計学と推測統計学
多数データの
数学的要約
・記述
母集団の
データ
(仮想的)
母集団
無作為
抽出
標本集団
のデータ
確率的推測・記述
少数データの
数学的要約
・記述
13
推測統計学とベイズ統計学
(仮想的)
母集団
無作為
抽出
標本集団
のデータ
少数データの
数学的要約
・記述
確率的推測・記述
無作為
抽出
事前知識
標本集団
のデータ
ベイズ更新
事後知識
14
この講義の方針
• 目標:自信を持って(完全に内容を理解した
上で)行動モデルに関する統計分析ができる
• Logitモデルに代表される離散選択モデル,多
変量解析手法の拡張である線形構造方程式モ
デル,個人間異質性を取り入れた一般化線形
モデルについて,理論的背景,統計学的基礎,
計算方法,推定結果の解釈の方法を理解する
• フリーの統計処理ソフトRを用いて演習を行
う.可能であればNotePCを持ってきてくださ
い.
• 教科書 久保拓弥(2012)データ解析のため
の統計モデリング入門,岩波書店
15
• その他の教材は配布します.
この講義の予定
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
(10/3) 計量行動分析の意義と3つの統計学の考え方 Purpose.ppt
(10/10) R言語の導入と記述統計学 IntroductionR.ppt
(10/17) 推測統計学と仮説検定 PointEstimate.ppt
(10/24) 推測統計学と仮説検定
(10/31) 回帰分析の記述統計学的方法
(11/7) 回帰分析の記述統計学的方法 LinearRegresson.ppt
(11/14) (休講)
7 (11/21) 回帰分析への推測統計学の応用
8 (11/28) ロジットモデルの誘導 Logit.ppt
9 (12/5) 最尤法による非集計ロジットモデルの推定
10 (12/12) 因子分析・主成分分析Factor.ppt
11 (12/19) 共分散構造モデルの推定 SEM.ppt
12 (1/9) 一般化線形モデルの考え方glm.ppt(1/25改訂)
13 (1/16) 一般化線形モデル推定
14 (1/23)
課題発表会1
16
15 (1/30)
課題発表会2
1
2
3
4
5
6
Rに関する情報は
• RjpWiki http://www.okada.jp.org/RWiki/
17
インストール
18
最新版は3.1.1(10.10現在)
19