2008年3月10日 早稲田大学 連合学習モデルと その神経学的基盤 慶應義塾大学社会学研究科 丹野貴行 目次 1. レスポンデント条件づけ研究(~1960年代) 2. R-Wモデルの成立 3. 連合学習モデルの拡張(随伴性判断での研究例) 4. 連合とは何か 5. 連合学習の神経学的基盤 参考文献: 今田寛 (1996). 学習の心理学 培風館 レスポンデント条件づけ 繰り返すと・・・ ベルと餌を対呈示すると、餌への反射である唾液分泌 がベルへも起こるようになった(Pavlov, 1927)。 いったい何が起こっていたのか? 対呈示により連合が形成される NS (ベル) US (餌) UR (唾液) US: Unconditioned stimulus UR: Unconditioned response NS: Neutral stimulus CS (ベル) CR (唾液) CS: Conditioned stimulus CR: Conditioned response (1)仮定: 刺激の等質性 (2)必要十分条件: NSとUSの時間的接近性 1960年代における変化1 生物学的準備性 仮定: 刺激の等質性 視聴覚 電気 ショック 味覚 X線 (腹痛) Garcia & Koelling (1966) CSとなるかどうかはUSとの関係に依存する (比較心理学による進化論的原因の探求) 1960年代における変化2 接近性から随伴性へ US no US CS a b no CS c d Rescorla (1968) 接近性のみが重要ならば a のみを考慮すれば良い。 しかしΔP = P(US|CS) – P(US|noCS) が重要なようである。 つまりCSがUSの予測子とならなければならない 。 目次 1. レスポンデント条件づけ研究(~1960年代) 2. R-Wモデルの成立 3. 連合学習モデルの拡張(随伴性判断での研究例) 4. 連合とは何か 5. 連合学習の神経学的基盤 参考文献: 今田寛 (監修)(2003). 学習心理学における古典的条件づけの理論 培風館 ブロッキング Phase Group 1 Group 2 1 A+ non 2 AB+ AB+ Test B B Results no CR CR Group1とGroup2の間で、Bの随伴性には 差が無いにもかかわらず、前者ではBは CSとはならなかった。 試行ごとの予測が可能なモデルの必要性 Kamin (1968) Rescorla-Wagner model (1972) Vn ( V ) exp( kt) 連合強度 の変化量 学習率 予測誤差 (驚き) 接近性 V: 連合強度(0~1、CRの大きさは連合強度により決まると考える) α: CS明瞭度に依存する学習率パラメータ(0~1) β: US強度に依存する学習率パラメータ(0~1) λ: 対呈示ならば1、CS単独呈示ならば0 k : 接近性減少に伴う連合の崩壊率 R-Wモデルのブロッキングの説明 その後の流れ • CSへの注意(attention)という概念(予測ができるほど注目 する・驚きが大きいほど注目する)を導入したMackintosh (1975) モデルとPearce-Hall (1980) モデル • AB刺激の呈示を、A要素とB要素の同時呈示ではなく、ABと いう別の刺激の呈示であると考えるPearce (1987)モデル(刺 激形態化・般化) • あるCSがCRをもたらすのは、CSと+の連合強度と、文脈刺 激と+の連合強度が、テスト時に比較した結果であるとする、 Miller のコンパレータモデル(Miller & Schachtman, 1985) • 以上の他、CS→USの記憶減衰に基づくSOPモデル(Wagner, 1981)、CSとUSの時間関係も同時にコーディングされている とする時間的符号化モデル(Matzel et al., 1988)など、いくつ ものモデルが提案されている その後の流れ 目次 1. レスポンデント条件づけ研究(~1960年代) 2. R-Wモデルの成立 3. 連合学習モデルの拡張(随伴性判断での研究例) 4. 連合とは何か 5. 連合学習の神経学的基盤 随伴性(因果関係)判断の概要 • 古くはHumeやKant。迷信行動(Skinner, 1948; 制御幻想) や原因帰属(Kelly, 1967)などとも関連する • 1960年代中頃から研究が開始(Allan & Jenkins, 1965) • 統計的モデルとしてのΔPモデル(Allan, 1980) • R-Wモデルの導入(Dickinson et al., 1984) • Retrospective revaluationの問題(Shanks, 1985)と新たな 連合学習モデルの出現(e.g., Van Humme and Wasserman, 1994) • 高次の推論過程の影響(Waldmann & Holyoak, 1992) 実験手続き Effect no Effect Cause a b no Cause c d たとえば、ラジオを叩いた場 合と叩かなかった場合とで、 故障が直ったか直らなかっ たか。 • 試行ベースもしくは上記の随伴性テーブルの形式で呈示。 • 実験参加者は0~100(-100~100の場合もあり)の間で、 感じた因果性をレーティングする。 統計的モデル Effect no Effect Cause a b no Cause c d Allan (1980)のΔPモデル ΔP = P(E|C) – P(E|~C) ヒトは統計学者のように振舞うと仮定している。 a > b > c > dの心理的重みづけがある(Wasserman et al., 1990)、dを無視するヒューリスティクスを用いている (Hattori & Oaksford, 2007)といったモデルの拡張があり、 まさに認知心理学的なモデルである R-Wモデルの導入 Alloy & Abramson (1979): 随伴性判断は、動物における学習モデルで説明できる のではないか? Dickinson, Evenden, & Shanks (1984): ヒトの随伴性判断においてもブロッキングが生じるこ とを示す その後R-Wモデルが予測・説明してきた 現象が随伴性判断においても見られるこ とを確かめる検討が続く(レビューとして Shanks & Dickinson, 1987) 随伴性判断の獲得過程 R-Wモデルの予測 ΔPモデルの予測 随伴性判断の獲得過程 R-Wモデルのみが、随伴 性判断の獲得過程を説明 できている。 実際のデータ (Shanks & Dickinson, 1987) Retrospective Revaluationの問題 Prospective Blocking Phase Group 1 Group 2 1 A+ ― 2 AB+ AB+ Test B B Results no CR CR Retrospective Blocking Phase Group 1 Group 2 1 AB+ AB+ 2 A+ ― Test B B Results no CR CR • Retrospectiveな影響をR-Wモデルは説明ができない。 • AB間の刺激連合が形成さえるとし、A単独呈示中は、Bにおけ るαの正負が逆転しているとする改良版R-Wモデル(Van Humme & Wasserman, 1994)などが考案されている • 統計的モデルは両者の違いは問題にはならない 推論過程の影響 Phase Group 1 Group 2 Group 3 Group 4 1 ― C+ C+ C+ 2 ― D+ D+ D+ 3 ― ― CD+ CD++ 4 A+ A+ A+ A+ 5 AB+ AB+ AB+ AB+ Test B B B B Results Baseline CR↑ CR↑↑ CR↓ Additively(Group 2, 3) 参加者は通常、もしAとBの両者とも原因であるならば、AとBを両方呈示 した場合には、結果はより大きくなるという考え方をしている。 それが違 うということを経験するとブロッキングの効果が弱まる(Beckers et al., 2005; Lovibond et al., 2003)。 Maximality(Group 4) Additivityが成り立つ背景には、+以上の場合がありえるという考えが ある。これを明示的にすることでブロッキングがより強くなる(De Houwer et al., 2002)。 Hyblid Modelを模索中 どのモデルが支持されるかは状況に依存するのだろう • 手がかりの数(Houwer & Beckers, 2002) • レーティングの回数(Collins & Shanks, 2002) • 個人差(Shanks & Darby, 1998) それぞれの主張を含んだ単一のモデルを作り出せないか? • 推論モデルは量的予測には程遠い、R-Wモデルの獲得 段階の利点は捨てがたい、などなど・・・ • 因果関係があるかないか(Causal Structure)についての 確信度と、そしてあるとしたらどの程度強いのか(Causal Power)を同時に扱うCausal Bayes Net はその候補と見ら れている。 目次 1. レスポンデント条件づけ研究(~1960年代) 2. R-Wモデルの成立 3. 連合学習モデルの拡張(随伴性判断での研究例) 4. 連合とは何か 5. 連合学習の神経学的基盤 連合とは何なのか Hall (2002): 連合学習モデルでは、観察された現象は、概念的神経系 (conceptual nervous system)の変化として、ノードの結びつき の変化として説明できると考えている [連合学習は脳で起こって いることそのもの、あるいはそのモデルであると考えている] Shanks (2007): CS (Tone) US (Air-puff) UR(CR) (Blink) 認知主義: Tone、Air-puff、Blinkという別個の心的表象があり、そ の間の計算は可能 連合主義: “Tone⇔Airpuff”および“Tone⇔Blink”という連合され た心的表象があり、それらを切り離したり計算することはできない 目次 1. レスポンデント条件づけ研究(~1960年代) 2. R-Wモデルの成立 3. 連合学習モデルの拡張(随伴性判断での研究例を 通した種々のモデルの紹介、および認知心理学と の絡みについて) 4. 連合とは何か 5. 連合学習の神経学的基盤 予測誤差(prediction error) Dopamine Neurons 注意が向く・報酬の場合に 活性化(ただし罰子には反 応しない) ドーパミンニューロンは、時 間的情報を伴って、予測誤 差をコードしている。 Schultz (2000) 脳部位を用いた研究例 Corlett et al. (2004). Prediction error during retrospective revaluation of causal associations in humans: fMRI evidence in favor of an associative model of learning. Neuron, 44, 877-888. Right lateral prefrontal cortex(右外側前頭前皮質) がRetrospective revaluation が起こっているときにも活性 化しているならば、その現象 の説明には連合学習モデル が適しているだろう。 まとめ 1. レスポンデント条件づけ研究(~1960年代) 2. R-Wモデルの成立 3. 連合学習モデルの拡張(随伴性判断での研究例) 4. 連合とは何か 5. 連合学習の神経学的基盤
© Copyright 2025 ExpyDoc