情報伝達効率に基づく 概念形成機構の解析 2004年2月23日 中村研究室 澤 繁実 [email protected] 主査教官 中村 清彦 審査教官 新田 克己,橋田 浩一,茂木 健一郎,山田 誠二 1 1.研究の目的 人間の脳内における概念構造構築の メカニズムを明らかしたい. 本研究では概念構造構築の学習アルゴリズム Cobweb Fisher (1987)を人間の概念構築のモデルとし て取り上げ解析する. ● 教師無し学習 人間の日常 の概念構築と ● 逐次学習 ● Category Utility Gluck and Corter, (1985) よく対応よって を用いた学習 Cobwebを解析 2 2.先行研究 Category Utility Gluck and Corter, (1985), Corter and Gluck, (1992) 話し手 「果物」 私は 受け手 を持って 「リンゴ」 います。それは「赤い」と思 いますか? マスカット?あんず? デリシャスリンゴ?オレンジ? 予測正解率:低い デリシャスリンゴ(赤)?マッキン トッシュリンゴ(赤)?青リンゴ? 予測正解率:高い 最適な概念構造とは ● 特徴の予測正解率が最大化される構造 ● そういう構造を持つ概念は Category Utility が高いとする. 3 Corter and Gluck (1992) 2.先行研究 Category Utility 添え字 果物 i j 芯があるか ある・ない 赤・緑・黄・ 紫・・・ 特徴の値 Feature 色 リンゴ 特徴 Attribute CU = Category Utility k 果物・ リンゴ・ 概念 Category Gluck and Corter, (1985), Corter and Gluck, (1992) 概念Ckに属することが わかった場合の 特徴予測正解率 概念に属することが わからなかった場合の 特徴予測正解率 CU (ck ) P (ck )i j P (ai f ij | ck ) 2 P ( ai f ij ) 2 ) P(色 緑 |リンゴ CU (リンゴ ) P(リンゴ )i j P(色 赤 |リンゴ ) 2 P(色 赤 | 果物 ) 2 CU (リンゴ ) P(リンゴ 概念の観測 頻度によって 重視する度合 いを変えよう 自乗の 戦略 i j ) 2 P(色 緑 | 果物 ) 2 自乗の意味 特徴を予測 する確率 × 実際にその 特徴が観測 される確率 = 予測が 正解する 確率 4 2.先行研究 概念構造構築機械Cobweb C:概念 C3 C2 リンゴ ぶどう C4 C5 デリジャス リンゴ Fisher, (1987) Category Utility の平均 C1 もも CUCobweb この値が最も高くなる構造を Cobwebは選択する. 青リンゴ ● 人間には,予測正解率を増や したいという欲求と概念数を減ら したいという2つの欲求がある. 2 2 P ( c ) P ( a f | c ) P ( a f ) k 1 k i j i ij k i ij n CU Cobweb ある階層内のn個の概念の 果物 C0 ある階層の Category Utility n 概念 Ck の Category Utility 5 2.先行研究 Cobwebの4つの挙動 事例 root Fisher, (1987) Merge C1 Best Child root Merged Category C1 C3 Best Child C3 root 事例 事例 C2 C1 C2 C3 Second Child C2 Create 事例 Split C1 C2 C3 root root root Split 事例 Best Child C4 C1 C5 C2 C3 C4 C5 C2 C3 Grandchildren これらの挙動,全ての場合についてCUの値を計算し,値が最 も高くなる構造をCobwebは選択する. 6 目次 3.本研究 (1) Cobwebが人間と相似な概念分類である ことを示唆する. (2) 情報量の観点からCobwebを考える. (3) 自乗戦略と情報量戦略の解析 (4) Mergeの必要条件式を求める. 7 本研究1 Fisher (1987) 「豆の病気のデータ」 と 「政策と政党の関係 」 生物学上の理由や事前知識によりルールが決められて分類された概念 本研究 果物・楽器・家具Tversky, (1985) それぞれの特徴から人間が成長していくにしたがって 自然に獲得していったと考えられる概念 概念に関する人間の心理学データTversky, (1985)を適用 させ,人間の概念構造構築のモデルとしてCobwebは適 切かを検証した. 8 Tverskyの心理学的分類データの Cobwebへの適用 (Sawa) 入力データTversky, (1985)は 90 秒間,それぞれの概念についての特徴を 列挙・リスト化して, 特徴を0 と1 で 表記したもの. 果物の特徴データ ・・・ 特徴の値 0と1は排反である. 人間が成長していくにしたがって自然に獲得していった概念 の心理学データ(Tversky, 1984)をCobweb に分類させる. 9 果物の概念階層 Tversky, (1984) Fruit apple Delicious apple peach Macintosh Freestone apple peach Cling peach grapes Concord grapes Green seedless grapes この構造と同じようにCobwebが分類すれば, 人間と同じ分類ができたとし,分類成功とする. 10 Cobwebの特徴 結果 事例の入力される順番によって構成される概念構 造が変化する. よって,入力する6事例の全順列つ まり6P6 = 720 通りについて学習させる. Tree1 80.0% 1 turn Tree4 1.67% 1 turn Tree2 15.0% 1 turn Tree5 1.11% 1 turn Tree3 2.22% 1 turn Tree6 96.6% 2 turn 2 turn では96.6 % ,3 turn では99.4 % が心理学データと同じ構造になった. 人間が成長していくにしたがって自然に獲得していったと 考えられる概念も学習でき,人間の概念構造構築のモデルと11 してCobwebは適切であることが示唆された. 本研究2 情報量の導入 Gluck and Corter, (1985) U:不確実さ(Uncertainty) CU (自乗戦略) n P(ck )i j P( f ij | ck ) 2 P( f ij ) 2 n k 1 CU (情報量戦略) P(ck )i j P( f ij | ck )logP( f ij | ck ) P( f ij )logP( f ij ) n n k 1 特徴集合Aと概念集合Cの 相互情報量 I(A;C) と等しい. 12 Tverskyの心理学的分類データの 情報量戦略によるCobwebへの適用 (Sawa) 先ほどの実験と全く同じ要領で, 自乗戦略を 情報量戦略に変更して概念の心理学データ (Tversky, 1984)を分類した. 結果 Tree1 77.8% 1 turn Tree5 1.11% 1 turn Tree2 14.4% Tree3 1.11% 1 turn 1 turn Tree6 3.33% Tree7 1.11% 1 turn 1 turn Tree4 1.11% 1 turn Tree8 98.3% 2 turn 2 turn では98.3 % ,3 turn では100 % が 心理学データと同じ構造になった. 自乗戦略と情報量戦略は同程度の分類性能 (P>>0.05) 13 本研究3 自乗戦略と情報量戦略の解析 自乗戦略と情報量戦略は,統計的に独 立な分類方法であるとは言えず,同じよ うな分類性能があることを示唆した.(Sawa) しかし,自乗戦略と情報量戦略では全く 同じようには分類されていない.その差 はいったい何なのかを突き止める. 14 自乗戦略 と 情報量戦略 の挙動の差異 同じ事例が Best Child 離れた場所へ 配置された. 自乗戦略 turn 2の 途中にて Macintosh apple M.A. 2 M.A.1 F.P.1 D.A.1 D.A.1 M.A.1 F.P.1 F.P.2 G.G.1 C.G.1 C.P.1 C.P.2 C.G.2 F.P.2 C.P.1 C.G.1 G.G.1 D.A.1 M.A. 2 C.G.2 C.P.2 同じ事例は 情報量戦略 同じ場所 へ Merge 配置された. G.G.1 C.G.1 C.G.2 F.P.1 F.P.2 C.P.1 D.A.1 15 C.P.2 M.A.1 M.A. 2 挙動の差 デリシャス リンゴ 2 Best Child 事例 果物 Best Child 果物 Best Child Second Child 事例 デリシャス リンゴ 1 Merge マッキン トッシュ リンゴ 2 ピーチ 1 デリシャス リンゴ 1 マッキン トッシュ リンゴ 2 ピーチ 1 果物 果物 Best Child 果物 リンゴ 事例 ピーチ 1 リンゴ デリシャス リンゴ 1 マッキン トッシュ リンゴ 2 ピーチ 1 ピーチ 1 デリシャス リンゴ 2 デリシャス リンゴ 1 マッキン トッシュ リンゴ 2 デリシャ ス リンゴ 1 マッキ ントッ シュ リンゴ デリシャス 2 リンゴ 2 この挙動の違いは何から生まれてくるのか? 16 自乗戦略 と 情報量戦略 の挙動の差異 G 予 測 正 解 率 G (自乗戦略 ) j P ( f ij ) 2 1 0.95 0.9 0.85 0.8 G (情報量戦略 ) j P( f ij )logP( f ij ) 0.75 0.7 0.65 0.6 0.55 0.5 0 0.2 0.4 0.6 0.8 CU (自乗戦略) n CU (p^2 情報量戦略 + ) (1-p)^2 P(c ) P( f | c )logP( f | c ) P( f P( f ) 1 n P(ck )i j P( f ij | ck ) 2 P( f ij ) 2 特徴の検出確率 曲線の傾きの k 1 n k 1 k i j ij k ij k ij )logP( f ij ) n 強弱が入れ替 わる値 17 自乗戦略 と 情報量戦略 の挙動の差異 Merge によって作ら れた新しい概念は子 孫により多くの事例を 含む.よって必ず特 徴の検出確率P(f)は 0.5に近づく.deltaだ け特徴の検出確率が 下がったとする. 情報量戦略の傾きが 常に緩やかである領域 G1 0.95 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55 0.5 inner region delta G(自乗戦略) G(情報量戦略) 0.5 0.6 0.7 0.8 0.9 P ( f )1 曲線の傾きの p^2 + (1-p)^2 よって,CUの減少が少ないので,情報量戦略の方が 強弱が入れ替 Merge が起こりやすい. わる値 18 Merge の重要性 Mergeは2つの概念をまとめて新しい概念を作り出し, 概念構造をより深くすることの出来る唯一の挙動なので, Mergeは概念階層形成に重要な役割を果たしている. root C1 C2 事例 C3 root Merge 事例 Merged Category C1 C3 C2 情報量戦略はこのMergeが起こりやすいのでより深い 概念構造が出来上がる可能性を示唆した. 19 本研究4 Mergeの必要条件 下の式の 左辺はBest Child が選択され た時のCU Cobwebの式 そのもので あり, 右辺はMerge した場合とBest Childした場合のCU Cobwebの分 子 の差分である. Best Child B root Merge A ~ B 事例 事例 C1 C2 C C555 C3C4C root CM A C3C4CCC555 C1 C2 この式は自乗戦略と情報量戦略のどちらでも成り立つ条件式である. 20 本研究成果のまとめ 1. 特徴から自然に構築される概念に関しての心理学 データであるTversky (1984) をFisher (1987)の Cobwebに適用し,人間と相似な概念構造構築機 械であることを示唆した. 2. Cobweb に情報量戦略を適用し,Fisher の用いた 自乗戦略と比較して,統計的に同等の性能がある ことを示唆した. 3. 情報量戦略の方が Merge が起こりやすいことを示 した. 4. 情報量戦略の方が新概念を作り出し,より深い概 念構造が出来上がる可能性を示唆した. 5. Mergeの起こる必要条件式を導いた. 21 博士課程への課題 ● 当面の目標 ● 既存の情報理論の認知モデルとの比較検討. CU Sawa 概念集合 相互情報量 - エントロピー 特徴集合と概念集合の ● CUSawの検討 (人間には,予測正解率を増やしたいという欲求と 概念数を減らしたいという2つの欲求がある.) ● 長期的な目標 ● 神経回路素子を用いた人間の概念メカニズムへの応用. ● 階層構造にこだわらないネットワーク型の概念構造の理論化. 22 中村清彦研究室 02M35303 澤 繁実 [email protected] 23 Merge は CUの値を必ず増加させないことの証明 F (P ) 1 0.95 0.9 0.85 P(C2 ) P( f1 | C2 ) P(CM ) P(C1 ) P( f1 | C1 ) P(CM ) P( f1 | CM ) 0.8 0.75 0.7 0.65 0.6 P(C1 ) F P( f1 | C1 ) 0.55 P(CM ) 0.5 0 0.2 P(C2 ) F P( f1 | C2 ) P(CM ) F P( f1 | C1 ) 0.4 p^2 + (1-p)^2 0.6 0.8 1 P 24 Mergeが行われると どうなるか root 事例 変化する部分 C1 変化しない部分 Merge ~ B 事例 root CM C C567 C3C4C C2 Best Child A B root A 事例 C3C4CCC555 C1 C2 C C555 C3C4C C1 C2 25 自乗戦略 と 情報量戦略の類似度を検定 χ2検定を行い,自乗戦略と情報量戦略の両戦略においてデータ分類 正解数に統計的に差のないことを示した. 結果 自乗 戦略 情報量 戦略 自乗 戦略 情報量 戦略 自乗 戦略 情報量 戦略 自乗 戦略 情報量 戦略 H0:帰無仮説:各データの正解数と分類方法は独立である. (正解数は分類法によらない.) H1:対立仮説:各データの正解数と分類方法は独立ではない. (正解数は分類法によって変わる.) 有意水準α=0.86 で帰無仮説H0 が採択された. 26 Category Utility 入 事例名 力 事 サンマA 例 イモリA デ ニホンザルA ー インコA タ サンマB は ヤモリA 与 インコB え ニワトリA ら れ 鳥類に 上記8事例 る 属することが 全てを考えた . わかった 確率 Gluck and Corter, (1985), Corter and Gluck, (1992) 特徴1 移動手段 特徴2 肌 特徴3 受精に関して 特徴4 クチバシがあるか 泳ぐ 鱗 体外受精 無し はう 湿皮膚 体外受精 無し 歩く 毛 体内受精 無し 飛ぶ 羽 体内受精 有り 泳ぐ 鱗 体外受精 無し はう 湿皮膚 体外受精 無し 飛ぶ 羽 体内受精 有り 歩く 羽 体内受精 有り P(泳ぐ)=2/8 P(鱗)=2/8 P(歩く)=1/3 P(はう)=2/8 P(湿)=2/8 P(歩く)=2/8 P(毛)=1/8 P(飛ぶ)=2/3 P(羽)=3/3 場合の確率 P(飛ぶ)=2/8 P(羽)=3/8 P(外)=4/8 P(内)=3/3 P(内)=4/8 P(無し)=6/8 P(有り)=3/3 P(有り)=3/8 27 自乗戦略の場合の挙動 Macintosh apple M.A. 2 CU=1.51 CU=1.34 CU=1.64 A Best Child C B B A D.A.1 D.A.1 M.A.1 F.P.1 F.P.2 M.A.1 G.G.1 C.G.1 C.P.1 C C.G.2 F.P.1 C.P.2 F.P.2 C.G.1 C.P.1 G.G.1 D.A.1 M.A. 2 C.G.2 C.P.2 C がBest Child でCUは1.64, AとCを Merge した場合1.63,よって Best Child が選択された。 28 情報量戦略の場合の挙動 Macintos h apple M.A. 2 CU=1.69 Merge M.A. 2 CU=1.46 CU=1.80 A B C B D.A.1 D.A.1 A+C A M.A.1 F.P.2 C.P.1 G.G.1 C.G.1 C.G.2 C.G.1 C.G.2 D.A.1 F.P.1 C.P.2 C.P.1 Best Child A+C B C.P.2 B M.A. 2 A+C A A G.G.1 G.G.1 C C.G.1 C.G.2 F.P.2 M.A.1 Merge F.P.1 G.G.1 C F.P.1 F.P.2 C.P.1 D.A.1 C.P.2 M.A.1 M.A. 2 C.G.1 C.G.2 F.P.1 C F.P.2 D.A.1 C.P.1 M.A.1 C.P.2 C がBest Child でCUは1.80, A とCを Merge した場合1.85, よって Merge が選択された。 29
© Copyright 2025 ExpyDoc