1章&2章

エージェントアプローチ
人工知能 1章・2章
M0 片渕 聡
08/07/02
1
目次
 第1章:序論
 第2章:知的エージェント
2
第1章:序論
目次


研究の背景
AIへのアプローチ
-人間のように行動する(チューリングテストアプローチ)
-人間のように考えるシステム(認知モデルアプローチ)
-合理的に考える(思考の法則によるアプローチ)
-合理的に行動する(合理エージェントアプローチ)



人工知能の基盤
人工知能に関する最新技術
1章まとめ
3
第1章:序論
目次


研究の背景
AIへのアプローチ
-人間のように行動する(チューリングテストアプローチ)
-人間のように考えるシステム(認知モデルアプローチ)
-合理的に考える(思考の法則によるアプローチ)
-合理的に行動する(合理エージェントアプローチ)



人工知能の基盤
人工知能に関する最新技術
1章まとめ
4
研究の背景

人間のような知的存在の理解・構築
-定義すら未だ曖昧な段階
-人類文明に大きな影響を与える
非常に興味深い分野

現在のAI分野の領域
-汎用領域(認識、論理的推論)
-下位(専用)領域(チェス、病気診断etc)
5
第1章:序論
目次


研究の背景
AIへのアプローチ
-人間のように行動する(チューリングテストアプローチ)
-人間のように考えるシステム(認知モデルアプローチ)
-合理的に考える(思考の法則によるアプローチ)
-合理的に行動する(合理エージェントアプローチ)



人工知能の基盤
人工知能に関する最新技術
1章まとめ
6
AIのアプローチのカテゴリ分類
・分岐1:思考に興味あるか行動に興味があるか
・分岐2:モデルの基準が人間か理想像か
人間のように
考えるシステム
合理的に
考えるシステム
人間のように
行動するシステム
合理的に
行動するシステム
7
合理的とは

過ちを犯さないこと(⇔人間的)
-例えば人間はいくら試験勉強をしても試験でミ
スを犯すことがある

合理的であっても全能というわけではない
-例えば道路を渡る際いくら安全確認をしても突
然隕石が直撃することは予測できない
8
チューリングテストアプローチ
(人間のように行動する)

ある計算機に知能があるのかを検証
1.質問者(人間)と質問のやりとりをする
2.質問者が人間か機械かを判別できなければ合格
※質問者は物理的に機械を確認することは出来ない
相手は
人間?機械?
いかにして
この目標を達成するかの
研究が進められている
質問者(人間)
回答者(機械)
9
チューリングテストの成功
必要な(になるであろう)技術
自然言語処理
-日本語や英語を理解、処理する技術
 知識表現
-今までに得た情報を格納する技術
 自動推論
-蓄えられた情報を元に結論を導き出す技術
 機械学習
-解析したデータを元にパターンを検出する技術

10
統合チューリングテスト

現実には物理環境を考慮する必要がある
-視覚認識(機械が物体を認識するために必要)
-ロボット工学(物体を操作するために必要)
人間
機械
答えは
これですね
11
認知モデルアプローチ
(人間のように考える)


人間がどのように考えているのかを知る
-内省
-心理実験
認知科学
-AIの計算機モデルと心理学の融合
人間の心理の理論的な構築を目指す
12
思考の法則によるアプローチ
(合理的に考える)

「正しい思考」(反駁不可能な推論)の体系化
-思考の法則が心理を支配するという考え方

三段論法
鈴木君は
人間だ
全ての人間は
いつか死ぬ
鈴木君は
いつか死ぬ
形式論証によるアプローチ
↓
論理主義アプローチ
13
論理主義アプローチへの障害

厳密に規定されていない知識の形式化が困難
-現在の論理式では全ての知識をカバーできない

論理的な問題と現実問題に大きな隔たりがある
-机上の空論になる可能性がある
-事実がわかってもその組合わせ方がわからない
・事実A,B,Cがあったとしてそれらをどう組み合わせる?
14
合理エージェントアプローチ
(合理的に行動する)
自己の信念を元に目標達成のために行動する
・チューリングテスト+推論
-「思考の法則」アプローチと比べ一般的
-チューリングテストと比べ判断基準が明確
(人間の特殊な環境を考慮するのは今はまだ早い)

本書では合理的アプローチを主に扱う
15
第1章:序論
目次


研究の背景
AIへのアプローチ
-人間のように行動する(チューリングテストアプローチ)
-人間のように考えるシステム(認知モデルアプローチ)
-合理的に考える(思考の法則によるアプローチ)
-合理的に行動する(合理エージェントアプローチ)



人工知能の基盤
人工知能に関する最新技術
1章まとめ
16
人工知能の基盤

AIは様々な分野の概念や技術を継承している
-哲学(唯物論)
AIの
-数学(アルゴリズム)
概念
-心理学(行動主義、認知心理学)
-計算機技術(プログラム言語、OS)
AIの
-言語学(計算言語学問、自然言語処理) 実装
17
第1章:序論
目次


研究の背景
AIへのアプローチ
-人間のように行動する(チューリングテストアプローチ)
-人間のように考えるシステム(認知モデルアプローチ)
-合理的に考える(思考の法則によるアプローチ)
-合理的に行動する(合理エージェントアプローチ)



人工知能の基盤
人工知能に関する最新技術
1章まとめ
18
人工知能に関する最新(?)技術

チェス世界チャンピオンを打ち破るプログラム
(1989)
音声認識のミスを対話の成り行きの理解で修正
する対話プログラム(1994)
 宇宙船からの膨大なデータを処理し、重大な問
題をアナリストに知らせるシステム(1992)
 自律走行システム(1993)
などなど・・・

19
第1章:序論
目次


研究の背景
AIへのアプローチ
-人間のように行動する(チューリングテストアプローチ)
-人間のように考えるシステム(認知モデルアプローチ)
-合理的に考える(思考の法則によるアプローチ)
-合理的に行動する(合理エージェントアプローチ)



人工知能の基盤
人工知能に関する最新技術
1章まとめ
20
1章まとめ


AIへのアプローチは様々である
-興味は思考or行動
-モデルは人間or合理性
AIは様々な分野の概念や技術を継承
21
ここまでが1章です

ここから2章になります
22
第2章:知的エージェント
目次







知的エージェントとは
理想的な合理的エージェント
理想的マッピング
知的エージェントの構造
エージェントプログラム
環境の特徴
まとめ
23
第2章:知的エージェント
目次







知的エージェントとは
理想的な合理的エージェント
理想的マッピング
知的エージェントの構造
エージェントプログラム
環境の特徴
まとめ
24
知的エージェントとは
1.
2.
環境をセンサで知覚
環境に対して手足(エフェクタ)を介して動作
センサ
処理
環境
エフェクタ
エージェント
25
第2章:知的エージェント
目次







知的エージェントとは
理想的な合理的エージェント
理想的マッピング
知的エージェントの構造
エージェントプログラム
環境の特徴
まとめ
26
合理的とは(再掲)

過ちを犯さないこと(⇔人間的)
-例えば人間はいくら試験勉強をしても試験でミ
スを犯すことがある

合理的であっても全能というわけではない
-例えば道路を渡る際いくら安全確認をしても突
然隕石が直撃することは予測できない
27
性能尺度・知覚列

性能尺度
エージェントのどれくらい正しく動作するかを
評価する基準
例:道路を渡る前に左右を見渡すと性能尺度は上昇
-全てのエージェントに適用できる基準はない

知覚列
エージェントが知覚した全ての情報の履歴
28
組込み知識・自律性

組込み知識
人間によって予めエージェントに組み込まれてい
る知識

自律性
組込み知識に基づかずエージェント自身の経験
に基づいて行動すること
-自律性に欠けるエージェントは適応性にも欠ける
29
理想的な合理的エージェント

知覚列とエージェント自身の持つ組込み知識に
基づいて性能尺度を最大にする動作を選ぶ
エージェント

例:道路を渡るエージェントの場合
-安全を確認するため左右を見渡すetc

環境に関して知っていることも合理性には重要
30
第2章:知的エージェント
目次







知的エージェントとは
理想的な合理的エージェント
理想的マッピング
知的エージェントの構造
エージェントプログラム
環境の特徴
まとめ
31
知覚列から動作へのマッピング

知覚列と動作の対応付けでエージェントを表現

例:知覚xに対する平方根zのマッピング
知覚x
1.0
1.1
1.2
1.3
動作z
1.00000000
1.04880884
1.09544511
1.14017542
32
理想的マッピング

どんな知覚列に対しても、それに応じてエージェン
トが取るべき動作を特定できるマッピング

先ほどの平方根の例も理想的マッピング
知覚x
1.0
1.1
1.2
1.3
動作z
1.00000000
1.04880884
1.09544511
1.14017542
33
第2章:知的エージェント
目次







知的エージェントとは
理想的な合理的エージェント
理想的マッピング
知的エージェントの構造
エージェントプログラム
環境の特徴
まとめ
34
知的エージェントの構造

エージェント=プログラム+アーキテクチャ
※(エージェント)プログラム
知覚から動作へマッピングする関数を設計
※アーキテクチャ
プログラムを受け入れ実行する計算装置
35
第2章:知的エージェント
目次







知的エージェントとは
理想的な合理的エージェント
理想的マッピング
知的エージェントの構造
エージェントプログラム
環境の特徴
まとめ
36
エージェントプログラム

1.
2.
3.
骨格プログラム
新たに知覚を得ると内部情報を更新(記憶)
知覚に基づき最良の動作を選択(マッピング)
選択した動作の情報も内部に記憶
37
エージェントのタイプ

エージェントは以下の4つの要素に依存
-知覚(P)
-動作(A)
-ゴール(G)
-環境(E)
性質に応じたプログラムを用いる必要がある
38
エージェントプログラムの種類
単純反射エージェント
 内部状態を持つエージェント
 ゴール主導エージェント
 効用主導エージェント

単純
低信頼
複雑
高信頼
39
単純反射エージェント

現在の状態に適合するルールを見つけてその
ルールに見合う動作を行う
-例:前の車が減速したブレーキを踏む
条件(IF)-動作(THEN)ルール

現実世界においては適用できる範囲が狭い
40
単純反射エージェントの構造
Agent
Sensor
現在の環境状態
環境
IF-THENルール
最善の動作選択
Effectors
41
内部状態を持つ反射エージェント

環境の状態を用いることで単純反射と比べて適
用範囲を広げる
-時間と共に内部状態は更新される

例:車線変更の場合
-「信号が見えた車線変更する」では不十分
-「近くに車が無いか」という状態を保持
-その状態も考慮した上で車線変更するかを決定
42
内部状態を持つ反射エージェント
の構造
Agent
内部状態
Sensor
現在の環境状態
環境
IF-THENルール
最善の動作選択
Effectors
43
ゴール主導エージェント



エージェントにはゴールに関する情報が必要
-例えば移動方向は目的地に依存する
探索やプラニングにより動作を決定(3章以降)
未来に関する考慮を含む(IF-THENルールとの相違)
-「もしこの動作をしたら何が起きるのだろうか」
柔軟性・適応性が高い
44
ゴール主導エージェントの構造
Agent
内部状態
Sensor
現在の環境状態
未来への考慮
ゴール
環境
最善の動作選択
Effectors
45
効用主導エージェント

より性能尺度の高い動作列を決定するために
効用関数を用いる
※矛盾する目標(e.g.消費電力vs精度)がある時は
適切なトレードオフを指定する
※確実に目標を達成する動作列が存在しない時、
達成見込みを重み付けする方法をとる
46
効用主導エージェントの構造
Agent
内部状態
Sensor
現在の環境状態
未来への考慮
効用関数
環境
効用の度合い
最善の動作選択
Effectors
47
第2章:知的エージェント
目次







知的エージェントとは
理想的な合理的エージェント
理想的マッピング
知的エージェントの構造
エージェントプログラム
環境の特徴
まとめ
48
環境の分類基準(1/2)
環境は幾つかの種類に分類可能
アクセス可能 vs アクセス不能
-センサが環境全体を見渡せるかどうか
例:チェスは盤上(環境)を見渡せるのでアクセス可能

決定的 vs 非決定的
-環境の次の状態が現在の状態からの動作の選択に
よって確定できるかどうか
例:将棋は手によって次の環境が特定できるので決定的

49
環境の分類基準(2/2)
エピソード的 vs 非エピソード的
-前の動作が次の選択に影響を与えないかどうか
例:チェスは前の手が次の手に影響を与えるので非エピ
ソード的
 静的 vs 動的
-エージェントの思考中に環境が変化しないかするか
例:チェスは手を決めるまで環境が変わらないので静的
 離散的 vs 連続的
-知覚と動作が有限個に区別できるかどうか
例:チェスは各手ごとに有限個の選択しかないから離散的

50
環境とその特徴の例
アクセス不能、非決定的、非エピソード的
動的、連続的な環境は複雑
51
環境(シミュレータ)プログラム

1.
2.
環境と動作を結びつけるプログラム
各エージェントに知覚を与える
エージェントから動作を受け取り環境を更新
52
第2章:知的エージェント
目次







知的エージェントとは
理想的な合理的エージェント
理想的マッピング
知的エージェントの構造
エージェントプログラム
環境の特徴
まとめ
53
2章まとめ





エージェントはセンサで知覚してエフェクタで環
境に働きかける
エージェント=プログラム+アーキテクチャ
エージェントプログラムでは内部情報を更新しつ
つ知覚から動作にマッピングする関数を設計
エージェントは知覚、動作、ゴール、環境に依存
アクセス不能、非決定的、非エピソード的、動的、
連続的な環境は複雑
54