重い荷を処理するのに

協調機械システム論
(04.11, 25,本郷)
協調機械システム論
東京大学 人工物工学研究センター
淺間 一
レポート課題
● 異なる目的を持って行動する複数の個体
(人)が存在し,競合が生じる例を考え,競
合解消の方法を述べよ(コミュニケーション
を含む).
飛行機の離着陸(資源の拡大,集中管理(必要な情報を入手,頑健性))
体育館の使用(時間管理,ルール化),ロボット群によるスペースの利用
CIAとFBI(目的の競合,エージェントの統合)
自動改札(空間の競合,コミュニケーションによる解消?,改札を分ける)
テレビのチャンネル(優先度,先着順,運まかせ)
店舗(予防:先着順,競合が起きないようにする?)
歩道の人(位置検出,どけと言う)
焼肉屋(予防:負荷の制御)
エレベータ(ルール:降りる人優先→自己組織可能?)
混み合った店内(声をかける?),交差点(ルール化)
車両のすれ違い(ルール,合図)
スクランブル交差点(停止,動きをみて回避?)
人や車(追い越し車線,渋滞監視)
植民地分割(先着順,力による解決(非平衡が条件),平和解決),ロボット
地下鉄の改札(長くする?,先着順では?資源の拡大,ルール化)
電話でのメッセージ(時間的制約による競合,ルール化)
入室の際のすれ違い(優先順位のつけ方)
体育館(領域分割,時分割)
エレベータ(「降ります」)
サッカー(目的の競合?力関係)
二人以上での会話(早い者勝ち,優先順位,ルール,集中管理)
高速道路の合流(空間競合,ルールによる解消,推測,コミュニケーション?譲り合い,共通の認識)
座席(交渉?,資源の拡大)
交通渋滞・事故(ルール,環境の整備:予防,学習?)
スクランブル交差点(譲り合い,ルール)
込んでいる店(店員と客)(コミュニケーション)
競合解消の方法
空間資源の共有→時間軸によって解決
時間資源の共有→空間軸によって解決
(1)ルールを用いない解消(優劣をつける)
優先度
先着順(早い者勝ち)
ランダム(じゃんけん)
(2)ルールを用いる解消
Top-Down(誰かがルールを決める)
Bottom-Up(自然にルールができる,創発する)
そもそも競合が起こる系である場合
(1)入力を制限する(制御)
(2)資源を拡大する(システム変更)
(3)その他予防措置を講ずる
キーワード
予測,学習など
荷片づけ作業に必要な機能
 作業状況の管理
 作業分担の決定
 チームの組織化
 環境情報の管理
 動作計画
 相互衝突回避
 協調制御(同期)
 機能補完
 役割分担の決定
 故障時のバックアップ
荷片づけ作業
作業目標
移動ロボットによってすべての荷を部屋の壁際まで押して移動し片付ける
前提条件
荷の個数,移動ロボットの台数:複数
荷の種類
軽い荷(1台の移動ロボット
で処理可能)
重い荷(複数台移動ロボット
の協調が必要)
既知情報:荷の位置,形状
未知情報:荷の重さ
荷片づけ作業に必要な機能
●
●
●
●
●
●
●
●
●
作業状況の管理
作業分担の決定
チームの組織化
環境情報の管理
動作計画
相互衝突回避
協調制御(同期)
役割分担の決定
故障時のバックアップ
ロボットの行動モード
個別行動
軽い荷を処理するのに,単独で並列的に作業を行っている状態
協力行動1(依頼)
重い荷を処理するのに,他の移動ロボットに協力を依頼して作業を行う状態
協力行動2(支援)
重い荷を処理するのに,他の移動ロボットに協力し,支援しながら作業を行
う状態
待機
荷の処理を行わずに待機している状態
協調のアルゴリズム
協力行動
依頼あり
依頼なし
作業計画
(作業分担決定手法)
依頼あり
協力行動
個別行動
不可能
依頼なし
可能
協力行動
個別行動
一台のロボット
による作業
(衝突回避手法)
協力行動が
必要
作業結果
終了
Coordinato
r
Cooperatorの決定
(チーム編成手法)
Cooperator
Coordinatorの支援
(チーム編成手法)
複数のロボットによる協調作業
(同期動作手法)
シミュレーション実験
ロボット A
ロボット B
実作業実験
重い荷物なし
重い荷物あり
通信ログ
No.1: Sat Aug 12 19:41:51 1995
TO
: STMR****
FROM
: STMR0001
CONTROL: CLASS : CORE
TYPE
: COOP_NEGO_REQ
MESSAGE: REQ_PUSH 80 200 200 90
No.5: Sat Aug 12 19:41:56 1995
TO
: STMR0002
FROM
: STMR0001
CONTROL: 1
CLASS : CORE
TYPE
: COOP_NEGO_RES
MESSAGE: ACCEPT STMR0001
No.2: Sat Aug 12 19:41:52 1995
TO
: STMR0001
FROM
: STMR0002
CONTROL: 1
CLASS : CORE
TYPE
: COOP_NEGO_REP
MESSAGE: BID_PUSH 100 204 128 90
No.6: Sat Aug 12 19:42:55 1995
TO
: STMR0001
FROM
: STMR0002
CONTROL: 2
CLASS : CORE
TYPE
: OFFER
MESSAGE: ARRIVE
No.3: Sat Aug 12 19:41:53 1995
TO
: STMR0001
FROM
: STMR0003
CONTROL: 1
CLASS : CORE
TYPE
: COOP_NEGO_REP
MESSAGE: BID_PUSH 80 322 -200 179
No.7: Sat Aug 12 19:42:56 1995
TO
: STMR0002
FROM
: STMR0001
CONTROL: 2
CLASS : CORE
TYPE
: INQ_SYNC
MESSAGE: SYNC_MOVE 20 50 0 0
No.4: Sat Aug 12 19:41:56 1995
TO
: STMR0003
FROM
: STMR0001
CONTROL: 1
CLASS : CORE
TYPE
: COOP_NEGO_RES
MESSAGE: REJECT
No.8:Sat
TO
:
FROM
:
CONTROL:
CLASS :
TYPE
:
MESSAGE:
Aug 12 19:42:57 1995
STMR0002
STMR0001
3
CORE
SYNC
START
飢餓対処機能
思いやり機構
自分が助けを求めたいときに,まず他のロボットが助けを求
めているかどうかを確認し,もしその依頼があれば,自らの
作業を放棄し,他を助ける
仁
●
孔子の教えを一貫している政治上・倫理上の理想.博愛
をその内容とし,一切の諸徳を統べる主徳.天道が発現
して仁となり,それを実践すると,人事・万物すべて調和・
発展すると説く.
●
愛情を他に及ぼすこと.いつくしみ.おもいやり.博愛.慈
愛・
五常:儒教で,人の常に守るべき五つの道徳
仁・義・礼・智・信
朝倉文夫彫塑館の石庭
仁も過ぎれば弱となる
義も過ぎれば頑(かたくな)となる
礼も過ぎれば諂(へつらい)となる
智も過ぎれば偽(いつわり)となる
信も過ぎれば損となる
強化学習の概念
ロボットが回避行動を繰り返し実行することにより
適応的な回避行動を自律的に学習
学習の流れ
行動選択のスコア
・ 回避行動を 回避方向およ び回避速度で表す.
s
・ 回避方向 i およ び回避速度 j に対し てスコ ア ij を 導入する .
・ スコ ア は回避行動の選択確率を 決定する 指標である .
回避方向 i
0 ≦ i ≦ 7 : ( 8 方向)
回避速度 j
0 ≦ j ≦ 3 : ( 0 , 1 0 , 2 0 , 3 0 [cm /s])
状態表
取得情報 A
スコ ア表
.. .
取得情報 B
.. .
回避方向 : i
ス コ ア : s ij
.. .
回避速度 : j
.. .
回避行動の選択
ロ ボッ ト は選択確率にし たがっ て
ラ ン ダムに回避行動を 選択する .
回避行動の選択確率
rij =
sij
m n smn
i:
j:
回避方向
回避速度
→ 正規化
回避行動の報酬に基づく学習
回避行動の評価
評価値
E(t) =  d w (t) +  dr (t) -  dg (t) d w (t) : 障害物と ロ ボッ ト の距離
d r (t) : ロ ボッ ト と ロ ボッ ト の距離
 dw (t) = dw (t) - dw (t-t)
dg (t) : ゴ ールと ロ ボッ ト の距離
 d r (t) = d r (t) - d r (t-t)
 ,  ,  : 重み係数
 dg (t) = dg (t) - dg (t-t)
dg (t) : ゴ ールと ロ ボッ ト の距離
ゴ ール
d r (t) : ロ ボッ ト と
ロボット
ロ ボッ ト の距離
d w (t) : 障害物(
壁) と
ロ ボッ ト の距離
障害物( 壁)
ロ ボッ ト
状態認識に用いるパラメータ
学習の収束性
0.8
Ratio
0.6
0.4
0.2
0.0
0
200
400
600
Learning steps
800
1000
[times]
シミュレーション実験
行動選択の階層化
一つの物体を回避するための行動選択
各階層の学習
(a)ゴールへ向かうた
めの行動選択
(b) 一つの障害物を
回避するための行動
選択
(c) 一台のロボットを
回避するための行動
選択
(d) センサグループご
との複数物体回避の
ための行動選択
複数物体回避のための行動選択
通信特性
マーキング行動
レポート課題
● 異なる目的を持って行動する複数の個体
(人)が存在し,競合が生じる例を考え,競
合解消の方法を述べよ(コミュニケーション
を含む).