25章

〆
24章知覚
910
?
Ⅱ
日 Y
DE
日 X
日
Ⅱ
25
因巍.25随を背景に瓶を見るカメラ2台の視覚システムの鰭敵図.
ロボティクス
エージェントには,悪苔をする物理効果器がそなわっている.
b、テクスチャからの形状復元は,シーンに格子状の光縞を投影することで可能となる.
c、HuHman-Clo…のラベル付け法ではあらゆる多面体を扱うことができる.
。.曲面物体の繊面では,線のラベルは両靖で異なることがある.
e,あるシーンをステレオ視するとき,2台のカメラの位置力轤れているほど奥行き叶算
25.1はじめに
の輸度が向上する.
、シーン中で長苔の等しい線は薗像でも常に等しい長きで投影巷れる.
9.画像中の直線は必然的にシーン中の直線に対応する.
口承ツト
ロボット(rDbot)は,物理的な世界を操作することによってタスクを遂行する物理的なエー
ジェントである.そうするために,彼らは,足,11[輪.関節,グリヅパといったエフェク
24.10図24.23は高速逝路の出口レーンを走行する自動車の視点から撮影したものであ
エフェクタ
る.すぐ左手のレーンに2台の11エカ児える.このうち1台が,もう1台よりも近くに位囲
センサ
すると判断する理由は何か?
タ(e碇ctor)を義燗している.エフェクタは一つの目的をもっており,それは環境に対し
て物理的力を現すことである.1ロボットにはまたセンサ(sensor)が装愉きれており.その
結果,環境を知覚することが可能となる.現在,ロボティクスは,環境を計測するカメラ
と超音波,ロボット自身の運動を計測するジャイロスコープや加速度計を含むセンサなど
様々鞍セットを用いている.
今日のロボットのほとんどは,三つの主喪なカテゴリうちの一つに入る.マニピュレー
マニピュレータ
タ(manipulator),あるいは,ロポットアームは,たとえば,工場の組立て作業ライン,ま
たは国際宇宙ステーション鞍どの作業鯛に物理的に固定きれている.マニピュレータの運
動は,作業場内の任意の塒所にエフェクタ゜を移動可能にする[M1御可能な関節の全体連錘
を含んでいる.マニピュレータは,産業用ロボットの中では群を抜いて普及しているタイ
プであり,世界中で100万台以上肢置菩れている.ある移動マニピュレータは,外科医を
補助するため'二。痛院で使われている.ほとんどの自動、メーカは,ロボットのようなマ
、
ニピュレータなしでは存縫できないであろう.そして,あるマニピュレータは,オリジナ
ルの芸術作品を生み出すのに利用されてきた.
移動ロボット
UW
第二のカテゴリは,移動ロボット(mobilcrobot)である.移動ロボットは,】![鯖,脚ま
たはよく似た機撫を利用して,環境内を動き回る.彼らは,痢院で食べ物を運んだり.ドッ
クで積荷を動かしたり,同繊の作梁に利用きれてきた.先に,我々は,移動式のロポプト
の例に出合った.NAvLAB無人陸上移動体(unmanncdlandvduicle:IJIハノ)は,ドライバ
’Z章で,アケチュエータ(“tua8Dr)はエフニクタではないと目及した・アクチュエータは,エフェクタヘのコ
マンド塵知らせる69御ラインで.エフエクタは,物理、iなデバイスそのIDのである.(Ⅸ注:ロボティクスの分Bfで
は,必ずしもこの定碇は当てはまらず.ここでいうエフェクタがアクチニニータ-位を指す俎合が多い.エフニ
クタと券する培合は.むしろハンドなどをエンドエフニククを柑寸喝合が多く・作黛の効果の童嫁で使われる.)
・訳注:注Ⅱ中の訳注にしたがった ̄エフェクタロの使い方がを与れている.
郷一ごiZ=L空
912
蕊
,』l=)ulil 鼬
灘鶴
伊
(
塾
二瀞畠、
U
且ヴム。
$
■替臘
鑿豐
WI‘
壁
(b〕
(繩)
ヨーヒローー=--m=------ニーーーーニーーーニーー------
k劇A蝉ゾジャーーナ('鋤。u1m,甑):ln97年7jWに火襲鰯麹風を騨擬以二纐
倫ン籔嘩,蝿とA瓢馳Qのピューマノイドロポヅト・
_ ̄
--
-------
ljJW
AUV
寓懸歴]-(
ピューマ’イド
ロ|潔創卜
鮒運艤が可、龍である.他のタイプ“轤鋤画議ツトには,露ム窪中瀞鋤
遵樋,農薬散布,軍聯行動などに』剛に蝉っ,オiL莚い鎧。議允,薗鱒氷
瀧海擬謹に鑓おれ,そして,!」劉蛎J1い)に宗誉れてい遇ゾジ舗一う ̄
刺惑星口'一(,(pl…karユド『…感)として礎われて囎遜亀.
,、イプリッド型でロマニピュレー撹鞍装織してい愚瀞鋤式鋤'ロ瀬ツト
リ胴体部を真似した鞠馨鹸なデザインをもごヒューマノイド画ポット
愈心.図25.1(b)域,,圏率のホンダによって製造誉拠潅ぞ`M筥罰鍾塾
鰹アダ脅作m)警鐘愚ことができ墨が。飼遣型マニ蔭ユレー饗絢蝿つ瓢
蔀は‘義肢など鰯装置(人''1Mぬた蟻”人工的な【四ml糞,耳,、勘,郷'鯛
ン制_とアクチュェータを鍵癒してい愚謹鑓体),そし誼溌蝋鋤譲デⅦ
慰む。ぞこでは。蝋閥する小喜な群11ゴポヅトに鋲――て,ロ冒艫寸刷〕エ
]ポットを示す。ハイブリッド型I数,作撰鵜に1劃定暮れたマニ直ユレー
塾園|雛愈も”となる。
嚢跡
部,分的にしかiii、瓢審怠ず,醗率鮠蝋醐鮒。
---,H1ILpトー.旧恥菖
が-コ繭墾続胸睡瀞蝋Ili二鰔
曾ご鐵意ヅト鶴i蕊1A、鯉
,UTn
25章ロボティクス
912
9HPG
zii2□すIゼットハードウニア
愚であろう.しかもⅧシミュレーションと鍵蟻り,本当の衝霊腫実際{ニロポツトを傷つIブ
亀。蕊際のロポゾトシステムは,ロボットが速く学び,安全に動作できるように,ロボッ
ト自身や,その物遡的環境。篭して遊行するタスクに関する事前知謹を具体的に麗蕊する
必彊がある.
…==牙・ ̄--…=?、-- ̄ ̄ ̄:積潭も■,ご
エゴーェコ
25.2ロボットハードウエア
これまでのとこも率聾では,蕊為は,エージェントァーキテクチャーセンサザフ弩遙雲-:-
菫'鯏扇鮒f筑馴r辮墨
計堕11型iにiiiiiIゴー型_剛x湾靹一
二葬率
■■■---
(all
センサ
Ubl
鴫醐四ンU
図25'一](遜)NASAのソジヤーナ(SQjoubnCir):Iり97年7月に火星の表面を艤査した移
動ロポット。(l〕)ホンダのP3とASIhIO鯉ヒューマノイドロボット.
(pnlssiv…n圏。『)は,環境の蕊の観察満である。それらは,環境内の他の資源によって生
PiEMリセン判
喉しでimlii謹逝路⑳flit11通11繭がiiT能である。他のタイプの移動ロボットに)は,無人空中移動
U劇V
AUV
露昆ローバ
ロボット
中移動体くAUv)は,澱糠採光に纏われ,そして,図25ユ(a)'に示さ』}Lているゾジヤーナ
(SojQiu『mler)のように,惑騒ローバ(plmnebaryInvers)として使われている.
である.これらは人のlilil撚部礎興慨した物理的態デザインをもつヒューマノイドロボット
(h'1m'甑、',QidImhQt)を含む.|図25.1(b)は,日本のホンダによって饗造言れたそのよう葱2
である。b
レンジファイ
ンダ
ゾナー池シ噸
体のピューマノイドロポヅトを示す。ハイブリッド型は,作業鰯に固定きれたマニピュレー
が対象物体麗面で反嚇し‘その-甑がセンサに戻って<亀.戻ってきた信号の時櫛と強嘗
は,近くにある対鎮物体の霞籠の精報を伝える水亨のゾナーセンサ|は,無人水中移動弊
ロポテイグスの分離kjL,凝朧などの装置(人mのための人工的な四肢,耳‘眼汎知的
(AW)のた地の選択髄と塗る技術である.陸上では,ゾナーセンサは,角度分欝能の鰻界
な霧蕊(たとえばセン・ijとアクチュエーダを裟備している家全体),そして複数のポデポ
から近溌鯉⑳衝突回避に潮嗣罰L愚。ソナーの代わり陣,レーダー(航空磯で主として纏
われた)とレーザーを含む.レーザーレンジファインダ艫園濁,2に示されている.
いくつか⑳レンジセン4;は〃非常に蔑距鑑もし<ばかな1)鋤遣箪霞を計瀬する.近接の
からなるシステムを含む.そこでは〆際潤す尋小さな灘ロボットによって。ロボットのよ
界を扱うことによ愚繍梁である。ロボット'は,コーナーのまわりを見ることができず,迩
鋤指令はギアUDIスリップ'や醗擦による不鐘蕊剛性にllill約される。また。実世界では。リアル
タイムよli)'も連〈』作胴誉せもことを頑固に纒趣。シミュレーション蕊境では。単蕊なアル
ゴリズム(たとえば,21蕊で述べたQ学習(Q-l鰹almiI1g))を用いて,少しのCPU時間で
・何百万魁の試行から学ぶことができる。爽鰯境で,それらの試行を行うに1重.何年もがが
多くの移動ロボット'1』.近くの物体までの距離を測亀レンジファインダ(mngeHndEr)
を利1Mする.一つの共趣のタイプは,ソナーセンサ(sonar鰺sen塁orルまたは.趨蒼波卜
ランユデューサとして諭られている“ソヅーーセンサば,指向性のある脅波を発信し,それ
タよ!)も道'方にエフェクタを作lWjiざせ亀ことができるが,固定型マニピュレータがもつ勵
性がをいので,作蕊嘘Iml離職ものと塗る。
う窪行動が運jiji;書れ圏Ⅷ
実際のロボットは.部分鮒にしか魍翻できず。確率麓的Ⅷ動的.かつ遮読的な環境に対
処しなくてはいけ厳い“あるいくらかの,しかしすべてではないが,ロボット環j職は、,連
続的でかつマjレチエージェントである。部分躍翻、性と確率論的鞍健質喰,巨大で複雑嘘世
成ざれろ|iiljを捉え愚.ソナーのような能動センサ(融cti1M…nsor)は,エネルギーを環境
に迭!)込む。それらは,,`このエネルギーが反鰔きれてセンサへ戻場という鞭爽に依存する。
能動センサは,鍵動セン釧.よ')も多くの情報鞍提供する艤向があるが,それは,糟加すら
冠力消澱と多数のiii臘動センサが同時に使われるときに生じる干渉の危険のもとでのことで
ある。能動にしろ,受動にしろ。センサば三つのタイプに分けられ,それは,物体への躍
耀か,環境の全体Jのイメージか,またはロボット自身の属膣のいずれかを記録するセンサ
体(UAV)があり,監拠鯉蕊紘布,蕊Ii垳動などに共通に使われている.また,自律水
第三のタイ(プは,ハイブリッド型でⅧマニピュレータを装備している移動'式のロボット
ヒューマノイド
・ヒンサIdLIJポッ|、と蝿境のllliの知覚インタフェースであ掛カメラ鰯ような震動-センサ
股並セン゛峅
堂蝿嘩画1位シズ
デム
レンジのセンーリ・は,膣窒ひげをン器(whiskcr)。バンパー(bampp…l)と接鱗を感じる人
工」、蔓といった触覚センサ(tactill躍鶏、釦r)を含む。がたや,このスペクトラムのもう一方の
蝿は,全地球測位システム(91,⑳balp鱸ifiinningSySLGnm:GPS)で,パルス續号を発信する衛
腿への距離を測る。現在,鞠20歎圏の蝋適衛星があり,それぞれ異なる二つの周波数の信
号を総侭している。GPS受話器は,位相変化を分J肺することによって、これらの衛星への
0瞬躍:ロポティクュの分肝で'1A:”遇常.TVカメラなどの外界センミノーb闘塗jml1エンコーダなどの内界セン引内
そしてがヒンーlザなどのI11亙作厨センサの三つに分ける腸骨が多い.
白雛漉娼CL1MINAW摩Lion型lrlR麺Bingの略。
麗章ロボティクス
914
25.2ロポプトハードウエア
915
感じぎせる.良いセンサは.三つの並進と三つの回転の方向の力を測ることができる.
エフェクタ
エフェクタは,それによってロボットが移動し,体の形を変える手段である.エフェクタの
自由度
股Bfを理解するためには.自由度(degreeoffreedom:、0F)の概念を使って,理鴎的な動
きと形HIXについて鴎麓することが,第一に役立つであろう.我々は,ロボット,あるいはそ
のエフェクタの-つが,動くこと力可能な,それぞオL独立な一つの方向に.自由度を-つ
数える.たとえば,AUVのような,剛体で自由運動するロポプトでは,6自由度,すなわ
五日堺肢的奴臼
婆抄
(a)(b〕
勘力学的状皿
図25.2(&)SICK社のLMSレーザーレンジスキャナ,移動ロボプトによく利用されて
いるレンジセンサ.(b〕水平'二搭載されたセンサで行われ,二次元の環境地図上へ投影きれ
デイファレンシャ
ルGPS
ンシャルCPS(diHE塵ntialCPS)は,既jmの第二地上受償器をようして,理想の条件のも
とでミリメートルの輸度を提供する.不運にも,CPSは室内あるいは水中では作動しない,
毎伍センサ
垂要なクラスの第=のセンサは,掻像センサ(imagingsensor),すなわち,我々に環境
のイメージを与え.そして24章のコンピュータビジョンの技構を使って,環境のモデル
や特瞳を与えるカメラである.ステレオビジョンは,深き情報を捉えることができるので,
ロボティクスで特に正要である.ただし,距離画像化の新しい能動センサ技術の開発が成
功しており,その未来は若干不確定である.
因む感覚センサ
シャフトデ
コーダ
デコーダ(shaftdecDd画)を装鯛し,微増の動きにおけるモーターの回転数を計測する.ロ
ポットアームでは,シャフトデコーダは,あらゆる時間の期11Mにわたって正砿な燗報を提
可
距賎を計測する積算距離計(odomehy)として利用可能である.不運にも,唯輪I土流誉れ
滑る傾向があり,その結果,積算距離計は近距離の範囲でのみ正確である.自律水中移助
体への流れや無人空中移動体への風などの外力により,位囮の不確実性は1M大する.ジャ
慣性センサ
イロスコープのような慣性センサ(inertiaIsensor)は助けには在るが.自身では位箇の不
確実性の必然的な藩積を防ぐことはできない.
カセンサ
トルクセンサ
囿催閾毎
画、O脚笠
物体を吐くのに必要である.図25.3(a)に示すロポツトアームは6自由度を有し,そのう
ち五つは回転運動を生成する回転関節(rwolutejoint)によって生み出きれ,残りの一つ
は並進の動き駐生成する回動関節(prismaticjoint)によって生み出きれる.単純な実験に
よって,全体としての人の碗が6自由度以上にあることを確かめることがでる.テーブル
に手をおいて固定したまま,肘を回転きせるための自由度があることに気づくだろう.目
標位画にエフェクタをもっていくのに必要な自由度以上の自由度を布するロボットは,最
低限の自由度しか有苔ないロポプトよりも制御しやすい.
移動ロボットにとって,自由度は,必ずしも可励要素の数と同じではない.たとえば,平
均的な噸を考えよう.二つの自由腰があることで,前後への移動と旋回が可能である.対
第三の肛要なクラスは,固有感覚センサ(pmprioCeptivCse…r)で,自身の状M1$をロボッ
トに伝える.ロボットの関節の正確な角度を翻るために,モーターは,しばしばシャフト
供することができる.移動ロボットでは,車輪回転を知らせるシャフトデコーダが,走行
狼尊pEHH8f
運動学の次元のそれぞれの変化の倒合のための追加の次元を含む.。
非国体の身体では,ロボット自身内に遮加の自由度がある.たとえば,人の腕で.肘は
一つの方向で曲げることができ.1自由度を有する.また,手首は,3自由度あり,それ
は,上下ならびに左右に動き,吾らに回転することができる.ロボットの閲筋は,それぞ
れ,1,2または3自由度を右する.6自由度は,手のように,任意の位圃に任意の姿勢で
たレンジスキャン.
距薩を算出することができる.複数の衛星からの僑号を三角樹趾することによって,GPS
受話器は,数メートルの輔度でこの地球上で絶対位置を決めることができる.デイファレ
ち.空、l内の位、(ェ,",童)の3自由度,そして,旦二,どプチ.とロー上として知られる
回転軸方向の3自由度である.これらの6自由度は,斑■鐸的状態(kinematicState)を2定
義する.あるいは.姿勢(pose)を定蕊する.ロボットの動力学的状鴎(dynHmIiCstaLe)は,
看==
R
ボットに感じきせる.そして,トルクセンサは,それがどのくらい硬く回転しているかを
鯵
(a)(b)
図25.3(。)スタンフォードマニピュレータ,五つの回転関節(R)と-つの直助関筋(P)
をもち,合8t6自由度を布する初期のロポツトアーム.(b)簡給操舵の四輪11[の非ボロノ
ロボットの状態の他の遮要な側面は,カセンサ(Ib『cesensor)そして,トルクセンサ
(to画uesens。「)によって測られる.これらは,ロボットが壊れやすい物体や正確な位inや
形状が未知の物体を操作するとき,絶対必要となる.緬球を差し込んでいる1トンロボッ
トのようなマニピュレータを想像しよう.過大な力を適用して電球を壇すことは,まった
くもってあまりにも簡単である.力センサは,睡球を持ってどのくらいそれが硬いかをロ
'
’
ミックな運動.
z、ki噸maLIcnはギリシア柵のhl8Hの理動からきている.鰯シネマロも同樺.
。Ⅸ注:本来の動力学的状國は.買沮や加辺血などが含まれ.ここでいう則臆な速度だけが迅加与れるもので'よ
ない、
(
25章ロボティクス
916
25.3ロボットの知覚
917
照的に,噸の運動学的配低は3次元である.人は,オープンの平面上で容易に,任意の位
打弛ロ中應
Q39U可睦自由庇
非ホロノミッケ
固(工,J),任意の向きへJKを導くことができる(図25.3(b)参照).このよう'二,唯は,三
つの有効自由度(eHGctiv巳dCgreesofhPedom)をもつが,そのうち二つが制御可能自由度
(contFo1labled噂eesoffteedom)である.ロボットが制御可能自由度よりも多くの有効自
由度をもつとき非ホロノミック(nonholonomic)と称し,自由度が同数のときホロノミッ
ク(holDnomic)と称する.゜ホロノミプクなロポプトは,たとえば,前辿後退に加え欄に一
瞬にしてスライドできれば,駐車はもっと楽であるという意味で,制御がより容易である.
しかし,ホロノミプクロポットは擾繍的により複雑である.ほとんどのロボプトアームは
ホロノミックで,ほとんどの移動ロボットは非ホロノミックである.
移動ロボットのために,車輪,軌逝,脚を含む移動のための鯛広いメカニズムカ艀在す
デイファレンシャ
ル囮■』
る.デイファレンシャル駆動(。、画通mtialdri蝿)のロボットは,皿のタンクのように二つ
の独立駆動の車給(または軌逝)を有する.もし両方の叩轄が同じ速度で動けば.ロポプ
シンクロ囚廸
トは迦進土鼻.もしそれらが逆方向に動けば.ロボットはその場で雄回する.これに代わ
るものは,シンクロ駆動(symchmdrivG)である.それぞれの吋鴫は移動し,自身の粕まわ
りに回転できる.これはすべての車給が同じ方向を指し,同じ速度で移動するという拘束
がなければ.いともNiijliに鴬秩序状悪にいたるだろう.デイフアレンシヤル駆動もシンク
ロ駆動も両方とも,非ホロノミプクである.少し高価なロポプトは.通常,三帖か四輪が
独立に膣回移動可能なホロノミプクロE動を用いる.
脚は,車輪と違って.非常'二凹凸のある地形に対応することができる.しかし,脚は平
面では周知のとおり遅く,そして,擬鱒的に桶築が困蝕である.ロボティクス研究者は,
1本脚から数十本までの多脚の股計を試みてきた.脚ロボットは,歩き,走り,そして苔
血坤妾弔匡
とができるということを意味する.動かない状鰹で直立を保持できるロポプトは,静的安
卸的安宝
一般的に.センサ信号には雑音(ノイズ)が含まれ,環境は部分的にしか観測できず,予
バーきれる多角形内に入っていれば,ロボットは静的に安定している.
測不可能で,しばしば動的であり,知覚は困雅である.大抵は,良い内部蕊現は,三つの
エータ
逵匡アクチュ
エータ
性質をもっている.それらは.ロポプトが正しい決定をするのに十分な情報を含み,能率
動体は,たいていプロペラまたはタービンを使う.小型軟式ロポプト飛行船は,自身を空
的な更新力河龍なように構造化きれていて,内部の変数カ輪理的な世界での自然な状態変
中高<維持するために,熱運動に依存する.自律水中移動体は,潜水艦で使われたものに
数と対庵する,という意味で自然である.
類似しているスラスタをしばしば使う.
15章で,我々は,カルマンフィルタ(Kalmanmeter),隠れマルコフモデル(HMM)と動
的なペイズネプト(dynamicBay巴sne8)が,部分観測の環境の遷移とセンサモデルを表すこ
センサとエフェクタだけでは,ロポプトは作れない完全なロポプトは.エフェクタを
空気圧アクチユ
知覚は,ロボットがセンサによる聞定結果を環境の内部表現へマププするプロセスである.
定(staticanystabIe)とよばれている.、心を地面に投影したとき,聴地した脚によってカ
他のタイプの移動ロボットは,動き回るための広範な異なるメカニズムを使う.空中移
ご動モータ
25.3ロボットの知覚
らに.図25.4(a)でみる脚ロボットのように.跳びきえするように作られてきた.このロ
ボットは動的安定(dynamicanystable)であり,跳んでいる1mは,直立したままでいるこ
駆動する動力源を必要とする.電動モータ(eIeCtricmotor〕は,マニピュレータの動作や移
動のための最もポピュラーな機榊である.しかし,圧緬ガスを用いる空気圧アクチュエー
タ(pneumaticactuation)や,与圧ぎれた漉体をもちいる油圧アクチュエータ(hydmulic
actuaLion)は.それらな')の応用の適所をもつ.ほとんどのロポプトは,ワイヤレスネッ
とができることを理解した.我々は,環境状態変数の事後確率分布を表す信念状瞳(belief
state)を更新するための,正確もしくは近似のアルゴリズムについて述べた.このプロセ
スのためのいくつかの動的なベイズネットモデルは,15章で示きれた.ロボティクスの課
トワークといったディジタルコミュニケーションのいくつかの方法をもっている.最後に,
こまごまとした部品すべてを取り付けるための身体フレームがなければならず,緊急時の
題では,図179で示巻れるネットワークでのように,我々は,そのモデルの観察変数とし
てロボット自身の過去の行動を通常含む.図25.5は,本章での配法を示す.Xtは時mltで
の環境(ロボットを含む)の状襲を,Z`は時岡#での観測を。そして,AIは観測力鵯られ
ハンダゴテもなければ在らない.
たあとでとった行動を表す.
白眼注:正確な定畏は以下である.ホロノミプク.非ホロノミプクとは.力学的拘束を分13Iする1mmである.い
室.力学系の拘束条件を考える.拘束条件は.一般'二システムの座低(位固.姿勢)と60m,そして巴揮の町、
微分すなわち2Bi[・カロ連H2などの方程式として衷邑れら.この拘束条件が座1K(と時問)のみで毘述きれる掛合D
・ホロノミプク(holonomic)鱒と固い,そうでない場合02すべて・卵ホロノミプク(“かholo軌。mlc)鰯とロゥ.
フィルタリング(nltemmg)のタスク,あるいは,信念を更新することは#15章で述べた
ことと本質的に同じである.タスクは,新しい信念状態P(x`+llz1惑十,,⑭,:c)を。現在の
偲念P(XOlz1:*,αu:1-1)と新しい観測zE+,から計算する.主な違いは,(1)観察と同様に,
行動にも明示的に条件をつけること,そして,(2)今,鐘Ek変数よりむしろ迎続変数を扱
ノ
25軍ロボティクス
918
25.3ロボットの知覚
919
/
/
Xq山一
一〆
トー.
-舐け
■■「□
1--グ
ド・」
P.■可
■■
凡
■
L・P~).:---..
F.‐.‐.;.・・..~.-..ハP-...か,_
+、.-■「..『
1:. ̄., ̄?いむP『[、串
10.、L『、--.巴一一.つよ----ムユムニエニ-回.で--.---一一
Hr
(a)(b)
図塑.5ロポプトの知覚は,この動的なペイズネットワークによって興明きれるように.
行動と濁定の系列からの時間的推箇と考えられる.
図辨.6(a)111純化各れた移動ロボットの運動学のモデル.ロボットは,薗方を示すマー
クがついた円として表されている.時刻8とt+lにおける位置と向きI土,Uc△cと唖△c'二
よる更、fで表きれている.また,時刻2で餌商した位趣(ェ.,"`)におけるランドマークも示
きれている.(b)レンジスキヤンセンサモデル.与えられたレンジスキヤン(z1,zz,z3,割)
わなくてはいけないことである.このように,我々は,韓和よりも穣分を使うために,iMi
帰的なフィルタリング更新式(15.3)を修正する:
'二対して可能な二つのロポプトの姿勢が示きれている.左側の姿勢のほうが右側の姿野よ
りも.よりレンジスキャンに適合している.
P(xt+l1z1:`+1,q1:0)
-.P(…,,x端,)/P(x`瓢'…)P(x`'遥'…‐…(露』)
この式は,時刻t+1における状lZl変数Xの。Z後砿率が, ̄時刻前に対応する推定価か
ら再帰的'二計算各れることを示している.このBf算は, ̄時刻繭の行動@$と現在のセンサ
測定結果zc+1を含む.たとえば,もし我々の目標がサプカーをするロポプトを開発するこ
となら.xt+nは.ロボットに対するサプカーポールの相対的な位撞になるだろう.騏後確
心.最後に,我々はロポプトに童地悪できて,ロポプトが位健決めしたい対熱物体を ̄誘
キッドナプピン
グ間、
物願を単純に保つために,ロボットが平面上でゆっくり動き,環境の正確な地図が与え
ポプトの姿勢は,図25.6(a)に示すようにデカルト座標韮とpと進行方向を示す0によっ
て定義ぎれる(我々は対応する速度を除外する.すなわち,動的モデルではなく運動学的
ジ)とロポプトヘの運動指令を漸次的に組み合わせることで,この位、をいかに再帰的に
モデルであるノ).もしベクトルでそれらの三つの値を整えれば,どんな特定の状悪も,
推定するかを我々に伝える.確率P(X`+l1xG,○$)は,遷移モデル(tmnsiLionmodel)あ
るいは。運動モデル(motionm○.CO)とよばれ,P(露`+llXE+')は.センサモデル(sensor
modeDである.
X`=(室0,J`'0`)Tによって与えられる.
運動学的近似では,それぞれの行動は二つの速度成分の爵聞の記述からなる.すなわち,
並進連lBE成分陸と回転速度成分恥から揮成きれる.微小時間△tの岡の,このようなロ
ポプトの運動のおおまかな決定蛤のモデルが以下で与えられる:
位翻決め
位■茨00
…w(削瀞)
位置決め(IOC麺zation)は,ロボットの知堂の一般的な例である.それは,駒がどこにある
かを決定する問題である.物がどこにあるかについての知職が,あらゆる物理的な相互作
用の成功の核心にあるので,位団決めは,ロボティクスの殿も広範な知覚問題の一つであ
Xは,決定蹟的状態予測を表す.当然,物理的なロポプトはある程度予測不可能である.
これは,共通して,平均'(xgDth、⑩`).共分散四審のガウス分布でモデル化誉れろ(数学
る.たとえば,ロボットマニピュレータは,操作する対象物体の位皿を知らなくてはなら
ないし,ロボットナビゲーションでは,目棉鳴所に到達するために,自分がどこにいるか
を知っていなければならない.
的定義は付録A参照):
P(X`+1lx`,DC,凶`)=Ⅳ(Xc+Ⅱ,函零)
位置決め問題は,ますますj11犬する三つのタイプの困難がある.もし位歴決め暮れるべ
追跡
大同、○t位軒碧功
き対象物体の初期位歴が既知であれば,位団決めは追跡(tr[Dcking)問廻となる.追跡聞
腿は,有界の不確実性によって特徴づけられる.より難しいのは大局的位固決め(global
Iocalization)で,そこでは,対象物体の初期位陞はまったく未知である.いったん興味あ
る対象物体が位置決めきれたなら,大局的位舩決めIIU四は,追跡問題に蜜わる.しかし,
この問題も。ロボットがかなり広範な不確実性をうまく処理する必要があるフェーズを合
ば撞靖な条件のもとで位置決め技術の頑強性を試すために使用きれる.
られると仮定しよう(このような地図の例は,図25.8に見られる).そのような移動ロ
率P(Xflz1露,。B蝿-1)は,過去のセンサ溜定と制御から我々が知っているものを捉えたす
べての状悪に対する確率分布である.式(25.1)は,センサ測定(たとえば゛カメラ・イメー
■、モデル
拐一(Iddnap)することができる.このような素直でない条件の下での位歴決めは,キヅド
ナプピング問題(kidnappingProblem)として知られている.キプドナッピンクは,しばし
次に,我々はセンサモデルを必要とする.ここでは,2種類のセンサモデルを考える.最
ランドマーケ
初のモデルは,ランドマーク(Iandmark)とよばれる室室かつ堕壁亘堕な環撹の特濁tをセ
ンサカビ検出すると仮定する.それぞれのランドマークについて,位置と方向が報告苔れる.
ロボットの状態がxc=(毎0,,t,,c)Tで位置(垂1,Ji)Tが既知のランドマークを観測するとし
ノ灰注:再度示すが,NBH[力叺ったとしても辺且力学レベルの範鰯である.質且,重力、加速皮などが零匹されな
い限り.通常,動力学的モデルと拝しない.動的と動力学的が混同ぎれているようである.
25章ロボティクス
920
25.3ロボットの知覚
921
よう.雑音がなければ,距雄と方向は,単純な幾何学によって:i算可能である(図25.6(a)
参照).観測きれた距離と方向の正確な予測は以下で与えられる:
lmnctlomMoNTE-CARm-LocALIzAnmoN仏弓jVbmod2L而血p)唾tumsaseLofsamplcs
inputB:。,ChepTevTousmbotmctioncommand
z,Br卸、g巳s頃、with卿rE&。、&】尾1b…0重&■
JVlthcmlmberof5nmpI閏LobemEEiht母msd
modセムユpmb巳bil画ticcnvlmnmentmcdelwithposeplmrP(XO),
■
.…W(鰯輿鯏藝)
(
)
mctionmodelP(XhlXo,do〕,andrangese画sornoisemodolP(ZIZ)
m⑨PC⑧2DmaPoftheenvimnmmt
BtntIc:Sha物ectorof&Bmpl圏o【size凡initiaUyg”e“1s。“mP(Xo)
IC函1"rlable3息砕;a殖ctorcfwもigh崎ofBiz⑥jV
再び,雑膏は我々の測定を盃ぬる.物邸を単純に保つために,共分散Z塵のガウス雑音
を仮定しよう.
P(z4lxl)=」v(急0,理)
lbrd=ltoJVdo
いくぶん異なるセンサモデルは,図25.2で示ぎれろ種類のレンジスキャナにしばしば適
Sli]_“mple鮠mP(XoIXo=8181,A。=。〕
w[il←1
する.このようなセンサは,距離のベクトルz,=(露2,...,墓材)Tを生成し,それぞれの方
fbrj=1,Mdo
向はロボットに対して固定である.いま,姿勢x8が与えられ,そこから最近傍の障害物に
綿RgYH;IVuw寵ミ'2,鯉)曇)
対して鏑j番目のビーム方向に沿った距離の伍巧が観測きれたとしよう.以前のように,
S-WE[clZTED-SAMPLEPWITTK-REPLAcEMENT(」VbSh町
これは,ガウス雑音によってなぎれるとしよう.一般的に,異なるビーム方向のエラーは,
独立で同等に分布きれるとしよう.そうすると,以下が得られる:
rcCurmS
IW
P(露`|x`)=。Ⅱe-1露,‐`'''2.,
図25.7独立雑音をもつレンジスキヤンセンサモデルを利用したモンテカルロ(Montc
Cnrlo)位匠決めアルゴリズム.
j-1
図25.6(b)は,4本ビームのスキャンの例で二つの可能な姿勢を示している.一方が観
測きれた距曜他のベクトルの生成力[理にかない,他方はそうではない.レンジスキヤンモ
デルをランドマークモデルと比べると,レンジスキャンモデルでは,レンジスキャンの解
的形化
デルの糠形化の概念を脱明している.左側では,非線形運動モデルバx1,。‘)を示している
釈の前にランドマークを同定する必要がないという優位性がある.実際,図25.6(b〕で
は.ロボットは,特徴がない盤に直面している.一方,目に見え,同定可能なランドマー
クがあると,それは即座に位低決めを提供できる.
15章では,カルマンフィルタ(Kalmanlilter)とパーテイクルフィルタ(p③ェticlefilter)
について述べた.前者は,単一の多蜜且ガウス分布として侭念状悪を表し,後者は,状態
に対応するパーテイクルの築合で個念状態を表す.最新の位匝決めアルゴリズムは,ロボッ
モンテカルロ法
による位■決め
トの侭念P(xOlzn:`,⑥、:`-,)の二つの表現のいずれかを使う.
パーテイクルフィルタによる位世決めは,モンテカルロ法による位置決め(MonteCarlo
localization:MCL)とよばれる.MCLアルゴリズムは,本質的に図15.15のパーテイクル
フィルタアルゴリズムと同じである.必要なすべては,適切な運動モデルとセンサモデル
リズムは,通勤モデルとセンサモデルを線形化する(linearize).鶴形化は,非線形の関数
を1次関数によって局所的に近似することである.図25.9は,(1次元の)ロボット運動モ
(制御。8は線形化では何の役目も果たしていないので省略してある).右側では,この関数
は鯉形関数'(x`,醜)で近似されている.この1次関数は,時刻tにおける状態推定の平均
テーラー風団
脾`でのノの接線である.このような線形化は,(1次の)テーラー展開(T油yloreg<pansion)
とよばれている.テーラー展開を介してノとAを線形化するカルマンフィルタは,拡襲カ
ルマンフィルタ(egEtcnd⑪dKalunanfiIter:EKF)とよばれている.
図25.10は,拡張カルマンフィルタ位匠決めアルゴリズムを走らせたときのロポプトの
推定の系列を嚢す.ロボットが進むにつれて,誤差楠円力f示すように,ロポプトの自己位
瞳推定の不硫実性が期す.その誤差は,位置が既知のランドマークとの距擢と方向が観測
できたとき減少する.ロポプトがランドマークを見失ったとき,誤差は最後に再びTIIえる.
を供給することである.図25.7に,レンジスキヤンモデルを利用した-つのバージョンを
ランドマークが簡単に同定きれれば,EKFアルゴリズムは十分にはたらく.そうでないと
示す.アルゴリズムの操作は,ロポプトがオフイスビルの中で自分がどこにいるかを発見
するときの様子として,図25.8で鋭明きれている.斌初の画像では,パーテイクルは,率
IMI確率に善づいて一概に分布し,ロポプトの位団について大局的な不確実性を示している.
二番目の百像では,測定の最初の築合が到薪し,パーテイクルは,高いコト後信念の領域で
クラスタを形成する.三赫目では,すべてのパーティクルを-カ所の位瞳に押し込むのに
問題の例で,15章の終りに眼蛤した.
十分な観測が利用可能である鰯合を示す.
カルマンフィルタは,もう一方の位睡決めの主要な方法である.カルマンフィルタは,ガ
ウス分布によるI11後砿率P(xI1z1:`,。U麺-Ⅲ)を表す.このガウス分布の平均は焼で,共分
散はz8である.ガウス個念の主な問題は職形の運Eカモデルノと圏定モデルハの下に閉じら
れているという点のみである.非總形のノまたはAに対して,フィルタの更新繕采は,通
常ガウス分布にしたがわない.したがって.カルマンフィルタを利用した位置決めアルゴ
きは,図25.8(b)で示したように,駆後分布は複数のピークをもつかもしれない.どのラ
ンドマークであるかを知っている必要があるという問題は,データ連合(dataassociaticn)
地図作成
これまでのところは,我々は.単一物体の位匠決め問題を騒箪してきた.ロボティクスで
は,しばしば,多くの物体の位囲決めが求められる.このような問題の古典的な例は,ロ
ボット用の地図作成である.環境地図力r与えられていないロボットを想像しよう.むしろ,
ロボットは自身で,このような地図を櫛砿する必要がある.明らかに,人類は,我々の惑
塁全体'二及蕊ほどのほど大きい場所の地図作成するための驚くべき技術を莞達ぎせてきた.
鴻寧ロボティクス
922
923
25.3ロボットの知覚
JQDI
hIoU
し-4J、 f叩
P■Pq=P_四■ロ,●ロ。,-0,0_■B-
sblI
---_$
、
、
~ ̄
/
、
/
咄
jt難。j-坪磯②)+FKJUb-的)
コェさ
し-野。』
〆~、
劇
Oも 、
●■
ローm=戸
;呂・0.、
、
フ
 ̄Hf
ノ
い■
ノ
 ̄為
エ「
S、
(⑪)(b)
図25.9線形化苔れた運動モデルの1次元喪示:(&)関数ノと,その平均IgG,共分肚の
間隔(ヨ`に基づく)の時刻[+1への投影.(b)線形化バージョンは暁におけるノの接
鍵.平均糾噂の投影は正しいが.投影邑れた共分散五c+】はZc+’と異なる.
j
曰
く
、b⑩8
----0---
●ひB
G
P
土
。
S
9
-6冊骨
-6-e‐
■守
と日企画士
/,b
巳、...
。
RDbc8Po$iti・Fn
回25.10拡殻カルマンフィルタを用いた位歴決めの例.ロポプトは迩纈上を鯵lUbする.
誤差櫓円が示すように,進むに連れて不確実性が潮す.ロボプトカ粒砥が既知のランドマー
■
ク■
O
OS
分
B
クを観翻すると,不確実性は減少する.
や
それで,ロボティクスの自然な問皿は,ロボットが同じことをすることを可能にするアル
ゴリズムを工夫することである.
j
⑩
囚U卑世亜塾功迫
回作成
文献では,ロボットの地図作成問題は,同時位画決め地図作成(SimultaneousIoc凶ization
andmapping:SLAM)として参照きれている.ロボットは地図を綱成しなくてはいけない
h
・■
POP
輌
戸
』
■
Ⅱ●巴
PL
十
かに悪化する.
銃計学の観点から,地図作成は,位腫決め問題と同じく,ペイス推定凹阻(Baycsi圏、i、‐
fbrBme)である.もし以前と何じょうに,地図をM・時刻tに鱈けるロボットの姿勢をXi
声△
↑
Ⅱザ
と表せば,我々は,駆後確率の中に全体地図を含めるために,式(25.1)を密きなおすこと
ができる:
P(X`+,,Mlzn:`+、,。]懇)
ロ」
1|」
III-誤旱
一▲
可
-LL日‐』
’141
ⅡP
.LⅡ田山Ⅱ0■P。r冒可」■『rⅡ
ョ』
む
11‐しIF‐
□9十
ずldi
甲一‐し‐
ⅡT
P
PB
r
刀▲|
F
P弓冒
一-勺■}
.L■ユBr・I■rj.
■I□『・
火
一‐‐1-‐
q7町.
■中‐
-‐。』一
P
繍「’’1’1
岳
』」
|1日
ヨエーー
lT#。.□
』‐■pPJ爪・pP菫■夕日P凸一■■F‐」
弓
bP■宮と
■
P
一・・‐。.Ⅷ-:い]「..L
-0PlPLpJ‐11dB■■■01■pI-リーLP-P1-■寸・1L0■‐I‐山円■■Ⅱ‐-・し』Lglpd■かⅡ-10■
というだけではなく,自分がどこにいるかを知らずにそれをしなくてはいけない.SLAM
I土.ロボティクスの核心問題の一つである.我々は,環境力個定であるケースを考えよう.
これは十分に困霊であり,ロポプトの移動中に環境変動が許ぎれたなら,状況はよりはる
C
I
I
図Z5.8モンテカルロ法'二よる位回決め(McnteC"lolocnl陸ntion).移動ロボット位
置決めのためのバーテイクルフイルタアルゴリズム(particIc-liI魎山Borithm).(⑥)初期で
の大局的不確爽性.(b)(対称の)鹿下を移動したあとに得られた近似的に二つの鱒をもつ
不確実性.(c)特歓的なオフィスに入ったあとの単峰の不随実性.
‐。P(…'x…)/P(x鎌』MP(露"jwl…-1)`麹
この式は,実際にはある朗報をもたらす,行動と測定を取り入れるために必喪と答れた
条件付き分布は,ロボットの位、決め問題と本質的に同じである.主な注意は,新しい状
態空間一ロボットのすべての姿勢とすべての地図の空ml-が吾らに多くの次元をもっ
ているということである.あなたが写真の品質でビル全体を表現したいことを想像してみ
よう.これは,数値の数字をたぶん必要とするだろう.それぞれの数字は,確率変数になっ
戸口
25章ロボティクス
924
25.3ロポプトの知覚
925
て.そして状鐘空岡の非常に高い次元に貢献する.この問題を一層困鍾にするものは,ロ
ポプトカ噸もってその環境がどのくらい大きいかをきえ知っていないかもしれないという
事実である.このように,卿の次元は,地図作成の岡に動的に閏圃される必要がある.
たぶん,SLAM問題のための鰻も広く使われる方法は,拡張カルマンフィルタ(EKF)
である.それは,通常,ランドマーク態知モデルと組み合わ暮れ。ランドマークはすべて
識別できること力泌要である.前節では,vl後推定価は平均殿と共分散二$のガウス分布
一------0--$
い
、
’
--------⑨--0-‐
●
 ̄
によって表現きれた.SLAM問題に対する拡裂カルマンフィルタ手法では,Ill後推定価は,
再びガウス分布となる.しかし.今度は,平均晩ははるかに大きいベクトルである.そ
れは地図中のロポプトの姿勢だけでなく,すべての特駁(またはランドマーク)の位旺も
含む.もしそのようなDB掴の特厳があれば,このベクトルは,2池+3次元と獲るであろう
●●●●
@
; $I
 ̄
 ̄
#
B■●●
(特蔵の位画の指定に2,ロボットの姿勢に3必要).したがって,行列ECは.(2,+3)x
(2"+3)の大きぎをもつ.それは以下の檎適をもつ:
②…(塞劉:)㈱
(③)(b)
ここで,Exxは,ロボットの姿勢の共分iiiで,それは位陞決めのところですでに触れ
た.四Jwは,地図中の特徴とロボットと座標の間の相関を表す,大きぎ3x2fUの行列
である.量後に。zafMは,すべてのペアの相関藍含む地図中の特蔵の共分舷を規定する,
大きぎ2nx27Uの行列である.拡擾カルマンフィルタに必要な麗憧容量は.地図中の特騒
の数mの2次のオーダであり,更新時岡も同じく価の2次のオーダである.
数学的欝翻に立ち入る前に,図式的に拡襲カルマンフィルタの解を閏べてみよう.図25.11
は,四つのランドマークが二列に整えられた八つのランドマークがある環境内のロボット
を示している.段初は,ロボットは,どこにランドマークがあるかについてば蚤ったく知
らない.それぞれのランドマークが異なる色であること,さらに,ロボットがそれらを憎
頼性高<,どれがどれであるか見つけることができると想定しよう.ロボットは,明碗に
定義ぎれた位旺から左側へg出発する.しかし,自身がどこにいるかに閲して,徐々に確
実性を失う.これは,図25.11(a)の誤差楕円で表きれ,その幅はロポプトカ愉進するごと
に噸す.ロポットカ勘<たびに,近くのランドマークの距離と方向を感知し,これらの観
測は,ランドマークの場所の推定値を導く.当然,これらのランドマークの位凪推定の不
確実性は,ロボットの位囲決めの不確実性に密に関連する.図25.11(b),(c)では,ロボッ
ト力彌境内を答らに移動していったときの,ロボットの佃念を表している.
図式的な表現からはまったく明らかでない,これらすべての推定価の愈要な騨細は,す
べての推定値を単一のガウス分布で保持しているというIII実である.図25.11は,この
ガウス分布のロボットとランドマークの座標の部分空間への単なる写像にすぎない.この
噸後多変壁ガウス分布は,すべての推定他の岡で相関を維持する.この見方は,図25.11
(。)で何力握こるかを理解するのにⅢ要である.ここで,ロボットは,以鯛に地図に写像
きれたランドマークを観測する.結果として.それ自身の不確実性はおそろしく縮退する.
他のすべてのランドマークの不確実性もそうである.これは,ロボットの推定価とランド
マークの推定if【が,噸後ガウス分布において,高い相関があったという躯実の帰結である.
一つの変数(ここではロボットの姿勢)に関する知職を見つけたことが,他のすべてのも
ので不確実性を自動的に減少苔せる.
白択注:右甸への同追いか?
 ̄ ̄■■■■■ ̄
■
0
(c)(。)
図25.11ロボットの地図作成問Ruに適用きれた拡弧カルマンフィルタ.ロボットの経路
は点鯉で,それ自身の位圃の撞定鐘は,灰色に塗られた橘円屏である.位陞が未知の八つ
の戯別可館なランドマークは.小邑な点として示きれ,それらの推定位画は白抜きの概円
醇で示きれている.(a)から(c)では,ロボットの位、の不錨爽性は,それがIHI会うランド
マークについてのその不鬮爽性の墹加につれ,同樺にjUえている.これは.地加する不確
実性で地図上に作成きれる新しいランドマークに出合い鋭ける限り鋭く,ロボットは,(。)
で最初のランドマークを関知し,そして,この瞬皿,すべてのランドマークの不確翼性は,
鍵定価が相関関係をもつと1,,うWI実のおかげで減少する.
地図作成のための拡製カルマンフィルタアルゴリズムは,前節での位肚決めのための拡
張カルマンフィルタアルゴリズムに似ている.ここでの主要な通いは,癖後確率に加えら
れたランドマークの蜜数から生じる.ランドマークのための運動モデルは,些細である.
それらは運動しない.関数ノは,それゆえに,それらの変数のための恒騨関数である.測
定関数は,本質的に以前と同じである.唯一の迎いは,拡張カルマンフィルタ更新式のヤ
コビ行列(Jaoobinn)H`がロボットの姿勢に閲してだけでなく,時IHIZで観測ぎれたランド
926
25章ロボティクス
マークの位置に関してもとられるということである.その結果得られる拡頚カルマンフィ
から鏑へ箱を押すロポプトである.
我々は,まず動作計画問題力配述かつ解決可能な適切な表現を見つけることから始める.
ルタ式は,以前に税明きれたものよりも恐るべきものですらある.それで,ここではこの
ロボットの位睡,向き.関筋角で定蕊きれるロボットの状211空間であるコンフィギュレー
理由のために単純に省こう.
しかし.そこには,これまで我々が静かに黛視していた別の困縫がある.地図のサイズ
胚が前もって知られていないという駆実である.そのため,l」[とzdの最終推定時の要
紐飽計画
緊の数も,同禄に未知である.ロポプトが新しいランドマークを発見するたびに,それは;
動的に決められる必要がある.この間翅への解決策は,非常に単範だ.ロポットカ噺しい
鶴的(Continuous)な空岡を含むということである.経路計亘のロボティクスの文献は,滴
次元の連続空間での経路発見を特に目指して,様々な異なる技法を区別する.アプローチ
は,ロポットカmilもってランドマークの存在を知っていたのと同じである.
の主要なファミリーはセル分解(celldecompomtiom)と骨格化(skeletonization)として知
他のタイプの知覚
同定することで,離散的グラフ探索問題に縮退きせる.本鰯を通じて,我々は,運動が決
定詮的で,ロボットの位回決めが明確であると仮定する.そのあとの節で,これらの仮定
られている.それぞれは,連続的経路計画IMI題を,自由空、内での標独的な状顛と経路を
ロポプト知覚のすべてが位画決めと地図作成についてではない.ロポプトは,温度.匂い,
音轌億号なども知覚する.ちょうど位匝決めと地図作鱗のように,これらの量の多くは,碗
率的に推定可能である.このような推定器に必要なすべては,長い時、の状態蜜数の進化
を特織づける条件付き確率分布と.測定値の状悪変数への関係を寵途する他の分布である.
しかしながら.ロボティクスで勤作している知覚システムのすべてが,確率的表現に頼っ
ているわけではない.実際,我々のすべての例における内部状懸は,明確な物理的な解釈
をもっており,これは,必ずしも砿率的表現のケースである必喪はない.たとえば,障害
物を超えて脚を持ち上げるように戯みる脚ロボットを想鰹しよう.騒初に低く脚をあげ,
もしそれ力彌害q駒とぶつかったなら,だんだん高く脚をあげるという規則を使うとしよう.
我々は,命令きれた脚の高さが,世界の物理趾の表現だと百うであろうか?多分,その
中では,それは障害物の高蓉と勾配に関係がある.しかしながら,我々は,脚の高さを,
物理的な意味が欠けていても,ロポプトコントローラの補助変数として考えることもでき
を錘ぬよう.
コンフィギュレーション空間
ロボットの動作llIl題への解に向けた最初の第一歩は,適当な問題の表現を工夫することで
ある.単純なllIImのための単純な蕊現から始めよう.図25.12(a)で示きれるロポプトアー
ムを考えよう.それは,独立に動く二つの関節をもっている.関節を動かすことは,肘と
グリヅパの座標(ェ,p)を変える.(腕は,z方向には動けない.)これは,ロボットの構成が
4次元の座標で紀途可能であることを示唆する.すなわち,環境に閲する肘の位睡(韮c,睦)
とグリッパの位腫(⑪,,蝿)である.明らかに,これらの四つの座標は,完全なロポプトの
作典空因
る.このような表現はロボティクスでは珍しくないそして.ある問題に対して,それら
は確実に十分に働く.
ロボティクスの傾向は,明確に定装きれたjEi味を伴う溌現へ明らかに向かっている.確率
的技法は.位圃決めと地図作成といった多くの困難な知覚の問題において,他のアプロー
チより性能力彊れている.しかしながら,統計的技法は,時々あまりにも厄介で,より111
砿含拘衷
純な解決砿が,実際の局面ではちょうど効果があるかもしれない.どのアプローチをとる
か決心を助けるためには,実世界の物理的なロボットとの作粟経験が殿も良い教師である.
25.4動作言
トモー診已ン
一つの配置への経路を見つけることである.我々は,すでに本番を通じて,経路計画問題
'
ランドマークを発見するたびに,それは駆後推定値に新しし、要素を単に加える.この新し
コンブライアン
ション空間(conligmaLiomspace)は,もとの3次元空1mよりも働くより良い鰯所である.
経路gf画(pathplanning)問題は,コンフィギュレーション空lIiで,一つの配匝からもう
の様々なバージョンに出会った.ロボティクスでは,経路針薗の主要な特徴は,それ力[魍
い要素の分散の価を非常に大きな他に初期化することによって.結果得られる躯後推定価
点から負への
五m
927
25.4動作叶面
ロボティクスでは,決定は砿終的にエフェクタの運動を含む.点から点への錘!(pointPto‐
pointmotion)問題は,ロボットまたはそのエンドエフェクタを指定ぎれた目標場所に運
ぶことである.より偉大な挑戦は,コンプライアントモーション(comp1iantmotion)で,
そこでは,障害物との物理的な接触を保ちながらロボットが運動する5コンプライアント
モーションの例は,電球をねじこむロボットマニピュレータ,またはテーブルの上面の鍋
状悪を表現する.それらは,作桑空間(worksp…)表現として知られているものを構成す
る.なぜなら,ロボットの座標が,操作しようとしする(あるいは避けようとする)物と
同じ座標系で指定ぎれているからである.作業空間表現は,特にロボットとすべての物が
単純な多角形のモデルによって表ぎれているなら,衝突チェプクによく適している.
作乗空1N喪現の1111題は,障害がないときにすら,必ずしもすべての作業空間座標が,実
際には達成できないということである.これは,達成できる作業空1m座標の空IIBの結合拘
束(linlcageccn5trainL)の理由による.たとえば,肘位匝(垂。,me)とグリッパの位Ⅲ(ェ9,Fg)
は,それらが剛体の前腕に結合しているので,いつも固定した距賎だけ離れている.作築
空岡座擦上に定鍵きれたロポプトKE動計画器は,これらの拘束にしたがった経路を生成す
るという挑戦に、[面する.状態空H1は連続的で,拘束力排線形であるので,これは特に一
筋縄にはいかない.
。>フィギュ
レーシ団シ劃司
コンフィギュレーション空間(connguraLionspaoe)で計画を立てるほうがより簡単であ
ることが明らかになる.ロボットの要素のデカルト座標によってロボットの状態を表すの
ではなく,我々は,ロポプトの関lMiiの角度空間によって状顛を表す.我々のロポプトの例
は,二つの関節をもつ.これから,我々は.二つのそれぞれの角度Ipp,P・を厨関節と肘閲
筋の状顛として喪す.障害物がないときには,ロボットは,コンフィギュレーション空1m
で自由にどんな値もとることができる.特に,経路を計面するときに,直認によって現在
と目標位匝を直線で繋ぐことができる.この経路に沿っていくときに,ロボットは,目標
位置に到斬するまで,一定速度で関節角度を変えるであろう.
928
溺箪ロボティクス
9卿
25.4動作計画
運悪く,コンフィギュレーション空HUは,それ自身の1M]組がある.ロボットのタスクは,
コンフィギュレーション空間での座鰯ではなく,たいていは作粟空1M座標で表きれ.たと
 ̄
 ̄ ̄--
 ̄
〆
えば,我々は,おそらく向きも指定して,エンドエフェクタを作業空間のある位瞳に移動
幸毎m学
きせていたかもしれない.これは,そのような作業空間座標をコンフィギュレーション空
間へ,いかに写像するかという疑IUlを提起する.一般的に,この1111翅の逆,す葱わちコン
フィギュレーション空IHI座標を作業空lUI座標に喪摸することは111純である.それは,一連
のかなり明らかな座標喪換を含む.これらの変換は,並進関節にとって翻形,回転関節に
とって三角法である.座標変換のこの連鎖は,我々がすでに移動ロボプトの肘論で触れた
邇動摩(kinemaLics)として知られている.
エフェクタの位匠が作業空間座標で柑定きれているロボットの姿勢をBlf1[する逆問題は,
逆邇勤学(inv已顕ekinematics)として知られている.特に多くの自由寵をもつロボットに
とって,逆運動学を計算することは,一般に困雅である.特に,解が-つであることはほ
とんどない.我々のロポットアームの例では.図に示したようにグリプパが同一の作業空
P已血
PS
PC地
=
=
間座標をもつ異なる二つの姿勢がある.
戸
〆
(&)
一般に,この2リンクロポプトアームは,任意の作業空間座標に対して,ゼロか二つの
逆運動学の解をもっている.ほとんどの塵繋用ロボットは,無限に多くの解をもっている.
どのようにこれ力《可能かを砿狸するために.我々のロボットに,その回転軸が今あるもの
と平行である第三の回転関節を加えた甥合を想像しよう.このような鯛合,ロボットのほ
とんどの姿勢に対して,グリッパを固定して(しかし方向は保てない!),その位匠を保ち
ながら,内部の関節を自由に回転苔せることができる.少しの自由度(どれくらい?)を
追加するだけで,方向も保ちながら,同じ効果を実現できる.我々は,すでにこの例を机
■
●卸翻
(b)
図25.12(a)二つの自由度をもつロポットアームの作栗空1,1衷現・作察空l[Hは,平らな
障害物力塚:弁から掛かっている箱の中である.(b)同じロポプトのコンフィギュレーション
空困.白い領埋だけは,衝突がない姿勢である.この図の点は,左個のロボットの姿勢'二
対応する.
P
に手を囮いて固定しながら肘を動かすという興爽験算で見た.手の位匝の運動学的拘束は,
肘の姿勢を決めるのに不十分である.百い換えれば,廟から腕の組立ての逆連動学は,無
限の解をもつ.
コンフィギュレーション空旧褒現の鋪二の問題は,ロポプトの作栗空町で存在するかも
1
しれない障害物から生じる.図25.12(a)トー示す例は,ロボットの作業空岡の中心に突き
出ている,天井からぷら苔がってろ障害物を含めて,いくつかのそのような障害物である.
作業空岡では,そのような障害物は.単純な鯉何学的形理をとる.特にロボティクスの教
PeIb
科書では,多角形の障轡物に注目する傾向がある.しかし,それらは,コンフィギュレー
ション空間ではどのように見えるだろうか?
図露.12(b)は,図25.12(a)で示苔れている特定の障害物の配睡のもとでのコンフィギュ
レーション空間を示している.コンフィギュレーション空1mは.二つの部分空間へ分解す
白白⑤日
占莉空向
ることができる.一般に自由空間(け。espace)とよばれるロポプトカ翻違可能なすべての
姿勢の空間と,占有空間(occupiedspace)とよばれる到迩不可能な空1mである.図25.12
(b)の白い領域は自由領城に対応し,他のすべての地域は占布領域に対応する.占有領域
の異なる灰色の領域は,ロボットの作業空町の異なる対象物体に対応する.全体の自由領
域を囲んでいる黒い領域は,そこでロボットがそれ自身と衝突する姿勢に対応する.厨ま
たは肘の角度の寵鋼なiiiがこのような違反を引き起こすことを砿鰹することは,簡単であ
る.ロボットの両側の二つの卵形の領域は,ロボットが搭戟されているテーブルに対応す
る.同樺に,第三の卵形の領域は,左の内壁'二対応する.斌後に,賎もおもしろい対無物
体は,コンフィギュレーション空1mでロボットの作業空佃を妨げている」11純な垂直の障害
物である.この対象物体は,奇妙な形状をしている.それは,きわめて非線型であり,凹
=
臣
〆
(日)
-
■
守山“
(b)
図25.13f慎曜空囮とコンフィギュレーション空1mで示きれるロポブトの三つの姿勢
形状きえしている.少し想像すれば,醗者は,上鏑左でグリプパの形を盟戯できるであろ
う.我々は,ここでしばし休製をとり,この正要な図を研究することを鶴者にお助めすろ.
この障害物の形状は,まったく明らかというわけではない.図25.12(b)の内脇の点は.図
25.12(a)で示きれているロポプトの姿勢を示す.図鴻.13は,作業空NIIとコンフィギュレー
ション空間の両方での,追加の三つの姿勢を示している.姿勢conlL1では,グリッパは垂
直の障害物を囲んでいる.
一般に,たとえロボットの作蕊空岡が平らな多角形によって表ぎれろとしても,自由領
930
25章ロボティクス
25.4動作計画
931
域の形状は,非常に被雑になり得る.実際には,。そのため通常,コンフィギュレーション
空11mを明示的に栂成する代わりに,それを厳密に調べる.プランナは,一つの姿勢を生旗
し。それから,ロボット運動学を適用し,そして作業空IMI座標での衝突のチェック詮する
ことで,その姿勢が自由空IIUに存在するかどうか知るためのテストを実施するだろう.
セル分解法
セル分解法
経路計画の我々の岐初のアプローチは.セル分解法(celldecomposition)を使う.すなわ
ち,それは,セルとよばれる有限の数の贋接する領域に自由領域を分解する.これらの領
域は,単一領域内での経路計画問題が簡単な手段(たとえば,礎想に沿って動くこと)に
よって解くことができるという正要な性質をもつ.経路計画問題は,それで,3章で導入
した探索問題にとてもよく似た鰻放グラフ探索問題になる.
段も単純なセル分解は,規則正しく等間隔におかれた格子から綱成きれる.図25.M(a)
は,この空1111の正方格子分關とこの格子サイズに最適の解の経路を示す.また自由空間の各
格子の衝髄を示すためにグレースケールの濃淡を用いる.この場合の園制【とは.各セルから
ゴールへの最短距離を意味する.(これらの箇箇は,図17.4で与えられたWLuelTERATIoN
ルを通過する経路だけがゴールに行き軒<鳩合があるからである.特に,セルの大ききが.
アルゴリズム決定麓の形式によって計算することができる)図25.14(b)は,対応する腕の
空間の経路とクリアランスと同等である鳴合など.
空間軌迩を示す.
これらの問題を避けるために,セル分解手法を修正する二つの方法がある.篭初の手法
このような分解は,それを実装するのがきわめて簡単という有利があるが,しかし,そ
は混合セルを,多分,もとのサイズの半分のセルを使ってさらに細分割することである.
完全に自由領域のセル内に存在する経路が見つけられるまで,これを再帰的に続けること
れは,また二つの限界をもつ.第一に,格子セルの数が次元数dの指数オーダで1Wえるの
で,低次元のコンフィギュレーション空1mでしか実行できない.第二に,煙混合”セルで何
をすべきかの間剛がある.混合セルとは,まったくの自由領域内でも,まったくの占有領
壊内でもないセルを指す.このようなセルを含む解の経路は,望まれた方向にセルを匝親
に欄切るためのいかなる方法もないかもしれないので,本当の解でないかもしれない.こ
れは,パスプランナを信用できないものにする.一方で,もし我々が完全に自由領域の七
ルだけを使うと主弧すれば,プランナは不完全なものとなるであろう.なぜなら,混合七
が可能である.(もちろん、もし与えられたセルが混合セルであるかを判断する方法をとる
ときのみ,この方法は働く.そして,それはコンフィギュレーション空間の境界が,比較
的単純な数学的記述をもつ場合にだけ蘭」nである.)それを通して解が通過しなくてはい
けない通路の最小サイズに限界があるという条件で,この方法は完全である.それがコン
フィギュレーション空間内の一筋縄にはいかない領域に侭とんどのl1fji[力を集中ぎせるに
もかかわらず,それぞれのセルの再帰的分制が2.個のより小嘗いセルを作るので.この
方法は高次元の問題にうまくスケールアップするのに失敗する.完全なアルゴリズムを得
完全セル分解
る第二の方法は,自由領域の完全セル分解(exactcelldecomposition)を主張することであ
る.この方法は,セルが自由領域の境界に面するところで,不規則な形状を強いるが,自
由領域内のセルの移動を計算することは欄111であるべきだという意味で,セルの形状はま
だ繩単純園でなければならない.このテクニックは,いくらかの非常に先進的な幾何学的
アイデアを必要とする.それで,我々は,ここでこれ以上,造ままいことにしよう.
図溺.14③で示きれている解の経路をよくみると,解iiiきれなければならないであろう
=
’
〆
■
= 伊
苔らなる困難な問題がわかる.第一に,経路が任意の急なコーナーを含むということに気
づくであろう.どんな有限のスピードで動いているロボットでも,このような経路を実現
することができない.第二に,経路が節轡物に非常に近いことに気づくであろう.車を運
転したことのある鮭もが,両側が1ミリメートルのクリアランスしかない駐車スロットが
実は駐車スペースでないことを知っている.同じ理由で,我々は,小きい運助誤差関して
ロバストな解の経路のほうを好むであろう.
我々は.経路長を最小化し法がら陣聾物からクリアランスを騒大化したい.これは,ポ
ア
(a)(b)
図25.14(⑨)コンフィギュレーション空岡の鮭Rh格子セル近似のために見つけられた箇
箇関数と経路.(b)作業空HIl座標で視覚化きれた同一経路.垂直の障害物との衝突を避ける
ためにいかにロボットがその肘を曲Iγろがに注意.
ポテンシャル咀
テンシャル増(potmtialneld)を導入することで成し遂げらることができる.ポテンシャ
ル鰐は,状態空卿上で定謹苔れた関数で,その価は瞳も隣接している障害物への距離に応
932
25章ロボティクス
25.5不砿かな運動の叶回
VbrDnoiグラフ上の探索は,鰻短経路を与えないかもしれない.しかし,結果得られる経
じて大きくなる.図25.15(a)はこのようなポテンシャル場を示している.護い部分が,障
響物により近いことを示している.経路計面に使われるとき,このポテンシャル場は,最
適化で付加的なコストになる.これは興味あるトレードオフを含む.一方では,ロボット
は,目樋への経路長を躍小化しようとする.もう一方で,それは,ポテンシャル閥数値を
最小化することで障害から離れようと試みる.両方の目標の岡での適当な正み付けにより,
結果得られる経路は,図25.15(b)で示各れろもののように見えるかもしれない.この図
は,価値反復によって再びiil・算苔れろ混合コスト関数から引き出きれた侭illi関数も示して
いる.明らかに,結果得られる経路はより長いが.しかし,それはより安全でもある.
路は,クリアランスを蛾大阪にする傾向がある.Vbronoiグラフ手法の不利な点は,より
高い次元のコンフィギュレーション空1mへの適用が困醗であることと,コンフィギュレー
ション空Hliが広くオープンなときに,不必要に大きい回り道を引き起こす傾向があるとい
う点である.なお,Vbronoiダイアグラムを計算することは.特に,障害物の形状力戦雑
になる得るコンフィギュレーション空IHIにおいて,困餓になり得る.
伍車的ロード
マップ
に生成し,自由空間に入らないものを雍却することで作られる.1点からもう一方の点へ
“容易に官到達可能な任意の2点をアークで結ぶ.たとえば,自由空間の直線で結ぶ.す
べてのこの操作の結果は,ロボットの自由空1mのランダムグラフである.もし我々がこの
経路計面アルゴリズムの第二の主要なファミリーは.骨格化(skeUeto血ation)の考えに基
づく.これらのアルゴリズムは,ロボットの自由領域を1次元表現へ鑓退苔せる.そして,
Vbr頤輯グラフ
Voronoiダイアグラムの代わりは.碗率的ロードマップ(pmbabilisticm⑥dmap)で,よ
り多くの可能な経路を提供し,そしてオープン空'10でより良く探索する骨格化手法である.
図濁.16(b)は,硴率的ロードマップの例を示す.グラフは,非常に多くの姿勢をランダム
骨格化手法
iOOfl上
933
グラフにロボットの初期(スタート)と目標の姿勢を加えれば,経路計画は,篭散グラフ
この低次元表現は,コンフィギュレーション空間のスケルトン(skeleton)とよばれている.
図溺.16は,骨槻上の例を示す.それは自由空間のVbmDnoiグラフ(VbronoigraPh)で
探索問題になる.理購上,この手法はランダム点の悪い選択により,スタートから目標ま
での経路がまったくない状憩で陞倉去りにきれるかもしれないので.不完全である.生成
暮れた点の数とコンフィギュレーション空1mのある幾何学パラメータに閲して,失敗の確
率の上限を定めることは可能である.また,鱒そら<部分的な探索が,スタート位匿と最
終目標位賦の双方向からの探索により良い経路が発見ぎれるだろうと示唆する領域へサン
プル点の生成を方向づけることは可能であろう.これらの改善で,確率的ロードマップに
よる計薗は,通常の多くの経路計薗手法よりも高次元のコンフィギュレーション空岡へス
ある.すなわち,二つ以上の障害物から等距離にある点の集合である.Vbmnoiグラフを用
いて経路を計面するために.まず殿初に.ロボットは,現在の自分の姿勢をVbmnoiグラ
フ上の点に震える.これが,コンフィギュレーション空岡での直繊運動によって,いつも
成し遂げられることができることを示すことは簡単である.第二に,それが最も近い目標
の姿勢に対応する点に到連するまで,ロポプトは,VbrOnoiグラフに沿って移動する.最
後に,ロポプトは,Vbmnoiグラフから陰れて,目標に移動する.また,この最終ステッ
ケールアププできる傾向にある.
プは,コンフィギュレーション空Mjの直鐘運動を含む.
罐かア
これまで:態合苔れたロボットの運動計薗アルゴリズムは,ロボティクスの問題の主要な特威
である不砿実性を扱っていない.ロボティクスで,不確実性は,環境の部分観測とロポプ
トの行動の砿率的(あるいはモデル化できない)効果から生じる.エラーは,パーテイク
ルフィルタのような近似アルゴリズムの使用からも生じる.そして,それはたとえ環境の
最もあUそうな
状巴
確率的な性質が完全にモデル化できたとしても,ロボットに正確な信念の状態を与え悲い、
ほとんどの今日のロボットは,これまで繊箇されてきた経路計画アルゴリズムのように,
意思決定のための決定鴎的アルゴリズムを用いる.そうするために,位憧決めアルゴリズ
ムによって生じた状態分布から最もあUそうな状態(mostUlDelystate)を抽出することは,
よく使われる爽跳的やり方である.この手法の優位点は純粋な圓博ですむことである.コ
ンフィギュレーション空、を介して経路を計画することは,すでに挑戦的課題である.も
し全状態をカバーする完全な確率分布を用いなければならないとしたら,より悪いだろう.
このように,経路を計画するもとの問題は,経路をVbronoiダイアグラムで見つける問
題に柵藩苔れろ.そして,それは(ある種の一般的でないケースを除いて)一般に1次元
で,三つ以上のカーブが交差する有限の多くの点をもつ.このように,最短経路をVbmnoi
グラフに沿って見つけることは,3章や4章で麟箇した離散グラフ探索問題の一種である.
不砿実性が小きいときに,このように不確実性を無視することは有用である.
運悪く,不確実性を無視することは,必ずしもうまくいかない.いくつかの問題で,ロ
ボットの不砿爽性は.単純にあまりにも大きいのである.たとえば,自己位世同定に関す
るいかな愚手がかりももっていない移動ロボットを制御するために,どのように我々は,
決定鶴的経路勵画器画を使うことができるか?一般に,もしロボットの其の状態が股尤
25章ロボティクス
934
推定則によって同定巷れたものでないとき,結果として生じる制御は,準躍適になるだろ
う.1m違いの大きさによっては,これは,障害物との衝突といった,すべての麺類の証ま
れていない結果をもたらしうる.
ロボティクスの分野は,不確実性に適応するためのある範囲の技法を採用してきた.い
くつかは,不確実性のもとでの意思決定のための17章で与えられたアルゴリズムから生
じている.ロボットが自身の状憩推移の不確実性のみに直面し,状態そのものは完全に観
25.5不確かな運動の計画
935
徴がとても小きいということである.そのような小きい規模で,ロボットが自身の位腫を
正砿に測ることもIMI伽することもできなくて,そしてまた環境自身の形状に対して不確か
であるかもしれない.税々は,これらの不砿突性がすべて有界と仮定しよう.PMP問題へ
の解決策は,典型的には,実行中にセンサフィードバックを利用し,想定きれた不確実性
の有界の範囲に矛盾しないすべての状況で働く条件付き計画か方策であろう.
測できるとき,問題は一つのマルコフ童思決定過程(MEurkDvDe[血sionpmce蜜s:MDP)に
よって,愚も良くモデル化ぎれろ.MDPの解決策は,醗適方策(policy)で,それは可能
なあらゆる状襲で何をすべきかをロボットに伝える.決定茜的計画響からの単一経路の解
は,ロバストとはほど遠いのに,このように、それはすべての種類の運動誤差を取り扱う
ナピゲーシ、ン
困泣
ことができる.ロボティクスで,方策は通常ナピゲーション関数(navigationhmction)と
よばれている.図25.14(a)で示嘗れろ慶憧関数は,単純に勾配にしたがうだけで,そのよ
うなナビゲーション関数に変換可能である.
ちょうど17章で示したように,部分観測は,問題をはるかに困鐘にする.結果として,ロ
ボット&H1御問題は.翻分観測マルコフ童思決定過程(partiHUyobse唾v日bleMDP:POMDP)
である.このような状況で,ロボットは,露.3節で議雷したように,通常,内部の信念状
態を維持する.POMDPへの解決麓は,ロポプトの信念状態空間で定義ぎれた方策である.
園25.172次元現魂,適度の不砺英性円鹸.可能なロボプトの運動のエンヴェローズ
邇図されたロボットの迫度はpだが.不確英性のため,爽麗の連E芝はCbの中のどこかで.
そして結果として迅助のエンヴェロープのどこかに位肚L,それは,我々が穴に当たった
がどうかわからないことを通味する.
通常と異なり,方策への入力は全体の確率分布である.これは,知っているものでだけでな
く,知らないものも含めて,それらをもとにロボットが自分の意思決定することを可能に
する.たとえば,もし非常にⅢ異な状態蜜数について不確かなら,それは,合理的に情報
佃餌収自行■
収轆行動(infbrmgtiongathemngaction)を呼び可i、けることができる.これは,Impが全
体観測を仮定しているので,MDPの枠組みでは不可能である.運悪く,まぎにPOMDPE
を解く技法は.ロボティクスには適用できない.すなわち,連鏡空間のための技法が知ら
れていない.量子化は,既存の技法力R取り扱えることができないほど巨大なPOMDPsを
通常生じきせる.我々に可能なすべては,姿勢の不確実性を最小限にとどめるように努力
沿岸鰹行
することである.たとえば,沿岸航行(coastalnavigation)ヒューリステイフクは,姿勢の
不確実性を低減するために,既知のランドマークの近くにとどまることを要求する.この
ことは.今度は,近くにある新しいランドマークの地図作成の不確実性を徐々に低減し,
そのこと自体は,ロボットにきらなる領海の探索を可能にきせる.
ファインモーションプランニングは.一連の慎廼な運動(gumdedmotion)から構成言れ
る.それぞれの側亜な運動は,(1)運動指令と(2)終了状悪から構成きれる.後者はロボッ
トのセンサ価の述部であり,襖正な動きの終了を示す真価を返す.運動指令は,典型的に
はコンプライアントモーション(compli4mtmoCion)で.もし運H力指令力彌書物と衝突を引
き起こせば,ロボットがスライドすることを可能にすることを簾す.例として,図25.17
に,狭い垂肛の穴をもつ2次元のコンフィギュレーション空間を示す.それは,長方形の
ベグをわずかに少し大きい穴へ抑入するためのコンフィギュレーション空11Mである.運動
命令は, ̄定速度である.終了条件(terminatiDncondition)は,面との接触である.倒御
の不確実性をモデル化するために.我々は,命令きれた方向への動作ではなく,そのまわ
りの円碓q内にロボットの実際の運動があると仮定する.もし我々がスタートの領域sか
らまっすぐ下に遡む速度を命令したら,何が起こるかを図は示している.速度の不確実性
のため.ロボットは,円錐のエンヴェロープのどこか,おそらくは穴に入っていくが,よ
ロバスト法
不確奥性は,また,確率的手法よりも,むしろいわゆるロバスト制御(mb…contmI)を
使うことで.取り扱うことが可能である.ロバスト法は.-つの問題の各鬮面に対して,
有界の不確実性を仮定し,静容範囲内で確率を値として割り当てない手法である.実際
の値がどうであれ.許容範囲内に収まっている限り,ロバスト鞍解は作用する解である.
ロバスト法の一つの極靖な形態は,第12章で与えられた整合プランニング(oonfbrmamL
ファインモーショ
ンプランニング
planning)法である-それは,状態燗報がまったくない状態で働くプランを生成する.
ここで,我々は.ロボットによる組み立てタスクでのファインモーションプランニング
(fine-motionplanning:FMP)に用いられるロバスト法に注目する.ファインモーション
プランニングは,勝止環境内の物体へのロポットアームによる非常に細かな接近運動を含
む.ファインモーションプランニングの鰻も困難な点は,要求ぎれる運動と環境の関連特
りありそうなことは,穴の一方の壁に譜陸することであろう.ロボットは,穴のどちらの
壁に糟いているかわからないので,どちらの方向に動くかを知らないであろう.
より理にかなった戦略は,図25.18と図25.19に示きれている.図25.18では,ロポプト
は.穴の一方へ故愈に移動する.運動描令は,図で示きれいる.終了テストは,いずれかの
面との接触である.図25.19で,面に沿って滑らせて穴に導く運動指令力r与えられる.これ
は,我々がコンプライアントモーションを使うことを仮定する.運動エンヴェロープ内のす
べての可能な速度が右側への移動なので,水平面と接触している限り,ロボットは右偲へ
移動するであろう.すべての可能な速度が垂腫面に対して下への移動なので,穴の右手の
垂直の鍋に触れたときに,ロボットはそれに沿って,下へ移動する.大の底に達するのが
終了条件なので,ロボットはそこまで連動を続ける.制御の不確実性(Controluncertainty)
にもかかわらず,ロボットのすべての可能な軌道は,穴の底と接触して終わる.すなわち,
不規則な面がロボットを-つの柵所で立ち往生きせることがない限りにおいて.
25章ロボティクス
936
25.6通勤すること
3iu1剛
iiiii雷hiii■
これまで,我々は運勘の計画の仕方について餓箇してきたが,運動の仕方については,篭
じてこなかった.我々の計画は-特に決定蹟的な経路迫計画器によって生成答れたもの
は-ロボットはアルゴリズムが生んだどんな経路にも単に沿っていくことができると仮
定している.もちろん実世界では.これはそのケースに当てはまらない.ロボットは,慣
性をもっていて,任邇の極籟に迎い速度以外は,任愈の経路を実行することができない.
たいていの鳴合は,ロボットは位1mを指定するよりは力を作用させる.本節は,これらの
図25.18赴初の指令と。可能なロポプトの運動の帰結のエンヴヱロー式いかなるエ
ラーが起きても,我々は,鼠終のコンフィギュレーション力f穴の左個へあることを知って
いる.
937
力を計算する方法を箙飴する.
ダイナミクスと制御
c;、L,
25.2節は,動力学的状態(dymuBmicstate)の配述を導入した.それは.ロボットの速度を
モデル化几することでロボットの運動学的状懸を拡襲する.たとえば,ロボット関節の角
度に加えて,動力学的な状懸は,角度の変化の側合も捉える.動力学的状鯉表現の推移モ
デルは.変化の割合への力の効果を含む.このようなモデルは,微分法的式(diHbJcntial
equationB)を介して一般的に饗暮れる.それは,ある量(たとえば,運動学的状襲)を量
の変化(たとえば,速度)と関係づける式である.基本的には.我々の運動学的モデルの
代わりに,動力学的モデルを利用して.ロボット運動を計画することを決めることができ
図蕊.Ⅱ9=誘目の連日b指令と可麗な連日bのエンヴェローズ誤差'二もかかわらず,魂々
は.鮪周は穴に到藩するであろう.
たはずである.このような方法飴は,もし我々力断面を生み出すことができたなら,優れ
たロポプトパフォーマンスをもたらすであろう.しかし,動力学的な状態は,運動学的空
剛よりも複雑であり,次元ののろいは.運動針回問題を最も単純なロボットを除いてすべ
想像するに,ファインモーションの計画を構築することは,些細なことではない.実際,
てのロポプトにとって手に負えないものにする.この理由のため,現実的なロボットシス
それは,正確な運動をもつ計画よりも相当困鐘である.それぞれの運動に定められた数の
テムは,より単純な運動学的経路計画器にしばしば顧る.
運動学的計繭の制限を袖髄する共通のテクニックは,ロボットを軌道'二追従きせるため
離散的な値を選ぶか,性質上異なる行動を与える方向を選ぶために,環境幾何学を使うこ
とができる.ファインモーションの計画器は,コンフィギュレーション空岡の毘述,速度
不確実性円錐の角度,終了(この場合,面への接触)のためにどんなセンシングが可能か
の仕様を入力として捉える.そして,もし存在するならば.成功することを保証きれた多
段条件付き計画か方策を生成すべきである.
我々の例は.計画器力琿境の正確なモデルをもっていると仮定しているが。しかし「以
下のように.このモデルで有界な誤差を許容することが可能である.もし誤差をパラメー
タに関して妃述することができれば,これらのパラメータをコンフィギュレーション空間
'二自由度として加えることができる.最後の例では,もし穴の深きと広き力坏確かだった
ら.我々は,それらをコンフィギュレーション空1mに2自由鹿として加えるだろう.コン
フィギュレーション空間でこれらの方向でロポプトを動かしたり,あるいは直接にその位
鯉を感知することは不可能である.しかし,制御とセンサ不確実性を適当に指定すること
⑥悶コント
ローラ
穆聞鎚邨
遍逼コント
ローラ
に,別のメカニズムであるコントローラ(Control】e『)を利用することである.コントロー
ラは,馴御目的を速成するために.環境からのフイードバプクを使って,実時間でロボッ
トBililpを生成するための技術である.もし目標が螂前に計酉きれた経路上にロボットをと
どめることならば,それは,参照コントローラ(rcIb睡neoontmUer)として,しばしI錫1用
きれ,経路は参照経路(陀睡ncep。$h)とよばれる.大局的なコスト関数を鹸適化するコ
ントローラは最適コントローラ(optim⑭Jcontroller)として知られている.MDPのための
賦適方策は,耶爽上,域適コントローラである.
表面上は,馴前に指定きれた経路にロボットをとどめる問題は,比較的わかりやすいよ
うである.実際には,しかし,この見たところ単純な問題答えも,落とし穴をもっている.
図25.20(a)は,何が悪い方向にもっていくことができるかを示す.そこで見せられたの
によって,この問題をFMP11Il題として配途することで,これら二つの制限とも取り入れ
は,運動学的経路に沿っていくように試みるロボットの軌適である.逸脱が起こるときに
ることが可能である.これは,複雑な4次元の計画問題を与えるが,しかし,ちょうど同
じ計画技法が適用可能である.17章での決定理詰的な手法と異なり,この種のロバスト法
は叶圃の予想きれた品質を股大限にするよりは,最悪のケースの結采のために設計きれた
は,この逸脱の大きさに比例する反発力を与える.直観的には,逸脱がロボットを軌道に
保つために反力'二よって賠償きれるべきなので,これはまことしやかなように見えるであ
lif画の結果に落ち藩<,もし実行中の失敗が,実行に含まれる他のどのコストよりも,は
るかに悪い場合に限り,股悪のケース計画は,決定蔭的の意味で逓適である.
はいつでも-雑音のため,もしくはロボットが適用可能な力の制約からか-ロポプト
h駅注:252陣でも脱明したが,叫鞄'二通度鱈けを零撤することは辺勤学の範囲であり,力,質丘,加速度を
孝皿しないと動力学にならない.
25章ロボティクス
938
ろう.しかし,図25.20(8)に示すように,我々のコントローラはむしろロボットを激しく
鰻動きせる.援助は,ロポットアームの自然の慣性の結果である.いったん,参照軌道の位
世へ戻るようにRE動きれると,ロボットはオーバーシュートする.そして。それは逆の符
号の対称的なエラーを引き起こす.図25.20(a)が示すように,このようなオーバーシュー
トは,全体の軌遡上で続くかもしれず,結果のロボットの連動は望ましいものからほど遠
い.明らかに,より良い制御が必要である.
25.6連動すること
939
照経路に戻れないので厳密安定ではない.
P、コントローラ我々の領域で鮫密安定を成し遂げる段も単純なコントローラは,P、コントローラ(PD
oontmller)として知られている.文字蟻P鮒は再びJiifm昼を表し,鰹D"は微分項を表す.
P、コントローラは,以下の式によって鴎述蓉れろ:
.`‐xP(w)-霊`)…型黒
(蝿.3)
この式が示唆するように,P、コントローラは微分瞬紫によってPコントローラを拡張す
る.それは,眼遷U(#)-毎:の第一階時田徹分に比例する項“を加える.そのような項に
よる効果は何か?一般に.礎分項は制御対象のシステムを綴和する.この意味を理解す
るために,上腿のPコントローラの掛合と同じように.娯差(y(8)-ェ。)が急激に時、的に
変化する渦合を想定しよう.この鴎差の撤分項は比例項のH;」層iを弱め,揺らぎ全体の反応
を減少きせるだろう.しかし,もし同じ齪差が続き喪化しなければRt分項は消え,比例項
が制御の遇択を支配する.
図窮.20(。)にゲインパラメータXp=、3とX、=.Bとして我々のロポプトアームにこ
のP、コントローラを適用した結果を示す.明らかに,結采得られる経路ははるかに滑ら
かで,どんな明らかな撞動も示与ない.この例が示唆するように,撤分項は.それがない
とき安定でないコントローラを安定にする.
実際には,P、コントローラは失敗モードを所有もする.特に,PDコントローラは外
より良いコントローラに到逮するために,オーバーシュートを生じたコントローラのタ
イプについて正式に毘述しよう.観察きれたエラーに対して比例する逆の力を与えるコン
Pコントローラ
トローラは,Pコントローラ(PoontmUer)として知られている.文字Pは比例項を意味
する英鴎のPmportionaIの頚文字であり,実際の劇御がロボットマニピュレータのエラー
に比例することを示す.より正式に,p(t)を時岡[によってパラメータ化きれた参照経路
としよう.Pコントローラによって生成された制御醜は,以下の形式で表きれる:
ロ`=KPM8)-ェ&)
ゲインパラ
メータ
ここに,戦は,時刻tでのロボットの状態である.KPはいわゆるコントローラのゲイン
パラメータ(gainpammeter)で,コントローラが実際の状態垂Gと望ましい状襲ソ(8)の1m
の鶴差をどれくらい正すかを規定する.髄初の例ではHP=lである.一見して,KPに
より小ぎい価位を選ぶことが問題を正すと思うであろう.運悪く,これはそのケースでは
ない.図25.20(b)は,KP=.lのケースで,まだ振動する軌iiiを示している.小曽なゲ
インパラメータの位は,単に振動の速度を落とすかもしれないが,問題を解決しない.実
醗,摩擦がないときに,Pコントローラは,本質的にバネルールである.つまり,それは
固定きれた目標軌iliのまわりに無期限に振動をするであろう.
伝統的に,このタイプの問題は,AI研究者にとってますます糊大する亟要性をもつ分野
である制御理陰(controltheory)の世界に入る.ここ10年1mの研究は,上毘の単純な制御
則よりも優れている,とても多くのコントローラをもたらした.特に,参照コントローラ
夜定
は,小昔な掴らぎがロボットと参照個号との鴎差を有界の範囲に収める葱ら,安定(stable)
堅已吏査
定(stricLlystable)と言われる.明らかに,我々のPコントローラは安定に見えるが,参
と百われる.そのような揺らぎが起きたとき,参照経路に戻ることができるなら,厳密安
部の錨らぎがないときにさえ.鶴差を完全にゼロに閏壁することに失敗するかもしれない.
これは我々のロポプトの例から明らかではないが,しかし,誤差をゼロにするために,時々
過大な比例項のフイードバプクが要求苔れる.この問題への解決策は,時岡積分誤差に基
づいて,第三番目の項を制御則に加えることにある:
。`‐肘,(ツル難)十K`んい-露`)…K・`(`(砦璽`)
(25.4)
ここで,K'は,もう一つのゲインパラメータである.IML)-ェ`)。tの項は,誤差の時岡
欄分を計算する.この項の効果は,畏期にわたって存在する参照信号と実際の状態とのlIU
の個差が正答れることである.たとえば,王cが鶴いHUU(t)よりも小ぎいときには,結果
得られる制御の⑥$がこの齪差を鏑小することを余儀なくするまで,この積分は期加する.
そして,積分項は期大する振動的挙動の危険性を椴牲にして.コントローラがシステム的
な麟差を示嘗ないことを確麗する.すべての三つの項を含むコントローラは,PIDコント
ローラ(PmContmoller)とよばれている.多橡な制御問題のために,PIDコントローラは
産業界で広く使われている.
ポテンシャル場制御
我々は,ロボットの運勘叶画で追加のコスト関数としだポテンシャル場を紹介した,しか
し.それらは,経路叶画フェーズまったくなしで済ますことで.ロボットの運助を直接生
成するのに利用きれ↑9ることもある.これを達成するために,我々は,目標地へロボット
を;1つ弧る引力と障聾物からロボットを遠ざけるポテンシャル場を定義する必要がある.
そのよう鞍ポテンシャル場は,図25.21に示苔れている.その一つの大局的な最小は目標
地であり,位は近接の障瞥物からこの目概地への距離の合計である.図に示ぎれているポ
25章ロボティクス
9qO
25.6退勤すること
テンシャル鰯を生成する際には,計画はまったく含まれない.このため,ポテンシャル場
得するのはしばしば難しい.鋪二'二,我々が十分な正硴巻をもつモデルを考案できるとし
ても,計算鴎的困難苔や位1m決めエラーがこれらの技法を実用的でなくするであろう.あ
は,よく実時間制御に適している.図25.21は,ポテンシャル場で,二つの異なる初期位
囲のもとで,山登りを実行した結果の二つの軌道を示す.多くの応用で,ポテンシャル場
は,与えられたいかなる位憧に対しても,能率的に:f算きれること力可能である.苔らに,
941
反応的制ロ
るケースでは,反射エージェントの股lif-いわゆる反応的制御t巴activecomtrol)-が
より適当である.
ポテンシャルを玻適化することは,現在のロボット位陞のポテンシャルの勾配をlif算する
画二四h世坤丘
ことを意味する.これらの計算は.経路計画アルゴリズムと比較すると,通常きわめて能
率的である.それらのすべてがコンフィギュレーション空間(DOFs)の次元の指数オーダ
である.
そのような能率的な方法で,答らに遠距離にわたって,コンフィギュレーション空間で目
IUb
標への経路を見つけるために,ポテンシャル場アプローチがうまくやるという事実は,そ
もそもロボティクスにおいて,計画の必要があるかどうか,という疑問を提起する.ポテ
ンシャル場技法は十分か,あるいは,我々は.我々の例でただ運が良かっただけか?答
えは,我々力F本当に運が良かったということである.ポテンシャル鴇には,ロボットを鹿
にかけることができる多くの局所曜小がある.この例で,ロボットは,それ力輔書物の間
違った側で行き飴まるまで,単にその周囲鰯を回転きせることによって障害物に近づく.腕
力彌害物の下でゴールにフィットするようにロポプトにその肘を曲げきせるほど,ポテン
シャル鰯は,十分に壁かではない.換言すれば,ポテンシャル場技法は。局所的なロポプ
ト制御にとって亜大だが,それはまだ大局的な計画を必要とする.もう一つのポテンシャ
ル鰯の、要な欠点は.それが生成する力がロポプトの速度ではなく,障害物とロポプト位
憧にのみ依存することである.このように,ポテンシャル場制御は実際に運動学の方法で
あって,そしてもしロボットが速く動けば失敗するかもしれない.
反応的制御
これまでのところ,我々は参照経路かポテンシャル鯛のどちらかを婿成するためのある環
境モデルを要求する馴御決定を考慮してきた.このアプローチでいくつかの困鐘がある.
錨一に,火星の地表面といった,特に複雑なまたは違い環境で,十分に正確なモデルを猿
(a)(b)
図塑.22(、)6脚の昆虫ロボット(b)1脚の馴仰のための拡彊有限状璽マシン(AFSM).
このAFSMがセンサフイードバプク'二反応することに注童しよう.もし脚を前方へlEiって
し、る途中にスタックすれば.脚は.ますますよ')斑<持ちあげられるだろう.
-つのそのような例は,図25.理(&)に示している6脚ロボット,あるいはヘキサポッド
(hexapod)で,タスクは荒れた地形を歩いて通り抜けることである.前臆で述べた経路計
画技法のいずれかを働かせるために.十分な正確巻で地形のモデルを得るには,ロポプト
のセンサは馨しく不十分である.きらに.たとえ我々が十分に正確なセンサを加えたとし
ても,I2の自由度(それぞれの足に2自由度)は,結局,経路計直問題を3131[鶴的には手
に負えないものにするだろう.
それにもかかわらず‘明示的な環境のモデルなしに.直接コントローラを指定すること
が可能である(我々は,これをすでにP、コントローラで見てきた.それは。ロポプトダ
イナミクスの明示的なモデルなしに.複雑なロポプトアームを目標位瞳に維持すること
ができた.それは,しかしながら.運動学的モデルから生成きれた参照経路を本当に必
要とした).我々の脚ロボットを例にとって,制御則を指定することは,正しいレベルの
抽象度で驚くほど単純であることが明らかになる.実行可能な制御則は,各脚があると
きは地面に触れ,残りの時岡では空中で動くように,それぞれの脚を周期的に動かすで
あろう.それぞれ反対側の3脚が物理的なサポートを提供するために,いつも地面に接
しているように,すべての六つの脚は,岡整きれるべきであろう.そのような制御パタン
は,簡単にプログラムでき,そして,平らな地形でうまく働く.荒れ地では,陣書物は脚が
前方へI優るのを妨げるかもしれない.この問題は,馨しく111純な馴御則によって克服きれる.
つまり,脚の前進退勤が妨げられたとき.単純にそれを引っ込めて。より高くそれを持ち
上げて,そしてまた賊みる.結果として,コントローラは,有限状態マシンとして図25.22
(b)に示苔れる.それは.状態をもつ反射エージェントを梢旗する.そこでは内部状態は,
現在の機械の状恕(8,から04まで)の引数によって表現きれる.
このシンプルなフィードバック駆動のコントローラの変形は,荒れ地でロボットを巧み
に動かす能力がある,著しくロバストな歩行パタンを生成することが判っている.明らか
に,このようなコントローラは,モデルなしで,そして,コントロールを生み出すための
熟考や探索をし鞍い、このようなコントローラを実行するときに,環境フィードバックは,
25承ロボティクス
942
25.7ロボットのソフトウェアアーキテクチャ
横切るときに生み出ぎれるメッセージでタグを付けられることができる.そしてロボット
ロボットによって生み出ぎれろ行動に、異な役1Mを果たす.ソフトウェアだけは,環境に
ロボットが画かれるときに,何が実際には起こるだろうかを示苔ない.-つの(単純な)コ
ントローラと一つの(裡雑な)環境との相互作用を通して現れる振舞いは,しばしば創発
51発的行、
的行動(emergentbehavior)として参照きれる.麟密に百うと,本章で麟鴎してきたすべ
てのロボットは.いかなるモデルも完全でないという邨英のおかげで創発行動を示す.し
かし,歴史的には,この用贈は明示的な環境のモデルを使わない制御技術のために予約醤
れてきた.現れてくる行動は,多数の生物有掘体の特轍でもある.
技術的には,反応的コントローラは,MDP(あるいは,もし彼らが内部状態をもてば,
POMDP)にとってちょうど一つの方策の実現である.17車では,我々は,ロボットとそ
の環境のモデルから方策を生成するいくつかの技法に五合した.ロボティクスでは,正砿
なモデルの定式化に対して我々が無力であるがために,手でこのような方麓を作ることは,
偉大な実用的亜要性がある.21章は,経験から方簸を綱成する強化学習法を述べた.それ
らの方法のいくつか-Q学習と方簸探議手法のような-は.環境のいかなるモデルも
要求せず.ロボットのための高品質のコントローラを生み出す能力があるが,その代わり
大通のトレーニングデータに親らざるをえない.
25.7ロボットのソフトウェアアーキテクチャ
ソフトウェア
アーキテクチャ
アルゴリズムを樽蕊するための方法飴は.ソフトウェアアーキテクチャ(softwar巴aJ℃hitec・
ture)とよばれている.アーキテクチャは,通常,プログラムを醤<ための目關と手段を含
み,そしてプログラムがいかにまとめられるかの全般的な哲学も含む.
ロボティクスのための現代のソフトウェアアーキテクチャはp反応的制御とモデルに基
づく熟考的制御を組み合わせる方法を決めなくてはいけない.多くの点で反応的剛御と熟
考的制御は直交する強きと弱きがある.反尼的制御は,センサ駆動で爽時1mの下位レベル
の意思決定'二適する.しかし,反応的制御は大局的なレベルで,もっともらしい解決策を
ほとんど生み出嘗ない.なぜなら,大局的制御決定は意思決定のときに感じられることが
できないIii報に依存するからである.このような問題に対しては,熟考的醐御の臆うがよ
り適当である.
したがって。ほとんどのロボットアーキテクチャは,制御のより低いレベルでは反応的
技法を使い,より高いレペルでは。熟考的技法を用いる.我々は,PDコントローラに閲
する餓飴でこのような組合せに出くわした.そこでは,我々は(反応的)P、コントロー
ラを(熟考的)経路計團器と麹み合わせた.反応的と熟考的技法を組み合わせたアーキテ
ハイブリッド
アーキテクチャ
クチャは,通常,ハイブリッドアーキテクチャ(hybridarChit⑥ctu暉)とよばれる.
サブサンプションアーキテクチャ
サブサンプショ
ンアーキテケチャ
943
拭弧有餌状HBT
タン
のモータに,または他の有限状態マシンに送られる.巻らに,有限状態マシンは,アーク
を通過する時間をコントロールする内部のタイマ(クロック)を所有する.結果として,マ
シンはふつう拡張有限状態マシン(au唖nenntedfinitestatemachine:AFSM)として参照き
れる.ここで,拡張はクロックの使用を参照するところである.
単純なAFSMの例は,図25.22(b)で示営れる4状態のマシンで,6脚昆虫歩行ロボッ
トのための周期的騒脚運動を生み出す.このAFSMは,周期的なコントローラを実装し
ており,その実行は環境からのフィードバックに依存しない.前方への振出しフェーズは,
しかしながら,センサフィードバックに依存する.脚の前方掻出しが実行し扱れたという
ことを邇味して,もしスタックすれば,ロボットは,もう一度脚を引っ込めて,やや高く
もち上げて,そして前方振出しの実行を試みる.このように、コントローラはロボットと
その環境の相互作用から生じている出来卒に反応できる.
サプサンプシヨンアーキテクチヤは,AFSMを同期きせたり.おそらくは矛盾している
複数のAFSMの出力値を結び合わせるために,追加の基本要紫を提供する.このように,
それは,プログラマが,徐々に複雑なコントローラをボトムアップ的に作ることを可能に
する.我々の例では,個々の脚のためのA鰯Mから始まり,次に複数の脚を組み合わせる
AFSMに移るであろう.この上に,我々は,衝突回避といった高次の行動を実装するだろ
う.それは後ずきりと旋回を含むだろう.
AF5Mからロボットコントローラを作るという考えは.非常に興味ある・前節で述べた
コンフィギュレーション空間のいずれかの経路計画アルゴリズムを使って同じ行動を生成
することがいかに難しいかを想像しよう.第一に,我々は,正確な地形のモデルを必要とす
るであろう.そのそれぞれが二つの独立したモータによって駆動きれる六つの脚のロポプ
トのコンフィギュレーション空間は,合計18次元になる(脚のコンフィギュレーション空
間に12次元,環境に対する位置・姿勢の6次元).たとえ我々のコンピュータがそのよう
な高次元の空115で経路を見つけるほど十分に速かったとしても,我々は,坂を滑り落ちて
いるロポプトといった嫌な結果を心配する必要があるだろう.そのような確率的な効果の
ため,コンフィギュレーション空、Iの一つの経路は,Bi:弱すぎると断言できるだろう.そし
て,P、コントローラで答えも,このような出来事に対処することができないだろう.つ
まり‘熟考的に運動行動を生成することは,現在のロポプト運動計画アルゴリズムにとっ
て.単にとても複雑な問題である.
運悪く,サプサンプションアーキテクチヤは,それ自身に問題がある.第一に,もしセ
ンサデータが個頼でき,童思決定のためのすべての必要な憎報を含んでいれば,AFSMは
生のセンサデータによって駆iEbぎれ,うまく働くが,センサデータが自明でない方法で時
岡積分苔れなければいけないとき,失敗する.そのため,サブサンプション型コントロー
ラは.通常は,局所的なタスク,たとえば壁沿いや可視光源への移動などに適用ぎれる・第
二に,熟考不足は,ロボットのタスクを変えることを霞し<する.サブサンプシヨン型ロ
ポプトは,たいていただ一つのタスクを遂行する.そして,それは.異なる制御目標に適
応するために,その制御を修正する方法に閥するいかなる考えももっていない(ちょうど
サブサンプションアーキテクチャ(subsumptionar〔hitecture)(Brooks,1986)は,有限状
37ページのフンコロガシのように).股後に,サブサンプシヨン型コントローラは,理解
シンのノードは,あるセンサ蜜数のためのテストを含むことがある.その燭合.有限状懇
マシンの実行トレースが,このようなテストの結果の要件とぎれる.アークは,それらを
するの力種しい傾向にある.実際には,何十もの相互に作用しているAFSM(そして環境)
の、lでの込み入った相互作用は,ほとんどの人のプログラマの理解の範囲を超える.これ
らの理由により,そのすばらしい歴史的な敵要性にもかかわらず,サプサンプシヨンアー
態マシンから反応的コントローラを組み立てるためのフレームワークである.これらのマ
25章ロボティクス
944
25.7ロボットのソフトウェアアーキテクチャ
式のコントロールシステムのプログラムを作るための機能的なプログラミング官騎である.
キテクチャは,商業上のロボティクスでめったに使われない.しかし,いくつかの子孫は
三■アーキテケ
チャ
使われている.
ちょうど行動画IMiと何じょうに,CRLは,その遮礎的なビルディングブロックとして有
=厨アーキテクチャ
限状醗マシンを使う.この上に,それは,異なるモジュール1mでのコミュニケーションフ
ローと同期拘束を定鍵するための,行動箇鴎よりも広範囲の欄成物を提供する.GIRLのプ
ログラムは効率的で必須の箇蛎,たとえばC旨珊のような言語にコンパイルされる.
コンカレントロボットソフトウェアのためのもう一つ別の肛要なプログラミング言語化
ハイブリッドアーキテクチャは,反応と熟考を結合する.群を抜いて股も人気があ愚ハイ
ブリッドアーキテクチャは,三暦アーキテクチャ(thzBe-1ay已匝麺dlitecturdで,それは‘反
関連ぎせられるアーキテクチャ)は,反応的行動計画システムまたはRAPS(1991)であ
る.RAPSは,プログラマが目標,目標に関連したプラン(または-部の方鱸),そして
応屑.実行園と熟考層から撫成きれる.
反応■
反応暦(reactive出y巴r)は,ロボットに下位レベルの制御を提供する.それは,タイトな
それらのプランがうまくいくための条件を指定することを可能にする.決定的に,RAPS
センサイテ動ループによって特繊づけられる.その決定周期は,しばしI蓮およそミリ秒の
は,また実際のロボットシステムで起こる避けようのない失敗を処理するための機能を
提供する.プログラマは,橡々な種類の失敗の検出ルーチンを指定することができ,それ
オーダである.
質行田
実行圏(唾ecuti輻lay屯r)(あるいは月例序層)は反応層と熟考層の岡の欄として働く.そ
ぞれの樋釦に対して,例外処理ルーチンを指定できる.3層アーキテクチャでは,RAPS
は再計画すること力泌要でをい出来邪を処理するために,実行層でしばしば使われる.
ロポプト内で実行ぎれろ推飴や学習を駐容するいくつかの他の盲語がある.たとえば,
れは,熟考層によって指令を受け入れ,そして,反応掴のためにそれらを願番に並べる.
たとえば,実行圏は熟考的経Bii計画蟹によって生成きれた経由点の集合を取り扱うだろう.
■勺呵
そして,どの反応的行動を発動するかに関する意思決定を行うだろう.実行鰯の決定周期
は通常,秒のオーダである.実行屑はまた,センサ情報を内部状態表現に銃合することに
責任がある.たとえば,それは.ロポプトの位瞳決めとオンラインの地図作成ルーチンを
CoLoG(1997b)は.反応的制御の直接指示と熟考的問題解決(プランニング)とをシーム
まかなう.
動をもつ剛御プログラムの仕様に加えて,プログラマは,またロポプトとその環境の完全
なモデルを蝿供する必要がある.制御プログラムが,非決定的選択点に到達するときはい
レスに混ぜるプログラミング箇甑である.CoLocのプログラムは,非決定的行動オペレー
タの追加のオプション付きで状況計算(10.3節)の中で定式化ちれる.可能な非決定的行
熟考層(delibemtelay③r)は,計酉を利用して複雑なタスクに対する大局的な解決策を
生み出す.このような解決策を生み出すことに含まれる計算醤的1鰯置きのため,その決定
つも,計画器(定理鉦明器の形で)が,次に何をすべきかを決定するために呼び出ぎれる.
このように,プログラマは.戯終の制御選択をするために,一筋のコントローラを指定し,
そして内麓の計画器に頼ることができる.GoLoCの美し醤は,反応と熟慮のシームレスな
銃合にある.CoLocの強い要求にもかかわらず(完全観測,曜散的状態,完全モデル),
周期は,しばしば分のオーダである.熟考層(または計画層)は,意思決定のモデルを使
う.それらのモデルは,耶前に供給巻れるか,またはデータから学習きれるだろう.そし
て,それらは,実行屑で乗ぬられた状態の梢報をたいてい利用する.
3層アーキテクチャの変形は,最も現代的なロボットソフトウェアシステムで見つけるこ
とができる.三つの鰯への分制は,あまり厳密ではないいくつかのロポプトソフトウェ
アシステムは,人々との相互作用をコントロールするユーザインタフェース層.もしくは,
Gomcは,一連の屈内の移動ロポプトに高次の制御を提供した.
EES
た,追加の層を所有する.
似て,例示によってロボットソフトウェアを副線することを可能にする.CESはプログラ
マが,学習可臘な機能一典型的には,ニューラルネットワークのような微分可能なパラ
メータ衷現一によって埋められるプログラムコード中の“ギャップ溝を残すことを可能
ロボットプログラミング言語
多くのロポプトコントローラは,特定の目的をもつプログラミング言語で実装きれている.
にする.次に,これらの機能は明示的な鯛練フェーズで焔納的に学ばれ,そこで馴練者は
望みの出力行動を指定する必要がある.qBSは,部分観測可能で連続的なドメインで十分
たとえば,サプサンプションアーキテクチャのための多くのプログラムは,Bmoks(1990)
によって定穫暮れた行動言鱈(beh&viorkmguage)で実装苔れている.この言語は,AFSM
コントローラへコンパイルするルールベースのリアルタイムの制御言語である.L動のよ
うに,シンタックスはAFSMへコンパイルきれ.そして,複数のAFSMが局所的/大局
的メッセージ交換機構の集合を通じて統合きれる.
ちょうどサプサンプションアーキテクチヤのように,行動言鴎は,モジュール間のコミュ
ニケーションフローの比較的狭い定溌の単純なAFSMに焦点が限られている.この考えに
選づ譽,斌近の研究は,行動雷禰に精神的にはよく似た,しかし,実行きれるときに,よ
り強力で,より速いある範囲のプログラム言語に導く.一つのこのような言語は,汎用ロ
ボット苣鴎(geuIericrobotlanguage:CRL)(2000)である.GRLは,大きいモジュール
CESは,組込み型システムのためのC++(C++【。『⑥mbeddedsy意tems)を短くしたも
ので,硫寧を学習を統合するC十十の拡授官甜(2000)である.〔屯Sのデータ型は,確率
分布で通常要求される砿率的技法の実現努力なしに,不硴かな愉報でプログラマが計算す
ることを許す.より肛要なことに,CESは,20章で甑篭した学習アルゴリズムに非常に
同じ環境で稼動している他のロポプトの行動と自身の行動との調整に責任がある層といっ
汎用ロボット
百凪
945
値働くことが示されてきた.
Au3p
AL由p(2002)はL旧pの拡張である.ALislpは,GoLoGでプログラマに選択点に類似し
ている非決定的遡択点を指定曽せる.しかし,意思決定をするための定理江明器に依存す
る代わりに,ALispは強化学習を通じて,正しい行動を蝿納的に学ぶ.このようにALLsp
は,領域知職一特に、望みの行動の階咽的な“サブルーチン毎栂遺の知識-を強化学
習者に取り込むためのフレキシブルな手段と考えられる.今までのところでは。ALispは,
シミュレーションでしかロボット問題に適用苔れてこなかったが,しかし,それは,環境
と相互作用を通して学ぶロボットを柵築する有望な方法鶴を提供する.
25章ロボティクス
946
25.8応用領域
947
25.8応用領域
今から,我々はロボットテクノロジーの主要な応用領域のいくつかをリストアップしよう.
エ業と農業.伝統的に,ロボットは,人IHIにとっては厳しい労働だがロボットオート
メーションが十分なじむに足るように構造化された領域に股腫きれてきた.最も良い例は,
組立てラインで,マニピュレータが組み立て,部品股匿,部材操作,溶接,塗装のような
タスクを規定どおりにこなす.多くのこれらのタスクで,ロボットは,人間の労働者より
も経済的になった.
屋外で‘我々が収穫,採掘,発掘に利用する、1機類はロボットに代わりつつある,たと
えば,カーネギーメロン大学の鰻近のプロジェクトは,ロボットが人間の約50倍の速答
で大型船の塗装除去作業力可能なことを示し,そして環境への影轌も多く削減きれた.自
律型採掘ロボットのプロトタイプは,地下鉱山の鉱石を輸送することに関して,人間より
も速く,より正確だとわかった.ロボットは,捨てられている地雷と下水通の高精度の地
図を生成するために使われてきた.多くのこれらのシステムは依然としてプロトタイプ段
階であるが,現在人間によってなきれる多くの半機械的な仕駆をロボットが代行するのは,
時間の問題にすぎない.
輸送.ロボットによる輸送は多くの側面をもっている他の手段ではアクセス困難な場
所への物資を配達する自律型のヘリコプタから,自身では車椅子を制御できない人々を運
ぶ自律的な車椅子まで,そして,積栽ドックで人間の習熟運転手よりも.コンテナ輸送が
優れた自律型ストラドルキャリアまで.屋内の搬送ロボット,あるいは使い走りロボット
の主要な例は,図25.23(&)で示答れるヘルプメイトロポットである.このロボットは,食
品と他の物品を輸送するために,何十もの痛院で配置きれた.研究者は,自律的に高速道
路をナピゲートしたり,またオフロードの地形を横断すること力可能な車のようなロボッ
トのシステムを開発した.工場の殻定では,自律移動ロボットは,倉庫や生産ラインのIm
で品物を搬送するために,日常的に配置きれる.
多くのこれらのロボットは,彼らの作動のために環境の鯵正を必要とする.瞳も一般的
な修正は,床の誘導ルー乳能動的なビーコン,バーコードタ銘そしてGPS衛星といっ
た位種決め支援である.ロボティクスの公開挑戦課題は,特にGPSが利用できない深い
海といった環境でナピゲーションするために,人工の機器の代わりの自然の手がかりを使
うことカサできるロボットの股計である.
危険な環境.ロボットは,人間が核廃棄物を除去するのを手伝った.最も知られている
のはチェルノブイリとスリーマイル島である.ロボットは,世界貿易センターの崩壊のあ
とで現れ,人間の捜索隊貝と救助貝にとってはとても危険だと考えられた建物に入った.
ある国は,弾薬を輸送し,爆弾の信管を外すために,ロボットを使ってきた-よく知
られた危険な任務である.多くの研究計画は,現在,地上と海上で地濫敷股地帯を処理す
るためのプロトタイプ・ロボットを開発している.これらのタスクのために現存するほと
んどのロボットは,遠隔操作きれている-人間が,遼隔操作でそれらを操作する.この
ようなロボットに自律性を与えることは,重要な次のステップである.
探査.ロボットは,火星の地表を含めて,誰も以前に行かなかったところへ行った(図
25.1(a)参照).ロポットアームは,人工衛星の展開と回収ならびに国際宇宙ステーション
の建造で宇宙飛行士を支援する.ロボットはまた海中探査も助ける.彼らは,定期的に沈
没船の地図を獲得するために利用言れる.図25.24は,レンジセンサを使って獲得した炭
鉱の3次元モデルと ̄緒に,廃鯉の炭鉱の地図を作成するロボットを示す.1996年に,研
究者のチームは,気候調壷にとって亜要なデータを獲得するために,活火山の噴火口へ脚
ロボプトを送りこんだ.ドロン(dmne)として知られている無人飛行艇は,軍事行醐で使
われる.ロボットは,人間にとってアクセス困難な(あるいは危ない)領域で,情報を集
めるためのとても効果的な道具i二なっている.
健康管理.脳,目,心臓と同等に複雑な闘器の手術時の衛具配置で,ロボットは,外科
医の補佐にますます利用ぢれろ.図25.23(b)は,このようなシステムを示す.彼らの高
い精度のおかげで,ロボットはあるタイプの人工股関節手術ではなくてはならない適具に
なった.予備的研究で,結腸内視検査法を実行するときに,ロボットのような装置は,障
害の危険を減少答せることがわかった.手構室の外では,研究者は,知的なロボット歩行
器や薬の服用を思い出巻せる知的なロボットおもちゃといった,年配者や身体障害者のた
めの支援ロボットを開発し始めた.
25車ロボティクス
948
個人サービス.サービスは,ロボティクスの有望な応用領域である.サービスロボット
は,個人の毎日の仕事をするのを手伝う.市販されているホームサービスロボットに,自
動掃除機,芝刈り機とゴルフキャディーがある.これらすべてのロボットは,自律的に移
動して,そして人間の助けなしで任務を果たすことができる.いくつかのサービスロボッ
トは,ショッピングモールと見本市でロポプト1W報キオスクとして,またツアーガイドと
して美術館などの公共の鰯で稼動している.サービスタスクには,人1mとの相互作用が要
求きれ,予憩できない動的な環境ではロバストに対応する能力が要求ぎれろ.
エンターテイメント.ロポプトは.エンターテイメントとおもちゃ業界を征願し始めた.
919
25.9まとめ
・カルマンフィルタやパーテイクルフィルタのような確率的フィルタリングアルゴリ
ズムは,ロボットの知覚に役立つ.これらの技法は,状鰹という個念,すなわち状
態変数にわたる事後確率分布を保守する.
・ロポプトの運動計画は,通常,コンフィギュレーション空岡で立てられる.そこで
は,各点はロボットの位画姿勢と関筋角を捕定する.
・コンフィギュレーション空1mの探索アルゴリズムは.すべての位圃姿勢の空間を有
限の多くのセルへ分解するセル分解や,コンフィギュレーション空IHIを低次元空1m
のマニフオルドヘ投射する外骨格手法を含む.そして,運動計画問題はこれらのよ
我々は,図25.4(b)でソニーアイポを見た.この犬のようなロポプトのおもちゃは,世
界中のAI実験室で研究プラットホームとして使われている.このプラプトホームで研究
ロポプトサッカーきれているAIの挑戦タスクの一つは,ロボットサッカー(roboticBoccer)で,人間のサッ
カーに酷似した競争的なゲームだが,自律移動ロボットとして動作する.ロボットサッカー
は,それが多くの他の,より本格的なロポプトの活用にとって原型となる一連の問題を鍵
起するので,AI研究のすばらしい機会を提供する.毎年開髄きれるロボットのサッカー大
会は,非常に多くのAI研究者を引きつけ,そしてロボティクスのフィールドに多くの興
奮を加えた.
人間の鱸力増強.ロボットのような科学技術の最終的な適用領域は,人間の能力を期強
する領域である.研究者は,11噸子のような,人町を運び歩く脚歩行マシンを開発してき
り単純な構造内の探索を利用して解かれる.
・探索アルゴリズムによって見つけられた経路は.PIDコントローラのための参照軌
逝としての経路として利用することによって実行ぎれうろ.
・ポテンシャル場技法は,障害物と目標位腫への距離について定韓菩れたポテンシャル関
数によって,ロポプトを操縦する.ポテンシャル場技法は,極′l、甑でスタックするかも
しれない.しかし,経路計画の必要性なしに連動を直接生成することが可能である.
・時々,経路を明確な環境のモデルから引き出すよりは,直接,ロボットコントローラ
を指定することのほうが,よりlpnlLである.このようなコントローラは,単純な有
限状鰹マシンとしてしばしば書かれることが可能である.
で,人々の歩行や腕の動作を容易にする装画の開発に魚点を当てている.もしこのような
・サプサンプシヨンアーキテクチヤが,内蔵タイマを強化することで,互いに連結葛
せられた有限状憩マシンからロボットコントローラをプログラマが作ることを可能
装瞳が永久に取りつけられれば,それらは,人工のロボットのような手足として考えられ
ることができる.ロボットによる遠隔操作や遠隔呈示は,別の形式の人1111の能力瑚大であ
・3暦アーキテクチャは,熟考,サプゴールの系列化,コントロールを統合するロボッ
た.現在,複数の研究活動が,外骨格アタッチメントを通じて付加的な力を供給すること
にする.
トソフトウェアを開発するための共通のフレームワークである.
る.遠隔操作は,ロボットのような装肚の支援により,遠距離の任務を実行することを含
む.ロボットによる遼隔操作の普及した形態はマスタースレイプ形式で,そこでは,ロボッ
・ロボットソフトウェア開発のための特定目的のプログラミング言語が存在する.こ
トマニピュレータは,触覚インタフェースを通して測ることができる遠隔の人IHIのオペレー
れらの言語は,マルチスレプド・ソフトウェアの開発,献画に組み込むための制御指
タの運励を見習う.これらすべてのシステムは,人、の砺境への相互作用能力を墹大きせ
令の統合,および経験から学ぶための柵成概念を蝿供する.
る.少なくとも,非常に表面的な水準で,人間を複製するいくつかのllf面が進んでいる.
ヒューマノイドロボットは数社の日本企業から市販きれている.
文献と歴史ノート
ロボット(robot)という百葉は.チェコの脚本家K…lCapekによって彼の1921年の劇
R、DBH.(RDSSum'BUnivelEa1Robots)の中で使われ,大衆化苔れた.ロボットは機械的に
25.9まとめ
作られたというよりはむしろ,化学的に育てられたが,結局自分の主人を嫌悪し,支配す
ロボティクスは,物理的な世界を操作する知的エージェントに関係する.この章では,我々
は,ロポプトのハードウェアとソフトウェアの以下の避礎を学んだ.
・ロポプトは,環境を知覚するためのセンサと,環境に物理的力を現すことができる
アクチユエータを装備する.ほとんどのロボットは,固定の場所に据えつけられた
たマニピュレータか.動くことができる移動ロボットである.
・ロポプトの知覚は,センサデータから決定に関連した量を推定することに関係する.
そうするために,我々は,内部表現とこの内部翌現を時岡とともに更新する方法を
必要とする.困躍な知覚の問題の一般的な例は,位、決めと地図作成を含む.
ることを決める.実際には,竺口ポット画という画莱を生み出すためにチニコ鰭の"mbo煙,.
(義務的仕事)と“mbomik”(農奴)を股初に組み合わせたのは,Capekの兄であったJosef
で.彼の1917年の短鬮OpiUf瞳においてであったらしい(Glanc,1978).
ロボティクスという用鴎は,最初に(Asimov,1950)によって使われた.しかし,ロボ
ティクス(他の名前のもとで)は非常により長い歴史をもつ.古代のギリシアの神賭にお
いて.nlosという名の機械男は,HeplMnsOos(冶金術のギリシアの神)によって,おそら
く設計・製作言れた.すばらしい自動人形は,18世紀に作られた-JapquesVbLucanson
の機械アヒルは1738年からの初期の一つの例一しかし彼らが示した複雑な挙動は,前
もって完全に定められていた.鍔そら<,プログラム可能なロポプトのような装瞳の履も
25通ロボティクス
950
初期の例は,第1章で記述ぎれているジヤカード式紋織機(1805)であった.
ユニメイト
最初の商業的なロポプトは,ユニメイト(Unimate)とよばれたロポットアームで,=鑓曲
25.9まとめ
マルコフ位紅決
め手法
なオートメーションを意味するRmiu鋸amutomUtioTUの省略形である.ユニメイトは,
JosephEngelbergerとCeOrgeDevclによって開発きれた.1961年'二,逓初のユニメイトロ
ポットはゼネラルモーターズに売られ,そこで,それはテレビのブラウン管を製造するため
に使われた.1961年はまた,DevDlがロポブトで熾初のアメリカの特許を得た年であった.
11年後の19勉年に日産は,EngelbCT恩erとDcvDlの会社ユニメーシヨンによって供給碁れ
Ra⑨
団些と二mH■d
パーティクル
フィルタ
たロボットで川崎正工が開発したロポプトによって,すべての組立てラインを賦初'二自動
PUMA
化した.この闘発は,大部分は日本とアメリカで起こった大きな展開のロ火を切った.そし
て,それはいまだ'二進行中である.ユニメーシヨンは.PUMA(P、…mmableUni…出
によって展開されて,現在広く使われている.nm.B脳CkwelUzedパーティクルフィルタ
(Ra⑨BladEwCUizedparticlenlter)は,ロポプトの位腫決めのためのパーテイクルフィルタ
技術を,地図作成のための明確なフィルタ技術(MurphyfLndRu璽製」1,20016Mont4merlo,
Thrun,KoU画,andWbgbreit,2002)に結びつけている.
移動ロポプトの研究は,二つの血要な醜技会によって最近の10年にわたって刺激を受
技会勝者は,CARMBL(Congdon,Huber,Kortenl且、p,BidladK,Cohe血,HuHman,Koss,
Raschke,andlA厄ymouLh,1992)であった.進歩は,安定していて印象的だった.最も鮭近
ト(畿初にゼネラルモーターズのために開発苔れた)は,あと'二鶴いた20年の1mのロポッ
の競技会(2002)では.ロボットは複雑な会餓期の建物に入り.登録受ltlへ行く経路を探し
ロポカップ
出し,会鴎登録し,鱒演しなければならなかった.ロポカップ(Robocup)0競技会は,1995
年,北野宏明と彼のグループ(1997)によってに始められ、2050年までに鰯サッカーにお
は,コントロールシステムがプログラム可能でなかったが,最初の自律移動ロポプトと考
いて入団の世界チャンピオンチームに対して勝つことができる完全自律型のヒューマノイ
プキンスビースト(HopkinsB…t) ̄は,ずっと洗練きれていた.それは.パターン囲職
異なるサイズの移動ロボットと四本脚のソニーAiboロボットのリーグからなる.j2002
ドチームを開発すること鱒を目指している.競技会は,シミュレーションきれたロボット,
えられることができるだろう.ジョンズホプキンス大学で1960年代初期に作られた“ホ
ハードウェアをもって,標準のAC冠源アウトレプトのカバープレートを鯉職することが
できた.それはアウトレヅトを捜し,そして,それ自体をプラグインして,そこからバッテ
リを再充髄することができた!しかし,ビーストは限られたレパートリーのスキルしか
ハンドアイマ
シン
年に.競技会は,ほぼ30の異なる国からのチームと100,000人以上の来場者を得た.
マニピュレータロボットの研究はもともと“ハンドアイマシン(hand-ey⑧machine)0,とよ
ばれ,まったく異なるラインに沿って進化した.ハンドアイマシンを作ることの殿初の主要
もっていなかった.餓初の多目的移動ロボットは,当時スタンフォード研究、Ni(現SRI)で
1960年代後期に開発ぎれた鰊Shakeヅ'であった(FikesqndNilsBon,1971;Ni…、,1984)
な努力はHeinrichErnstのMH-1であり,彼のMITでの博士践文に署曽れている(Ernst,
1961).Edinburghでの機械知能プロジェクトは,FRBDDY(Micbie,1972)とよばれる,印
の研究は,この著しい達成に影騨きれた.他の影尋力があるプロジェクトは.スタンフォー
象的な初期の視覚に基づく組立てシステムを示した.これらのパイオニア的な努力のあ
と,多くの研究は,決定鶴的で完全に剛8Mできる運mbBf画間翅のための幾何学的アルゴリ
ズムに集中した.ロボットの運動計画におけるPSPACB困鰹は,Reifの影轡力のある證
ロボットの古典的な研究を記述している.
文(1979)によって示きれた.コンフィギュレーション空1,表現は,IpzanoPerez(1983)
Shakeyは知覚,計画,実行を統合する賎初のロボットであった.そして,AIの多くの以降
ドCartとCMURcver(Morav。。,19鋼)を含む.CCD(andWiIIbng(1990)は,自律移動
による.非常に影騨力があるのは,SChwartZとSharirによる一連の薗文で,彼らがピア
ロボットの地図作成の分野は,二つの異なった起源から進化した.蛾初の糸はSmithand
Ch2eseman(1986)による仕事から始まった.彼らは,カルマンフィルタを同時位極決め
ピアノ移勘
ノ移動(pianomovGr)問題とよぶものであった(Schw掴rtz,Scharir,andHopcmft,1987).
可視グラフ
甦rez(1985〕によって始められ,そして,ZhuandLatombe(1991)によってかなり改善
暮れた.最も初期の骨格化アルゴリズムは,ポロノイグラフ(RDwat,1979)と可視グラ
フ(visibintygraph)に鑑づいていた(WesIeVandLozanlo-Pe鹿,1979).Glmbas,Knuth,
andShmr(1992)は,徐々にポロノイグラフを計算する効率的な技法を閲発した.そして,
Choset(1996)は.ポロノイグラフを非常に広い運mblif画119題に一般化した.JohnCamy
コンフィギュレーション空Ruでの計画のための再帰的なセル分劇は,B「ookSandlpzan年
地図作成問題に適用した.このアルゴリズムは,MoutarIierandChaLila(1989)によって
瞳初に実装きれて,あとでLeonardandDmranレWhyte(1992)によってに拡磯された.
Dissanayake,New、紐、,qark,DurmnしWhy6e,andCBorba(2001)は,股先j:i技術水準を
占有播子
SimmomBandKoenig(1995)を通じた研究まで,AIの文献の中には現れなかった.のちの
研究はマルコフ位邇決め手法(MarkovloCal趣tion)という用盟を導入した.博物館に配憶
きれた一連のロボットによって,この技術の鹸初の実際の応用は,BmgaTd,Cremer日,rbo[,
mhnd,Iakem息yer,Schulz,Steiner,andThrun(1999)によるものであった.パーテイクル
フィルタに基づくモンテカルロ位腫決め手法は,r、,Bur忠、1,DCUaKrt,andThrun(1999)
けてきた.毎年閲11世されるAAAIの移動ロポプト競技会は,1蝿2年に始まった.最初の鏡
MachinefbrAssemiy)ロボットの開発で,1978年にフォローアップした.PUMAロボッ
トマニビュレーションの事実上の標準であった.現在,ロボットの穂働台数は,世界的に
100万台と推定きれ,その半分以上が日本に股、ぎれている.
ロボティクス研究についての文献は,大まかに二つの部分に分けることができる.移動
ロボットと据えつけのマニピュレータである.C[屯VWhlterの1948年に作られた鰯カメ”
951
記述している.第二の糸は,確率的地図作成のための占有格子(occupancygnd)表現の発
達から始まった.それは,おのおのの場所(Tbv)に対応する格子力彌聾物によって占有き
れている確率を指定する(MoravecandEUbs,1985).ロボットの地図作成の最高71.隆の技
術の概要は,(Thnln,2002)の中に見つけることができる.KuipersandLevitt(1988)は
測量法による地図作成ではなく,人間の空間鯉鐵のモデルによって動樋づけられた位相的
なマッピングを騒初に提唱した一人である.
初期の移動ロポプトの位団決め技術は,Bo祀nsten,回聴rett,andFbung(1996)が概衙Hして
いる.カルマンフィルタは何十年も制御理錯における位肛決め手法として有名だったが,位
憧決め問題の一般的な確率による定式化は,IbmD巴anと彼の同僚の仕111(1990⑧、1990b),
シルエット
の博士篭文(1988)は,異なった骨格化手法を用いて,シルエット(silhoueLte)アルゴリズ
ムとよばれる,運動計画の殿初の-変数指数関数アルゴリズムを確立した.Jeghn-Claude
Latombeによる文献(1991)は.運動計團問題の広範な手法をカバーしている.(Kavraki,
o銀注:正確にはHob⑪Cup(丑母西極)である.
」訳注:2002年からヒニーマノイドリーグが始まっている.また,サフカー以外'二・災害壮助を目掬したレス
キューリー銑次世代ロポプト研究者や同月新をwてるジュニアリーグもある.
25軍ロボティクス
952
25.9まとめ
SveStka,mtombe,andOvermBェ3,1996)は砿率的ロードマップ法をIHI発し,そして,そ
ポットアーキテクチャとシステムの包括的な概要を提供する.DudekamdJexnkin(2000)
ニングは,(IpzanGPe…MaBon,aJudIHylor,1984)とCannyandReif(1987)によって,
ロポットマニビュレーションに閲する鼠近の本は,コンプライアントモーションのような先
とMurphy(2000)による2冊の最近の教科替は,より一般的なロボティクスをカバーする.
れは現在鰻も効果的な手法である.限られたセンシングによるファインモーションプラン
確率の不確奥性よりむしろ間隔不確実性についての考えを使って閥在きれた.ランドマー
進のトピックを扱う(Ma5onp2001).ロボティクスに関する主要喉会殿は,IEEEIntema-
アイデアの多くを使う.
qmdAu8⑥mq2jo冗,hU2enE⑪fio極Jbt`maJq'Robot麹RescnvTlb,RobDticsE花。A池CD卸01m…
クに基づくナビゲーシヨン(LaZanasandLatombe,1992)は,移助ロボットの御台で同じ
tionalConfbl巴nceonRoboticsamdAutomationである.Lジャーナルは,IEEEjTobDt鰹
ダイナミカルシステムとしてのロボットの制御一マニピュレーションか,またはナビゲー
ションのための-この翠の中の材料が,ほんのわずかしか触れていない膨大な文献を生み
shIstem3などである.
出した.皿要な研究は,Hoganによるインピーダンス制御に閥する3節作(1985)とロボッ
トダイナミクスの一般的な研究(Fb③the…、。,1987)を含む.DemandWblIman(1991)
は,制御理鑓とAIのプランニングシステムを結びつけようとした姫初であった.ロポット
担拘
勉世フィード
バック
練習問題
マニビュレーションに閲する数学の3冊の古典的な教科碑は,Paml(1981),CTaig(1989)
25.1モンテカルロ位置決め法は,どんな有限のサンプルサイズに対しても,パーティク
-安定した把持を決定する問題は.非常'二困難である(MmBonandS…bury,1985).能
力のある把持は,接触力を決定し,渦I)を検出するために,接触の感覚もしくは触覚フィー
ドバック(haPtiCneedbadK)を必要とする(P上mngandHonerbach,1985).
計算きれる位世の期待値は.其の期待値と異なる.この質問では,あなたはこのバイアス
ルフイルタの作用の仕方によって,バイアスを受ける.すなわち,アルゴリズムによって
とYbshikawa(1990)による.把持(graspmg)の分野もロポテイプクスにおいてⅢ要である
の量を定めるよう求められる.
簡単のために,ロボットの可能な位固力泗つの場合の世界を考えよう:x=(露,゛律2,罪3,ェ4}・
初めに,我々はそれらの場所の中から,一様にⅣ三1個のサンプルを引こう.通常どおり,
複数のサンプルがいずれかの嶋所Xのために発生するならば,それは完全に許容できる.
ポテンシャル輯制御(それは迎助計画と制御IMI皿をl可時に解こうとする)は,Khatib
(1986)によってロポテイックスの文献に導入苔れた゜移動ロボット研究では,この考えは衝
ベケトル■ヒス
トグラム
953
Zを以下の条件付き確率によって特徹づけられる二値センサ変数としよう:
突回避問題の実際的な解決としてみな冬れ゜あとにBore函teinによって.ベクトル蝿ヒス
トグラム(vcctorlieldhistogr…)とよばれるアルゴリズムに拡張ぎれた(1991),ナビゲー
P(zlエ、)=0.8P(気zIエ,)=0.2
ション関数(決定麓的なMDPsのための制御方策のロポティックス版)は.Koditschek
U987)によって導入ぎれた.
ロボットのためのソフトウェアアーキテクチャの麟阻は,多くの宗教的な餓謄iを生む.古
F(zlエコ)=0.4PトzIエ2)=0.6
F(zl鞄)=0.1P(-zIエ3)=0.9
F(zlエ4)=0.1P(ヨニ1.F4)=0.9
きよき時代のAIの候補は-3屑アーキテクチャーShakeyの股計の時代に苫かのぼり,
Catによって見直きれる(1998).サプサンプションアーキテクチャは.RodneVBrook3に
MCLはパーテイクルのⅢみを生成するためにこれらの確率変数を利用し,それらは,そ
よる(1986).類似した考えがBraitenberg(1984)によって独立して発展したけれども,彼
のあと正規化きれ,再サンプリングの際に利用ぎれろ.簡単のために,jVに閥係なく,再
は,彼の博士陰文(1989)で,完全に反応的であった回収作業能力をもつ移動ロポプトを開発
ング過程は.Xの上に確率分布を定める.
の著薔1/WCleSは,行動規範型アプローチに撃づく一連の単純なロポプトを記述している.
Bmok8の6脚歩行ロボットの成功のあとに,多くの他のプロジェクトが鶴いた.Connell
サンプリング過程で,たった1個の新しいサンプルしか生成しないと仮定しよう.このサ
ンプルは,Xで四つの位圃のいずれともと一致するかもしれない.このように,サンプリ
した.行動規範パラダイムのマルチロポプトシステムへの拡張は,文麟(Mataric,1997)と
a.この新しいサンプルのためのXの上の結果として生じる確率分布は何か?この質
(1998)は.最高水準の技術を鯛垂している.
b、二つの確率分布Pと。の相違はKLlii報量(KunbackLieblerdi肥団genoe)によって
計測きれる.それは,以下のように定銭苔れろ.
(Parker,1996)に見つけることができる.CRL(HmBwiU,2000)とCoLBB”(Konolige,
1997)は,並列行動規範型ロボティクスをいくつかのロボット箇贈に抽象化する.Arkin
問に,」V=1,...,10の場合と」V=COの場合に分けて答えよ.
7車で毘述ぎれた状況オートマトン(BituaLedautomata)(RD6emschein,19856K鴎lbling
…1-EP(露J1蠣鵠
andRosemschBm’1990)は,また,探ヨiEと配連作乗のための移動ロポプトを制御するのに
用いられてきた.状況オートマトンは,単純な組合せの回路を使って現境の状態の棟相を
追跡する有限状H1Iオートマトンから成り立つという点で,行動規範型の:RBIと非常に密接
な関係にある.行動規範型アプローチは,明示的な表現の欠如にⅢさをおくが,状況オー
トマトンは,それぞれの状憩レジスタの代衷的な内容が正しく定蕊ぎれるように.宜箇的
環境モデルからアルゴリズムとして輔藁ぎれる.
いくつかの鼠近の良い教科轡は.移動ロポプトの分野に存在する.上で参照きれた牧科
書に加えて,Kortenkamp,Bonasso,andMurphy(1998)による解既製は,現代の移助ロ
(a)の中の分布と其の駆後確率分布の間のKL捕報量はどんなものか?
c、問題定式化(アルゴリズムでない!)のどんな俸正が,上の特定の推定器に対して
Jvの有限の値のときで苔え,バイアスがかからないと保証するだろうか?少なく
とも二つのそのような俸正(それぞれは,十分でなければならない)を与えよ.
画8
25.2レンジセンサ付きのシミュレーション苔れたロボットのためのモンテカルロ位圀決め法
■研注:主要な金堕としてJBEEJn8CTTT麺。"uCm化7℃Tロ産mjm$JJig…他DC⑭…dsp3帖T犯sもある.