Title 学習方式によるロボットの運動制御 Author(s) 川村, 貞夫 Citation

Title
Author(s)
学習方式によるロボットの運動制御
川村, 貞夫
Citation
Issue Date
Text Version ETD
URL
http://hdl.handle.net/11094/773
DOI
Rights
Osaka University
学習方式によるロボットの運動制御
昭和61年2月
川 村 貞 夫
(
華警暮
藷圭姦
)
柔最果己人己人
ξ汽㌢隻産室憂
ξξ簑差差童美
学学罷す髭す釜
強明く
な す すくすく
り れ れ れ
ぱ ぱ ぱ
7
〃’
/
、
(本論文第9章実験結果より)
一三一
目≧欠
集1章 緒論
第2章 時不変線形メカニカルシステムに対する学習制御
2−1.緒言
2−2.誤差の収束健
2−3。錯言
第3章 学習制御方式のシステム論的考察
3−1.緒言
3−2.周波数領域における解析
3−3。有界実性,感度,最適レギュレータとの関係
3−4.シミュレーション結果
3−5.緒言
第4章 時変線形メカニカルシステムに対する学習制御
4−1.緒言
4−2.誤差の岐稟性
4−2−1.速度信号による入力の修正法
4−2−2.位置信号と速度信号による入力の修正法
4−3.緒言
第5章 ある種の非線形システムに対する学習制御
5−1.緒言
5−2.誤差の収束牲
5−3.緒言
第6章 移動ロボットヘの適用
6−1.緒言
6−2.二足歩行ロボット
6−3.運動学習経験に基づく歩行パターンの選択
6−4.緒言
第7章 ロボットマニピュレータの連動制御への適用
7−1.緒言
7−2.非線形システムとしての定式化
7−3.時変システムとしての定式化
7−4,緒言
第8章 ロボットマニピュレータの力制御への適用
8−1、緒言
8−2.力と位置のハイブリッド学習制御の権威
8−3.緒言
第9章 実験結果
9−1。緒言
9−2.二足歩行ロボット
9−3.ロボットマニピュレータ(1)
9−3−1.速度信号による入力の修正
9−3−1−1。関節角摩擦制御
9−3−1−2.作業摩擦制御
9−3−2.加速度信号による入力の修正
9−4。ロボットマニピュレータ(2)
9−4−1.円軌道
9−4−2.I直線軌道
9−5.ロボットマニピュレータの力制御
9−5−1
.研磨作業
9−5−2
.グライデング作業
9−6.緒言
第10章 緒論
謝辞
参考文献
記号
Rn:実数を要素とするn次元ベクトルの集合.
Rnxm;実数を要素とするnxm次元ベクトルの集合.
xξN:xが集合Nの要素であることを示す.
Cn[O,T]:区間[O,T]でCn級関数の集合.
一
V・
隻菖■章
系書言窩
■一■ ロボットの運動制御
人問と同じような姿をして,人間と同じような行動をする機械にロボットという名前が
初めて付けられたのはチェコスロバヰアの作家カレル・チャペルが1920年に発表した
戯曲においてであった. その後このような機械を実現するために基礎的な研究が続けら
れ,特に1980年代に入ってエレクトロニクスの慧遠な発達にともなって,ロボットは
色々な作業現場で便用される身近な機械になりつつある.現在では塗装作業や溶接作業な
どある程度人間の作業をロボットに代行させるという目的は達成されたと言っても過言で
はない。しかしながら,現段階てば口ホットの運動という最も基本的な分野に限っても,
理想的な運動パターンをロボット自身が自律的に実現しているとは言い難い.即ち邊多く
の産業用ロボットてば,人問がロポヅトを動かして教示する(ティーチングプレイバック
方式)方式が主流であり,人問による教示作業をプレイバックするだけのものが多い.そ
れは,チャペルが始めに想像し,その後多くの人が夢見た理想的なロボットの姿とはあま
りに違ったものとなっている。
多くのロボットは作業空間を広くとり多種多様な作業を実現するために多自由度の関節
構造のものが利用されている.これらのロボットでは,そのダイナミクスが多変数であり
非線形であることから運動の制御が著しく難しいものとなっている.このような特徴をも
つロボットに対して,古典制御理論におけるP.I.D方式を基礎としたサーボ理論によ
って自擦運動についてのフィードバック制御系を構成する方式が用いられ,実際の作業現
場にも適用されはじめている.きらに,この方法は,非線形特性を有するロボット運動の
グローバルなロバスト性と安定性を保証できることが示されており,ロボットの連動制御
の有効な一手法となっている.[1ト[4]
しかしながら,現実的により高遠な目標運動パ
ターンをより高精度に実現しようとするとき,フィードバックゲインを極端に大きくする
ことが安定牲などの問題から不可能であるので,従来のフィードバック系だけでなく何ら
かのフィードフォワード系をロボットに付加することが必要となる.このような考えに基
づいた非線形補償法会既にいくつか開発されている.[8コ その最も基本的な形は,ロボッ
トに目標運動を実現させるために必要な入力を,あらかじめ推定されたロポツトの物理パ
ラメータに基づいて計算する方法である.ところが,これらの方式ではロボットダイナミ
一1一
クスのパラメータを正確に同定しなければ入力が得られないことや,入力の計算が複雑で
あるなどの問題がおこる.またこれとは別の方式で,ロポツトのパラメータの同定を事前
に必要としないという点で有効なモデル規範形適応制御方式がロボットに適用されたが,
[9]・[10コ 現時点では計算機の計算速度の問題や,ロボットの非線形性をどのように取り
扱うかの問題が残されている.
■一2 学習という概念の導入
それでは,このような特性をもつロボットに対して,どのような制御方式が適している
のであろうか.従来の制御理論に着目してみると,まず制御理論のおこりは,ワットによ
って発明された蒸気機関の回転速度を調節するガバナー(調速器)に対する解析であると
言われている.そこでは,周波数領域においてシステムの安定性が解析され,古典制御理
論として体系化された.その後,システムの状態空間という概念に基づいた現代制御理論
が登場し,最適性を考慮した様々な手法が開発された.ここで留意すべきことは,古典制
御理論における安定性の解析や現代制御理論における最適性の解析の基本は,線形システ
ムに対する時間無限大でのシステム応答の厳密な説明であり,必ずしも過渡的なシステム
の応答を直接操作し得るとは言い難い点である.具体的には,古典制御理論においてぼ,
過渡的な特性を定めるパラメータを最終的に人間の経験によって決定していることや,現
代制御理論での最適レギュレータでは過渡的な出・カハターンを直接操作し難い事などがあ
げら一れる.一方,ロボットの運動制御については,時間無限大での運動.の様子よりもむし
ろ有限時間区間での過渡的な応答を目標パターンに一致させることが重要となる. 従っ
て,従来の制御手法をそのままロボットの運動制御に適用するよりは,ロボットの運動特
性に適した制御方式を開発することが切望される.
有限時間区間でロボット運動を目嬢パターンに近づけるための制御手法を考えるとき,
我々人間がひとつの運動フォームを獲得する方法が大きなヒントを与えてくれる. それ
は,目標運動パターンが有限な時間区間で与えられるが故に,何度も実際の運動を繰り返
すことが可能となり,その繰り返しによって目標連動パターンを実現するようないわゆる
学習能力である.我々は色々な運動フォームを学習することによって獲得している.本研
究の目的は,このような運動についての学習能力をロボットに付加することである. 即
ち,与えられた目標パターン(理想的な運動フォーム)を試行を繰り返すことによって実
一2一
現するものである.具体的に一般の制御システムにっいてのべれば,パラメータが推定さ
れていないシステムの入力と出力のみに注目し,目標出力と毎回の試行時のシステムの出
力の差により入力を修正して,目標出力を達成する制御方式である.このような制御方式
が構成できればシステムについてパラメ}タを同定する必要はなく毎回の試行の繰り返し
によって,制御対象について学習することが可能となると予想される.このことはロボッ
トダイナミクスを正確に推定する必要なく,ロボットが試行を繰り返すうちに目標運動パ
ターンを実現することを意味している.従って,経年変化や招待する対象物の変化により
起こるパラメータの変化についても学習方式によって克服することができるものと期待で
きる.
学習能力を機械に付加した初めての例は1960年前後にRos馴b1attによって提案され
たパーセプトロンがあげられる.その後,1970年代には制御工学の分野にも学習方式
を導入した例はあるが,パターン認識手法の拡張や確率近似的な手法の,パラメータの学
習方式であり,動的なシステムを対象とするものは見られなかった.その理由の一つとし
ては,前述のごとく入出力のパターンに基づいた動的システムに対する学習方式を実現し
ようとすれば,入出力ハターンを何らかの方法でメモリニしておかなげれぱならないこと
が挙ばられる.数十年前ではこれは非常に難しいことであったが,現在では高度に発達し
たVL S I技術により,コンパクトにがつ安価にメモリーすることが可能となり動的シス
テムに対して学習という概念を導入するアイディアが現在では現実的な制御手法として浮
かび上がってきたと考えられる.
■一3 各章の構成
まず,第2章てば最も簡単な例として多入力多出力の時不変線形メカニカルシステムに
ついて,ある入出力関係と条件のもとに前節で述べた学習に関するアイディブが実現でき
ることを示す.次に,第3章では,対象を時不変線形システムに限定することによって,
従来の周波数領域における種々の解析結果とのつながりを示す.具体的には,システムの
有界実性,感度と呼ばれる量との対応と最適レギュレ}タの構成の条件との対応を明確に
する.また,この関係によって,学習プロセスを構成するために,状態フィードバックシ
ステムのフィードバックゲインはリッカチの方程式を解くことによって得られることが示
される.
一3一
ロボットマニピュレータの運動制御に適用可能な学習プロセスを構成する準備として,
第4章では,一般的な時変線形メカニカルシステムについて学習方式を定式化し,その有
効性を理論的に証明する.ざらに,学習プロセスの構成に際して,出力の微分信号を利用
することによって,制御対象はある種の非線形システムにまで拡張できる一 アとが,第5章
において理論的に示される.
以下,第6章,第7章 及び,第8章では,先に提案された学習方式をどのように実際
の制御対象に適用するかが論じられる.先ず,第6章では,本研究で提案する学習方式が
特に移動ロポヅトの制御に適していることを指摘する.具体的にぼ,二足歩行ロポヅトに
対して,適用可能であることが明らかにされる.きらに,一度学習により獲得した情報を
別の運動パターンに用いるシステムについて述べる.次に,第7章においてはロボットマ
ニピュレータに第4章及ぴ第5章で述べられた方式を適用できることが示される.そのた
めに,7−2節ではロボットダイナミクスの特性を考盧して第5章と類似の学習プロセス
様成の条件・が導出される.また,7−3節ではロボットダイナミクスが目壌軌道まわりで
線形化され,時変線形システムとして表現する.ざらに,第8章では,位置と力に線形構
造を仮定することにより,力の目標パターンをも学習プロセスにより実現できることが,
明らかにきれる.その際,位置と力の比例定数は未知である場合にも本方式の有効性が示
される.これらの制御対象に対して実際にいくつかの実験が行われ,それらの実験結果が
第9章に示される.畢後に,第10章において全章に関するまとめ,及び今後の研究課題
等について述べる.
一4一
隻竃2章
時不変線形メカニカルシステム
に対す一る学習制御
2一 ■
糸誓言
本章では,学習プロセスの構造を簡単に説明するために,制御対象を時不変線形システ
ムに限定して考える.このようなクラスの制御対象については,本論文で提案する方式と
類似の方式がいくつか報告されている.まず,内山によってロボットマニピュレータが連
動を繰り返しながら目標連動を実現するという先駆的な研究が行なわれた.こ12コこれは学
習という表現は避けているが,ロボットの入力ハターンを複雑な計算を介さずに形成しよ
うという意図で開発されたものであった。…方萱別のアフロ糾チは理中野らによって開発
された繰り返し制御と呼ばれるものがある。口3L離堪]これほ目嬢出力ハターンが鰯鰯関
数で与えられる場合に壬 前回の周期での誤差(目榛出力と実際のシステムの応答の差)
によって, 次回の周期の入力を修正して漸近的に目標出力に近づけようとするものであ
る.また,近年類似の方式についての研究も行なわれている、〔15コイ17〕いずれの手法も
ラプラス変換を解析に利用して,周波数領域で議論がなきれている晶本章でほこれらの手
法とは別に,時変線形システムや非線形システムに拡張する目的で,時間領域での解析壷
行なう。また,口添ットのようなメカニカルシステムに学習方式を適用することを考慮し
て,特にメカニカルシステムに制御対象を限定して議論する.
2−2 時不変線形メカニカルシステムに
対する学習制御
次のような多入力多出力のメカニカルシステムを考える.
R麦(t)十Q麦(t)十Px(t)=u(t),
y(t):麦(t)
(2−1)
ただし,uξRn:入力,y∈Rn:出力,R,Q,PξRnxnであり,行列R,Q,
Pが正定対称であるようなメカニカルシステムを考える.ここでの問題設定として重要
一5一
なことは対象システムとしては,線形メカ
ニカルシステムという構造を仮定している
y(t)
dynomics
1st triQlユ1
y
地(t)
十
が,各パラメータは未知であるということ
である.このシステムに対して,目標の出
y
object
u1(t)
一十
十
〈
θ(t)
memOr
力yd(t)を区間〔O・T](T:終了時刻)
で与える.まず,このシステムに対して,
1回目の試行時に適当な入力ul(t)をシス
テムに与える.このときシステム応答を,
x1(t)とすれば,(2−1)式は,次のよ
u2(t)
y
y2(t)
object
一2nd trld
id
dンmmics
此
此(t)
十
十
、
〈 e2(D
・
十
memOry
Fi2.2−1
Fig.2−1
うに表現される.
‘
Learning A1gorithm
R支1(t)十Q麦1(t)十Px1(t);u1(t)
(2−2)
y1(t)=重1(t)
ただし.初期条件は,
.麦1(・)一・。(・)・・1(・)一・O
(2−3)
と設定するものとする.ここに,・Oは位置パダン・(・)を目標位置パターン・。(・)
¥τ)・τ…
(2−4)
・・吐
に一致させる初期値である・一般にy1(t)は目標出力yd(t)に一致しないので・誤差
(2−5)
・1(t)=yd(t)一y1(t)
が存在する.そこで
2回目の入力u2(t)を
u2(t)=u五(t)十A・1(t)
(2−6)
一6一
と構成する.ここに,行列Aは,適当な正定対称行列である、このアルゴリズムをFig.
2■!に示す.以下この操作を繰り返すわけであるが,一般に試行回数をkとするとk回
目の試行時にはシステムが,
R麦k(t)十Q麦k(t)十Pxk(t)=・k(t)
麦。(・)=・。(O),・。(・):・◎
(・一・)
yk(t)=麦k(t)
と表わされる.また,入力は,
uk+且(t):uk(t)寺Aek(t)
e・(tトy・(t)Ty・(t) .
(ト8)
と表現される一このアルゴリズムによって誤差㍉(t)が減少またはゼ口に収束し主目標出
力yd(t)が実現されるかどうかが問題となる・このことについては次の2つの定理が成立
する.それらを示す前に聖以下の2つの事実に注意する、
(注意1)
(2−7)式,(2r8)式より,k+1回目の試行時にほ,
R麦k.1(t)十Q㍉。且(t)斗Pxk.1(t)賞uk.1(t)
茱uk(t)斗Aek(t)
(2−g)
が成立していることがわかる.(2−9)式から(2−7)式を差し引くことにより次の
開係が得られる.
R旨k(t)十Q主.k(t)十Pak(t)=Aek(t)
ただし・ak(t)=xk+1(t)一xk(t) である・
一7一
(2−10)
(注意2)
(2−10)式における
・k(t)については・
さk(t):麦k.1(t)I一支k(t)
=yk.1(t)一yk(t)
=yd(t)一yk(t)一(yd(t)一yk.1(t))
=・k(t)i・k.1(t)
(2−11)
が成立する.
定理2.1
初回の入力u1(t)及び目標出力yd(t)を区間[O・T]で連続な関数で構成し・条件
2Q−A>O が満足さ一れるとき,誤差ek(t)ば次の意味で減少する.
(2−12)
Sk.1≦Sk
Skは次の式によって定義される値である・
ここに
・・
¥)ψ
(2−13)
証明
(2−11)式より・Sk.1ぱ・
・…一
^1・艸)∼ψ)一W
一・・
¥)…什)小㏄)・ψ
と表現される.ざらに
(2−10)式より次式が成立する.
一8一
(2−14)
¥)(・き・一・吐)・・ψ一い∵二、
・・一・…
定理の初回の入力・1(・)に対する仮定と(・一・)一式より・㍉(・)ぱ・1関数となり・
yd(t)が連続関数であることより・誤差e1(t)は連続関数となる・以下同様の繰り返しに
より一般にek(t)は・連続関数となる・このことは・ (2−10)式からきk(t)・色k(t)
が,各々連続及ぴC1関数であることを示している.また,初期条件より,
色k(0):麦k,1(O)一麦k(O)=yd(◎)一yd(O)=O−
0
0
(2−16)
・k(0):xk.1(O)一xk(0)=・一・:O
となることより, (2−15)式は次のように部分積分によって書換られる,
u1、・(・)(・・一・)邑、(・)・・
・、一・い玉一、・(・)・さ、(・)令・、・(・)・・、(・)・
J O
(2−17)
定理の条件より2Q−A〉Oであるので,直ちに
(2−18)
Sk.Sk+1;≧O
が得られる。
.
証明終
この定理はSkという評価規範のもとに誤差が減少することを有限試行回数内で保証し
ているが・無限回の試行後に誤差がゼロに収束し・確実に目標出力yd(t)が得られること
は保証していない.そこで,無限回の試行後に目標出力が得られるかどうかについて次の
定理を与える.これは,目標出力・。(・)を・1級に限定することによって目標出力が獲得
されることを示すものである.
定理2.2
初回の入力u1(t)を区間〔O・Tコで連続な関数を与え・かつ目標出力yd(t)を区間[O・
T]で連続的に微分出能(C1級)で与えるとき,条件2Q−A>Oが満足されれば誤差
ek(t)は任意に固定さ’れた雫刻tでゼロに収束する・(ek(t)はゼロに単純収束する)
一9一
証明
・1(・)が連続であることから・・1(・)∈・21…1となり,目標出力を・。(・)ξ・1
1・,・1と与えたので・誤差・、(・)=・。(・)一・、(・)=・。(・)一女1(・)はC1級とな
る.また,このことは・(・一・・)式より・1(・)ξ・3[… 1を示している・次。こ,
(2−8)式から得られる2回目の入力・2(・)も連続関数となり,・2(・)εC2[O,
T1となる.以下同様に,数学的帰納法によって,一般にk回目の誤差・k(・)ぱC1級と
なり,・。(・)は・3級となる.従って,(・一・・)式の関係より,
R苔k(t)十Q三k(t)十P色k(t)=A6k(t)
(2−19)
を得る.またこのことは(2−11)式より,
(2−20)
三k(t)=6k(t)一6k÷1(t)
を得る. ここで次の量を定義する.
¥(τ)…(τ)・ぺ(τ岬τ)]・τ
(2−21)
・・吐
(2−21)式で定義されるJk.1(t)については(2−11)式・(2−20)式を用
いることにより,
^1[・{・・…(τ)…(τ)・・…(τ)]・τ
W)一
一/1[(・・(τ)一ξ・(τ))㌦(・・(τ)巾)
・(さ。(τ)一三。(τ))T・(6。(τ)一三。(τ))1・τ
ャ(τ)㌦・・(τ)・三・(τ)㌦さ・(τ)]・τ
一・・化
一10一
t
・/
色。T(τ)・色。(τ)・置。T(τ)A査。(τ)1・τ
(2−22)
O
を得る.きらに,
(2−10)式,
(2−19)式の開係を代入すると,
^l・(∼)・・主・(τ)・…(τ)]
・・…一W一・
・査。T(τ)[・畜。(τ)・Q三。(τ)・・さ。(τ)1・τ
イt
・。T(τ)・色。(τ)・ぎ。T(τ)Aぎ。(τ)1・τ (2一・・)
O
となる・ここで・(2−16)式の初期条件より ㍉(O)=ak(O)=O であり1また・
ek(O)=yd(O)一yk(O)=O より・(2−10)式において・行列R・Aが正定対称行
列であることを考慮すれば,
(2−24)
置k(O)=O
となることが理解される.これらのことに注意して,
(2−23)式を部分種分すると
・。(・)一・。、、(・)・旨kT(・)・註。(・)・色。T(・)(… )・。(・)・・。T(・)・・。(・)
・ト(一・(τ…・/l・(τ)(・㍗ニニ)
を得る.R,Q,P 正定対称行列であることと条件より
2Q−A〉Oであるので,区
間[O,T]の任意の時刻において
Jk(t).Jk†1(t)≧O
(2−26)
となる・(2‘21)式のJk(t)の定義よりJk(t)≧OであるのでJk(t)は下に育界であ
り,かっ(2−26)より単調減少であることよりある値Jooに収束する.
一11一
また,(2−25)式より任意の時刻tで
・。(・)一・。、。(・)≧三kT(・)R三k(・)≧O
・。(・)一・。、1(・)・色。T(・)(… )ξ。(・)・・
・。(・)一・。、1(・)≧・。T(・)・・。(・)・・
(2−27)
が成立していることから,
旨k(t)→O・色k(t)→O・・k(t)→O
(2−28)
となることがわかる.これは,(2−10)式より直ちに
・k(t)→O
(2−29)
を意味する.
証明終
定理2.2では システムの出力を速度としているので,速度誤差ek(t)の単純収束
(任意の固定された時刻においてゼロに収束すること)が示された.しかし珪がら,きら
に次の定理によって位置誤差については区間[0,T]で一様に収束することが示される.
定理2.一
R
定理2.2と同じ条件のもとに,区間[O,T]内でのすべての点で一様に
xd(t)一xk(t)→O ・
k→oo
(2−30)
が成立する.
証明
(2・27)式より きk(t)・色k(t)・ak(t) ぼ一様有界となり・このことは(2−
10)式より・ek(t)が一穣有界であることを示している.従って,
一12一
¥(一一・・…一・・…
(2−31)
・・…
によって定義される位置誤差は一様有界かっ同程度連続となる.きらに,定理2.2の結
果より,区間[O,T]そ任意に固定された点t一において
Ek(t)→O ・
(2−32)
k→◎o
が成立する.以上の結果より{Ek(t)}は一様有界かっ同程度連続であり,ゼロに単純収東
する.故に,As㏄1ト紗zelaの定理より[18]・[19コ区間[O,Tコ内のすべての点tで一様に
Ek(t)霊xd(t)一xk(t)→O・
k→oo
(2−33)
となり,ゼロに収束する.
証明終
2−3。 糸古言
ここで証明したことは,2階の線形定係数微分方程式で表わされるメカニ売ルシステム
に対して1一システムの出力ykを速度量kとするときに1
(1)初回の入力u1(t)と目標出力ハターンyd(t)の各要素が,連続な関数で与えられる
とき誤差ek(t)=yd・(t)一yk(t)はL2ノルムの意味で減少すること・
(・)初回の入力・1(・)と目鮒カハターン・。(・)の各要素が・1級の滑かきをもっとき
誤差ek(t)=yd(t)一yk(t)が単純収束(任意に固定された時刻で収束する)の意
味でゼロに収束すること,
(3)(2)と同じ条件のもとに・位置パターンxk(t)は区間[O・T〕で一様収東すること
以上3つの事柄である.それらの証明にはメカニカルシステムの構造的特徴である各係数
の正定対称性を利用している. また,ここでは出力を麦にとったが,状態変数の線形結
合 y:α麦十βXのような場合も同様に示される.これについては,以下の章につい
て,より広い時変システムについて定式化されるのでここでは省略した.
曲13市
隻書3章
学習制御方式の
システム論的考察
3一 ■ . 糸吝…葦
本章では本論文で提案する学習制御方式と従来の制御理論とのつながりを示す.そのた
めに,制御対象は時不変線形システムとし,ラプラス変換に基づいて周波数領域で解析す
る.特に,従来のサーボ理論との開係を示すので,本章てばシステムは目標出力に対して
feedback系を構成するものとする.従って,feedback系への指令値を入力と見なし,それ
を毎回の試行ごとに修正するタイフの学習方式を考える.解析にあたっては,誤差がどの
ように変化するかを示すために誤差の遷移を示す誤差遷移関数行列Sを定義する.この誤
差遷移関数行列Sが学習制御を実現するために満たすべき条件は回路理論における有界実
性そのものであり,Sを感度行列と見たときには感度を減少さ一せる条件に対応しているこ
とから,最適レギュレータ構成条件と同じであること.が示される.これらの関係からある
状態量の組合せによる出力については誤差の減少を保証するfeedback gainをRi㏄atiの
方程式を解くことにより求めることができる.また,特に機械系の場合にはその構造的特
徴から,状態量のすべてについて誤差の減少を保証する学習制御が構成できることが示さ
れる.最後に,この制御方式による幾つかのシミュレーション結果からfeedback gainや
評価関数が学習制御の性能におよぼす影響について考える.
3−2.周波数領域における解析
ここで取り扱う対象システムは,入出力数が同じであるとする.また各試行において運動
開始の初期時刻てばシステムの応答と目標パターンの状態量が一致しているものとする.
そのような仮定のもとにシステムをラプラス変換で表現し,学習アルゴリズムをブロック
図に示すとFig.3−1となる.ただし図中の文字は下記に示すものである.
Y。(・)ξ・「x1 目標軌道
Yck(s)ξRrx1
k回目試行時のサーボ系への入力
Yk(s) ∈R「x1
k回目試行時のシステム応答
Ek(s) ξR「x1
k回目試行時の説差 」E、(s)・Y、(s)一Y、、、、
一14一
F(s) ξR「x「
開ルーフ伝達関数行列
H(s) εR「x「
閉ルーフ伝達関数行列
M
記章システム
1St triaユ
泊
÷
F
・、El一
M
2nd tria1
・
I
篶
冶
、必
』
比2
今
「
■
・。E2間
M
Y2
Ψ∠
泊
、冶
1、、。.。.。。e、、、、g。。g。、、t。、
forF・edbackSy・tems
まず1回目試行時の誤差E1(s)は。
E1(s)=Yd(s)一Y1〈s)
;Yd(s)rH(s)Yd(s)
(3−1)
となる.つぎに2回目の試行時にサーボ系に与える入力を,
Yc2(s)=Yd(s)十E1(s)
(3−2)
と構成する・2回目の試行時にYc2(s)を入力しても一般に誤差は存在すると考えられる
ので・それをE・(・)と.するとE1(・)とE・(・)にはつぎのような関係がある・
E2(s)竈Yd(s)一Y2(s)
=Yd(・)一H(・)Y.2(・)
一15一
=Yd(s)一H(s)(Yd(s)十E1(s))
(3−3)
=(I−H(s))E1(s)
この開係は一般にk回目とk+1回目の試行ピついても成立するので,
Ek+1(s);(I−H(s))Ek(s)
(3−4)
となる.ここで,
S(s)=I−H(s)
(3−5)
と定義し,誤差遷移関数行列と呼ぶことにする.以後この関数行列S(s)によって誤差の
収束牲などを議論する.
学習制御の安定性(試行ごとに誤差が減少すること)を保証する条件を求めるために,
評価規範としてっぎのようなものを考える.
ト・…一い・・一
(3−6)
ただしek(t)はEk(s)の逆ラプラス変換形である.ところで誤差の遷移は(3−4∼式の
よう・にラプラス変換形で与えられているので,(3−6)式の条件の周波数領域での表現
を求める必要がある.誤差の時間関数については,
・k(t)宣O
t≦O
(3−7)
であり,これとParSeVa1の等式より,
い・・一)ト)・・一
(3−8)
となる.ただし*印は共役転置を意味する.(3−8)式はk+1回目の試行においても
成立することから,(3−6)式の条件はつぎのように表現さ’れる.
一16一
(3−9)
これに(3−4)。
(3−5)式の関係を代入すると次式を得る.
∫o①
凸
、止
Ek中(iω)(I−S岬(iω)S(iω))Ek(iω)dω>O
(3−10)
・oo
これより条件は,
山
I−S中(i側)S(量ω)≧O
(3−11)
虹な墨担ただしすべての周波数紗で等号が成宜する場合は除く骨
3一一3 冊有界案.健、感度㌔最適レギュレータ
条締(3一五五)式ぼ、回路理論ぞよく知られた奮界案艦(躍。舳d前R餓旦)に対応して
お物壷システムの亜案牲虹関係している曲一酸に脅界実笹はつぎのように定義され器曲
影2]すなわち理
(五) 盈窪(s)〉O なる室に対してS(s)ぼ亜則
く2) s(正実数)に対してs(s)が実数
山
(3) R⑬(s)>O なるsに対して葭
五一S巾S≧O
凄溝是するときS(s)ほ有界実で塗ると言われる。またこのときSは分散行列(S囎tt鉗一
五㎎晦恕パ渓)と呼ばれる、したがって先に定義した誤差遷移開数行列S(s)が分散行列と
なり,システムが無損失でない場合に,学習は安定であると言える.(システムが無損失
の場合は, 五一S卯(亘ω)S(iω)=O に対応する)
つぎに,誤差遷移開数行列S(s)をシステム論的に考えると感度および最適レギュレー
タとの関係が明らかになる.それを示す前に。まず最適レギュレータと感度の関係につい
て簡単に述べておく.
一般に(A,B)が可制御であるシステム
一!7一
支(t):Ax(t)十Bu(t)
(3−12)
(A∈Rnxn BξRnx「)
に対して評価関数を,
十・・…・・…一
(・一・・)
(RξR「x「 R>O,QξRnxn Q≧O (Q1/2,A) は可観測)
幸
を最小にする最適制御入力u(t〕は,
u*(t)害一RI1BTpx(t)
(3−14)
となる.ここでPξRnxnぱ,Ri㏄atiの行列方程式
PA+ATp_PBR−1BTp+Q=O
(3−15)
を満足する正定唯一解である.
逆に状態フィードバック
u(t)=一Kx(t) KξR「xn
.
(3−16)
が(3二13)式で表現される評価関数の最適制御入力となるための必要十分条件は,
(1)支(。)=(A−BK)。(。)
(3−i7)
が漸逓安定であること
(2)D卯(iω)RD(iω)≧R
(3−18)
である.ただし D(s)=I+L(s),L(s)=K(s I−Aゾ1Bであり,D(s)は還送差行
列,L(s)には一巡伝達関数行列である.
一18一
この条件の1入力1出力系については,R.画.Ka1Hanによって,〔23] また多入力多出力
系につい÷は,8.D.O.A.d、、、、によって証明された.〔24コ つぎに感度との関係では,1
入力1出力系について最適レギュレータが感度の絶対値を減少させることをKa1㎜nが示し
た.[23] また多入力多出力系については,J.B.CruzとW.A.Perkinsによって同様の関係
が示された.[25] 彼等が定義した感度行列 W(s) ぱ,
W(s)・=D−1(s)
(3−19)
であり,1入力1出力系からの自然な拡張となっている.このW(s)を使って
(3−
17)式を書き直すと,
曲
R−W卯(iω)RW(iω)≧O
(3−20)
と竣る.したがって最適レギュ.レーダは(3−20)式の規範の意味で感度を減少させて
いる。また逆に感度を減少させる漸近安定な状態フィードバック制御は。(3−13)式
の形式の評価関数に対する最適レギュレータとなっている。
これらの準備のもとに、学習の安定条件(3−11)式との関係を考える.まずここで
考える制御対象システムについて状態変数はすべて観測できるものとする.きらにシステ
ム自体には零点がないものとする・つぎに出力を yk(t)=K xk(t)・目標軌道をyd(t)
・・Kxd(t)と置く。ただし,K (r舳)は重み行列Q,Rに対する最適フィードバック行
列であり・yk(t)・yd(t)ぱYk(t)・Yd(t)の逆ラプラス変換形である・このときシステ
ムぱ,Fig.3−2に示されるような実現となる.
Xd K泊、B 、
.
⊥
S
XK Y
十
A
Pig・3−2
Sγstem Structure
一19一
したがって,Fig.3−1で示されるF(s)の部分は,
F(s):L(s)=K(s I−A).1B
(3−21)
となる.このことから誤差遷移関数行列S(s)は,
S(s)=I−H(s)
=I一(I+L(s))一1L(s)
;(I+L(。))一1
;ガ1(・)
害W(s)
(3−22)
となるので,前述の感度行列と一致する.ここで(3−13)式において,R=Iと置げ
ば,学習の安定条件(3二11)式と最適レギュレータ構成条件(3−20)式は同じも
のとなる.このことから評価関数(3−13)式においてR=I,Q≧O なる適当な行
列を重みとして,最適制御入力のフィードバックシスIテムは試行ごとに誤差を減少させる
学習安定なシステムになっていることがわかる.
ところで・ここでは アk(t);K・・(t)と置し’ているために誤差・k(t)は・
・k(t)=yd(t)一yk(t).
=K(xd(t)一xk(t))
(3−23)
となっている・したがって学習が安定である場合・この誤差 ek(t)がゼロに収束するの
で,
eoo(t);yd(t)一yoo(t)=K(xd(t)一xoo(t))=O
(3−24)
を意味する.ところが,一般には,Kのゼロ空間に属する要素については,必ずしも
xd(t)=xo。(t)を意味しないという不都合が生じる・しかしながら本論文で取り扱って
いるようなロボットなどのメカニカルシステムではつぎの理由からxd(t):xoo(t)とな
っていることがわかる.
一20一
まず,線形メカニカルシステムを
C1θ(t)十C2δ(t)十C3θ(t)=u(t)
(3−25)
とする・ただし・C1・C2・C3ξR「x「
特に・C1ぱ正定対称行列とする・このシステムを(3−12)式の形式で表現すると,
麦(t)=Ax(t)十Bu(t)
(3−25)
y(t)=Kx(t)
となる、ただし,
x(t)=(θT(t),6T(t))T、
「・,.■ ・
A上・■・…・■・。∵・■
であり,行列Kは(3−14)式においてR=Iと置き,リッカチ方程式の艦をPとした
とき,
K=BTp
T
OP11’P12
P11’P12 P11’P12’P22
P=
=
・1−1 ・1.T,・。。
・、。T,・。。
一(・1−1・。。T,・ゴ1・。。)
ξ・…
(3−27)
によって与えられる.ここで,
一21一
θd(t)一θ。。(t)
Z(t)
(3−28)
xd(t)一・。。(t)
δd(t)一6。。(t)
と置くと(3−24)式,
Z(t)
(3−27)式より,
・。一1・、。TZ(・)・・。一1・。。圭(・)一・
(3−29)
となる・初期条件に関しては・θd(O):θk(O)・ δd(O)=δk(O)・∀kであるから・
Z(O)=Z(O)=O であるので(2−29)式の解は、Z(t)=Oとなる.このことは,
xd(t)=xo。(t) を意味し・位置と速度に相当する状態変数は各試行ごとにゼロに近づ
いていくことが保証さ一れる.
3−41。
シミュレーション結果
ここでは,システム・パラメータの変化が学習制御に与える影響を見るために,次のよう
な簡単な1自由度モデルを考える.
aOδ(t)十a1δ(t)十a2θ‘t)=k2(θd(t)一θ(t))十k1(6d(キ)一δ(t))
(3−30)
ただし・θ(t):システム応答・θd(t):目標位置パターン・aO・a1・a2:システムパラ
メータ・k1・k2:feedback gain とする・また・初期条件 θd(O)・O・δd(O):O
終端条件 θd(1)・Lδd(1)・O を満足する目標パターンを・
θ。(・)=一2・3… 2
(3−3・)
と与えた・計算の時間きざみは・O・O05秒であり・パラメHタは・a0=1・a1:2・
a2=1として位置feedback gainを変化させた場合と速度feedback gainを変化させた場
合についてシミュレーションを行なった.各々の結果をFig.3−3,Fig.3−4に示す.
一22一
一
一ノk1・O
kl:i5
k2=60
、./
τ
k1=5
}!皿!へ・1・↓「ユ「㌔
叩
9
9
て〕?
N
0
{。
①’
N①§
い
千
k2・2ムO
い
?
、
f
甲
、帥
ヂ
9
.\
9 \ll・1・
、
こ、ふ\
9
\。k2・60
k2=iO
05115 2コ
TRlAし NUM8ER
S imul at ion Re sult
Effect of
kl箏30
051152025
丁副AL N〕M8ER
Pi g.3山3
\kl=15
pig.3出4
Gain k
S imulat ion Resul t
Effect of Gain k
2
1
これらの結果から位置feedback gainの増加は学習の効率を悪くする方向に働き,これと
反対に速度feedback gainの増加は学習の効率を良くする方向に働くことがわかる.そこ
でこれらの結果を詳しく考察するために,このシステム手こついての学習の安定条件(3−
11)式を求めることにする.まず伝達関数 H(s)は,
ト2+k1・
H(s);
・O・2・(・1・・1)… 2・・2
(3−32)
となるので,誤差遷移関数S(s)は,
2
S(s)=
aO・十・1・十a2
・O・・2・(・。・k1)… 2・k。
となる.従って,学由の安定条件の式ぱ
、,’
1−S小(iω)S(iω)
一23一
(3−33)
[(・・、・・。)・r・・。・。1ω2・・。(・。… 。)
(・2・k.10ω2)2・(・、・k1)2ω2
(3−34)
と表現される.ここで(3−34)式の正負を決定する分子に若目すると,パラメータは
すべて正であることから,
(2a1+k1)k1−2aOk2〉O
(3■35)
が成立するとき(3−34)式はすべての周波数に対して正となり,学習は安定となる.
この・とき還度feedback88in k1が小き過ぎると(3−35)式は成立せず,つぎの周波
数帯域で不安定(学習の意味での不安定)になる.
ω≧k2(k2+2a2)/[2aOk2−k1(2a・1+k1)]
(3−36)
以上のことより速度feedback8ainを十分犬きくとれぱ,ω=・・を除くすべての周波数帯
域で学習の安定性が保証されることがわかる.Fig.3−3より同じ値のfeedback gainで
は始めの回の誤差が大きくなったとしても,位置feedb8ck ga亘nを小さくするほうが何回
かの試行後には誤差苧小さくなるということも理解できる.
次に最適レギュレータを利用した学習制御システム構成に関するシミュレーション結果
を示。す.まず(3−30)式で与えられたシステムを次のように表現す.る.
(3−37)
童(t)=Ax(t)十bu(t)
ただし,
x(t)=(θ(t),舳))T,
O ,
O
I
A=
,
12/・O…
1/・O
B=
一1/・O
一24・一
ここで問題は学習が安定に行なわれるように状態feedback gain(k1・k2)を求める
ことである.そこで評価関数Jを
「一)…㍍)]・・
(3−38)
・二
とする.ただし,
q1,O
Q:
q1>O・ q2>O
O・q2
である,
このとき最適制御入力uお(t)ぱ,
u*(t)=一bTpx(t)
(3−39)
となる.ここでPξR2x2は,R」i㏄atiの行列方程式
PA+AT卜pbbTp+Q霊◎
(3一辺O)
を溝足する正定唯一解である・そこでq1・q2を適当に与えて(3−40)式のRi㏄ati
方程式を有本一ポツダの方法叫こより解を求め,最適・・・・・・・…i・(・。,・。)
を求めた。これらのパラメμタを用いたシミュレーシ重ン結果を門g.3−5。門g.3−6
に示す・δに関する重みq2を大きくすると飛躍的に誤差の収束は早くなる。一方・θに
関する重みq1を大きくしても自動的に学習の安定条件が溝足されるfeedback gainが得ら
れているので,単に位置feedback gainのみを大きくしたときのような学習性能の劣化は
生じないことがわかる.
山25一
o
o
o
○
oo
q1・lOO
ち
q。・100
o
N
9
○
“〔
弓
⑭Io
㌔も
\一 買
\一
マ
9
“
盲
も
転
q2・lOO
q1:100
q1:1000
ql:200
ω
ら
』
一
q1=10000
q2:200
q2 :10000
5
15
0
25
5
TRIAL NuMlヨ1三R
Fig.3−5
S imu1at ion Re su1t
Fig.3−6
Bff・・t・f W・ightq1
二3− 5
15
20
25
3
TR−AL NUM8E・R
S imulat ion Re su1t
趾f・・t・f W・ightq2
糸吉……=
時不変線形システムに関する学習制御方式を周波数領域で定式化し,回路理善の有界実
性,システムの感度及ぴ最適レギュレータとの開係を示した.その結果誤差を減少させる
feedback gainの設定は最適レキ平レ^タ問題として,Ri㏄ati方程式牽解くことによって
得られることを明らかにした.
一26一
隻竃41琴泰
時変線形メカニカルシステムに
対する学習制御
4一 ■ 糸著…葦
2章てば制御対象の係数が時間的に変化しない線形システムを対象として論じたが,実
用的にはより広いクラスのシステムに対して学習方式の有効性を示すことが望ましい.例
えば,ロボットマニピュレータの運動では空間内のある固定された点の近傍の運動に限れ
ば,時不変線形システムと見なせるが,広範囲な空聞での運動はロボットダイナミクスの
持っ非線形性により,時不変線形システムとして取り扱えない。ところが目ある目標連動
(時闘関数とむて目標軌道壷与える㌻の逓儲に撒戒岬トの実際の連動がとどまる産すれば垂
潔ポッ紅努イナミクスは埋係数が時変改)線形シス号ふと見なすことができる骨その線形犯
についての詳繍は曲8章に譲るとして,本章では動遵まわりで線形化されたロボット守ニ
ピュレーダに適用する目瞭とし.て,時変線形メ党ニカ地システムに対して学習方式を定武
化し呈誤差の収束性省議論する目その際2章てば垂錨力壷速度信号のみによって結成した
が担本章で敏位置信号をも含めた形についても敢勿援う。
4一一 ;三
言呉妻豊σ)川支員ミヤ生
4−2一■.速度信号による入力の修正
次のような時変システムを制御対象と考える,
R(t)麦(t)十Q(t)麦(t)十P(t)x(t)=u(t)
(4−1)
y(t)=麦(t)
2章の場合と同様に入力u∈Rn,出力yξRn.R(t),Q(t),P(t)ξRnmであ
り,R(t),Q(t一),P(t)は時間区間こO,T]で正定対称行列であるとする.また行
列の各要素は連続的に微分可能(ξC1[O,Tコ)であるとする.ざらに,この場合も第
2章において述べたように,上述のようなシステムの構造は仮定するが,パラメータ自身
一27一
については未知であるとする.このような制御対象に与えられた目標出力(目標速度パ
タ一ン)yd(t)に対して・(2−7)式・及ぴ(2・8)式と同じ繰り返し操作を実行
する.即ち この場合システム応答は,
浸(t)麦k(t)十Q(t)麦k(t)十P(t)xk(t)2uk(t)
○ xk(O):x
支k(O)=yd(O)・
(4−2)
yk(t)=支k(t)
となる.ここに・Oは位置・(・)のパターンを目標位置パダン・。(・)に一致させる
初期億である.また,入力の修正は,
uk+1(t)=uk(t)十Aek(t)
(4−3)
・k(t)=yd(t)‘yk(t)
となる.ただし,Aは適当な正定対称行列である.このアルゴリズムによって,誤差が減
少するかどうかが問題となる.これについては次の定理によって示される.
定理4.1
初回の入力u1(t)と目標出力yd(t)の各要素を・連続な関数で構成すると・誤差ek(t)
は次の意味で減少する.
(4−4)
Sk{≦Sk
ただし,
十・{・抑
ρ:適当な正数
ここに,評価関数のe一ρtは時間の始めの方に大きな重みをかけることを意味している.
証明
第2章の(注意2)と同様に・ak(t)=xk、王(t)一xk(t) とするとき・
一28一
ak(t)=・k(t)一・k.1(t)
・…
となることから次の開係が得られる.
¥・・{・…一
十ρ・(・・…一色{一色州
†十ρψ・仰・/l一ρ㌔{・㍗.、、
きらに誼この場合もk+1回目の応答の式から垣k回目の応答の式を差し引くことにより
R(t)註k(t)十Q(t)a虹(t)十P(t)ak(t)=A8㎏(t)
(4−6)
を得る.(4−6)式を代入することによって芋(逐一5)式は
・{
¥ψ・ψ・…金・…一・一
丁
イ
・馬ρt畠。T(・)・色。(・)・・
(逐一7)
○
となる・定理2店1の証明と同様の議論から・葛k(t)1合k(t)の連続性が保証され・また
初期条件も同様に 色k(O)=ak(O)=Oとなることから・(417)式は次の様に部分積
分によって書換えられる.
・。一・。、。一・一ρT[色。T(・)・(・)a。(・)・・。T(・)・(・)・。(・)l
T
・/
・一ρt色。T(・兀ρ・(・)・・Q(・)・良(・)一・1さ。(・)・・
O
一29一
T
・/
・・ρt・。T(・)[ρ・(・)・芦(・)1・。(・)・・
(4−8)
O
R(t),P(t),Q(t)が区間[O,T]で正定対称行列であることから適当な正値スカ
ラ量ρを設定することにより(4−8)式は非負となる.このことば直ちに
(4−9)
Sk.1≦Sk
証明終
を下している。
第2章での議論と同様に,誤差のゼロ収束にっいてほ次の2つの定理が与えられる.
定理4.2
初国の入力u1(t)の各要素を連続関数で与え・かつ 目標出力yd(t)の各要素を連続的
に微分可能な関数で与えるとき適当な正値スカラ量ρのもとに,ek(t)は単純収束する.
証明
仮.足より定理2.2における議論と同様に,
(d/d・)(R(・)査k(・)十Q(・)色k(・)・P(・)・k(・))=Aさ一
求i・)
(4−10)
という関係が得られる・ただし・ak(t)=xk.1(t)一xk(t)・ここで・次の量を定義する
(ただし時刻tは区間〔O,Tコで任意に固定されたものとする.)
¥ρτψ)…(τ)・伽・る・(τ)]・τ
へ…
(4−11)
(4・11)式で定義されるJk.1(t)について・さk(t):ek(t)一ek,1(t)・
一30一
ak(t)=きk(t)一るk.1(t)
W一・・…
という関係より次式を得る。
?ム小)…(τ)小…(τ一
t
・/
・0ρτ[さ。T(τ)・色。(τ)・註。T(τ)Aき。(τ)1・τ
O
(4−12)
次に・8k(O)昌O 及ぴ ak(◎)=ξk(◎)=Oより・(4−6)式を考慮すれぱまk(O)
:O であることがわかる.このことより,(4−12)式に(4−6)式,(4−10)
式を代入して計算することにより次の関係が得られる宙
へ(・)一ヘヰ五(走)㍗皿へ義虹丁(・)舳き虹(・)辛ぺ(・)(醐寺・(・))ψ)
・・。T(・)・(・)・虹(・)1
ド
一・…μき。T(τ)同(克)今眺)・怠(・)一蝸段(冨)れ
⑪
t
・/
・蠣ρτ色。T(τ)[ρ・(τ)・ρ・(τ)・・Q(τ)一良(τ)一声(τ)一・1主。(τ)・τ
O
イt
・一ρτ・。T(τ)[ρ・(τ)・用1・。(τ)・τ
〇
十小一〃τ
・十ρψ一・(…τ(・一・・)
ここで,次の不等式が成立することに注意する.
一31一
∫t
・一ρτ[Φき。(τ)一Φ.1戸(τ)・。(τ)1TlΦき。(τ)一Φ・1戸(τ)・。(τ)1・τ…
O
∫t
・・ρτ[Φき。(τ)一Φ一1包(τ)・。(τ)〕T[Φ三。(τ)一Φ■1包(τ)圭。(τ)1・τ・・,
(4−14)
○
ただし,ΦξRnxnは適当な正定対称行列とする.(4−14)式より 直ちに,
/l一ρτ{…十・1τM一ψ
十τき{ψ
卜卯十τ色小{(τ)ψ
十三{二練
が成り立つことがわかる.ただし,Ψ=Φ・Φ.
(4−15)式の不等式より(4−13)
式から次式が導かれる.
・。(・)一・。、。(・)・・一ρ縦・(t)T・(・)益。(・)
・a。(・)T(・(・)・・(・))さ。(・)・・。(・)T・(・)・。(・)1
・/l一ρτ旨{τ)三・(τ…・/÷ρψ1(τ)色・(一
t ・/
・’ρτ・。(τ)T・、(τ)・。(τ)・τ
O
一32一
(・一・・)
ただし,
A1(τ):ρR(τ)十2Q(τ)十怠(τ)一△一2Ψ・
・1(τ)=ρ(・(τ)・・(τ))・・Q(τ)一志(・τ)一戸(τ)一A弍(τ)Ψ一1包(τ),
C1(τ)=ρ・(τ)一戸(τ)一声(τ)Ψ・1戸(τ),
R(t)。P(t)、Q(t)が正定対称行列であることから適当なスカラ量ρを設定することに
より,
A1(τ)〉O・B1(τ)>O・C1(τ)〉O
(4−17)
となる一従って・(4−16)式の右辺は正となり・Jk(乞)が単調減少することが示され
る。また,(4−16)式より任意の時刻tξ[O,Tコにおいて次の関係も得られる。
J。(・)一・k、、(・)・・.刊きk(・)T・(・)a。(・)・・
・。(・)一・。、。(・)・…ta。(・)T(眺)・・(・))&。(・)・・
へ(・)一。、且(・)・・一ρt・。(・)T・(・)・。(・)・・
(・一・)
数列Jk(t)は定義より非負(下に有界)であり・単調減少であるので任意の時刻tε
[O,T]で,ある値(Jo。(t))に収束する。このことと(4−18》式より k→ooの
とき
きk(t)’今O’主k(t)→)O’ak(t)→O
(4一エ9.)
が任意の時麹tε[O,T]について成立することがわかる.結局,
(4−19)式と
(4−6)式より,k→ooのときに 任意の時刻t∈[O,T]で,
・k(t)→O
(4−20)
であることが不さ一れる.
証明終
一33一
定理4.3’
定理4.2と同じ条件のもとに,区間〔O,T]でのすべての点で一様に,
xd(t)一xk(t)→O ・
(4−21)
k→oo
が成立する.
証明は・定理2・3と同様に位置誤差 xd(t)一xk(t)は 様有界・同程度連続でありゼ
ロに単純奴東することを考慮すれば,^SCOli一^rZeIaの定理が適用できることから明らかで
ある.
系 4.1
定理4.1は行列Q(t),P(t)が正定対称でない場合にも成立する.
証明
この場合ほ,Q(t),P(t)に関する項について部分積分が計算できないので(4−8)
式の代わりに次のように表現する.
・ゼ・。、1一・‘ρT・。T(・)・(・)主。(・)
で
・/
・一ρt圭。T(・)(ρ・(・)・・Q(・)一点(・)一・)色。(・)・・
O
T
・/
・・ρt色。T(・)・(・)・。(・)・・
(・一・・)
O
(4−15)式と同様に次の不等式が得られることに注意する.
/l一ρ仏イ中ψ
一34一
戸丁
… ‘ρ㌔。T(・)・虹(・)枇
(4−23)
!。
ただしΨξ9砿n正定対称行列。きらに(4−23)式の右辺を計算して壷
冊丁
j
・一
`。T(・)Ψ色。(・)・・一・一ρT・。T(・)・。(・)
0
T
−/
・…ρt・。T(・)(ρ1一Ψ一1)・。(・)・…
⑪
(4−24)
娑なる、この関係壷縄いると亜(4−22)武よむ次式が得られる由
・ゼ・虹寺互・ポヘベ・州・)}T)寺“・)}・))
ド
1響刊“・)(州・)・・Q(・)一鮒)一・一Ψ)義。(・)航
⑪
T
・/
・皿ρt“・)(ρ1一ヅ五)・。(・)・・
(4−25)
○
この場合も十分大き渡櫨のρ雀設定することにより(4−9)式が成立する.
証明終
系 4.2
定理4.2舛行列Q(t),P(t)が正定対称行列でない場合にも成立する一
証明
この場合(4−13)式に代わって,
・。(・)一・。、、(・)一・一ρt(き。T(・)・(・)き。(・)・き。T(・)・(・)色。(・))
一35一
t
・1
・■ρτ奇。T(τ)(ρ・(τ)・・Q(τ)・怠(τ)一・)き。(τ)・τ
O
t
・/
・‘ρτ主。T(τ)(ρ・(τ)・・Q(τ)一直(τ)一・)乞。(τ)・τ
〇
十ψ一・・(τ))Wτ
十小一・・(…τ
十小)・(τ)・・(…τ (・一・・)
と表現する.
(4−16)式が得られたと同様にΨを適当な正定対称行列として(4−26)より次式
が得られる.
・。(・)一・。、。(・)・・■ρt(三。T(t)・(・)き。(・)・き。T(・)・(・)主。(・)).
t
・/
・‘ρτ奇。T(τ)A。(τ)三。(τ)・τ
O
t
・/
・.ρτa.T(τ)・。(τ)色。(τ)・τ
O
t
・/
・一ρτ・。T(τ)・。(τ)・。(τ)・τ
O
(4−27)
一36一
ここに,
A2(τ)=ρR(τ)十2Q(τ)十直(τ)一A−2Ψ・
B2(τ)=ρR(τ)十2Q(τ)一良(τ)一A
一(d(τ)十P(τ))TΨ一1(包(τ)十P(τ))一Ψ,
C。(τ)=一声丁(τ)ヅ1戸(τ)一PT(τ)Ψ■1・(τ),
(4−27)式において・右辺のC2(τ)を含む項は正値とならないが・系4・1の
(4−24)式の関係を使うと,(4−27)式は結局,
小)一へ、1(・)・・山ρt(き。T(・)・(・)註。(・)ヰ色。T(・)・(・)色。(・)・・。T(・)・虹(・))
「t
・^ρτ三。T(τ)・。(τ)三。(τ)・τ
十」
o
t
・1
ゴρτ色。T(・)・。(τ)麦。(君)・τ
◎
t
・/
・凹ρτ・。T(τ)・。(τ)・。(τ)・τ
O
(4−28)
となる.ただし,
A3(τ)=A2(τ)
B3(τ)=B2(τ)一Ψ
・。(τ)一ρ1一Ψ一1・・。(τ)
である.従って,十分大きな値のρを設定することにより,
A3(τ)〉O・B3(τ)〉O・C3(τ)〉O
市37一
(4−29)
となり,定理4.2と同様の結果が得られる.
証明終
系4.3
窪理4.3ば行列Q(t),P(t)が正定対称でない場合にも成立する。
証明は定理4.3及び系4.2より明らかである.
4−2−2
位置信号と速度信号による
フ㌧フb0⊃催菱二i=1三
対象システムとしては(4−2−1)で与えられるタイフのものを考える.一方,出力
㌻(t)としてほ次のような位置と速度の線形結合を設定する.即ち全体のシステムは
R(t)麦(t)十Q(t)麦(t)十P(t)x(t):u(t)
y(t)=α麦(t)十βx(t)
(α,β,スカラ量)
(4−30)
と表現される.ただし,信号を正規化する目的でスカラ量α,虜については,次の条件を
満たすものとする.
α十β:1
0くα≦1, O≦β〈1
(4−31)
即ち,(4−31)式は出力信号に速度信号が含まれることを必要としている,その理由
については・以下の証明の申で明らかとなる・次に・位置の目標パターンをxd(t)とすれ
ば・目標出力yd(t)ほ・
yd(t)=α麦d(t)十βxd(t)
(4−32)
と表現できる.この目標出力とシステムの出力との差を誤差e(t)とすると,
一38一
・(t)=yd(t)一y(t)
(4−33)
:α(麦d(t)一麦(t))十β(・d(t)一・(t))
となる.このようなシステムに対して,次の繰り返・し操作を実行する.
R(t)麦k(t)十Q(t)麦k(t)十P(t)xk(t)=u(t)
麦k(O):麦d(O) ・xk(O)=・d(O)
(4−34)
uk.1(t)=uk(t)十A・k(t)
前節の定理及ぴ系ではシステムの出力を速度としていたので誤差8k(t)は速度誤差を意
味していたがドe虹(t)を(4−33)式で定義されるものに置き換えれば里(4−34)
式で与えられる学習ブ1コセスに対して,それらの定理や系はすべて成立することが示され
る.その証明はほぼ前節のものと同じであるので,煩雑さを避けるために,系4.3に相
当する最も広いクラスの対象く係数行列R(t)のみが正定対象であると仮定する場合)に適
用できる定理だけを次に示す。
定理4.4
初回の入力u1(t)の各要素を連続関数で与え,目標出力の各要素を連続的に微分可能な
関数とすれば・xk(t)ぱ一様にxd(t)に収束する・
証明
目鮒力についての仮定より定理2.2の証明と同様の議論から・k(・)はC1級関数と
なる.このことから次の量が定義できる.
ψ十τ(・・(τ)…(τ)小)…(τ))・τ
(4−35)
この場合ek(t)とek.1(t)は(4‘33)より・
;。(・)一・。、、(・)一・。(・)一・。(・)一(・。(・)一・。、1(・))
=α(麦k.1(t)■麦k(t))十β(・k,1(t)一xk(t))
:αさk(t)十βak(t)
一39一
(4−36)
(ただし・・ト(・)r…1(・)一・・(・))1なる・きらに…(・)ξ・1[…1よ1
るk(t)一6k+1(t)=α蓋k(t)→一β色k(t)
(4−37)
.となることから・Jk+1(t)は次のように表現される・
¥[(・・(τ)一一色・(τ)一β・・(τ))・・(・・(τ)一一色・(τ)一β・・(τ))
・…什
・(る。(τ)一αざ。(τ)一β色。(τ〕)T・(る。(τ)一α三。(τ)一β圭。(乞))1・τ
¥ρτ[(一ψ)・β・・(τ))・…(τ)
一・・(・)・・(・)一
・(α三。(τ)・β主。(τ))T・6。(τ)1・τ
(4−38)
ただし P(・十τ[(一色・(τ)・β・・(τ))・一・(τ)・β・・(τ))
・(α三。(τ)・β色。(τ))T・(α童。(τ)・β主。(τ))1・τ
定理4.2,4.3と1同様の議論.より,
R(t)きk(t)十Q(t)圭k(t)十P(t)ak(t)=Aek(t)
(d/dt)(R.(t)きk(t)十Q(t)合k(t)十P(t)・k(t))=〈さk(t)
(4−39)
という関係が得られる.これを(4−38)式に代入して,
Jk(t)一Jk+1(t)=G(t)
十[(ψ・β・・(τ))・(・ざ・(τ)・…(τ)・…(τ))
一40一
・(α益。(τ)・β色。(τ))T(・/・τ)(・註k(τ)・Qき。(τ)… 。(τ))1・τ
(4−40)
となる・初期条件は・ak(O):色k(O)=きk(O)呂Oで与えられるので・行列R(t)が正定
対称であることに注意して(4−40)式を部分積分すると
・。(・)一・。、、(・)一・’ρt[き。T(・)・(・)三。(・)・主。T(・)(α・(・)・ρβ・.(・))色。(・)
・・。T(・)ρβ・(・)・。(・)・・色。T(・)β・(・)ぎ。(・)
… 。T(・)βR(・)色k(・)1
t
・/
・一ρτ[き。T(τ)・1(τ)三。(τ)
◎
へT(宮)・。(τ)金。(τ1・・。T(τ)・。(τ)・。(τ)
・色。T(τ)・。(τ)麸。(τ)・養。T(τ)・5(τ)・。(τ)
・・。T(τ)・。(τ)圭。(τ)1・τ
(4−41)
丁且(τ)=(ρR(τ)十怠(τ)斗2Q(τ)一αA)α皿2βR(τ)
・。(τ)・(ρ・(τ)一貞(τ)・・Q(τ)1・)α・(ρ2・(τ)
十2P(τ)一ρ良(τ)十2包(τ)一2R(τ)一βA)β一ραβA
・。(τ)一(ρ2・(τ)… (τ)一ρ良(1)一β・)β1αβ・
・。(τ)一・(O(τ)・・(τ))Tα・・βQ(τ)
T5(τ)=2α声(τ)
・。(τ)・・α・T(τ1・・(・直(τ)・Q(τ)・・T(τ))β
を得る.定理4.2の(4−15)式と同様の不等式を用いることにより,次の開係が成立
する.
一41一
・。(・)一・。。1(・)・・一ρt[旨・T(・)(α・(・)一川き・(・)
・色。T(・)(α・(・)・ρβ・(・)一β・(・)・.1・(・)・)主。(・)
・・。T(・)(ρβ・(・)一β・(・)・一1・(・))・。(・)1
t
・/
・‘ρτ[査。T(1)・、(τ)き。(τ)・色。T(τ)・。(τ)査。(τ)
O
・・。T(τ)・。(τ)・。(τ)1・τ
(4−42)
ただし,
S1(τ)=(ρR(τ)十良(τ)寺2Q(τ)一αA)α一2βR(τ)一r
−T4T(τ)F■1T4(τ)
・。(τ)一(ρ・(τ)一直(τ)・・Q(τ)一α・)α・(ρ2・(τ)… (τ)一ρ直(τ)
・帥(τ)一・・(τ)一βA)β一ραβ・一ραβ一ト・。T(τ)・一1・。(τ)
・。(τ)一(ρ2・(τ)… (τ)一ρ舳)一β・)β一ραβ・一・
一・。T(τ)・・1・。(τ)
R(t)が正定対称行列であるので十分大きなρをとることにより,(4−42)式の右
辺は非負となる・従って・{Jk(t)}は下に有界で単調減少となるので・区間[O・T]で
任意に固定された時刻tにおいて,ある値に収束する.ざらに,(4−42)式より,
¥ψ・1(τ)三・(τ)・τ
州仇
{ψ・・(τ)主・(τ)・τ
・・吐)一W
m(τ)・・(τ)・・(τ)・τ
(4−43)
・・化)一W)・
一42一
∫t
も成立することから,
き。T(τ)き。(τ)・τ→・,
k→oo,
O
∫t
さ。T(τ)圭。(τ)・τ→・,
k→oo,
O
∫t
・。T(τ)・。(τ)・τ→・,
k→oo,
(4−44)
O
となることがわかる。次に(4−39)式より,
ピψ十(τ一柵山一
ド
1 壷。T(鴛)Q㌦)ポ1Qω㍉(鴛)れ
○
寺い^)Ω一一・(τ)・τ十(τ一Ω・・(τψτ
十(τ一{(τ)・・(τ)・雷十(τ)・・(τ)Ω・・(τ)線
となるに注意す去,ただしΩ皿1=A■1A一且とする.(4−15)式と同様の議論によって
適当な人ききのスカラ量δ1・δ2・δ3 を設定することにより・次式を得る・
^1・・(τ)・・(τ)・τ・δ・/l・・(τ)る・(τ)・τ・δ・/l・・(τ)・・(τ)・τ
δ1
十・(τ)・・(τ)・… (・一・・)
一43一
このことと,(4−44)式を考え合わせれば,容易に次のことが理解される.即ち,区
間〔O,T]で任意に固定されたtについて
∫t
・。T(τ)・。(τ)・τ→・
,
(4−47)
k→oo
O
(4−33)式より,
となる.一方,
岬一一
gー・一τ))・〃τ
(4−48)
となり,これにSc㎞arzの不等式を適用して次式を得る.
(・。(・)一・。(・))T(・。(・)一・。(・))
寸一)(一心τψ
・δ・いW 一一・・)
ただし, δ4={1−exP((一2β/α)T)}/2β
とする.(4−47)式と
(4。一49)式より,任意に固定されたtにおいて,
xd(t)■xk(t)→O
・
k→oo
(4−50)
となることがわかる・次に{Jk(t)}は下に有界で単調減少であるので次の値も区間
[O,T]で一様有界である.
∫t
・一ρτさ。T(τ)・ξ。(τ)・τ
(4−51)
O
(4−51)式は(4−33)式を代入して計算することにより次のように書換られる.
一44一
∫t
・一ρτる。T(τ)・さ。(τ)・τ一αβ・一ρt(麦。(・)一麦。(・))T・(麦。(・)一麦。(・))
O
t
・/
・・ρτ[α2(麦。(τ)一麦。(τ))T・(麦。(τ)一麦。(τ))
O
・(β2・ραβ)(麦。(τ)一支。(τ))T・(麦。(τ)一麦。(τ))1・τ
(4−52)
従って・麦d(t)一重k(t)は一様有界となり・xd(t)一xk(t)ぱ一様有界がつ同程度連続と
なる・きらに(4−50)式よりxd(tト㍉(t)が単純収東(区間[Ol Tコで任意に国
定されたtにおいての収束)するので雪恩scoH一柵鵬亙翻の定理より区間[O雪下]でx虹(t)
は㍉(t)に一様に収束することが保証される曲
証明終
(4−30)式において,α一霊O とすると、(4−42)式の右辺が非負となること
が示せなくなる由それゆえに,以下の証明が成立せず,誤差の収束牲は保証されない。以
上の理由から入力の修正には速度信号が必要であることが理解できる凸
定理毎,4では入力は位置信号と速度信号によって修正き一れたが,つぎの差分形式の微
分近似式に着目すると今まで述べたタイプとは違った修正法が可能であることが示曹る、
(4−53)
麦(t):〔X(t+δ)一X(t)]//δ
まず,
(4−53)式より,
(4−54)
X(t+δ):δ麦(t)十X(t)
となることから,入力の修正として(4−34)式に代わって,
・k.1(t)=・k(t)十く[α(麦d(t).麦k(t))十局(・d(t)一・k(t))1
=uk(t)十Aβ(xd(t+δ)一xk(t+δ))
一45一
(4−55)
とすれぱよいことがわかる.ただし,α/β=δ とした.このことば, 位置誤差:
xd(t)一xk(t)のデータをδだけ進めて入力に加えることを意味している・δが十分小さ
いときには,近似的に定理4.4の方式と同じであるので,このような位置誤差の位相を
進める修正法も有効であると思われる.位相を進める修正法は,時不変線形システムに対
して既に内山[12]によって提案されているが,ここでは時変システムに対しても有効であ
ることが亦された.
4一一 R
糸吉…葦
本章では時変線形メカニカルシステムについて学習制御方式を示し,その収束性を証明
した.システムの時変係数行列R(t),Q(t),P(t)として, はじめはすべて正定対称行
列であると仮定したが,基本的には慣性項R(t)だけの正定対称性が必要であることが,
系4.1,4.2,4.3によって示された.これは,直感的には,入力の修正として加
速度項だけに注目してパターンを修正していることを意味している.従って,本方式がダ
イナミクスを扱っているが, 構造的には代数的な計算を基本としていることが理解でき
る.定理4.1,4.2などで定義される規範では,e・ρtという重みをかけた形となっ
ている.これは物理的には時刻の始めの方に大きな重みをかけていることを示している.
従って・ρを極端に木きな値とすると・ある有限な試行回数内では純粋なL2ノルムでは
誤差が減少しない可能牲もある.しかしながら,この重みρは数学的な証明のテクニック
とし・て導入されたもので実際には極端に大きな値としなくても良いことが8’ ヘにおいて示
さ一れる・’
tに・純粋なL2ノルムでほ誤差がゼロに収束することを時変システムに対して
厳密に証明することは難しく, e0ρtという重みでL2ノルムを少しゆがめた形のノルム
を採用することによって初めて以上のような理論的展開が可能となったと考えられる.
本章では位置信号と速度信号による方式について述べたが,加速度信号に基づく方法も
時変線形メカニカルシステムに対してまったく同様に,証明することができる.きらに,
加速度を利用する場合には制御対象としてある種の非線形システムにまで拡張することが
できる.そこで,この方法ついては第5章で非線形システムに対して統一的に述べること
にする.
一46一
隻菖5章
ある種の非線形システムに
対する学習制御
5一 ■ 恭替玉葦
第4章までの各章ではメカニカルシステムに対して速度または位置と速度の信号を使っ
て入力を修正する方式が提案された.本章では毎回の試行時に得られるそれらの信号の微
分値を使って入力を修正する方式を新たに提案する.このような方式では制御対象システ
ムとしてある種の非線形システムにまで拡張できることが示される.制御対象の非線形シ
ステムとしてほある種の橋造的特徴は仮定するが,ダイナミクスそのものは未知であると
いう問題設定は第2章及ぴ第雀章で述べたものと同じである、
5−2誤差の収束牲
六方式を適用する制御対象としては,次のような非線形システムを考える。
童(t)竃ぞ(壬,x)十Bu(t)
(5−1−a)
y(t)=Cx(t)
(5−1−b)
ただし,x(t)ξ盈n,fくt,x)ξRn,BξRn鮒,CξR「xn,u(t)ξRギ,y(t)ξRゼ
とする・きらにシステムは任意の時刻tε[O・T]かつ任意の対(x1・x2)に対し
て次のリブシッツ条件を溝是するものとする。
llf(t・・1・)一f(t・・2)ll。。≦α1(t)llxrx211。。
(5−2)
ただし,一般にベクトルeの第i成分をe(i) で表わすとき,
11・ll。。=mム・1・(i)1
(5−3)
1≦i≦n
であり・α1(t)は区間[O・Tコで区分的に連続な関数である・このような制御対象に対
一47市
して,実現すべき目積出力yd(t)が区間[O・T]で与えられるとき・その出力を獲得す
るために学習プロセスを次のように構成する、
入力:
ムk,1(・);・。(・)・A(d/・・)・一
(5−4)
求i・)
誤差:
・k(t)畠yd(t)・yk(t)
(5−5)一
出力:
yk(t)雪Cxk(t)
(5−6)
ただし,Aは適当なrxr行列とする.なお,(5−6)式のxk(t)ば(5−1−a)式
から次の式によって支配されるものとする.
^l・(τ巾・(τ)…
(5−7)
仰)・
ここに,x(O)ぱ初期値を表わし,(5−7)式ば毎回の試行ごとに初期値を一致ざ借る
」ことを意味する.このアルゴリズムのブロック図をFig.5−1に示す.
・・一「
r■一一’^’
I
書
㌦
口腕knOH聰
1
叛
yd
十
dy河8面iOS
,
I
1越b
I
l
I
l
I
㍉
,oPor8毛io皿
「
1
d
服
㌦十1
一
:
:回e口。「y㌔1l
1
回6回。「y
,
・
・
一し・…
1
■}一・■・.一・一■・}■・・■1
㌦十1
unkn0H風
㌔
へ十1
ayn国ロニ06
十
〇k+1
k刑地
。P●r■tユ。o
r
d
−
dt
uk+2
回6㎜ory
uk+2
Pig.5−1
Learning Control
Based on Differentia1 Operation
一48一
ある条件のもとで, (5−4)式による入力の修正が誤差をゼロに収束させ,目標出力
を実現できることが次の定理によって示される.
定理
次の3つの条件が同時に満足されるとする.
(a)llI
−CBAll 〈1
r
oo
ただし,llEll。。:m。・1Σ1。(ij)ll,
EξR「x「
1≦j≦r i
(b)㍉(t)亜yd(t)は区間〔O.T]で連続的に微分可能壷
(c)yd(◎):Cx(◎)1
このとき,次の意味で誤差はゼ割に収束する.
Hさk、王Hλ≦δO!一}1λ
O≦δ◎〈1
(5−8)
ただし,
川iλ一… /・一λt116(・)ll。。/
O≦t≦T
である.
上式で定義した関数ノルムをここではλ一ノルムと呼ぶ.これば時間関数e0λtによっ
て始めの時刻に大きな重みをかけることを意味している.このλ一ノルムのもとで,
llさ。llλ・δらkllさ111λ
(・一・)
であることから,k→oo のときに時間区間[O,T]において,
一49一
㍉(t)→O・
シk(t)→シd(t)
(5−10)
となる.また条件(c)より,このことば区間一
mO,T]で
yk(t)→yd(t)
(5−11)
となることを意味する.
証明
(5−4)式,(5−5)式及ぴ出力の式より,
る同(t)=シd(t)一シ刷(t)
=シd(t)一シk(t)十シk(t)一シk.1(t)
=亭k(t)十C(麦k(t)一麦k刊(t))
(5−12)
となる・次に(一 T−1一金)式より・文k(t)・圭k、工(t)を表現すると・ (5−4)式の関
係から,
麦・
求it)一麦同(t);f(t・xk)・f(t・・k.1)十B(uk(t)一uk.1(t))
=f(t・・k)一f(t・・k,1)・BAさk(t)
(5−13)
を得る.(5−12)式に(5−13)式を代入することによって,
6k(t):(Ir−CBA)6k(t)十C(f(t・xk)一f(t・xk,1))
(5−14)
となる.ここで,(5−2)式のリブシッツ条件より次の不等式が得られる.
llさkllλ≦HIr−CBA”oo“さkllλ十αonClloo”xk−xk+111λ
(5−15)
一50一
である,次に(§一㍗式の初期条件壷考慮して(δ川
ここに・ 舳芸職詠xαパt)
◎≦t≦丁
且3)式より,
¥一)・・{・(一
走
パ
・}λ(t‘君)・■λτ(・(τ・・虻)一貴(君,・汰、1))・τ(ト・・)
JO
という関係が成立することに注目する.これより次の不等式が得られることがわかる。
抑(“・舳鮭■∵舳拙
虫簑
{トゼλ素11}竜)㌣虹寺五酬1囎辞
c◎:IlB〈ll◎o
とする、
15一夏?)式事)関係に由鮒㈱鯛夏至の不等式壷適用し鵬〕害
岬一{岬λ…
Iト・一∴、血、8、
となる吊ここで,Z(t)の定義より次の不等式を得る缶
;,xkOxk+1■1λ=suP{z(t)}
O≦t≦T
・1・。[(・一・・λT)/λ1… (α。(・一・.λT)/λ)lllさ。llλ
(5−19)
(5−19)式を(5−15)式に代入することによって,
■1るk.111λ≦δ0
さkllλ
となる.
一51一
(5−20)
ただし,
δO:l1Ir−CBA1I①o
・α・ll・l1。。・。[(卜・一λT)/λ1… (α。(・一・‘λT)/λ)
(5−21)
である.定理の条件(a)を溝足する場合,十分大一きな正の数λによって,
O≦δOく1
(5−22)
とすることができる.
証明終
この方式によればシステムの情報は(5−1−a)式の非線形関数f(t,x)に関する
リブシヅツ条件と。定理の条件(a)の行列C跳こ関するものが必要となるが,正確にシ
ステムを同定する必要がないことに注意したい.
5−3系苦言
本方式をロポヅトに適用するた串の詳細な議論は第7章で述べるが,.定理の条件(a)
を溝足するためにほメカニカルシステムに対してほ出力y(t)に速度信号が含まれていな
けれぱならない.(y(t)が位置信号のときは, 1;I r−O llo。=1となり誤差の収束
鮭は保証されない,)入力は出力誤差の微分信号によって修正されるので,実際には加速
度誤差によって修正されることとなる.
本章では入力の修正法として出力の微分信号を用いたDタイフ(Diff鉗釧tia1t洲e)
について述べた.この方式の他にも比例,積分,微分の各々の信号を利用したP I Dタイ
プ(昨。posi㎝a1,Inte鮒a互,0iffer㎝tia1type)の入力構成法も実現できることを指摘して
おく.[関連論文8]
一52一
隻竃6章
脚式移動ロボットヘの適用
6一■ 糸吝言
脚式の歩行連動には,いくつかの種類の歩行運動パターンがある.ロボットは環境の,
変化に対して運動パターンを選択することによって,歩行における適応能力を獲得するも
のと思われる.しかしながらロボットのまわりの環境に大きな変化がない場合には,同じ
運動パターンを繰り返すことによって歩行運動は実現される.したがって脚式の歩行ロボ
ットにとっては,なによりもまず第一に一つの歩行運動を実現することが最も必要なこと
である.
一般に葭一つの歩行運動パターンが与えられた娑しても宙単純なサー添機構だけでぼ,
それほ正確にほ実現できない畠なぜならば亜リンク間の動的干渉や摩擦垂そして歩行に題
する機構的拘束条件の変化などが主ロボットの運動に大きく影響するからである。特に壇
脚の数が多くなり関節数が多く」なると青マニュピュレーダの樹御などに提案されている葬
線形補償法では計算時間の問題だぱからも実現することは難しいと思われる.
一方蛆本論文で提案する学習制御では埋ロボットダイナミクス壷正確に推定する必要が
ないことと,関節数が多い複雑な系に対しても容易に適用できることなどから。脚式ロボ
ットの制御に適しているものと期待できる、本章では,特に二足歩行ロボットにスポット
をあてて,提案された学習制御方式の適用を計る,一般に事二足歩行運動てば静的歩行
(支持脚の是慶から重心が外へ出ないようなパタ}ンで遊脚を動かす運動の連続)であれ
ば,ぽぽマニュピュレーダの制御と同様に取り扱える、しかしながら高遠歩行を自的とし
て,足首のトルクを使用しようしないような動的な歩行を実現することは難しい問題であ
る,即ち,動的歩行では,各関節の運動が目標パターンからずれれぱ,歩行のタイミング
(是を踏み出すタイミング)を狂わせ,継続的な歩行が実現できなくなるのである.従っ
て静的歩行よりも,ばるかに忠実に各関節が目標パターンに追従することが要求される。
そこで,このような問題を解決するために,本論文で提案する学習制御方式を二足歩行ロ
ボットに適用する.そのために,まず第2節てば二足歩行ロボットのダイナミクスを定式
化する.また第3節では,前述の静的歩行の場合や歩行ロボット特有の動的な歩行を継続
的に実現するための学習制御法について詳細に述べる.
脚式の移動ロボットの場合,基本的には1ストライド分だけの学習を実現しておけばよ
一53山
い由この方式は計算機の記憶容量の点からも好都合なものとなっている.ただし,この学
習方式では単一の歩行パタ…ンに対してのみ有効であり,様々な歩行パタ^ンを実現する
には,猶々のパターンに対する制御入力をすべて記憶しておく必要がある.これは実装上
好ましくないため葭記憶すべき制御大力のデ…タ量をいかに圧縮するかが大きな問題とな
る.そこで,第4節てば,種々の歩行パターンを実現する入力を,あらかじめ学習によっ
て得られた入力ハターンから直接獲得する方法を提案する.
6−2:
土足歩行ロボットのダイナミクスと
線形システムとしての定式化
多リンク構造の二足歩行ロポヅト(多足歩行ロポヅトも含む)が,1司じく多リンク構造
のロポ秒トアいムと大きく異なる点の一つは,外部環境に固定されたリンクがないため,
その力学的モデルが運動状態によって大きく変化することである。歩行日琳ットのアクチ
ュエータ数室M,力学的猛自由度をWとすると宝連動状態に応じて次の3つの場合が考え
ら机る.
(a) M>w
(b)..M=W
(c) MくW
人間に類似した駆動機樽を有す多ロボットであれば,(a)は両脚が接地している状
態,(b)は片脚の足底が着地している片脚状態,(C)はつま先立ちの片脚状態あるい
はジャンプ状態に対応する.ただし,ある程度歩幅と歩行速度が大きくなると,外形的に
は足底が着地していても,足首部分のアクチュエータ入力の制約から実質的には(C)に
含まれる歩行パターンとなる.もう一つの大きな特徴ほ,歩行中に各脚要素の役割(遊脚
か支持脚か)が変わることによる各アクチュエ^タペの負荷の変動である.このような力
学モデル自体も大きく変わってゆくシステムに対するフィードフォワrド制御入力は,歩
行システムの状態の遷移に従って順次切り換えてゆく必要がある.本章てば。歩行中力学
モデルが変化しない一定期間ごとに前章で述べた学習制御法を適用し,理想的な運動パ
ターンを実現するためのフィードフォワード制御入力を獲得することを考える.
まず,運動状態(a),(b)の各々の場合には適当な制御入力,出力を選ぶことによっ
一54一
て,各々の次元をシステムの自由度と同一にできる.このときW自由度口添ットのダイナ
ミクスは,
A(θ)θ十B(θ)62+F6+C.i。θ=。
・(θ)・・童j…(θi一θj)ξ・WxW・
(6−1)
@θ:(θ・・θ2,…,θ。)T,
・(θ)・・ij・i・(θゼθj)ε・W洲, δ2・(6,2・6.2,…,δ。2)T,
肝㍉竃醍繍事
き一(台亙宙濤。苗靱…刈丁宙
㈱鑓凹(一・重言)帥wへ・1炸(・蝸且凶蟻ゼ㍉・舳留)㌧;重力加還度重
減現納る苗醐∼醐こgような非線形システム前して亜碑で提靴た拭凄
鐘用し苗よゆ厳密に解析することも可能であるが,二足歩行運動が実際には鉛直輸逓携に
騒られることなどから筍次のような時不変線形システムと見なすこともできる。
A菖(t)十Fδ(t)十Cθ(t)邊u(t)
(8−2)
ただし里A登録川。F竈ず…,C昌d亘a9(一。・9)
馬
馬
亙
ここで,行列A雪F,Cはすべて正定対称行列であることから2章の表現を用いれば亜
R鮒)十Q童(t)十P・(t):・くt)
.
(6−3)
ただし,R=AξRW・W,Q昌FξR舳,P:CξR舳,。(t):θ(t),
と表現できるの’ ナ提案した学習制御を直接適用することができる.また(C)の場合で
ほ,システムを線形化することによって(6−2)に代わって次式が得られる.
Aδ(t)十F6(t)十Cθ(t):Du(t)
一55川
(6−4)
ここに DξR版M (M<W)
従って,2章の表現を用いるならぱ(2,1)式に代わって,
R麦(t)十Q麦(t)十Px(t):Du(t)
(6−5)
となる.この場合,出力Y(t)を
Y(t)。;DT麦(t)
(6−6)
と設定すれば,このシステムに対して定理2.1,定理2.2,定理2.3は同様に成立
する.ただし,この場合は例えば(2−16)式に代わって,
・。一・。、、一色。T(・)R色。T(・)・・。T(・)・・。(・)
T
・/
色。T(・)(・Q一… T)色。T(・)・・
(6−7)
O
となる.従って,定珪の条件は,
2Q−DADT〉O
(6−8)
となるが,それらの定理における議論は同様に成立する.
従って,M〈Wの場合についても,M個の自由度については前述の方式と固ゆ学習プロセ
スが構成できる.
二足歩行ロボットがっま先立ちの状態,あるいは足首トルクを使用しないで歩行する場
合などでは,ロボットの重心に関する前傾運動を内力トルク成分だけで制御することはほ
とんど不可能である。すなわち,倒立振子になぞらえることのできる重心の前傾運動は,
ほぼその運動開始時の状態量で決定され, 内力トルクにはほとんど影響されないのであ
る.ダイナミックな二足歩行はこの不安定なモードをうまく利用して実現されるわけであ
るが,その時の動的な安定性、即ち定常歩行が可能か否かは,着地時の歩行ロボットの外
形で決定される、従って,遊脚が着地する以前にロボットの相対形状が着地時の望ましい
一56一
姿勢と歩幅になっていれば,二足歩行ロボットの動的な安定性は保証される.ロボットの
外形(M自由度)の理想的な運動パターンを,学習プロセスによって獲得することは前述
のように可能であり,そのプロセスにおいて重心の前傾運動はほとんど変化しないので,
つま先立ちのような足首トルクを使用しない歩行パターンに対しても,本方式を適用する
ことが可能である.このようにダイナミックな歩行運動の場合には,1スライド分の学習プ
ロセスの対象として,ロボットの相対形状を決める自由度分だけをとるのが適当である.
6一二≡;
運動学習経験に基ずく歩行パターン
σ)逼曇主尺
二足歩行ロボットに目標の運動パターンが与えられた時,それを忠実に実現させる制御
入力は,試行の繰り返しによる学習制御によって獲得されることを前節で述べた.ところ
で,この方法を用いて様々な歩行パターンをマスタ}しようとすると,優々のパターンに
対する学習プロセスが必要であり,非常に手間がかかる。きらに,歩行パターンの種類が
増えれば増える程,信々のパターンを実現させる制御入力の記憶のために,より多くの記
憶容量が必要となってくる。以上のような事情から。学習の手間をできるだ粉省き,記憶
すべき理想的な制御大力ハターンの数を減らすこ1とが重要な問題となるが,こればシステ
ムの線形性を利用すれば容易に解決できる.本章では,既に獲得された制御入力を利用し
て,新たに別の運動パターンを学習プロセスをかいざずに生成する手法について述べる.
ここで考察の対象を(6−3)式で表わきれるようなM自由度線形メカニカルシステム
に限定して考える.先ず,運動パターンの学習プロセスによって,次のような多項式時間
関数で与えられた目標運動パターンが実現されたとしよう。
m
α
Z(t)=Σα.t1
α
I
(6−9)
i=2
ただし,ここでは初期状態を状態変数の原点にとり,目標連動パターンは時間の2次以上
の項から構成するものとする.このときの理想的な制御入力u (t)は, (6−3)式
α
より,
一57一
mα
u (t)=Σ[i(i−1)ti‘2R+iti・1Q+tip1α.
α
1
i:2
mα
=ΣX.(t)α.
1
1
(6−10)
i=2
となる.
ただし,X.(t)=i(i−1)ti・2R+iti■1Q+tip
1
eRH洲
ここで(6−10)式中の行列X・(t)には,次の関係があることに注意する.
1
Xi÷1(t)=(i+1)Xi(t)
(6−11)
次に,新たに他の目標パターン
mβ
・β(・)=Σβi・’
(6−12)
i;2
が与’えられたとき,そのパターンを実現する理想的な制御入力
mβ
(6−13)
uβ(t):ΣXi(t)βi
i=2
を既に得られているu (t)から生成したいのだが,そのためには自由度Wに対応したW
α
組のu J(t)(1≦j≦W)が得られていなけれぱならない.いまW組の制御入力を
α
(6−10)式を使って,
一58一
m
α
α
u J(t)=ΣX.(t)α.J,
1
1
1≦j≦W
(6−14)
i=2
と表現する.次に上式の各ベクトルを用いて,
U(t)=[。エ(t),。2(t),。3(t),… u H(t)1
α
α
1
α
α
α
P.=[α.1,α.2,α.3,… α.H1,[1≦i≦m l (6−15)
1
1
1
l
α
のように行列を定義する.このとき,
mα
Uα(t)=ΣXi!t)Pi
(6−6)
i:2
であることから,
mα
・。(・)一・、(・)・。舳しΣXi(・)・i・。一1
(・一・亨)
i:3
となり,その他のX.(t)(3≦i≦m
)については(6−11)式の関係から,
1
α
mα
・。(・)一・X。(・)=・U、(・)・2.L・ΣXi(・)・i・。i1
i=3
X・(t)=4X・(t)」
・、、(t)=mαX・、.1(t)
一59一
(6−18)
が成立するので,各Xi(t)(3≦i≦mα)を初期条件Xi(0)=Oのもとに,(6−1
8)式の行列微分方程式を解くことによって求められる・X2(t)についてはそれらの結果
を使って(6−17)式より求められる.以上により,新たに(6−12)式で与えられ
る目標連動パターンが与えられたとき,理想的な制御入力は, (6−13)式として求め
.ることができる.牢おmβ〉mαの場合は(6−18)式の次数を上げることで簡単に対
応しうる.
本方式の有効性を確認するために,二足歩行ロボットの遊脚の2自由度について計算機
シミュレーションを行なった.以下にその結果を示す.なお,遊脚モデル(Fig6−1)
の各物理パラメータぱ,Tab1e6−1に示すものである.
可Ul
Il
L1
M1 』
2
Fig.6一一1
Two Links Mod−e1
U212
…θ。 」二乙
L:1ength
2
L2M2
M:mass
L/2:distance f=rom the
joint to the cente1r
of gravity
I:inertia
Link No.
M[kg1
L[ml
2I工kgm】
1
3.77
O.3
0.144
2
4.80
O.3
0.236
Tab l e 6−1 Phys ical Parameters o f a Two L inks Mode1
一60一
まず,次の2つの目標出力についての理想的な入力を試行を繰り返すことによって構成
した.
_40t3+60t2_10
。1(t)=
α
_240t4+480t3_240t2_15
_40t3+60t2−10
z 2(t)嵩
α
(6−19)
_王60t4+320t3_五6◎t重_五◎
ただし亜・(・)一(θ玉(・){(・))Tである岨この・つの歩行パターンをパi・曲・皿
2一徹に示す.また日この二つ.の目標運動に対して20圃試行を繰り返し誤差が小さくな
った様子を門g曲6−2−bに示す.このとき入力の修正は第4章の位置と速度の両方壷利
用する方式を採用した年その際,A螢む綾g。(75里?5》重徹=⑪昔2,虜篶O曲8 とした里
2
Zα
1
1
Zα.
−1
10
而
Nが2
、
り
N1σ3
(司
、
WalkingPattem
1σ4
l
zα
1σ5
z婁
0
5 10 コ5 20
ZrZ=(E1,E・)丁加i・h・晒b帥
(b)
。、。,。一・
日61一
S imul at ion Re s ul t
次に別の目標運動が,
_60t3+90t.2_15
Zβ(t)=
(6−20)
一240t4+480t3_240t2_15
と与えられた場合を考える.この歩行パターンを門g.6−3−aに示す.上述の手法に基
づいて,Zβ(t)に対する入力uβ(t)を求め,遊脚モデルを駆動した時の, シュミレー
ション結果を,Fi8.6−3−bに示す.
1
Z6
−1
10
意
}1σ2
廿
)
、
(a)
N1σ3
・Walking Pattem
with◎ut experience
!σ4
1σ5
航曲experieハ。e
OI 5 10 15 20
ZダZ=(E1・E・)Tt・i・ユ・・㎜b・・
(b)
Pig.6−3
Simulation Result
なお,(6−18)式の行列微分方程式における微分を差分操作におきかえ,時系列信号
Uαを入力とするディジタルフィルタを構成することによって,制御入力uβを求めた、
また,Zβ(t)の初期位置があらかじめ用意した目標パターンの初期位置と異なるが,これ
は・α2(・)の初期入力値を,(6−13)式で得られる入力に付加することで対応でき
る.Fig.6−3−bより本論文の手法を用いた場合,第1回目の試行から誤差が小さくな
っていることがわかる.
一62一
この手法によれば,いくつかの運動パターンについて入力を構成しておけば,別の連動パ
ターンに対しては,(6−17)式, (6−18)式で示される一種のフィルタによっ
て簡単に入力を構成できる.これによってFig.6−4のような運動パターンの選択が可能
となる.
high 1eve1 inte11igence
ba s ic input pat tern
r一・
I
“■1
L__
・__J
Start SWitCh
Star
i
弓
『
弓
C○
吊
識
1
「
ヨ
印ter
1
●●●
πiOtiOn pattern
,
1
1
se1ection
switch
.
I
一
L_
____」
input
SYSTEM
output
Fig.6−4
Walking Pattern Selecting Mechanism
この図は上位知的レベルで運動の起動スイッチと連動パターン選択スイッチがコントロー
ルきれ,ロボットが色々な運動パターンのフィードフォワード入力を高精度で発生させる
システムの概念を示したものである.この選択機能は,ちょうど自動車のギアチエンジの
働きに相当するものと考えられる.
一63一
6
系苦言
歩行中,力学モデルの構造が変化しない一定期間申ごとに学習プロセスを実行し,その
結果を組合せることによって,二足歩行ロポッー gが様々な理想歩行パターンを獲得し得る
ことを示した.この考え方は,二足歩行ロボットのみならず一般の脚式移動ロポットヘも
十分適用することができる.また,あるパターンについては既に構成された入力から直接
制御入力が求められることを示し,これに基づく運動パターン選択法を提案した.本章で
ほ,制御対象を時不変線形システムとしたが,1コポットマニピュレHタなどの非線形シス
テムに対しても,空間的軌道が同じで時間軸を変化させる場合には,本方式と同様に学習
によって得られた入力から直接必要な入力を構成する方法が提案されている.[37]・[38]
これらの方式を如何に実用化するかが今後の課題である。
一64一
第7章ロボットマニピュレータの
運動制櫛への適用
7一■
綿葦言
第4章及ぴ第5章ではあるクラスのシステムに対して学習制御が有効であることを主に
その収束性について数学的に論じた.本章ではロボットマニピュレータのダイナミクスが
それらの制御クラスに属し,学習方式が実際に適用できることを示す。その際,ロボット
に与えられた目標軌道についてフィードバック系を構成する岨このフィードバック入力に
よりロボットの運動は目標軸遵の近傍にあると考えられる由しかしながら葭多くの場合安
産鮭怠どの問題からフィードバックゲインを極端に大きくすることができ凄い出それ砂え
に葦目標軟遵壷亙確に実現することほ難しい拮特に害目嬢パ費一ンが高遠な場合には実際
の噴添ットの連動は大きく目標からずれてしまう。そこで本論文で提案する学習方式凄適
用し宮ロボットの運動の改善を.計る。即ち。目標軌道に対する荒い拘束はフィードバック
系で実現しサ綱かな鯛御壷学習によるフィードフ或ワード系で行なうものである。
7−2
非線形システムとしての定式化
本節てば5章で述べたタイフの非線形システムとして,ロボットダイナミクスを定式化
する。まず,口添ツトダィナミクスをハミルトン形式で次のように表現する,
ト州/帥:R血1(θ)。
(7−1−a)
白:一♂H/台θ十v
(7−1−b)
ただし・θ一(θ。・θジ・・θ、〕Tは関節角座標・・一(・1・・。,…・、)T
は一般化連動量であり,ハミルトニアンHぱ,
H=K+U
(7−2)
と表現される.ここに,K=δTR(θ)δ/2, (R(θ):慣性行列)であり,
山65一
Kは運動エネルギー,Uはポテンシャルエネルギーを表わす.また,vは一般化力を表わ
し・実際には目標軌道θd(t)に対してフィードバック系を構成して次のような形式で与え
る・.
・;・0/8θ十K。(θポθ)十K。(δd■δ)十・
(7−3)
ここで,第1項は重力の影響を相殺するために加える重力補償項であり,推定されたロボ
ットのパラメータに基づいて比較的簡単に計算できるので実時間で補償入力を構成する.
ただし,実際の重力項au/8θを正確に補償することはパラメータ誤差などの影響で難
しいので,その妥当な推定値るU/8.θを入力に加える形で表現する.(ただし,初期時
刻一t昌OでほaU/8θ;♂口/aθであるとする.)第2項,第3項は各々位置フ
ィードバック項及ぴ速度フィードバック項であり,ロボットの連動はこれらのフィードバ
ック入力によって目榛運動に近い形となるものと考えられる.しかしながらロポヅトの運
動は目標連動と一致せず,一般に誤蓬が存在する.特に目標パターンが高速な場合にはこ
の誤差が大きくなり実用上問題となる.そこでこの誤差を小さくするために学習方式によ
’り補償入力uを律成することを考える.具体的にほ5章で提案された方式を門g.7−1に
示す形で実現する.以下にその詳細を記す.まず,(7−1−a)式,(7−1−b)式
のロポットダイナミクス及ぴ(7−3)式の一般化力は,状態変数 x;(θT,qT)T と
補償入力uを使って,
麦=f(X)十Bu,
(7−4)
R−1(θ)。
f(X)=
一・K/θθ一・U/もθ十・口/・θ十K。(θd一θ)十K。(6ボδ)
O
B=
一66一
Ifro㎜㎜e皿◎ry
l
l
^
aU
l
aθ
uk
+
・.、
k
÷
dyna撤ics
’
+
θk θd
rObOt
K
θk・・
1,
P
十
;
1
I
e
K
・
1l 十 θ
d
k
d Ii
l
dt 口
−
v
\
、 、
、
ol
■
1
r一…一一………∵“■■’…’0
P
i
1 寺
・
l■ 、 〈
l
し一一__J
ek d l
π
1
i
i
し’i −0_0回00一■一0■0山___^’・■_皿・1_^’’^^一■
ド・・1 町7−1孔・・mi㎎C㎝・満1f・…b・・Dy・・皿i・亭
㌧”舳・y
Based on the Acceler&tion
Si・9n&1s
と表現でき。(5−1−a)式と同様の形式となる・一方鎧力は一般化遅動貴ではなく篤
速度として測定されるの.で,
y=δ=[O,R・1(θ)1
=C(x)x
(7−5)
q
となる.この場合出力方程式のC行列が状態変数の関数となっているので・前述の定理を
直接適用することはできない.しかしながら,状態変数xと慣性行列R(θ)について実用
上妥当な仮定を設けえことにより,定理の条件(a)に代わって
・m・・(1口、一・・一1(θ)ll。。)・・
O≦t≦T
−67一
(7−6)
が溝足されるならぱ誤差が収束することが以下に示される.
5章においそ示したように出力を角速度で与えることから・るk=シd一シk=θd一θk
となっている.ここで仮に,
llR(θk÷1)6k+11Iλ≦r1IR(θk)るk11λ
(7−7)
O≦r〈1,vk
が成立すれば,慣性行列についてはその構造から,
αI≦R(θ)≦βI,
tξ[O,T](α,β:正の定数)
(7−8)
と考えられるので,[40]
α116.l1λ・ll・(θ。)さ。llλ・・kll・(θ、)るlllλ
・β・kllさ、llλ
.(・一・)
となる.このことは・抑のとき116.11λ→・差意味している.従って,(・一・)式
の成立が証明されれぱ題意は満たされる・そこで・R(θk)=Rk・dR(θk)/dt=怠k
とするとき,次の関係が成立することに注意する.
Rk.1るk.rRkさk=Rk.1(θd一θk.1)一Rk(θd一θk)
=(Rk+1IRk)θd+Rkθk−Rk+1δk+1
(7−10)
ざらに・(7‘1−a)式より 白k=Rkδk+直kδk であることを利用すIると・
Rk.16k.rRk6k=(Rk.1−Rk)θd+白ゼ匂k.1一良kδk+貢k.1δk,1
(7−11)
となる・次に・(7−4)式より・ 匂k・dk,1 を代入すると5章の(5−14)式に
対応する次式を得る.
一68一
・。、1さ。、。一(1、一・・。^1)・。さ。・・。
(ト・・)
ただし・wkは次式で与えられるものとする・
wk}さK/♂θk+♂K/aθk.1−8U/aθk+a0/♂θk
+aU/8θk・ra口/8θk・rK。(θk■θk.1)一K。(6k一白k.1)
一(Rk−Rk.1)θd一(点ゼ貢k.1)へ一直k。五(δゼδk,1) (7−3)
ここで壷状態量について次の条件を仮定する。
llθk!1。。≦C玉一1}1。。≦C2バーO曲T1宮vk
lト14)
この条件と慣性行列の構造的な特徴かポある定数α芝によって・
1∼駄11λ≦α211・k手ゴ・一1入
(ト劇)
が成立することを用いると一 ウ(7−12)式より次式が得られる.
1・。、且る。、111入・m・・(1!1山・・ゼ111。。)1・。さ。1λ・α。1・。、ビ・。1λ
O≦t≦T
(7−16)
ここで・l1xk。「xkliλの項については(7−4)式のf(x)が・リブシツツ条件を
満足することから,(5−19)式の関係が同様に成立する.即ち,
Hx・・1Tx・IIλ≦δ(λ)”6・Hλ・.
δ(λ)一・。(1一….T)・λ… (α。(1一・一λT)・λ)
一69山
(H7)
であるので,(一 V−8)式を考慮すれば,
llxk+1−xkIIλ≦δ(λ)lIさkIlλ≦[δ(λ)/α]I1Rkさk1I入
(7−18)
となる.(7−16)式,(7−18)式より,
llRk.1るk.111λ≦・11RkさkHλ
(7−19)
・・m・・(l11、一・・。一111。。)・α2δ(λ)/α
O≦t≦T
となる.このrは十分大きなλによって,
O≦rく1
(7−20)
1となる..
7−3 時変システムとしての定式化
本節てばロポヅト竿イナミクスが,目標の軌道まわりで線形化されることによって,第
4章で取り扱った時変線形システムとみなせることを示す.まず,ロボットダイナミクス
の基本となる(7−1−a),(7−1−b)式において、 (7−11a)式より白を計
算して1(7−1−b)式に代入すると,
R(θ)θ十良(θ)δ=一♂H/♂θ十v
(7−21)
R(θ);壱性行列(正定対称)
となる.きらに(7−2)式より一aH/8θを書き下たすと,ロボットダイナミクスは
次式で表現される.
R(θ)θ十÷(θ,δ)十g(θ)=v
一70一
(7−22)
ここに,f(θ,δ)昌貞(θ)δ斗♂K/8θ:コレオリカ,遠心力,
g(θ)=aU/aθ:重力項
目標軌道(運動)が関節角座標で表現されたとし・それをθd(t)(tξ〔O・T])で表わ
す.ただし,Tは運動終了時刻とする.きらに目標軌道θd(t)の各要素は時閥区間〔O,
TコでC3級以上の温かな関数で与えられるものとする.この目標軌道に対して線形フ
ィードバック制御系を構成し入力Vを,
・=§(θ)十K。(θボθ)十K。(δd■δ)十τ
(7−23)
とする.第1項は重力補賞項であり,比較的簡単に実時間で計算できるので。(7−2
3)式のようにフィードフカワード入力として構成する岨前節で説明したようにパラメー
タ誤差などの影響を考慮して,その妥当な推定値§(θ)を入力に加えることにする苦行列
朕冒匿は各々位置フィードバックゲイン行列田速度フィードバックゲイン行列であり,
遭
v
通常は対篤上にのみ正の値を設定する.この制御則によって豊撒ポットの運動軌道θ(も》は
目標軌道θd(t)の近傍にあると考えられるが12つの軌道の間には次のようなぜ口で狂い
誤差が一般に存在する。
(7−24)
x(t)羅θ(t)一θd(t)
この誤差を小さくするために学習制御によってフィードフォワード入力τを構成する.本
方式を説明するにあたり,まずx(t)について2次以上のオーダーの項を無視することによ
って(7−22)式及ぴ(7−23)式をまとめて次のように表現する.
[R(θd(t))十{8R(θ)/8θ}θdx(t)コ[麦(t)十θd(t)コ
牛f(θd・δd)十{・f(θ・δ)/・θ}(θd,δd)・(t)
十{・f(θ・δ)/・δ}(θd,δd)麦(t)
十・(θd)一§(θd)十{♂(・(θ)一§(θ))/さθ1θdx(t)
一7!一
昌一K
x(t)一K麦(t)十τ
P
v
(7−25)
ざらに,(7−25)式を整理して,
R(t)麦(t)十Q(t)麦(t)十P(t)x(t)=ぴ(t)
(7−26)
を得る.ただし,
R(t)・;R(θd(t))
Q(t);{af(θ・δ)/8δ}(θd,6d)十Kv
P(t)x(t)={8R(θ)/aθ}θdx(t)θd(t)
十{8f(θ・δ)/aθ}(θd,θd)・(t)
十{a(・(θ)一§(θ))/8θ}θdx(t)
十K一。(尤)
P
u(t)2h(t)十τ(t)
h1・)・一R(θd(・))θd(・)イ(θd・δd)1(θd)十套(θd)
である.結局,目的は(7−26)式で表現される誤差システムの入力u(t)(実際には補
償入力τ(t))をうまく構成することによって・目標の連動パタ…ンθd(t)を実現すること
である.この場合x(t)が目標軌道からのずれであるので,誤差システム(7甲26)式
に対する目標位置パタ…ンxd(t)は・
xd(t):O
O≦t≦T
一72一
(7−27)
となる.従って,4章の2つのタイプの入力修正法は各々,
4−2−1.速度による方式
・k,1(・)=・k(t)十A(童d(t)一重k(t))
(7−28)
=uk(t)一A童k(t)
4−2−2。位置と速度による方式
・k、ユ(・):・k(・)寺Alα(麦d(・)一㍉(・))・β(・ム(・ト・k(・))コ
(7−29)
竃機蛙(t)一A〔α童虹(鏡)寺βx虻(t)3
とす棚ま良い。
‘fm㎜㎜emory
邊
種k
十
寺
qk 6d
Vk
ア◎b◎t
皿
十
dyn師ics
g
o
÷
x
l
P
.
d
Kv
l
一
dt ■I
\
,
,
・■一・i‘一一一一
「一一
,
阜k ; βd
1
P
1
1
、
一
___一__一一_」
!
十
÷
^
一
自
・1■
.
“
…
I
l uk+1
8
さ
;
し一一一一一一一一一一一一一一一一一一一一一一一一」
㌦・舳… 。。・一・・。。m・。。・。・・…f・・・・・…。・・血…
Based on the Velocity
−73一
Signals
3
ざらに・目標パターンθd(t)の各要素を時間tに関してC級以上の温かな関数で与えれ
ば,係数行列 R(t),Q(t),P(t)の各要素把C1級以上の滑かきとなる.また,初回の
入力u1(t)は・τ1(t)=O とすれば・ u1(t)=h(t)となりロボットの物理的特性か
ら連続な関数と見なせる・目標出力については一 Eyd(t)=麦d(t)=Oであることから,明
らかに,C1級の条件を満足する.従って,4章での制御対象システムとしての条件をす
べて満足するので,(7−26)式で与えられる時変線形メカニカルシステムに対して4
章の方式を直接適用することができる.なお,この場合のアルゴリズムをFig.7−2に示
す.
誤差の収束についての考察
以上の議論より,ロボットダイナミクスを目標軌道のまわりで線形化して得られる時変
線形システムに対して第4章で提案した方式が適用できることが示された.その際,誤差
の収束鮭を保証するためには十分大きなρの値を設定する必要がある・このことはL2ノ
ルムなどの評価規範でみたときに,有限試行回数では誤差が減少しない可能腔もある.し
かしながら,実際に便用される多くのロボットの物理パラメータでは,フィードバックゲ
インを他のパラメータに比べて比較的大きく設定できることから,ρは極端に大きくしな
くとも良いことが以下のごとく示される.即ち,フィードバックゲインKp,Kvが正定対
称であることを利用すると,(4−42)式に代わって次式が得られる.
・。(・)二・。、1(・)…ρt1益。T(・)(α・(・)一β・)三。(・)
・色。T(・)(α・(・)・ρβ・(・)・α・、・β・、一αβ・一β・(・)ビ五・(・)トβ・)色。(・)
・・。T(・)(ρβ・(・)・α・、・β・、一β・(・)・一1点(・))・。(・)1
t
・/
・.ρτ[き。T(τ)U。(τ)三k(τ)
O
・主。T(τ)・。(τ)色。(τ)・・。T(τ)・。(τ)・。(τ)1・τ
(7−30)
一74一
ただし,
Uユ(τ):(ρR(τ)十2Kv+2E(τ)十怠(τ)一α〈)α一2βR(τ)一F
一W1T(τr正W。(τ)
・。(1)一1ρ舳)・ρ・、…、… (τ)一貫(τ)一α・)α・(ρ2・(τ)… 胆
十2F(τ)十2倉(τ)一ρ忘(τ)一2R(τ)一βA)β一ραβ〈
一トW.T(τ)ビ1W。(τ)
・。(τ)一(ρ2・(雷)・ρ・甲…展辛・・(冨)一ρ怠(τ)一β・)β一ρα局・
T
一五
十ρKホトW2(τ)「W2(τ)
ただし垂
禰パτト(2買(τけ2倉(τバα十2貞固(雷1
W2(τト2籔芦(冨)
W。(冨)4α{冨)・・(血舳)寺・(君)・抑㍗冨))揖
E(τ):Q(㌘)一K
v
F(冨)x(冨)駕p(冨)一民x(τ)
騨
くマー30)式の各項に注意するとフィードバックゲインの各要素が比較的大きいことか
ら垣極端に大きなρの値を設定しなくとも(7−30)式の右辺を正にすることができ
る苗このことは誤差の評価規範Sk(Jk)をL2ノルムに遅い形で設定できることを示して
おり実用的にも本方式が有効であろうと予想される.
7一一一4し
弗吉{葦
リンク構造のロボットダイナミクスが,第4章及び,第5章で記述された時変線形シス
テム及び非線形システムで表現されることを示した.どちらの場合にも実用上の観点から
比較的簡単に実現できる重力補償項は実時間で入力し,目標軌道に対してはフィードバッ
ク系を構成した.
山75川
第8章1コボットマニピュレータの
力制御への適用
8一 ■ . 糸書言
クランクまわしやグライヂィング作業など外部環境から力学的干渉を受ける作業をロボ
ットに行わせる場合には,位置制御だけでは不十分であり,力を制御することの必要性が
多くの論文で指摘されている.また,その力制御及ぴ位置と力のハイブリッド制御を実現
するための幾つかの方式が既に提案されている.〔41] しかしながら,ロボットがある方
向に高遠に連動しながら,別の方向に力制御する場合などでは,その運動の動的な干渉の
ため目標の位置と力のパタ…ンを同時に実現することはかなり困難である.
一方,本論文で提案する学習方式では,再現性のある外乱が外部環境からロボットに加
わったり,高速運動時などで1コポットの非線型ダイナミクスが大きく効いてくる場合に特
に威力を発揮する.従って,力学的な干渉を受ける作業に対しても有効な制御法であるも
のと期待できる。そこで本章では,位置と力のハイブリッド制御に学習方式を導入するこ
とを考える.その際,力制御方向に対して位置変位と力の人ききに線形な開係があると仮
定する.実際,バリ取り作業などでは工具はバネを介してロボットハンドに取り付けられ
ることが多く,この仮定が成立する.このような場合,力の欠ききは位置変位に換算でき
るので。目穣のカパク…ンに対応する位置パターンについて第4章及ぴ第5章で提案した
学習方式を直接適用できるように思える.しかしながら,実際には次ρ二つの問題が起こ
る.
(1)力制御が必要な作業では対象物からの反力及びそれに伴う摩擦力などの外乱がロポ
ットの運動に大きく影響する.従って,これらの外乱を考慮したロボットダイナミ
クスについて学習方式を定式化する必要がある.
(2)工具のセッテッング誤差やバネ定数の誤差などから位置変位に換算して間接的に求
められた力のパターンには誤差を含むことが多く,徴綱な力の制御は困難である.
これらの問題点を解決するために,まず第2節では対象物からの反力及びそれに伴う摩擦
力なども含めてロボットダイナミクスを記述し,力制御方向にはカセンサーからの信号を
直接使って力の目標パターンを実現する位置と力の学習システムを提案する.次に第3節
てば力と位置の線形関係を利用して,この方式によってロボット運動が確実に目標の位置
一76一
と力のパターンに近づくことを理論的に示す.その際,力と位置の間に線彫な構造を仮定
するが,バネ定数に対応する係数及びロボットの物理パラメ帖タなどは未知である場合に
も本方式が有効であることが示される.
8−2一ハイブリッド学習制御の構成
ロボットがグライディンクなどの作業を実行するとき,対象物からの反力の影響を含めて
識自由度のロボットダイナミクスを次のように表現する。
R(織)δ十ヂ(ω壷あ)斗9(ω)…榊令F(嚇里ゐ)
ただい
〈8一五)
T
ω罵(⑩11ω2・由曲冊⑳nジ ぱ1一般他産標であザ作業内容壷記逮できる雅美
塵擦(通常はか出チシアン塵標系)で与兎るものとする曲R(ω)は慣笹行列お呼ばれ幕も
ので正定対弥行列となるこ註に注意しておく韮 ぞ(⑩珪ゐバま遠心力壷コレガリ力及び精髄
宇至=
摩擦を表す非線形項であり,g(鋤)ぱ重力項垂表す。また里W罵(Wエ雪W2ぺ〕W簸)且蛙
この座標系に対応する一般化力である、きらに言ピω,ゐ)ぱカ制御で問題となる反力及
びそれに伴う摩擦力壷表す項である。実際には圭この座嬢系搬とロボットのアクチュェ・一
夕の座標系θが異なる場合が多い。碗えば担麗節型撒ポットに対して作業摩擦系壷カーテ
シアン座標系にとる場合などが多い。この場合,一般に次の様にして実際にアクテュエー一
夕に加える入力Vを求めれぱよいことが示されている,こ1L〔42]
V竈JTW
(8−2)
ここに行列Jは,J:δω/δθで定義されるヤコビアン行列である.この方式によって
実際にアクチュエータに加えるべき入力Vが求められるので,以下では作業座標系ωに対
応する入力Wの構成について考えることにする.
まず,座標系の位置制御方向をωP力制御方向をωfとして,
一77山
ωp一(ω且,ωパ・・ω、)T,
ωp
(8−3)
ω=
ωf一(ω協、。,ω、、。パ・・ω、)T,
ωf
と表すものとする.即ち,一
克ゥ由度については位置制御,n−m自由度については力制御
を実行する・次に位置と力の目標軌道を各々ωpd(t)・fd(t)・(O≦t≦T・不運動修了
時刻)とし,その各要素ぼ4章の定理の係数行列に対する条件を溝足するために,C3級以
上の温かな関数で与える.この目標軌道に対して入力Wを次のように構成する.
・、(ω・。一ωp)・・サ(あ・ボあp)
十τ
W(t):き(t)十
(8−4)
・f
㌦(fd’fトF。ω
G GεR・㎜,F,亙εR(㈹)・(・一識)
ポ
v
P v
ここに第1項ば重力補償項であり,第7章で述べたように,比較的簡単に計算できるので
実時間で計算し入力に加えるものとする.ただしロポヅトの物理パラメータの推定誤差を
含んでいるので,推定される重力項套(t)として入力に加えるものとする.ただし,初期時
刻てば§(O)冒g(O)であるとする.次に第2項てば,fはカセンサ山から測定された力信
号で。あり位置と力の目標軌道に対レてfeedback系を構成している.feeψack
gain行列G
P
,・、,・、はすべて対角上にのみ正あ値を設定するものとする・力制御方向の一・、あf
の項はダンピング項であり行列Fも対角上にのみ正の値をもつ。位置と力を同時に制御
V
するためのサーボ系として通常外乱補償用に積分捕債を加えた形のものが採用されている
が,ここではそれにかわる補償入力として第3項の学習的に作られるfeedfor続ard入力τを
与えるものとする.そのfeedforw鮒d入力の構成を説明するためにまず,位置と力の誤差
eP(t),ε(t)を各々次のように定義しておく.
・p(・)=ωpd(t)一ωp(・)・
ε(t)=fd(tトf(t)・
(8−5)
一78一
また,繰返し回数を表現するために,以後k回目の試行時の位置と力をω㌦(t),ヂk(t)
とする.きらに,その誤差を次のように表現する.
・pk(t)=ωpd(・)一ω㌦(・)・
εk(t)=fd(t)一fk(t)
(8−6)
このような準備のもとに学習プロセスを次に述べるような形で権威する.まず,初期値は
毎回試行ごとに目標パターンの初期化に一致させる.即ち,
一㊧㌦(O)量る㌦(O)=O,
ε虻(⑪)富曇敗(O)霊◎田
迂8−7)
とする品このとき目k回目入カベを修正して,k斗1回目の入力 ㍉吋を次のように落
成する.
αる㌦(セ)十局・㌦(t)
賞ト五(t)竃琶k(t)十Φ
(8−8》
徹る虹(t)十局ε虹(t)
ただし・1回目のf鎚dfor欄rd入力τ1ば・
τ1(t)=O
O≦t≦T
(8−g)
とする.ま」た,行列ΦξRnxnは’
Φ=di…(φ1・φ2・…φ。)・ φi≧O (1≦i≦。)(8_10)
とする。スカラー量の係数 α,β は,
α十厚=1,
(Oくα≦1,O≦βく1)
一79一
(8−11)
を満たすものとする.このアルゴリズムをFig.8−1に示す.
}
P
。。b。。
f
k−th t=ria1
P
ω「十ωd
fd一説m。・y
manipu1ato=r
一 十
u
.k
εk
十
十
十
P
ek
β
.
A +
+
+
d
α
dt
εk
memo「y
robot
k+1−th tria1
manipu1atoτ
uk.1
Fig’8−1
8−3
Learning A1gorithm for Hybrid−position/Force Contro1
学習による誤差の収束性
本・節てば,前節で述べた(8−8)式の入力修正法によって実際に位置誤差e P(t)と力
誤差ε(t)が試行とともにゼロに収束することを示す.まず,力の大きざf(t)ぱ,力制御
方向の位置変位ωf(t)と次のような開係が成立するものとする.
f(t)=Kωf(t)
(8−12)
ただし・K=dia9・(kl・k2・…
kn.m)で与えられ・バネ定数に対応する行列である・
以下では,力制御方向の誤差の収束を示すために,力に対応する位置変位ωf(t)を使って
議論を進めるが,実際の制御には力信号f(t)に基づいて実行されるので,係数行列Kの各
要素及ぴ位置変位ωf(t)は陽に求める必要がないことを指摘しておく、力の目標軌道に対
応する位置の目標軌道をωf。(・)とすれば,(・一・・)式と同馴こ目標軌道についても
一80一
・。(・)=・ωf
B(・)
(8−13)
(8−5)式の力の誤差ε(t)に対応する位置誤差を, ef(t)とすれば同
となる.また,
様に,
・f(・)雪ωf B(・)一ωf(・)
一・一1(・。(・)一・(・))
一1ε(t)
:K
(8−14)
を得る。これらの開係を用いることによって。(8−4)式の入力 W(t)ぼ次のように
位置変位のみによって表現される田
轡
G壷 ◎
P
G蓼。
ωゴ⑳
療
W竃釜く⑩)辛
暫
十
f
○画F随
P
£
ωボ⑳
曲曾
○壇頁
曽
」し
妙トが
十 冨
一・、あf
B
(8−15)
饒怠(ω)十K。(ωボω)十K。(あd㎞ゐ)十i今τ
ただし。
G
G
O
プ
, vK:
K。=
◎,F K
P
P
O
ωd
v,
,三=
・ ωd:
O,F
v
f
ωd
一Fが
v d
f艶df◎r囎rd入力τ:Oのときのf舵db鮒k入力についての有効笹は既に報告されており宙
[1コ鰯ばほぼ目標軌道ω。(・)近傍にあると考えられるが,猛お次のような誤差が擁す
るヰ
一81一
一・p(t) 一ωpd+ωp
=
X(t)=
=一ωd(t)十ω(t)
(8−16)
一・f(・) 一ωfd・ωf
この誤差x(t)は比較的小さな値であることから,第7章と1同様に2次以上の項を無視する
ことによって(8−1)式のダイナミクスぼ・目標軌道ωd(t)のまわりで線形化され・次
のように表現さ一れる.
R(t)麦(t)十Q(t)童(t)十P(t)x(t)=u(t)
(8−17)
ただい
R(t)畠R(ωd(t))・
Q(t)=〔af(ω・あ)/8あ](ωd,あd)一〔8r(ω・あ)/aあ](ωd,あd)十Kv・
P(t)・(t);〔θ早(ω)/ω]ωdx(t)あd(t)十[8f(ω・あ)/aω](ωd,ω・(t)
■[8・(ω・あ)/♂ω](ωd,ω・(t)
十[8(9(ω).§(ω))/ωコωdx(t)十Kpx(t)・
u(t)=h(t)十i(t)十τ(t)
h(t)=R(ωd(t))申d(t)十f(ωd・あd)■・(ωd・あd)十・(ωd).§(ωd)
従って,ロポットダイナミクスは第4章の定理が直接遇周できる時変形線形メカニカル
システムとして表現できる.次に,(8−7)式の入力の修正について考える.先ず,k
固めの力誤差ε。(・バこ対応する位置誤差・f。(・)は,
一82一
・㌦(・)一ωf.1㌦一・(・。一・。)一・})
18一王8)
となるので,(8−8)式は次のように表現される.
αさpk(・)十β・㌦(・)
τk・1(t):τk(t)ヰΦ.
(字一19)
1αKさf・(・)十周K・f・(・)
きらに,
㍗㌦(t)
㍉(tト
(8−2◎)
資
山e虹(t》
と表現し・uk(t):h(t)十重(t)寺τk(t) であることに注意すれば1(8−19)式は1
巾・什一・ト冷)・へ1)1 (・一・王)
と書替られる。ただし,行列Aは行列ゆを
ゆ1・O
⑳:
Φ1ξR皿x㌧
(8−22)
◎・Φ2
Φ2ξR㈹xn一拠・
とするとき,
⑲
0
1、’
A:
(8一一23)
O・Φ2K
山83一
で与えられるものである.従って,制御対象システムは(7−26)式と同様に表現で
き,入力の修正は(7−29)式と同じ形式で与えられるので,第7章の位置制御の場合
と同様に位置と力の制御にも第4苧の定理を適用することができる.その際,位置と力の
線形関係の係数Kは未知である場合にも・行列Aを正定とするようにΦ2を適当に設定で
きる.このようにして,本方式てば係数Kを正確に推定する必要なく,力の誤差をゼロに
収束させることができる.
8−4。 赤苦言
試行を繰返すことによって目標の位置パターンとカハターンをロボットに実現させる学
習鯛御方式を提案した.この方式てば,力制御方向には力と位置に線形開係を仮定してい
るが,その係数及ぴロボットの物理パラメータは未知である場合にも本方式が有効である
ことが示された.
一84一
実験結果.及び
シミュレーシ員ン結果
負善9章
9一 ■
親書…葦
前章までに,本論文で提案する学習制御がロボットの制御に適用でき,目標運動からの
ずれはゼロに収束することが数学的に証明された.その際,証明のテクニックとして第4
章では重みρの値を十分大きくすること,第5章では,重みλの値を十分犬きくすること
を必要とした.これらは,いずれも時刻の始めの方に大きな重みをかけることを意味して
おり。誤差が一様に小さくなるためにぱ多くの試行回数を必要とする可能性もある.そこ
で本章では。実際に我々が制御する口添ットなどでは理その物理的パラメータの関係から
重みのρ及ぴλを極大に大きくする必要が事実上ないことを実験及ぴシミュレーションに
よって小す.
9一一一:≡ミ…
二足歩行ロボット
本論文で述べた学習プロセスの二足歩行ロポットヘの実装可能性を示すために。実機に
よる歩行パターンの学習結果を以下で紹介する.今回の実験では,片脚支持期の終りの撒
水ットの形状が,つぎの片脚支持期の始めの形状になるような目標遅効のパターンを与え
た.(Fig.9−1)また。片脚支持期で支持脚の足底が浮き上がらないような連動パター
ンを選んだので,一歩の片脚期の歩行パターンを完成することによって,継続的な歩行が
実現されることとなる.本実験に使用した二足歩行目ポットの写真を,Photo,9一五に示
す.このロボットは前後方向に6自由度,左右方向に1自由度を持ち,駆動機構はD.C。
サーボモータをハーモニックドライブで減速し,タイミングベルトによって各関節にトル
クを伝達するというものである.また各関節には,ポテンショメータがとりつけられてお
り,色変位を知ることができる.実験システム全体の概略図を円9,9−2に示す.マイク
ロコンピュータからの入出力線とモータヘの電源コードぱ,歩行の障害とならないように
天井に取り着けられたレールに沿って滑らかに動くようになっている.またこのロボット
は,完全に自律型で機械的な拘束はなく,左右方向の安定化は上部のバランサー壷左右に
移動させることによって実現している、このような方式においてはバランサーが一方の端
一85一
一1
Fig.9−1
Desired Wa1king Pattern
Photo.9−1
Photograph of a Biped Robot
from POTENTlO METERS
己
to DC.MOT ORS
DCAMPコ
CAMERA
BlPED
ROBOT
Pig.9−2
D/A
A/D
COMPUTER
TMS1OOM
PEN RECORDER
1三xperimenta1 System
一86一
にあり,遊脚を動かすとロボットが鉛直軸を中心に回転してしまう可能性がある.ここで
は足底にラバーを取り着けるなどのハードウェア的方法と回転力を生じにくい歩行パター
ンを選択するというソフトウェア的な方法によってこの問題を解決している.この1コポッ
トに上述の制御方式を適用するにあたり,左右方向はあらかじめ人間がプログラムしてロ
ボットの安定化をはかり,動的な影響を大きく受ける前後方向の6自由度(足首のアクチ
ュエータも含む)について繰り返しを利用して入力を求めた.実際には,目標出力に対し
てサーボ系を権威し,そのサ}ボ系への入力を修正する方法によって実験を行なった.即
ち,ロボットのアクチェエータヘの入力V(t)を次のように与えた.
・(t)=K。(θd(t)十τ(tトθ(t))十K。(δd(t)一δ(t))
(9−1)
ただし・θ(t);関節角摩擦。θd(t):目標パターン・冨(t):学習によるフィードフォ
ワード入力,K
P’ V
K ;フィードバックゲインである.ここで,速度信号は次のような
差分形式で求めた、
自 (t)=[θ (t;十△t)一θ(t)コ。/△t
(9−2)
また,入力の修正に関して第4章で述べた位相を進める方法を採用した。その位相進み量
δば各自由度とも同じ値(約50msec)を与えた.目標出力は時間の3次軌道の組合
せによって1歩O.8秒、歩幅23cmの歩行パターンを生み出す形を与えた(門g.9一
亙)。実験では第1回目の試行時に,主に追従遅れなどの原因によって目標出力が得られ
ず,ロボットは一歩踏み出すことに失敗し前に倒れてしまった.そこで目標出力と実際の
応答の差を10m s e c程度のサンプリング間隔で時系列信号としてメモリしておき,上
述の方法により2回目以後の入力を構成して実験を続けた.その結果,5回目の試行時か
ら1歩踏み出すことに成功した.またこのとき得られた入力ハターンを使用して定常な歩
行を実現することができた.このときのシステム応答や入力などをFig.9−3,Fig.9−
4に示す・RXエ∼RX6はFi9・9−5に示される角度であり・θdは目標出力・θcはサー
ボ系に与える入力(θc(t):θd(t)十τ(t))・θばシステム応答・eは誤差一は試行回数
である.また各々の関節の誤差収束の様子をFig.9−6に示す.門g.9−3,Fig.9−4
Fig.9−6などから試行回数が増すごとに誤差が小さくなっていることがわかる.
一87一
■川
,I
一 ’一■ 凹
■
rn
◎◎
1il
j
1
!1
一1
1
1
H;
1−1≡
1≡i
■
リ
ll!
『
j
一“
,「
1
;一
;い
」
口.1
r
i
1!
・!
I
i
1一
j
I
1
い1j
k
」一
1
=i1・
l l
1い
’}
゚い;
■l11
’=.1’
1l一一
上
・1
1い一止
Pl; !1
■ 一
I
1jI−1
一ポ
1リ;
「….1
い壬
.iけ10
1一
1−1
ll
ll
.1
。i1
リ
。11
1
i■
.†〔』
い
j
Ir[一↑‘ 1=
@リ ≡
I
!一11一
E
ヰ1 ト
い
i1
け
1
1一
一1
!1
≡11:
1lリ1−1
1
リll
j−1一
L二
1一
i
L
、I一
!1一
4
11
c
二{1
ll
粁
1一
.’
1
リ
1
lll,
;1亘1』リ1一
1一
い一
1
一
1リ1.
1
I1l・1:=.、1
j」
州・1
・1・
州
ギ
;.㌻
一11
1i
」
1l
’1↑;
1一
・ ,
一リ
リ
年
I一
、;、
1i
し
1
i
I1一
↑
■い
1
1
■t
一一1一
1・一
1’
1
H
Hヨ
1;1■一≡
1■」
.工
I
1二一
1
j
一1
“一
p
恢い
コ1
け。1
f
1一
’[丁 }一1
リ1=
ll1・
一;
’・
1
1
リ1−1・1
!ll
li;1
1一
.1.い1
一1;
n
⊥一一.。
■■ ■■ ’■
r.
1
}一
1I
■
■■■ 一 一
.1r
‘=
.,j
1 ’ 1
’一;
^
^ 舳
撃戟E1
1
リ
い
ll
1。
1グj
一†一一←【
l1
1ピ
一r「仁一’’
’ 一■
0I一』 u一
^
l l
1」
一{一司
一
一’
一I’一 1
lli;一1
ジ
!!
’舳η〃〃〃〃∫〃〃伽帥
1
1・
い一
::i1
≡じ
I.
1「I
H l
i
1≡{=
1・ギー…
1
111「1。
!・」
「1
I
い≡、i
1
肝
1≡
」’
f」
I:
」↑1て
i
1一
!一
1
一1rl
il
一’
一一一 一 一.
一一一」
←
一
十一一一十
.{
一, 一
C一
1’宇。’r
’T−r皿[’’
リ1;
1;.i
i.
梶E…1…
一1一 一
1
D■一;
一 ■一
’止』“一
1い
p
ψ
ll
ll
=一いr
1−1
ガ・.
一 一 ’ 一 一
1:
、1い
1!
一1一
:,1[1
h
i=≒
■”
一i』
境
’
←一
’一軸■■
ゲ〔
一土一
P
一一
11ll
@!=
ドー=
一 1
llリ
}1
一「.
I
I}
.一1
’ ,
一 .
1.
I
川
一一..
1i’一
“、 一〇■』。w冊
i
・1
・・I’・・’
1ド!1;
u
一■
■ 一
{1
・一
,ll
」
s1
…一
!I
1一・リ ー1
1
」1・
’
ヂ.一
リ 〕
1 一
T
■1il
_⊥一⊥二’’’
■ lll;.」
一1
1・E
1ll・
I山■{
1
1lll
!1
1
l/
I一.
1
1
i
、,1
・ 、
1・
叶
I
!一
川一1 1 。
ll!1
、1
I− 1’一1■■
@’}
■;
。一」一山
o
‘I」}.
ll一
l i1■1l
ll!
ピ
1。
リ1」上
1い州
ll
・lU≡1ll
1一、
1一
i1
←l1
1
η
1。
,TH
一一・
リ
1一
1rい
j・i’
1一
ll
@111−1
.iヰ.
い
ll.
一リい
〔1一
川H1l
j
1 “.I
llリ
H」
「・i
ll
ll
1・1
一,
リ
P} =
r
11
;!1:い; ヨ11.
P」,
I−t一一1.
1
い
1・
『1
’ ・
E」
一.1.い
,1ピ11一
11;
cい1
1−
一 .
ニド
!1一
1,l ll
一1一
il
い1
?P
1
1≡
’山
!一
』{
li。
,1
一{1
l ll一
Gリ1⊥i一
ll い
ll
!.
1・i一
=1;F
p
■
一 ■
一ド
リ
!.
え〇一〇“』一目HH0え〇一〇“』一目HH0 1 〃∫〃〃■〃’柵〃“帥〃⑪
1
1 一
illl
ll≡;
o◎
!1
撃Pl1:lll
リ1
一1一
θ
・11一・
w≡
・・!1
ll;
ポ
E
[・
廿1■H
e
D1
「
〕
I
い■
:1ド
15リ
’トー一
・一 i
;;1i
P「1
l1
.仲』..;.。
1
1l・ll
11一
一 一
゚川
5
1一
リ
一’
〔一∴
』
1
1一
い
一=≡
吾
1一
1一
1 ■
1
ll11
一1い1
11
旦
i
1!
1
。
..1
n
I
I
■ 一■’止」・■一
i
一{
1一
川
.ll
1
1
酌
ll
i
i≡1リ
Dい I
o◎
1リ
{
1 ≡
.il
ll’
ji
H
i
川一
一
.1
1一一
;1
リ
■
1l
i
1
㍗■r
!1
1
i
ll;舳・
「1
1
1
!li.
.」1
い:1.
1!1
L止1
1一
」1
・’』一’■1
山…
P
一巾一・一
Irn!
一1111
噤u丁
一一
一ρq
1」
mr
a
1
一 ■
j11
i,=1一1リ
111i
Pいlr↓
’【』叫一
。111111!グ
P一
ll
い
一1■』叶
1川
1111
丁πT
11
l l
〕
い一
Pr
一jl=
い
叫
リ
iい≡■ll
11
ガ
1
い
1
ウ
一リコ
」い
!、
i
一1
11
リ
=1
1
1・1
P1.
一リ;1
,韓
11≡’
P!
=一1
’1
1
l!’1、
1
一1
ド
1
≒1
.1i
111
p
1!い
1111
ll
い.
川≡.
川
1
■!1
111
い
H. I
リ
,1
≡線
m†
u
, ,
1
≡,1=リ『1 ■ 」I’
111
1㌧
≡9
“
_一」卍L
1一 ’一〇一
1!1
11=≡
i−1
1一」
F一1
@一
’!
黷g・
P」11
町
1111i!1一
=■lll
T:111
111
1−1.一」
_L1.一_{
1■
一1
’1
、・’
≡■
叫1
『1!・1
D一
1i1
・1−1+
・一■H}・
■■〔}
D!
D1一
C
い1
11
一.’
P一」;
p1
・!!1
いr
τ一一一
E1い
}1rlr,.
い
い
i
「ザ「「
T
1・1・
j
叩一「
s11
11
川1
〔r
1寸
1;一
一;
・■」
11コ1
■
111:
11!1
1111
…
㌻11一.H1
11−1
■ン
撃奄P1−h
げ
一中1
了ギー.
い
@リ
堰E1
≡11
一1
.
11一いllい
アー‘
111
111
一≡
P11
11
㍗一
Pii1
∴鼈
}
1
l
1
l=
い1
1≒i
!■
P;…
l
1
.
「ll
11リ!μ
ヨ・
」
i
1
一一
l
.
.1・
l
l・i
11
い
!
1一
一I
リ
1
1
一I
1.
l
111
!一≡1
一!’
1i1’i
D1一
川
、≡い」
,
−jl
1い1
ll
†T
:l1
1リ
■lll
1一.
け1
l1川
1≡、
l
1
け一一’η
Iグ
P
X
( 三1)
ig.9一専
十
.・…い
P
一
1
ヴ川
・へ.、㌧
111
111「:1j
リ
汀11〕.1
■
11i
1:;
l」≡l
・一_一二
1
i1
什ヨ1
P11
1
X5(
=≡1
?ォ
・一
T「
ッ1
一L一■
一
■」「■■
グ
■・一四山一
P1−1
l:1
1:11一
■」=l
撃「
†一iル
1、
汀パ
,一■一I
’.I’一一」一一」一一一一LI一」’一’
一≡1 11111
1・
1い
、ド1
∴
一i
㍗
・l1・l
,
Pい1・
’ll
謌黷梶v
Pさ;i
1
l」一
1;グ
ー:い1N
jlリけ刊
丁
;1・・・1・・1H}
1=1
」l1
・
1
11炉
、
TT0
グ!
1一
1
1リ
!1一
1.
−1!
レ I一![
。、、一1 1
一
l・i.≡
川1
一川
l
齊 一
ij
・l
}ヨll■
一■
ピ11!l1
l
1
a
.
1
E・‡
,1
ハ
「11い≡
干11
i11
映手
1・111
@i
」
1i
11・=
一!二、、
I
」_
リ
l
1
1
i.
11」
}}
一[山L■“
∴
一
,
1
一i
111
ド
≡一1
@
11
」二二
い=
=
一一
P11
1 l1,..
D.、
中..
1一
一
」l
㌔
!一.
1
一 ’川 一 一
一上
≡」=1
4
一{・、
一一
一.一
1
黶f
g1−1
l・l1
.
i・
一^一一。^一
1
ヨ
ト
一
・≡
ミ1一
」一
r ■ 一 r
=」
,
c∴. 1 !
ト
り一
■一一■
一一」■ 一 ■一
「L一■
=v「’IてL
j
■;・一
rr7
lll一
1
」
:甘
l11
!11
1
「一=
1
l
1
1
」
111r
下:÷L
T「†三=芋
釧〃舳〃舳“釦ム
肺ウドえ。oは州U閑 1 〃釧〃〃〃〃舳閉榊
1
1
.11
I’
「1
1一一.
,ウ。一え。 oは■■U■o
」.
’■’一■
!1ミ1.1
j11
ヨ
「
窒P1i一
≡i−
ド!1
I’凹’
出
ゲす1一
い1…
料≡11リ
、…一
g†附
≡耐 弓1!≡・
r’一
!.!
1 一
η一
・^■’}
1111
’舳
、亭
Gリ
11
1
1
;11
↑…
_、し_
11ミ1
固
一
1ア了岬
1H:11!1.!
。 ■一山■。 1
二一11・lr一
■一一一■
1■
グ11
一↓」
一
P1
巾I一’一
1一:,
F.ヰ.
♀;!
1111
一 」≡
1一
;11・
D叫
1=1!
山一
r1■
≡’11
u’一・一‡.。.
い11−11い
中刊’一
1」1rll一
.1.
寸1
一ニト:
u
」丁「一一
1
1≡一一≡
11−1
1.≡
1川1い
1 一
’
uT「一千
,
B=い
一 ,
11;1
i
}11 l
llて1.ll
・1
い
山一
∴
ポ
⑳
」…
L
1
三呼
い1’。
11 il
11
1111
l11
i
1、
11’l1.
{
〕、n■・ 一 一 , !
≡11
い=!
i1リい..
■
リ
i;
一.1
丁呵
一「
・一
「1jl
=…≡い1リ11
丁「 一
丁丁三’下一
一1
冊「馬一
一^川r’:一一^1
1111
111
Il
D.i
戟
j!一
川
11
言3)’
xPe「i孤ent&1 駅esult ◎f the 遣iPed Loc0孤。t立。n Robot
’
千4÷÷
・1
。1・・
X5(J:5)
@〇 ’
1一
I一■1
。
→ ■
o○
マ
∼
o
O『
◆
1
1
■
■
1
■
1
01
心
い、
、い
.い
1
RX4
.RX3
出
。
F
十/R
嵩、
一
、県
、 、、・
X、
N①一
、
、
N
・RX2
RX1
1
・ 、一
、
、’、一’、醐
」、・、’、’4RX6
、 、
、
O
RX6
脳1
、 ’
、
、
、、、、・\。RX4
\L
.r
hRX5
、
/
歌2
Pig.9−5
Or
Oマ
Definition of the Variables
ω1
2 34 56 7 8
TRlAL NUMB日R
Fig.9−6
1ヨxperimenta1 Resu1t of Six degrees of Preedo皿
一90一
口司ドヅー g マニヒ=コ」
9−3
(■)
しノータ
9一二3一 ■実験システム及び
シミュレーションモデル
本論文で提案する制御方式をFig.9−7に示されるような3自由度をもつロポットマニ
どユレータに適用する.ロボットの物理パラメータはTab1e9−1に示されるものであり
その概形をPhotq9−2に示す.全体の実験システムはFig.9−8に示される.ロボットの
色変位,角速度は一 e々ポテンショメータ,タコジェネレーダからA−D変換器を介してマ
イコンに入力され,制御量を計算後D−A変換器,D.C.アンブを経てロボットのサー
求モー列こ電力が供給される。
〈ド3・。
仁き手
. 2 も\一
L:ニヨーength
m=maSS
ザ
S:d−i s tance fr◎m the
joint t◎ the ce撮ter
∫
θ1’
of gr&vity
レニ
工:inertia
X
Pig.9−7
Robot Manipu1ator with Three Degrees of Fでeed−om
Tab1e 9−1 Phγs ica1 Parameters of the Robot Manipu1ator
L同
S[m]
2
2
2
Ix[kgm ] Iy【kgm ] 王z U(9m ]
0.059
0.3
0.305
0.54
0.15
b.11
一91一
0.03
0.022
0.0048
0.018
0.017
0.0033
Photo 9−2
Photograph of
Deg=【’ees of
/ O
the Robot
Manipu1ator with
Three
PreedOm
t◎ D.C.
S1…RVO MOTORS
D.C.AMP.
fro皿
聯服榊聯総S
O
A/D CONV.
D/^ CONV。
MI CRO COMPuTI≡R
ROBOT MANIPuLATOR
TMS1OOM
P1ミN
Pig.9−8
Experimenta1 Sγstem
一92一
RI…CORDER
9−3−2 速度信号による入力の修正
重三馬棄糸吉果
(関節角座榛制御)
関節角で目標軌道を与えた場合についての実験結果をFig.9−9、,一Fig.9−10に示
す・このとき制御入力は(7−3)式で与えたパi馬9−9では評価規範Skのρの値を
ゼロ。重み行列A=dia8.(32,32,32)として各関節の速度誤差の推移が示されて
いる。また・円9・9−10は繁1自由度θ1について誤差が試行ごとに減少することを示し
ている。図中θd;目標軌道。θ:システム応答・白d一δ;角速度誤差・θd一θ:色変
位誤差嗣TRY1試行回数を表わす.このときの実験条件をTable,9−2に示す。
∫・2dt
107
十1≡1
口ト1≡2
→{3
6
10
5
10
5 10 15 20
PIg.9_9
tria1 number
ExpeTimental Result
Integrations− 盾?Squared・Ve1ocity Brrors
E=θ 一θ 1ヨ=θ 一θ E=θ 一θ
!dユ1,2d・22,3d・33
一93一
tart
Start
tart
tart
’Start
Start
tart
工 1」1−J二。。。一一’。。一 ■ ・。[・ 一・ .^㌧∴上.
I’一 一
?1 一一 一
v1一
f’一
f’
f■’一■一
?1■■■
。止’ 一一
一
一
鼈鼈鼈鼈
’’
。一I一
禔゚0三一_I:」◎I一
1一一一 1■II」
0■ ■1−0
1一 一 ■ 皿
@■上
h一」
h 1
。 ■ 一
黶。 ■■一 ■■
f’ ……
黶。一一
ロ 一■⊥1
■
一
f
h【 o 一’
@ 一
v
鼈鼈黷P一⊥
@
L一
齊M一■ 一一I
黶f’I一.
h」hI’皿
’」一一
.
一
%
黶。」一一
O山I
」一
①
...==
遠
e:
黷P
1−
h ’ ’
一’
@ 1 l’■1
P ■‘一L
@ 一一
二=一
f I 」
I I−1
’
。一
■ I’一
@‘’皿■一
一一
」’r
. 」
黷h 一
一 ■
黶
一L
@
」
■一
鼈鼈鼈黶
@
■ 一’
E;・い1. 。.1。
=!
゚i;
i・,
1・コ
hい
;1i
■I.■
f■ 一■
f1…・’
@’ I’ ■一
? 1一■I
@ ’ 一‘
111.・
@一」’I
一 一
■■
。■ 【 ■一一1
一=一=一二一
==f=]
!li一==1
鼈ネニ =「二
D=二.’
■■!
11{
・」≡
Di
1.■
P
鼈齔?
一 I
E
「 一i」I−1
鼈黶E
」、I・
一’
梶B一
D 二
一 一 一 I・
撃撃
一:
三デ
=二=
:l11
黹 i
1・
1,
一【=
‘
u
一I 一
黶∴黶Gコ
’一〇一1
@一
.I■一
@
」一;
i;川
1Iリ
撃奄
V
洲∵
h
’=一一
鼈黶。i
■
■1
ii
1
。一
一’r
一
■ 一
=
11;
■
I’
.
一
一
^
− o
τ一1
u.
@’ ’一
E一 ■
一
I一
一
.
−1
→一
一
1
一j
P.;
.1
1’リ
P
」 ・
f_‘
・ 一
l‘一
一 ’
1
’
’
sー」」上
I一
・
@ 一
‘
一:lI
¥打1一一 リ
ニ!
ψ
=一
‘、ll・11 .l I
。‘
一’
11i
I
■
h。一ユ。‘コ
一
」い
G1..i。。
’一一
!
■ 一
。 ・
。’’1
1
P1
lパ
■
’
?■1■
.
一
■
㌧1
。’
@
1・い
■一
D一
E・■
黶E1
@
I 。二
.一
一
■
C1.
1‘
f⊥:、一
■1一
≡1■
‘’,
1
黶f ‘■一
D
■ユ
■
@一一一
黶f
P’. 一. ⊥■‘
国m一
ゲ1!
.
l
l・1
│1
l・一1
’=Irl
!:.
1に
.=一
e■I
ムηい
l
P,’
B.・
凸1=一
1』1↓
’ I
I
c
@I .I
@■ 1
…
一
=.:1
L=.=
P.i
い.
’’い
P’llu
’ ’一
一 。’
■ ■■
■
一 ’
一1:
一一二二 =二’
:。1
@一一
1・1
・ ■
f一T
’,
1’.1−1ド市…1
@二. =、
」.一1
・三..三.
;I=
堰f…・主
f一’.一
一丁丁 一71
1
、r D
11 」
三{」
■ 一
■
;ド
11
P1;・←十■
黶
1。=
1.1
h.ll
二.’
@一一」’I
゚=
堰G
@ ■I一
iゼ
!.
■ ’
」一
一:
’
・ ■
l1・1
■
c…=. I ’
一
1。==
Pい:■
1一
xperimenta1 Resu1t
1
1
一
g
・■
ystem Responses and−Errors
1,
θ≡θ
θ =θ
θ :=θ
1, d d1, d d−1
1」11r寸1111.⊥いい■
P一.1.i.rl
山川1
P■
RY宮17
RY;10
=θ
パ市r
f!11
一
一
・
RY=5
■
Aし=
│r
一
ll:
一.:1
ll’
=I.一
l
P・!
1=
==
黶f
川・l
一 ■
し=」一=一
。一
@ ■ 一一
11
el
’l
一 一’
!一一’=’=’
T.
・1「1
e
.1=■
一÷・・ 1・
r..
’、14 ミ
1
:■1一.llHl
’
’
黶A’
I 1
¶
一 ■
O一 ■’
@■
一1.=
∴鼾Hr
・マ1.]・一
」’
f.一一・
@: == ■ 一
’1ザ…
1一■
1:
三1;一
卜’ I
リ;
111!.,
1い
一.
;」’」■一
h■I:
’I「
1.1
I
F=τ1
:1
ig.9−10
.
一 一
一
’ ・
==・
戟D.
RY昌1
一■一
{=い.
一一
f’
二
三一..
il」llil」一1
1.
P1三ピ
I
‘
■
lI{
1
’
■
1、
’1−1
@−11
=A≡
一 ■■
一
三
1−I
■
.:I
P
[!.・
。’
I
「I≡
’
@’
F」三「1= 一1⊥
黶C
E・
1.1
4」ピ
D
1」
黷P
@I 1 ■I
I
P1
。1;
二1
@ ■
l1
一=.
ド11
P1U
E 」 一■
?
[1
鼈黹
fI■
■一
11i
l■
■■
1;、!
■
1 一一.
@一
<ム’
■
1
=一
f」:=’
「
11:い
’ ■ 一
÷1
l
111
一.
=11一川
■ 一
』I.
・L
。。‘
h
■一
’一
山
’
1リ
1い1・
1
iI
E1.・iill
一’
o
I . 一 一■
@一・
一’
・ ■
I
D
1リ1・・!1・.
→:
@’ ‘■I
‘
.一’
?■ I■.1
’」
梶GI
黶A
’・一I
x.」
。
■.
@■ 一■
?
一=・
’1!;;
■一
I
■’
P111:
.い;
P.’1.1
■.
P
一一
@.
一’
D 一 ■
㎜τ^N^回[INsτ日u”[”f5co日P。
P−
G1一
@
…→・
」 ’ 一 I
鼈黷Pニ
j=;一.
c
二=・三ド
川一1i
lリ
目
●
■ .
h一一山
止..一
v■
111
’.・
I一’■
’ ■ I■
。 」一’
’‘
一
一5
G一
eI
j’=I.’1 ■ ■.
一.
1一一』
P−1
Pい
F一
− I
、「
■一■一1
@’
黶。 1
一 ■ 一r
l
==i一.一 .
=.
山
」、一j」
■】
■;
』.一■ I ’ 1’
{11
ニー一
1,l
PiH一=い1..
=.二」工一.一=
二一一=
二一二
p一一
¥一!
o1一グ
DJ===盤
. ■
@一1
黶f
「
Pド;べ
f二;I−
@I. 一一
」 一‘’
I
%
一1一.
D「’
一 0
■=
u_一.=一=
=一
黶D一一
■」一
@ 一 I
黶c
=、!Il
一 一■
。一 ■‘
■一
一一 ■;
=よ
@一
i1=i
@’
一一=一■
黶vI⊥■
D一一1一一
I ■一I1
@一■1
@ − I 」■
f一■…
F1二’二’工
黷P’
D=二.j=
},
11T』
?P.1.
@一■一
1 ■L− 1一
三三{’
黷h一
齊M’’
@ 11 一一;
@■1 一…
@■■一
@一止
I
h一一
@■ ’ ■一
一.
齊R」」
’1
@
一■’
v」一
@ 」一一」
v1− I1−
@I一■ ■一
。 ■
P■=
@一一■.一
h ■一 一I
黶。 」一
、・三 ■一一
’I
’1‘
?一 ■■u
一I1
鰍P一
市一1−1
11ピー、1=
h■’■
皿’二
。 ’0−0■
h ’一
@■’
1!
│I一■一
’… =。■
@I1. f凹
O一一
Z一〇■■’
黶f■■1一
0
◎
f’
f‘一
f’一■I
D1・1’
。 一一⊥一
@ 一 ’一一
■’」
h ’’’
P一■一 一
f=:’τ■」,1一
■一一 ■■一
黶x一■■一一1
@■■一■I,
。
。’’一
? 0」一I
?黶ロ一一■
。 ■■■■ 一
一一 0I 一一1
ドll
■」 一■■ I■
7一
(作業座標制御)
作業摩擦制御では,第8章で説明したように関節角座標入力v(t)を次のように与え
た.
・(・)・含(θ)・・(θ)T[・、(ω。(・)一ω(・))・・、(あ。(・)一州)1・・(・)
(9−3)
θ:関節角摩擦,ω:カーテシアン座標,J(θ):ヤコビアン行列,
G G :フィードバックゲイン
P’ v
また,入力の修正は次のよう.に権威した.
・T(θ。、且)・。、。(・)・^θ。)・。、亙(・)・・T(θ。、。)舳。(・)一州)
(9−4)
このときの実験結果をFig.9−11,門g曲9−12に示す。門g曲9−1ヱではx,y垣z
方向の速度誤差をFig.9−9と同様の評価規範によって示す,またFig.9−12でほx宙
y,z方向の位置誤差が繰り返しによって減少することを示している。このときの実験条
件をTab1e9−2に示す.
∫・2dt
107
十Ex
+Ez
→モy
6
10
5
10
5 10 15 20
Pig.9r11
Experimental Result
trial numbe「
Integrations of Squared−Velocity 王…=rrors
B。=X・’X・B。=YゴYrE。=Z・一・
一g5日
Start
Start
.」I=一■’1一
一
I
■一
’I一
。一 ’’ 一一
h■ ’ ■■
D一 }
■
鼈鼈
‘ ’■
D ’’
■・三・…三≡ =
一
I
一一■
。. ■■
一
■一1一
@■」 一‘
I 一 」’’
。I一一一一
■‘一 一
I一一
@。一
一’ II
0
。’ . 一
一
’
’
’
f
一
@■一 一I
。■一 ■一
一■
一一■’
■I
■1』
:ニュ
」 一
@’
■
}
P
’’
c一一 一’
h一
一’一一
二一一1=・
一H
一一 一■
x二:I
■’
1’’
@’
’一■1.’■
一I II。
@’
一
I.0
i一
.’一
@ ’
’
■ ’一■
’
’
鼈鼈
一 ■ ’一
@ ‘1’
ユニ:==
’
一建
’・==
■]一
@}.
@■’一
ニユニ■’’’
;一基
」=二=_.」一一
・‘
f.・■
=
u 一
黶D.
D 一
.I
<?D
.
;行.
一
F「=■二
一
■一
I
一■’
’’
@II‘一
@I−
一’■■
@ ’
’
@^’
一一’一
11.
’
’一■
’ ’I
ft_。一
一
一一I
f■’
^一
〇
一^
1■
@
’,.‘
一
一
■
@一 . I
二=!
’ ’
■ ’
。 l 一一
、コ=
f一’’■二一
ぷ:{・
一
=、
■
III
黶f’
D
P,
■■ ■ ■
一」.
。
’黶f一’
一一
■.一
1r’’
’ ’
一
三i{=
一一■■’
’ 一I’一
尺
一一
@
冨11
f=一
’=
:
’’
.
。
F.=三.、ユ{..1
i’1.1、
。’r.』■=..一:’1■
?=F・一二:ニト1土
一
? 一 ’
■
■ 」 一一
..’1
』土:’1
茶U.二
? ■ 一
.II.
’’
1I=一
@・’■■■
@ .
三.{.=
一
一■
I
I
■
一
.
’1一=・
一 I
‘
?
・
」
手“三」{I=一1;
’ ■
.一一’’
E1…二一一。.
h’’一 言,’.
一・’
1
■ .
.{1;’.・一1ガ1
一
1 ’
@ . I
.=
=二
=一
二’
j:三
’.
二「
::
’
■
「..
1:
二
.
一 ’.
=D=二=’』.
@1
■ 一■
’
’ ’
’
二’一。
,r
1二1
■ ■
− I
■‘‘一一
f’
一I一
@ 一’
一一
@I
’一’’
@ I’’
f’
一一
黶E’一
..
’.
』1一一 一 ’
f一,
鼈黶E’
一一I
− 1’
x .
’
一
’u■=
P.=■
■一 一
I 一
1
1
■
.’
’」■ I■
’一
一‘
h‘一
一
一 一■ .
鼈? ■
■
I .,
’一
L■
@ . 一’
I
≡三i
’ ’一
@一
’ .
’■
〇.I一
黷
一・斗=
一:^一
’
.二=
一
一
■■
■
■
’一=
’1
一■
■■
■ ’
f@ I .■.
■
■I’
■ ■
■■一
@ 」 I L
’.
’
1三
’二一.
j二I
1
一
@■
’
’
,
■
j’一;
I
@
■
■
一一
.
@■
一
一一
e
■
H」
’
■一
@ ■ .1
@’
I
■
I,
@ 一 1
. 一 ■一
一’
D一■
一 一
一一 一一
一I’
@I I‘
’■一
コニ「
一「」.1
. 一
I
一
’ ■’
I
@一
f’・
=I:「1
’
.
, 一
.
@. 一
’’一1
f^,.
’
一
1
@
■
D=
梶G.
■■
@■
@ 一I
e一山
’一 I−
h…
@
e「 h’
一 一’■
’
一 ’’
P’.■ユ
’・一
■一
■ 皿
… ■ ■
■’一
f’一’
’一一’■
f 凹
汀:」
’
. 一 ■
I.
u
一
』
一
’
I
■一
■
f. .
’.
一 一
一■
・.
1=
一
一
@
■
一
■ ’I■
.
■、
一
Q一一=I二.
■
■
■’1’
■
‘一 ■■一’
」 ■
D
■ ■
一
I ’
.…
二
■
.
一
.
I
’
’■ 一
■ ‘
ドー
’
一
一
一
一.
f.
一
.
…
一
一 一
.一
=
;τ二・
」
一
■ I
. ・
ヨxperimenta1 Resu1t
n the Task−oriented Coordinates
■‘ ■
;」
一1
RY=5
osition Errors
」
’’{・
.
TRY;1
’
‘
i’.
,
■一
’
.1
=一
H11
一
’
’:;一 I ■ ,
一 .
’
一一
■
1:1
1 =1.■一
ig.9−12
@一 ’
’
。’■■
一 ’
■ ’ ■ 一’.
@’
f ■
; I
I。. 一1
1一==一
D
黶B.一
I’I
■・1’
@’一.’一
‘’
■
.一
’
一
’
一
I 一
u
■
. 一
1j
一 I ’
一
fI
@■1
。
=.=一「
1
、 一一一
’
’‘.
=]
::.』
‘」’ 一■
@’1一 ’
}τ^N^8区IN5τ同uM【NτS
CORP.
}τ^N^8区IN5τ同uM【NτS
CORP.
■I I 一一
’
=’ 一 ■
d二
1
黷h=一:
■
』r;
一
’ , 一■
一 ■」
E’ 一
川‘
l
I
’
■一=
■
一=
:
@一一 ’ 一
斗
■一
:†=τ一
’一 一一
’
hI’
.一 一I
一’
?
.
一
N
「;=
一’==一一
. ・ ・、ll」
目.
U
1「:
一:
二一二.
.一
。 一
一
?一 ’
’ ■一■
.
@一’
I,
e ’一
」
.■’’
■ 一‘
o.=
_=
■
■一
一
一 . 一
鼈
’・’
@’ ’’1
・’
’
■I一
1=一
’ 一
一
一■
」1一
’ 一II【.
@ ’ ’,■I
?’一1
一 ■’■
・
I
ハニ・j’
黶O1■
@ ’一■■
x==二
1
@■
、..二
一
一■
」一.!」.’
I
■
I 一’
■■
■
止
@‘ 1 I
1
D1.一二
’
.一
’I■
一’
h■■
. ■
●■・ ■
’ 一 一=
.二…一一・fr害‘’:
i=’.
一
:I;一 ’
■
’
@.
’■
1=
?・ ’ 一一
一’.
一一’
D‘1一⊥
h■ ■ 1
■ ■■
.=一=一
’
@’ .一
I1
8
.。’I
・ 一 ’ ’
;===Ij=一’i’==
」一■ ’ ’
I’
一
一 一
j==一 ’ . ’
■ . L■ I
’
@■ .一
=:寸二
一
■■
え:; 1二11
’
一 @ ■’■
一.■
。
。=。。:
。I一 一一
’
τ=
一 一
■I
@’^I.
一
@ 1 1.一
’一
一
’ ’’
@’
一 I ■ Ll ’’ 。
■
@ ’ ・
一 一1
。 一 I
■
一一
@ 一 一
?一’一
黶。 ’I
。』 ’ I一
一’
f■一’
v一 . 一
■
一 一一=
∴黹ム.’
‘
f一
.・
@ 1 ’ .
一■I
’
f ’ 一’ I
一一 一’
’一1
f’’一⊥
■一
@ 1 ■■’
’I一 ・・I一
一
■一一
!_一■一 一
コ=.. ■I止
’
一 一 ’’
’’’ 一’
:.。一≡
■一一
’一
@一 ■
@」 o
f’■,
@ ■ 一
.= 1=一。1’一
ff ’ I一
は
一 1
■ 一
一’一 ■
■…i 舳τ^N^8E・”STRUM[NτS OO
員=1
I ’
’ o一 ’
’
鼈?
?
■’
ニ
’
鼈
ザ{
一・・■
@I ’
;」.こ’』’
1
,I一・
f】
f
’
‘ ■一
I.’■’’
一1
@一一一’ ’
■
【.’
’’ ’‘
’一
@一 .
■ 一I . 一’
@ 一■
.::’=’=一:、I 一一■
。 ■一■
f ’
@一 一
f1’ 一.一一
■ 一’一
一’
■昼… 讐至
’一’^’
。 . ・一
一’ 一’
? 一一■一
. ’ 一一1
≒…:.……;
? 一 一,
二三二
一
■ ’一 ■
’ 一■
潤。一
黶。一
D’’
■ I■ I一
一
一一■
.’1 ・■
コし 1一’1 、一一一一
[ 一 ・
1
一
:一二’=二」‘’
I一’ ■■
^
一■’I
」三二.壬
@一■
黶f一一
.. 一一
@’
一
■’一 一 一■
■■■
■■
@’’ ・1一
?一 ■■一
一一
黷P’ ■ I
■
。’ ‘一’
・ ■■一
@ I ■ .一
@ 一 ’
一一
I I■一
。■一
一言
@ 一’ I
一■
?
f’
一
f ’
‘ 一一
…三{
一一’」’二I“
1山一
D■
’
■二==I一
・ ■■一
一一
@’一’一
@. I’
@
l
.
@ ■一一.■
。 ’
咋・≡三・三1
1」’」I・
@■I ■ ’
. 一’I ■
■
=■t。
。一1」
■ ’’’
一■’■
(=)≡≒… …÷…
│ L
RY目11
Tab1e
Conditions
9−2 Exp er iment a1
Fi9.9−9,Fi9.9−10
Sa㎜P1ing tine
feedback gain
△t=6.O
△t・9.5 〔msec]
[㎜SeC〕
K =diag.(64,64,64)
P
K :diag.(32,32,32)
V
Initia1 condition
Fig.9−11,Fig.9−12
[Nm/de9]
[N㎜sec/de9]
(θ1(O)・θ2(O)・θ3(O))・(O・O・O)ld・・1
(61(O)・θ2(O)・63(O))・(0・O・O)[d・・/…1
G =diag.(64,64,64)
[N/皿]
G・diag.(32,32,32)
[NSeC/㎜コ
P
v
(X(O),Y(O),Z(O))・〈O,O,O) [㎜]
(θ1(O)・θ2(O)・θ3(0))二(30・60・150)ld・・1
(X(0),Y(O),Z(O))=(O,O,O)
[㎜/secコ
ぱ)
べ
Time of ter㎜ination
Desired trajectory
T:1.1
〔SeC]
T:1.8
θ。i(・)….・(・一・(…))(…)2
[de9]
〔sec]
・。(・)・・。(・)・・。(1)・・.・・(・一・(…))(…)2
{i・1,2,3}
InPut lI■odification
α:1 〔sec/deg], β=O [1/deg]
〈=diag。(32,32,32) [N㎜]
[㎜1
α=1 〔sec/m], β=0
A=diag.(32,32,32)
[1/m]
[N]
9−3−3 加速度信号による入力の修正
加速度によって入力を修正す盲学習プロセスを同じロボットマニピュレータに適用す
る.このとき,出力を速度信号として,微分操作は(9−2)式の差分形式を採用した.
このときのシミュレーション結果及ぴ実験結果を以下に示す.なお,計算機シミュレーシ
ョンはルンゲクッタ法によって求められた.
(a)シミュレーション結果
(関節角制御)
開館角で目標軌道が与えられた場合、特に、修正ゲインAを適当に与えた場合について
のシミュレーション結果をFig.9−13に示す.このときの条件をTab1e9−3に示す.図
中kは試行回数を表わす.また,ロポヅトの物理パラメータはTab1e9−1に示されるもの
を便用した.次に,修正ゲインAを理想的に慣性行列そのものを与えた場合のシミュレー
ション結果をFi8.9−14に示す.Fig.9−13及ぴFi8.9−14よりシミュレーション
の条件は,第5章の理論的考察が示唆する如く慣性行列そのものを修正ゲインとした場合
の方が早く目標軌道に収束することがわかる.
(作業座壕制御)
開.前角制御の場合と同様に,修正ゲイン〈を適当に与えた場合をFi8.9−15に,理想
的なものを与えた理合をFig.9−16に示す.また,シミュレーションの条件はTab1e9−
3に亦す.
(b)実験結果
関節角で目標軌道が与えられた場合の実験結果を月g.9−17に示す.このときの実験
条件をTab1e9−4に示す.
一98一
θ
θ
rad
(。。。〕
〔舳d〕
0.3
θd
・O.4
K巨5
K曽s
K;4
O.3
一(=3
K列
K;1
O.2
1(目3
O.2
K目2
ω
o.1
⑩
K.2
x□ユ
θ
d
0.1
0
O.2
O.4
0.6
0.8
t
〔SeC〕
一〇.1
(b〕
Plots of Ve1ocity Trajectories
0・2 0・4 0・6 0・8(。。。)LO
(a)
P1・t・f・P・・iti㎝T・・j・・t・・i・・
Fig.9−!3
一Si㎜1.ti㎝R。・ultinJ・int一・ng1・C…din・t・・
Th・g&in㎜・t・i・Ai・・㎝・tanL
θ
0
rad
(rad)
(・)
0.3
θ
日eC
d
0.4
K=5
K□4
←一θ
d
K=5
K=4
0.3
K−3
K;3
K’2
K=1
0.2
O.2
K■2
H
O
o
0.1
K’1
0.1
O.2
(SeC)
一0.1
〔b〕
0.2
(a)
0.4
0.6
0.8
{。。・)
Plots of Position Trajectories
P1ots of Velocity Traj ectories
一i.0 t
Fig.9−14
S imu1at ion Resu1t
in.Joint−ang1e Coo=rd−inats
The gain matrix
A=Rlθk(t〕〕
X
0.
(m)
K=3
’X;2
K≡4
K=5
0.
0.1
(a〕
0.2
Plots of Position Trajectories
0.3
(㎜)
y
in X− and−Y− D i re ct ion s
トー
〔⊃
トー
!
0.3
(m)
K苫4
K;5
K=3
0.ユ
0.Z
O.2
O.3
(㎜〕
y
K;2
(b〕
P1・t・・fP・・iti㎝T・・j・・t・・i・・
Fig.9−15
i撮 Y− and Z− Direct ions
Simu1atioη Resuユt i逮 Task−oriented Coordinates
The gain ㎡atrix A is cOnstant。
O.5
(皿)
K=2
‘’1一ト3
ピK;4
O.4
O.1
〔a)
H
N
0.3
0.2
Plots of Position Trajectories
〔㎜)
in X一
γ
and Y− Direction・s
O
0.3
〔m〕
1(=2
…。’
O・2 K;3、;、 O・31・〕y
0.2
(b〕P1・t・・f・…干i・・…j・・・・・・・・…一・…一・・・・・・・…
Pi g.9−16
S iInu1at ion Resu1t in Tas k−oriented Coord−inate s
−1
Th・g・i… t・i・A=R/θk(t))J lθklt))
Tab1e
9−3 正…xperimenta1
Fi9.9−13,
K =diag.(。1.0,1.O,1.O)
v
Initia1 condition
Conditions
Fig.9−15,
Fi9.9−14
[N口sec/rad]
Fi9.9−16
G・diag.(1.O,1.O,1.O)
V
[NSeC/m]
(θ1(O)・θ2(O)・θ3(O))・(O・π/2・π)1・・d1
(X(O),Y(O),Z(O)):(0.4, O, O.23)
(δ1(O)・62(O)・δ3(O))=(O・O・O)〔・・d/…コ
(θ1(O)・θ2(O)・θ3(O))=(O・π/2・
1
Z
3
[㎜]
π)[radコ
(X(O),Y(O),Z(O))・(0,O,O) [n/sec]
Time of terIIIination
丁讐1.O [sec]
T・1.O [secコ
,一^
◎
ω
I)esired trajectory
θdi(・)・・i(3−2(・/T))(・/T)21・・
〔rad]
・1:O・3・
・2:1・27・
・3=2・03
・d(・)・O・4(3−2(・/T))(・/T)2
Xd(t)・Yd(t)・0
[m1
{i・1,2,3}
InPut 皿。dification
一1.O, 1.5, 〇
A:diag.(O.5,O.5,O.1)
A=R(θk(t))
一へ O.2,
O.1, 一1,8
A・・(θ。(・))“一1(θ。(・))
Start
§tart
二1一
鼈黶E一
一’.■■
’’.‘し
O・三一1ユ
P」・・
O11j一
黶。 ■. ■
f三三三一….手1一ド ニ==に 1」[。一
h ■ ’ .
黶。‘■・
o
一■.・I
:=【一
f一‘_一.
fビ
■’. ’
.一■.
{:吾:
.二=:=一
皇
妻1隣
P≒1…
D
r.一一二一
’一■I
L三一
」I一一
. ’ ■ 一
w.
■ 一 ‘
!=:一」
1…1」1
1111
{i:』
■一
=’:
二、
苛
;∴
勺
.一1
c三11一,ミ
二1一!’
1…ll
P−1
■一■‘【
1㌧ 1㌻
㌻
D一■
.:=一
B’
1丁’j.;.
`1’
…1…・1
v:
撃奄P丘。..■一
゚.一丁
■11一’ I
τ’
匡.
I’
;:・=
{==二
1〕
一=I1..=∫■一.’」■
【I.:=一
サ.!
・:…=・…
戸.1
∴
三ミ・..
=D.しi÷.1■・■
1+
汁.珊
ミ;÷
ポ=
::二1
u
並
二{.1.三
・1.■
=一
1一一
Ij’=一三1
G
’‘一.
E;’=
・=ギ.
I −
0
■
ピ1三:…r’’
=.=二:
F==「
’
1■に
一■
・
一 一 .」‘
1I:一.
1」1}1.
■■ .一 ■
1[=:
・=i・:三
三;1;
1:一
:’一=二
1.三…ミ
∴一.:=一
.ll・1・;
=v三1i
.:二:1■:一 ’
111.1
,
.
{』
い■111111
F;Il
1:.■
・ ’ ’ ■
=!.
一』■ 一一I
P;」l11一一
1−1=、=!
ピI
=し
鼈鼈?‘ ’
r1一ミ1=;i・
一.’
パ’=
F
。
■ ■ ■
=一一.r
一 ■・.’
;一一=
11、
F二。」
三111=・
L1一」
一:.
’I−
…=
o
二…1
:■i
Iい1
.:一
p111ド11
一一:;
ニニ1
1・、
d
1{l1
{.一ギ1
⊥.
゚■1
U紅
P一
P11
ll二1
li.
P11
’
■:’‘■
I
I:≡!・
トニj.
’一一
{・=・1・三
1−1
=.に=’
E ■
..
ッ.
、
・1
杜
出
1:二1
∼“
1一一一
一一」’
」
L’I■ .
li11
Pい1
P1
一…1
P:一:
1111
lll
撃P11
::’1
。一
lI
111
」
・1;I
11一
■一
’一
:.:3「
.1・1111111
撃戟G;
し二
:1111グ=llll
i1ミ11・.=
1一
O11.
」一、一
;1二11≡=
111;l11・=
ピ11
p1
11・い
111・
1い1
1’〕
1111
P111
1一∴
∵1’
撃戟E;
i..一.
秘 o1
∼1’
壬
I
Iい1
」=
11−l1
1:=:
;・…ミ;一・二
1111
一’.’
h.11
一’ ■ ■
一 一
11
1.i11,11=
=1一:
1111
=’:。
P1
1.
↓
1・・‘
I
二
l111
!:’’
一一
ll;1
1デ1
冷
州1・1…
…・傘・三.・.
ll−1三
;I11:1・・丁1。、
11.l1
一派
1・・1=一
…l1亨…
景;.j..
百:
11
ま1;1..1‘.:
l111=
1ム
一1汽
ガ1
・一1一手1■ド.■;.
三÷・一
{・デ.;:・
・
P」
≡一
■.・■
D二:■」’■’一■
一,一 1I
一’’
│1=」}≒一
1
I ■ 一
I■」 ^一一
‘一
I 一’
。.’:
P一二1一一;’
11−11
1一’ 一
..’
ッ
w一
獅P
堰f
11;
c’111.11
1:■・’
■jlい11
ド・・’
コ
ユ.
Dllt…
r
:1
ll11…}
一ト1一
汀;一。。:一;;1ミ
I−I■一一
h’一一’‘一
0・
oα
一.工::
u!一
dll:一
i一グミ
r:
省
『一
I
P.1
=I
.ll.1−1
汽三
山1‘■■一 ’
・一
1一
■
1111
晴
1{壬1ミll
一
TRY旨1
一い
1111
11=1
いい一.⊥._王.
べ
一㌻
P上11
一一’
=.一I=.一’
1■一
11;十三11
≡・三11’
1111
llll
1一。1:
:」1.1≡1≡≡.
=一.==一一
壬=・
Ilr
と1;11二1:
黷「
1リ≒
.止:.:
.1=1I1÷1.三ゲ
1一
11三.1
オ1
.1携杣・1
ポ11
==.=
ll…111.
1=11
゚.1:1−
P一!I’
B..■一=.
し…1二
P−1→1一
1τ’三
P二11
u:=「
二’
■丘二.
P㌦
11111ド
」i.一..、’一一一
’■I.
ll..
し1
:t:!
’
撃P11・
1=1−
芋
1
!’=■
}111・
.1};一1
11メ
I=..
Iグ
Illl
v:’
1一L。_.一
i:一
111
1ヨ1。
;1!1
1ピ
111=1い」㌧.1!・.一.!.1【.一一
!11・
;牢
1111.
I.
ッll・リ…
。11
jl=1
1一
1・1!
sRY;4
TRY;4
111。
一1・い1
■■’I■
■ 一一■1
I
叶
也
≡’■一
li
i11.
g1=
.。≒
..
一
TRY=6
Pig.9−17−a Bxperimenta1 Resu1ts in Joint−ang1e Coordinates
黶OI■一一
ロL.一し
Start
・↓St・・t
「
「
一一一. 一
一
。I■一【1
」….三一∵一1・1二i
.
■
一
P−111
・!1,1
■.一■ ’ ■
‘
’:ll
一1業一
一1
一 一
・
}’
11111■1
一一‘
111=i1
I 一 一
’
f
⊥_
f’
’1=」一..
^
F一=.
=Ii」1
↓
;」Iリニ1■1…
:311
■ .’ I
P11一
11‘=
Fi−i
1;11
■11
G,一
一
=三i1
一一
一
黷h
■
..=‘.
「11
’
’ ■
s
c1i1
■
・一■ ■’
一1
1−11
=1;..
D=ll
11’
’
■
11.=
1;1
’一
=■’一
一!1:一1:一
1111
’ 一
一 ‘一
P1
1一
一
」
黷「
’
=1=i
=:1
D=1:
‘
1
■ ’ ■
■一 ■
I 一
鼈鼈?’ ’一
h
P’
」
■
■
■ ’一 I I
撃P1
■ ■
.」_二.
三1ピー
一
@一 ■ ■
一
■
■
■
’
E:・=、一…」三
■ ■一I’
■一一
D ‘
I
仁■
十
「;ド・
・=1:
.
≠P
1一 一
1…j.1・
E■=.
■
1一一==
撃撃
。
f一=.
I
I
、. =u
1=1.■
u
’1.=
=v==
■
一
・1
一
.1■’
.1=.
≠P=l
一1
一 一
I
1一.1=一1
rlピ
一≡=一
≡1:一1
@i
’
丁
1・…11
.=…・=r
P−1!1
■
。 ■
P
二1.’1
.「■=
・■・一
.j
一
籔:†.一
1
.1 一
一
L」
■ ■ 一
・{
==
D=二、一二
黶。一一皿
一
’
?‘ 1
■■
li11
I一
■
ニニ.≒:.
1■.1
_1.:
ニニ⊥’
二」、..一
■ 一 ’
1
■
I=
I
NU
P
≠P一
DH
■
≠P=
=∴黶
.1」ll
’
F旦.1=
1一一1丁
黶F:;
。一■ 一一
_=:一=’
1
⊥
潤A一
■
一一
篶11
‘一.・ 一
o1
潤El
’’ ’
? ■
!11==一
一1.==
一一
I
1
■
1「
∵j
’1・=
. ’‘
一==
=F,
I
I一一、.
1
.1{1・
Gr’い
一1−
い==
一.;..!。
11’’.一
.j−
グ」1
Pい
」l11
1;
1;リ。11
1111一■一一
P−1
u1“
因 舳f^N^8E1NSTRuM一≡ト
ミ1.・:
一ド1・
゚一
P1=.
==い
P1!
I:・..一’’」=・
一:・三:・一・一{三
一
=l11
│i1
一.一
≡11!.li一
P11・F}
(11!..
・;…一三11
1・’=一11:1’
lil・
P111
川一
∵1一
!
!:」Iij・=’
1ヨI:
ll
E1・1
→
=グ1
11’二
1ψ Eパ
・=.‘
一1111
一{{ミ;
=lllIい
1川
P川
一リ1
1≡1≡
、一・
窒P11
1=…一・・.・=
11−l1
I.I
.1リ…
一.1;.
t
’●■一
÷11・
]一。
:仁.
=!:一
≠P
。1111
1’ド11{
梶E
1:i1
撃h」∫1
.l1.≡三一;1i1
│1I.[1
州
1;i
i
一!1I
,j..
パ〕I
=D1=1
リ
1.
o.
oα
」!1
ユ
仙
ヨ1.1
一}一11土!・1!1
11リ
i
一=1Tl
川1・;1
一1三1一
一 ■ 一
一.
x1.一’
一■ 一■
一
1一ギ・・:。
■
一
I
−
梶E1一
1ギ1
■ 一 一 ■
ll−1
i=
ポj.i
F1
11..
・1.ll≡ll一=
凸’‘一 F
;1に
;≡’
;11;
111−1
リH
i
TRY目10
’’.一
iポ」ill
1:』
・i
一
i吾
ii
⊥
一I
1王
P
■
’’
P↓
;!
舳
11、
、..1付
1川
O一三.」一
.I
.:一二..
G!11
I
一==二.
={一1…
=IH
Pミ1
糊山TRY目10
二
I■
c…’…1.1.’
・ト・」
I1・グ
I≡・
一1
。 一.
l11三」
A
↓LIi:
!三’
川11一、1
一 ‘ ■ I ’一■
一一
I 1 −I
v ■ 一一
P1ギ
1÷」1
・ll=l1・1ピ
三一
■
11.115−
1!
1
’.‘
hニ」・・1ポユー
■ ■ 一
三リj.■=
_..’= {・:=1二
■1:
!1
k
.・
.「
㍑}。
B“
1.
1.
.!
一.一’’’
h
≡リ
Ell−1
.. 一1
1[j1I−I;1一
■
li.≡.:
1il一
〃.
1舳川
舳
? ■
■
‘
一一_..」......
1一
一 1一」 一■止
TRYま一17
一=」止
一. 1
≠奄戟D
■ 一
一:.1
h■■皿1■
TRY目28
Fig.9−17−b Experimenta1 Resu1ts in Joint−angle Coordinates
一一止_一。
’
Tabユe 9−4
1…xperi㎜enta1
△t=6.O
SaI■Pl ing tiII■e
feedback gain
Conditions・
[回SeC]
K =diag.(6.O,6.O,6.O)
[㎜歴/de9]
K =diag.(6.O,6.O,6.O)
[N阯sec/de9]
P
v
Initia1 condition
(θ1(0)・θ2(O)・θ3(O))・(O・π/2・π)[d・・1
(θ五(◎)・δ2(O)・δ3(O))=(O・9・O)[d・・/…]
Ti■e of ter■ination
Desired trajectory
T=1.2 [sec]
θ。i(・)・・i(・一・(・/・))(…)2[…1
・1:67・5・・2=45・P3=67・5
{li=1,2,3}
InPut □odification
A=dia9.(O.1O,
O.12,
O.054)
[H園。。。2/d。。1
一106・
9−4.ロボットマニピュレータ(2)
9−4一■.実験システム
前節で使用したロボットマニピュレータ(Fig.9−7)と同じ構造の3自由度のものを
使って,実際にロボットに図を描かせる実験を行なった.ただし,この場合のロボットの
物理パラメータと概形を各々Table9−5とPhoto9−3に示す。全体の実験システムは速
度信号を測定するタコジェネレーダが取りっげられていないことを除げばF i g・9−8
に示されるものと同じである.従って,ロボットの運動は各関節に取りつけられたポテン
されるものと同じである.そこで,各関節に取りつけられたポテンショメータから関節色
変位を測定し,角速度は(9−2)式の差分形式で求めた.また,手先にはロボットに図
を描かせる目的で,ペンが装着されている.制御入力は(9−4)式のように構成し,作
業座標で目標軌道を与えた.また,入力の修正には第4章で述べた位相進みの方式を用い
た.
Photo.9−3
Photograph of
the Robot Manipu1ators
2I(kg・)X
Link No.
・(kg)
1
1(m)
S(m)
2工(kg㎜)
0.63
h(kg皿∠) Z
(
0.022
2
5.4
0.40
0.13
O.062
0.052
O.013
3
3.6
0.40
0.17
0.046
O.041
O.0048
Tab1e 9−5 Physica1 Parameters of the Robot Manipu1ator
一ユ07一
9−4I。一
2− Pヨ車厄i首
Fig.9−18に示されるような45度平面上に直径20cmの円を描く目標軌道を与え
た.このときの実験結果をFig.9−19,Fig.一 〟│20,Fig.9−21に示す.Fig.9−
19では各方向の位置と速度の誤差の2乗積分値を表わし,Fig.9−20てば各方向の目
標位置パターンと実際の応答及ぴ誤差の推移を示している.また,Fig.9−21に実際に
1コポヅトが描いた円軌道を示す.なお,この実験条件をTab1e9−5に記載する.
9一<1一
3. i董:糸衆車九i薗
x−y平面(水平面)上でy方向に25cmの直線を描く目標軌道を与えた.このとき
実際にロボットが描いた直線をF i8.9−22に示す.また,実験条件をTabIe9−5
に亦す.
■
φ
回転角度
■
45。平面
上面図
45。平面
Z
し
0
X
45。
77 / /
側面図
Pig.9−18 Structure of Bxperimental System
一108一
T
も
Pig.9−19−a Experimental Result
Integrations of Position ]ヨrro「s
O
ω
in X一,Y一, and Z−Directions
も{
N9
O
㈹
Z
y
。∴
123456
TRIAL
O
岡
7 8 9 1011121314
NUMBER
Pig.9−19−b Bxperimenta1 Result
Integration字 of Velocity Errors
孔∼
in X一,Y・,and−Z−Directions
口9
○
Y
乏
伺ヌ
O
1 2 3 4 5 6 7 8 91011121314
TRIAL NUMBER
一109一
ボ七a汽
↓Sta「t
!br二ar=
》
=一一二___1…≡≡≡…子≡≡≡≡
=二一 ’一一
1Iま’ 工
.二
I }目1’^固^8
Sτ日u……はτS OO月P.
^. _
」
萎…塾3.一一目§進1…一1妻=、 .
OH^R
J:1
↓Star=
↓S七ar七
↓S七a「七I
喜一三軍
・一…茎…ヨ…
…三1頃暑…1…
妻季糞…1萎
預=露
.^Rτ“o、
美嚢1
…葦亙§
暮義一茎葦
萎…姜……
J・3
Pig回9−20 Experimental Result
Position Trajectories and−B=rrors in
一110一
X−Y一
, ,
and−Z一.Directions
↓Sta「七
・ε
ドt
ザt邑「二
義婁貞…
熱.産姜…一望葦葦茎
……誠一一・一
憂華美
膏…葦…≡三三三一’吾……1……1
簑
一露・≡饒’萎
CH^
』一■
■O.OP64’R
c岱3一
茎董婁蓬…
SeG…1一
」:5
ゼa「七
S七ar七.
↓
↓sta「t
奉筐麹
;6I妻妻
’≡≡…正≡
目
J二10
Fig.9−20
一111一
0……≡……震…茎…
善、二.姜…………奏.葦…二
隻……ヨ;…一ミ…
一三。=’烹……・…言一
萎自萎 茎襲葦
菱1ヨ薦鯖妻萎姜賓
↓舳
↓S七航
生鰺一=
嚢
・.茎斐葦一≡…………
三1……1妻…ξ≡…髪…
一己E
_一一
垂乗……一・一
三三…ヨ≡≡・. ■■
産蕊嚢蓬
・=.=一手玉≡r拒
姜蓬葦産
…寒α箔詞奉葦
目帖τ州^距帖τ則
J:15
↓S㎞七
ボ㎞七
↓St舳
萎葦言…
恕
斐1…調為験ξ
ミ棄妻1季
…三巨萎……1……
ヨ三≡≡王≡≡ヨ≡≡≡≡=≡≡≡≡ミ三三…≡≡≡;…
J=20
rig.9−20
一112一
一一一一一一一一一
@: D6sired−Traj ectory
: Practical Trajectory
、、一
¥、
’ 、
’
/
/
/
、
、
、
、
、
1、
、
’
、/
十
’
享
一 ■一
一
㌔
∫
㌔
ノ
㌔
㌧
ノ
㌔
吐一
㌔/
山
巾
’
ノ
㌔
/
←一Sもar七
o
㌧Star七
『oo瓦
100冊
」=1
」=3
煙戟A、
、”、
一㌔
、
!
、
、
!ノ4タ/㌘苗才1一山一は
、
/
、
、
〆
、
’
、
㌔
戸
、
、
、
’
、
Ax !
!
’
!
/
’
`1!、 ’』 ’ ’
’
’
←S七ar毛
f一一,
←
’ S七昌r七
rOc[
10o皿
」:2
」=4
Fig.9−2ユ ]ヨxperimental Result
一113一
‘一一’、
’、
’
、
、
’
、
、
’
、
、
’
f一
f、
.一
f、
』
、1
1
一
、
・、
’
’
、
一、
’
’
、
、
’
!
、
、
/
、
ノ
し
!
、
ノ
』
!
!
㌔
7.
’
1’’’’・
・
’
←Start
’
←S七直r七
10c■一
10c匝
」:5
」=7
/
十
,・
十
I
’
1 ’
・
㌧Sもart
ノ
トS1二art
1Cc正一
一〇c皿
J=8
」=6
Fig.9−21
一114一
」
一一・
f一
f、
f、
/
f 、
D’
十一
、
一
、
、
’
、
’
、
’
、
ノ
、
ノ
』
!
ノー
’
’
㌧S七訂t
←一Sもar七
10c固
10C固
」:9
」=11
’1
〆’1
x’、
、
!
’
”
、
一十
一
」
1
’
、
、
’
、
’
、
ノ
、
ノ
、
./
、
、
ノ
k
’
I一
1ノ
←s七ε=t
←Starも
「Ccr
「Oo皿
J:12
」=10
Fig.9−21
目115一
’
S七art
S七art
←
」:1
←
」:5
S七art
S七ar七
←
←
’」:2
」:6
Star七
Staテt
←
←
」:3
」=7
Start
S七ar七
←
←
」:4
J:8
100皿
St邑rt
←
Des ired
Trajecto1ry
」:9
Practica1 Traj ectory
一St畠r七
←
」=10
Fig.9−22
Experimenta1 Resu1t
一116一
Tab1・e
g山5
這xperimenta1 Conditi◎撮s
冒i9.9−19, Fi9.9−20, F1
△t竃7,4 〔眠s鈍]
Sa㎜P1量ng ti㎜e
舳L
feedback gain
G =dia9.(8.⑪,
v
Initia1 condition
8、⑪, 8.O)
?A7。、
256,
256)
[NSeC/㎜〕
W.O,
W.O)
〔㎜]
(X(O),y(O),Z(◎))=(O,O蓼O)
@ (X(O)宰Y(O),Z(O)):;;(0。◎,O)
[㎜SeCコ
[N/m]
(X(O),Y(O),Z(O))=(O,O,O)
(θ1(O)・θ2(O)・θ3(O))・(O・48・151)[d・・1
iθ1(O)・θ2(O)・θ3(O))・(O・48
ド
△t=7.4
Fi9.9−22
(θ1(O)・θ2(O)・θ3(0))・(0・
ニ1(O)・θ2(O)・θ3(0))・(0・
iX(O)。Y(0),Z(0))=(O,O,O)
^
〔m/SeC]
〔N/㎜]
mNSeC/皿]
[m]
X0,180)[deg]
m皿/SeC]
}一
・■
Tine of ter皿ination
丁雪1.4 〔sec]
Desired trajectory
Xd:Z8い・亘識捗
丁竃ユ.4
o一^
Xd(t)・Zd(t);O
,^9。
W・・。2・(・一・(・/T))(・/・)2[㎜1
f 。 、 ^ ^一 ’^ ’、 ’ .
Yd冨。・玉…州・z l㎜1
φ(t)・360(3−21t舳(t/T)2
InPut ㎜odification
δゴO・24・
δガ0・241
δ3:O・18
[SeC]
珀’
’o,、 、
’ 。
「
〔d信
[S眺]
δゴO・24・
δ2=O・24・
δ3・O・24[…1
9−5.ロポットマニプレータのカ制御
第8章で提案した位置と力の学習方式が実際に有効であることを9−3節と同じ実験シ
ステムを使って示す.一般に,工具にバネを取り付け,力の欠ききを位置変位としてとら
える場合には,バネによって動く方向と力制御方向を一致させるためにロポヅトの手先の
姿勢を制御しなければならない.従って一般には6自由度以上のロボットが必要となる.
しかしながら,力制御方向を鉛直方向に限定するときには,Fig.9−23に見られるよう
な鉛直方向にバネを介して動く作業台と3自由度のロボットマニピュレータによって作業
を実現することができる.便用したロボットはTabIe9−1にその物理パラメータを記載
したものである.また,作業台のパラメrタはTab1e9−6に示す.力信号については,口
承ットの手先に付けられたカセンサーから取り込まれる.(1ヨ本アドテヅク製,3分カロー
ドセル)また,各関節の変位及ぴ速度はポテンショメータとタコジェネレーダによって測
定される.
M3 ・
ノみ◆峯!
θ2・1一
ト、、M・鉾57r
θ1’Ll
Fig・9−23M・・h・・i・・1St…t・… fE・p・・i皿・・t・1Sγ・t・m
T・b1・’9−6Phy・i・・1P・・…t・… fth・M・・i㎎T.b1。
L4川
L5回
0.6
0.3
M4[kg1 KWm1
1.8
250
一118一
T
この場合は作業座標としてカ}テシアン座標系をとり,ω:(X,y,Z) とするので,
入力Wは次のように書換られる.
麦d(tト麦(t)
xd(tト・(t)
GP
十G
v
yd(t)一y(t)
シd(t)一シ(t)
十τ(t)
W(t)=§(t)十
・、(・。(・)一州)一・、あf(・)
(9−5)
ただし霊・産・・、漫・2x2里興産・・、ε・1x王であり・・ピ。{は各・・壷・方
向の目標位置パタ㎞ンとz方向の目標カパク一ンである。入力θ)修正に便用される誤差
は,
「
1
㍉(tトXk(t)
・㌦(ト
バ(・)吋。(・)イ(・)葭A徴3x3
yd(定トyk(t)
(9−6)
である由担しk固目の試行時のX・Y方向の応答を各々x k・y kとし・Z方向の力をf
とする.また五力の微分誤差信号は(9一・2)式のような差分形式で与えたヰこのような
制御方式によって次の2つの作業を行った.
実験1(曲面の研磨作業)
高速な運動パターンで1司時に力の目標パターンを実現する例として,曲面を磨く作業を
ロボットに行わせた.一
?フ的には,作業台上のウクレレに肺。to9−4のように接触して
いる状態から次のような目標運動を与えた.
目119一
・d(t):yd(t)=O・
・。(・)一一・・(・一・(…))(…)2・
O≦t≦T/2
・。(。)一、。(・)一一・(・一・(…))(・一・(…))2・
(9−7)
T/2≦t≦T
fd(t)=.6・
ただし,原点はFig.9−24のA点に取り,座標系はFig.9−24に示される方向にとる
ものとする.これは,実際にぼFi8.9−24のA点で8Nの力を加え,その力を保ったま
まB点まで動かすものである.この目標運動パターン及実験における実際の応答を,Fig.
9−25−a,bに示す.また実験条件はTab1e9−7に示すものである.
この作業では,A点を過ぎた後上下方向の(Z方向)の形状が大きく変化するので力を
一定に保つことが難しく,1回目の試行では大きな力の誤差を生み出している.しかしな
がら、試行を重ねるに従ってほぼ一定の力で加圧することが出来るようになり,位置パ
ターンについても誤差が減少していることがわかる.
Photo.9−4 Photograph of Experimenta1 System
一120一
V
(る/
.、イ
令
B
/45deg.
X
./
/
“
○
Fig. 9−2卑
C00rdinates and Direction of the Desired Motion
「
一I
一.
lII
ポ:1
i・
一
グ.
xd
’一一I・
一8
1
■^’
(C㎜)
’一
1一
1110
\五
1’
1111
...二
一■.・
一I
’■ 山
.1一一
二.’・
7丁
]
:丁.1
.I
e.
P…
・…
十
↑口
・1
一 I ユ
1一≒1
1’
ゴIo
∵1
一’』.
[
十・・千一二
j..1
・’
:!・..1
’■一 P」
ξ
’=1
・;
ユ0
Iソ
一‘’
一『・
■1’一 ‘・
!
yd
一ユ
…一^・
e
,
一8・
i
’■
・
一
一‘
■
’一
I’
向■
一■
I
o’
1.二
∵T
一
⊥
2sec.一
(C皿〕
一丁’
0
fd
,
」
‘
4
一
…
一6
.L
」
一.
Ψ
1・1・
1
一‘
一
・τ
‘’
D一’
’一
■
llI「
I’,
1
一
一2・
}一
■・
,一
(N)I
0
1一
T/2
T
Fig.9一事5−a
Desired Trajecto=ries of Position and Porce
一工21一
’1
1⊥.l1
1⊥.1.」1,P.
津
一
1■
甲「・
一’
、
E一
、・X
=fX、=. l1:」 ’ご
1’.
二
一戸
・’一
、
PI−
I
『n
士
1=ピ
1■…
il..
・’
,‘一
‘㌣.
・一
下・
ll:
ガ
8’
11・:
二ざ
’三=
三11・
一一
÷=
D
0二
1二1;
Dm〕
(Cm〕
」
6一
幸
’.
デ≒
一=1
D一
一
v..
干十
一甲’
一・
fゴ㌧
1.
撃P、一.
・・:、
1.1・
・ ’ ・
一1一
1
fi11.
・,1−
i・.・
1
撃P・=
E}
h
牛 1”
111い
一い二・
.I
.11=
1」∵・一
ゼ」:。
仁
戟D.
■1
’1一:・一
Oト.ザ
世
・二
P11:一ザ・
…蜘
・一
P
・1.1・
≡一….
一6
㌻:.=.
半
・=’
i
t
梶
ァ・ギ
・1.
、1・’一^
k21
l111+一1 :1・上11・、
1.・一1=
■L・
I寸…1
d
.一
k
.一
一.1....
i、
・」
U.=
A・・
「1
P.1一. I
、;1;叫
1
^’一一
;P−.’一
G.・二
」=一
L
㌣一
・・
1’
引・し〔o■’一
’1一…f,□
円・←一
D一
. 一二
一一.
i ll
i
. !
一・■
1 3o・・、
↓
1・・
…
,
・ll・L1=u’. ’
sI
;・I
、・=
ドー
一 ■一
4仁二」
:l111ポ1一・:1=I
.1
¥! !
1 【:〃」
黶E
一1一一.I一
(N〕
三……1
1.一
≡∵;∵
:二1
㍍
ドI.
1=・
一
u.、fリ∴9∫P・j 。n
(N)
り
}
1.l1・1:i一!1二.←
・
、、
0
C
I;≒一 堰f;
@;一
^
r二丁
1:ll
’二…
Tl−1一.
一.=
「1’
,ソ
N
N
山一
…
一I
?チd一γ
∵一・一
三∴二1j一
干=・・二1
’^・
!」
(Cm)
m)
1土佐
1’
.二j1†
.1一・1’∴
1一=・一
i.一. ・
’
P
「
}
ザ
.・
11
梶D≡、1.1.
...
」一’山
1一一
k・2
Fig. 9−25−b Experimenta1 Resu1t of Po1ishing
I
k口4
実験2(グライディンク作業)
グライディンクなどの作業では母材に食い込まないようにグラインダーをソフトタッチ
させることが問題となる.そこで,ここではロポヅトにグラインダー(日本精密機械工作
株式会社製,pen type grinder)を持たせ次のような目標運動を与えた.
・。(・)一・。(・)=一・・(・一・・)・2,
・。(・)・一・9・(・一・・)・2,
O≦t≦T/4
xd(t)=yd(t);一12t+1・
fd(t)=一21
T/4≦t≦3T/4
(9−8)
・。(・)一・。(・)一一・(・一・・)(・一・・)206・
ヂ。(・)一一… (・・一・)(い1)2,
3T/4≦t≦T
この目標連動パターンをFig.9−26−aに示す.これは,具体的には材科を多く削り過
ぎないように力と位置を時間の3次関数で与え,徐々に加圧しながらグラインダーを動か
していき(Fig.9−26−a,c点→d点),一定遠度,一定圧力でグライディンク作業
を行ない(Fig.9−26−a,d点→e点),3次軌道で減速減圧するものである。(月
g.9−26−a,e点→f点) このときの実験システム全体と手先のグラインダー部分
を各々Photo9−5,Photo9−6に示す.また実験条件をTab1e9−7に示す.実際の位
置と力の応答はFig.9−26−bに示されるように,試行と共に目嬢パターンに近づいて
いることがわかる.
9−6
糸苦言
本論文で提案する学習制御が,理論的狂証明のみならず,実際に存在するロボットマニ
ピュレータに対しても有効な結果が得られることをいくっかのシミュレーション及び実験
を通して明らかにした.
一123一
Photo. 9−5
Photograph
of Experimenta1 System
Photo. 9−6
Photograph
of Force Senso=【・
and Grind.er
1+
1’
u
十
・ザ・;・
111
ゾ1.
.1,1
f
I、
。二。・
一II
?E
皿)
キ一1.
P
一1−
一
1’一
1
一一二一
Fig.9−26−a
.一
D.
■
I一
P一!
上げ
‘I
.ゾー
・二1
.一
P..
.、..
v
・‘一一
.;一
f1一
0
・ト
’†巾
1一
γd
一
・一
;1・
一1二
一.l
Xd D1。に
’
(Cm)
千1
「
I . .
.
十・
■ 一
一・’
「.I
=“
1…
−10一一・
一
‘
(Cm〕
一’
_L.一 T’’ピI’’=一
2sec.
...
I’
〕1
「
一一
I・ 一
・’一
1’一I
「
.1
一十
i
f
d
一 一
I 一一
【,1〃● P1.L一“i・
D._.一
O
一
1.=;
│’・・
一
…・
↓ ¥・・十
一・一
一
I ・一
1一.
−12
〔N)
1
上i
0
T/4
二.一
二1・
■ ’
. I ■■
3T/4
Desi=red.Traj ectory
of Position and Force
.
T
一124一
⊥〕1一_ll.
U}ぺ‘.1ニ
一
’
A.
・
・・’■
レ1
I
・
壮
↓
l l
1:
、」ニミL・’い・1’1
一1.
ア’・r 一一’ 1 一十}一
…㌧士
@ ミ{■「、一一.τ山
(Cm)■工.
Q十ゴ竃二土
士亡
^‘■
0
.上
¥ドゴy一
’ふ_
P↑一斗上i岬戸・
: ‘i
一1.i−1・一1
τ法十}・・;… 1_一
梶Q∴]⊥二L
1’一 1一I’
12
h一
・一‘
早
丁下丁
T
撒
一
lc一・’一・
斗
川[じ【仁」I.r
一
一12一
I
・一
Pリ.
P斗÷一丁;・1上二、.ll「
j 1
’
^
’ ■
・
I
・
■・
心
lI一
J□
S一_
1
@一.1
=1
;
.1
、⊥二世⊥rィ十
、7干…
A⊥ユエエ
‘・
堰D1.一
〔N〕一
k;1
‘
・
. Il
斗1
f
P
〔・ ■:、一r
1一
一
一一■一.’
P・
黷P
ヨ沖■
←
.・
1.
1よμドい一,1
1L
f一
P・:=・1...、
黶f一
ヤじ層ユ1 一
x.一一
I■†
.i
→十i
二. U二.
пf、キ知外
・.i
0
(・〕十
’
.
一
@..」 .ユ1」、=…μこ・、P =・㌧.’..・■ 山■.二 fゴf⊥ピ
期
I
w“,
/一〕
N
.ザ
一十}
O一
一
一
・ 一一
I
.十1.!。。!.lI−1
k22
Fig.9−Z6−b Experi血ental Resu!t of Grind−ing
仁
一 ’・■一」 一一
⊥
し
A;一十
・十I二■山・’.一
・一.・1
^
■
1
、..・
’ニ ニ。・.一一:二
k,4
Tab1e 9−7
E・p♀・i・㎝tま1
Conditions of Hyb了id
Position/這。r㏄ Contro1
Fi9.9−26
Fi8.9−25
SamPI玉ng ti㎜e
feedback gain
Initial condition
H
N
△t・9.5 〔ms㏄]
△t・9.5 [皿s㏄]
G =diag.(384, 384,)[N/皿], F =6
P
P
G =diag.(256,256)〔N/㎜], F =4
P
P
G :diag.(72,72)[Nsec/日], F :160[Nsec/1■1]
v.
v
G。・di・9・(64・64川…/皿1・㌦・160[N…/皿1
X(O)・Y(b)・O 1㎜1,F(O)・O [Nl
X(O)=Y(O)・・O
(θ1(O)・θ2(O)・θ3(O)):(O・O・120)[d・・]
(θ1(O)・θ2(0)・θ3(O)):(O・45・135)[d・・1
(θ1(O)・δ2(O)・δ3(O))・(O・0・O)1d・・/…]
(X(O),Y(0),Z(O))=(O,O,O)
[㎜],
F(O)=O
〔N]
[㎜/sec]
α
Ti㎜e of ter㎜inatiOn
InP口t 皿。dification
T=3.6
[sec]
α:1/17[…/・]・ β=1字/17[1/皿]
A」=d iag.(408[N],408[N],51/8[m])
T=3.6
[sec]
α=1/17[sec/㎜],
β=16/17[1/聰]
!\=diag.(272[N],272[N〕,17/8[m])
隻竃■ O章
糸苦言翁
本論文では動的システム(特に,ロボットの運動)の制御手法に学習の概念を導入し,
実際の試行を繰り返すうちに目穣の出力(目標運動)を実現する方式を提案した.具体的
内容について以下に主要結果を示す.
〔1]制榔対象を線形時不変システムとするとき,本論文の学習的制御手法と最適レギュ
レーダ及び感度との関係を示し,本方式のシステム論的考察を行なった。
[2]ロボットの運動制御てば目標運動からのずれを誤差とするとき,加速度誤差または
速度誤差(または,位置誤差,速度誤差,加速度誤差の組合せ)を用いた入力の修
正法によって,運動パターンの学習プロセスが,構成できることを理論的に証明し
た。また,これらの制御手法が実際にロボットの関節角座標及ぴ作業座標における
制御で有効であることを3自由度のロボットマニピュレータを使った実験によって
示した。
[3コロボットマニピュレータの位置と力のハイブリッド制御に適用できる学習方式を提
案し争3自由度のロボットマニピュレμタに実際に幾つかの作業を実現させること
によって,その有効性を実証した.
[4コ本論文で提案する制御方式が移動ロボットの運動制御に適していることを指摘し
た.きらに,実際に7自由度を有する実機の二足歩行ロボットに本手法を適用し,
高遠な二足歩行運動を実現した.また,一度学習プロセスによって獲得された入力
パターンから直接別の目標運動パターンを生成する方式を提案し,その有効性を歩
行ロボットの2自由度モデルを使ったシミュレーションによって示した.
一127一
次に,本論文で得られた結果についての考察及ぴ今後の課題等について述べる.
[1]本論文で証明した基本的な内容は無限回の試行後に誤差が完全にゼロに収束するこ
とである.しかしながら,実用的には出来るだけ少ない試行回数で誤差を有効に減
少させることが望ましい.そのためにぱどのように位置誤差,速度誤差,加速度誤
差を組合せて利用するべきかを実用的な立場から考察する必要があると思われる.
[2]第9章に示したように,実際にはマイクロコンピュータを使用して離散時間システ
ムとして入力を構成する.一般に,離散時間系では連続時間系とは違った性質があ
り,その意味からは離散時間学習制御法を提案する必要があるかもしれない.事
実,本論文では述べなかったが,離散時間系特有の性質をうまく利用した学習制御
プロセスのアイディアがいくつか提案され初めている.[44]・[45] 今後は,ハー
ド化に遺した離散時間学習制御システムを構成することが望まれる.
[3]本論文で提案する学習方式により,ある程度メカニカルロポットを知能化すること
ができた.即ち,ロポヅトに与えられた目標の連動パタニンはロポヅト自身が運動
を繰り返すうちに実現さ一れた.しかしながら.人問や他の動物の連動学習機能を思
い浮かべるとわかるように,学習能力によって目標パターンそのものが獲得さ一れる
場合が多い.具体的には,ある評価(例えば,エネルギーや時間など)を最小(最
大)にするような目標パターンを学習能力によって獲得しているものと思われる.
このように,より抽象的な目標を達成する学習システムを実現することがこれから
の課題である.恐らく,この問題を従来の制御理論の分野だけで解決することは難
しく,現在急速に発達してきたA I(人工知能),エキスパートシステム,ファジ
理論などの技術を導入する必要があろう.その際,ロボットダイナミクスをどのよ
うにそれらの技術に効率良く組み込むかが一つの課題となるものと思われる.
一128一
[4]本論文では純粋にメカニカルなロボットの運動制御という観点から運動学習につい
て考察し,人間や他の動物の運動学習能力については特に注意を払わなかった.従
って,学習プロセスの構成においても生体の機能との対応は考慮されていない.し
かしながら,たとえメカニカル1コ求ットであろうと生体であろうと,同じ物理法則
によってそれらの運動が支配されていることは事実である.それゆえ,何らかの共
通点が見出される期待もある.従って,神経生理学的な運動学習能力との対応を考
察することも今後興味深い研究対象となるものと思われる.
一129一
謁オ香辛
本研究を行なうにあたり,有本 卓教授,宮崎文夫助手には終始多大な御助言,御指摘
.また励ましの御胃薬を頂きました.ここに心より感謝致します.そして,論文作成にあた
っては,瀬口靖幸教授並びに鈴木良次教授から多くの御意見を賜わりました.厚く御礼申
し上げます.
きらに,門田良実助教授,玉城史朗助手には,理論的な議論に加わって頂きました.ま
た,実験用ロボットの作成に於では,林 清重技官に御尽力頂きました.ここに深く感謝
の意を表します.
加えて,実際の実験及ぴシミュレーションでは, 川村竜也君(現 松下電器産業),
藤野大助君(現 三菱電機),松林成彰君(現 松下電器産業),内田洋之君,(大学院
生),松森正史君(大学院生),山崎英生君(大学院生), 中山 敏君(現 松下電
工)諸氏に御協力頂きました.また,論文作成にあたっては,松浦貞裕君,(大学院生)
江口裕之君(大学院生),吉見 卓君(大学院生),上山健司君(学部生),中島靖之君
(学部生),榎本康男君(学部生)諸氏に御世話になりました.ここに心より御礼申し上
げます.最後に,ここにはかききれないほど多くの方々に学会及び研究会などで貴重なご
意見,御指摘を賜わりました.合わせて深く感謝の意を表します.
一130一
妻ミ考)之南氏
1 . H.Takegak i and Sugur聰 ^r i皿。to :A Ne報 Feedback Hethod for Dyna㎜ic Contro1
of ManiPu1ators, Trans. of ASME, J. of Dyna㎜ic SystelIls, Measure回ent and
Contro1,103,119/125.1981
2. Suguru Ar i㎜oto and Fumio M i yazak i: Stab i1ity and Robustness of PID Feed−
back Contro1 for Robot ManiPu1ators of Sensory CaPabi1ity, In H.Brady &
R.Paul (Ed。), Robotic Research, 岨IT Press, 783/799. 1983.
3。宮崎文夫、有本 卓:ロボットマニピュレータのためのフィードバック親御則の安
定性とロバスト性に関する考察、計測自動制御学会論文集、 Vo1.21,
No. 1,
78/83.
1985。
4.SugwuArinotoandFu固io剴i胞zaki:Asy図ptot言。StabiHtyofF舵dback
Contro1 Laws for Robot 融aniP種1ators, Proc. of 1st IF^C Sy■P. on Robot
Contro呈, SPa五n, 且985.
5.宮崎文夫、有本 卓、竹垣盛一、前田陽一郎:人工ポテンシャルに基づいたロポッ
トマニピュレーダのセンサフィードバック制御、計測自動制御学会論文集、
Vo旦,21, No.1, 71/77. 1985.
6.Fu㎜ioMiyazakiandSuguruAri皿。to:SensoryFeedbackforRobotManipu−
1ators, JournaI of Robotic Syste㎜s, Vo1.2, No.1, 53/71. 1985.
一131一
7.FunioHiyazaki,SuguruAri固。to,MorikazuTakegaki,andYoichiroMaeda:
Sensory’Feedback Based on the Artif三。ia1 Potentia1 for Robot ManiPu−
1ators, Proc. of gth IFAC Congress, Hun8ary, 1984.
8.J.Y.S.Luh,H.冒.Ha1ker,andR.P.C.Pau1:Reso亘ved−Accce1erationContro1of
Hechanica1 HaniPuIators,IEE1…:Trans.Auto間atic Contro1 ^C−25 468/474 1980
9.凶、Takegak亘andSu9目r口Ar昼日。to:AnAdaPtiサeTrajectoryContro1of固aniPu−
lators,
Int.J.Contro1,UoI.34,No.7,219/230.1981.
10.^.Ba1estrino,G.1〕eMaria,andSciavicco:AnAdaptive凹。de1Fo1IoUingContro1
for Robot HaniPuIators,Trans.ASME,J.of Dyna間ic Syste日s,HeasureI■ent and
ControI,Wo1,105,143/151.1983.
1 1 . F.Rosenb1att, Pr inc iP1es of Neurodyna習ics,PercePtrons and the Theory of
8「a i n uechan i s口s,SPartan Books Co.,Uash i ngton,DC,1961
12.内山 勝:試行による人工の手の高遠パターン形成,計測自動制御学会論文集,
VoI.14 No.6 94/100. 1978.
13.井上 恵,中野道雄,久保忠志,松本 啓,馬場 斉:陽子シンクロトロン電磁石
電源の繰り返し運転における高精度制御,電気学会論文詩,C−100−7,
16/22.1980.
14.井上 恵,岩井真一,中野道雄:プ.レイバックサーボ系の高精度制御,電気学会
論文詩,C−101−4, 89/96.1981.
15.小俣 透,中野道雄,井上 息:繰り返し制御の多変数系への拡張,計測自動制御
学会論文集, Vo1.20 No.9 23/28. 1984.
一132一
16.原 辰次,小俣 透,中野道雄:繰り返し制御系の安定余裕と設計法,第7回
Dyna固{ca1Syste㎜Theoryシンポジウム 1984 徳島
17.美名 勉,加藤英治,青木康史:反復制御とロボットアームの軌道制御への応用,
計測自動制御学会論文集, Vo1,21 No.11 87/94.1984.
18.一松
信;数学公式,岩波出版
19.山本
稔;常微分方程式の安定性,実教出版 1979
:≡三〇。 S麺dao Kawa㎜ura争 Fu固亘◎ 潤玉yazaki工 and Suguru Ari塵。to芸 Learn童ng Co識tro}
職eor胃ヂ⑪r⑰獅脳1ca亙Syst餓s,第12回制御理論シン斌ジウム 198葛 神戸
2王。川村貞夫、富崎文夫、有本 卓:多自由度機械系に対する軌道修正学習制御の
統一的設計法, 第23回S王CE学術講演会 1984 東京
ξ2缶8,D,0.A激d鉗s㎝:Net㈹rk畑aしsis独dSy就h優sis,昨en債鵬Ha旦夏官hc岨且973
23. R.E.Ka1腕an…Whe逼 iS a しine盆r C◎ntrO1 SySte歴 0Pt亘識識且,TramS.ASME 3。◎f 豚議SiC
肺・・83d…5L19♀4曲
24.B.D.O.AndersoパTheTestingforOpti胴1ityofLinearSyste働,Inter.J.of
Cont.,4−1,pp29 1966.
25.J.B.CruzandW.R.Perkins:ANe}APProachtothese聰sitivityprob1e聰sin
Mti。。。i.b1.F。。db。。kS。。t。皿D。。i。。,1E肥丁。。。。.㎝A.t。^。ti.C㎝t。。1,AC−g,
pp216,ユ964
26.小郷
寛,美名 勉:システム制御理論入門,実教出版,1979
一133一
27.有本
章:線形システム理論,産業図書 1974
28、川村貞夫、宮崎文夫、有本 卓:学習制御方式のシステム論的考察,
第26回自動制御連合講演会 1983・東京
会9.川村貞夫、宮崎文夫、有本 卓:時変線形モデルに基づいたロボットの運動学習制
御に関する考察.第24回S I CE学術講演会 1985 北海道
30.川村貞夫、松林成彰、宮崎文夫、有本 卓:ロボットマニプレータの運動学習制
御,第2回日本ロボット学会学術講演会 1984 東京
31.川村貞夫、松林成彰、宮崎文夫、有本 卓:Bettem㎝t Pr㏄essの実プラントヘの
応用,第7回D抑a日ica1Syste順Theory シンポジウム 1984 徳島
32. Fu■io Hiyazaki a腕d Suguru Ari扇。to: A Hierarchica1 Contro1 for Biped Robots
Proc. of ’83 Int.Conf.on Adワanced Robots, Tokyo, 299/306. 1983.
33.SuguruAri口。toandFu■ioMiyazaki:BipedLoco㎜otionRobots,OHM−North−
H.H。㎜d,V.1.1会,194/205.1984、
34.有本 卓、宮崎文夫:二足歩行ロボットの階層制御、日本ロボット学会誌、
Vo1.1, No.3, 7/15. 1983.
35.川村貞夫、川村竜也、藤野大助、宮崎文夫、有本 卓:二足歩行ロボットの学習制
.御,第12回制御理論シンポジウム 1983 神戸
36.川村貞夫、川村竜也、藤野大助、富崎丈夫、有本 卓:学習機能をもつ二足歩行ロ
ポットの実現,第22回S I CE講演会 1983 小倉
一134一
37.川村貞夫、富崎文夫、有本 卓:ロボットの学習経験に基づく制御方法について,
第6回Dynamica1Syste㎜Theory シンポジウム 1983 金沢
38.川村貞夫、宮崎文夫、有本 卓:ロボットの運動パターンに関する知識の表現と
利用, 第2回知識工学シンポジウム 1984 東京
39.川村貞夫、中山 敏、富崎文夫、有本 卓:学習による種々の歩行パターンの実
現,第3回日本ロボット学会学術講演会 1985 大阪
40. D.T,Greenwood:C旦ass亘。a} Dyna㎜ics,Prent ice一冒a}},Eng1eリ。od C}i ffs里閑。3,197?
41由剃田鐵。Raib鉗tandJ,3由Craig1服br亘dPOS童t亘On/FOr鵬C0枕r0}Of総枷i酬且atOr§田
丁㌘ans.
of 胤SME, 3. of Dyna㎜五。 Syste画s 凶e劉su㌘建図ent and Contro呈。 102壷
王2§/133(1981)
遜2。高瀬国克1マニピュレータの運動成分の一般的分解とその制御,計測自動制御学会
論文集、 Vo夏,12 No.3 30◎/306. 1976.
43。松林成彰、川村貞夫、富崎文夫、有本 卓;学習による力と位置のハイブリッド
コントロール,第芦7回自動制御連合講演会 1984 神戸
44.石原 正,阿部健一,竹田 宏;離散晴間プレイバックサーボ系の収東条件,
第23回S I CE学術講演会 1984 東京
45.川村貞夫、富崎文夫、有本 卓:離散時間学習劔御によるロポツトの連動制御,
第1回日本ロボット学会学術請演会 1983 東京
一135川
属目イ系喬竈)芝
1 .
Suguru Ari口。to, Sadao KaU釧11ura, and F口聰io 縢iyazaki: Betterin9 0Peration
of Robots by Learnin9, Journa1 of Robotic Syste歴s, リ。1.1, No.2,
123/140. 1984.
2.
Suguru ^ri口。to. Sadao KaUaI■ura, and Fu口io Miyazaki: Can Mechanica1 Robots
Learn by The口se1ves?, Proc. of 2nd Int. SynP. of Robot ic Research, Kyoto,
1984.
3. SadaoKa口aI■ura,Fu−ioHiyazaki,andSuguru^rinoto:IterativeLearning
Contro1 for Robot i c Syste囚s, Proc.of I ECON’84, Tokyo, 1984.
4. Su8uruAri80to,SadaoKa咽口wa,舳d恥UioHi胞z8ki:8etterin80p鉗a領。n
of Oyna口ic Syste口s by Learn ing, Proc. of 23rd IEEE CDC, Las Ψegas, 1984.
5. 川村貞夫、宮崎文夫、有本 卓:学習制御方式のシステム論的考察、計測自動制御
学会論文集、 Vo1.21, No.5, 445/450. 1985.
6. 川村貞夫、川村竜也、藤野大助、宮崎文夫、有本 卓:運動パターン学習による二
足歩行ロボットの歩行実現、日本ロボット学会誌、 Vo l.3, No.3,
5/15. 1985.
7. Suguru^ri㎜oto,SadaoKa灯a㎜ura,andFu聰ioMiyazaki:Mathe口atica1Theory
of Learning Contro1s, 4th Ya1e WorkshoP on ^PP1ications of AdaPtive
SysteIlIs Theory, NeU Ha▼en, 1985.
一136一
8. SadaoKa報a㎜uゼa,F機㎜io購yazaki,andSuguruAri㎜oto:HybridPosit童。n!Force
ControI of 魁a竈iPu1ators 8ased on Learn豆n9 醐ethod, Proc. of −85 Int白
Conf.on Advanced Robot i cs, Tokyo,ユ985.
9. Sadao1(a艀a㎜ura,Fu藺ioMiyazaki,andSuguruAri固。to:App1icationsof
Learnin9 凶ethods for Dyna㎜言。 Contro1s of Robot ManiPu1ators, Proc. of 24th
IEEE CDC, F1orida, 1985.
10.SuguruAri蜆。to,Sadao艮a報a㎜ura,andFu働五〇賜三yazak三:LearningCoΩtro}
“eory£orD舳舳豆。a互Sysも鋼s,冷Gc品◎f24thIE鵬C逮C,円。バ幽,蝸跳由
且且中州域貞夫、富鰯文夫、奄本 章1動駒シス号ム湯)学習的縄御法(晦航鮒鴎航
昨㏄eSS)の提案、計測自動制御学会論文集、 V◎1白22, NO侶王、
王986、
五2、川村貞夫、宮崎文夫、有本
計溺自動制御学会論文集、
卓:口ポットマニどエレ㎞タの連動学習制制、
Vo豆。22 掲載予定、且986苗
亙 3再 Sadao Kawa㎜ロゼa.Fu図舌。 M五yazak五。 and Su9口r口 Ar量触0t◎
;Rea1主zation ◎f R◎bot
潤。tion Based on a Learnin9 融ethod,s口b塵itted to IEEE Tran. on S”C
1五5 く一