四足ロボットの生物規範型不整地適応動歩行

四足ロボットの生物規範型不整地適応動歩行
- CPG と体性感覚・前庭感覚・視覚による歩行調節 ○福岡 泰宏
木村 浩
中村 浩之
(電通大・情報システム学研究科)
Biologically inspired adaptive dynamic walking of the quadruped on irregular terrain
○ Y.Fukuoka, H.Kimura and H.Nakamura
(Univ. of Electro-Communications)
Abstract: We are trying to induce a quadruped robot to walk dynamically on irregular terrain by using
a nervous system model. In this paper, we integrate several reexes such as stretch reex, vestibulospinal
reex, and extensor and exor reex into CPG (Central Pattern Generator). We try to realize adaptive
walking up and down a slope of 12 degrees, walking over an obstacle 3 cm in height, and walking on
terrain undulation consisting of bumps 3 cm in height with xed parameters of CPG and reexes. The
success in walking on such irregular terrain in spite of stumbling and landing on obstacles shows that the
biologically inspired control proposed in this study has an ability of autonomous adaptation to unknown
irregular terrain. In addition, we realize adaptive walking up a step and over an obstacle based on vision.
Key Words: dynamic walking on irregular terrain, quadruped robot, central pattern generator, reex
1 はじめに
これまでに,数多くの脚式ロボットの研究が行われて来た
[1].一脚,二脚,四脚ロボットを用いた不整地動歩行・走
行もある程度は実現されており,あらかじめ路面などの環
境情報が完全に分かっているならば,それに対応できる歩
行制御プログラムを用意することは可能である.しかし,
非常に多様な不整地すべてに適応可能な歩行制御プログラ
ムを用意することは一般に困難であり,自律的な適応が重
要となる.しかし,自律的な適応に基づく不整地動歩行の
実現は,これまで非常に困難な問題とされてきた.
これに対して,実世界での自律的な適応を見せる多くの
動物の運動はその体内に張り巡らされた神経系によって制
御されており,そのメカニズムを解明するために数多くの
研究が行われてきた.そして,神経生理学などの実験の結
果,動物の歩行は主に中枢にある「パターン発生器 (Central Pattern Generator:CPG)」と抹消からの感覚などに
よって発生する「反射」の組み合わせにより生成されてい
ること,これら CPG や反射の機構は主に脊髄に存在し脳
幹・小脳・大脳など上位中枢からの調節を受けていること
は,事実として広く受け入れられている [2, 3].生物学,
神経生理学等で得られた知見に基づいて,自律的・創発的
な歩行を実現しようとする試みはこれまでに数多くなさ
れてきた.そして, CPG は四足歩行の歩容を自律的に生
成する機能を持つこと [4], CPG の出力を関節トルクと考
え, 筋骨格モデルと相互に接続することで軌道計画を行う
必要がなく路面変化や外力に対する適応性を直接得ること
ができること [5, 6] などがシミュレーションにより示され
ている.生物規範型制御を用いたロボットの動歩行の実現
例は少なく [7, 8],特に不整地動歩行については CPG と伸
展・屈曲反射機構による著者らの研究のみである [8].しか
し,そこで実現された不整地歩行は非常に簡単なものであ
り,うねりがあるような路面や不連続な路面での適応的歩
行などは今後の課題となっていた.
そこで,本稿では,中程度の不整地における適応的動歩
行を実現するために, CPG と反射の組み合わせ方につい
て二つの手法を提案し, CPG を経由する反射が不整地適
応動歩行を実現する上で有効であることを四足歩行ロボッ
トを用いた実験により示す.次に,代表的な動歩行制御手
法と生物規範型制御の関係について述べ,著者らの生物規
範型制御による不整地適応動歩行実験の結果を従来型の力
学や制御理論に基づく歩行と比較しながら「なぜ生物規範
型制御を用いるのか」について述べる.
アクチュエータを全く持たない機構が動歩行により坂を
下ることができることや,自然界において静歩行はごく一
部の昆虫と動物の非常に特殊な場合にしか観察されない
ことなどから,動歩行がより自然で基本的な歩行であるこ
とや,動歩行とは機構が本来持つ「歩行という機能」が重
力という外力や神経 - 筋肉系からの内力により誘発された
ものであることは,生物学 [9] とロボット工学 [10] におけ
る動歩行についての共通理解となりつつある.本研究で用
いる生物規範型歩行生成・制御系は,このような歩行につ
いての理解に基づき,不整地適応動歩行を実現するために
採用されたものである.そこでは,従来のロボット工学で
常識とされた軌道計画は存在せず1 ,リズム発生器と反射
というトルクを出力する系と床面との相互作用の結果とし
て,不整地への動的な適応が自律的に生成される.
2 動歩行制御
2.1
従来の動歩行研究
従来の二足や四足ロボットの動歩行制御手法は, Zero Moment Point(ZMP) を着地足が作る多角形上に常に置く
軌道計画・制御 (ZMP 規範型) と,支持脚点を基点とした
倒立振子モデルに基づく軌道計画・制御 (倒立振子モデル
規範型) に大きく分けられる. ZMP 規範型制御において
は,比較的大きな足底が必要であり,慣性の大きな胴体を
アクチュエータにより揺動させる必要があるなどの欠点が
指摘されている.倒立振子モデル規範型制御においては,
常に重力により倒れようとしているので制御の遅れが転倒
につながり易く,安定に歩行できる周期の上限があるなど
の問題点がある.一方の欠点は,他方の利点でもある.
生物における ZMP 規範型制御について考えると,人は
比較的大きな足 (foot) と多数の足裏圧覚を持っており,
ZMP 規範型制御を行っている可能性があるが,小さな足
(paw) を持つ猫や蹄 (hoof) を持つ馬などの歩行において
ZMP 規範型制御が行われているとは考え難い.倒立振子
1 伸張反射のための原点や重力方向は存在するが,これらは一定である
モデル規範型制御においては,支持脚交換という非線形現
象を利用することにより,位相平面において安定なリミッ
トサイクルを構成することが歩行の安定化を意味する [11,
12, 13].安定なリミットサイクルは安定な振動と等価であ
るという意味で,倒立振子モデル規範型制御は,生物にお
ける振動パターン生成器 (CPG) による歩行生成・制御と
強い類似性を有する.これについては, 6.3. で改めて述
べる.
cerebrum
vision and
association
cortices
vison
vestibulospinal
reflex
motor
cortex
vestibule
vestibular
sensation
vestibular
nuclei
purkinje
neurons
cerebellum
brain stem
2.2
四足動物の歩行生成・制御系
四足動物における歩行生成・制御系を Fig.1に示す.ここ
で,関節は屈筋と伸筋により駆動され,各筋肉は脊髄にあ
るα運動ニューロンからの指令を受ける.除脳ネコ [14] を
用いた研究によると,脊椎動物の歩行リズムを生成する神
経振動子は脊髄中に存在し、歩行は中脳以下の比較的低
レベルの神経系において自律的に生成されていることが
明らかになっている.猫などの高等動物の CPG がどのよ
うな神経回路から構成されているかは明らかではないが,
CPG の特性は生物学や神経生理学において活発に調べら
れており [14, 15],また, CPG の数理モデルがいくつか
提案されている.そして,神経生理学の実験やシミュレー
ションにより, CPG はパターンを生成・変更する能力を
持つことや [4],パラメータの変更や外界の変化に対して適
応的に安定なリミットサイクルを構成する能力が示されて
いる [5]. Fig.1の CPG において,相互に抑制された二つ
のニューロンの出力は屈筋と伸筋の各α運動ニューロンに
伝えられ,関節の周期的な運動を発生させる. CPG は脳
幹経由の上位からの入力信号により駆動されている.
筋紡錘とゴルジ器官は筋の伸張と張力をそれぞれ検出す
る.支持脚の伸筋が伸ばされたとき,α運動ニューロンは
筋紡錘からの信号に基づいて収縮させるための信号を出力
する.このフィードバックは「伸張反射」と呼ばれ,筋に
剛性を与える.屈曲反射は接触感覚に基づいて,遊脚の屈
筋を収縮させる.
前庭感覚は頭部の角加速度や角速度を検出する.直立時
や歩行時の姿勢の安定性は,前庭感覚に基づき前庭核とα
運動ニューロン経由で脚の筋を駆動することにより保たれ
る.この安定化は,「前庭脊髄反射」と呼ばれている.視
覚に基づく歩行制御の機構は明らかではないが, Drew ら
[16] は大脳運動野経由で CPG への指令を調節するモデル
を提案している.
2.3
CPG を用いた整地動歩行
上で述べた生物の歩行生成・制御系を適用するために,四
足ロボット Patrush を用いる.各脚はピッチ平面内で回転
する 3 関節で構成され,上から腰,膝,足首関節と呼ばれ
ている.腰と膝関節には DC モータと光学式エンコーダが
組み込まれており,足首関節は受動関節となっている.反
射機構のためのセンサとして,膝リンクには 6 軸力センサ
が,胴体には角速度センサが取り付けられている.また,
段差や障害物までの距離と高さを検出するために, 2 眼ス
テレオカメラが胴体上に搭載されている.このロボット
は,全長 34(cm),全高 31(cm),全質量 5.2(Kg) であり,
ピッチ軸まわりの関節しか持っていないので, 2 本の棒に
よりロールおよびヨー平面内の運動は拘束されている.
本研究では,四足歩行ロボットに Fig.2-(a) のように仮
想の伸筋と屈筋を定義し,また,実験グラフの各変数の零
点と方向を Fig.2-(b) のように定義する.また,各脚に,
左前脚 (LF),右前脚 (RF),左後脚 (LH),右後脚 (RH)
と記号をつけ, LFS は左前脚・腰関節を表し, x は joint
spinal cord CPG
γ
α
α
somatic
sensation
motor neurons
flexor
reflex
stretch
reflex
extensor
muscle
muscle
muscle
spindle
flexsor
muscle
Golgi tendon
organ
skin
Fig.1 Simplied nervous system for adaptive control of
legged locomotion in animals.
angle, fx , fz はそれぞれ x,z 方向力センサ値とし, LFS.x,
LFS.fx のように用いる.
joint
angle
body angle
flexor
extensor
-
joint torque
+
-
θvsr +
flexor
θ
z
extensor
y
(a)
(b)
x
Fig.2 (a) Virtual extensor and exor muscle on a
quadruped robot. (b) Origin and direction of angles
and direction of torque.
ここでは, CPG のモデルとして,松岡 [17] により提案
され多賀ら [5] により二足歩行ロボットに適用された神経
振動子を用いる.このモデルでは,一つの神経振動子は次
式のように,非線形一階連立微分方程式で表される二つ
のニューロンが互いに抑制し合う組より構成され,ロボッ
トの一つの関節において,それぞれのニューロンが内部状
態に比例するトルクにより伸筋と屈筋を駆動する (Fig.3(a)).
u_
fe;f gi
=
0u
fe;f gi
+ wf e yff;egi 0 vfe;f gi + u0i
+F eedfe;f gi +
X
n
y
v_
fe;f gi
0
fe;f gi
w y
ij
j
=1
j
(1)
= max (0; ufe;f gi )
= 0vfe;f gi + yfe;f gi
f g
ここで,添字: e は伸筋, f は屈筋, e; f は伸筋または
屈筋, i は i 番目の神経振動子を表し,変数: ui はニュー
ロンの内部状態, vi はニューロン内の疲労状態, yi はニュー
ロンの出力, u0i は上位からの駆動入力, F eedi は関節
角などのフィードバック信号を意味し,定数: はニュー
ロンの疲労状態の内部状態への影響を表す係数, , 0
は ui と vi の時定数, wf e は拮抗ニューロン同士の結合係
数, wij は接続されている他のニューロンとの間の結合係
数,を意味する.
Σwij y j u0
τ
τ
,
LF
ue
β
-1
-1
ye = max(ue , 0)
+
w fe
LH
y f = max(u f , 0)
-1
RH
Neural Oscillator
Feed f
uf
τ
β
vf
τ
1 : Excitatory Connection
-1 : Inhibitory Connection
,
LF : left fore leg
Flexor Neuron
LH : left hind leg
RF : right fore leg
Excitatory Connection
Σwij y j u0
RH : right hind leg
Inhibitory Connection
Oscillator
(b) Neural
Network for Trot
(a) Neural Oscillator
Fig.3 Neural oscillator as a model of a CPG.
結果として,関節を駆動するモータに出力される CPG
トルクは
N T r = 0p u + p u
(2)
となる. CPG 伸筋活動期 (N T r < 0) と屈筋活動期
(N T r > 0) は,それぞれ, CPG レベルでの支持脚相と
e
e
f
f
遊脚相に相当する.また, 5. の視覚に基づく不整地歩行
以外の実験において, u0i は各脚共通の定数である.
Feedi について考えると,生物において重要なフィード
バックの一つに,伸張反射がある.伸張反射は伸ばされた
筋肉をもとの長さ (静止長) に戻すための反射で,静止長の
位置は基本的には直立方向,すなわち, = 0 である (た
だし, Fig.2-(b) で = (joint angle) + =2).生理学的知
見によると,筋肉と脊髄間で発生する伸張反射には,筋が
伸張されている間持続して起こる「緊張性伸張反射 (tonic
stretch reex)」と,筋伸張の初期だけに出現する「相動
性伸張反射 (phasic stretch reex)」の二種類がある.前者
を CPG と筋肉間で起こる反射と仮定すると, Grillner ら
の知見に基づいて多賀の二足歩行ロボット制御のモデルで
導入された CPG への関節角度フィードバックは緊張性伸
張反射に相当し,本研究でも次式がすべての実験において
採用されている.
Feed
e1tsr
= ktsr ;
F eed
f 1tsr
= 0ktsr desired angle = 1:7N T r + 0:26
(4)
それぞれの目標角度に対して PD 制御をする.
CPG へのフィードバック信号として関節角度のみを用
いて (F eede = F eede1tsr ; F eedf = F eedf 1tsr ) 平地動歩
行実験を行い, CPG と緊張性伸張反射により安定に歩行
できることを確認した [18].このとき Patrush は,左右脚
間歩幅約 25(cm),周期約 0.8(sec),速度約 0.6 (m/sec) で
2.4
RF
ve
Feed e
N_Tr
-1
T r に対してある目標角度を設定
歩く.
u0
u0
Extensor Neuron
式のように腰関節の N
し,
(3)
また,本研究では,相動性伸張反射を モータニューロン
と筋肉間で起こる局所的な反射と考え, 3. で採用する.
各脚の腰関節を駆動する CPG を相互結合して 4 個の
CPG からなるネットワークを構成するとき (Fig.3-(b)),
これら CPG は相互に引き込まれ,同一周期と固定位相差
で振動を始め,四足歩行ロボットのトロット歩容を生成す
ることが出来る [8].
以下,本研究の実験では, CPG による制御は腰関節に
対してのみ行い,膝関節については,支持脚時は N T r に
よらず 0.07(rad) と一定の目標角度を設定し,遊脚時は次
CPG を用いた不整地適応動歩行
2.3. では,関節角フィードバックを持つ CPG を用い,整
地歩行が容易に実現されたことを述べた.本研究では,生
物規範型制御に基づく不整地歩行実現の次の段階として,
より不整地度の高い路面での適応的な動歩行の実現を目指
し,センサ情報に基づく CPG や反射の調整の方法につい
て議論する.
多賀が二歩行ロボットの平地・坂歩行のために提案し,
2.3. でも用いられた制御モデルでは, CPG へ入るセンサ
情報は,伸張反射のための角度・角速度情報と,それら
を遊脚・支持脚で切り替える体性感覚のみであった.しか
し,不整地歩行のためには,支持脚負荷や接触などの体性
感覚・前庭感覚に基づく CPG や反射の調整が重要である
ことはよく知られている [14, 15] また,神経生理学にお
いては, CPG と反射の関係について「感覚性のフィード
バックが CPG を修飾する」こと [3] が知られているが,
その具体的なメカニズムは四足動物の神経系は複雑過ぎて
必ずしも明らかではない.そこで,本研究では種々のセン
サ情報から歩行運動を調節するモデルとして次の二つを考
え,実験結果からその優劣を論じ, CPG と反射の関係の
具体的なメカニズムについてロボット工学の立場からの提
案を行う.
(a)
(b)
CPG と CPG に独立な反射による不整地適応
CPG と CPG 経由の反射による不整地適応
(a) では,反射を CPG とは独立な制御系と考え, CPG
出力トルクと反射トルクを足したものを,モータに出力す
る. CPG は,反射トルクを外乱と見なし,反射トルクが
消えたあとで元の状態に戻るべく調節を自動的に行う.
(b) では,すべてのセンサ情報を CPG にフィードバック
することにより, CPG 経由の反射としてトルクを発生す
る.時定数を持つ CPG を経由するために, (a) と比較し
て反応は遅くなるが,反射トルクの発生と同時に,セン
サ情報により CPG 全体の位相を調節することが可能と
なる.センサ情報の CPG への入力は, CPG の位相,接
地の有無,床反力の大きさにより, On/O の制御を受け
る.
さらに,段差などの不連続面がある不整地においては,
視覚による適応が重要となる [16]. 5. では,
(c) 視覚情報に基づく CPG 入力調節による不整地適応
について述べる.
3 CPG と独立な反射による不整地適応
3.1
相動性伸張反射による不整地適応
CPG へのフィードバック信号として関節角度のみを用い
た制御により高さ 3cm 幅 6cm の障害物を乗り越える不整
地歩行実験を行ったが,前脚が障害物に乗り上げた後,後
方に転倒した.これは,障害物に乗り上げた時に推進力が
不足しているためであり,この状態を回避するために支持
脚トルクを相動性伸張反射により増加させ,推進力を高め
て障害物を乗り越えさせることができる [18].しかし,相
動性伸張反射のレベルが高いと,脚が接地したとき常に腰
リンクを直立方向に戻そうとするので腰リンクを振る振
幅が小さくなり高速な歩行を妨げてしまうなどの問題点が
あった.
3.2
前庭脊髄反射
低いレベルの相動性伸張反射を用いて,登坂歩行実験を
行った結果, 7 度を超える坂に対しては全く対応できない
ことがわかった.短い坂であれば u0 を可能な限り増加さ
せて勢いで登りきることも可能だが,エネルギー効率が悪
く理想的とはいえない.一方,相動性伸張反射レベルを上
げても, 3.1. で述べたように推進力を失ってしまい,重
心が後方に傾き転倒してしまう.
そこで,登坂歩行中の体の傾きに対応するために「前庭
脊髄反射」を導入した.前庭脊髄反射は,前庭器官からの
傾き情報をもとに体幹や四肢に出現する反射である.その
代表的なものに緊張性迷路反射があり,これは水平面に対
する頭の傾きに対して姿勢を保持するために発生する反射
である. Patrush は頭と体が同一であるので体の傾きに対
して出現する反射とみなす.登坂歩行中の姿勢制御を例に
とると,前庭器官により体の傾きを検出すると,前または
後脚の関節筋に収縮命令を与えて転倒回避の姿勢をとる
[10] (Fig.2-(a)).しかし,この姿勢制御では,重力に抗し
て運動するために必然的に起こる移動速度の低下に CPG
レベルで対応できないために, CPG レベルの伸筋・屈筋
の活動によって定まる支持脚相・遊脚相と実際の運動の各
相の間にずれが生じ,坂の傾斜が大きくなるについて支持
脚での滑べりや遊脚の足踏みが発生し,なめらかな歩行の
実現は困難であった [19].
3.3
屈曲反射
代表的な脊髄反射のもう一つに体を傷つけるような刺激
から逃避するための「屈曲反射 (exor reex)」が存在す
る.歩行における屈曲反射の一例として,遊脚時,爪先に
刺激を受けると屈筋の 運動ニューロンに興奮性の刺激を
与え,脚を屈曲する反応がある (Fig.1).歩行中,障害物
につまづいた時の転倒回避を考えると,このような強い屈
曲を起こす必要がある [8].よって本節では,遊脚時におい
て爪先に 1.5[Kgf] を超える強い刺激がかかると, 0.2[sec]
の間, 3[Nm] の屈曲トルクを腰関節に与え, 3cm の障害
物に前脚がつまづいた時の転倒回避を試みた.実験の結
果,成功率は低い.右前脚がつまづいたとしたとき,屈筋
の 運動ニューロンに興奮性に結合することにより,右前
脚は再び強く屈曲し,遊脚を延長する.しかし,この時,
隣の脚である左前脚は既に遊脚に移行しているため,前脚
は両方とも遊脚になってしまう.生物学において,歩行中
は前後それぞれの隣合う脚は相反するという指摘があり,
また客観的に見てもこの状態では明らかに前方に転倒して
しまう.このように,刺激に対して強い屈曲反射を出現さ
せると, CPG からの出力トルクとの間に大きなズレが生
じてしまう.著者らの従来の研究では,このような問題に
対して,隣合う支持脚に伸展反射をおこさせる「交差伸展
反射」を導入して,位相の調整を図ったが [8],その適応範
囲には限界があった.
4 CPG 経由の反射による不整地適応
ここでは, CPG 経由の反射として,前庭情報に対する反
応,腱での負荷に対する反応,接触による伸展・屈曲を説
明するが,それぞれ従来からある前庭脊髄反射,腱反射な
どの定義と混乱しやすいので,前庭脊髄反応,腱反応,伸
展反応,屈曲反応と呼ぶ.
4.1
前庭脊髄反応よる坂の昇降
3.2. において発生した CPG と実際の運動の間の支持脚・
遊脚相のずれに対して, [19] においては CPG の内部パラ
メータ を調節することにより CPG の周期を長くするこ
とで対応した.しかし,生理学的に CPG の内部パラメー
タが調節される知見はなく,また,いかに調整パラメー
タの値を決定するかという問題も残る.これに対して,
前庭器官により検出された胴体の傾きを考慮した CPG
経由の緊張性伸張反射により,重力に対して胴体の傾き
を保持する際の抗重力筋の調節を行うことは,伸筋の多
くは抗重力筋であり,かつ,筋が伸張されている間持続
して起こる緊張性伸張反射の性質から妥当である.本研
究ではこれを「CPG 経由の前庭脊髄反射:前庭脊髄反応
(vestibuolospinal response)」であると理解し,緊張性伸
張反射の角度情報に胴体の傾き角を以下のように導入し,
体幹の傾きにかかわらず常に重力方向を保つようにする.
vsr
= (joint angle) + =2 0 (body angle)
F eed
fe;f g1tsr1vsr
= 6ktsr vsr
(5)
このとき登坂時には, CPG の伸筋ニューロンに興奮性の
フィードバック信号が入るので,必然的に CPG の支持脚
期は長くなり,結果として実際の運動とのずれは小さくな
る.この CPG 経由の前庭脊髄反射を導入して 12 度の坂
の登坂の実験を行い,かなりの低速ではあるが,調整パラ
メータの数を増やすことなく,安定に歩行させることに成
功した.
4.2
腱反応よる坂の昇降
4.1. では,安定な登坂歩行が実現された.しかし,前庭
脊髄反射は基本的に重心または ZMP により静的な安定を
保つための制御なので,推進力の高い動的なな歩行が実
現されていたとは言い難い.よって,より高速な登坂を
実現するために,腱反応を用いる. Pearson[20] は脚接地
時に足根関節 (ankle) 筋にかかる負荷を腱器官が検出する
と, CPG の伸筋ニューロンに興奮性の信号が入ること指
摘している.これを本稿では腱反応 (tendon response) と
定義する.すなわち,腱反応は,支持脚時地面から受ける
抗力に対して推進力が妨げられないように, CPG の伸筋
ニューロンに興奮性接続して推進力を補うという働きをも
つ.本研究においてはパトラッシュには足根関節が存在し
ないので,足根関節同様に歩行中推進に関して大きく依
存する腰関節において,関節筋負荷を検出する.また,本
研究で用いた膝下に取り付けた力覚センサでは,実験的に
腰関節の関節筋張力を厳密に検出するのは困難であるた
めに,支持脚接地時における _ の減少分だけ瞬間的に負荷
がかかり,伸筋が伸ばされたと仮定して関節筋負荷の代用
とした.具体的には式 (6) のように,末梢からのフィード
バック経路 F eede1tr を CPG の伸筋ニューロンに興奮性に
結合する (式 (7)).
F eed
e1tr
=
k (_ + 1) (_ 01)
0 (_ < 01)
tr
(6)
F eed
Feed
= F eede1tsr1vsr + F eede1tr
= F eedf 1tsr1vsr
e
f
出力から得られるように,つまづいた瞬間を t = 0[sec] と
して 0.2[sec] の間,式 (9) で表す F eedf 1f r を CPG の屈筋
ニューロンに興奮性に結合する.
(7)
この手法により 12 度の坂の昇降実験を行い,成功した
時のデータを Fig.4に示す.ここで,腱反応は CPG 伸筋
活動期 (N T r < 0) で, N T r の凸 (1.7 ∼ 1.9[sec], 2.3
∼ 2.5[sec] など) として現れている.また, 4.1. において
述べた CPG 経由の前庭脊髄反射の影響により,上り坂時
の CPG 伸筋活動期は平地や下り坂時よりも長くなってい
る. 4.1. の実験とこの実験を比較すると,坂を登るのに
walking up a slope
F eed
F eed
RFS.x
LFS.x
RFS.N_Tr
LFS.N_Tr
body angle
RF.fz
1
4
0
body angle
[degree]
0
-1
-4
-2
-8
-3
-4
-5
0
1
3
time [sec]
2
4
5
6
Fig.4 Walking up a slope of 12 degrees using tendon
response.
前者は約 4[sec],後者は約 2.2[sec](1.1
3.3[sec]) 時間を
要しており,腱反応を利用して登坂の方がより高速な歩行
を実現することができた.さらに,後者の方は前者に比べ
て,坂の昇降時にかかわらず比較的安定した持続振動を繰
り返している.
4.3
3
N_Tr [Nm]
fx, fz [kgf]
(b)
屈筋活動中にある脚に刺激を加えると,その刺激から
逃避するように脚を屈曲させる.
0
x
[rad]
-1
-2
k 0
er
vsr
(vsr 0)
(vsr < 0)
4.4
0
2
body angle
[degree]
0
-1
-2
-2
-4
-3
0
1
2
time [sec]
3
4
より高度な不整地への適応
CPG と緊張性伸張反射,前庭脊髄・腱・伸展・屈曲反応
を組み合わせた式 (1), (10) の制御において,種々のパラ
(8)
すなわち,式 (3) と式 (8) より,重力線より脚が前方にあ
る時つまづくと, F eede = (ktsr + ker )vsr とすることに
より緊張性伸張反応を強化している.
(b) の屈曲反応 (exor response) 場合,屈筋活動中 (N T r
0) につまづいた時 (fx > 1.5[Kgf]),屈曲トルクが CPG
4
Fig.5 Avoidance of falling down after stumble by using
exor response.
ンに興奮性に接続する.
e1er =
LF.fx
-π/2
(a) を伸展反応, (b) を屈曲反応と呼び,この切替えは CPG
からの筋活動指令によって行われるとものする [15].
具体的には, (a) の伸展反応 (extensor response) の場
合,伸筋活動中 (N T r < 0) につまづいた時 (fx >
1.5[Kgf]),式 (8) で表す F eede1er を CPG の伸筋ニューロ
F eed
body angle
LF.fz
1
3.3. では,屈曲反射による反応では 3cm の障害物につま
づいた後の転倒を回避できなかった.本章では同様の実験
環境において,屈曲反応により転倒回避を試みる.猫の歩
行中,足の背面に刺激を加えると,その脚が伸筋と屈筋の
どちらが活動しているかによって次のように反応が異なる
ことが知られている.
伸筋活動中にある脚に刺激を加えると,転倒しないよ
うにその脚はより強く進展する.
RFS.x
LFS.x
RFS.N_Tr
LFS.N_Tr
2
伸展反応および屈曲反応よるつまづき後の転倒回避
(a)
(9)
式 (10) に F eede1tr が含まれているのは,つまづいた後に
他の脚が障害物の上に乗り上げた時,腱反応の推進効果で
後ろに転倒することなく歩行を行うためであり,式 (7) か
らそのまま導入してある.
Fig.5は, 3.3. と同様な 3cm の障害物につまづいた後,
屈曲反応によって転倒を回避した時のグラフである. Fig.5で
は, 1.9[sec] 付近で左前脚がつまづいて LFS.N Tr が急に
大きくなり遊脚期が長くなっている一方,右前脚は支持
脚期を延長して体を支えている.これは,となり合う脚
の CPG の同一ニューロンが互いに抑制結合されている
(Fig.3-(b)) ために,左前脚がつまづいて CPG の屈筋ニュー
ロンが強く興奮した時,右前脚の CPG において屈筋ニュー
ロンが強く抑制され,右前脚は左前脚とともに遊脚になる
ことを防ぐためである.
-π/2
-2
= (kf r =0:12)(0:12 0 t)
= F eede1tsr1vsr + F eede1tr + F eede1er
(10)
= F eedf 1tsr1vsr + F eedf 1f r
e
f
8
N_Tr [Nm]
fz [kgf]
f 1f r
ここで定数 kf r は, 3.3. と同様にピーク値で 3[Nm] の屈
曲トルクが CPG 出力から得られるように実験的に求め
る.
以上より,つまづき後の転倒回避のために CPG にフィー
ドバックされる信号は次式となる.
walking down a slope
2
0
x
[rad]
-1
F eed
>
メータを一定のまま,坂,障害物,うねりが続くより高度
な不整地上の動歩行を実現することにより,本研究で提案
する生物規範型制御があらかじめ予想されていない不整地
に対して強い適応性を持つことを示す.
ここで, Fig.4や Fig.5より分かるように,定常振動をし
ている CPG に外乱として各種のフィードバックが入力さ
れたとき CPG の出力波形は乱れるが,歩行の一周期の過
渡状態を経て元の安定した定常振動に戻っている.これは
CPG の自己安定化能力である.そこで,前後脚のいずれ
かが常に不整地部にあり, CPG ネットワークが再び安定
状態に戻る前の過渡期に再度外乱が入るように,不整地部
の間隔を歩行の一周期移動分より短い Fig.6のようにな不
整地を設定した.
44cm
50mm
28cm
30cm
70mm
12
3
N_Tr [Nm]
fx, fz [kgf]
12
30mm
66cm
20mm
30mm
30mm
(a)
(b)
Fig.6 Terrain of medium degree of irregularity
不整地 Fig.6-(a) 上を動歩行したときの結果を Fig.7と
Fig.8-(a) に示す. Fig.7においては, 1[sec] 過ぎから登坂
を開始し腱反応が CPG に影響を与え, 3[sec] 過ぎに登坂
中に右後脚がつまづき屈曲反応により RHS.N Tr が急増
して転倒回避をしていることがわかる.さらに,屈曲反応
後 RHS.N Tr がマイナス方向 (支持脚) に比較的大きく増
加しているのは,前遊脚時過度の屈曲を起こした脚を支
持脚時に緊張性伸張反応,および腱反応によって支えてい
る CPG の自律的適応に他ならない.このように CPG へ
のフィードバック信号の強化は CPG の自律的適応能力の
促進にもつながる.また,下りを歩行した後の 5[sec] 後に
障害物を跨ぎ越えている.この時は障害物の上に乗り上げ
ず,前に多少前に傾いた状態で前脚,後脚ともに障害物に
つまづいたが,屈曲反応で無事跨ぎ越えた.
walking down
a slope
walking up
a slope
4
N_Tr [Nm]
fx, fz [kgf]
RHS.x
LHS.x
RH.fx
RHS.N_Tr
LHS.N_Tr
RH.fz
walking over
an obstacle
8
body angle
2
4
0
body angle
[degree]
0
-2
-4
-π/2
-2
-4
-8
-4
-6
0
x
[rad]
0
1
2
3
time [sec]
4
5
6
Fig.7 Walking up and down a slope of 12 degrees and
over an obstacle 3cm in height.
不整地 Fig.6-(b) 上を動歩行したときの結果を Fig.9と
Fig.8-(b) に示す. Fig.9において,脚が凸につまづいたり
(1.5, 2.4[sec]),凸に乗り上げたり (1.2, 2.8[sec]) しなが
ら,かつ胴体もピッチ平面内で揺動しながら,安定な歩行
が持続していることが分かる.
body angle
4
RFS.x
LFS.x
1
2
0
body angle
[degree]
0
-1
-2
-2
0
x
[rad]
-1
-3
-π/2
-2
-4
0
1
3
2
4
5
time [sec]
Fig.9 Walking on terrain undulation.
著者らは以前の研究において, CPG への指令入力を増加
させることにより, 2cm の段差乗り越えを実現した [8].
この結果は,上部制御器が段差を認識した際に下部制御器
に与える指令信号は, CPG への指令入力を「いつ」「ど
れくらい」変化させるかという情報のみで十分であること
を示している.しかし, u0i をすべて同時に増加させたた
めに段差乗り越え後に CPG の振動が一旦停止する,視覚
情報からどのようにして u0i の変化を生成するかが不明で
あるなどの問題点があった.
Drew のモデルに基づく自律的な CPG への指令入力の
調節はまだ実現されていないが,歩行開始前にステレオ
カメラより得られた段差までの距離と高さに基づき,プロ
グラムにより CPG への指令入力を調節することにより,
3cm の段差の乗り越えを実現した [10].
次に,歩きながら常に障害物を検出し,障害物が視界か
ら消えたあと障害物につまづかないように脚を大きく上げ
る歩行の実験を行った.障害物の検出は,障害物上のマー
クのトラッキングにより行われた (Fig.10-(a)).まず,障
害物が画面上のある地点まできた時点で (このとき前脚腰
関節は障害物前方約 30[cm]),前遊脚が遊脚相の中盤まで
ならその遊脚の歩幅を通常より小さくし,遊脚相の中盤
以降ならばそのままの歩幅とする.そしてこの前脚と左右
反対の前脚が次の遊脚になるとき, u0i を大きくして,障
害物を乗り越えさせる.すなわち,障害物の前で歩幅をあ
わせるような制御を行っている.最初に障害物をまたぎ越
える脚が決まれば, u0i を大きくする脚の順番は常に一定
とし,左前脚が最初ならばその順番は,左前脚 (LF) 右
左後脚 (LH) とした.右前脚
前脚 (RF) 右後脚 (RH)
が最初ならばその順番は, RF LF LH RH とした.
Fig.11の実験結果では,高さ 3cm 幅 6cm の障害物が画面
上のある地点まできたとき (1.8[sec]), LF が前遊脚であ
り遊脚相のほぼ中盤だったので歩幅を小さくし,次の RF
から u0i を順次大きくして障害物を越えていることがわか
る.この障害物またぎ越え歩行の様子を Fig.10-(b) に示
す.
)
(a)
(b)
Fig.8 Photos of walking down a slope:(a) and walking
on terrain undulation:(b).
RF.fz
RF.fx
RFS.N_Tr
LFS.N_Tr
2
)
)
) ) )
6 考察
6.1
「CPG と独立な反射」と「CPG 経由の反射」
5 視覚を用いた適応制御
CPG と独立な反射においては,そのレベルを上げよう
Drew[16] らは,神経生理学実験に基づいて,猫が障害物
CPG のトルクと相反するトルクを出力する, CPG の周
期や CPG 間の位相が調整されないなどの問題のため,歩
をまたぎ越える際の遊脚の運動調節について,視覚に基
づいて CPG への指令入力を調節するモデルを提案して
いる. CPG のモデルとして神経振動子を用いた場合,
CPG への指令入力は神経振動子への外部入力 u0i となる.
とするといくつかの問題点があり,また場合によっては
行のためには反射のレベルは低い方が望ましいと言える.
これに対して, 4. の実験により, CPG 経由の反射は
伸張や伸展・屈曲のために必要なトルクを出す一方, CPG
(a)
(b)
Fig.10 Photos of tracking of a marked obstacle while
walking:(a) and the quadruped walking over an obstacle
by using vision:(b).
N_Tr (Nm)
vision input
CPG torque: u
external input to CPG: u0
u0
3
10
0
0
3
10
0
0
3
10
RF
LF
LH
0
0
3
10
0
0
RH
(sec)
Fig.11 Walking over an obstacle 3 cm in height by using
adjustment of external input to CPG based on vision.
の周期および CPG 間の位相は CPG の引き込み能力によ
り適切に自律調整されることが示された.さらに,式 (1),
(10) の制御において CPG 経由の複数の反射・反応が互い
に悪影響を及ぼすことなく両立していること,および,
種々のパラメータを一定のままより高度な不整地上の動歩
行を実現できたことにより,本研究で提案する生物規範型
制御があらかじめ予想されていない不整地に対する強い適
応性を持つことが,実験により確認された.
CPG と独立な相動性伸張反射,前庭脊髄反射は主に静
止直立時に観察される反射であり,胴体の傾きに対して
重心もしくは ZMP を戻すように働く. CPG 経由の反射
は,主に動的な歩行時に CPG の位相の調整を行いなが
ら,支持脚・遊脚のセンサフィードバックを行う.従っ
て, CPG が働かない静止直立時は前者が優性で, CPG
の活動が次第に大きくなり移動速度が上げるにつれて後者
が優性になる制御が,一般に妥当と考えられる.このこと
は,従来型の歩行制御においても,静止時または低速歩行
では静的な安定性を重視した ZMP 規範型制御が有効であ
るが,高速歩行・走行になるにつれてより効率に優れ,動
的な安定性を重視した倒立振子モデル規範型制御やホッピ
ングのようなリミットサイクルを構成する制御手法が有効
になることに対応する.
6.2
単一システムと二重システム
従来のロボット工学においては,軌道を計画し,その軌道
に沿うように関節を制御するという,二重システムとし
て歩行の制御を行って来た.人やロボットの腕の制御にお
いては,視覚座標系で表された最終目標位置が存在するこ
とが多いために,このような二重システムは非常に有効で
あった.しかし,二重システムは,常に軌道計画と制御と
いう二つの異なる問題を考慮する必要があるために,シス
テム全体の最適化・適応・学習を困難なものとしていた.
一方,動歩行においては,歩幅の調節は行われるが,
通常,着地点の正確な位置が与えられることはない.従っ
て,歩行の生成と制御のために, CPG や反射などサブシ
ステムの出力がすべてトルクであり,軌道計画が存在しな
い.このようなシステムの単一性は,外界の変化に対する
出力トルクの調節を直接考えることにより,システム全体
の最適化・適応・学習を簡単なものとする.例えば,多賀
は [21],単一システムにおいては,ロボットや環境につい
ての陽なモデルなしで,神経系や筋骨格モデルと環境との
相互作用の結果として,適応性が自律的に発生することを
指摘している.
また,本研究では, CPG への指令入力 u0i を視覚情報
に基づいて調整することにより,単一システムにおいても
視覚を用いた適応歩行が十分可能であることを示した.
6.3
CPG を用いた歩行の意味
2.1. で, CPG を用いた歩行生成・制御と倒立振子モデル
規範型制御の類似性について指摘したが,このことは,
倒立振子モデル規範型歩行の典型例である,アクチュエー
タを持たない歩行機械が下り坂を動歩行する「受動歩行
(passive dynamic walking)」 [22] を考えることによって
より明確になる.
受動歩行時に下り坂において重力がリンクに与えるト
ルクの計算値と,関節角のフィードバックがある CPG を
用いた平地歩行時の CPG トルクの実験値を比較すると
[18],トルクの大きさは物理定数の違い,摩擦の有無など
の理由で異なるが,明らかに支持脚・遊脚時それぞれのト
ルクの符号とパターンには類似性がある.この類似性は,
受動歩行と CPG による歩行の両方の単一システムにおい
て,歩行運動は外力もしくは内力が働くリンク機構と床面
との相互作用により自律的に生成されていることを考える
と当然の結果である.すなわち,受動歩行の場合は,歩行
機械自体が持つ歩行の能力が外力 (重力) により誘発された
ものと考えることができるが,平地や昇り坂では重力とい
う外力は存在しないので内力が必要となる.フィードフォ
ワード・フィードバック・トルクや CPG トルクはこの内
力に相当するが,リンク機構や床面などの環境との間の自
律的な相互引き込みを発生する能力や,センサー・フィー
ドバックに対して自律的に周期や位相を調節する能力に
おいて, CPG は運動方程式と軌道に基づくフィードフォ
ワード・フィードバック・トルクよりも格段に優れた能力
を持っていることが,本研究の実験により示された.
6.4
生物規範型制御の利点
アクチュエータやセンサの特性・能力が全く異なる系に対
して,生物規範型の制御を行う妥当性を示すために,本研
究の実験を通して得られた結果を力学に基づく制御による
歩行実験 [24] の結果と比較すると,生物規範型制御の利点
として以下をあげることができる.
(a)
本研究の実験で示されたように, CPG は「筋骨格系
との相互引き込み」,「自己安定化」,「センサー・
フィードバックに対する周期・位相の自律調整」,
「自動補間」の能力を持つ. CPG のこのような能力
が,坂,障害物,うねりがあるような不整地の適応動
歩行の実現を非常に容易なものにした.
(b) (a) で述べた CPG の能力は, CPG を下部制御器と
してより有用なものとしており,視覚による段差乗り
越えや障害物回避の運動生成問題を CPG への外部入
力 u0i の設定問題に簡略することができた.このよう
に,下位の脊髄反射から上位の視覚による運動生成ま
で, CPG を中心とする整合性のとれた不整地適応歩
行生成・制御系を構成することが出来た.
(c)
(d)
従来の方法における数千行の運動計画・制御プログ
ラムが本手法においてはわずか五百行程度に短縮さ
れ2 ,動歩行の軌道生成や制御に関する要素がすべて
CPG や反射のパラメータに凝縮された.
軌道計画が存在せずトルクを出力する CPG と反射か
らなる単一系が,歩行の生成・制御のために用いられ
ている.
これらの利点は,さらに将来のより高度な不整地での自律
適応的な歩行への可能性を示している.例えば,パラメー
タ化やシステムとしての単一性は, 6.2. で述べたように
歩行生成・制御における最適化・適応・学習を簡単にする
であろう.
7 おわりに
動的で非常に柔軟な歩行を行う動物の神経系を参考にし
て,「リズム発生機構 (CPG)」にセンサ情報に基づく伸
張反射,前庭脊髄反射,伸展・屈曲反射などの「反射機
構」を組み込み,種々のパラメータを一定のまま四足ロ
ボットによる, 12 度程度の坂,高さ 3cm 程度の障害物,
うねりが続く中程度な不整地上の動歩行を実現した.こ
の実験により,本研究で提案する生物規範型制御があら
かじめ予想されていない不整地に対して自律的な適応性
を持つことが示された.また,視覚に基づく CPG への
指令入力の操作による,高さ 3cm の段差乗り越えや障害
物回避が実現された.いくつかの実験映像が WWW 上
(http://www. kimura.is.uec.ac.jp) で公開されている.
多賀のシミュレーション・モデル [5] では, CPG へ入
るセンサ情報は,伸張反射のための角度・角速度情報と,
それらを遊脚・支持脚で切り替える体性感覚のみであっ
た.それに対して本研究では, CPG へ入るセンサ情報と
して,腱反応のための支持脚負荷情報や伸展と屈曲のため
の興奮性信号を発生する接触情報などの体性感覚情報,重
力方向を知るための前庭感覚情報を追加し,より高度な不
整地での適応動歩行をロボットにより実現した.また,ア
クチュエータやセンサの違いにも関わらず,生物と同様な
手法により不整地での適応動歩行をロボットにおいて実現
したことにより,物理現象としての動歩行の本質は,動物
とロボットにおいて同一であることが示された.
小脳モデルに基づく運動の調節 [3],視覚情報に基づく
CPG への指令入力の学習的生成手法,ロール・ヨー面運
動の制御などが今後の課題となっている.
本研究は東電記念科学技術財団の研究助成を受けて行わ
れた.ここに関係各位への感謝の意を表します.
付録
Table.1
parameters
w
w
0
fe
ij
本研究で用いられたパラメータの値
value
0.05
0.6
1.5
-2
61
parameters
value
p ; p (Nm) 0.075, 0.12
k (1/rad)
8
k (1/rad)
5
k (sec/rad)
5.8
k
50
2 ステレオなどの視覚処理は除く
f
e
tsr
er
tr
fr
参
(1)
(2)
(3)
考
文
献
米田, [特集] リファレンス オブ リファレンス:脚移動, 日本
ロボット学会誌, 16-7, pp.897-901, 1998.
伊藤, 歩行運動とリズム生成, 日本ロボット学会誌, 11-3,
pp.320-325, 1993.
佐藤,「脳・神経と行動」:運動プログラムと行動出力,岩
波書店, pp.159-178, 1996.
(4) Collins, J.J. and Stewart, I.N., Coupled nonlinear oscillators and the symmetries of animal gaits, J. of Nonlinear Science, 3, pp.349-392, 1993.
(5) Taga, G., Yamaguchi, Y. and Shimizu, H., Self-organized
control of bipedal locomotion by neural oscillators, Biological Cybernetics, 65, pp.147-159, 1991.
(6) 宮腰,多賀,國吉,長久保,神経振動子を用いた三次元 2 足
足踏みシミュレーション - ヒューマノイドの実世界内行動を
目指して -,日本ロボット学会誌, 18-1, pp.87-93, 2000.
(7) 秋山, 木村:神経振動子を用いた四足動歩行 - ペース, ト
ロットの実現 -, 第 13 回日本ロボット学会学術講演会予稿
集, pp.227-228, 1995.
(8) 木村, 秋山, 桜間, 神経振動子を用いた四足ロボットの不整
地動歩行と整地走行, 日本ロボット学会誌, 16-8, pp.11381145, 1998 .
(9) Full, B., Biological inspiration: lessons from manylegged locomotors, Proc. of ISRR99, pp.279-284, 1999.
(10) Kimura, H., Fukuoka, Y. and Nakamura, H., Biologically inspired adaptive dynamic walking of the quadruped
on irregular terrain, Proc. of ISRR99, pp.271-278, 1999.
(11) Miura, H. and Shimoyama, I., Dynamical walk of biped
locomotion, Int. J. of Robotics Research, 3-2, pp.60-74,
1984.
(12) Raibert, M.H., Legged Robots That Balance, The MIT
Press, Cambridge, MA, 1986.
(13) Koditschek, D.E., and Buehler, M., Analysis of a simplied hopping robot, Int. J. of Robotics Research, 106, pp.587-605, 1991.
(14) Grillner, S., Control of locomotion in bipeds, tetrapods
and sh, In Handbook of Physiology, volume II, American Physiol. Society, Bethesda, MD, pp.1179-1236, 1981.
(15) Cohen, A.H. and Boothe, D.L., Sensorimotor Interactions During Locomotion: Principles Derived from Biological Systems, Autonomous Robotics, Vol.7, No.3,
pp.239-245, 1999.
(16) Drew, T., et al., Role of the motor cortex in the control
of visually triggered gait modications, Can. J. Physiol.
Pharmacol., 74, pp.426-442, 1996.
(17) Matsuoka, K., Mechanisms of Frequency and Pattern
Control in the Neural Rhythm Generators, Biological
Cybernetics, 56, pp.345-353, 1987.
(18) 福岡,四足動歩行ロボットにおける生物規範型制御の有効性,
電気通信大学情報システム学研究科・修士論文, 2000.
(19) Fukuoka, Y., Nakamura, H. and Kimura, H., BiologicallyInspired Adaptive Dynamic Walking of the Quadruped
on Irregular Terrain, Proc. of IROS99, pp.1657-1662,
1999.
(20) Pearson, K., et al., \Corrective responses to loss of
ground support during walking II, comparison of intact
and chronic spinal cats", J. of Neurophys., 71, pp.611622, 1994.
(21) 多賀, 歩行の創発, 日本ロボット学会誌, 15-5, pp.680-683,
1997.
(22) McGeer, T., Passive Dynamic Walking, Int. J. of Robotics
Research, 9-2, pp.62-82, 1990.
(23) Keir Pearson, The Control of Walking, Scientic American, Vol.234, No.6, pp.72-87, 1976.
(24) 木村, 下山, 三浦, 四足動歩行ロボットの力学的解析, 日本ロ
ボット学会誌, 6-4, pp.367-379, 1988.
(25) 下山,三浦,光石, 2 足歩行ロボット BIPER-4 の動歩行に
関する研究,日本機会学会論文集 (C), Vol.49, No.444,
pp.1372-1381, 1983.