潜水艇の自律性とニューロ ・コントロールの研究

4
1% 9% (
1
9
8
9.9)
生
産
研
HH Hl
l
日日 川 Il
l
HI
Hl
l
l
l
l
Hl
HH 日日l
Hll
l
川 = 川 Hl
H 川 H Hl
l
L
Hl
Hl
l
l
J
HH 川 I
l
r
川 =川 H H日日川 I
l
l
H= 州 H I
l
l
= 川 Hl
I
研
7
2
1
究
究
速
報
UDC6
2
9.
1
2
7.
0
5
潜水艇の自律性 とニ ューロ ・コン トロールの研究
St
u
d
yo
nAut
o
no
mya
ndNe
u
r
oCo
nt
r
o
lo
fUnd
e
r
wa
t
e
rVe
hi
c
l
e
s
藤
井
輝
夫*・浦
環*
Te
r
uoFUJ
I
IandTa
makiURA
1.現実的 な自律機械 のフ ィール ド
海水順応性 を考 える と,非常 に有望 で あ る.
ニ ュー ラル ・ネ ッ トの数学 モデルの一 つ として,PDP
自律行動 を行 う移動機械 の研究 は多方面 で行 われて い
モデル2)が提 案 され てい る. この回路網 の振 る舞 い はそ
る.陸上機械 を考 える と, コ ミュニケー シ ョン ・リンク
れ ぞれのニ ュー ロン素子 同士 の結合荷重 に よって与 えら
を通 じての リモー トコン トロールの力 は大 き く,移動機
れ る.バ ックプロパ ゲ- シ ョンを結合荷重 の決定手段 と
械 その ものが完全 に自律 的 にな らね ばな らない要求度 は
して用 い るのが一 派 的 な方法 と して確 立 しつ つ あ る.
低 い. しか し,深海 を移動 す る無索無人潜水艇 はコ ミュ
ニ ュー ロ ・コン トロールが有望 で あ るの は,限 られた入
ニ ケー シ ョン ・リンクが極 めて貧 しいため に, この制御
出力パ ター ンの学習 を行 うと, それ とは異 な る入力 に対
には完全 に近 い自律性 が要求 され る.
して も妥当 な制御 出力が得 られ る とい う性質 による.
2.海 水 順 応 性
潜水艇 の 自律制御 を とりま く環境 として,
(1)
艇 の運動 は数 ノ ッ トの範 囲で航 空機 等 に比 べ て非常
に遅 い.
3.潜水艇 のモデル
これ まで に検討 して きたグ ライダー型潜水艇 は海底面
に至 るまでの間,艇 をグライデ ィング させ て,水平方向
の移動 をエネルギー消費 な しに行 お う とす る もので,海
(2)浮力が利 用で きるた め,設計 の 自由度 が大 き く,色 々
な形状 を対 象 とす る可能性 があ る.
面 と海底 の高度差 を利 用す る. グライデ ィング航行 と海
底 面近傍 での運動 には先 に述 べ た よ うに自律性 の高 い制
(3)
制御 面 を自由に設計 で きる.
御 系が必 要 で あ る.前報 1)で は, セ ンサ, ア クチ ュエー
(4)
付加 質量が大 き く,急激 な運動 はで きない.
タ, スラスタを搭載 した 日航模型 PTEROA6
0を用 いて,
(5)
海底 面 の形状 ,外乱 の程度 が未知 で あ り, ロバ ス ト
回流水槽 内での 日航実験 を行 った. その結果,姿勢角あ
性 が必 要.
るいは深度 を制御情報 として用 いた簡単 なフィー ドバ ッ
(6)
艇 の位置 を正確 にセ ンシングす るこ とが困難 .
ク制御 によって,水平航行 させ る こ とがで きた.
な どが挙 げ られ る. これ らの項 目を満足 で きる制御 系 の
ここで は,制御対 象のダイナ ミクス を物理 的 に把握せ
Se
aWat
e
rFr
i
e
ndl
i
ne
s
s
:SWF) と
性 質 を海水順応性 (
ず に,艇 の運動制御 を行 うニ ュー ラル ・ネ ッ トを構築 す
呼 んでお く.
る ことを考 える. そのた めに, ファジー ・ア リゴ リズム
自律 型 潜 水艇 はその ミッシ ョンに よ り形 状 のバ ラエ
テ ィが考 え られ る.航空機 が重力 に打 ち勝 つた め に形が
おのず と決 って しまうの とは大 きな違 いで ある.形状 の
異 な る多数 の潜水艇 の制御 系 を通常 の手段 で設計 してい
によ り水平航行 を目標 とす る制御 系 を作 り, この結果 を
ニ ューラル ・ネ ッ トに学習 させ る.
4.PDPモデル,学 習則
て は,時間 と労力 が幾 らあって も足 りない. そ こで,学
PDPモデル2)は,一般 に入力層,中間層,出力層の 3層
習機能 や 自己組織能力 を有 す るニ ュー ロ ・コン トロール
か らな り,各層 に数個∼数十個 のニ ュー ロ ンを含 む もの
が海 水順 応 性 を満 足 す る制御 系 として浮 か び上 が る.
で ある. このモデルの特徴 は,層 内 にはニ ュー ロン問の
ニ ュー ロ .コン トロール は現在 の ところ, 陸上 の移動体
結合 が存在 せず,各層間のニ ュー ロ ンのみが結合 してい
の制御 手段 として ははな はだ不満 な面が あ るこ とは否定
る とい う点 で ある.
で きない. しか し,無索無人潜水艇 の制御 手段 として は
*
東 京大 学 生産 技術 研 究所
第 2部
第 n層 冒,第 i番 目のニ ュー ロンは,次 の式 に従 って
出力 Ⅹ 1
nを与 える もの とす る.
日日l
Hl
H1
日‖I
l
H日日HHl
I
H=l
‖l
l
Hl
日日=l
l
HL
日日‖l
l
l
l
川日日日日l
l
H日日HHl
‖l
H=l
L
l
Hl
l
l
日日l
l
HL
‖l
Hl
HHHl
日日HHHl
l
l
日日l
L
l
日日l
l
日日日日‖
3
7
722
研
究
41巻
9号 (19899)
生 産
研
究
報 lllllllllllllll!llIIlllIIIIIllllllllllllllllllllllllllllIlllllllllll!!│││││!llllll!llllllllllllllllllllllllll:││lllll
ベ ー タ角 δeを考 える。通常の線形 フ ィー ドバ ックでは釣
速
n l
島n = Σ w . n _ ¬
合状態 まわ りで,こ れ らの量 に関す る線形方程式 を考 え
xin =f(uin)
るが, こ こで は艇体 の水平航行状 態 が未知 で ある とした。
f(u)=1/(1+exp(―
u))
(1)
ここに,ui:ニ ュー ロンの膜電位,w.-1:第 n_1層
j
番 目の ニ ュー ロンか ら第 n tt i番目のニ ュー ロンヘ の結
水 中 にお ける航行体 の運動 は非常 に遅 い ためネ ッ トワー
合荷 重 , f:出 力関数 である。
ネ ッ トワー クの学習 はパ ックプ ロパ ゲー シ ョンによっ
る。 したが って, 3層 のネ ッ トワー クを考 えて,各 層 の
ニ ュー ロン数 を入 力層 2個 ,中 間層 5個 ,出 力層 1個 と
て行 う。 あ る入 力 に対 す る出力 層 か らの最終 的 なネ ッ ト
ワー ク出力 をolとし,そ の入 力 に対応 す る最 も望 ましい
す る (Fig.2参照).
クは,1秒 間隔程度 で,姿 勢角 の変化量△θ,深 度 の変化
量△dを入 力 として,エ レベ ー タ角 δeを出力す る もの とす
5.教
入力 をtlとす る。tiは教師信号 で外部 か ら与 えられ る もの
である。 この とき次 の ような二乗誤差 Eを 考 える。
師
信
号
艇 に関す る水 平航行状態,動 特性等 の情報 が 数式上 に
Eを 最 小 (厳密 に は極 小 )と す る よ うにw.nの 値 を次 の式
表 されて い ない条件下 で,妥 当な制御成績 を示す例 とし
て,フ ァジー制御 を考 える。前節 で述 べ た姿勢角,深 度
の変化量 に見合 う角度 (△δe)エレベ ー タを切 る とい う単
に 従 って 変 化 させ る。 w.nの pス テ ップ ロ の 変 化 量 を
純 なアル ゴ リズムを考 え,水 平航行 させ ることを目標 と
E==平
(ti-01)2
(2)
△w.n(p)と して
△w.n 1(p+1)
=η δinxjユ1+α △Wiin l(p)
Horizontal
(3)
δi は学 習 信 号 で 次 式 で 与 え られ る。 まず 出力 層 に関 して
o l ) f(′
δi n = ( t i ―
uin)
(4)
また 中 間 層 につ いて は
δkn+lwan
δin=f′
luln)Σ
(5)
で あ る。 (3)式 に現れ るηは学習係数 で結合荷重変化 の
/s
4oe
潜水艇 の縦運動 に関す る代表 的な量 は,姿 勢角 θ,お よ
び深度 dで あ る (Fig.1参照)。 また操縦量 として はエ レ
Z′
Fig.1
I
Lougitudinal Motion Con
∠d(m)is
Zθ(rad)is
Up
Neutral
Rule l
:区
-30 0 30
Down
Neutral
Up
→
-20
0
Rule
→
i区
-45 0 45
Down
l\
Up
→
-10 0 1o
Fig. 3
= 三二1 1 1 ] :
-45 0 45
Down
-10
Rule 4
i区
-45 0 45
UP
Layer
」δ
θ
(rad)is
0
-20
Down
Rule 2
then
→
J:
-30 0 30
Fig.2 PDP Model
o
い ヽこ z l
r
収束速度 を与 えるものであ り,α は安定化係数 で 結合荷
重変化 のll■
性 を規定す る もので ある。
Fuzzy Algorithm
-0
-45 0 45
生
41巻9号 (1989.9)
産
研
究
! l l l l l l l l l l l l l l l l l l l l l l l ! │ │ I I I I I ! │ │ │ │ l l ! l l l l l l l l l l l l l l l l l l l l l l l l l l l究
l l l l l速
l l l 1報
1111111111
一
ー
ー
ー
バ
の運動方
の運
を
として
ン
シ
動
ル
ル
を
1(m/s)で
非線形
お よび メ
定
ップ関 数 は
,艇
度
す る。各 フ ァジ
Fig.3のように した。ル ール 1, 2に 関 しては,△ d,△ θ
程式 で解 い たの。微分要素 を制御情報 としてい るため振
動 が見 られ るが ,40秒 程度 で姿勢角,深 度 ともに水 平航
に関す る条件 それぞれ についての適 合度 の積 を,ル ール
全体 に関す る適合度 として算出す る。 それぞれの適合度
ωl∼ω4に対応 す る出力yl∼y4を,次 式 の ように荷 重平均
して最終的 な出力 y°を求 める。す なわち
,* luoryr* a;:y. f
roll a2l cls|_aa
y。=望
△δe=y°
(6)
この フ ァジー ・
アル ゴ リズ ム を用 いて,PTEROA60の
制御 シ ミュレー シ ョンを行 った例 をFig 4に示す 。初期
値 は,姿 勢角 θ=0.3(rad),深度 d=0.5(m)と し,航 行速
行状態 に収束 して い る。
5。 ニ ュー ロ ・コン トロー ルのシ ミュ レー シ ョン
ー
前節 の フ アジー ・アル ゴ リズム による制御 パ タ ンを
ー
教師信号 として数万 回 の学習 をさせた後,ネ ッ トワ ク
に単独 で制御 を行 わせ る。教師信号 は,各 計算 ステ ップ
にお ける入出力信号 の対応 のみが意味 を持 つ。 したがっ
て時系列 デー タすべ ての学習 を行 うと多 くの時間 を要す
る とともに,入 出カパ ター ンに偏 りが起 こる。 そ こで,
ー
時系列 デー タか らラ ンダ ム に200組の入 出カ パ タ ン を
0“﹄
︶%
︵
抽 出 し,こ れ を教師信号 として与 え,学 習係数 η=0,9,
安定化係数 α=0.4(以 後 この値 は変 えない もの とす る)
とい う条件 で学習 を行わせ る→。また,制 御対 象,初 期値
お よび航 行速 度 は前節 と全 く同 じ もの とす る。 ニ ュー
ロ ・コン トロール の シ ミュレー シ ョンの例 をFig.5に不
-5
0
す 。この例 は十万 回学習後 の もので,教師信 号 で ある フ ァ
ジー制御 によるシ ミュレー シ ョンによヒベ て短 い時間 で水
平航行状態 に達 して い る。
次 に 初 期 姿 勢 角 θ=0(rad)で 計 算 を行 った 結 果 を
︵●‘﹄︶ だ
Fig.6に示す 。この場合 につ いて も,25秒程度 で これ まで
の例 と同 じ水平航行 状態 に収東 して い る。
7.実
T i m e( s )
Fie. 4
Simulation of Fuzzy Control of Longitudinal
Motion
験
ニ ュー ラル ・ネ ッ トがその特性 を最 も有効 に発揮す る
の は,計 算機 上 で はな く,実 際 の問題 に適用 した場合で
︶%
0“﹄
︵
0“■︶ヽ
︵
0
一
日︶0
͡
二 ―. 1
-.2
︵0“■︶ だ
う
︵
も”﹄︶、
一
20
Time(s)
T i m e( s )
Fig.5
Simulation of Neuro Control of Longitudina)
Motion ( 1)
Fig.6
Simulation of Neuro Control of Longitudinal
Motion ( 2 )
724
研
究
41巻 9号 (1989.9)
速
生
報 llllllllIIIII:││11111111111111111111!llllll1111111!111111111111111111111
づ“﹄
︵
︶ヽ
0”﹄︶ヽ
︵
︵0“ぃ︶ だ
︵0”﹄︶ だ
L 0
5
Fig. 7
産 研 究
Experiment of Neuro Control of Longitudinal
Motion ( 1 ) (MODEL: PTEROA60, Time History)
Fig. B
5
10
Time(s)
15
20
Experiment of Neuro Control of Longitudinal
Motion ( 2 ) (MODEL: PTEROA60,Time History)
ある と考 え られ る。 これ を確認 す るため,千 葉実験所 内
8.お
の風路付造波 回流水槽 において,自 航模型PTEROA60D
わ
り
に
幅
本論 で はニ ュー ラル ・ネ ッ トを用 い た制 御 が 外 乱 や制
30cm,全 厚 18cmの もので,重 心 は前方 か ら25.3cmの 位置
御 対 象 の変化 に対 して 柔軟 に対 応 し うる とい う予 測 の も
を用 い て 航 行 実 験 を行 った。模 型 は全 長 60cm,全
にあ る。水槽 の水路 は全深 lm,全
幅 1.8mで あ り,模 型
とに,自 律 型 潜水 艇 の将 来 の制 御 手段 と しての 可能性 を
の横 方向,上 下方向 の運動 は非常 に制限 され る。流速 は
検 討 す るた め,実 際 に模 型 を用 い た 自航 実験 を試 み た.
シ ミュ レー シ ョン に よって 収 東 が 確 認 され て い る フ ァ
0.7m/s一 定 とした。 また,実 験 の 際 に は電 気 的 な ノイ
ズ,流 速 の舌Lれ等不確定 な外乱 が考 えられ る。実際, 5
節 に述 べ た フ ァジー制御 で は,外 乱 に対 す る応 答 や水路
の寸法 による運動 の制限等 の理 由 で満足 に航行 させ るこ
とがで きなか った。
ジー ・アル ゴ リズ ム を教 師信 号 と して ネ ッ トワー ク に学
習 させ , こ れ を用 い て制 御 を行 う こ とに よ り,回 流水 槽
内 にお い て水 平航 行 させ る こ とに成 功 した 。
今 回 の 実験 の 結 果 か ら,ニ ュー ラル ・ネ ッ トはその特
実験 は,艇 体 の水 平航行状 態等の条件 を直接与 えず,
性 や将 来 の ハ ー ドウ ェア構 成 等 を考 え る と,自 律 形 潜 水
シ ミュレー シ ョンによる学習 のみで,ネ ッ トワー クに艇
艇 へ の応 用 に関 して,十 分期待 が持 て る。 当面 の課 題 と
の制御 をさせ水路 内 を水平航行 させ ることを 目標 とす る。
十万 回学習後 の ニ ュー ラル ・ネ ッ トに制御 を行 わ せた実
して は,教 師信 号 の選 択 方法 や ,実 機 レベ ル で の オ ンラ
イ ン学 習 ,ネ ッ トワー クに よる逆 シス テム の構 成 等 につ
験 の一 例 をFig.7に 示す。ニ ュー ロ・コ ン トロール の場 合
フ ァジー制御 と異 な り外乱 に対 して ロバ ス トで,ほ ぼ水
い て の検 討 が必 要 と考 え る。 (1989年
平 に航行 させ る ことがで きた。
次 にニ ュー ロ ・コン トロー ルが艇の運動特性 の変 化 に
対応 しうるか ど うか を確認 す る。 一般 に潜水艇 の縦運動
特性 は重心の前後 方向の位置 に大 き く影響 を受 けるので,
その重心位置 を全長 の0.5%だ け前方 に移動 させた。この
艇体 について,前 の例 と全 く同 じネ ッ トワー クで制御 を
行 った結果 をFig.8に 示す。この場合 も,ほ ぼ水平 に航行
してお り,ニ ュー ラル ・ネ ッ トは艇体仕様 の変化 に も柔
軟 に対応 して制御 を行 って い ることがわか る。
参 考 文
6月 1日 受理)
献
環 ,藤井輝夫 :グ ライダー型潜水艇の設計 に関す る
研究 (その 6),生 産研究,Vol.419(1989)
2) D.E. Ru■lelhart, L.1/11cClelland
」
and The PDP
Research GrOup: ParaHel Distributed Processing,
1)浦
The R41T Press(1986)
3 ) 大 坪新 一郎 : グ ライダー型潜水艇 の可能性 に関す る研
究, 東 京大学修士論文 ( 1 9 8 7 )
4 ) 横 山 正 : ニ ュー ラル ・
ネ ッ トによる海中航行体 の 自動
制御, 東 京大学修士論文 ( 1 9 8 9 )
5 ) 浦 環 , 前 田久明, 石 谷 久 : 深 海調査 のための 自律型
潜水艇 の開発研究, 第 9 回 海洋工学 シンポジウム講演集
(1989)近
刊