刊行のことば - コロナ社

□□□□□□□□□ 刊 行 の こ と ば □□□□□□□□□
ii
刊
行
の
こ
と
ば
□□□□□□□□□ ま
え が き □□□□□□□□□
最適制御問題とは,制御対象であるダイナミカルシステムに対して,与えられ
た評価関数を最小にするような制御入力を求める問題である。さまざまなシス
テムに対して評価関数さえ与えれば望ましい制御入力が求められるという問題
設定は一般的な制御系設計論として魅力的であり,1960 年代以降活発に研究さ
れた。しかし,限られた問題設定を除くと実際に解を計算するのが難しく,計
算機が未発達だったこともあって,線形システムの場合や一部の分野を除いて
徐々に廃れていった。また,有限時間の最適化という問題設定が継続的なフィー
ドバック制御には向かないという点も実用上の障害であった。有限時間の最適
化によって継続的なフィードバック制御を実現するモデル予測制御のもととな
るアイデアも最適制御と同じくらい古くまでさかのぼることができるが,過大
な計算量により実現困難なアイデアに長く留まっていた。
ところが,近年,計算機と数値解法の進歩により,非線形システムに対して
実時間で最適制御問題を解いてモデル予測制御などのフィードバック制御を実
現することがいよいよ可能になりつつある。制御対象を限定する代わりに厳密
な解析的結果を積み重ねてきた制御理論とは異なるアプローチであるが,制御
対象を限定せず数値計算によって制御系を設計する手法にも価値があると考え
られる。特に,非線形システムに対しては一般的な制御系設計手法が存在しな
いので,評価関数最小の意味で合理的な制御系を決定することが現時点で取り
うるアプローチの一つであることは確かである。さらに実時間での最適化手法
が発展すれば,制御系設計の枠組みが変わっていくほか,制御以外のさまざま
な分野への応用も期待できる。
このような背景を踏まえて,本書は,最適制御およびモデル予測制御につい
て興味を持った大学生・大学院生や技術者・研究者を対象として,最適化の基
iv
ま
え
が
き
礎から数値解法に関する最近の話題までを自己完結的かつ平易に解説すること
を目的とする。予備知識として,ベクトルと行列,多変数の微積分,そして常
微分方程式の基礎程度を想定している。おもに扱うのが有限時間の最適制御問
題であるため,必ずしも古典制御や現代制御のフィードバック制御理論を詳し
く学んでいる必要はない。ただし,例題として線形システムも取り上げるので,
状態空間表現に基づく線形制御理論を学んだ読者は,線形制御理論を別の観点
から眺めることができるだろう。
本書の構成とスタイルは,最適制御やモデル予測制御の論文に現れる基本用
語が一通りわかるようになることを念頭に置いて設定した。重要な概念や用語
は一通り網羅するように努め,かつ,あまり厳密性にこだわらないものの,概
念の意味や定理とアルゴリズムの導出過程についてはなるべく省略せず述べる
ようにした。ただし,本筋を見失わないよう,細部の式導出と証明や容易な拡
張については演習問題へ回した。本書を足がかりとして読者諸氏に最先端の研
究へ踏み出していただけたら幸甚である。
最後に,本書執筆に際してお世話になった方々への謝辞を記したい。恩師で
ある藤井裕矩先生には,本書の内容を含む制御工学の分野へ著者を導いていた
だいた。池田雅夫先生はじめ本シリーズ編集委員各位には,浅学非才の著者に
執筆の機会を与えていただき,構成や表現について助言をいただいた。図版作
成は留田直子さんに協力していただき,LATEX 入力の一部は片山聡君に協力し
ていただいた。橋本智昭先生と河野佑君からは草稿に対して貴重なコメントを
いただいた。研究室の学生諸君には校正を手伝っていただいた。コロナ社には
脱稿を待っていただくとともに,さまざまな面でお世話になった。ここに厚く
お礼申し上げたい。そして何より,家族の励ましと支えがなければ本書は出来
上がらなかっただろう。心からの感謝と共に本書を捧げたい。
2010 年 12 月
大塚敏之
□□□□□□□□□ 目
1. 序
次 □□□□□□□□□
論
1.1
最 適 化 と は ......................................................
1
1.2
制 御 と 最 適 化 ......................................................
8
1.3
数 学 的 表 記 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2. 非線形計画問題
2.1
問題設定と用語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2
拘束条件なしの場合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3
拘束条件付きの場合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.1
等式拘束条件の場合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.2
不等式拘束条件の場合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.3
カルーシュ・キューン・タッカー条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.4
拘束条件に関する諸注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4
拘束条件なし最適化問題の数値解法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.1
勾
2.4.2
ニュートン法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.4.3
準ニュートン法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.5
配
拘束条件付き最適化問題の数値解法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.5.1
ペナルティ法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.5.2
バ リ ア 法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.5.3
乗
2.5.4
逐次 2 次計画法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.6
直
数
線
法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
探
索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
vi
目
次
2.6.1
精密な直線探索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.6.2
粗 い 直 線 探 索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
演
習
問
題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3. 離散時間システムの最適制御
3.1
基本的な問題設定と停留条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2
離散時間 LQ 制御問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3
動 的 計 画 法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.1
ベルマン方程式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.2
ベルマン方程式からのオイラー・ラグランジュ方程式導出 . . . . . . . . . . . . 75
3.4
数
値
解
法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.4.1
基本的な問題設定の場合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.4.2
他 の 問 題 設 定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
演
習
問
題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4. 変
分
法
4.1
汎関数の停留条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2
拘束条件付き変分問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.3
第
4.4
ガトー微分とフレシェ微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
演
習
問
2
変
分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5. 連続時間システムの最適制御
5.1
基本的な問題設定と停留条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.2
局所最適性の十分条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.3
最 適 解 の 摂 動 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
目
vii
一般的な問題設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5.4
演
次
習
問
題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6. 動的計画法と最小原理
6.1
ハミルトン・ヤコビ・ベルマン方程式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
6.2
最
6.3
特異最適制御問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
演
習
問
小
原
理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7. 最適制御問題の数値解法
7.1
数値解法の考え方 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
7.2
勾
7.3
シューティング法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
7.4
入力関数のニュートン法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
7.5
他 の 問 題 設 定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.6
動 的 計 画 法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
演
習
問
法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
配
題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
8. モデル予測制御
8.1
問題設定と停留条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.1.1
モデル予測制御の問題設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.1.2
モデル予測制御の課題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
8.1.3
停 留 条 件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
8.2
8.2.1
数
値
解
法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
最適解の実時間方向への変化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
viii
次
8.2.2
随伴変数を追跡する数値解法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
8.2.3
実時間オイラー・ラグランジュ方程式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
8.2.4
制御入力系列を追跡する数値解法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
8.2.5
数値解法の実際 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
閉ループシステムの安定性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
8.3
演
目
8.3.1
想 定 す る 問 題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
8.3.2
終端拘束条件による安定性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
8.3.3
終端コストによる安定性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
習
問
題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
引用・参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
演習問題の解答 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
索
引 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
1
序
論
本章では,本書で扱う最適化問題を概観する。特に,ダイナミカルシス
テムの制御における最適化の役割について,新しい動向を含めて述べる
とともに,実際に制御問題へ最適化を適用する際に注意すべき点につい
ても整理しておく。併せて,本書を通じて用いる数学的表記をまとめる。
1.1 最 適 化 と は
何らかの自由変数を含む工学的問題では,最も望ましい結果を達成するよう
に自由変数を決めることがしばしば重要になる。特に,結果の望ましさが自由
変数の関数として実数値で表される場合,その関数を評価関数(performance
index)と呼び,自由変数を決定する問題は評価関数を最小化ないし最大化する自
由変数を求める問題に帰着される。このような問題を最適化問題(optimization
problem)といい,その解を最適解(optimal solution)という。現実的な最適
化問題において自由変数を選ぶ範囲は制限されることが多い。自由変数が最低
限満たさなければならない条件を拘束条件(constraint)という† 。評価関数の
符号を適宜付け替えることによって,評価関数はつねに最小化するものとして
も一般性を失わない。そこで,本書ではつねに最小化を考えることにする。以
†
評価関数を目的関数(objective function)やコスト関数(cost function)
,拘束条件を
制約条件と呼ぶこともある。
2
1. 序
論
下では,典型的な最適化問題がどのようなものか例を通じて説明する。
例 1.1 (数理計画問題) なるべく少ない量のプラスチックを使って与え
られた容積のコップを作る問題を考える。簡単のため形状は図 1.1 のよう
な円筒とする。コップの厚さは一定で十分薄いとすると,プラスチックの
量はコップの表面積で決まる。したがって,コップの半径を r ,高さを h
とすると,評価関数は
f (r, h) = 2πrh + πr2
となる。第 1 項は側面積,第 2 項は底面積を表す。一方,与えられた容積
を V とすると,拘束条件は
πr2 h = V
となる。この拘束条件を満たし評価関数 f (r, h) を最小にするように自由
変数 r, h を決定することで,所望のコップが設計できる。
h
r
図 1.1 円筒形のコップ
この例題のように自由変数が有限個の変数である最適化問題を数理計画問題
(mathematical programming problem)と呼ぶ。特に,評価関数と拘束条件が
1 次式の場合は線形計画問題(linear programming problem),2 次式の場合は
2 次計画問題(quadratic programming problem)とそれぞれ呼ぶ。線形計画
以外の問題を総称して非線形計画問題(nonlinear programming problem)と
1.1 最 適 化 と は
3
呼ぶ。前述の例 1.1 は手計算でも最適解が求められそうなくらい単純だが,よ
り実際的な工業製品の設計と生産を最適化しようとすれば,たくさんの部品の
仕様,価格,納期に加えて完成した製品の保管や輸送のコストも考慮して,利
益を最大化したり汚染物質の生成を最小化したりすることになる。したがって,
はるかに複雑な問題になって,解を求めるには計算機を使わざるを得ないだろ
うことは想像に難くない。
一般には,有限個の自由変数に限らず関数を決定したい場合も考えられる。
このとき,評価関数は,関数に対応して結果の望ましさを実数値として与える
ので,いわば関数の関数になる。関数の関数を汎関数(functional)と呼び,汎
関数を最大化ないし最小化する問題を変分問題(variational problem)と呼ぶ。
変分(variation)とは,関数の微分を汎関数に拡張した演算である。また,汎
関数の変数に相当する関数を変関数という。通常の変数と区別するため,汎関
数の変関数は [ ] で囲む。
例 1.2 (変分問題) 図 1.2 のように x 軸上の与えられた 2 点 (x0 , 0),
(xf , 0) を通り弧長一定の曲線 (x, y(x)) と x 軸とが囲む面積を最大にする
問題を考える。この場合の評価関数は,関数 y(x) を変関数とする以下の
汎関数である。
xf
J[y] =
x0
y(x)dx
また,曲線の弧長を l とすると,拘束条件は
y
y
(x)
J[y]
O
x0
xf
図 1.2 汎関数の例
x
4
1. 序
論
xf
y(x0 ) = 0,
y(xf ) = 0,
x0
1 + (y (x))2 dx = l
となる。
上記以外に,例えば空気抵抗が最小になるように飛翔体の形状を決める問題
も変分問題の例である。軸対称な形状を仮定すれば,飛翔体の形状は 1 変数関
数で記述でき,空気抵抗はその関数に依存して決まる汎関数と見なせる。そし
て,飛翔体の体積や寸法に対する制約が拘束条件を与える。また,多変数関数
の変分問題も考えることができ,例えば鉄道車両や飛行機の場合は軸対称な形
状に限定できないので,その形状は曲面を表す 2 変数関数によって記述される。
したがって,それらの空気抵抗を最小にする形状を求める問題は,2 変数関数
の変分問題になる。これら工学的問題のほか,自然現象の記述においても変分
問題は重要な役割を果たす。例えば,物体の運動や光の経路および弾性体の変
形がそれぞれある汎関数を最小にするという変分原理(variational principle)
が知られている。
さて,さまざまな制御の問題も,制御目的を評価関数の最小化として表すこ
とができれば最適化問題になる。例えば,何らかのフィードバック制御を想定
し,そのフィードバックゲインなどを自由変数と見なせば,制御系設計は数理
計画問題に帰着される。他方,制御対象のシステムに対する制御入力を変関数,
評価関数を汎関数と見なせば,制御問題は変分問題に帰着され,これを最適制
御問題(optimal control problem)という。また,最適制御問題において制御
入力を最適化する時刻の範囲を評価区間(horizon)といい,評価関数を最小に
する制御入力を最適制御(optimal control)という。
例 1.3 (最適制御問題) 単位質量を持つ質点の位置を x(t),制御入力と
して質点に加わる外力を u(t) として,質点の運動方程式 x
¨(t) = u(t) を考
える。そして,時刻 t = 0 で位置が x0 ,速度が v0 である質点を最短時間
で原点 O に到達かつ静止させる制御入力 u(t) を求める問題を考える(図
1.1 最 適 化 と は
u
5
v0
x0
O
x
図 1.3 質点を最短時間で移動させる最適制御問題
1.3)。ただし,制御入力 u(t) には大きさの制限があり,その絶対値が 1
以下であるとする。この場合,制御対象である質点の状態方程式は
⎡
⎤
x(t)
⎡
⎤
x(t)
˙
d ⎣
⎦=⎣
⎦
dt x(t)
˙
u(t)
であり,初期条件が x(0) = x0 ,x(0)
˙
= v0 で,終端条件が x(tf ) = 0,
x(t
˙ f ) = 0 で,それぞれ与えられる。そして,評価関数は J = tf であり,
制御入力 u(t) (0 <
= tf ) を変関数とする汎関数である。このように評
=t<
価区間の長さ自体が評価関数になる場合もある。拘束条件は,状態方程式
のほか,初期条件,終端条件,そして,|u(t)| <
= 1 である。
例えば,地球から月へロケットを飛ばす場合,地球上の発射地点で静止してい
る初期状態から月面の着陸地点で静止する終端状態へ最短時間で到達する最適
制御問題が考えられる。その際,推力の大きさや方向に拘束条件が課せられる
ことになる。もちろん,ロケットを支配する運動方程式も拘束条件である。ま
た,移動の時間を最小にする以外にも,燃料の消費量を最小にする問題なども
考えられる。拘束条件や評価関数に応じてどのような時間パターンで推力の大
きさと向きを与えればよいかは決して自明ではないし,到達時間や燃料消費量
を最小化することは月面到達の実現可能性やコストにとって重要であることも
明らかである。
例 1.3 のように,最適制御問題は有限な評価区間における制御入力を時刻の
関数として決める問題であることが多い。その場合,最適制御はフィードフォ
ワード制御として求められることになる。理想的な軌道をあらかじめ計画する
などの用途にはフィードフォワード制御であっても有用であるが,現実のシステ
ムを制御する際には,モデルの誤差や外乱による悪影響を抑制するためにフィー
6
1. 序
論
ドバック制御が用いられることが多い。そして,通常のフィードバック制御で
は,制御を行う時刻の範囲があらかじめ指定されることはなく,また,時刻では
なく状態の関数としてフィードバック制御則を決める。6 章で論じるように,あ
る種の偏微分方程式が解ければ最適制御が状態の関数として求められフィード
バック制御則を決定できるが,一般には解くのが非常に困難である。したがっ
て,線形システムに対する特殊な問題を除いて最適制御問題はフィードバック
制御にあまり適さない。
そこで,制御入力を時刻の関数として求めながらもフィードバック制御を行う
問題設定が考えられている。それがモデル予測制御(model predictive control)
である† 。この問題では,つねに現在の時刻を最適制御問題の初期時刻として有
限時間未来までの最適制御を求め,そしてその初期値のみを実際の制御入力と
して用いる。評価区間の長さを T として,各時刻 t で最小化すべきモデル予測
制御の評価関数を一般的な式で表せば
t+T
J = ϕ(x(t + T )) +
t
L(x(τ ), u(τ ), τ )dτ
となる。ここで,ϕ と L が制御の目的を表す関数である。評価区間は t から
t + T までなので,時刻 t とともに後退(recede)していくことになる。そのた
め,モデル予測制御は receding horizon 制御(receding horizon control)†† な
いし moving horizon 制御とも呼ばれる。上の評価関数を最小にする最適制御
を t から t + T までの時間関数として求め,その初期値のみを実際の制御入
力として制御対象に加える,という処理を各時刻 t ごとに行えば,結果的に状
態フィードバック制御が行える。なぜなら,評価区間における初期状態である
x(t) に依存して最適制御が決まるからである。
モデル予測制御において,各時刻で有限時間未来までの最適制御を求めてそ
の初期値のみを用いるという処理は,例えば自動車の運転との類似を考えると
わかりやすい。人間による自動車の運転も,時々刻々周りの状況に応じて運転
†
††
英語の頭文字を取って MPC という略称もよく用いられる。
英語の頭文字を取って RH 制御 または RHC という略称もしばしば用いられる。
□□□□□□□□□ 索
【あ】
RHC
RH 制御
値関数
アルミホ基準
6
6
70, 122, 182
57
【い】
1 次独立制約想定
陰関数定理
25
31
【う】
ウルフ条件
58
【え】
SQP 法
MHE
MPC
LQ 制御問題
53
8
6
65, 105, 127
【お】
オイラーの方程式
64, 88,
オイラー・ラグランジュ
方程式
64, 88,
黄金分割法
横断性条件
価値関数
70, 122
ガトー微分
98
カルーシュ・キューン・
タッカー条件
27
【き】
逆行列補題
共状態
共状態方程式
共 役
共役点
局所最適解
曲率条件
許容解
許容曲線
許容入力集合
許容変分
許容領域
切替え曲面
59
63, 103
64, 104
40
111
17
58
16
83
73
83
17
133
【く】
104
104
57
88
17
48
48
52
52
55
【け】
KKT 条件
懸垂曲線
27
92
【こ】
高位の無限小
降下法
降下方向
交差項
拘束条件
勾配ベクトル
勾配法
コスト関数
cost-to-go
固定端点問題
孤立局所最適解
1
70, 122
83
17
【さ】
クリロフ部分空間法 43, 177
【か】
開 球
外点ペナルティ法
外点法
拡張ラグランジュ関数
拡張ラグランジュ関数法
囲い込み
引 □□□□□□□□□
13
37
37
81, 119
1
14
37, 138
最急降下法
38, 139
最急降下方向
38
サイクロイド
90
最小原理
129, 131
最小燃料問題
134
最速降下線問題
88
最短時間問題
134
最適解
1, 17
最適化問題
1
最適コスト関数
70, 122
最適制御
4
最適制御問題
4, 61, 103
最適レギュレータ問題
65
【し】
GMRES 法
次元の呪い
実時間最適化
集積点
終端コスト
自由端点問題
終端ペナルティ
シューティング法
shrinking horizon
準正定
準ニュートン法
準負定
乗数法
初期推定解
177
74, 153
9
49
62, 102
83
62, 102
142
171
12
45
12
52, 151
36
索
強いルジャンドル条件
【す】
随伴システム
随伴変数
随伴方程式
数理計画問題
ステージコスト
スラック変数
64, 104
63, 103
64, 104
2
62, 102
35
【せ】
制御リアプノフ関数
正準方程式
64,
正 定
12,
制約条件
セカント方程式
積分拘束条件
遷移行列
119,
線形計画問題
186
104
183
1
46
91
143
2
【そ】
双 対
相補性条件
相補的
59
27, 181
59
【た】
大域的最適解
17
大域的に正定
186
第 1 変分
84
対 称
12
第 2 変分
84
ダビドン・フレッチャー・
パウエル法
46
ダミー変数
35
探索方向
37
【ち】
逐次 2 次計画法
直線探索
【つ】
DFP 法
停留解
停留条件
停留点
強いクレブシュ条件
110
強いルジャンドル・クレブ
110
シュ条件
97
【て】
46
20
20
20
【と】
等式拘束条件
等時線
動的計画法
特異弧
特異最適制御
凸計画問題
16
134
71, 125, 152
133
133
19
【な】
内 点
内点ペナルティ法
内点法
内部境界条件
50
50
50
120
【に】
2 次計画問題
2 次形式
2 次の勾配法
45,
2 次の十分条件
2 点境界値問題
65,
ニュートン法
ニュートン方向
入力アフィンシステム
ノルム
2
12
150
30
104
44
44
126
【の】
12
【は】
53
37
引
backward sweep
112, 146, 163
ハミルトン関数
63, 103
ハミルトン行列
147
ハミルトンの原理
92
ハミルトン・ヤコビ・ベル
マン方程式 124, 152, 182
219
ハミルトン・ヤコビ方程式
124, 127
バリア関数
50
バリア法
50, 150
汎関数
3, 82
半径方向非有界
186
バンバン制御
132
反復法
36
【ひ】
BFGS 法
非線形計画問題
評価関数
評価区間
46
2, 16
1
4, 62, 102
【ふ】
負 定
12, 183
不等式拘束条件
16
フレシェ導関数
98
フレシェ微分
98
フレッチャー・リーブス法
42, 141
ブロイデンの
1 パラメータ族
59
ブロイデン・フレッ
チャー・ゴールド
ファーブ・シャンノ法 46
【へ】
閉 包
ヘッセ行列
ペナルティ関数
ペナルティ乗数法
ペナルティ法
ベルマン方程式
変関数
変換法
変 分
変分原理
変分法
変分問題
50
14
48
52
48, 150
71
82
47
3, 83
4
82
3
220
索
引
【ほ】
ポラック・リビエ・
ポリャック法
42, 141
ボルザ問題
103
【む】
moving horizon 推定
8
【め】
メイヤー問題
有効制約
15
15
97, 111
【ゆ】
26
【よ】
103
【も】
目的関数
モデル予測制御
【や】
ヤコビアン
ヤコビ行列
ヤコビ条件
1
6, 156
弱いクレブシュ条件
弱いルジャンドル条件
110
97
【ら】
ラグランジュ関数
ラグランジュ乗数
24
24
ラグランジュの運動
方程式
ラグランジュ問題
92
103
【り】
リアプノフ関数
receding horizon 制御
183
6, 156
リッカチ微分方程式 96, 106
リッカチ方程式
67
隣接停留曲線
111
【わ】
ワイエルシュトラスの
定理
19
著者略歴
1990 年 東京都立科学技術大学工学部航空宇宙システム工学科卒業
1992 年 東京都立科学技術大学大学院工学研究科修士課程修了
(力学系システム工学専攻)
1995 年 東京都立科学技術大学大学院工学研究科博士課程修了
(工学システム専攻)
博士(工学)
1995 年 筑波大学講師
1999 年 大阪大学講師
2003 年 大阪大学助教授
2007 年 大阪大学教授
現在に至る
非線形最適制御入門
Introduction to Nonlinear Optimal Control
c Toshiyuki Ohtsuka 2011
2011 年 2 月 25 日 初版第 1 刷発行
おお
検印省略
著
者
発 行 者
印 刷 所
大
つか
とし
塚
ゆき
敏
之
株式会社
コロナ社
代 表 者
牛来真也
三美印刷株式会社
112–0011 東京都文京区千石 4–46–10
発行所
株式会社
コ
ロ
ナ
社
CORONA PUBLISHING CO., LTD.
Tokyo Japan
振替 00140–8–14844・電話(03)3941–3131(代)
ホームページ h
t
tp://www.
cor
onasha.
co.
j
p
ISBN 978–4–339–03318–2 (中原)(製本:愛千製本所)
Printed in Japan
無断複写・転載を禁ずる
落丁・乱丁本はお取替えいたします