Taylorの定理と極大・極小の判定

Taylor の定理と極大・極小の判定
Taylor の定理を 2 変数の場合と、一般の n 変数の場合の両方のかたちで述べる.
Taylor の定理 (2 変数の場合) f (x, y) を 2 変数 x, y の C ℓ -級の実数値関数とし, a, b,
h, k を定数とすると、
ℓ−1
∑
∂ )p
1( ∂
h
+k
f (a, b)
p
!
∂x
∂y
p=1
∂ )ℓ
1( ∂
+k
+
h
f (a + θh, b + θk)
ℓ ! ∂x
∂y
f (a + h, b + k) = f (a, b) +
を満たす実数( θ (0 < θ <)1) が存在する.
p
∂
∂
ここで、 h ∂x
+ k ∂y
は形式的に二項定理により展開する.
p
( ∂
∑
∂ )p
p!
∂ pf
h
+k
f (a, b) =
hi k p−i i p−i (a, b)
∂x
∂y
i ! (p − i) !
∂x ∂y
i=0
一般の n 変数の場合の Taylor の定理のために記号を用意する.
 
h1
 h2 
( ∂
∂
∂ )
 
,
,...,
h =  ..  ,
∇=
∂x1 ∂x2
∂xn
.
hn
n 次横ベクトル
( ∂f
∂f
∂f )
∇f =
,
,...,
∂x1 ∂x2
∂xn
を f (x) の gradient(勾配) という.
h · ∇ = h1
∂
∂
∂
+ h2
+ · · · + hn
∂x1
∂x2
∂xn
とおく.これの p 乗 (h · ∇)p を展開すると
(h · ∇)p =
∑
hi1 hi2 · · · hip
1≤i1 ,i2 ,...,ip ≤n
=
∑
j1 +j2 +···+jn
∂p
∂xi1 ∂xi2 · · · ∂xip
p!
∂p
hj11 hj22 · · · hjnn j1 j2
j !j ! · · · jn !
∂x1 ∂x2 · · · ∂xjnn
=p 1 2
Taylor の定理 (n 変数の場合) f (x) を n 変数の C ℓ -級の実数値関数とし, a, h ∈ Rn
とすると、
ℓ−1
∑
1
1
f (a + h) = f (a) +
(h · ∇)p f (a) + (h · ∇)ℓ f (a + θh)
p!
ℓ!
p=1
1
を満たす実数 θ (0 < θ < 1) が存在する.
証明 φ(t) = f (a + th) という 1 変数 t の関数を考える.1 変数関数の Taylor の定理に
より
ℓ−1
∑
1
1 (p)
φ(1) =
φ (0) + φ(ℓ) (θ)
p!
ℓ!
p=0
を満たす実数 θ (0 < θ < 1) が存在する.合成関数の微分の公式により φ(t) の p 階導関数
φ(p) (t) は
φ(p) (t) = (h · ∇)p f (a + th)
なので、n 変数の場合の Taylor の定理が得られる.
定義 f (x) = f (x1 , x2 , . . . , xn ) を n 変数 x1 , x2 , . . . , xn の実数値関数、a ∈ Rn とする.
点 a の近くで常に f (x) ≤ f (a) であるとき、f (x) は点 a において極大値 f (a) をとると
いう.同様に、点 a の近くで常に f (x) ≥ f (a) であるとき極小値 f (a) をとるという.
実数値関数 f (x) が点 a で極大値または極小値をとれば、xi 以外の n − 1 個の変数
xj (j ̸= i) に aj を代入して得られる 1 変数 xi の関数 f (a1 , . . . , ai−1 , xi , ai+1 , . . . , an ) は、点
xi = ai で極大値または極小値 f (a) をとるので、この xi の関数の点 xi = ai における微分
係数は 0 である.すなわち
定理 (極値をもつ必要条件) 微分可能な実数値関数 f (x) が点 a において極大値または
極小値をとれば、
∂f
(a) = 0, i = 1, 2, . . . , n
∂xi
この条件を満たす点 a を特異点 (singular point) または臨界点 (critical point) という.
特異点であっても、その点で必ずしも極大あるいは極小になるとは限らない.極値の
判定には、上記のテイラーの定理と、次の二次形式の理論を用いる.
S = (sij ) を n 次実対称行列、すなわち成分はすべて実数で sij = sji を満たすものと
する.
n
∑
Q(x) =
sij xi xj
i,j=1
を、S を係数行列とする二次形式 (quadratic form) という.すべての x ̸= 0 に対して
Q(x) > 0 が成立するとき正定値 (positive definite)、Q(x) < 0 が成立するとき負定値
(negative definite) という.またすべての x ̸= 0 に対して Q(x) ̸= 0 で、Q(x) > 0 を満た
す x が存在し、Q(x) < 0 を満たす x も存在するとき不定符号 (indefinite) という.
二次形式 Q(x) を行列の積で表すことにする.x を第 i 成分が xi の n × 1 行列と考える
と、その転置行列 t x は第 i 成分が xi の 1 × n 行列であり、t x と S と x の積として
Q(x) =
n
∑
sij xi xj = t xSx
i,j=1
と書くことができる.
S に対して適当な n 次直交行列 P 、すなわち実数を成分とする正則行列で P −1 = t P を
満たす行列 P を選んで、t P SP が対角行列になるようにできる.t P SP の左上から i 番目の
2
対角成分を αi とおくと、α1 , α2 , . . . , αn は S の重複度を込めた固有値全体である.y = t P x
とおくと、t y = t xP となるので、P −1 = t P に注意すると
Q(x) = t xSx = t y(t P SP )y
がわかる.t P SP も n 次実対称行列である.R(y) = t y(t P SP )y とおく.これは t P SP を
係数行列とする y に関する二次形式である.y の第 i 成分を yi とおく.yi は x1 , x2 , . . . , xn
の 1 次式で表される.この変数変換により、もとの二次形式 Q(x) は
R(y) = α1 y12 + α2 y22 + · · · + αn ynn
という簡単な形に変形される.この R(y) の形から、固有値 α1 , α2 , . . . , αn の正負の符号
と二次形式 R(y) の正定値、負定値、および不定符号との関係は容易にわかる.
S の左上の k × k の部分の行列の行列式
∆k =
s11 s12 · · · s1k
s21 s22 · · · s2k
..
.. . .
. ,
. ..
.
.
sk1 sk2 · · · skk
k = 1, 2, . . . , n
を S の主小行列式 (principal minor) という.k = n のときの ∆n は S の行列式である.
定理 S を係数行列とする二次形式 Q(x) について、次の3条件は同値である.
(1) Q(x) は正定値.
(2) S の固有値はすべて正.
(3) すべての k = 1, 2, . . . , n について ∆k > 0.
また、次の3条件も同値である.
(1) Q(x) は負定値.
(2) S の固有値はすべて負.
(3) すべての k = 1, 2, . . . , n について (−1)k ∆k > 0.
さらに、次の2条件も同値である.
(1) Q(x) は不定符号.
(2) S のどの固有値も 0 ではなく、正の固有値も負の固有値もある.
C 2 -級の実数値関数 f (x) = f (x1 , x2 , . . . , xn ) と a ∈ Rn に対して、(i, j) 成分が
∂ 2f
(a)
∂xi ∂xj
である n 次対称行列を Hesse 行列 (Hessian) という.Hesse 行列の主小行列式を
∆k (a),
k = 1, 2, . . . , n
とおく.f (x) が C 2 -級関数だから、
∂2f
∂ 2f
=
∂xi ∂xj
∂xj ∂xi
3
が成立することに注意する.
∂f
点 a で ∂x
(a) = 0 (1 ≤ i ≤ n) と仮定する.ℓ = 2 の場合の Taylor の定理により、
i
n
h ∈ R に対して
n
1∑
∂2f
f (a + h) − f (a) =
hi hj
(a + θh)
2 i,j=1
∂xi ∂xj
を満たす実数 θ (0 < θ < 1) が存在する.
∂ 2f
∂ 2f
(a + θh) →
(a) とな
∂xi ∂xj
∂xi ∂xj
る.Hesse 行列を係数行列とする h に関する二次形式を Q(h) とすれば、h → 0 のとき
f (a + h) − f (a) の正負と Q(h) の正負は一致する.よって、二次形式 Q(h) が正定値なら
ば 0 に近いすべての h ̸= 0 につて f (a + h) > f (a) となるので、f (x) は点 a で極小であ
る.Q(h) が負定値あるいは不定符号の場合も、同様である.
以上の議論により、次の定理が得られる.
f は C 2 -級の関数なので、ここで h → 0 とすると
定理 (極値の判定) C 2 -級の実数値関数 f (x) の特異点 a において、
(1) すべての k = 1, 2, . . . , n について ∆k (a) > 0 ならば、f (x) は点 a で極小である.
(2) すべての k = 1, 2, . . . , n について (−1)k ∆k (a) > 0 ならば、f (x) は点 a で極大で
ある.
(3) ∆n (a) ̸= 0 で、(1) でも (2) でもないならば、f (x) は点 a で極大でも極小でもない.
注意 Hesse 行列のどの固有値も 0 でない場合は、上記の (1), (2), (3) のいずれかであ
る.Hesse 行列の固有値として 0 がある場合、すなわち ∆n (a) = 0 の場合は、このままで
は判定できない.さらに調べる必要がある.実際、極大になることも、極小になること
も、また極大でも極小でもないこともある.
2 変数 x, y の C 2 -級の実数値関数 f (x, y) について、極大値、極小値を求める方法をま
とめると、次のようになる.
Step 1. 特異点 (a, b) を求める.すなわち
∂f
(a, b) = 0,
∂x
∂f
(a, b) = 0
∂y
を同時に満たす点 (a, b) を求める.
Step 2. Step 1 で求めた特異点 (a, b) について、
∆(a, b) =
∂2f
(a, b)
∂x2
∂2f
(a, b)
∂y∂x
∂2f
(a, b)
∂x∂y
∂2f
(a, b)
∂y 2
∂ 2f
∂ 2f
=
(a,
b)
(a, b) −
∂x2
∂y 2
(
)2
∂ 2f
(a, b)
∂x∂y
とおく.
∂ 2f
(a, b) > 0 かつ ∆(a, b) > 0 ならば、f (x, y) は点 (a, b) で極小である.
∂x2
∂ 2f
(2)
(a, b) < 0 かつ ∆(a, b) > 0 ならば、f (x, y) は点 (a, b) で極大である.
∂x2
(3) ∆(a, b) < 0 ならば、f (x, y) は点 (a, b) で極大でも極小でもない.
(1)
4
(4) ∆(a, b) = 0 の場合はこのままでは判定できない.f (x, y) は点 (a, b) で極値をとる
場合もとらない場合もある.
例 f (x, y) = (x2 − y 2 )e−(x
2 +y 2 )
の極大値と極小値を求める.
∂f
2
2
= 2x(1 − x2 + y 2 )e−(x +y )
∂x
∂f
2
2
= 2y(−1 − x2 + y 2 )e−(x +y )
∂y
だから、特異点 (a, b) は (0, 0), (±1, 0), (0, ±1) の 5 個である.
∂2f
2
2
= 2{(1 − 2x2 )(1 − x2 + y 2 ) − 2x2 }e−(x +y )
2
∂x
∂2f
∂ 2f
2
2
=
= 4xy(x2 − y 2 )e−(x +y )
∂x∂y
∂y∂x
2
∂ f
2
2
= 2{2y 2 + (1 − 2y 2 )(−1 − x2 + y 2 )}e−(x +y )
2
∂y
だから、 5 個の特異点についてそれぞれ調べることにより次の (i), (ii), (iii) がわかる.
(i) 点 (0, 0) で f (x, y) は極大でも極小でもない.
(ii) 点 (±1, 0) で f (x, y) は極大値 e−1 をとる.
(iii) 点 (0, ±1) で f (x, y) は極小値 −e−1 をとる.
例 f (x, y) = x2 − y 2 について、
∂f
= 2x,
∂x
∂f
= −2y
∂y
だから、特異点は (0, 0) だけである.さらに Hesse 行列は
)
(
2 0
0 −2
だから、(0, 0) で極大でも極小でもない.このことは、f (0, y) = −y 2 ≤ 0 および f (x, 0) =
x2 ≥ 0 から直感的にもわかる.
例 f (x, y) = (y − x2 )(y − 2x2 ) は、x2 < y < 2x2 の範囲では f (x, y) < 0 で、これ以外
の範囲では f (x, y) ≥ 0 である.よって、点 (0, 0) の近くで正の値も負の値もとる.
∂f
= −6xy + 8x3 ,
∂x
∂f
= 2y − 3x2
∂y
だから、特異点は (0, 0) だけである.さらに
∂ 2f
= −6x + 24x2 ,
∂x2
だから、点 (0, 0) において Hesse 行列は
(
∂ 2f
= −6x,
∂x∂y
0 0
0 2
∂ 2f
=2
∂y 2
)
である.これは極値判定の定理において ∆(a, b) = 0 の場合である.
5
問題
次の x, y の関数 f (x, y) について
∂f
∂f
(a, b) =
(a, b) = 0 となる点 (a, b) をすべて求めよ.
∂x
∂y
(注意.特異点がないものもある.)
( ∂ 2f
)2
∂2f
∂2f
∂ 2f
(ii) 各特異点 (a, b) において 2 (a, b) と ∆(a, b) =
(a,
b)
(a,
b)
−
(a,
b)
∂x
∂x2
∂y 2
∂x∂y
を計算し、(a, b) で極大あるいは極小になるかどうか判定せよ.それだけで判定でき
ない場合には、さらに工夫してみよ.
(i) 特異点、すなわち
(1) x2 + 2y 2
(2) x3 + y 4
(3) x2 + 2xy + y 2 − 4x − 2y
(4) 2x3 + 5x2 + xy 2 + y 2
(5) x3 − xy + y 2
(6) x3 − 3xy + y 3
(7) x4 − xy + y 4
(8) e−(x
(9) xye−(x
(10) log x + 2 log y + log(4 − x − y)
2 +y 2 )
6
2 +y 2 )
解答とヒント
2
2
2
∂ f
(1) ∂f
= 2x, ∂f
= 4y だから、特異点は (0, 0) だけである. ∂∂xf2 = 2, ∂x∂y
= 0, ∂∂yf2 = 4
∂x
∂y
だから、f (x, y) は (0, 0) で極小値 0 をとる.(注意.この結論は、f (x, y) = x2 + 2y 2 の形
から明らかである.)
∂f
∂x
(2)
∂f
∂y
= 3x2 ,
∂2f
∂y 2
2
= 4y 3 だから、特異点は (0, 0) だけである. ∂∂xf2 = 6x,
∂2f
∂x∂y
= 0,
2
= 12y だから、点 (0, 0) での状況は 2 階までの偏微分では判定できない.しかし、
f (x, 0) = x3 は x > 0 ならば正で x < 0 ならば負なので、点 (0, 0) で極大でも極小でもない.
(3) ∂f
= 2x + 2y − 4, ∂f
= 2x + 2y − 2 だから、この 2 つが同時に 0 になるような点
∂x
∂y
は存在しないので、特異点はない.よって、f (x, y) は極大にも極小にもならない.(注意.
s = x + y, t = x − y とおくと、f (x, y) は (s − 23 )2 − t − 94 となる.)
∂f
∂x
(4)
∂f
∂y
= 6x2 + 10x + y 2 ,
= 2y(x + 1) だから、特異点は (0, 0), (− 53 , 0), (−1, 2),
2
2
2
∂ f
(−1, −2) の 4 個である. ∂∂xf2 = 12x + 10, ∂x∂y
= 2y, ∂∂yf2 = 2(x + 1) だから、f (x, y) は点
(0, 0) で極小値 0 をとり、点 (− 35 , 0) で極大値 125
をとる.点 (−1, 2) および (−1, −2) では
27
極大でも極小でもない.
∂f
∂x
(5)
= 3x2 − y,
∂2f
∂x∂y
∂f
∂y
2
1
= 2y − x だから、特異点は (0, 0), ( 16 , 12
) の 2 個である. ∂∂xf2 = 6x,
2
1
1
= −1, ∂∂yf2 = 2 だから、f (x, y) は点 ( 16 , 12
) で極小値 − 432
をとる.点 (0, 0) では極大
でも極小でもない.
∂f
∂x
(6)
= 3x2 − 3y,
∂2f
∂x∂y
∂f
∂y
2
= 3y 2 − 3x だから、特異点は (0, 0), (1, 1) の 2 個である.∂∂xf2 = 6x,
2
= −3, ∂∂yf2 = 6y だから、f (x, y) は点 (1, 1) で極小値 −1 をとる.点 (0, 0) では極大で
も極小でもない.
∂f
∂x
(7)
∂2f
∂x2
− 18
= 4x3 − y,
∂f
∂y
= 4y 3 − x だから、特異点は (0, 0), ( 12 , 12 ), (− 12 , − 21 ) の 3 個である.
2
2
∂ f
= 12x2 , ∂x∂y
= −1, ∂∂yf2 = 12y 2 だから、f (x, y) は点 ( 21 , 12 ) および (− 21 , − 21 ) で極小値
をとる.点 (0, 0) では極大でも極小でもない.
(8)
= −2xe−(x
∂f
∂x
2
2 +y 2 )
,
∂f
∂y
= −2ye−(x
2
2 +y 2 )
2
だから、特異点は (0, 0) だけである. ∂∂xf2 =
2
∂ f
2(2x − 1)e−(x +y ) , ∂x∂y
= 4xye−(x +y ) , ∂∂yf2 = 2(2y 2 − 1)e−(x +y ) だから、f (x, y) は点
2
2
(0, 0) で極大値 1 をとる.(注意.この結論は、f (x, y) = e−(x +y ) の形から明らかである.)
(9)
∂f
∂x
2
2
= (y−2x2 y)e−(x
2 +y 2 )
2
2
,
∂f
∂y
2
2
2
= (x−2xy 2 )e−(x
2 +y 2 )
の 5 個である. ∂∂xf2 = 2xy(2x − 3)e−(x
2
2
だから、特異点は (0, 0), (± √12 , ± √12 )
2
∂ f
, ∂x∂y
= (1 − 2x2 )(1 − 2y 2 )e−(x +y ) , ∂∂yf2 =
2
2
1
2xy(2y 2 − 3)e−(x +y ) だから、f (x, y) は点 ( √12 , √12 ) および (− √12 , − √12 ) で極大値 2e
をと
1
1
1
1
1
り、点 ( √2 , − √2 ) および (− √2 , √2 ) で極小値 − 2e をとる.点 (0, 0) では極大でも極小でも
ない.
∂f
∂x
1
x
2
である. ∂∂xf2
(10)
=
1
− 4−x−y
=
4−2x−y
, ∂f
x(4−x−y) ∂y
∂2f
1
, ∂x∂y
(4−x−y)2
=
2 +y 2 )
2
y
1
− 4−x−y
=
1
= − x12 −
= − (4−x−y)
2,
は点 (1, 2) で極大値 2 log 2 をとる.
7
2
2
8−2x−3y
だから、特異点は (1, 2) だけ
y(4−x−y)
∂2f
1
= − y22 − (4−x−y)
2 だから、f (x, y)
∂y 2