Taylor の定理と極大・極小の判定 Taylor の定理を 2 変数の場合と、一般の n 変数の場合の両方のかたちで述べる. Taylor の定理 (2 変数の場合) f (x, y) を 2 変数 x, y の C ℓ -級の実数値関数とし, a, b, h, k を定数とすると、 ℓ−1 ∑ ∂ )p 1( ∂ h +k f (a, b) p ! ∂x ∂y p=1 ∂ )ℓ 1( ∂ +k + h f (a + θh, b + θk) ℓ ! ∂x ∂y f (a + h, b + k) = f (a, b) + を満たす実数( θ (0 < θ <)1) が存在する. p ∂ ∂ ここで、 h ∂x + k ∂y は形式的に二項定理により展開する. p ( ∂ ∑ ∂ )p p! ∂ pf h +k f (a, b) = hi k p−i i p−i (a, b) ∂x ∂y i ! (p − i) ! ∂x ∂y i=0 一般の n 変数の場合の Taylor の定理のために記号を用意する. h1 h2 ( ∂ ∂ ∂ ) , ,..., h = .. , ∇= ∂x1 ∂x2 ∂xn . hn n 次横ベクトル ( ∂f ∂f ∂f ) ∇f = , ,..., ∂x1 ∂x2 ∂xn を f (x) の gradient(勾配) という. h · ∇ = h1 ∂ ∂ ∂ + h2 + · · · + hn ∂x1 ∂x2 ∂xn とおく.これの p 乗 (h · ∇)p を展開すると (h · ∇)p = ∑ hi1 hi2 · · · hip 1≤i1 ,i2 ,...,ip ≤n = ∑ j1 +j2 +···+jn ∂p ∂xi1 ∂xi2 · · · ∂xip p! ∂p hj11 hj22 · · · hjnn j1 j2 j !j ! · · · jn ! ∂x1 ∂x2 · · · ∂xjnn =p 1 2 Taylor の定理 (n 変数の場合) f (x) を n 変数の C ℓ -級の実数値関数とし, a, h ∈ Rn とすると、 ℓ−1 ∑ 1 1 f (a + h) = f (a) + (h · ∇)p f (a) + (h · ∇)ℓ f (a + θh) p! ℓ! p=1 1 を満たす実数 θ (0 < θ < 1) が存在する. 証明 φ(t) = f (a + th) という 1 変数 t の関数を考える.1 変数関数の Taylor の定理に より ℓ−1 ∑ 1 1 (p) φ(1) = φ (0) + φ(ℓ) (θ) p! ℓ! p=0 を満たす実数 θ (0 < θ < 1) が存在する.合成関数の微分の公式により φ(t) の p 階導関数 φ(p) (t) は φ(p) (t) = (h · ∇)p f (a + th) なので、n 変数の場合の Taylor の定理が得られる. 定義 f (x) = f (x1 , x2 , . . . , xn ) を n 変数 x1 , x2 , . . . , xn の実数値関数、a ∈ Rn とする. 点 a の近くで常に f (x) ≤ f (a) であるとき、f (x) は点 a において極大値 f (a) をとると いう.同様に、点 a の近くで常に f (x) ≥ f (a) であるとき極小値 f (a) をとるという. 実数値関数 f (x) が点 a で極大値または極小値をとれば、xi 以外の n − 1 個の変数 xj (j ̸= i) に aj を代入して得られる 1 変数 xi の関数 f (a1 , . . . , ai−1 , xi , ai+1 , . . . , an ) は、点 xi = ai で極大値または極小値 f (a) をとるので、この xi の関数の点 xi = ai における微分 係数は 0 である.すなわち 定理 (極値をもつ必要条件) 微分可能な実数値関数 f (x) が点 a において極大値または 極小値をとれば、 ∂f (a) = 0, i = 1, 2, . . . , n ∂xi この条件を満たす点 a を特異点 (singular point) または臨界点 (critical point) という. 特異点であっても、その点で必ずしも極大あるいは極小になるとは限らない.極値の 判定には、上記のテイラーの定理と、次の二次形式の理論を用いる. S = (sij ) を n 次実対称行列、すなわち成分はすべて実数で sij = sji を満たすものと する. n ∑ Q(x) = sij xi xj i,j=1 を、S を係数行列とする二次形式 (quadratic form) という.すべての x ̸= 0 に対して Q(x) > 0 が成立するとき正定値 (positive definite)、Q(x) < 0 が成立するとき負定値 (negative definite) という.またすべての x ̸= 0 に対して Q(x) ̸= 0 で、Q(x) > 0 を満た す x が存在し、Q(x) < 0 を満たす x も存在するとき不定符号 (indefinite) という. 二次形式 Q(x) を行列の積で表すことにする.x を第 i 成分が xi の n × 1 行列と考える と、その転置行列 t x は第 i 成分が xi の 1 × n 行列であり、t x と S と x の積として Q(x) = n ∑ sij xi xj = t xSx i,j=1 と書くことができる. S に対して適当な n 次直交行列 P 、すなわち実数を成分とする正則行列で P −1 = t P を 満たす行列 P を選んで、t P SP が対角行列になるようにできる.t P SP の左上から i 番目の 2 対角成分を αi とおくと、α1 , α2 , . . . , αn は S の重複度を込めた固有値全体である.y = t P x とおくと、t y = t xP となるので、P −1 = t P に注意すると Q(x) = t xSx = t y(t P SP )y がわかる.t P SP も n 次実対称行列である.R(y) = t y(t P SP )y とおく.これは t P SP を 係数行列とする y に関する二次形式である.y の第 i 成分を yi とおく.yi は x1 , x2 , . . . , xn の 1 次式で表される.この変数変換により、もとの二次形式 Q(x) は R(y) = α1 y12 + α2 y22 + · · · + αn ynn という簡単な形に変形される.この R(y) の形から、固有値 α1 , α2 , . . . , αn の正負の符号 と二次形式 R(y) の正定値、負定値、および不定符号との関係は容易にわかる. S の左上の k × k の部分の行列の行列式 ∆k = s11 s12 · · · s1k s21 s22 · · · s2k .. .. . . . , . .. . . sk1 sk2 · · · skk k = 1, 2, . . . , n を S の主小行列式 (principal minor) という.k = n のときの ∆n は S の行列式である. 定理 S を係数行列とする二次形式 Q(x) について、次の3条件は同値である. (1) Q(x) は正定値. (2) S の固有値はすべて正. (3) すべての k = 1, 2, . . . , n について ∆k > 0. また、次の3条件も同値である. (1) Q(x) は負定値. (2) S の固有値はすべて負. (3) すべての k = 1, 2, . . . , n について (−1)k ∆k > 0. さらに、次の2条件も同値である. (1) Q(x) は不定符号. (2) S のどの固有値も 0 ではなく、正の固有値も負の固有値もある. C 2 -級の実数値関数 f (x) = f (x1 , x2 , . . . , xn ) と a ∈ Rn に対して、(i, j) 成分が ∂ 2f (a) ∂xi ∂xj である n 次対称行列を Hesse 行列 (Hessian) という.Hesse 行列の主小行列式を ∆k (a), k = 1, 2, . . . , n とおく.f (x) が C 2 -級関数だから、 ∂2f ∂ 2f = ∂xi ∂xj ∂xj ∂xi 3 が成立することに注意する. ∂f 点 a で ∂x (a) = 0 (1 ≤ i ≤ n) と仮定する.ℓ = 2 の場合の Taylor の定理により、 i n h ∈ R に対して n 1∑ ∂2f f (a + h) − f (a) = hi hj (a + θh) 2 i,j=1 ∂xi ∂xj を満たす実数 θ (0 < θ < 1) が存在する. ∂ 2f ∂ 2f (a + θh) → (a) とな ∂xi ∂xj ∂xi ∂xj る.Hesse 行列を係数行列とする h に関する二次形式を Q(h) とすれば、h → 0 のとき f (a + h) − f (a) の正負と Q(h) の正負は一致する.よって、二次形式 Q(h) が正定値なら ば 0 に近いすべての h ̸= 0 につて f (a + h) > f (a) となるので、f (x) は点 a で極小であ る.Q(h) が負定値あるいは不定符号の場合も、同様である. 以上の議論により、次の定理が得られる. f は C 2 -級の関数なので、ここで h → 0 とすると 定理 (極値の判定) C 2 -級の実数値関数 f (x) の特異点 a において、 (1) すべての k = 1, 2, . . . , n について ∆k (a) > 0 ならば、f (x) は点 a で極小である. (2) すべての k = 1, 2, . . . , n について (−1)k ∆k (a) > 0 ならば、f (x) は点 a で極大で ある. (3) ∆n (a) ̸= 0 で、(1) でも (2) でもないならば、f (x) は点 a で極大でも極小でもない. 注意 Hesse 行列のどの固有値も 0 でない場合は、上記の (1), (2), (3) のいずれかであ る.Hesse 行列の固有値として 0 がある場合、すなわち ∆n (a) = 0 の場合は、このままで は判定できない.さらに調べる必要がある.実際、極大になることも、極小になること も、また極大でも極小でもないこともある. 2 変数 x, y の C 2 -級の実数値関数 f (x, y) について、極大値、極小値を求める方法をま とめると、次のようになる. Step 1. 特異点 (a, b) を求める.すなわち ∂f (a, b) = 0, ∂x ∂f (a, b) = 0 ∂y を同時に満たす点 (a, b) を求める. Step 2. Step 1 で求めた特異点 (a, b) について、 ∆(a, b) = ∂2f (a, b) ∂x2 ∂2f (a, b) ∂y∂x ∂2f (a, b) ∂x∂y ∂2f (a, b) ∂y 2 ∂ 2f ∂ 2f = (a, b) (a, b) − ∂x2 ∂y 2 ( )2 ∂ 2f (a, b) ∂x∂y とおく. ∂ 2f (a, b) > 0 かつ ∆(a, b) > 0 ならば、f (x, y) は点 (a, b) で極小である. ∂x2 ∂ 2f (2) (a, b) < 0 かつ ∆(a, b) > 0 ならば、f (x, y) は点 (a, b) で極大である. ∂x2 (3) ∆(a, b) < 0 ならば、f (x, y) は点 (a, b) で極大でも極小でもない. (1) 4 (4) ∆(a, b) = 0 の場合はこのままでは判定できない.f (x, y) は点 (a, b) で極値をとる 場合もとらない場合もある. 例 f (x, y) = (x2 − y 2 )e−(x 2 +y 2 ) の極大値と極小値を求める. ∂f 2 2 = 2x(1 − x2 + y 2 )e−(x +y ) ∂x ∂f 2 2 = 2y(−1 − x2 + y 2 )e−(x +y ) ∂y だから、特異点 (a, b) は (0, 0), (±1, 0), (0, ±1) の 5 個である. ∂2f 2 2 = 2{(1 − 2x2 )(1 − x2 + y 2 ) − 2x2 }e−(x +y ) 2 ∂x ∂2f ∂ 2f 2 2 = = 4xy(x2 − y 2 )e−(x +y ) ∂x∂y ∂y∂x 2 ∂ f 2 2 = 2{2y 2 + (1 − 2y 2 )(−1 − x2 + y 2 )}e−(x +y ) 2 ∂y だから、 5 個の特異点についてそれぞれ調べることにより次の (i), (ii), (iii) がわかる. (i) 点 (0, 0) で f (x, y) は極大でも極小でもない. (ii) 点 (±1, 0) で f (x, y) は極大値 e−1 をとる. (iii) 点 (0, ±1) で f (x, y) は極小値 −e−1 をとる. 例 f (x, y) = x2 − y 2 について、 ∂f = 2x, ∂x ∂f = −2y ∂y だから、特異点は (0, 0) だけである.さらに Hesse 行列は ) ( 2 0 0 −2 だから、(0, 0) で極大でも極小でもない.このことは、f (0, y) = −y 2 ≤ 0 および f (x, 0) = x2 ≥ 0 から直感的にもわかる. 例 f (x, y) = (y − x2 )(y − 2x2 ) は、x2 < y < 2x2 の範囲では f (x, y) < 0 で、これ以外 の範囲では f (x, y) ≥ 0 である.よって、点 (0, 0) の近くで正の値も負の値もとる. ∂f = −6xy + 8x3 , ∂x ∂f = 2y − 3x2 ∂y だから、特異点は (0, 0) だけである.さらに ∂ 2f = −6x + 24x2 , ∂x2 だから、点 (0, 0) において Hesse 行列は ( ∂ 2f = −6x, ∂x∂y 0 0 0 2 ∂ 2f =2 ∂y 2 ) である.これは極値判定の定理において ∆(a, b) = 0 の場合である. 5 問題 次の x, y の関数 f (x, y) について ∂f ∂f (a, b) = (a, b) = 0 となる点 (a, b) をすべて求めよ. ∂x ∂y (注意.特異点がないものもある.) ( ∂ 2f )2 ∂2f ∂2f ∂ 2f (ii) 各特異点 (a, b) において 2 (a, b) と ∆(a, b) = (a, b) (a, b) − (a, b) ∂x ∂x2 ∂y 2 ∂x∂y を計算し、(a, b) で極大あるいは極小になるかどうか判定せよ.それだけで判定でき ない場合には、さらに工夫してみよ. (i) 特異点、すなわち (1) x2 + 2y 2 (2) x3 + y 4 (3) x2 + 2xy + y 2 − 4x − 2y (4) 2x3 + 5x2 + xy 2 + y 2 (5) x3 − xy + y 2 (6) x3 − 3xy + y 3 (7) x4 − xy + y 4 (8) e−(x (9) xye−(x (10) log x + 2 log y + log(4 − x − y) 2 +y 2 ) 6 2 +y 2 ) 解答とヒント 2 2 2 ∂ f (1) ∂f = 2x, ∂f = 4y だから、特異点は (0, 0) だけである. ∂∂xf2 = 2, ∂x∂y = 0, ∂∂yf2 = 4 ∂x ∂y だから、f (x, y) は (0, 0) で極小値 0 をとる.(注意.この結論は、f (x, y) = x2 + 2y 2 の形 から明らかである.) ∂f ∂x (2) ∂f ∂y = 3x2 , ∂2f ∂y 2 2 = 4y 3 だから、特異点は (0, 0) だけである. ∂∂xf2 = 6x, ∂2f ∂x∂y = 0, 2 = 12y だから、点 (0, 0) での状況は 2 階までの偏微分では判定できない.しかし、 f (x, 0) = x3 は x > 0 ならば正で x < 0 ならば負なので、点 (0, 0) で極大でも極小でもない. (3) ∂f = 2x + 2y − 4, ∂f = 2x + 2y − 2 だから、この 2 つが同時に 0 になるような点 ∂x ∂y は存在しないので、特異点はない.よって、f (x, y) は極大にも極小にもならない.(注意. s = x + y, t = x − y とおくと、f (x, y) は (s − 23 )2 − t − 94 となる.) ∂f ∂x (4) ∂f ∂y = 6x2 + 10x + y 2 , = 2y(x + 1) だから、特異点は (0, 0), (− 53 , 0), (−1, 2), 2 2 2 ∂ f (−1, −2) の 4 個である. ∂∂xf2 = 12x + 10, ∂x∂y = 2y, ∂∂yf2 = 2(x + 1) だから、f (x, y) は点 (0, 0) で極小値 0 をとり、点 (− 35 , 0) で極大値 125 をとる.点 (−1, 2) および (−1, −2) では 27 極大でも極小でもない. ∂f ∂x (5) = 3x2 − y, ∂2f ∂x∂y ∂f ∂y 2 1 = 2y − x だから、特異点は (0, 0), ( 16 , 12 ) の 2 個である. ∂∂xf2 = 6x, 2 1 1 = −1, ∂∂yf2 = 2 だから、f (x, y) は点 ( 16 , 12 ) で極小値 − 432 をとる.点 (0, 0) では極大 でも極小でもない. ∂f ∂x (6) = 3x2 − 3y, ∂2f ∂x∂y ∂f ∂y 2 = 3y 2 − 3x だから、特異点は (0, 0), (1, 1) の 2 個である.∂∂xf2 = 6x, 2 = −3, ∂∂yf2 = 6y だから、f (x, y) は点 (1, 1) で極小値 −1 をとる.点 (0, 0) では極大で も極小でもない. ∂f ∂x (7) ∂2f ∂x2 − 18 = 4x3 − y, ∂f ∂y = 4y 3 − x だから、特異点は (0, 0), ( 12 , 12 ), (− 12 , − 21 ) の 3 個である. 2 2 ∂ f = 12x2 , ∂x∂y = −1, ∂∂yf2 = 12y 2 だから、f (x, y) は点 ( 21 , 12 ) および (− 21 , − 21 ) で極小値 をとる.点 (0, 0) では極大でも極小でもない. (8) = −2xe−(x ∂f ∂x 2 2 +y 2 ) , ∂f ∂y = −2ye−(x 2 2 +y 2 ) 2 だから、特異点は (0, 0) だけである. ∂∂xf2 = 2 ∂ f 2(2x − 1)e−(x +y ) , ∂x∂y = 4xye−(x +y ) , ∂∂yf2 = 2(2y 2 − 1)e−(x +y ) だから、f (x, y) は点 2 2 (0, 0) で極大値 1 をとる.(注意.この結論は、f (x, y) = e−(x +y ) の形から明らかである.) (9) ∂f ∂x 2 2 = (y−2x2 y)e−(x 2 +y 2 ) 2 2 , ∂f ∂y 2 2 2 = (x−2xy 2 )e−(x 2 +y 2 ) の 5 個である. ∂∂xf2 = 2xy(2x − 3)e−(x 2 2 だから、特異点は (0, 0), (± √12 , ± √12 ) 2 ∂ f , ∂x∂y = (1 − 2x2 )(1 − 2y 2 )e−(x +y ) , ∂∂yf2 = 2 2 1 2xy(2y 2 − 3)e−(x +y ) だから、f (x, y) は点 ( √12 , √12 ) および (− √12 , − √12 ) で極大値 2e をと 1 1 1 1 1 り、点 ( √2 , − √2 ) および (− √2 , √2 ) で極小値 − 2e をとる.点 (0, 0) では極大でも極小でも ない. ∂f ∂x 1 x 2 である. ∂∂xf2 (10) = 1 − 4−x−y = 4−2x−y , ∂f x(4−x−y) ∂y ∂2f 1 , ∂x∂y (4−x−y)2 = 2 +y 2 ) 2 y 1 − 4−x−y = 1 = − x12 − = − (4−x−y) 2, は点 (1, 2) で極大値 2 log 2 をとる. 7 2 2 8−2x−3y だから、特異点は (1, 2) だけ y(4−x−y) ∂2f 1 = − y22 − (4−x−y) 2 だから、f (x, y) ∂y 2
© Copyright 2024 ExpyDoc