Kurzskript zur Vorlesung

KAPITEL 1
Mehrdimensionale Funktionen
1. Abstände und Normen
Definition 1.1 (Norm). Sei V ein Vektorraum über einem Körper K mit K = R oder K = C. Eine
Abbildung k · k : V → R nennt man Norm, falls die folgenden drei Bedingungen erfüllt sind: (i) Für
x = 0 gilt kxk = 0 und für jedes x ∈ V \ {0} gilt kxk > 0. (ii) Für jedes x ∈ V und jedes λ ∈ R gilt
kλxk = |λ| kxk. (iii) Für alle x, y ∈ V gilt kx + yk ≤ kxk + kyk (Dreiecksungleichung).
p
Definition 1.2. Die durch k · k2 : Rn → R, kxk2 := x21 + · · · + x2n definierte Abbildung nennt man
euklidische Norm. Die durch k · k1 : Rn → R, kxk1 := |x1 | + · · · + |xn | definierte Abbildung nennt
man 1-Norm. Die durch k · kmax : Rn → R, kxkmax := max{|x1 |, . . . , |xn |} definierte Abbildung nennt
man Maximum-Norm.
Definition 1.3 (Abstand). Es sei k · k eine Norm auf einem Vektorraum V über K = R, C, so nennt
man d(x, y) := kx − yk den Abstand von x zu y (bezüglich der Norm).
Bemerkung Für einen Abstand (bezüglich einer Norm) ergibt sich für alle x, y, z ∈ V (i) d(x, y) = 0
genau dann wenn x = y; (ii) d(x, y) = d(y, x) und (iii) d(x, z) ≤ d(x, y) + d(y, z).
Lemma 1.4 (Die Cauchy-Schwarzsche Ungleichung). Für alle x, y ∈ Rn gilt (x> y) ≤ kxk2 · kyk2 .
Satz 1.5. Die euklidische Norm, die 1-Norm und die Maximums-Norm sind alles Normen auf Rn .
2. Topologische Eigenschaften
Definition 1.6 (Topologische Begriffe). Es sei Rn versehen mit einer Norm k · k. a) Zu x ∈ Rn und
> 0 nennen wir B (x) := {z ∈ Rn | kx − zk < } offene -Kugel um x. Im Spezialfall n = 1 ist
B (x) =]x − , x + [. b) Es sei M eine Teilmenge von Rn . x ∈ M heißt innerer Punkt von M falls
es ein > 0 gibt, so dass B (x) ⊂ M ist. Die Menge aller inneren Punkte heißt das Innere von M .
Schreibweise: M 0 . c) M heißt offen, falls jeder Punkt innerer Punkt ist. d) x heißt Berührpunkt von
M , wenn für jedes > 0 gilt B (x) ∩ M 6= ∅. Die Menge aller Berührpunkte heißt Abschluss von M .
Schreibweise M . e) x heißt Randpunkt von M , falls x Berührpunkt von M und von Rn \ M ist. Die
Menge aller Randpunkte von M heißt Rand von M . Schreibweise: ∂M . f ) M heißt abgeschlossen
falls Rn \ M offen ist.
Satz 1.7. Für A ⊂ Rn gilt: a) A ist offen genau dann wenn A = Ao . b) A ist abgeschlossen, genau
dann wenn A = A. c) ∂A = A \ Ao .
Definition 1.8 (Beschränkte Mengen). Eine Menge M ⊂ R heißt beschränkt bezüglich einer Norm
k · k falls es eine Zahl R ∈ R gibt, so dass kxk ≤ R für jedes x ∈ M gilt.
Lemma 1.9. Für alle x ∈ Rn gilt: kxkmax ≤ kxk2 ≤ kxk1 ≤ nkxkmax .
Korollar 1.10. ist M beschränkt bezüglich einer der Normen k · k1 , k · k2 oder k · kmax , so ist M
bezüglich aller dieser Normen beschränkt.
Definition 1.11. Eine Teilmenge M ⊂ Rn heißt kompakt, falls sie abgeschlossen und beschränkt ist.
3. Konvergenz und Divergenz
Definition 1.12 (Folgen, vergleiche Analysis in einer Variable). Eine Abbildung a : N → Rn (bzw.
a : N0 → Rn ) nennt man Folge. Statt a : N → Rn schreibt man meist (ak )k∈N und ak statt a(k).
1
Definition 1.13 (Konvergenz, Divergenz, Grenzwert einer Folge, vergleiche Analysis in einer Variable).
Es sei (ak )k∈N eine Folge. Die Folge (ak )k∈N heißt konvergent falls ein a ∈ Rn mit folgender Eigenschaft existiert: Zu jedem > 0 gibt es ein N ∈ N, so dass für alle k > N die Ungleichung kak − ak < gilt. Der Wert a heißt in diesem Fall Grenzwert von (ak )k∈N . Wir schreiben auch limk→∞ ak = a oder
k→∞
ak −→ a. Eine Folge heißt divergent falls sie nicht konvergent ist.
Satz 1.14. Eine Folge (xk )k∈N mit xk ∈ Rn konvergiert bezüglich der euklidischen Norm, genau dann
wenn Sie bezüglich der 1 − N orm konvergiert und genau dann wenn sie bezüglich der Maximums-Norm
konvergiert.
Satz 1.15. Eine Folge (xk )k∈N mit xk ∈ Rn konvergiert genau dann wenn alle ihre Komponentenfolgen
konvergieren.
Definition 1.16 (Cauchy-Folge, vergleiche Analysis in einer Variable). Eine Folge (ak )k∈N heißt
Cauchy-Folge falls es zu jedem > 0 ein N ∈ N gibt, so dass für alle k, m ≥ N die Abschätzung
kak − am k < gilt.
Satz 1.17 (Cauchy-Konvergenzkriterium, vergleiche Analysis in einer Variable). Eine Folge in Rn ist
genau dann konvergent, wenn Sie eine Cauchy-Folge ist.
Satz 1.18 (Bolzano-Weierstraß, vergleiche Analysis in einer Variable, Satz. 2.6). Jede beschränkte Folge
hat eine konvergente Teilfolge.
4. Stetigkeit
Definition 1.19 (Stetigkeit). Es sei M ⊂ Rn und f : M → Rm eine Funktion. f heißt stetig im
Punkt x0 ∈ M wenn zu jedem > 0 ein δ > 0 existiert, so dass für jedes y ∈ M mit ||x0 − y|| < δ auch
||f (x0 ) − f (y)|| < gilt. f heißt stetig auf M falls f für jedes x ∈ M stetig ist.
Satz 1.20. Eine Funktion f : M → Rm ist genau dann stetig in a ∈ M , wenn alle Komponentenfunktionen fj : M → R, x 7→ (f (x))j stetig sind.
Satz 1.21 (Folgenstetigkeit). Es sei M ⊂ Rn . Eine Funktion M → Rm ist genau dann stetig im Punkt
a ∈ M wenn für alle Folgen (an )n∈N mit an ∈ M und an → a auch f (an ) → f (a) gilt.
Satz 1.22 (Existenz von Maxima und Minima). Es sei K ⊂ Rn kompakt und f : K → R stetig. Dann
gilt: a) f nimmt auf K ein absolutes Maximum und ein absolutes Minimum an. b) Ist K zusätzlich
wegzusammenhängend, d.h. zu jedem Punktepaar x, y ∈ K gibt es eine stetige Funktion w : [0, 1] → R
mit w(0) = x und w(1) = y, dann ist f (K) = [a, b] wobei a das absolute Minimum und b das absolute
Maximum von f ist.
Bemerkung: Es gilt sogar: Es sei f : Rn → Rm stetig. Dann gilt a) Ist M ⊂ Rm offen, dann ist
auch f −1 (M ) offen. b) Ist M ⊂ Rm abgeschlossen, dann ist auch f −1 (M ) abgeschlossen. c) Ist K ⊂ Rn
kompakt, dann ist auch f (K) kompakt.
KAPITEL 2
Berechnung von Extrema
1. Partielle Ableitungen
Definition 2.1 (partielle Ableitung). Sei U ⊂ Rn offen und ej der j-te Einheitsvektor. Eine Funktion
f : U → R ist in x ∈ U partiell differenzierbar in der j-ten Komponente falls der Grenzwert
f (x + hej ) − f (x)
lim
h→0
h
∂f
existiert. Falls dieser Grenzwert existiert bezeichnet man diesen mit Dj f (x) oder mit ∂x
f (x). Dieser
j
Grenzwert wird auch j-te partielle Ableitung von f in x genannt. f heißt in x partiell differenzierbar, falls f für jedes j = 1, . . . , n in x partiell differenzierbar in der j-ten Komponente ist. f heißt
partiell differenzierbar, wenn es für alle x ∈ U partiell differenzierbar ist. f heißt stetig partiell
differenzierbar in x bzw. in U , wenn f partiell differenzierbar in x bzw. in U ist und jede partielle
Ableitung in x bzw. in U stetig ist.
Definition 2.2 (zweifach partiell differenzierbar). Sei U ⊂ Rn offen und f : U → R. Ist f partiell differenzierbar und sind sämtliche partiellen Ableitungen Dj f , j = 1, . . . , n wieder partiell differenzierbar,
so nennt man f zweifach partiell differenzierbar. Sind alle Abbildungen Di Dj f stetig, so nennt man f
zweifach stetig differenzierbar.
Satz 2.3 (Satz von Schwarz). Sei U offen und f : U → R zweifach stetig differenzierbar, so gilt
Di Dj f (x) = Dj Di f (x) für alle i, j = 1, . . . , n und alle x ∈ U .
2. Totale Differenzierbarkeit
Definition 2.4 (totale Differenzierbarkeit). Sei U ⊂ Rn offen und f : U → Rm . f heißt im Punkt
x ∈ U total differenzierbar, falls es eine lineare Abbildung A : Rn → Rm , eine Umgebung V ⊂ U
von x und eine Abbildung Rest : V → Rm gibt welche
Rest(h)
=0
f (x + h) = f (x) + Ah + Rest(h) für h ∈ V und lim
h→0
khk
erfüllen. Wir schreiben meist differenzierbar statt total differenzierbar. Achtung: A und Rest hängen
von x ab. Die lineare Abbildung A wird Ableitung von f im Punkt x genannt.
Satz 2.5. Sei U ⊂ Rn offen und f : U → Rm in x differenzierbar mit Ableitung


a11 . . . a1n

..  .
A =  ...
. 
am1 . . . amn
Dann gilt
a) f ist stetig in x,
b) Alle Komponentenfunktionen fi : U → R von f (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn )) sind
partiell differenzierbar und es gilt Dj fi (x1 , . . . , xn ) = aij .
Definition 2.6 (Gradient und Jacobi-Matrix). Die Ableitung in x einer differenzierbaren Funktion
f : U → Rm mit U ⊂ Rn offen nennt man Jacobi-Matrix. Schreibweise:


D1 f1 (x) . . . Dn f1 (x)


..
..
Df (x) = 

.
.
D1 fm (x) . . . Dn fm (x)
3
Im Fall m = 1 nennt man Df (x) den Gradienten von x. Schreibweise:
grad f (x) = (D1 f (x), · · · , Dn f (x)) .
Satz 2.7. Sei U ⊂ Rn offen und f : U → R in x partiell differenzierbar. Sämtliche partiellen Ableitungen
Dj f , j = 1, . . . , n seien stetig in x. Dann ist f total differenzierbar und stetig.
Satz 2.8 (Kettenregel). Es seien U ⊂ Rn und V ⊂ Rm offen. Für zwei Abbildungen f : U → Rm
und g : V → Rk gelte f (U ) ⊂ V . Weiter sei f in x ∈ U und g in y = f (x) differenzierbar. Dann ist
g ◦ f : U → Rk differenzierbar und es gilt
D(g ◦ f )(x) = Dg(f (x)) Df (x).
3. Die zweite Ableitung (Hesse Matrix)
Definition 2.9 (Hesse Matrix). Sei U ⊂ Rn offen und f : U → R zweimal partiell differenzierbar, so
nennen wir die Matrix


D1 D1 f (x) . . . Dn D1 f (x)


..
..
Hf (x) = 

.
.
D1 Dn f (x) . . . Dn Dn f (x)
die Hesse Matrix von f in x. Die Hesse Matrix ist also die Jacobimatrix des Gradienten und wird daher
auch zweite Ableitung von f in x genannt.
Satz 2.10 (Taylor Approximation zweiter Ordnung). Ist U ⊂ Rn offen und f : U → R zweimal stetig
differenzierbar, dann gilt für jedes x ∈ U für h aus einer genügend kleinen Umgebung von x
1
Rest(h)
f (x + h) = f (x) + Df (x) · h + h> Hf (x)h + Rest(h) mit lim
= 0.
h→0 khk2
2
Definition 2.11. Sei A ∈ Rn×n symmetrisch. Man nennt A
a)
b)
c)
d)
e)
positiv definit, falls für alle x ∈ Rn \ {0} gilt: x> Ax > 0.
positiv semidefinit, falls für alle x ∈ Rn \ {0} gilt: x> Ax ≥ 0.
negativ definit, falls für alle x ∈ Rn \ {0} gilt: x> Ax < 0.
negativ semidefinit, falls für alle x ∈ Rn \ {0} gilt: x> Ax ≤ 0.
n
>
indefinit, falls es ein x1 ∈ Rn mit x>
1 Ax1 < 0 und ein x2 ∈ R mit x2 Ax2 > 0 gibt.
4. Extremwerte
Definition 2.12 (Maxima und Minima). Ist M ⊂ Rn und f : M → R.
a) Ist x ∈ M derart, dass f (x) ≥ f (z) für alle z ∈ M gilt, so heisst f (x) (globales) Maximum von
f . Ist x ∈ M derart, dass f (x) ≤ f (z) für alle z ∈ M gilt, so heisst f (x) (globales) Minimum von
f . Ein globales Maximum (bzw. Minimum) nennt man isoliert (oder strikt) falls sogar f (x) > f (z)
(bzw. f (x) < f (z)) für alle z ∈ M \ {x} gilt.
b) Ist x ∈ M derart, dass es eine offene Menge U ⊂ M gibt, so dass x ∈ U ist und f (x) ≥ f (z) für
alle z ∈ U gilt, so heisst f (x) (lokales) Maximum von f . Ist x ∈ M derart, dass es eine offene
Menge U ⊂ M gibt, so dass x ∈ U ist und f (x) ≤ f (z) für alle z ∈ U gilt, so heisst f (x) (lokales)
Minimum von f . Ein lokales Maximum (bzw. Minimum) nennt man isoliert (oder strikt) falls
sogar f (x) > f (z) (bzw. f (x) < f (z)) für alle z ∈ U \ {x} gilt.
Satz 2.13 (Notwendiges Kriterium für lokale Extrema). Sei U ⊂ Rn offen und f : U → R partiell
differenzierbar. Hat f in x ein lokales Extremum (also ein lokales Minimum oder ein lokales Maximum)
so ist grad f (x) = 0. Bemerkung: Die Punkte mit der Eigenschaft grad f (x) = 0 nennt man die
kritischen Punkte von f .
Satz 2.14 (Hinreichendes Kriterium für lokale Extrema). Sei U ⊂ Rn offen und f : U → R zweimal
stetig differenzierbar. Weiter sei x ein kritischer Punkt von f und Hf (x) die Hesse Matrix von f in x.
a) Ist Hf (x) symmetrisch positiv definit, so hat f in x ein isoliertes lokales Minimum.
b) Ist Hf (x) symmetrsich negativ definit, so hat f in x ein isoliertes lokales Maximum.
c) Ist Hf (x) indefinit, so hat f in x weder ein lokales Minimum noch ein lokales Maximum.