Appunti per il Corso di Metodi Matematici per loIngegneria AA 2013

Appunti per il Corso di
Metodi Matematici per l’Ingegneria
A.A. 2013/2014
Marco Bramanti
Politecnico di Milano
9 aprile 2014
Indice
I
Spazi di Lagrange
8
1 Spazi vettoriali, spazi metrici
1.1 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Spazi metrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
8
11
2 Richiami sulla cardinalità di insiemi
16
3 Convergenza e completezza
18
3.1 Teoremi di convergenza in R e in Rn . . . . . . . . . . . . . . . . 18
3.2 Completezza in spazi metrici . . . . . . . . . . . . . . . . . . . . 22
4 Successioni di funzioni, spazi di funzioni continue
4.1 Successioni di funzioni e convergenza uniforme . .
4.2 Spazi di funzioni derivabili . . . . . . . . . . . . . .
4.3 Spazi di funzioni in…nitamente derivabili . . . . . .
4.4 Funzioni Lipschitziane . . . . . . . . . . . . . . . .
o derivabili 25
. . . . . . . . 25
. . . . . . . . 32
. . . . . . . . 36
. . . . . . . . 38
5 Il teorema delle contrazioni in spazi metrici e le sue applicazioni
5.1 Teorema delle contrazioni . . . . . . . . . . . . . . . . . . . . . .
5.2 Applicazioni al problema di Cauchy per sistemi di equazioni differenziali ordinarie . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Equazioni integrali di Fredholm . . . . . . . . . . . . . . . . . . .
5.3.1 Equazione integrale di Fredholm di seconda specie in C 0 [a; b]
5.3.2 Il metodo della serie di Neumann e l’approssimazione di
Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.3 Applicazione a un modello di di¤usione . . . . . . . . . .
1
39
39
41
46
46
48
50
6 Esercizi sulla Parte 1
55
II
61
Misura e integrale di Lebesgue
7 Motivazioni per studiare la teoria della misura e dell’integrazione
di Lebesgue
61
7.1 Inadeguatezza dell’integrale di Riemann per gli scopi dell’analisi
funzionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.2 L’idea dell’integrale di Lebegue . . . . . . . . . . . . . . . . . . . 65
7.3 Il problema di de…nire una “buona” misura . . . . . . . . . . . . 67
7.4 Sviluppo e impatto della teoria
della misura e dell’integrale di Lebesgue . . . . . . . . . . . . . . 70
8 Teoria della misura e dell’integrale di Lebesgue
8.1 Spazi misurabili . . . . . . . . . . . . . . . . . . . . .
8.2 Misura . . . . . . . . . . . . . . . . . . . . . . . . . .
8.3 Costruzione della misura di Lebesgue in Rn . . . . .
8.4 Restrizione di una misura . . . . . . . . . . . . . . .
8.5 Funzioni misurabili . . . . . . . . . . . . . . . . . . .
8.6 Integrazione astratta . . . . . . . . . . . . . . . . . .
8.7 Relazione tra integrale di Riemann
e integrale di Lebesgue . . . . . . . . . . . . . . . . .
8.8 I teoremi di convergenza per l’integrale di Lebesgue .
8.9 Lo spazio L1 . . . . . . . . . . . . . . . . . . . . . .
8.10 Il teorema fondamentale del calcolo integrale . . . .
71
71
72
73
78
79
83
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 88
. 93
. 98
. 101
9 La teoria della misura astratta in probabilità
106
10 Misure di Hausdor¤
10.1 Misura e dimensione di Hausdor¤ . . . . . . . . . . . . . . . . . .
10.2 La misura (n 1)-dimensionale e il problema isoperimetrico . . .
10.3 Misure e distribuzioni di carica . . . . . . . . . . . . . . . . . . .
111
111
117
119
11 Spazi Lp
11.1 Gli spazi Lp ( ) per 1 < p < 1
11.2 Lo spazio L1 . . . . . . . . . .
11.3 Inclusioni tra spazi Lp . . . . .
11.4 Approssimazione di funzioni Lp
11.5 Integrali doppi in Rn . . . . . .
11.6 Convoluzione in Rn . . . . . . .
121
121
125
126
127
128
131
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12 Cenni su operatori e funzionali lineari continui
132
12.1 Operatori lineari continui . . . . . . . . . . . . . . . . . . . . . . 132
12.2 Funzionali lineari continui . . . . . . . . . . . . . . . . . . . . . . 136
2
13 Esercizi sulla Parte 2
139
13.1 Soluzioni di alcuni esercizi della Parte 2 . . . . . . . . . . . . . . 145
III
Spazi di Hilbert
147
14 Geometria negli spazi di Hilbert
147
14.1 Spazi vettoriali con prodotto interno . . . . . . . . . . . . . . . . 147
14.2 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
15 Funzionali lineari continui su uno spazio di Hilbert
158
16 Analisi di Fourier in spazi di Hilbert
162
17 Esercizi sulla Parte 3
170
IV
Applicazioni dei metodi di ortogonalità
173
18 Applicazioni all’analisi armonica
173
18.1 Il sistema trigonometrico. Serie di Fourier in una o due variabili 173
18.2 Base di Haar e wavelets . . . . . . . . . . . . . . . . . . . . . . . 178
19 Applicazioni dei metodi di ortogonalità a problemi di¤erenziali182
19.1 Separazione di variabili per problemi ai limiti per EDP mediante
il sistema trigonometrico . . . . . . . . . . . . . . . . . . . . . . . 182
19.1.1 Di¤usione del calore in una sbarra . . . . . . . . . . . . . 182
19.1.2 Equazione di Laplace sul cerchio . . . . . . . . . . . . . . 186
19.2 Problemi di Sturm-Liouville e polinomi ortogonali . . . . . . . . 191
19.3 Applicazioni dei polinomi ortogonali in problemi ai limiti per
equazioni a derivate parziali . . . . . . . . . . . . . . . . . . . . . 204
19.3.1 Laplaciano in coordinate sferiche e polinomi di Legendre . 204
19.3.2 Oscillatore armonico quantistico e polinomi di Hermite . . 207
19.4 Il problema agli autovalori per il laplaciano e le sue applicazioni . 211
19.4.1 Separazione di variabili per le equazioni del calore o delle
onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
19.4.2 L’equazione di Helmholz sul rettangolo . . . . . . . . . . . 216
19.4.3 L’equazione di Helmholz sul cerchio . . . . . . . . . . . . 217
20 Esercizi sulla Parte 4
223
20.1 Soluzione di alcuni esercizi sulla Parte 4 . . . . . . . . . . . . . . 225
V Formulazione debole dei problemi ai limiti per equazioni
ellittiche
229
3
21 Derivate deboli e spazi di Sobolev
21.1 Il concetto di derivata debole . . . . . .
21.2 Derivata debole, caso unidimensionale .
21.3 Derivata debole, caso multidimensionale
21.4 Spazi di Sobolev . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
22 Formulazione debole di problemi ellittici
22.1 Operatori uniformemente ellittici . . . . . . . . . .
22.2 Problemi ai limiti e de…nizione di soluzione debole
22.3 Risultati di esistenza . . . . . . . . . . . . . . . . .
22.4 Risultati di regolarità . . . . . . . . . . . . . . . .
22.5 Risoluzione numerica di problemi ai limiti
in forma debole . . . . . . . . . . . . . . . . . . . .
22.6 Alcuni esempi svolti . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
229
229
232
235
238
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
246
246
248
254
261
. . . . . . . . 262
. . . . . . . . 266
23 Esercizi sulla Parte 5
280
23.1 Soluzioni di alcuni esercizi della Parte 5 . . . . . . . . . . . . . . 283
4
Introduzione al corso di
Metodi Matematici per l’ingegneria
In questo corso, prendendo le mosse dai soli corsi di matematica di base (Analisi 1 e 2, Algebra Lineare), si vogliono introdurre alcuni temi, idee e metodi
dell’analisi matematica moderna e mostrarne alcune applicazioni signi…cative a
diversi settori di grande interesse per le applicazioni alla …sica e all’ingegneria: sistemi di equazioni di¤erenziali ordinarie, analisi di Fourier, equazioni alle
derivate parziali.
Nel corso di Analisi 1 lo studente incontra i concetti di base del calcolo
di¤erenziale e integrale in una variabile, il cui nascere si è accompagnato storicamente al nascere della scienza moderna (Newton) agli inizi del 18 secolo. In
Analisi 2 si incontrano le equazioni di¤erenziali ordinarie, strumento fondamentale della modellizzazione matematica dei fenomeni …sici, e si gettano le basi
del calcolo di¤erenziale e integrale in più variabili, necessari per la formulazione
delle equazioni alle derivate parziali, che modellizzano la …sica dei mezzi continui, intensamente studiata nel 19 secolo. Di queste equazioni però non si
arriva a parlare se non di sfuggita nel corso di Analisi 2.
C’è ancora una lunga e interessante storia da raccontare, quindi, riguardo ai
rapporti tra l’analisi matematica e la …sica. Da una parte, ancora nel 19 secolo,
c’è un …orire di tecniche e strumenti per la risoluzione esplicita di problemi per
equazioni alle derivate parziali, quando questo è possibile: serie, trasformate
integrali, funzioni speciali vengono utilizzate per risolvere i problemi di¤erenziali che modellizzano fenomeni di di¤usione del calore, vibrazione di corde e
membrane, ricerca del potenziale elettrostatico o gravitazionale in presenza di
un’assegnata distribuzione di cariche o masse, e così via.
Poi, tra la …ne del 19 secolo e i primi decenni del 20 , sulla spinta di
problemi sempre più complessi posti dalle applicazioni, problemi per cui non è
facile ottenere soluzioni esplicite, ed anche per la tendenza, che intorno al 1900 va
attraversando tutto il mondo matematico, a sviluppare teorie e concetti sempre
più generali e astratti, si viene a¤ermando il nuovo punto di vista dell’analisi
funzionale: la soluzione del problema che si va cercando è una funzione che viene
vista come un punto di uno spazio astratto, un “punto”la cui esistenza si cerca di
dimostrare con ragionamenti sempre più so…sticati. Si assiste così allo sviluppo
di teorie astratte (spazi di Hilbert, spazi di Banach...) e a una vera rivoluzione
nel modo di concepire le idee fondamentali dell’analisi: con Lebesgue, intorno
al 1910, una nuova teoria dell’integrazione, con gli spazi di Sobolev, intorno
al 1930, una nuova idea di derivata, con la teoria delle distribuzioni, 1950, un
nuovo concetto di funzione.... Queste idee e teorie astratte si rivelano potenti ed
e¢ caci nel gettare luce anche sui problemi concreti che la scienza pone, in forma
sempre più complessa, e sono fondamentali per capire i metodi matematici oggi
comunemente utilizzati nelle applicazioni …siche e ingegneristiche.
In questo corso si farà una panoramica su alcune delle idee qui sopra accennate, seguendo un percorso che, senza entrare nelle teorie più impegnative (che
richiederebbero più tempo a disposizione) e senza nessuna pretesa di sistematic-
5
ità, mostri un ventaglio interessante e vario di idee, metodi e problemi, arrivando a qualche applicazione signi…cativa in campi diversi: i sistemi di equazioni
di¤erenziali ordinarie, l’analisi di Fourier, i problemi ai limiti per equazioni a
derivate parziali da un punto di vista classico e moderno. E’un corso rivolto a
studenti a cui piace la matematica nel suo intreccio di astratto e concreto.
Il percorso seguito è suggerito dal tentativo di soddisfare due esigenze tra
loro antagoniste. Ricordiamo ancora infatti che tra il punto di arrivo dei corsi
di matematica di base alle applicazioni odierne dei metodi matematici intercorrono più di 100 anni di storia, e la matematica generalmente non fa sconti
sulla consequenzialità logica. Si è cercato quindi di arrivare, mediante un percorso appositamente “ritagliato”in modo da evitare investimenti teorici troppo
onerosi per un corso di 5 crediti, ad almeno alcune idee e tecniche relativamente
recenti, senza però snaturare completamente la consequenzialità logica, e quindi
partendo da temi che sviluppano nella direzione dell’analisi funzionale moderna
i concetti del calcolo di¤erenziale classico con cui lo studente è già familiare.
Dal punto di vista matematico, questo si è tradotto nel privilegiare sistematicamente nel corso il tema della completezza a discapito di quello della
compattezza, le tecniche di ortogonalità e spazi di Hilbert rispetto a quelle di
spazi di Banach; per lo stesso motivo si è deciso di non a¤rontare la teoria degli
operatori. Per ridurre al minimo le sovrapposizioni col corso di Analisi Funzionale e Trasformate, in…ne, si è anche scelto di non trattare (e non darne per
scontata la conoscenza) le trasformate integrali (di Fourier e Laplace), privilegiando, nella risoluzione di problemi ai limiti per equazioni a derivate parziali,
i domini limitati su cui si può applicare il metodo di separazione di variabili e
gli sviluppi in serie, e non trattare la teoria delle distribuzioni, concentrandosi
sulla de…nizione di derivata in senso debole.
Una panoramica sul corso
La prima parte del corso tratta gli spazi classici di funzioni continue o derivabili; se ne mostra la completezza a partire dalle nozioni di base dell’analisi
e dallo studio delle proprietà della convergenza uniforme di successioni di funzioni, e si mostra come queste proprietà, grazie al teorema di punto …sso in spazi
metrici, consenta di ottenere risultati classici di esistenza e unicità per problemi
di¤erenziali ed equazioni integrali.
Successivamente (Parte 2) si presentano le idee fondamentali della teoria
della misura e dell’integrazione di Lebesgue, motivati dalla necessità di ottenere
spazi completi di funzioni integrabili. Questa teoria è un vero punto di svolta
nella matematica di inizio 1900, ed è un passaggio imprescindibile per avvicinarsi
a tutte le idee importanti nelle applicazioni dell’analisi matematica da 100 anni a
questa parte. Gli spazi di funzioni a quadrato integrabile rispetto a una misura,
in particolare, saranno l’esempio e il modello principale di spazio di Hilbert, il
successivo concetto chiave che si introduce nel corso.
La teoria degli spazi di Hilbert (Parte 3) unisce l’idea analitico funzionale
di completezza all’idea geometrica di ortogonalità. In questo quadro astratto
viene sviluppata su¢ ciente “geometria in…nito dimensionale” da permettere di
sviluppare le idee fondamentali dell’analisi di Fourier in spazi di Hilbert; il tema
6
dei funzionali lineari continui e delle forme bilineari, con gli importanti teoremi
di esistenza di Riesz e di Lax-Milgram, fornirà invece la strumentazione per
le applicazioni dell’ultima parte del corso, ai teoremi di esistenza per problemi ai limiti per equazioni a derivate parziali. Nella Parte 4 si vuole mostrare
qualche applicazione dell’analisi di Fourier in spazi di Hilbert all’analisi di Fourier “concreta”, con i suoi problemi di approssimazione di segnali periodici mono
o multidimensionali. In secondo luogo, si illustrano applicazioni a problemi
di¤erenziali classici: problemi ai limiti per le equazioni a derivate parziali della …sica matematica, in geometrie semplici, che si risolvono per separazione di
variabili sfruttando idee di ortogonalità e completezza in spazi di Hilbert.
La quinta e ultima parte del corso vuole introdurre alla cosiddetta formulazione debole dei problemi ai limiti per equazioni a derivate parziali di tipo
stazionario. Il quadro funzionale è quello degli spazi di Sobolev Hilbertiani.
Con‡uisce qui da una parte la teoria della misura e dell’integrazione di Lebesgue,
dall’altra la teoria astratta degli spazi di Hilbert, per ottenere una de…nizione
di soluzione di un problema ai limiti che permetta di dimostrare teoremi di esistenza e unicità anche in geometrie molto generali, in cui la risoluzione esplicita
in termini esatti appare preclusa.
Maggio 2012
7
Parte I
Spazi di Lagrange
1
Spazi vettoriali, spazi metrici
Cominciamo con l’introdurre o richiamare alcune strutture astratte che si utilizzano per studiare gli spazi di funzioni che sono coinvolti nei problemi analitici
che incontreremo.
1.1
Spazi vettoriali
Iniziamo a ricordare la de…nizione di spazio vettoriale che lo studente ha incontrato nello studio dell’algebra lineare.
De…nizione 1.1 (Spazio vettoriale) Uno spazio vettoriale sul campo K (= R o C)
è un insieme X su cui sono de…nite:
1. un’operazione + (“somma di vettori”), che associa ad ogni coppia di
vettori (x; y) un vettore x + y; l’operazione di somma soddisfa le proprietà (per
ogni x; y; z 2 X):
-commutativa: x + y = y + x;
-associativa: x + (y + z) = (x + y) + z;
-esistenza dell’elemento neutro 0; tale che x + 0 = 0 + x = x;
-esistenza dell’opposto x di ogni elemento x, tale che x + ( x) = 0:
2. Un’operazione di prodotto tra un vettore e uno scalare, che associa a
una coppia ( ; x) con 2 K; x 2 X un vettore
x 2 X; l’operazione1 soddisfa
le proprietà (per ogni x; y 2 X; ; 2 K):
-distribuitva del prodotto per uno scalare rispetto alla somma di vettori:
(x + y) = x + y
-distribuitva del prodotto per uno scalare rispetto alla somma di scalari:
( + ) x = x + x;
-pseudoassociativa: ( x) = ( ) x;
-l’elemento neutro del prodotto tra scalari è elemento neutro del prodotto per
uno scalare: 1 x = x:
Ricordiamo che uno spazio X ha dimensione …nita quando esiste un numero
…nito di elementi e1 ; e2 ; :::; en 2 X tali che ogni altro elemento di X è combinazione lineare di questi. Altrimenti si dice che X ha dimensione in…nita. Nel
corso di algebra lineare e geometria lo studente ha incontrato soprattutto spazi
vettoriali di dimensione …nita, come sono gli spazi Rn e Cn , gli spazi di matrici,
gli spazi di polinomi di grado minore o uguale di un n …ssato. In analisi ci
interessano spazi vettoriali di funzioni, e questi sono solitamente di dimensione
in…nita.
1 Come nell’algebra usuale, il simbolo
sottointeso.
di prodotto tra vettore e scalare è comunemente
8
De…nizione 1.2 (Spazio di funzioni) Sia
F = ff :
un insieme qualsiasi e sia
! Rg :
(Si potrebbero considerare anche funzioni a valori in Rn o Cn , ma per semplicità
limitiamoci ora a questo caso). F è uno spazio vettoriale su R, con le operazioni
naturali di somma di funzioni:
(f + g) (x) = f (x) + g (x)
e prodotto di una funzione per uno scalare:
( f ) (x) = f (x) :
La veri…ca delle proprietà delle operazioni richieste dalla de…nizione di spazio
vettoriale è immediata, seguendo queste dalle analoghe proprietà delle operazioni
su numeri reali.
Notiamo che se ad esempio
= (a; b)
R, F ha dimensione in…nita:
non esiste un numero …nito di funzioni di cui tutte le altre siano combinazioni
lineari (ad esempio, le funzioni xn per n = 1; 2; 3; ::: sono un esempio di in…nite
funzioni di cui nessuna è combinazione lineare di un numero …nito delle altre, e
naturalmente esistono funzioni di tipo ancora diverso).
Di solito si studiano spazi di funzioni con qualche proprietà aggiuntiva (ad
esempio funzioni continue, o integrabili, o derivabili...).
Esempio 1.3 C 0 (a; b) = ff : (a; b) ! R : f è continuag è uno spazio vettoriale. Il modo più semplice di dimostrarlo non è veri…care daccapo le proprietà
delle operazioni, ma veri…care che questo sottoinsieme di F(a;b) è un sottospazio
vettoriale. Questo consiste nel veri…care che la combinazione lineare di due elementi di C 0 (a; b) è ancora un elemento di C 0 (a; b), il che segue per le proprietà
note delle funzioni continue.
Puntualizziamo quindi il
Teorema 1.4 (Criterio di riconoscimento dei sottospazi) Dato uno spazio
vettoriale X su K e un sottoinsieme X0 X; X0 risulta un sottospazio vettoriale
(cioè uno spazio vettoriale rispetto alle medesime operazioni) se
x + y 2 X0 per ogni x; y 2 X0 ; ;
2 K:
Esempio 1.5 Applicando il criterio precedente è immediato veri…care che sono
spazi vettoriali i seguenti:
C 0 [a; b] ; insieme delle funzioni continue su [a; b]
C 1 [a; b] ; insieme delle funzioni derivabili con derivata continua su [a; b]
L [a; b] ; insieme delle funzioni limitate su [a; b]
9
e analoghi spazi di funzioni de…nite su tutto R oppure su un opportuno insieme
Rn .
Invece, non è uno spazio vettoriale l’insieme
P (R) , insieme delle funzioni periodiche su R,
in quanto la somma di due funzioni periodiche non sempre è periodica, come
mostra l’esempio
f (x) = sin x + sin ( x) .
Quando in analisi si parla di “spazio di funzioni” solitamente si intende
indicare uno spazio vettoriale, i cui elementi sono funzioni (con qualche proprietà particolare). Nei casi (non così frequenti) in cui ci interessa considerare
un insieme di funzioni che non costituisce uno spazio vettoriale, solitamente
si utilizzano termini come insieme delle funzioni... o classe delle funzioni...,
rinunciando cioè a usare la parola spazio.
Come negli spazi Rn esiste il modulo (o norma) di un vettore, così in molti
spazi vettoriali esiste una norma che consente di misurare la “grandezza”di un
vettore e quindi la distanza tra due vettori:
De…nizione 1.6 (Spazio vettoriale normato) Sia X uno spazio vettoriale
su K. Si dice norma su X una funzione
k k : X ! [0; +1)
che ad ogni vettore associa un numero reale non negativo, con le seguenti proprietà (per ogni x; y 2 X; 2 K):
-proprietà di annullamento: kxk = 0 () x = 0
-omogeneità: k xk = j j kxk
-disuguaglianza triangolare: kx + yk kxk + kyk.
In questo caso (X; k k) si dice spazio vettoriale normato.
Esempio 1.7 1. In Rn la norma usuale è
v
u n
uX
2
jxj = t
jxi j
i=1
che veri…ca le proprietà precedenti. Non è l’unica norma naturale in Rn . Sono
norme anche:
jxj0 =
jxj1 =
max
i=1;2;:::;n
n
X
i=1
jxi j oppure
jxi j :
Si può dimostrare che queste tre norme sono tutte tra loro equivalenti, il che
signi…ca che per certe costanti c1 ; c2 > 0 risulta
c1 jxj0
jxj
10
c2 jxj0
e analoghe disuguaglianze permettono di confrontare jxj con jxj1 e jxj0 con jxj1 .
2. In C 0 [a; b] possiamo de…nire:
kf kC 0 [a;b] = max jf (x)j ,
x2[a;b]
che risulta …nita per ogni f 2 C 0 [a; b] in base al teorema di Weierstrass. E’
immediato veri…care che valgono le proprietà di norma. Analoga norma si può
de…nire più in generale in C 0 (K) dove K è un sottoinsieme chiuso e limitato
di Rn .
3. In C 0 [a; b] possiamo de…nire anche2 :
Z b
kf kL1 [a;b] =
jf (x)j dx.
a
0
Anche questa risulta una norma su C [a; b], pur essendo sostanzialmente diversa dalla norma kf kC 0 [a;b] . Le norme k kC 0 e k kL1 non sono equivalenti.
Vediamo quindi che su uno spazio di funzioni, diversamente che in Rn , possono
esistere norme sostanzialmente diverse tra loro.
4. Se provassimo a de…nire la norma kf kC 0 o kf kL1 in C 0 (a; b) (che pure
è uno spazio vettoriale), queste norme non risulterebbero …nite per ogni f 2
C 0 (a; b), in quanto C 0 (a; b) contiene anche funzioni illimitate. Quindi su questo
spazio queste non sarebbero norme. Vediamo quindi che non in ogni spazio
vettoriale esistono norme “naturali”.
1.2
Spazi metrici
Una diversa struttura astratta utile in analisi è quello di spazio metrico, che ora
introduciamo.
De…nizione 1.8 (Spazio metrico) Si dice spazio metrico un insieme X dotato di una funzione distanza
d:X
X ! [0; 1]
che soddisfa le seguenti proprietà (per ogni x; y 2 X):
-proprietà di annullamento: d (x; y) = 0 () x = y
-simmetria: d (x; y) = d (y; x)
-disuguaglianza triangolare: d (x; y) d (x; z) + d (z; y).
Notiamo subito che ogni spazio vettoriale normato è uno spazio metrico:
ponendo
d (x; y) = kx yk
si ha che d soddisfa le proprietà della distanza. Tuttavia la struttura di spazio
metrico non presuppone di per sé quella di spazio vettoriale. Ad esempio è
immediata la seguente:
2 L’origine del nome L1 dato a questa norma si chiarirà in un prossimo capitolo, parlando
dell’integrale di Lebesgue. Per ora è solo un simbolo come un altro scelto per denotare questa
norma integrale.
11
Proposizione 1.9 Se (X; d) è uno spazio metrico e X0
sieme qualsiasi, anche (X0 ; d) è uno spazio metrico.
X un suo sottoin-
In particolare: qualunque sottoinsieme di uno spazio vettoriale normato è
uno spazio metrico, pur non essendo più, in generale, uno spazio vettoriale.
Esempio 1.10 1. Sia X un qualunque sottoinsieme di Rn e d (x; y) = jx yj.
Questo è uno spazio metrico (e in generale, non è uno spazio vettoriale).
2. X = C 0 [a; b] con d (f; g) = kf gkC 0 è uno spazio metrico, essendo uno
spazio vettoriale normato.
3. X = f 2 C 0 [a; b] : kf kC 0 1 con d (f; g) = kf gkC 0 è uno spazio
metrico, essendo sottoinsieme di uno spazio vettoriale normato. Non è uno
spazio vettoriale (combinazione lineare di funzioni che soddisfano kf kC 0 1 in
generale non soddisfa la stessa limitazione).
4. X = ff : R ! R : f periodica e limitatag con d (f; g) = kf gkC 0 è uno
spazio metrico. Infatti, anche se la di¤ erenza tra due funzioni periodiche può
non essere periodica, quindi X non è uno spazio vettoriale, è comunque vero che
la di¤ erenza tra due funzioni periodiche e limitate è limitata, quindi kf gkC 0
risulta …nita.
Gli spazi metrici che ci interesseranno nel seguito saranno quasi sempre
sottoinsiemi di uno spazio vettoriale normato.
In tutti gli spazi metrici, quindi in particolare negli spazi vettoriali normati,
si possono introdurre nozioni topologiche in modo analogo a quanto si fa in Rn .
Data la somiglianza di questi concetti con quelli che dovrebbero essere già noti
in Rn non ci so¤ermeremo molto nell’esempli…care.
De…nizione 1.11 (Intorni sferici) Sia (X; d) uno spazio metrico. Si dice
sfera aperta o intorno sferico di centro x0 2 X e raggio r > 0 l’insieme
Br (x0 ) = fx 2 X : d (x; x0 ) < rg :
De…nizione 1.12 (Punti di un insieme) Sia (X; d) uno spazio metrico e E
X. Un punto x 2 X si dice:
interno ad E se esiste un intorno sferico Br (x) E;
esterno ad E se esiste un intorno sferico Br (x) E c (il simbolo E c indice
il complementare di E; cioè E c = X n E);
di frontiera per E se non è né interno né esterno. Esplicitamente: x è di
frontiera per E se ogni intorno sferico Br (x) contiene un punto y 2 E e un
punto z 2
= E:
De…nizione 1.13 (Tipi di insiemi) Sia (X; d) uno spazio metrico e E
Si dice che:
E è aperto se ogni punto di E è interno ad E;
E è chiuso se il complementare di E è aperto.
Naturalmente un insieme può non essere né aperto né chiuso.
12
X.
Teorema 1.14 (Operazioni su aperti e chiusi) Sia fA g 2I una famiglia
[
qualsiasi (cioè: anche in…nita) di aperti. Allora
A è aperto;
2I
sia
\
n
fAi gi=1
sia fC g
una famiglia …nita di aperti. Allora
n
\
Ai è aperto;
n
[
Ai è chiuso.
i=1
una famiglia qualsiasi (cioè: anche in…nita) di chiusi. Allora
2I
C è chiuso;
2I
n
sia fCi gi=1 una famiglia …nita di chiusi. Allora
i=1
Dimostrazione (traccia). Le prime due proprietà si dimostrano direttamente
in base alla [
de…nizione di aperto e di intorno sferico:
Sia x 2
A ; dunque x 2 A per un certo A che è aperto, dunque esiste
Br (x)
A
Sia x 2
Bri (x)
Br (x)
2I
n
\
[
i=1
A ; dunque x è interno ad
2I
[
A e questo è aperto.
2I
Ai ; dunque x 2 Ai per ogni Ai che è aperto, dunque esiste
Ai per ogni i = 1; 2; :::; n: Posto r = min (ri : i = 1; 2; :::; n) si ha che
n
\
Ai e questo è aperto.
i=1
Le ultime due seguono, in base alla de…nizione di chiuso come complementare
di un aperto, per dualità, cioè ricordando che
!c
\
[
C
=
Cc
2I
n
[
i=1
Ci
!c
2I
=
n
\
Cic :
i=1
Notiamo che invece in generale l’unione di una famiglia in…nita di chiusi può
non essere chiuso e l’intersezione di una famiglia in…nita di aperti può non essere
un aperto.
Esempio 1.15 In R; gli intervalli (a; b) sono aperti, gli intervalli [a; b] sono
chiusi. Si osservi che:
1
[
0; 1
1
= [0; 1) che non è chiuso, e
n
0; 1 +
1
n
n=1
1
\
n=1
= (0; 1] che non è aperto.
13
De…nizione 1.16 Sia (X; d) uno spazio metrico e E X: Si dice:
interno di E, e si indica con E , l’insieme dei punti interni di E;
frontiera di E; e si indica con @E; l’insieme dei punti di frontiera di E;
chiusura di un insieme, e si indica con E; l’insieme E [ @E.
Si veri…cano facilmente le seguenti proprietà (dimostrare per esercizio):
Teorema 1.17 Per ogni E X:
E
E E;
E è aperto e E è chiuso;
E è aperto se e solo se E = E ;
E è chiuso se e solo se E = E.
Esempio 1.18 In R2 determinare interno, frontiera, chiusura, interno della
chiusura, dei seguenti insiemi:
(a) E = (x; y) : 0 < x2 + y 2 < 1 :
(b) E = R Q.
Soluzioni
(a): E = E; E = (x; y) : x2 + y 2 1 ; @E = f(0; 0)g[ (x; y) : x2 + y 2 = 1 ;
E
= (x; y) : x2 + y 2 < 1 . Notiamo in particolare che E
2
(b): E = ;; E = R ; @E = E; E
2
6= E:
= R . Anche in questo caso E
6= E:
De…nizione 1.19 Sia (X; d) uno spazio metrico e E
X: Si dice che E è
limitato se esiste una sfera (di raggio e centro qualsiasi) Br (x0 ) E.
In particolare in uno spazio vettoriale normato si dice che E è limitato se
esiste K > 0 tale che kxk < K per ogni x 2 E.
In ogni spazio metrico, e quindi in particolare negli spazi vettoriali normati,
si può de…nire il concetto di limite di successione:
De…nizione 1.20 (Limite di successione) Sia (X; d) uno spazio metrico e
1
fxn gn=1
X. Si dice che xn ! x se d (xn ; x) ! 0: Esplicitamente, questo
signi…ca che:
per ogni " > 0 esiste n0 tale che per ogni n n0 è xn 2 B" (x) :
Si noti come la convergenza in X è stata ricondotta, via il concetto di distanza, alla convergenza in R. Questo è del resto ciò che si fa anche per de…nire
la convergenza in Rn . Vale naturalmente il teorema di unicità del limite, con
“la solita” dimostrazione.
Molto importante è la prossima proprietà, che getta un ponte tra il concetto
topologico di insieme chiuso e quello di successione convergente:
Teorema 1.21 (Caratterizzazione successionale dei chiusi) Sia (X; d) uno
spazio metrico e C
X: L’insieme C è chiuso se e solo se vale la seguente
proprietà:
14
1
per ogni successione fxn gn=1 C tale che xn ! x per qualche x 2 X si ha
che x 2 C:
Detto altrimenti: un insieme è chiuso se e solo se contiene i limiti di tutte le
proprie successioni convergenti in X. (Si noti che la successione fxn g per ipotesi
ha limite in X; il punto è che questo limite appartenga in e¤ etti al sottoinsieme
C).
Dimostrazione. 1. Proviamo prima che se C è chiuso allora vale la proprietà.
1
Sia dunque fxn gn=1
C tale che xn ! x 2 X; e proviamo che x 2 C: Per
assurdo, sia x 2 C c . Poiché C è chiuso, C c è aperto, perciò x è interno a C c ;
sia dunque Br (x)
C c . Per de…nizione di limite, esiste n0 tale che per ogni
n
n0 è xn 2 Br (x)
C c ; assurdo perché questo implicherebbe che in…niti
elementi xn stanno in C c ; mentre per ipotesi sono tutti elementi di C:
2. Proviamo ora che se vale la proprietà allora C è chiuso. Lo mostriamo
provando che C c è aperto. Sia dunque x 2 C c e proviamo che x è interno a
C c , cioè esiste Br (x)
C c . Per assurdo non sia così. Allora per ogni n la
sfera B1=n (x) non è contenuta in C c , ossia esiste xn 2 B1=n (x) \ C. Dunque la
successione fxn g è contenuta in C; e d’altro canto converge a x perché d (x; xn ) <
1=n. Per la proprietà ammessa per ipotesi, questo implica x 2 C; assurdo perché
per ipotesi x 2 C c :
La de…nizione di limite consente di de…nire, al solito modo, il concetto di
funzione continua su uno spazio metrico, a valori reali o in un altro spazio
metrico:
De…nizione 1.22 Siano (X; dX ) ; (Y; dY ) due spazi metrici. Una funzione f :
X ! Y si dice continua in x 2 X se per ogni successione fxn g X tale che
xn ! x in X si ha f (xn ) ! f (x) in Y: Equivalentemente, se per ogni " > 0
esiste > 0 tale che dX (x; x) < =) dY (f (x) ; f (x)) < ":
La funzione f si dice continua in X se è continua in ogni punto x 2 X.
Si possono formulare i concetti topologici di insieme aperto e chiuso in
termini di funzioni continue:
Teorema 1.23 (Insiemi aperti e chiusi de…niti mediante funzioni continue)
Sia (X; d) metrico e f : X ! R continua. Allora gli insiemi:
E1 = fx 2 X : f (x) > 0g
E2 = fx 2 X : f (x) < 0g
E3 = fx 2 X : f (x) 6= 0g
sono aperti; gli insiemi:
E4 = fx 2 X : f (x) 0g
E5 = fx 2 X : f (x) 0g
E6 = fx 2 X : f (x) = 0g
sono chiusi.
Dimostrazione. Proviamo che E1 è aperto mostrando che ogni suo punto è
interno. Sia x0 2 E1 ; quindi f (x0 ) > 0: Per continuità di f esiste allora Br (x0 )
15
in cui f (x) > 0 (lo studente è invitato a mostrarlo in dettaglio). Dunque
Br (x0 ) E1 , ed E1 è aperto.
In modo analogo si mostra che E2 è aperto. Allora E3 = E1 [ E2 è aperto
perché unione di aperti.
Gli insiemi E4 ; E5 ; E6 sono, rispettivamente, il complementare di E1 ; E2 ; E3 ;
dunque sono chiusi perché complementare di aperti.
Esempio 1.24 In uno spazio vettoriale normato (X; k k) gli insiemi
fx 2 X : kxk = 1g ; fx 2 X : kxk
fx 2 X : kxk > 1g è aperto.
1g sono chiusi;
Terminiamo con la seguente
De…nizione 1.25 Sia (X; d) uno spazio metrico. Un sottoinsieme E
X si
dice denso in X se E = X. Equivalentemente: E è denso in X se per ogni
1
x 2 X esiste una successione fxn gn=1 E tale che xn ! x:
Quindi un sottoinsieme denso, pur possedendo meno elementi di X; consente
di approssimare bene quanto vogliamo qualsiasi elemento di X. Ad esempio, Q
è denso in R.
2
Richiami sulla cardinalità di insiemi
Richiamiamo molto brevemente alcuni fatti che ci serviranno in seguito, riguardanti la cardinalità (numerosità) degli insiemi in…niti.
De…nizione 2.1 Due insiemi X; Y si dicono avere uguale cardinalità se esiste
una corrispondenza biunivoca tra X e Y:
Si dice che cardX <cardY se X ha la stessa cardinalità di un sottoinsieme
proprio di Y; e inoltre X non ha la stessa cardinalità di Y:
L’ultima precisazione nella de…nizione precedente è resa necessaria dalla
prossima:
De…nizione 2.2 Un insieme X si dice in…nito quando esiste un suo sottoinsieme proprio X0 X che ha la stessa cardinalità di X.
In altre parole: ogni insieme in…nito ha la stessa cardinalità di qualche suo
sottoinsieme proprio, ma non necessariamente di ogni suo sottoinsieme proprio.
Esempio 2.3 L’insieme N = f0; 1; 2; 3; :::g è in corrispondenza biunivoca col
suo sottoinsieme proprio f1; 2; 3; :::g, dove la corrispondenza biunivoca è quella
che associa ad ogni numero naturale il suo successivo. Perciò N è in…nito.
De…nizione 2.4 Un insieme E si dice numerabile se ha la stessa cardinalità
1
di N. Quindi E si può rappresentare come successione: E = fxn gn=0 .
16
Si possono dimostrare i seguenti risultati:
Teorema 2.5 Gli insiemi N; Z; Q sono numerabili.
1
Teorema 2.6 Se fEn gn=1 è una successione di insiemi tali che ogni En è
1
[
numerabile, anche
En è numerabile.
n=1
1
Questo ad esempio signi…ca che una successione a due indici naturali fxn;m gn;m=1
individua un insieme che si può rappresentare anche come successione a un solo
1
indice fyk gk=1 .
Teorema 2.7 L’insieme R non è numerabile, ed ha la stessa cardinalità dell’insieme delle parti P (N), cioè l’insieme di tutti i sottoinsiemi di N:
cardR = cardP (N) :
Inoltre, qualunque intervallo non vuoto (e non ridotto a un punto) in R non è
numerabile.
Il teorema precedente ci o¤re il primo esempio di confronto tra cardinalità
diverse di insiemi in…niti: R ha cardinalità maggiore del suo sottoinsieme N (ed
anche del suo sottoinsieme Q); si noti che, invece, R ha la stessa cardinalità del
suo sottoinsieme (0; 1). Si confronti con quanto osservato dopo la de…nizione di
insieme in…nito.
Il teorema a¤erma anche che cardN <cardP (N). Questo fatto si può generalizzare:
Teorema 2.8 Per ogni insieme X si ha cardX <cardP (X).
Questo implica che la scala delle cardinalità non ha un limite superiore: di
ogni insieme esiste sempre un insieme più numeroso.
Tornando agli spazi metrici, possiamo dare ora la seguente
De…nizione 2.9 (Spazio separabile) Sia (X; d) uno spazio metrico. Si dice
che X è separabile se esiste un suo sottoinsieme denso numerabile.
Per quanto a¤ermato dopo la de…nizione di insieme denso, questo signi…ca
che esiste un sottoinsieme di X, chiamiamolo X0 , che è numerabile (mentre X
in generale non è numerabile) tale ogni elemento di X può essere approssimato
bene quanto vogliamo con un elemento di X0 . Quindi in uno spazio separabile esistono “relativamente pochi” elementi (un sottoinsieme numerabile) che
permettono di approssimare tutti gli altri. Ad esempio R o Rn sono insiemi
separabili, perché Q è denso in R e Qn è denso in Rn . Vedremo nel seguito
esempi di spazi di funzioni separabili.
17
3
Convergenza e completezza
I teoremi di esistenza dell’analisi, per esempio per problemi relativi ad equazioni
di¤erenziali o per problemi di minimo, vengono spesso provati costruendo opportune successioni di elementi che dovrebbero approssimare la soluzione desiderata, e poi sfruttando teoremi che garantiscano la convergenza della successione
(o di una sua sottosuccessione). Questi teoremi di convergenza ruotano attorno
a due concetti chiave dell’analisi: completezza e compattezza. In questo corso
approfondiremo ed utilizzeremo solo la prima di queste due nozioni, che è la più
semplice e già consente molte applicazioni interessanti.
Tutti i teoremi di convergenza di successioni in spazi di funzioni o spazi più
astratti, a loro volta, si fondano in ultima analisi su teoremi di convergenza
“basici” che valgono in R. E’naturale quindi partire proprio da qui.
3.1
Teoremi di convergenza in R e in Rn
Cominciamo col richiamare la proprietà di R che sta alla radice di tutti i teoremi di esistenza che valgono in Rn e negli spazi di funzioni reali de…nite su
sottoinsiemi di Rn : la proprietà dell’estremo superiore, detta anche proprietà di
completezza di R.
De…nizione 3.1 (Maggiorante, massimo, estremo superiore) Sia E R.
Si dice che E è superiormente limitato se esiste un numero K 2 R tale che
x K per ogni x 2 E. Tale numero K si dice maggiorante di E. Se ne esiste
uno (cioè se E è superiormente limitato) allora ne esistono in…niti (tutti i numeri > K sono a loro volta maggioranti). Se un maggiorante di E appartiene
ad E, si dice che è il massimo di E: Analogamente si de…niscono i concetti di
insieme inferiormente limitato, minorante, elemento minimo.
Se E è superiormente limitato e l’insieme dei maggioranti ammette elemento minimo, questo si chiama estremo superiore di E, e si indica con sup E.
Analogamente si de…nisce inf E come il massimo dei minoranti di E (se esiste).
Osserviamo che un insieme ha massimo se e solo se ha estremo superiore e
questo appartiene all’insieme stesso. Se esiste sup E ma questo non appartiene
ad E, l’insieme non ha massimo.
La proprietà dell’estremo superiore a¤erma quanto segue:
Proposizione 3.2 Se E R è un insieme non vuoto e superiormente limitato,
allora esiste sup E 2 R. (Analogamente, esiste l’estremo inferiore di un insieme
non vuoto e inferiormente limitato).
A seconda della forma logica in cui si presenta la teoria dei numeri reali,
ossia in forma assiomatica oppure in forma costruttiva (a partire dalla teoria
dei numeri razionali), la proposizione precedente assume lo status di assioma
oppure di teorema.
Ricordiamo che la de…nizione assiomatica di R consiste nel dichiarare che
R è un campo ordinato che soddisfa la proprietà dell’estremo superiore. Che
18
questi fatti siano assunti come assiomi o siano dimostrati a partire da fatti più
elementari, in ogni caso ciò che conta per il seguito del discorso è tutto qui.
Una conseguenza abbastanza semplice della proprietà dell’estremo superiore
è il seguente:
1
Teorema 3.3 (di monotonia) Sia fxn gn=1 una successione di numeri reali,
monotona crescente e superiormente limitata. Allora essa ammette limite …nito,
e il limite è l’estremo superiore dell’insieme dei valori fxn : n = 1; 2; 3:::g :
Fin qui abbiamo richiamato fatti che dovrebbero essere ben noti dall’Analisi 1. Vediamo ora altro sviluppo del discorso che lo studente potrebbe non
conoscere.
1
Teorema 3.4 (di Bolzano-Weierstrass) Sia fxn gn=1 una successione limi1
tata di numeri reali. Allora esiste una sua sottosuccessione fxnk gk=1 convergente.
Quelli appena enunciati sono i due fondamentali teoremi di convergenza in
R. Su di essi si basano, ad esempio, i teoremi importanti sulle funzioni continue
su un intervallo.
1
Ricordiamo che una sottosuccessione di fxn gn=1 è una successione estratta
1
da questa, cioè del tipo fxnk gk=1 con n1 < n2 < n3 < ::: In altre parole, la successione degli indici della sottosuccessione è monotona, anche se la sottosuccessione stessa può non esserla. Esempi di sottosuccessioni sono la sottosuccessione
dei termini di indice pari, o di indice dispari, o di indice 3n, e così via.
1
Dimostrazione del Teorema di Bolzano-Weierstrass. Poiché fxn gn=1
1
è limitata, sia [a; b] un intervallo chiuso e limitato contenente fxn gn=1 . Sia
c = (a + b) =2 il punto medio dell’intervallo. Almeno uno dei due sottointervalli [a; c] ; [c; b] deve contenere termini xn per un numero in…nito di interi n.
Chiamiamo [a1 ; b1 ] questo sottointervallo (o uno dei due, se entrambi vanno
bene), e scegliamo un termine xk1 2 [a1 ; b1 ]. Ora consideriamo il punto medio
c1 = (a1 + b1 ) =2 di [a1 ; b1 ]. Almeno uno dei due sottointervalli [a1 ; c1 ] ; [c1 ; b1 ]
deve contenere termini xn per in…niti interi n > k1 . Chiamiamo [a2 ; b2 ] questo
sottointervallo (o uno dei due, se entrambi vanno bene), e scegliamo un termine
xk2 2 [a2 ; b2 ], con k2 > k1 . Proseguendo iterativamente a questo modo, costruiamo una successione di intervalli [an ; bn ], ognuno contenuto nel precedente e
1
di lunghezza la metà del precedente, e una sottosuccessione fxkn gn=1 tale che
xkn 2 [an ; bn ]. Valgono dunque le seguenti proprietà:
1
1. fan gn=1 è una successione crescente e contenuta in [a; b] ;
1
2. fbn gn=1 è una successione decrescente e contenuta in [a; b] ;
3. bn an = (b a) =2n 8n:
4. an < xkn < bn 8n:
Allora: per (1) e il teorema di monotonia, esiste tale che an ! ; inoltre
per il teorema di permanenza del segno, 2 [a; b]. Analogamente per (2) esiste
2 [a; b] tale che bn ! . Per (3) = perché an bn ! 0. Per (4) e il
19
teorema del confronto, anche xkn ! (= ). Abbiamo quindi provato che la
1
sottosuccessione fxkn gn=1 converge.
Il teorema precedente si estende a Rn :
1
Teorema 3.5 (di Bolzano-Weierstrass in Rn ) Sia fxk gk=1 una successione
1
limitata in Rn . Allora esiste una sua sottosuccessione xkj j=1 convergente.
Dimostrazione. Il teorema si può dedurre da quello precedente (in R) col
seguente argomento, che illustriamo per semplicità nel caso n = 2.
1
1
Sia f(xk ; yk )gk=1 una successione limitata in R2 . Allora fxk gk=1 è una
successione limitata in R; e per il teorema precedente ammetterà una sottosuc1
cessione convergente a un certo x; chiamiamola fxnk gk=1 . Consideriamo allora
1
2
la sottosuccessione f(xnk ; ynk )gk=1 , limitata in R e tale che xnk ! x: Per il teo1
rema precedente la successione fynk gk=1 , limitata in R, ha una sottosuccessione
n
o1
convergente a un certo y, chiamiamola ynjk
. Allora ynjk ! y e xnjk ! x,
k=1
n
o1
1
essendo xnjk
una sottosuccessione di fxnk gk=1 che già convergeva a x.
k=1
Ne segue che xnjk ; ynjk ! (x; y), e il teorema è dimostrato.
Mostriamo subito un esempio di applicazione del teorema di Bolzano-Weierstrass
alla dimostrazione di un teorema che lo studente conosce già:
Teorema 3.6 (di Weierstrass) Sia K Rn un insieme chiuso e limitato, e
sia f : K ! R continua. Allora f ha massimo e minimo in K.
Dimostrazione. Sia = sup ff (x) : x 2 Kg, intendendo ora che tale sup può
essere …nito oppure in…nito (nel caso f non fosse limitata in K; eventualità che
escluderemo nel corso della dimostrazione). Distinguiamo due casi.
1
1
1. < 1. Sia allora fxn gn=1 K tale che f (xn )
n (per de…nizione
di estremo superiore, questi valori f (xn ) esistono certamente). La successione
1
fxn gn=1 è contenuta in K che è limitato, quindi è limitata. Perciò per il teorema
di Bolzano-Weierstrass ammette una sottosuccessione convergente, xkn ! c.
Inoltre poiché K è chiuso, c 2 K: Poiché f è continua in K; f (xn ) ! f (c).
1
D’altro canto f (xn )
per il teorema di permanenza
n implica f (c)
del segno, ed essendo f (c)
per de…nizione di estremo superiore, si ha che
f (c) = , perciò c è un punto di massimo di f e il massimo.
1
2.
= 1: Sia allora fxn gn=1
K tale che f (xn )
n. Di nuovo, la
1
successione fxn gn=1 è limitata, perciò ammette una sottosuccessione convergente, xkn ! c 2 K: Poiché f è continua in K; f (xn ) ! f (c). D’altro canto
f (xn ) n implica f (xn ) ! 1; assurdo perché f (c) è …nito. Quindi il caso 2
non può presentarsi.
Analogamente si mostra che f ammette minimo.
Il teorema di Bolzano-Weierstrass è in un certo senso caratteristico di Rn .
Negli spazi vettoriali normati di dimensione in…nita un analogo teorema non
vale, come mostrano i prossimi esempi.
20
Esempio 3.7 Sia X lo spazio vettoriale normato delle successioni reali limitate:
X = `1 =
1
x = fxn gn=1 : kxk`1 = sup jxn j < 1 :
n
In X consideriamo la successione
n
n
de…nita da:
= 0; 0; 0; :::; 0; 1; 0; 0; ::: :
n
Chiaramente si ha k n k`1 = 1 per ogni n, dunque questa è una successione
limitata in `1 , che però non ha alcuna sottosuccessione convergente. (La dimostrazione di quest’ultima a¤ ermazione sarà più facilmente svolta in seguito).
Quindi in `1 il teorema di Bolzano-Weierstrass non vale.
Esempio 3.8 Sia X = C 0 [ 1; 1] con la norma del sup, e sia
p
n
x
se x 0
p
fn (x) =
n
x se x 0
Si ha kfn kC 0 [ 1;1] = 1 per ogni n, d’altro canto la successione converge puntualmente alla funzione discontinua
8
< 1 se x > 0
0 se x = 0
f (x) =
:
1 se x < 0
perciò non può contenere nessuna sottosuccessione convergente in norma k kC 0 [ 1;1]
a una funzione continua: infatti la convergenza in norma implica la convergenza
puntuale, perciò il limite di tale sottosuccessione convergente in norma dovrebbe
essere f , che però non appartiene a C 0 [ 1; 1].
Nell’esempio precedente la successione limitata non ha una sottosuccessione
convergente nello spazio, perché, in un certo senso, converge a un limite che sta
in un altro spazio (di funzioni discontinue). Un fenomeno diverso si presenta
nel prossimo esempio, dove la successione non ha sottosuccessioni convergenti
in alcun senso ad alcuna funzione:
Esempio 3.9 Sia X = C 0 [0; 1] con la norma del sup, e sia fn (x) = sin (n x).
E’ chiaro che kfn k1 = 1 per ogni n; d’altro canto fn non ammette alcuna
sottosuccessione convergente. (Anche in questo caso, non è così facile a questo
punto del corso dimostrare rigorosamente questa a¤ ermazione, ma potrà essere
fatto più avanti).
Molta analisi funzionale è stata sviluppata per ottenere negli spazi di dimensione in…nita qualche surrogato del teorema di Bolzano-Weierstrass. Questa
linea di ricerca porta allo studio del concetto di compattezza, che però, come già
segnalato, non perseguiremo nel corso. A noi il teorema di Bolzano-Weierstrass
in Rn serve principalmente per provare un risultato di completezza, di cui ora ci
occuperemo.
21
3.2
Completezza in spazi metrici
Torniamo ora nel contesto astratto degli spazi metrici, per dare la seguente
de…nizione fondamentale.
De…nizione 3.10 (Successione di Cauchy) Sia (X; d) uno spazio metrico e
1
fxn gn=1 X: Si dice che questa successione è di Cauchy se:
8" > 0 9n0 : 8n; m
n0 si ha d (xn ; xm ) < ":
Detto in modo meno preciso ma più intuitivo: una successione è di Cauchy
se i suoi termini sono sempre più vicini tra loro, o anche: se d (xn ; xm ) ! 0 per
n; m ! 1. Per ra¤ronto, si noti che una successione è convergente (a x) se i
suoi termini sono sempre più vicini a x. E’facile allora capire che:
Proposizione 3.11 Se una successione converge in (X; d) ; allora è di Cauchy
in (X; d).
Dimostrazione. Fissiamo " > 0: Per ipotesi xn ! x per un certo x, dunque
esisterà n0 tale che 8n n0 si ha d (xn ; x) < "=2: Di conseguenza per 8n; m n0
si ha
d (xn ; xm ) d (xn ; x) + d (xm ; x) < ";
e la successione è di Cauchy.
Il fatto che una successione sia di Cauchy è quindi una condizione necessaria,
in ogni spazio metrico, a¢ nché la successione sia convergente. Il fatto che una
successione sia di Cauchy o meno si può veri…care senza sapere preliminarmente
quale sia il “candidato limite” x, mentre per provare che fxn g è convergente
in base alla de…nizione di limite occorre già avere un’idea su quale sia il limite
stesso. Ad ogni modo la condizione necessaria non è in generale su¢ ciente, come
mostra il prossimo
n
Esempio 3.12 Sia xn = 1 + n1
per n = 1; 2; 3; ::: E’ noto che xn ! e per
n ! 1, e che e è un numero irrazionale, mentre tutti i numeri xn sono razion1
ali. Dunque la successione fxn gn=1 nello spazio metrico Q non è convergente.
Tuttavia la successione in R è convergente, quindi è di Cauchy; ma allora è
di Cauchy anche in Q, perché la distanza usata in Q ed R è la stessa (quella
euclidea). Abbiamo quindi un esempio, nello spazio metrico Q, di successione
di Cauchy ma non convergente.
Il prossimo esempio mostra invece l’utilità della condizione di Cauchy per
provare che una successione non converge.
Esempio 3.13 Dimostriamo rigorosamente l’a¤ ermazione fatta nell’Esempio
3.7: nello spazio
`1 =
1
x = fxn gn=1 : kxk`1 = sup jxn j < 1 :
n
22
la successione
n
de…nita da:
n
= 0; 0; 0; :::; 0; 1; 0; 0; :::
n
1
non ammette alcuna sottosuccessione convergente. Infatti, sia f kn gn=1 una
sua qualsiasi sottosuccessione, e mostriamo che questa non è di Cauchy. Infatti
(supponendo per …ssare le idee che sia kn < km ):
kn
km
k
kn
=
0; 0; 0; 1 ; 0; :::; 0; 1; 0; :::
km k`1
kn
km
= 1 per ogni n; m;
quindi la condizione di Cauchy non vale.
Proviamo anche la seguente semplice
1
Proposizione 3.14 Se una successione fxn gn=1 è di Cauchy in (X; d), allora
è limitata.
Dimostrazione. Applichiamo la de…nizione di successione di Cauchy. Fissato
" = 1 esiste n0 tale che per ogni n; m
n0 è d (xn ; xm ) < 1. In particolare
quindi
d (xn ; xn0 ) < 1 8n n0 :
I termini della successione che non soddisfano la relazione precedente sono solo
un numero …nito: x1 ; x2 ; :::; xn 1 . Detto
M = max (1; d (x1 ; xn0 ) ; d (x2 ; xn0 ) ; :::; d (xn ; xn0 ))
si ha
d (xn ; xn0 )
M 8n;
e la successione è limitata.
Diamo ora la seguente
De…nizione 3.15 (Spazio metrico completo) Uno spazio metrico (X; d) si
dice completo se ogni successione di Cauchy in X è convergente in X.
Quindi negli spazi metrici completi la condizione di Cauchy risulta equivalente alla convergenza. In uno spazio completo se veri…chiamo che una successione è di Cauchy (il che, ricordiamolo ancora, non richiede la previa conoscenza
del candidato limite) ne segue che esiste un elemento x 2 X a cui la successione
converge. Dunque la completezza dello spazio sarà un’ipotesi importante nei
teoremi di esistenza.
L’Esempio 3.12 mostra che lo spazio metrico Q non è completo. Vale invece
il seguente fondamentale
Teorema 3.16 Rn è completo.
23
1
Dimostrazione. Sia fxk gk=1 una successione di Cauchy in Rn . Allora la
successione è limitata (Proposizione 3.14), quindi per il Teorema di Bolzano1
Weierstrass ha una sottosuccessione fxik gk=1 convergente a un certo x. Mostriamo che, in qualsiasi spazio metrico, se una successione di Cauchy ha uno
sottosuccessione convergente, allora la successione intera converge (allo stesso
limite). Poiché la sottosuccessione converge, …ssato " > 0 esiste n0 tale che se
ij
n0 allora d xij x < "=2; poiché la successione è di Cauchy, esiste n1 tale
che k; ij n1 implica d xk ; xij < "=2: Quindi per k; ij max (n0 ; n1 ) è
d (xk ; x)
d xk ; xij + d xij x < ";
in particolare per k > max (n0 ; n1 ) è d (xk ; x) < "; e la successione converge.
Si osservi che nella dimostrazione precedente l’unico passaggio che non vale
in uno spazio metrico qualsiasi è l’applicazione del teorema di Bolzano-Weierstrass,
che vale in Rn .
Tornando agli spazi metrici qualsiasi proviamo ora che:
Teorema 3.17 Se (X; d) è uno spazio metrico completo e C
chiuso. Allora (C; d) è uno spazio metrico completo.
X è un insieme
1
Dimostrazione. Sia fxn gn=1 una successione di Cauchy in C. Allora è di
Cauchy anche in X. Poiché X è completo, la successione converge a un elemento
x 2 X. D’altro canto C è chiuso perciò x 2 C (Teorema 1.21). Dunque la
successione converge in C. Perciò C è completo.
De…nizione 3.18 (Spazio di Banach) Uno spazio vettoriale normato, completo rispetto alla distanza della norma, si dice spazio di Banach.
Ad esempio Rn è uno spazio di Banach. La cosa importante per dimostrare
teoremi di esistenza per problemi di analisi è trovare spazi di funzioni (quindi
in…nito dimensionali) che siano di Banach.
Esempio 3.19 Consideriamo lo spazio C 0 [ 1; 1] con la norma integrale:
Z 1
kf kL1 [ 1;1] =
jf (x)j dx:
1
Mostriamo che non è completo. Consideriamo la successione:
p
n
x
se x 0
p
fn (x) =
n
x se x 0:
La successione è di Cauchy. Infatti per n > m si ha:
Z 1
Z
kfn fm kL1 [ 1;1] =
jfn (x) fm (x)j dx = 2
1
=2
1
1+
1
p
n
x
p
m
0
1
n
1
1
1+ m
24
! 0 per n; m ! 1:
x dx
D’altro canto la successione non converge ad alcun elemento dello spazio. Questa
a¤ ermazione non è facile da giusti…care rigorosamente a questo livello del corso.
In sostanza, tuttavia, il ragionamento è il seguente: la successione converge (con
questa norma) alla funzione limite
fn (x) =
1
1
se x > 0
se x > 0
che è discontinua, ossia non sta nello spazio considerato. Perciò, in questo
spazio, la successione non converge.
L’esempio precedente mostra che garantire la completezza di uno spazio di
funzioni non è scontato, e in particolare dipende in modo cruciale dalla norma che si considera. Nel seguito di questo capitolo ci occuperemo di spazi di
funzioni continue e derivabili e mostreremo la loro completezza, nella norma
opportuna. Questi sono gli spazi di Lagrange, in cui ad esempio si ambienta lo
studio classico dei sistemi di equazioni di¤erenziali ordinarie; in questo contesto
dimostreremo il teorema di esistenza e unicità per un problema di Cauchy. In
seguito ci occuperemo di spazi di funzioni integrabili, gli spazi di Lebesgue, e
mostreremo come per ottenere spazi di Banach di questo tipo sia stato necessario sviluppare un nuovo tipo di integrale. Questo ci porterà alla teoria della
misura e dell’integrazione nata all’inizio del 1900, su cui si basa ad esempio lo
studio moderno delle equazioni alle derivate parziali, dell’analisi armonica, del
calcolo delle variazioni.
4
Successioni di funzioni, spazi di funzioni continue o derivabili
Vogliamo ora studiare gli spazi di funzioni C 0 [a; b] ; C k [a; b] ; o i loro analoghi
per funzioni di più variabili, e provare che sono spazi di Banach. Per far questo
è necessario uno studio preliminare di certi concetti legati alla convergenza di
successioni di funzioni, di cui ora ci occuperemo.
4.1
Successioni di funzioni e convergenza uniforme
De…nizione 4.1 (Convergenza puntuale) Sia fn : I ! R per n = 1; 2; 3; :::
1
con I R o in Rn . Si dice che la successione ffn gn=1 converge in x0 2 I se la
1
1
successione reale ffn (x0 )gn=1 è convergente; si dice che la successione ffn gn=1
converge puntualmente in I se converge in x0 per ogni x0 2 I: In questo caso
risulta de…nita una nuova funzione f : I ! R, f (x) = limn!1 fn (x), detta
1
limite puntuale della successione ffn gn=1 in I.
La nozione di convergenza puntuale è semplice ma anche molto debole. Ci
si rende conto facilmente, infatti, che il limite puntuale di una successione di
funzioni talvolta non “eredita”le buone proprietà possedute dalle fn . I prossimi
esempi vogliono illustrare i tipi di fenomeni che si possono presentare.
25
Esempio 4.2 Sia fn (x) = xn in [0; 1).
8
< 0 se x 2 [0; 1)
1 se x = 1
fn (x) !
:
+1 se x > 1:
La successione converge puntualmente solo nell’intervallo [0; 1], in cui risulta
de…nita la funzione limite puntuale
f (x) =
0 se x 2 [0; 1)
1 se x = 1:
Osserviamo che in questo caso il limite puntuale è una funzione discontinua,
sebbene le fn siano tutte funzioni continue.
p
Esempio 4.3 Sia fn (x) = n jxjsgn(x) in [ 1; 1].
8
< 1 se x 2 (0; 1]
0 se x = 0
fn (x) !
:
1 se x 2 [ 1; 0):
Anche in questo caso il limite puntuale è una funzione discontinua, sebbene le
fn siano tutte funzioni continue.
Esempio 4.4 Sia fn : [0; +1) ! R de…nita per n = 1; 2; 3; :::da:
1
x
per x 2 [ n1 ; 1)
nx per x 2 0; n1 :
fn (x) =
Si ha:
fn (x) !
1
x
per x 2 (0; 1)
0 per x = 0:
In questo caso il limite puntuale di una successione di funzioni continue e limitate è una funzione discontinua e illimitata. (Si noti che il limite è …nito in
ogni punto).
Esempio 4.5 Sappiamo che l’insieme Q\ [0; 1] è numerabile, perciò possiamo
1
elencare i suoi elementi in una successione3 fxn gn=1 . Sia ora:
fn (x) =
1 se x = x1 ; x2 ; x3 ; :::; xn
0 altrimenti.
Si ha:
fn (x) !
1 se x 2 Q
0 altrimenti.
Si noti che ogni funzione fn : [0; 1] ! R è continua tranne che in n punti;
in particolare è Riemann integrabile. Invece la funzione limite f [0; 1] ! R è
discontinua in tutti i punti e non è Riemann integrabile.
3 Non
si tratterà di una successione monotona. Ad esempio, i suoi primi termini potrebbero
essere:
0; 1; 1=2; 1=3; 2=3; 1=4; 3=4; 1=5; 2=5; :::
26
Esempio 4.6 Sia fn : R ! R de…nita per n = 1; 2; 3; ::: da
1
1+ n
fn (x) = jxj
:
Si ha:
fn (x) ! jxj :
1
Notiamo che ogni fn è derivabile: fn0 (x) = 1 + n1 jxj n sgn(x), in particolare
esiste fn0 (0) = 0 e si ha fn 2 C 1 (R), mentre il limite puntuale f non è derivabile
in x = 0. Si ha f 2 C 0 (R) n C 1 (R) :
La morale di questi esempi è: in generale la convergenza puntuale di una
successione di funzioni non permette di a¤ermare che la funzione limite f abbia
le “buone proprietà” delle singole fn . Per poter provare dei risultati che permettono di trasferire proprietà delle fn alla f è necessario introdurre e studiare
una nozione più forte delle convergenza puntuale: la convergenza uniforme, che
ora introduciamo.
De…nizione 4.7 (Convergenza uniforme) Sia fn : I ! R per n = 1; 2; 3; :::
1
con I R o in Rn . Si dice che la successione ffn gn=1 converge uniformemente
in I alla funzione f : I ! R se
sup jfn (x)
x2I
f (x)j ! 0 per n ! +1
ossia se
8" > 0 9n0 tale che n
n0 =) jfn (x)
f (x)j < " 8x 2 I:
A titolo di confronto, notiamo che invece a¤ermare che fn ! f puntualmente
in I signi…ca che
8x 2 I; 8" > 0 9n0 tale che n
n0 =) jfn (x)
f (x)j < ":
Dal punto di vista logico, la di¤erenza sta tutta nella posizione del quanti…catore
“8x 2 I”; nel caso della convergenza puntuale, a¤ermare che per ogni x e
per ogni " esiste n0 tale che..., implicitamente signi…ca che il numero n0 può
dipendere anche da x (oltre che da "); nel caso della convergenza uniforme invece
l’ordine dei quanti…catori ci dice che n0 non dipende da x. Questo si traduce
nel fatto che la distanza tra il gra…co di fn e quello di f diventa uniformemente
piccolo; precisamente, tutto il gra…co di fn (x) in I è compreso nella striscia
(f (x) "; f (x) + ") non appena n n0 .
1+1=n
Esempio 4.8 La successione fn (x) = jxj
converge uniformemente in [ 1; 1]
a f (x) = jxj. (Questa a¤ ermazione sarà provata in un esempio successivo). Illustriamo il signi…cato geometrico di questa a¤ ermazione. Tracciamo per prima
27
cosa il gra…co di f insieme al gra…co delle prime fn :
Ora tracciamo il gra…co di f (x) insieme a quello di f (x) + 0:1 e f (x) 0:1;
ottenendo così una striscia in cui devono essere contenuti i gra…ci interi delle
funzioni fn ; almeno per n abbastanza grande:
f1 non sta nella striscia
f2 non sta nella striscia
f3 sta nella striscia
f4 sta nella striscia, e così via
p
Esempio 4.9 La successione fn (x) = n jxjsgn(x) converge a
8
< 1 se x 2 (0; 1]
0 se x = 0
f (x) =
:
1 se x 2 [ 1; 0):
(come già visto nell’Esempio 4.3). Mostriamo che la convergenza non è uniforme. Come sopra, tracciamo per prima cosa il gra…co di f insieme al gra…co
28
delle prime fn :
Ora tracciamo il gra…co di f (x) insieme a quello di f (x) + 0:1 e f (x) 0:1,
ottenendo così una striscia in cui devono essere contenuti i gra…ci interi delle
funzioni fn ; almeno per n abbastanza grande:
f1 non sta nella striscia
f3 non sta nella striscia
f6 non sta nella striscia
f10 non sta nella striscia
e si capisce che anche aumentando l’indice n non è possibile che il gra…co intero
sia contenuto nella striscia. Infatti il gra…co di ogni fn è continuo, perciò non
può entrare nei due pezzi di striscia, che sono tra loro discosti.
Si noti anche che:
fn ! f uniformemente in I () kfn
f kC 0 (I) ! 0:
In altre parole, la norma C 0 (I) è la norma della convergenza uniforme. Si
osservi tuttavia che la nozione di convergenza uniforme si può applicare anche
29
a funzioni discontinue. In altre parole qui stiamo usando la norma di C 0 (I) per
calcolare la distanza tra due funzioni qualsiasi de…nite su I (e naturalmente tale
distanza non sempre è …nita).
Vediamo ora alcuni risultati che mostrano come per una successione di funzioni uniformemente convergente alcune buone proprietà delle fn si trasferiscano
al limite f .
Teorema 4.10 (Convergenza uniforme e continuità) Siano fn : I ! R,
con I
Rn , funzioni continue per n = 1; 2; 3:::; e supponiamo che fn ! f
uniformemente in I. Allora f è continua in I.
Dimostrazione. Proviamo che f è continua in un generico punto x 2 I.
Scriviamo anzitutto
jf (x)
f (x)j
jf (x)
fn (x)j + jfn (x)
fn (x)j + jfn (x)
f (x)j ;
con un n che ora sceglieremo. Per " > 0 …ssato, per de…nizione di convergenza uniforme esiste n0 tale che per ogni n
n0 si ha jf (x) fn (x)j < ": In
particolare allora si ha:
jf (x)
f (x)j
" + jfn0 (x)
fn0 (x)j + ":
Poiché fn0 è continua, …ssato " > 0 esiste > 0 tale che jx
jfn0 (x) fn0 (x)j < ": Allora per jx xj < si ha
jf (x)
f (x)j
xj <
=)
3";
e f è continua in x.
Teorema 4.11 (Convergenza uniforme e limitatezza) Siano fn : I ! R,
con I
Rn , funzioni limitate per n = 1; 2; 3:::; e supponiamo che fn ! f
uniformemente in I. Allora f è limitata in I.
Dimostrazione. Fissato " = 1, per l’ipotesi di convergenza uniforme esiste n0
tale che per ogni n n0 è jfn (x) f (x)j < 1 per ogni x 2 I, perciò
jf (x)j
jfn0 (x)
f (x)j + jfn0 (x)j < 1 + jfn0 (x)j :
D’altro canto per ipotesi fn0 è limitata, perciò esiste K > 0 tale che jfn0 (x)j <
K per ogni x 2 I, e
jf (x)j < 1 + K per ogni x 2 I;
perciò f è limitata.
Ci limitiamo a enunciare anche il prossimo:
Teorema 4.12 (Convergenza uniforme e integrabilità) Siano fn : [a; b] !
R, funzioni limitate e Riemann integrabili per n = 1; 2; 3:::; e supponiamo che
fn ! f uniformemente in I. Allora f è (limitata e) Riemann integrabile in
[a; b].
30
E’interessante rileggere alla luce di questi teoremi gli esempi presentati in
precedenza: negli esempi 4.2 e 4.3 una successione di funzioni continue converge
a una funzione discontinua; nell’esempio 4.4 una successione di funzioni limitate
converge a una funzione illimitata; nell’esempio 4.5 una successione di funzioni
Riemann integrabili converge a una funzione non integrabile. Evidentemente
in tutti questi esempi la convergenza non è uniforme. Si invita il lettore a
rendersene conto ragionando sul gra…co delle funzioni e sul signi…cato geometrico
di convergenza uniforme.
Illustriamo ora un criterio che sarà utile a provare la completezza degli spazi
di funzioni continue.
Teorema 4.13 (Condizione di Cauchy per la convergenza uniforme) Siano
fn : I ! R, con I
Rn , per n = 1; 2; 3::: e supponiamo che valga la seguente
condizione di Cauchy:
8" > 09n0 tale che 8n; m
n0 ; 8x 2 I risulta jfn (x)
fm (x)j < ":
(4.1)
Allora la successione fn converge uniformemente in I ad una certa funzione
f : I ! R. Viceversa, se fn converge uniformemente in I ad una certa funzione
f : I ! R; allora vale la (4.1).
L’ipotesi del teorema si chiama appunto condizione di Cauchy per la convergenza uniforme, e si può scrivere anche così:
8" > 09n0 tale che 8n; m
n0 ; 8x 2 I risulta kfn
fm k1 < ":
(4.2)
Dimostrazione. Assumiamo che valga la (4.1). Allora per ogni x 2 I …ssato,
1
la successione reale ffn (x)gn=1 risulta di Cauchy. Quindi, per la completezza
di R, fn (x) converge a un limite, che chiameremo f (x). Risulta così de…nita
una funzione che è limite puntuale delle fn . Dobbiamo provare che è anche
limite uniforme. Fissato " > 0 applichiamo l’ipotesi (4.1) e nella disuguaglianza
jfn (x) fm (x)j < " passiamo al limite per m ! 1; poiché fm (x) ! f (x), per
il teorema di permanenza del segno si ha:
jfn (x)
f (x)j
"
8x 2 I:
Quindi …ssato " > 0 esiste n0 tale che per ogni n n0 risulta jfn (x) f (x)j < "
per ogni x 2 I, perciò fn ! f uniformemente, che è la tesi.
Viceversa, se la successione converge uniformemente, cioè converge nella
norma k k1 ; allora è di Cauchy in norma k k1 (stessa dimostrazione vista per
provare che in uno spazio metrico una successione convergente è di Cauchy),
quindi vale la (4.1).
Possiamo ora provare il primo risultato fondamentale di completezza di uno
spazio di funzioni:
Teorema 4.14 Sia K
Rn un insieme chiuso e limitato. Allora lo spazio
0
vettoriale normato C (K) (delle funzioni f : K ! R continue, con la norma
k kC 0 (K) ) è completo, cioè è uno spazio di Banach.
31
Dimostrazione. Ricordiamo anzitutto che l’ipotesi K chiuso e limitato serve a
garantire che le funzioni in C 0 (K) siano limitate (per il teorema di Weierstrass)
e quindi la loro norma k kC 0 (K) sia …nita.
1
Sia ffn gn=1
C 0 (K) una successione di Cauchy in C 0 (K) , e proviamo
0
che converge in C (K). Dire che è di Cauchy nello spazio vettoriale normato
C 0 (K) signi…ca dire che vale la (4.2), quindi la (4.1); perciò per il Teorema
1
4.13 ffn gn=1 converge uniformemente, cioè in norma k kC 0 (K) , a una certa f .
D’altro canto, essendo limite uniforme di funzioni continue, per il Teorema 4.10
anche f 2 C 0 (K). Quindi fn ! f in C 0 (K), e C 0 (K) è completo.
4.2
Spazi di funzioni derivabili
Vorremmo ora dimostrare che analoghi spazi di funzioni derivabili sono completi.
Ragioniamo sullo spazio C 1 [a; b], che si può vedere come sottospazio vettoriale
di C 0 [a; b]. Sappiamo che un sottoinsieme chiuso di uno spazio metrico completo è completo, quindi se mettiamo in C 1 [a; b] la norma k kC 0 [a;b] possiamo
vedere
C 1 [a; b] ; k kC 0 [a;b]
come sottoinsieme dello spazio metrico completo
C 0 [a; b] ; k kC 0 [a;b] . Se questo risulta chiuso, allora è completo. Non è così
però, come mostra il prossimo
1
1+ n
Esempio 4.15 Sia fn (x) = jxj
1; 2; 3; :::; con
fn0 (x) =
1+
1
n
in [ 1; 1] : Si ha fn 2 C 1 [ 1; 1] per n =
1
jxj n sgn (x) per x 6= 0; fn0 (0) = 0:
Risulta: fn (x) ! f (x) = jxj per x ! 1. Si veri…ca inoltre che questa
convergenza è uniforme, infatti:
max jfn (x)
f (x)j = per simmetria
x2[ 1;1]
= max
x2[0;1]
Ora cerchiamo il massimo di g (x) = x
g 0 (x) = 1
1+
1
1 + n1
x
max g (x) = g
x2[0;1]
=
1
n
1
x1+ n .
0 per
n
1
1 + n1
1
1 + n1
1
xn
1
x1+ n :
x
n
!
1
=
n
1 + n1
!
1
n 1 + n1
32
n
1
1
1+
1
! 0:
en
1
n
!
Pertanto fn ! f uniformemente in C 0 [ 1; 1], ossia fn ! f in norma C 0 [ 1; 1] :
Tuttavia il limite f non appartiene a C 1 [ 1; 1] (f (x) = jxj non è derivabile in
0), quindi C 1 [ 1; 1] non è un sottoinsieme chiuso di C 0 [ 1; 1]. Inoltre: poiché
fn ! f in norma C 0 [ 1; 1] ; fn è di Cauchy in norma C 0 [ 1; 1] e dunque è di
Cauchy anche in C 1 [ 1; 1] ; k kC 0 [ 1;1] , ma non converge in C 1 [ 1; 1] perché
f non sta in questo spazio. Pertanto lo spazio
completo.
C 1 [ 1; 1] ; k kC 0 [
1;1]
non è
Si presti attenzione al signi…cato dell’esempio precedente, che mostra due
cose distinte:
1. Lo spazio vettoriale normato C 1 [ 1; 1] ; k kC 0 [ 1;1] non è completo.
2. Lo spazio C 1 [ 1; 1] ; k kC 0 [
1;1]
, visto come sottoinsieme dello spazio
metrico C 0 [ 1; 1] ; k kC 0 [ 1;1] , non è chiuso.
La seconda cosa è in un certo senso la giusti…cazione intuitiva della prima. Una successione di Cauchy in C 1 [ 1; 1] ; k kC 0 [ 1;1] è anche di Cauchy
in
C 0 [ 1; 1] ; k kC 0 [
1;1]
, pertanto in questo secondo spazio converge per-
ché questo spazio è completo; il limite sta in C 0 [ 1; 1] ma non necessariamente in C 1 [ 1; 1]; in quest’ultimo caso abbiamo una successione di Cauchy in
C 1 [ 1; 1] ; k kC 0 [ 1;1] ma non convergente in questo spazio.
All’origine di questo problema sta il fatto che stiamo mettendo in C 1 [ 1; 1]
la norma sbagliata: quella k kC 0 [ 1;1] , che dà un controllo sulla f ma non su f 0 .
L’idea è che se vogliamo sperare che uno spazio vettoriale normato di funzioni sia
completo, la norma deve controllare le proprietà importanti della funzione che
determinano l’appartenenza allo spazio stesso: se stiamo studiando uno spazio
di funzioni derivabili, a¢ nché sia completo sarà necessario mettere una norma
che controlli anche la derivata; se studiamo uno spazio di funzioni integrabili,
a¢ nché sia completo sarà necessario mettere una norma che controlli l’integrale,
e così via.
Facciamo anche la seguente ulteriore osservazione. Nell’esempio appena
considerato, fn ! f uniformemente, ma
fn0 (x) =
1+
1
n
1
jxj n sgn (x) ! sgn (x) (per x 6= 0),
e questa convergenza non è certamente uniforme, dal momento che le fn0 sono
continue mentre il loro limite è discontinuo. Questo suggerisce che per conservare la derivabilità del limite della successione occorra richiedere la convergenza
uniforme delle derivate. E’quanto a¤erma il prossimo teorema:
Teorema 4.16 (Convergenza uniforme e derivabilità) Sia fn : [a; b] !
R, fn 2 C 1 [a; b] e supponiamo che:
1. La successione fn0 converge uniformemente in [a; b] a una certa funzione
g.
33
2. La successione fn converge in almeno un punto x0 2 [a; b].
Allora:
La successione fn converge uniformemente in [a; b] a una certa f 2 C 1 [a; b],
0
e f = g:
Dimostrazione. Proviamo anzitutto che ffn g converge uniformemente in [a; b]
mostrando che è soddisfatta la condizione di Cauchy per la convergenza uniforme
(4.1). Per far questo applichiamo il teorema di Lagrange alla funzione fn fm
sull’intervallo [x0 ; x] (dove x0 è il punto che compare nell’ipotesi 2, e x è qualsiasi
punto in [a; b]). Esiste dunque un punto tn;m;x (cioè dipendente da n; m; x) in
[x0 ; x] tale che
fn (x)
fm (x) = fn (x0 )
fm (x0 ) + (x
x0 ) [fn0 (tn;m;x )
0
fm
(tn;m;x )] :
Fissato " > 0; per la convergenza uniforme delle fn0 (e quindi la condizione di
Cauchy soddisatta dalle fn0 ) esiste n0 tale che per ogni n; m n0 si ha
jfn0 (tn;m;x )
0
fm
(tn;m;x )j < " per ogni x 2 [a; b] :
Per l’ipotesi 2 (e quindi la condizione di Cauchy soddisfatta dalla successione
numerica ffn (x0 )g), inoltre, esiste n1 tale che per ogni n; m n1 è
jfn (x0 )
Quindi per ogni n; m
jfn (x)
fm (x0 )j < ":
N = max (n0 ; n1 ) si ha
fm (x)j < " + jx
x0 j "
" (1 + jb
aj) per ogni x 2 [a; b] :
Questo dimostra la condizione di Cauchy per la convergenza uniforme delle fn ,
perciò la successione fn converge uniformemente a una certa f; con f 2 C 0 [a; b]
(perché limite uniforme di funzioni continue).
Mostriamo ora che f è derivabile con derivata g. Fissato x 2 [a; b] qualunque
e h opportunamente piccolo, consideriamo
f (x + h) f (x) = [f (x + h)
fn (x + h)]+[fn (x + h)
fn (x)]+[fn (x)
f (x)] :
Applichiamo il teorema di Lagrange a fn su [x; x + h]; esisterà tn;x;h 2 [x; x + h]
tale che
fn (x + h) fn (x) = hfn0 (tn;x;h ) .
1
Per ogni x; h …ssato, la successione ftn;x;h gn=1 [x; x + h] è limitata, quindi per
1
il teorema di Bolzano-Weierstrass ammette una sottosuccessione ftkn ;x;h gn=1
convergente a un certo t 2 [x; x + h] : Mostriamo che allora
fk0 n (tkn ;x;h ) ! g t :
Infatti
fk0 n (tkn ;x;h )
g t = fk0 n (tkn ;x;h )
34
g (tkn ;x;h ) + g (tkn ;x;h )
g t
:
Ora: fk0 n (tkn ;x;h ) g (tkn ;x;h ) ! 0 per la convergenza uniforme di fn0 a g;
g (tkn ;x;h ) g t ! 0 perché g è continua, in quanto limite uniforme delle fn0
continue. Passando al limite per n ! 1 nella
f (x + h)
f (x) = [f (x + h)
fkn (x + h)] + [hfn0 (tn;x;h )] + [fkn (x)
f (x)]
si ha allora
f (x + h)
f (x) = hg t per un certo t 2 [x; x + h] :
Dunque
f (x + h) f (x)
= g t ! g (x) per h ! 0;
h
perché per h ! 0 è t ! x; e come già ricordato g è continua. Perciò esiste
f 0 = g. Già sappiamo che g è continua, perciò f 0 è continua, ossia f 2 C 1 [a; b].
Possiamo ora dimostrare il seguente risultato fondamentale:
Teorema 4.17 Lo spazio C 1 [a; b] ; con la norma
kf kC 1 [a;b] = kf kC 0 [a;b] + kf 0 kC 0 [a;b]
è di Banach.
1
Dimostrazione. Sia ffn gn=1 una successione di Cauchy in C 1 [a; b] : Per
1
1
de…nizione di norma kf kC 1 [a;b] ; questo signi…ca che sia ffn gn=1 che ffn0 gn=1
soddisfano la condizione di Cauchy per la convergenza uniforme; pertanto esistono f; g 2 C 0 [a; b] tali che fn ! f uniformemente e fn0 ! g uniformemente
in [a; b] : Per il teorema precedente, questo implica che f 2 C 1 [a; b] e f 0 = g;
dunque
kfn f kC 0 [a;b] ! 0 e kfn0 f 0 kC 0 [a;b] ! 0;
ossia fn ! f in C 1 [a; b].
Questo risultato si può generalizzare a funzioni di classe C k anche in più
variabili. De…niamo quindi con precisione gli spazi vettoriali normati classici di
funzioni derivabili:
De…nizione 4.18 (Spazi di Lagrange) Sia
Rn un aperto limitato. Ricordiamo anzitutto la scrittura a multiindice per le derivate parziali di qualsiasi
ordine di una funzione reale di n variabili:
= ( 1 ; 2 ; :::; n ) ; dove i sono interi
j j = 1 + 2 + ::: + n ; allora
@ f (x) =
@
1
x1
0 e poniamo
@j jf
(x) :
@x22 :::@xnn
Per k = 1; 2; 3; ::: de…niamo:
Ck
= f:
! R : f 2 C0
e @ f 2 C0
35
8
con j j
k
:
Poniamo
kf kC k ( ) = kf kC 0 ( ) +
k X
X
j=1 j j=j
k@ f kC 0 ( ) :
Osservazione 4.19 (Perché ?) Si noti che mentre lo spazio C 0 (K) è de…nito con K sottoinsieme chiuso e limitato di Rn , perché in base al teorema di
Weierstrass questo è su¢ ciente a garantire la …nitezza della norma kf kC 0 (K) ;
per calcolare le derivate parziali di f abbiamo bisogno di essere in un insieme
aperto; partiamo perciò da un insieme aperto e limitato , la cui chiusura è
un insieme chiuso e limitato; f si suppone de…nita e continua in ; le derivate
parziali di f esistono in
e si suppone si possano prolungare con continuità
…no al bordo di ; a questo modo f e le @ f sono continue sul chiuso e limitato
; quindi kf kC k ( ) è …nita.
Vale il seguente risultato:
Teorema 4.20 Gli spazi C k
sopra de…niti sono di Banach.
Abbiamo dimostrato questo teorema per k = 1 e n = 1 (Teorema 4.17).
La dimostrazione del teorema generale, ad ogni modo, presenta solo qualche
complicazione notazionale in più, ma il nocciolo delle idee è già tutto nel teorema base che abbiamo dimostrato, perciò non aggiungeremo altri dettagli sulla
dimostrazione.
Segnaliamo anzi che il risultato precedente si estende senza di¢ coltà agli
spazi di funzioni a valori vettoriali
Ck
; Rm = f :
! Rm : f = (f1 ; f2 ; :::; fm ) con f1 ; f2 ; :::; fm 2 C k
munito della norma
kf kC k (
4.3
;Rm
)=
m
X
j=1
;
kfj kC k ( ) .
Spazi di funzioni in…nitamente derivabili
Completiamo il discorso sugli spazi C k con qualche osservazione sugli spazi di
funzioni derivabili in…nite volte, che pure spesso si usano in analisi.
De…nizione 4.21 Se
Rn è un aperto limitato, de…niamo
C1
=
1
\
Ck
;
k=1
cioè lo spazio delle funzioni continue e con derivate di qualsiasi ordine continue
su tutto .
36
Questo è uno spazio vettoriale, che non ha però una norma “naturale”.
E’ chiaro infatti che qualunque norma k kC k ( ) è ben de…nita per le funzioni
di questo spazio, ma nessuna di esse è su¢ ciente a “catturare” l’informazione
sull’in…nita derivabilità. In altre parole, ci aspettiamo (ed in e¤etti è così) che
lo spazio C 1
; k kC k ( ) (comunque scelto un intero k) risulti uno spazio
vettoriale normato non completo.
De…nizione 4.22 Se
C01 ( ) = f 2 C 1
Rn è un aperto (anche non limitato), de…niamo
: 9K chiuso e limitato, K
: f (x) = 0 8x 2
=K :
Le funzioni di questo spazio si dicono di solito “funzioni C 1 a supporto
compatto”; il supporto è l’insieme su cui la funzione è diversa da zero, e si
richiede che esista un chiuso e limitato (che in Rn è sinonimo di “compatto”,
termine che però non abbiamo mai usato) che fa da supporto ad f ; questo
supporto può essere diverso da funzione a funzione. Poiché f e le sue derivate
sono diverse da zero solo su un insieme chiuso e limitato, su cui sono continue,
sono automaticamente limitate anche se fosse illimitato, perciò anche per le
funzioni in C01 ( ) tutte le norme k kC k ( ) risultano …nite. Come per lo spazio
C1
, però, lo spazio C01 ( ) ; k kC k ( ) è uno spazio vettoriale normato
non completo.
Si noti che una funzione C01 ( ) in particolare dev’essere C 1
; quindi
sulla frontiera del supporto, cioè là dove comincia ad annullarsi, deve annullarsi
f insieme a tutte le sue derivate. Che esistano funzioni di questo tipo non è
ovvio. Vale la pena quindi fare un
Esempio 4.23 Sia f : R ! R così de…nita:
(
1
e x2 1 per x 2 ( 1; 1)
f (x) =
0 altrove.
1
La funzione e x2 1 si annulla con velocità esponenziale per x ! 1 e per x !
1+ , e lo stesso fanno le sue derivate di ogni ordine. Perciò la funzione si
raccorda in modo C 1 con la costante zero nei punti 1, ed f risulta C 1 (R),
con supporto in [ 1; 1]. Perciò f 2 C01 (R) o C01 (a; b) per ogni intervallo
(a; b) [ 1; 1].
37
4.4
Funzioni Lipschitziane
Introduciamo uno spazio di funzioni che pure useremo talvolta, ed è uno spazio
intermedio tra C 0 e C 1 .
De…nizione 4.24 Sia
Lip
Rn un aperto limitato. Poniamo:
n
o
= f : ! R : jf jLip( ) < 1 , con
jf jLip( ) =
sup
x;y2 ;x6=y
jf (x)
jx
f (y)j
,
yj
e
kf kLip( ) = kf kC 0 ( ) + jf jLip( ) :
Le funzioni in Lip
(dette “Lipschitziane in ”) sono automaticamente
è uno spazio vettoriale, normato con la norma
continue; lo spazio Lip
kf kLip( ) . Si può dimostrare4 che:
Teorema 4.25 Lo spazio Lip
con la norma kf kLip( ) è di Banach.
Rispetto alle funzioni continue, le funzioni lipschitziane in aggiunta hanno rapporto incrementale limitato. Per esempio, in una variabile queste sono
funzioni che non possono avereppunti a tangente verticale: la funzione jxj è
Lipschtziana in [ 1; 1] ; mentre 3 x non lo è.
Le funzioni lipschitziane non sono necessariamente derivabili, come mostra
già l’esempio jxj, tuttavia si può dimostrare (Teorema di Rademacher) che sono
derivabili “in quasi ogni punto”. A questo stadio del corso però non è ancora
possibile spiegare il signi…cato preciso di questa a¤ermazione. Ci ritorneremo
in seguito.
Si noti invece che le funzioni C 1
sono certamente lipschitziane, come
conseguenza del teorema di Lagrange. Infatti per ogni x; y 2 ; x 6= y; esiste
un punto t 2 [x; y] (dove il simbolo [x; y] in questo caso non indica un intervallo
sulla retta, ma il segmento di estremi x; y in ) tale che
f (x)
f (y) = (x
y) rf (t) ;
da cui
jf (x)
f (y)j
jx
yj jrf (t)j
K jx
yj ;
in quanto jrf j è limitato in
perché f 2 C 1
. Come anticipato, quindi,
Lip
è uno spazio di funzioni intermedio tra C 0
e C1
; di funzioni
“più che continue e quasi derivabili”.
4 Una
traccia di questa dimostrazione sarà fornita nell’Esercizio 6.31.
38
5
Il teorema delle contrazioni in spazi metrici e
le sue applicazioni
5.1
Teorema delle contrazioni
Torniamo ora al contesto astratto degli spazi metrici, per presentare un teorema, abbastanza semplice nella dimostrazione ma profondo per le conseguenze.
Lo utilizzeremo in seguito per dimostrare risultati di esistenza e unicità per
problemi di¤erenziali.
Teorema 5.1 (Teorema delle contrazioni, di Banach-Caccioppoli)
(X; d) uno spazio metrico completo, e sia
5
Sia
f :X!X
una contrazione di X in se stesso, ossia una funzione tale che, per un certo
2 (0; 1) sia
d (f (x) ; f (y))
d (x; y) 8x; y 2 X:
Allora f ammette uno e un solo punto …sso, cioè elemento x 2 X tale che
f (x) = x:
La funzione f si può vedere come una trasformazione geometrica dello spazio
X in sè. Si dice contrazione perché avvicina i punti: la distanza tra i punti
trasformati f (x) e f (y) è sempre strettamente minore della distanza di x da
y, poiché < 1. (Tranne il caso in cui x = y; ovviamente). Il punto x si
chiama punto …sso, o punto unito, perché non viene spostato da f . Il teorema
garantisce l’esistenza e unicità del punto …sso di f . Si tratta del primo di una
serie di teoremi di punto …sso dell’analisi funzionale, che in contesti di varia e
crescente astrazione garantiscono sotto varie ipotesi l’esistenza (e solo talvolta
anche l’unicità) di punti …ssi. Questi risultati servono a provare teoremi di
esistenza per problemi, generalmente non lineari, per equazioni di¤erenziali o
integrali.
Dimostrazione. Proviamo l’esistenza del punto …sso. Sia x0 2 X un punto
qualsiasi, e consideriamo la successione delle iterate di f a partire da x0 ; ossia
la successione:
x1 = f (x0 )
x2 = f (x1 )
:::
xn+1 = f (xn )
:::
5 Risultato
ottenuto da S. Banach nel 1922 e R. Caccioppoli nel 1939.
39
1
Proviamo che la successione fxn gn=1 è di Cauchy. Anzitutto si ha, per de…nizione
di xn e per l’ipotesi su f :
d (xj ; xj+1 ) = d (f (xj
1) ; f
(xj ))
d (xj
1 ; xj )
e quindi iterativamente
j
d (xj ; xj+1 )
d (x0 ; x1 ) per ogni j:
Allora, per ogni n; m (con n > m) si ha, per la disuguaglianza triangolare
d (xn ; xm )
n
X
d (xj ; xj
1)
j=m+1
n
X
j
d (x0 ; x1 )
j=m+1
= d (x0 ; x1 )
m+1
nX
m 1
m+1
j
d (x0 ; x1 )
j=0
1
essendo 2 (0; 1). Ne segue che d (xn ; xm ) ! 0 per n; m ! 1: Dunque la
1
successione fxn gn=1 è di Cauchy, perciò per la completezza di X esiste x tale
che xn ! x. Poiché f : X ! X è continua (perché è una contrazione) sarà
f (xn ) ! f (x) : Allora passando al limite nell’identità
xn+1 = f (xn )
si ha
x = f (x) ,
ed è provata l’esistenza del punto …sso.
Proviamo l’unicità. Se esistono x; y tali che
x = f (x) ; y = f (y)
allora si ha:
d (x; y) = d (f (x) ; f (y))
da cui (1
) d (x; y)
d (x; y)
0; perciò d (x; y) = 0 e x = y, il che prova l’unicità.
Esempio 5.2 Sia X = C 0 [0; 1]. Sappiamo che è uno spazio metrico completo
con k kC 0 [0;1] . Sia
f :X!X
Z
1 t
f (x) (t) =
cos [x (s)] ds:
2 0
Detto in parole, la funzione continua x (t) viene trasformata da f nella funzione
integrale indicata. La funzione integrale è continua, quindi e¤ ettivamente f :
X ! X: Proviamo che è una contrazione. Poiché
jcos
cos j
40
j
j
si ha
jf (x) (t)
Z
1 t
f (y) (t)j =
cos [x (s)] cos [y (s)] ds
2 0
Z t
1
jcos [x (s)] cos [y (s)]j ds
2 0
Z t
1
jx (s) y (s)j ds
2 0
Z
1 t
t
kx ykC 0 [0;1] ds = kx ykC 0 [0;1] ;
2 0
2
perciò
1
kx ykC 0 [0;1] ;
2
e f è una contrazione di X in sé. Per il teorema precedente, esiste dunque una
e una sola funzione x (t) 2 C 0 [0; 1] per cui risulti
Z
1 t
x (t) =
cos [x (s)] ds per ogni t 2 [0; 1] :
2 0
kf (x)
f (y)kC 0 [0;1]
Si noti che determinare esplicitamente questa x non è banale.
Osservazione 5.3 Non ostante l’ambientazione astratta, questo teorema di esistenza ha un aspetto costruttivo: il punto …sso è ottenuto come limite di una
successione che, almeno in teoria, si può sempre pensare di costruire, e in questo
caso o¤ re anche un algoritmo di calcolo approssimato della soluzione e¤ ettiva.
In molti casi in realtà la forma esplicita dell’iterata di f è così complicata da
rendere questo procedimento inutilizzabile. Tuttavia vedremo che quest’idea della
successione approssimante può essere e¤ ettivamente utile.
5.2
Applicazioni al problema di Cauchy per sistemi di
equazioni di¤erenziali ordinarie
Consideriamo un sistema di n equazioni di¤erenziali ordinarie del prim’ordine
in forma normale, ossia:
8 0
y = f1 (t; y1 ; y2 ; :::; yn )
>
>
< 10
y2 = f2 (t; y1 ; y2 ; :::; yn )
(5.1)
:::
>
>
: 0
yn = fn (t; y1 ; y2 ; :::; yn )
dove le incognite sono le n funzioni yi (t) ; reali di variabile reale, e sono assegnate
n funzioni fi : ! R, con
Rn+1 .
Osserviamo che si può riscrivere in questa forma anche una singola equazione
di¤erenziale ordinaria di ordine n in forma normale:
y (n) = F t; y; y 0 ; y 00 ; :::; y (n
41
1)
:
(5.2)
E’su¢ ciente infatti porre:
8 0
y1 = y2
>
>
>
>
< y20 = y3
:::
>
>
y0
= yn
>
>
: n0 1
yn = F (t; y1 ; y2 ; :::; yn )
col che l’equazione (5.2) ha assunto la forma di sistema di n equazioni del 1
ordine.
Questa procedura funziona anche con sistemi di equazioni di ordine superiore
al primo, scritte in forma normale. Consideriamo, ad esempio, il sistema di
equazioni che regge la dinamica di un punto materiale mobile nello spazio R3 in
base alla legge di Newton. Da
F = ma;
se (x; y; z) (t) indica la posizione del punto materiale all’istante t e la forza F
dipende dal tempo, dalla posizione e dalla velocità del punto, si ha (ponendo
f = F =m)
8 00
< x = f1 (t; x; y; z; x0 ; y 0 ; z 0 )
y 00 = f2 (t; x; y; z; x0 ; y 0 ; z 0 )
: 00
z = f3 (t; x; y; z; x0 ; y 0 ; z 0 )
sistema di 3 equazioni del 2
nella forma (5.1) così:
8 0
y
>
>
> 10
>
y
>
>
< 20
y3
y40
>
>
>
>
y0
>
>
: 50
y6
ordine in forma normale, che può riscriversi ancora
= y2
= f1 (t; y1 ; y2 ; y3 ; y4 ; y5 ; y6 )
= y4
= f2 (t; y1 ; y2 ; y3 ; y4 ; y5 ; y6 )
= y6
= f3 (t; y1 ; y2 ; y3 ; y4 ; y5 ; y6 ) :
Tutto ciò per ricordare che i sistemi di equazioni di¤erenziali ordinarie del
prim’ordine costituiscono un quadro concettuale entro cui si può studiare una
varietà di problemi di¤erenziali. A sua volta, un sistema (5.1) si può scrivere in
forma compatta con notazioni vettoriali:
y 0 = f t; y
dove ora f è una funzione vettoriale di variabile reale. Come è noto, un sistema
di¤erenziale ha in generale in…nite soluzioni, mentre possiamo sperare che abbia
un’unica soluzione un problema di Cauchy associato al sistema, ossia
y 0 = f t; y
y (t0 ) = y 0
(5.3)
A¢ nché il problema abbia senso, la funzione f dev’essere almeno de…nita e
continua in un aperto
Rn+1 contenente
42
t0 ; y 0 . Risolvere il problema
di Cauchy (5.3) signi…ca determinare un intorno I di t0 in R e una funzione
y2 C 1 (I; Rn ) per cui risulti y 0 (t) = f t; y (t) per ogni t 2 I; e sia soddisfatta
la condizione iniziale. In particolare I dovrà essere abbastanza piccolo da far sì
che t; y (t) 2 per ogni t 2 I, motivo per cui ci si aspetta una soluzione “in
piccolo”, cioè locale, del problema di Cauchy.
Il risultato che vale in proposito è il seguente:
Teorema 5.4 (di esistenza e unicità in piccolo) Sia f :
! Rn con
n+1
aperto di R
; f continua in
e localmente lipschitziana in
rispetto a y;
uniformemente rispetto a t, il che signi…ca che per ogni t0 ; y 0
un intorno U di t0 ; y 0
f t; y 1
contenuto in
f t; y 2
Allora per ogni t0 ; y 0 2
1
2
esistono
e una costante K tale che
K y1
y2
8 t; y 1 ; t; y 2 2 U:
esiste un intorno I = [t0
; t0 + ] ed esiste una
n
funzione y2 C (I; R ) soluzione del problema (5.3). Inoltre la soluzione è unica
nel senso che coincide con qualunque altra eventuale soluzione nell’intervallo in
cui sono de…nite entrambe.
Notiamo che le ipotesi su f sono abbondantemente soddisfatte se ad esempio
f 2 C 1 ( ; Rn ).
Dimostrazione. La dimostrazione si articola in vari passi.
1. Per prima cosa riformuliamo il problema di Cauchy sotto forma di
equazione integrale. Se y2 C 1 (I; Rn ) risolve il problema (5.3), allora integrando
ambo i membri in (t0 ; t) possiamo scrivere6 :
y (t) = y 0 +
Z
t
t0
f s; y (s) ds per ogni t 2 [t
;t + ]:
(5.4)
Viceversa, se una funzione y2 C 0 (I; Rn ) risolve (5.4), la funzione integranda
f s; y (s) risulta continua per composizione di funzioni continue, dunque la
funzione integrale risulta derivabile, dunque anche il primo membro y (t) risulta
derivabile e derivando ambo i membri rispetto a t troviamo y 0 (t) = f t; y (t)
per ogni t 2 [t
; t + ], ossia la y risolve l’equazione. Di più, essendo y 0
uguale alla funzione continua f t; y (t) , in realtà y2 C 1 (I; Rn ). In…ne, ancora
6 Stiamo
usando l’integrale di una funzione vettoriale di variabile reale, de…nita ovviamente
da:
Z
b
(F1 (s) ; F2 (s) ; :::; Fn (s)) ds
a
=
Z
b
F1 (s) ds;
a
Z
b
F2 (s) ds; :::;
a
43
Z
b
Fn (s) ds :
a
dalla (5.4) per t = t0 leggiamo che y(t0 ) = y 0 , e anche la condizione iniziale è
soddisfatta. Possiamo quindi concludere:
y 2 C 0 (I; Rn ) risolve (5.4) , y 2 C 1 (I; Rn ) risolve (5.3).
Nel seguito proveremo quindi esistenza e unicità della soluzione dell’equazione
integrale.
2. Ambientiamo ora l’equazione integrale che vogliamo risolvere in un quadro
funzionale più preciso. Fissate le condizioni iniziali t0 ; y 0 2 ; scegliamo un
intorno
di t0 ; y 0 contenuto in
=
e poniamo
n
; del tipo:
t; y : jt
t0 j
a; y
y0
b
o
M = max f t; y ;
L = costante di Lipschitz di f in :
De…niamo ora
X=
y 2 C 0 [t0
; t0 + ] : y
y0
C 0 [t0
;t0 + ]
b
con
a da scegliersi in seguito. Si osservi che X è un sottoinsieme chiuso
(precisamente: una sfera chiusa) dello spazio C 0 [t0
; t0 + ], quindi X è uno
spazio metrico completo, per il Teorema 3.17.
3. Mostriamo che è possibile scegliere su¢ cientemente piccolo in modo che
la funzione F de…nita in X da:
Z
F y = y0 +
f s; y (s) ds
t0
risulti una contrazione di X in sè. Si osservi che risolvere l’equazione integrale
signi…ca trovare y per cui sia y= F y ; cioè trovare un punto …sso di F:
(a) Sia y2 X; allora
F y (t)
y0
Z
F y
y0
t
f s; y (s) ds
t0
M jt
quindi
C 0 [t0
M ;
;t0 + ]
perciò
F y 2 X se M
Sotto quest’ipotesi è ben de…nita F : X ! X.
44
b:
t0 j ;
(b) Siano y 1 ; y2 2 X; allora
F y 1 (t)
Z
F y 2 (t)
t
t0
Z t
t0
per l’ipotesi di Lipschitzianità
Z t
L y 1 (s) y 2 (s) ds
f s; y 1 (s)
f s; y 1 (s)
L y1
t0
y2
f s; y 2 (s) ds
f s; y 2 (s)
C 0 [t0
;t0 + ]
jt
ds
t0 j
quindi
F y1
F y2
C 0 [t0
;t0 + ]
L
y1
y2
C 0 [t0
;t0 + ]
;
perciò F è una contrazione di X in sé purché
L < 1:
E’su¢ ciente scegliere allora
= min
b 1
;
M 2L
per garantire che sullo spazio X de…nito da questo la F sia una contrazione.
Sotto quest’ipotesi esiste uno e un solo y2 X punto …sso di F; ossia una e una
sola soluzione dell’equazione integrale.
4. Unicità. Due soluzioni del problema di Cauchy, cioè y 1 de…nita in
[t0
1 ; t0 + 1 ] e y 2 de…nita in [t0
2 ; t0 + 2 ], sarebbero due punti …ssi di
F sullo spazio X de…nito da = min ( 1 ; 2 ) ; ma per il teorema delle contrazioni il punto …sso è unico. Quindi sull’intervallo comune di de…nizione le
due soluzioni devono coincidere.
Osservazione 5.5 E’ istruttivo ri‡ettere sui vari ingredienti coinvolti nella
dimostrazione precedente.
1. Abbiamo applicato il teorema delle contrazioni allo spazio metrico completo X: Si osservi che X non è uno spazio vettoriale normato, ma una sfera
chiusa entro uno spazio vettoriale normato completo, perciò è uno spazio metrico
completo. Questo mostra che per applicare il teorema delle contrazioni in questa dimostrazione è necessario conoscere il teorema al livello di astrazione degli
spazi metrici; un teorema analogo in spazi vettoriali normati non basterebbe.
2. Abbiamo sfruttato la completezza di C 0 ([a; b] ; Rn ), risultato che è stato
ottenuto mediante lo studio delle proprietà della convergenza uniforme delle
successioni di funzioni e fondandosi sulla completezza di R:
3. Si è utilizzata la teoria classica dell’integrale di Riemann (in particolare il teorema fondamentale del calcolo integrale all’interno della teoria di Riemann) per provare l’equivalenza tra soluzione del problema di Cauchy e soluzione
dell’equazione integrale.
45
Si tratta quindi di un insieme di ingredienti astratti e concreti, alcuni molto
classici (19 sec.) altri più moderni (inizio 20 sec.).
Osservazione 5.6 (Linee integrali di un campo vettoriale) Una classica
interpretazione del teorema di esistenza e unicità per il problema di Cauchy, che
può valer la pena di puntualizzare, riguarda le linee integrali di un campo vettoriale. Supponiamo, per …ssare le idee, di avere un campo di forze F (x; y; z) de…nito e continuo in un certo aperto A R3 . Una linea integrale del campo vettoriale
passante per il punto P0 2 A è un arco di curva regolare r: [t0
; t 0 + ] ! R3
tale che
r (t0 ) = P0
e per ogni t 2 [t0
; t0 + ] risulta tangente al campo vettoriale, ossia tale che
r0 (t) = F (r (t)) :
Il teorema di esistenza e unicità a¤ erma che per ogni (t0 ; P0 ) esiste una e una
sola curva con queste caratteristiche, de…nita almeno in piccolo. La condizione
di regolarità della curva, cioè jr0 (t)j =
6 0 è veri…cata se il campo stesso F (x; y; z)
non si annulla nella regione considerata.
Il teorema di esistenza e unicità locale appena dimostrato è solo il punto
di avvio della teoria generale dei sistemi di equazioni di¤erenziali ordinarie. Si
apre ora la questione di provare risultati di esistenza e unicità in grande, risultati di prolungabilità, di dipendenza continua delle soluzioni dagli ingredienti
del problema... Non ci occuperemo tuttavia di questi aspetti, in quanto il nostro obiettivo non è sviluppare lo studio delle equazioni di¤erenziali ordinarie ma
piuttosto mostrare il ruolo che giocano in questa teoria gli strumenti di analisi funzionale illustrati …nora. Piuttosto, ci interessa mostrare come gli stessi
metodi matematici possano essere utili a risolvere problemi diversi. E’ quello
che ora esempli…cheremo.
5.3
5.3.1
Equazioni integrali di Fredholm
Equazione integrale di Fredholm di seconda specie in C 0 [a; b]
Abbiamo visto che per applicare il teorema delle contrazioni alla dimostrazione
del teorema di esistenza e unicità per un problema di Cauchy è stato utile riformulare il problema sotto forma di equazione integrale. Le equazioni integrali
compaiono in vari contesti della matematica e delle sue applicazioni, ed il teorema delle contrazioni consente di risolvere altri problemi in questo contesto.
Vogliamo qui dare qualche cenno a questo argomento, per illustrare meglio la
portata dei metodi matematici …n qui sviluppati. Segnaliamo anche che fu proprio lo studio approfondito delle equazioni integrali compiuto nei primi anni del
1900 da parte di Fredholm, Hilbert e altri matematici, a fornire uno dei maggiori
impulsi iniziali allo sviluppo della nascente analisi funzionale.
46
De…nizione 5.7 Si dice equazione di Fredholm (di seconda specie) un’equazione
integrale del tipo
Z b
f (x)
k (x; y) f (y) dy = g (x)
(5.5)
a
dove l’incognita è la funzione f; mentre il nucleo k e il termine noto g sono
assegnati.
Segnaliamo per completezza che si dice equazione di Fredholm (di prima
specie) un’equazione integrale del tipo
Z b
k (x; y) f (y) dy = g (x) :
a
Pur essendo “più facile da scrivere” l’equazione di prima specie è molto più
di¢ cile da risolvere, e non ne parleremo.
Mettiamoci nel seguente quadro funzionale. Assumiamo
2
k 2 C 0 [a; b]
; g 2 C 0 [a; b] ;
de…niamo l’operatore
T : C 0 [a; b] ! C 0 [a; b]
Z b
T f (x) = g (x) +
k (x; y) f (y) dy:
a
Allora risolvere l’equazione (5.5) è equivalente a trovare un punto …sso di T .
Cominciamo a mostrare che e¤ettivamente T porta lo spazio C 0 [a; b] in se stesso.
La funzione g è assunta continua, quindi si tratta di mostrare la continuità della
funzione:
Z
b
x 7!
Si ha:
Z b
k (x1 ; y) f (y) dy
a
Z
k (x; y) f (y) dy:
a
b
k (x2 ; y) f (y) dy =
Z
b
[k (x1 ; y)
k (x2 ; y)] f (y) dy
a
a
Z
a
b
jk (x1 ; y)
kf kC 0 [a;b]
Z
a
k (x2 ; y)j jf (y)j dy
b
jk (x1 ; y)
k (x2 ; y)j dy:
Si tratta ora di sfruttare il fatto che la funzione k (x; y) essendo continua in
2
[a; b] è anche uniformemente continua 7 , in particolare …ssato " > 0 esiste > 0
tale che
jx1
x2 j <
=) jk (x1 ; y)
k (x2 ; y)j < " per ogni y 2 [a; b] .
7 La nozione di uniforme continuità non è stata discussa in precedenza. Si rimanda per un
breve approfondimento a [4, Cap.6, §11.2] e [5, Cap.3, §9.1.].
47
Allora si ha
Z b
k (x1 ; y) f (y) dy
Z
a
b
k (x2 ; y) f (y) dy < " (b
a) kf kC 0 [a;b]
a
purché jx1 x2 j < , il che dimostra che T f 2 C 0 [a; b].
Per provare sotto che ipotesi T è una contrazione consideriamo invece:
Z b
Z b
k (x; y) f1 (y) dy
k (x; y) f2 (y) dy
jT f1 (x) T f2 (x)j =
a
a
Z
a
perciò
b
jk (x; y)j jf1 (y)
kT f1
f2 (y)j dy
T f2 kC 0 [a;b]
kf1
Pertanto T è una contrazione se
sup
x2[a;b]
kf1
f2 kC 0 [a;b]
Z
f2 kC 0 [a;b]
sup
x2[a;b]
Z
a
Z
a
b
jk (x; y)j dy
b
jk (x; y)j dy:
b
jk (x; y)j dy < 1:
a
(5.6)
Facendo uso del teorema delle contrazioni otteniamo dunque il seguente risultato:
2
Teorema 5.8 Sia k 2 C 0 [a; b]
0
soddisfacente (5.6). Allora per ogni g 2
C [a; b] esiste una e una sola f 2 C 0 [a; b] soddisfacente l’equazione integrale
(5.5).
5.3.2
Il metodo della serie di Neumann e l’approssimazione di Born
Formulato così, questo è solo un risultato astratto di esistenza. Tuttavia, come
abbiamo già accennato, dalla dimostrazione del teorema delle contrazioni si
può estrarre un algoritmo di costruzione della soluzione. Illustriamo questo
procedimento, che permette di introdurre su questo esempio speci…co alcune
idee di portata più generale.
Sia:
Z
b
Kf (x) =
k (x; y) f (y) dy:
a
Abbiamo già visto che Kf 2 C 0 [a; b] se f 2 C 0 [a; b] ; in altre parole
K : C 0 [a; b] ! C 0 [a; b]
è un operatore tra quesi due spazi, che risulta anche lineare8 . Indicando con
I : C 0 [a; b] ! C 0 [a; b]
I : f 7! f
8 Ossia K (
1 f1 + 2 f2 ) = 1 Kf1 + 2 Kf2 per ogni
operatori lineari diremo qualcosa di più in seguito.
48
1;
2
2 R e f1 ; f2 2 C 0 [a; b]. Di
l’operatore identità, l’equazione (5.5) si può riscrivere in forma operatoriale:
(I
K) f = g
con g assegnato e f incognita. Il problema è dunque invertire l’operatore
1
(I K) ; cioè ottenere f = (I K) g. Il teorema che abbiamo dimostrato si può leggere dicendo che sotto la condizione (5.6), cioè se (I K) è una
piccola perturbazione dell’identità, sappiamo invertire (I K).
Ricordiamo ora come procede la dimostrazione del teorema di punto …sso. Abbiamo scelto un elemento iniziale qualsiasi, f0 2 C 0 [a; b] e abbiamo
costruito le iterate dell’operatore T f = g + Kf: Quindi, sfruttando la linearità
dell’operatore K,
f1 = T f0 = g + Kf0
f2 = T f1 = g + K (g + Kf0 ) = g + Kg + K 2 f0
f3 = T f2 = g + K g + Kg + K 2 f0 = g + Kg + K 2 g + K 3 f0
:::
!
n
X1
fn = g + Kg + K 2 g + ::: + K n 1 g + K n f0 =
K k g + K n f0 :
k=0
Sappiamo che il punto …sso di T è
"
f = lim fn = lim
n!1
n!1
n
X1
k
K g
k=0
!
n
#
+ K f0 :
D’altro canto sappiamo che
jKf0 (x)j
kf0 kC 0 [a;b] ; quindi
kKf0 kC 0 [a;b]
kf0 kC 0 [a;b] e iterando
n
n
kK f0 kC 0 [a;b]
kf0 kC 0 [a;b] ! 0;
pertanto la soluzione dell’equazione integrale è:
f = lim
n!1
n
X1
Kkg =
1
X
K n g:
n=0
k=0
dove questa serie, detta serie di Neumann, converge nello spazio di Banach
C 0 [a; b]. Si osservi che il risultato ottenuto si può riscrivere nella forma
(I
K)
1
g=
1
X
K n g;
n=0
con una forte analogia formale con la serie geometrica! Si ricordi comunque
che il simbolo K n g indica la composizione n volte dell’operatore K; applicata
49
a g, ossia l’iterata n-esima di g mediante K; un oggetto solitamente di¢ cile da
calcolare in modo esplicito per n grande, ma che almeno in certi casi si può
ragionevomente calcolare o approssimare per i primi valori di n. L’utilizzo di
una somma parziale di una serie di Neumann per approssimare la soluzione
dell’equazione integrale viene detta approssimazione di Born. Esplicitamente,
per il nostro operatore K si ha:
g + Kg + K 2 g + ::: (x) =
Z b
Z
= g (x) +
k (x; y) g (y) dy +
b
k (x; y)
a
a
Z
b
k (y; z) g (z) dzdy + :::
a
Poiché la convergenza della serie di Neumann alla soluzione cercata, in base al
teorema delle contrazioni, avviene nello spazio metrico C 0 [a; b] ; la convergenza
della somma parziale alla soluzione che cerchiamo sarà uniforme in [a; b], una
buona notizia.
5.3.3
Applicazione a un modello di di¤usione
Consideriamo il fenomeno della di¤usione del calore in una sbarra metallica,
rappresentata dall’intervallo [0; 1]. Se la temperatura è …ssata agli estremi, una
sorgente di calore f (x) è distribuita lungo la lunghezza della sbarra, e la sbarra
è termicamente isolata sulla sua super…cie laterale, la temperatura u (x) in stato
stazionario soddisferà
u00 (x) = f (x) per x 2 (0; 1)
u (0) = T0 ; u (1) = T1 ;
(5.7)
problema che si può risolvere esplicitamente con i metodi visti in Analisi 2. Se
l’isolamento laterale non è perfetto, la sbarra scambierà calore con l’ambiente anche per tutta la sua lunghezza. In questo caso, assumendo T = 0 la temperatura
esterna, la u in condizioni stazionarie soddisferà l’equazione modi…cata
u00 (x) + q (x) u (x) = f (x) per x 2 (0; 1)
u (0) = T0 ; u (1) = T1 ;
(5.8)
dove q (x) è un coe¢ ciente noto che descrive la conduzione di calore verso l’esterno. Non appena q (x) è una funzione non costante, i metodi elementari studiati
in analisi 2 non consentono in generale di integrare l’equazione e i risultati teorici sulle equazioni lineari studiati in analisi 2 garantiscono l’esistenza di soluzioni
per l’equazione di¤erenziale e per un problema di Cauchy ad esso relativo, ma
non per un problema ai limiti, come questo è. L’idea è allora vedere il problema
(5.8) come una perturbazione del problema (5.7), che sappiamo risolvere esplicitamente, e utilizzare i metodi visti in precedenza per esprimere la soluzione,
esatta o approssimata, di (5.8).
Mostriamo in dettaglio come si può procedere, in vari passi.
1. Anzitutto è utile riscrivere il problema in una forma che abbia condizioni
agli estremi nulle. Introducendo la funzione lineare
w (x) = (1
x) T0 + xT1
50
si vede che se u risolve (5.8) allora
v (x) = u (x)
w (x)
risolve
v 00 (x) + q (x) v (x) = f (x) + q (x) w (x)
v (0) = 0; v (1) = 0;
g (x) per x 2 (0; 1)
(5.9)
quindi il problema è ricondotto ad un problema analogo, con dove l’equazione
è simile ma ha un diverso termine noto, e le condizioni agli estremi sono nulle.
2. Adesso cominciamo col risolvere esplicitamente il problema nel caso
q (x) 0. Il problema
v 00 (x) = f (x) per x 2 (0; 1)
v (0) = 0; v (1) = 0;
si può integrare direttamente, così:
Z x
0
v (x) =
f (t) dt + a
0
Z x Z t
v (x) =
f ( )d
0
dt + ax + b:
0
Imponendo le condizioni agli estremi:
0 = v (0) = b
0 = v (1) =
a=
Z
1
0
Z
Z
0
t
1
Z
f ( )d
dt + a; perciò
0
f ( )d
dt
0
e la soluzione del problema è:
Z x Z t
v (x) =
f ( )d
0
t
dt + x
0
Z
0
1
Z
t
f ( )d
dt:
0
Vogliamo scriverla in forma più leggibile, trasformandola in un’espressione del
tipo
Z 1
v (x) =
k (x; t) f (t) dt
0
cioè con la soluzione espressa da un operatore integrale che agisce sul termine
noto. Perciò procediamo così, scambiando l’ordine di integrazione negli integrali
51
iterati:
v (x) = x
Z
1
Z
Z
t
f ( )d
dt
0
0
0<t<1;0< <t)0< <1; <t<1
=
Z
1
f( )
0
=
Z
1
Z
Z
1
xdt d
f ( ) [x (1
)] d
t
f ( )d
dt
=
0
0
0<t<x;0< <t)0< <x; <t<x
x
0
Z x
0
Z
x
f( )
Z
f ( ) (x
x
dt d
)d
0
spezzando l’intervallo di integrazione del primo integrale per sempli…carlo col
secondo
Z x
Z 1
=
f ( ) [x (1
) (x
)] d +
f ( ) [x (1
)] d
0
=
Z
x
f ( ) [ (1
x)] d +
0
=
Z
Z
x
1
f ( ) [x (1
)] d
x
1
f ( ) k (x; ) d
0
dove
k (x; ) =
(1
x (1
x) se 0
) se x
x
1:
(5.10)
Gra…co di k (x; ) .
Possiamo concludere questa prima discussione a¤ermando che la soluzione
del problema con q (x)
0 e termine noto f (x) è assegnata dall’operatore
52
integrale
Kf (x) =
Z
1
f ( ) k (x; ) d
0
con k come in (5.10).
3. Se ora v è soluzione del problema
v 00 (x) + q (x) v (x) = g (x) per x 2 (0; 1)
v (0) = 0; v (1) = 0;
v sarà anche soluzione di
v 00 (x) = g (x) q (x) v (x) per x 2 (0; 1)
v (0) = 0; v (1) = 0;
quindi risulterà
v = K (g
qv) = Kg
K (qv)
dove ge = Kg è una funzione nota, e
Z 1
e (x)
K (qv) (x) =
f ( ) [k (x; ) q ( )] d = Kf
0
e è un nuovo operatore integrale, con nucleo e
dove K
k (x; ) = k (x; ) q ( ). Il
problema che ci interessa si è dunque trasformato nell’equazione integrale di
Fredholm di seconda specie
e
v = ge + Kv;
a cui possiamo applicare il Teorema 5.8. Occorre garantire che valga la condizione
Z 1
sup
jk (x; ) q ( )j d < 1:
x2[0;1]
Stimiamo
Z
0
1
jk (x; ) q ( )j d
quindi calcoliamo
Z 1
Z
jk (x; )j d =
0
0
x
(1
x) d +
0
= (1
kqkC 0 [a;b]
x)
1 2
=
x
2
x2
+x
2
"
3
Z
0
x (1
x
2
(1
)
2
x2[0;1]
=
x) x
1
=
2
8
53
2
= (1
x)
x
3
2x + x
(1
jk (x; )j d ;
)d
#1
e poiché
max
1
1
2
x +x
Z
(1
x) x
2
x2
(1 x)
+x
2
2
si ha
sup
x2[0;1]
Z
1
0
jk (x; ) q ( )j d
1
kqkC 0 [a;b]
8
e questo è < 1 purché risulti
kqkC 0 [0;1] < 8:
In base al Teorema 5.8 possiamo allora concludere che:
Teorema 5.9 Se q 2 C 0 [0; 1] con kqkC 0 [0;1] < 8 allora per ogni f 2 C 0 [0; 1]
esiste una e una sola soluzione v 2 C 2 [0; 1] del problema (5.9). (Il lettore è
invitato a veri…care che anche se la v è inizialmente ottenuta come soluzione
e implica che il primo
C 0 [0; 1] dell’equazione integrale, l’identità v = ge + Kv
2
membro sia e¤ ettivamente una funzione C [0; 1]).
La soluzione può essere approssimata mediante la somma parziale della serie
di Neumann:
n
X
e k (e
v'
K
g)
k=0
e è l’operatore integrale di nucleo k (x; ) q ( ) e
dove K
ge (x) = Kg (x) =
Z
1
k (x; ) [f ( ) + q ( ) w ( )] d :
0
Abbiamo ottenuto la risolubilità unica del problema di partenza sotto l’ipotesi che il coe¢ ciente q non sia troppo grande. Il fatto che una condizione di questo
tipo sia necessaria, almeno da un punto di vista matematico, si può evidenziare
anche con la seguente osservazione: la funzione
v (x) = sin ( x)
risolve il problema
2
v 00 (x)
v (x) = 0 per x 2 (0; 1)
v (0) = 0; v (1) = 0:
2
Questo signi…ca che se q (x)
(notare che 2 > 8; quindi questo coe¢ ciente
q (x) non soddisfa la condizione del teorema) il problema iniziale con termine
noto nullo ha una soluzione non banale, ossia (per la linearità del problema)
viene a cadere l’unicità per il problema con termine noto qualsiasi. (Se v risolve
il problema con termine noto f; anche v (x)+sin ( x) risolve lo stesso problema).
Approfondendo questo esempio, supponiamo di voler risolvere il problema non
omogeneo:
v 00 (x) k 2 v (x) = 1 per x 2 (0; 1)
v (0) = 0; v (1) = 0
54
con k > 0 costante. Questo problema (coe¢ cienti costanti) si può risolvere
esplicitamente in modo elementare. Per k 6= n la soluzione esiste ed è unica:
v (x) =
1
k2
1
cos (kx) + sin (kx)
cos k 1
sin k
:
Per k = n con n dispari il problema non ha alcuna soluzione; per n pari ha le
in…nite soluzioni
v (x) =
1
n2 2
(1
cos (n x)) + c sin (n x) al variare di c 2 R.
E¤ettivamente quindi il problema non è in generale ben posto per kqkC 0 [0;1] > 8.
2
Segnaliamo che il contresempio q (x) =
ha un signi…cato matematico ma
non …sico, in quanto per il suo signi…cato …sico q (x) 0.
6
Esercizi sulla Parte 1
A. Esercizi su spazi vettoriali, spazi vettoriali normati, spazi metrici,
completezza
Es 6.1 Dire quali dei seguenti insiemi di funzioni è uno spazio vettoriale:
(a) C 0 (a; b)
(b) C 0 [a; b]
(c) f 2 C 0 [0; 2] : f (1) = 1
(d) f 2 C 1 [0; 2] : f (0) = 0; f 0 (2) = 0
(e) f 2 C 2 (R) : ex f 00 (x) + (sin x) f 0 (x) 5f (x) = 0
(f ) nf 2 C 2 (R) : ex f 00 (x) f (x) + 5f 0 (x) = 0
o
Rx
3
(g) f 2 C 0 (R) : f (x) = f (0) + 0 (x t) f (t) dt
Es 6.2 Dire chi sono i punti interni, esterni, di frontiera, di accumulazione per
E; dire se E è o non è aperto, chiuso, limitato, nei seguenti esempi. Dire anche
qual è l’interno, l’esterno, la frontiera di E.
E = (x; y) 2 R2 : x2 + y 2 < 1
E = (x; y) 2 R2 : 0 < x2 + y 2
E = (x; y) 2 R2 : xy 6= 0
E = Q \ [0; 1] in X = R;
E=
x=
in X = R2 ;
1
in X = R2 ;
in X = R2 ;
1
: n = 1; 2; 3; ::: [ f0g in X = R:
n
Es 6.3 Fare esempi (in R) di un’unione di in…niti chiusi che non è chiusa, e
di un’intersezione di in…niti aperti che non è aperta.
Es 6.4 Veri…care che lo C (a; b) è uno spazio vettoriale ma non risulta uno
spazio normato, con la norma C 0 .
55
Es 6.5 Veri…care che lo spazio P (R) delle funzioni de…nite su tutto R; continue
e periodiche non è uno spazio vettoriale.
[Suggerimento: cercare due funzioni di periodi diversi la cui somma non è
periodica]. Tuttavia, se si pone
d (f; g) = max jf (x)
g (x)j
x2R
questo risulta uno spazio metrico: veri…care che 8f; g 2 P (R) risulta d (f; g) <
1.
Es 6.6 Nello spazio C 0 [a; b] si de…nisca:
Z b
d (f; g) =
jf (x)
p
g (x)j dx
a
per qualche p 2 (0; 1) …ssato. Provare che d è una distanza.
Provare poi che, se si tentasse di de…nire una norma ponendo:
!1=p
Z
b
kf kp =
a
p
jf (x)j dx
(sempre per p 2 (0; 1)) questa veri…cherebbe i primi due assiomi della norma ma
non la disuguaglianza triangolare, ossia esibire due funzioni f; g per cui risulta
kf + gkp > kf kp + kgkp :
(Quindi abbiamo uno spazio di funzioni che è vettoriale e metrico, in cui la
distanza però non proviene da una norma).
Es 6.7 Di ciascuna delle seguenti funzioni in R, stabilire se soddisfa gli assiomi
di distanza:
2
d1 (x; y) = (x y)
p
d2 (x; y) = jx yj
d3 (x; y) = x2 y 2
d4 (x; y) = jx 2yj
d5 (x; y) =
jx yj
1 + jx yj
[Suggerimento per d5 . Provare a parte che la funzione f (t) =
la disuguglianza f (a + b) f (a) + f (b) per a; b > 0:]
t
1+t
soddisfa
Es 6.8 Di ciascuna delle seguenti funzioni in R2 provare che è una norma.
Disegnare poi la sfera di centro l’origine e raggio 1 rispetto a questa norma.
k(x; y)k0 = max (jxj ; jyj)
k(x; y)k1 = jxj + jyj
3
3
k(x; y)k3 = jxj + jyj
56
1=3
Es 6.9 Fare un esempio, in R2 , di:
a. insieme chiuso con interno vuoto;
b. un insieme con interno vuoto la cui chiusura è R2 .
Es 6.10 Sia (X; d) uno spazio metrico; de…niamo
d (x; y)
.
1 + d (x; y)
d0 (x; y) =
Provare che anche d0 è una distanza, e che (X; d0 ) è limitato anche se (X; d)
non lo è.
Es 6.11 Dire in quali dei seguenti spazi di funzioni continue è ben de…nita la
norma dell’estremo superiore, cioè
kf kC 0 (I) = sup jf (x)j :
x2I
(a)
(b)
(c)
(d)
(e)
C 0 (R)
C 0 (0; 1)
C 0 [0; 1]
f 2 C 0 (R) : limx! 1 f (x) = 0
f 2 C 0 (R) : 9K > 0 (K dipendente da f ) tale che f (x) = 0 per jxj
Es 6.12 Sia
kf kL1 (a;b) =
Z
a
b
jf (x)j dx:
Dire se k kL1 (a;b) risulta una norma:
(a) sullo spazio C 0 [a; b];
(b) sullo spazio delle funzioni limitate e Riemann integrabili in [a; b] :
Es 6.13 Sia
kf kP =
Z
b
a
jf 0 (x)j dx:
Dire se k kP risulta una norma:
(a) sullo spazio C 1 [a; b];
(b) sullo spazio X = f 2 C 1 [a; b] : f (a) = 0 :
Es 6.14 Sia P = fpolinomi p (x) in [0; 1]g. Si dica se P è un sottospazio
vettoriale di C 0 [0; 1] e in caso a¤ ermativo se è un sottospazio chiuso, rispetto
alla norma dell’estremo superiore.
B. Esercizi sulla convergenza di successioni di funzioni. Convergenza e completezza
Es 6.15 Sia fn (x) = x n . Studiare la convergenza puntuale e uniforme negli
intervalli (1; +1) e (2; +1).
57
K :
2
2
Es 6.16 Sia fn (x) = nxe n x . Studiare la convergenza puntuale e uniforme
negli intervalli (1; +1) e [0; 1].
Es 6.17 Sia fn (x) = n xe n
converge uniformemente in R.
Es 6.18 Sia fn (x) =
[0; +1).
x
1+nx .
2
x2
.
Determinare per quali
la successione
Studiare la convergenza puntuale e uniforme in
nx
. Studiare la convergenza puntuale e uniforme in
Es 6.19 Sia fn (x) = 1+nx
[0; +1) e in [r; +1) per r > 0.
Es 6.20 Sia fn (x) =
[0; 1].
1
1+nx .
Studiare la convergenza puntuale e uniforme in
Es 6.21 Sia fn (x) =
[0; 1].
1
n+x .
Studiare la convergenza puntuale e uniforme in
Es 6.22 Sia fn (x) =
[ 1; 1].
x
1+n2 x2 .
Studiare la convergenza puntuale e uniforme in
Es 6.23 Sia fn (x) =
[ 1; 1].
nx
1+n2 x2 .
Studiare la convergenza puntuale e uniforme in
Es 6.24 Calcolare il limite puntuale della successione di funzioni
fn (x) =
(n + 1) x2
(1 + nx2 ) (1 + x2 )
in R. Stabilire poi se tale limite è uniforme, giusti…cando le proprie conclusioni.
Es 6.25 Calcolare il limite puntuale della successione di funzioni
fn (x) =
n sin x
1 + n2 x2
in R. Stabilire poi se tale limite è uniforme, giusti…cando le proprie conclusioni.
Es 6.26 Sia X lo spazio vettoriale delle successioni convergenti di numeri reali,
con la norma:
1
kxk = sup jxk j dove x = fxk gk=1 .
k
Provare che (X; k k) è uno spazio vettoriale normato, completo.
[Suggerimento: ricordare che una successione
X è una successione di
n
oin
1
(k)
(k)
1
successioni: fxk gk=1 X signi…ca che xk = n
con n 2 R:]
n=1
Es 6.27 Si consideri C 0 [a; b] con la norma integrale:
Z b
kf k =
jf (x)j dx:
a
Provare con un esempio che con questa norma lo spazio C 0 [a; b] non è completo.
58
Es 6.28 Provare che C 1 [ 1; 1] con la norma di C 0 non è di Banach.
[Suggerimento: costruire una successione di funzioni C 1 [ 1; 1] che converge
in norma C 0 a una funzione che non sta in C 1 [ 1; 1]].
15. Trovare un esempio di successione limitata in C 1 [0; 1] che non ha alcuna
sottosuccessione convergente.
C. Esercizi su spazi di funzioni derivabili, funzioni Lipschitziane
Es 6.29 Costruire, per un intero n
C n+1 (R).
1 …ssato, un esempio di funzione C n (R)n
Es 6.30 Modi…cando l’Esempio 4.23 di funzione C01 (R), costruire una funzione f 2 C01 (a; b) per (a; b) qualsiasi.
Es 6.31 Dimostrare che lo spazio Lip [a; b] con la norma
kf kLip[a;b] = kf kC 0 [a;b] + jf jLip[a;b] ;
dove
jf jLip[a;b] =
sup
x1 ;x2 2[a;b];x1 6=x2
jf (x1 )
jx1
f (x2 )j
x2 j
è di Banach.
Seguire questa traccia, inserendo tutti i dettagli necessari:
a. Si veri…ca che Lip [a; b] è un sottospazio vettoriale di C 0 [a; b] :
b. Si considera una successione ffn g di Cauchy in Lip [a; b]. Per come
è de…nita la norma, in particolare è di Cauchy in C 0 [a; b] quindi esiste f 2
C 0 [a; b] tale che kfn f kC 0 [a;b] ! 0.
c. Si scrive ora la condizione di Cauchy su jfn fm jLip[a;b] : 8" > 0 9n0 tale
che 8n; m n0 si ha
j[fn (x1 )
fm (x1 )]
[fn (x2 )
fm (x2 )]j < " jx1
Da questa per m ! 1 si ricava che 8" > 0 9n0 tale che 8n
j[fn (x1 )
f (x1 )]
[fn (x2 )
f (x2 )]j < " jx1
x2 j :
n0 si ha
x2 j :
(6.1)
d. Dalla precedente relazione, unita al fatto che fn0 è Lipschitziana con una
certa costante L si ricava che f 2 Lip [a; b] con costante L + ":
e. Ancora dalla (6.1) si ricava che
jfn
f jLip[a;b] ! 0;
che unita al punto b dà fn ! f in Lip [a; b], quindi lo spazio è completo.
59
D. Esercizi sul teorema delle contrazioni in spazi metrici
Es 6.32 Sia
1
T x (t) =
3
Z
t
0
log (1 + jx (s)j) ds:
Dimostrare che T : C 0 [0; 2] ! C 0 [0; 2] è una contrazione.
Es 6.33 Sia
T f (x) =
Z
0
x
h
2
(x
t) f (t) + (x
3
t)
i
dt:
Dimostrare che T : C 0 [0; 1] ! C 0 [0; 1] è una contrazione.
Es 6.34 Modi…cando l’esempio visto nel §5.3.3, determinare sotto quale ipotesi
sulla funzione q (x) il seguente problema di¤ erenziale ha una e una sola soluzione
u 2 C 2 [0; 1] per ogni dato f 2 C 0 [0; 1] assegnato:
u00 (x) + q (x) u (x) = f (x)
u (0) = 0; u (1) = 0
0
[Interpretazione …sica: una sbarra [0; 1] omogenea è scaldata da sorgenti di calore
f (x) distribuite lungo la sua lunghezza; all’estremità x = 0 è isolata, mentre
all’estremità x = 1 è termostatata a temperatura 0; nella sua lunghezza scambia
calore con l’ambiente circostante, con coe¢ ciente di conducibilità verso l’esterno
q (x)].
Traccia: occorre prima risolvere esplicitamente il problema analogo con q (x)
0; scrivendo la soluzione nella forma
Z 1
u (x) =
k (x; t) f (t) dt
0
con k esplicitamente calcolato. Allora se u risolve il problema iniziale è anche
soluzione dell’equazione integrale
Z 1
u (x) =
k (x; t) [f (t) q (t) u (t)] dt;
0
che è un’equazione integrale di Fredholm di seconda specie a nucleo continuo.
60
Parte II
Misura e integrale di Lebesgue
7
7.1
Motivazioni per studiare la teoria della misura
e dell’integrazione di Lebesgue
Inadeguatezza dell’integrale di Riemann per gli scopi
dell’analisi funzionale
Abbiamo visto come gli spazi di Lagrange C k [a; b] costituiscano un ambiente
funzionale adatto allo studio delle funzioni derivabili : lo spazio C 1 [a; b], ad
esempio, è uno spazio vettoriale normato completo, costituito dalle funzioni
derivabili con continuità; la norma dello spazio esprime un controllo uniforme
della “grandezza” sia della funzione che della sua derivata; proprio questo fa sì
che la convergenza in questa norma conservi le proprietà caratteristiche delle
funzioni di questo spazio, cioè appunto l’essere derivabili con continuità, ed esprima l’approssimazione della funzione limite e della sua derivata con le funzioni
approssimanti e le loro derivate. Inoltre la completezza dello spazio si può esprimere intuitivamente dicendo che la convergenza in questa norma9 garantisce
l’appartenenza del limite allo spazio stesso.
Un’esigenza altrettanto naturale è quella di de…nire uno spazio vettoriale
normato di funzioni integrabili, ad esempio su un intervallo [a; b]. Non solo
lo spazio dovrà contenere soltanto funzioni integrabili, ma la norma dovrà esprimere un controllo sulla “grandezza” dell’integrale della funzione, in modo
che la convergenza in questa norma conservi l’integrabilità e al tempo stesso esprima l’approssimazione dell’integrale della funzione limite con l’integrale
delle funzioni approssimanti. Verosimilmente se tutte queste proprietà risultano
soddisfatte lo spazio sarà completo rispetto a questa norma.
Proviamo a de…nire uno spazio di questo tipo utilizzando l’integrale di Riemann, cioè quello che si studia nei corsi di analisi di base, che è anche quello
che è stato utilizzato …no alla …ne del 19 secolo.
La candidata naturale come norma (usiamo il simbolo provvisorio kkI con I
come integrale per distinguerla da altre norme viste …n qui) è:
kf kI =
Z
b
a
jf (x)j dx;
9 Rigorosamente si dovrebbe dire che il fatto che la successione sia di Cauchy garantisce
l’esistenza del limite nello spazio. Tuttavia per gli spazi di funzioni di solito è vero che una
successione di Cauchy nello spazio X è una successione convergente “in qualche spazio Y ”,
eventualmente più grande di X. Perciò intuitivamente pensiamo la completezza come il fatto
che il limite di una successione convergente appartenga allo spazio stesso.
61
che soddisfa sicuramente la proprietà di omogeneità,
Z
a
b
k f kI = j j kf kI 8 2 R cioè
Z b
j f (x)j dx = j j
jf (x)j dx
a
e la disuguaglianza triangolare,
Z
a
kf + gkI
b
jf (x) + g (x)j dx
kf kI + kgkI cioè
Z b
Z b
jf (x)j dx +
jg (x)j dx:
a
a
Lasciamo un momento in sospeso la veri…ca della prima proprietà della norma
(quella di annullamento) e chiediamoci su quale spazio di funzioni mettere questa
norma.
Una prima possibilità è C 0 [a; b], dal momento che le funzioni continue su
[a; b] sono certamente Riemann integrabili. Su questo spazio la norma soddisfa
anche la proprietà di annullamento: per una funzione continua su [a; b] è vero
che
Z
b
a
jf (x)j dx = 0 =) f (x) = 0 8x 2 [a; b] :
Perciò C 0 [a; b] ; k kI è uno spazio vettoriale normato; la norma misura la
grandezza dell’integrale, e la convergenza in norma esprime un’approssimazione
dell’integrale. Il problema è che questa convergenza non conserva l’appartenenza
allo spazio stesso, in altre parole questo spazio non è completo. Infatti:
Esempio 7.1 Sia
fn (x) = sgn (x)
Si vede che
kfn
p
n
jxj in [ 1; 1] :
f kI ! 0 con f (x) =
1 per x > 0
1 per x < 0:
In particolare f 2
= C 0 [ 1; 1], anche se la successione è di Cauchy.
In un certo senso, abbiamo scelto un insieme di funzioni troppo piccolo:
le funzioni continue sono solo una parte delle funzioni Riemann integrabili, e
l’approssimazione in norma integrale può fare uscire dallo spazio delle funzioni
continue. Lo spazio C 0 [a; b] ; k kI non è completo, quindi non è un ambiente
funzionale in cui sia facile dimostrare teoremi di esistenza. Non è adeguato per
gli scopi dell’analisi funzionale.
Pensiamo allora di considerare lo spazio R [a; b] di tutte le funzioni limitate e
Riemann integrabili su [a; b], e di munirlo della norma k kI . Una prima complicazione è che questa non soddisfa la proprietà di annullamento: per una generica
funzione integrabile,
Z b
jf (x)j dx = 0 ; f (x) = 0 8x 2 [a; b] :
a
62
Ad esempio, una funzione nulla tranne in un numero …nito di punti ha integrale
del modulo nullo, eppure non è identicamente nulla. Si esce da questo problema
decidendo di identi…care con 0 le funzioni per cui kf kI = 0 e identi…care tra
loro funzioni la cui di¤erenza ha norma nulla. Poiché questo problema non si
presenta solo in quest’esempio, ma si presenterà nella teoria di Lebesgue di cui
vorremo parlare, ne appro…ttiamo per spiegare questo punto rigorosamente.
Nell’insieme R [a; b] introduciamo una relazione di equivalenza, ponendo
f
g,
Z
b
a
jf (x)
g (x)j dx = 0:
La relazione
soddisfa le proprietà ri‡essiva, simmetrica e transitiva, perciò
è una relazione di equivalenza. L’insieme R [a; b] risulta così ripartito in classi
di equivalenza, cioè insiemi a due a due disgiunti di funzioni tali che per ogni
Rb
coppia f; g di funzioni nella stessa classe risulta a jf (x) g (x)j dx = 0. Indichiamo con ff g la classe di equivalenza a cui appartiene f (si dice che f è un
rappresentante della classe), e consideriamo ora l’insieme R [a; b] = (che si dice
insieme quoziente di R [a; b] rispetto alla relazione di equivalenza ) che ha per
elementi le classi di equivalenza. E’uno spazio vettoriale, con le operazioni
ff g + fgg = ff + gg
c ff g = fcf g :
La classe f0g che contiene la funzione identicamente nulla e tutte quelle che
hanno integrale del modulo nullo, è lo zero dello spazio vettoriale: ff g + f0g =
ff g.
Poniamo ora:
kff gkI = kf kI :
Notare che la de…nizione è coerente perché se g è un’altra funzione della classe
ff g ; si avrà
kgkI = kf kI :
Infatti per la disuguaglianza triangolare si ha
kgkI
kf kI
kg
kf
f kI + kf kI
gkI + kgkI
e poiché, essendo f
g, risulta kg f kI = 0, concludiamo kgkI
viceversa.
Il vantaggio di essere passati all’insieme quoziente è che ora se
kf kI e
kff gkI = 0;
questo implica ora che kf kI = 0 cioè f
0, quindi ff g = f0g, ossia: se una
classe di equivalenza ha norma nulla, questa è la classe che contiene lo zero, cioè
la classe f0g. Quindi vale anche la proprietà di annullamento, ossia lo spazio
quoziente R [a; b] = con la norma kf gkI risulta uno spazio vettoriale normato.
63
Introdurre uno spazio di “classi di equivalenza di funzioni”è il modo, rigoroso
ma molto pesante, in cui la teoria degli insiemi formalizza questa situazione.
L’idea intuitiva con cui noi possiamo pensare questo spazio, più agilmente, è che
i suoi elementi siano le solite funzioni, con l’avvertenza però che due funzioni la
cui di¤erenza ha norma nulla sono pensate come la stessa funzione; in particolare
una funzione a norma nulla si indenti…ca con la funzione identicamente nulla.
Si comincia a vedere all’orizzonte come la ri‡essione sull’integrale dal punto di
vista dell’analisi funzionale spinga a modi…care un po’ il modo tradizionale di
pensare le funzioni. Questo spunto sarà approfondito nel seguito, parlando di
integrale di Lebesgue.
Proseguiamo con l’analisi dello spazio (R [a; b] ; k kI ) (seguendo l’idea intuitiva appena enunciata, continuiamo a indicarlo senza far uso delle notazioni
relative alle classi di equivalenza). Si constata che, purtroppo,
lo spazio (R [a; b] ; k kI ) non è completo.
Un esempio di successione che in questo spazio è di Cauchy ma non converge
si potrà dare più facilmente quando avremo introdotto una parte della teoria
dell’integrale di Lebesgue. Ma segnaliamo da subito questo risultato negativo.
Prima di proseguire commentando la non completezza di questo spazio, segnaliamo qualche altra proprietà insoddisfacente di questo spazio. Si consideri il
seguente
1
Esempio 7.2 Sia fxn gn=1 la successione dei razionali dell’intervallo [0; 1] (poiché
sono un’in…nità numerabile, possono essere messi in successione, anche se questa non sarà una successione monotona) e sia
fn : [0; 1] ! R
fn (x) =
1 per x = x1 ; x2 ; :::; xn
0 altrimenti.
Si ha
fn (x) ! f (x) =
1 per x 2 Q
0 altrimenti.
Notiamo che ciascuna fn è Riemann-integrabile, con kfn kI = 0; mentre f (che
è la famosa “funzione di Dirichlet”) non è Riemann integrabile. Nello spazio
delle classi di equivalenza, ciascuna fn è la funzione identicamente nulla (!!!),
quindi nello spazio considerato questa è una successione costante (nulla), che
ovviamente tende a zero, eppure dal punto di vista della convergenza puntuale
fn ! f non integrabile.
La situazione è strana: il passaggio alle classi di equivalenza non è coerente
col concetto di convergenza puntuale di una successione di funzioni. Questo
accade perché la classe delle funzioni Riemann-integrabili non è chiusa rispetto
al limite puntuale. (Se la funzione di Dirichlet fosse Riemann integrabile -e
avesse integrale nullo-, avremmo una successione nulla che tende a zero: niente
di interessante, ma niente di strano).
64
Se nello spazio delle funzioni Riemann integrabili, in…ne, mettessimo la norma C 0 (della convergenza uniforme) otterremmo sì uno spazio completo (limite
uniforme di funzioni Riemann integrabili è Riemann integrabile), ma a prezzo di
perdere una delle motivazioni da cui siamo partiti: usare una norma integrale, in
modo che la convergenza in norma traduca l’approssimazione dell’integrale della
funzione limite con l’integrale delle funzioni approssimanti. La convergenza uniforme è una condizione troppo forte, che implica la convergenza degli integrali,
ma non è soddisfatta in tutte le situazioni in cui gli integrali convergono.
7.2
L’idea dell’integrale di Lebegue
Torniamo ora a commentare la non completezza dello spazio (R [a; b] ; k kI ).
Così come la non completezza dello spazio C 0 [a; b] ; k kI è stata interpretata
dicendo che le funzioni continue sono solo una parte delle funzioni integrabili, e
perciò la convergenza in norma integrale può far uscire dallo spazio delle funzioni
continue, così potremmo immaginare che anche le funzioni Riemann-integrabili
siano solo una parte di quelle per cui è possibile (in qualche altro modo) de…nire
un integrale, che naturalmente coincida col solito integrale quando applicato a
funzioni Riemann-integrabili. Nasce quindi l’idea che si possa allargare la classe
delle funzioni integrabili, per ottenere uno spazio completo. Questo però potrà
essere fatto solo cambiando la de…nizione di integrale (…nché l’integrale è quello,
le funzioni integrabili sono quelle!), e più precisamente cambiandolo in un senso
che renda meno restrittiva la richiesta di integrabilità. Ricordiamo ora come è
stato de…nito l’integrale di Riemann come limite di somme:
lim sn = lim
n!1
n!1
n
X
b
k=1
a
n
f
(n)
k
dove al passo n-esimo l’intervallo [a; b] è stato suddiviso in n intervalli uguali
(n)
(n)
(n)
(n)
mediante i punti a = x0 ; x1 ; x2 h; :::; xn =i b e ad ogni passo si sono scelti,
(n)
(n)
(n)
arbitrariamente, gli n punti k 2 xk 1 ; xk , k = 1; 2; :::; n. La funzione f si
dice Riemann-integrabile se il limite esiste …nito e non dipende da come si sono
(n)
scelti, ad ogni passo, i punti k . Si capisce dalla de…nizione che ciò che “mette
a rischio”l’integrabilità è il fatto che f abbia numerosi punti di discontinuità, e
quindi nel corso della costruzione succeda “tanteh volte” chei scegliendo il punto
(n)
(n)
(n)
in modi diversi all’interno dell’intervallino xk 1 ; xk
si ottengano delle
k
variazioni importanti nel valore di sn . Ad esempio, la funzione di Dirichlet
non è integrabile perché, ad ogni passo della costruzione iterativa, è possibile
(n)
scegliere i punti k tutti razionali, e allora sn = 1, o tutti irrazionali, e allora
sn = 0; perciò certamente successioni di Cauchy-Riemann diverse hanno limiti
diversi. Se vogliamo dare una de…nizione di integrale diversa, che risulti meno
restrittiva, dobbiamo trovare il modo di neutralizzare, nell’algoritmo di calcolo
dell’integrale, gli e¤ etti di instabilità dovuti alle (eventuali) grandi oscillazioni
o discontinuità della funzione.
65
Un’idea di questo tipo si trova nella nozione di integrale introdotta da Henri
Lebesgue nel 1902 nella sua tesi di dottorato presentata alla Facoltà di Scienze
di Parigi.
L’idea, apparentemente banale, è: invece di fare una costruzione iterativa suddividendo l’intervallo [a; b] sull’asse x in parti uguali, facciamo una
costruzione iterativa suddividendo in parti uguali, sull’asse y, un intervallo che
contenga l’insieme dei valori assunti dalla funzione (che per il momento supponiamo limitata). Ad esempio, se la funzione ha valori in [0; 1], al passo n-esimo
suddivideremo [0; 1] in parti uguali e considereremo gli insiemi
(n)
Ek
=
x 2 [a; b] :
k
1
n
f (x) <
k
n
, con k = 1; 2; :::; n:
Ovviamente un’approssimazione, per difetto o per eccesso, dell’area sotto il
gra…co di f si ottiene, rispettivamente, con le somme:
sn =
s+
n =
n
X
k=1
n
X
(n)
Ek
k
1
n
(n)
Ek
k=1
;
k
;
n
dove jEk j indica la misura dell’insieme Ek , cioè se ad es. è un intervallo la sua
lunghezza, se è l’unione di più intervalli la somma delle lunghezze degli itervalli,
e così via10 .
Una somma di Riemann di passo
3
1 0 Come vedremo, buona parte del problema da a¤rontare sta in questo semplicistico “e così
via”.
66
Una somma di Lebesgue di passo
3
della stessa funzione
Ciò che dimostra quanto sia buona quest’idea, e quanto sia diversa da quella
dell’integrale di Riemann (non ostante l’apparente simmetria: suddividiamo
l’asse x / suddividiamo l’asse y) è che per come sono costruite le somme risulta
sempre
n
X
1
(n) 1
0 s+
s
=
Ek
=
n
n
n
n
k=1
per cui lo scarto tra le approssimazioni per eccesso e per difetto tende necessariamente a zero! Signi…ca che questo algoritmo di approssimazione restituisce
“sempre”un limite. Apparentemente, ogni funzione risulta integrabile a questo
modo. In realtà, abbiamo in un certo senso spostato il problema: data una
(n)
funzione f e interi n; k qualsiasi, come sarà fatto l’insieme Ek ? Se f ha molte
oscillazioni e discontinuità potrà essere un insieme molto diverso da un intervallo o l’unione di un numero …nito di intervalli. Ad esempio, per la funzione di
(n)
Dirichlet tra gli insiemi Ek ci saranno
fx 2 [0; 1] : x 2 Qg ; fx 2 [0; 1] : x 2
= Qg ,
che non sono esprimibili come unioni …nite di intervalli.
Dunque: per costruire una teoria dell’integrazione di questo nuovo tipo dobbiamo prima impegnarci a costruire una “teoria della misura” che sia in grado
di assegnare una “lunghezza” anche a sottoinsiemi molto irregolari della retta.
7.3
Il problema di de…nire una “buona” misura
Dobbiamo dunque trovare il modo di de…nire la “lunghezza” (d’ora in poi la
chiameremo “misura”) di un sottoinsieme della retta il più possibile generico.
Idealmente, ad ogni sottoinsieme E di R vorremmo poter assegnare un numero
(E), non negativo ed eventualmente in…nito (la retta intera, o una semiretta,
67
hanno lunghezza in…nita), in modo che questa “funzione d’insieme”11
: P (R) ! [0; 1]
abbia alcune proprietà ragionevoli. Certamente vorremo che sia (;) = 0. Non
sarà vero il viceversa, ossia: ci saranno insiemi non vuoti di misura nulla (un
punto ha lunghezza nulla). La misura elementare è additiva (la misura del tutto
è somma della misura delle parti), quindi vorremo che risulti
(A [ B) =
(A) + (B) ogni volta che A \ B = ;:
Se teniamo presente che uno dei nostri obiettivi …nali è costruire uno spazio di
funzioni integrabili che risulti completo, sarà fondamentale che la nostra teoria
permetta di trattare agevolmente i limiti di successioni di funzioni; sarà prudente
allora richiedere che già al livello della misura le successioni (in questo caso di
insiemi) abbiano un posto di riguardo. Chiediamo perciò che la misura risulti
additiva anche per successioni di insiemi :
!
1
1
[
X
En =
(En )
n=1
n=1
1
fEn gn=1
per ogni successione
di insiemi a due a due disgiunti. Questa proprietà si chiama numerabile additività. In…ne, stiamo costruendo una misura che
generalizzi l’idea elementare di lunghezza, quindi vogliamo che per un intervallo
[a; b] risulti
([a; b]) = b a
(lunghezza elementare). Riassumiamo: vorremmo de…nire una funzione
: P (R) ! [0; 1]
(7.1)
tale che
1
[
n=1
1
(;) = 0
!
1
X
En =
(En )
(7.2)
(7.3)
n=1
per ogni successione fEn gn=1 di insiemi a due a due disgiunti, e
([a; b]) = b
a 8a; b 2 R; a
b
(7.4)
Purtroppo questo programma si è rivelato impossibile. Infatti un profondo
teorema di S. Ulam (1909-1984) mostra che non esiste alcuna funzione che
soddis… simultaneamente (7.1), (7.2), (7.3), (7.4). Precisamente, il teorema di
Ulam a¤erma che:
1 1 Il
R.
simbolo P (R) indica l’insieme delle parti di R, cioè l’insieme di tutti i sottoinsiemi di
68
“L’unica funzione soddisfacente (7.1), (7.2), (7.3) e tale che per ogni x 2 R
sia (fxg) = 0 (cioè l’insieme costituito da un punto solo ha sempre misura
nulla) è quella identicamente nulla”.
Poiché la proprietà (7.4) implica che per ogni x 2 R è (fxg) = 0 (prendere
a = b = x) e implica anche che non è identicamente nulla (prendere a < b),
ne segue quanto abbiamo a¤ermato.
A quale delle 4 proprietà possiamo rinunciare? L’unica scelta possibile, in
vista del nostro obiettivo, è rinunciare a (7.1): costruiremo una misura che
abbia proprietà ragionevoli ed estenda la misura elementare, ma non tutti i
sottoinsiemi di R risulteranno misurabili. La misura sarà de…nita solo su una
certa famiglia L di sottoinsiemi di R. Come scegliere L? Che proprietà dovrà
avere? Per coerenza con le richieste (7.2) e (7.3), L dovrà contenere l’insieme
vuoto, e inoltre dovrà essere chiuso per unioni numerabili:
En 2 L per n = 1; 2; 3; ::: =)
1
[
n=1
En 2 L.
(7.5)
Anche l’insieme R (cioè lo spazio intero) dovrà essere misurabile (con misura
in…nita, ci aspettiamo); inoltre, L dovrà essere chiuso per qualche altra operazione insiemistica elementare, ad esempio la complementazione: se sappiamo
misurare E, dovremmo saper misurare anche il complementare E c di E:
E 2 L =) E c 2 L.
In…ne, per coerenza con la richiesta (7.4), L dovrà contenere gli intervalli. Siamo
così arrivati a capire che per costruire una buona misura dobbiamo anzitutto occuparci di individuare un’opportuna famiglia di sottoinsiemi di R su cui
de…nirla, famiglia che deve anch’essa godere di oppurtune proprietà algebriche,
rispetto alle operazioni insiemistiche. Provando a guardare in avanti, immaginiamo ora che cosa succederà quando, avendo costruito una buona misura sulla
retta, che assegna una “lunghezza”appropriata ad ogni insieme E 2 L, dovremo
de…nire l’integrale di una funzione f (x); a¢ nché l’algoritmo di approssimazione
ideato da Lebesgue sia utilizzabile, occorrerà che gli insiemi
(n)
Ek
=
x 2 [a; b] :
k
1
n
f (x) <
k
n
appartengano tutti alla famiglia L; questo si traduce in una richiesta sulla funzione f , che non potrà essere totalmente arbitraria, ma dovrà essere anch’essa
“misurabile”, il che per de…nizione signi…cherà appunto che tutti gli insiemi
(n)
di livello Ek sono misurabili. Ragionevolmente, quindi, non tutte le funzioni
risulteranno integrabili secondo Lebesgue; tuttavia, dovrebbero risultare integrabili molte più funzioni di quelle Riemann-integrabili; soprattutto, data la
“intrinseca stabilità”della de…nizione di integrale di Lebesgue e dato che tra le
proprietà della misura abbiamo inserito la numerabile additività, che dovrebbe
essere d’aiuto nel dimostrare proprietà delle successioni di funzioni, possiamo
sperare che questo spazio risulti completo rispetto alla norma integrale.
69
Il percorso logico che ci attende è ora sostanzialmente capovolto rispetto a
quello seguito in questa introduzione. Dovremo:
1. De…nire e studiare particolari famiglie di sottoinsiemi dell’insieme universo (che nel discorso fatto …n qui era R, ma potrebbe essere Rn o anche un
insieme diverso), le cosiddette “ -algebre”;
2. de…nire il concetto di misura e studiarne le proprietà; de…nire una particolare misura, quella di Lebesgue, che estende la misura elementare in Rn ;
3. de…nire cosa si intenda per “funzioni misurabili”e studiarne le proprietà;
4. de…nire l’integrale di una funzione misurabile e dimostrarne le proprietà;
5. de…nire uno spazio vettoriale normato di funzioni Lebesgue integrabili e
dimostrarne la completezza.
7.4
Sviluppo e impatto della teoria
della misura e dell’integrale di Lebesgue
Nel percorrere i passi appena descritti di questa teoria, ci si è resi conto che
buona parte di essa può essere sviluppata in un contesto molto astratto, cioè
senza supporre che lo spazio ambiente sia R o Rn , e qualora anche lo spazio
ambiente sia Rn , senza supporre che la misura estenda la misura elementare.
In altre parole, risulta importante sia costruire una misura e un integrale sui
consueti sottoinsiemi di Rn che generalizzi la misura elementare e l’integrale
di Riemann, permettendo di costruire spazi di funzioni integrabili che siano di
Banach, sia costruire una teoria della misura e dell’integrazione astratta, (cioè
rispetto ad una misura “qualsiasi” in uno spazio ambiente “qualsiasi”), che sia
uno strumento teorico ‡essibile e applicabile a situazioni diverse.
La teoria di Lebesgue ha rivoluzionato l’analisi matematica del R20 secolo in
molti modi. L’idea di identi…care due funzioni f; g ogni volta che jf gj = 0
(si dirà che “f e g sono uguali quasi ovunque”) ha cambiato il modo stesso di
pensare al concetto di funzione, rispetto alla de…nizione “punto per punto”data
da Dirichlet negli anni 1830; gli spazi di funzioni integrabili secondo Lebesgue,
uniti a un altro sviluppo dell’analisi funzionale astratta di cui parleremo in seguito, cioè la teoria degli spazi di Hilbert, ha gettato nuova luce sullo studio delle
serie di Fourier, rivoluzionando l’analisi armonica; il teorema fondamentale del
calcolo integrale nel contesto della teoria dell’integrazione di Lebesgue è stato
il punto di partenza per una generalizzazione del concetto di derivata, la cosiddetta “derivata debole”, di cui parleremo, che entra nella de…nizione degli spazi
di funzioni (“spazi di Sobolev”) che costituiscono dagli anni 1950 il contesto
standard in cui studiare le equazioni alle derivate parziali.
La versione astratta della teoria dell’integrazione ha avuto altri risvolti fondamentali: negli anni 1930 Kolmogorov ha rifondato assiomaticamente il calcolo
delle probabilità dandogli la veste che ha ancor oggi, interamente fondata sulla
teoria della misura astratta; la teoria astratta della misura ha anche dato la
possibilità di de…nire le misure di dimensione inferiore a quella dello spazio ambiente (misura di super…cie nello spazio tridimensionale, ad es.), creando una
teoria adatta a studiare anche oggetti geometrici molto irregolari; ne è nata
la teoria geometrica della misura, che ha saputo risolvere questioni che erano
70
aperte da secoli, come il problema isoperimetrico classico, e ha dato strumenti
potenti al calcolo delle variazioni. L’idea di derivata debole, già citata, e la
teoria della misura, in…ne, sono stati tra gli spunti per la nascita della teoria
delle distribuzioni, che negli anni 1950 ha ampiamente generalizzato il concetto
di funzione, derivata, trasformata di Fourier, con conseguenze vaste sia sullo
studio delle equazioni a derivate parziali che sull’analisi armonica.
8
Teoria della misura e dell’integrale di Lebesgue
Per approfondimenti sul contenuto di questa sezione si rimanda a: [16], [21],
[20], [10].
8.1
Spazi misurabili
De…nizione 8.1 Sia un insieme. Si dice -algebra (su ) una famiglia M
di sottoinsiemi di (cioè12 M P ( )) tale che:
2 M;
E 2 M =) E c 2 M (dove E c indica il complementareSdi E in );
1
1
se fEn gn=1 è una successione di insiemi di M, allora n=1 En 2 M.
Gli insiemi di M si dicono insiemi misurabili, ( ; M) si dice spazio misurabile.
Ogni insieme
ha due -algebre banali: la più piccola è quella costituita
solo da e ;; la più grande è tutto P ( ). Dalla de…nizione segue facilmente la:
Proposizione 8.2 Se M è una -algebra, M è chiusa anche rispetto alle
seguenti operazioni insiemistiche: unione …nita, intersezione …nita o numerabile; di¤ erenza insiemistica13 .
Proposizione 8.3 Se E P ( ) è una qualsiasi famiglia di sottoinsiemi di ,
è ben de…nita la più piccola -algebra contenente E, detta “ -algebra generata
da E” e si indica con (E).
Infatti, di -algebre contenenti E ce n’è almeno una: P ( ); consideriamo
allora l’intersezione di tutte le -algebre contenenti E; si tratta di dimostrare
che quest’intersezione è a sua volta una -algebra (facile esercizio); questa sarà
per costruzione la più piccola -algebra contenente E.
Esempio 8.4 (Relazione tra topologia e teoria della misura) Sia uno
spazio metrico qualsiasi, e A la famiglia di tutti gli insiemi aperti di . La
1 2 dove P ( ) indica l’insieme delle parti di
compresi stesso e l’insieme vuoto ;
1 3 La di¤erenza insiemistica è de…nita così:
; cioè l’insieme di tutti i sottoinsiemi di
A n B = A \ Bc:
71
;
-algebra (A) (generata da A nel senso della de…nizione precedente) si dice algebra di Borel in , si indica con B ( ), e i suoi insiemi si chiamano boreliani
di : Tra i boreliani troviamo tutti gli insiemi aperti, tutti i chiusi, ma anche
tutti gli insiemi (generalmente né aperti né chiusi) che si ottengono facendo
unione numerabile di chiusi o intersezione numerabile di aperti. Se ad esempio
= Rn (con la distanza euclidea), diciamo pure che è molto di¢ cile costruire
un insieme di che non sia un boreliano. Questa -algebra è quindi una classe
molto ampia e generale di sottoinsiemi di .
8.2
Misura
De…nizione 8.5 Sia ( ; M) uno spazio misurabile. Si dice misura (su questo
spazio) una qualunque funzione (d’insieme)
: M ! [0; +1]
1
che sia numerabilmente additiva, ossia tale che per ogni successione fEn gn=1
di insiemi di M a due a due disgiunti, si abbia
!
1
1
[
X
En =
En .
n=1
n=1
(Dove ambo i membri possono essere …niti o in…niti). In tal caso ( ; M; ) si
dice spazio di misura.
Da questa sola richiesta di numerabile additività seguono in realtà molte
altre proprietà della misura:
Teorema 8.6 Sia ( ; M; ) uno spazio di misura. Allora:
1. (;) = 0;
2.
è …nitamente additiva, cioè per ogni famiglia …nita E1 ; E2 ; :::; En di
insiemi di M a due a due disgiunti si ha
!
n
n
X
[
Ei ;
Ei =
i=1
i=1
3. è monotona, cioè 8A; B 2 M, A B =) (A)
(B) ;
4.
è condizionatamente sottrattiva, cioè 8A; B 2 M, A
B e (B) <
1 =) (B n A) = (B)
(A) ;
1
5.
è continua da sotto: se fEn gn=1
S1è una successione di insiemi di M
tale che En % E (cioè: En En+1 8n e n=1 En = E) allora (En ) ! (E) ;
1
6. è condizionatamente continua da sopra: se fEn gn=1 èTuna successione
1
di insiemi di M tale che En & E (cioè: En
En+1 8n e n=1 En = E) e
inoltre (E1 ) < 1, allora (En ) ! (E) ;
1
7.
è numerabilmente subadditiva, cioè se fEn gn=1 è una successione di
insiemi di M ( non necessariamente a due a due disgiunti), allora
!
1
1
[
X
En
En .
n=1
n=1
72
Lo studente può provare per esercizio a dimostrare qualcuna di queste proprietà.
Nel seguito, come vedremo, saranno molto importanti gli insiemi di misura
nulla. Notiamo che se E; E0 2 M, E0 E e (E) = 0, allora (per la monotonia
della misura) anche (E0 ) = 0. Talvolta siamo in una situazione leggermente
diversa: abbiamo un insieme E 2 M tale che (E) = 0; e un altro insieme
E0
E (di cui a priori non sappiamo che sia misurabile); ci piacerebbe poter
comunque concludere che (E0 ) = 0 (cioè: che E0 2 M, e quindi (E0 ) = 0).
Questo non è vero per tutte le misure, ma solo per quelle per cui è noto che
i sottoinsiemi degli insiemi di misura nulla sono tutti misurabili (e quindi di
misura nulla).
De…nizione 8.7 Sia ( ; M; ) uno spazio di misura. Si dice che la misura
è completa se i sottoinsiemi degli insiemi di misura nulla sono tutti misurabili
(e quindi hanno misura nulla).
Esempi di misure. Non è così semplice costruire misure signi…cative. Cominciamo a introdurre un paio di esempi semplici (ma comunque importanti).
La misura del conteggio. Sia
un insieme qualsiasi, M = P ( ) e
:
M ! [0; +1] tale che
(A) =
numero di elementi di A, se A è …nito;
1 altrimenti.
Si veri…ca che
è una misura detta misura del conteggio. Come vedremo,
l’integrale rispetto a questa misura risulterà una serie numerica, quindi la teoria
astratta dell’integrazione assorbirà al suo interno la teoria delle serie numeriche.
La misura atomica o di Dirac. Sia
un insieme qualsiasi, x0 2 un suo
elemento …ssato, e M = P ( ). De…niamo : M ! [0; +1] tale che
(A) =
1 se x0 2 A
0 altrimenti.
Si veri…ca che è una misura, detta misura di Dirac concentrata in x0 e indicata
talvolta col simbolo x0 .
Vediamo ora come costruire la misura fondamentale che ci interessa negli
spazi Rn , che permetterà di de…nire un integrale che estenda l’integrale classico
di Riemann.
8.3
Costruzione della misura di Lebesgue in Rn
Il nostro obiettivo ora è costruire una -algebra di sottoinsiemi di Rn che contenga gli insiemi elementari (di conseguenza, conterrà i boreliani), e de…nire su
di essa una misura che estenda la misura elementare. La costruzione che faremo
non è quella originale di Lebesgue ma è dovuta a Carathéodory, e procede in
due passi. In un primo tempo si de…nisce una funzione d’insieme non negativa
73
che è de…nita su tutti i sottoinsiemi di Rn , estende la misura elementare, ma
non è una misura (non può esserlo, in base al teorema di Ulam). Questa
si
chiamerà misura esterna. In un secondo tempo individueremo una -algebra L
di sottoinsiemi di Rn tale che , ristretta a L, sia numerabilmente additiva,
quindi una misura: L sarà la -algebra degli insiemi Lebsegue misurabili (e conterrà la -algebra di Borel), e la restrizione di
a L sarà la misura di Lebsegue
.
Consideriamo gli insiemi più semplici che sono l’analogo in Rn degli intervalli
sulla retta.
De…niamo n-cella un insieme del tipo:
I = [a1 ; b1 ]
[a2 ; b2 ]
::: [an ; bn ] ; con ai ; bi 2 R:
Per ogni n-cella I come sopra poniamo
(I) = jb1
(Cioè sulle n-celle
ogni E Rn ;
a1 j jb2
a2 j ::: jbn
an j :
è de…nito come il volume elementare). Ora poniamo, per
(E) = inf
(
1
X
(Ik ) : E
k=1
1
[
k=1
Ik
)
:
In altre parole: si considerano tutte le successioni di n-celle la cui unione ricopre
E (poiché le n-celle sono una successione e non un numero …nito, si può ricoprire
anche un insieme E illimitato); per ciascuna di queste successioni di n-celle si
considera la somma (serie) delle misure elementari; quindi si prende l’estremo
inferiore al variare delle coperture di E con n-celle. Notare che se ogni possibile
copertura di E con n celle è tale che la serie delle misure sia in…nita, si avrà
(E) = 1. Se E è un insieme limitato, certamente
(E) < 1 (ma può
essere
(E) < 1 anche per certi E illimitati).
Come anticipato nell’introduzione di questo paragrafo, la funzione
non è
una misura. La proprietà importante che si può dimostrare per
è espressa
dal seguente:
Teorema 8.8 La funzione
è numerabilmente subadditiva, cioè per ogni suc1
cessione fEk gk=1 di sottoinsiemi di Rn (non necessariamente a due a due
disgiunti), si ha
!
1
1
[
X
Ek
(Ek ) :
k=1
k=1
(Dove i due membri possono essere eventualmente in…niti).
Il punto fondamentale è che anche se gli insiemi Ek si assumono a due a due
disgiunti, in generale non si può garantire che nella disuguaglianza precendente
valga il segno di =. Per questo
non è una misura. Del resto, per il teorema
di Ulam, non potrebbe esistere una misura de…nita su tutti i sottoinsiemi di Rn
che estenda la misura elementare.
74
Aprendo una parentesi, diamo la seguente de…nizione astratta, che ci sarà
utile più avanti:
De…nizione 8.9 Sia un insieme qualsiasi. Si dice misura esterna su
qualunque funzione d’insieme
una
: P ( ) ! [0; +1]
1
che sia numerabilmente subadditiva, ossia tale che per ogni successione fEk gk=1
di sottoinsiemi di si abbia
!
1
1
X
[
Ek
(Ek ) :
k=1
k=1
Torniamo al contesto di Rn e alla misura esterna
. L’idea ingegnosa
di Carathéodory consiste nell’individuare una condizione che permetta di selezionare, mediante , una -algebra di insiemi su cui
sia numerabilmente
additiva.
De…nizione 8.10 Si dice che T
(E) =
(E \ T ) +
Rn ha la proprietà di Carathéodory se
(E \ T c ) per ogni E
Rn .
Detto a parole: un insieme ha la proprietà di Carathéodory se suddivide
additivamente ogni sottoinsieme di Rn . Vale il seguente
Teorema 8.11 (di Carathéodory) Sia L la famiglia dei sottoinsiemi di Rn
aventi la proprietà di Carathéodory. Allora:
L è una -algebra;
L contiene la -algebra di Borel;
la funzione
ristretta a L è una misura , detta misura di Lebesgue;
la misura di Lebsegue è completa;
la misura di Lebesgue è invariante per traslazioni ed estende la misura elementare.
Qualche commento sul teorema precedente. Dal punto di vista pratico, la
misura di Lebesgue è de…nita esattamente come la misura esterna , soltanto
che la classe di insiemi misurabili non coincide con P (Rn ) ma è più ristretta.
In realtà la classe degli insiemi Lebesgue misurabili è veramente molto ampia
e comprende non solo tutti gli insiemi di Borel, come a¤ermato dal teorema,
ma in pratica tutti gli insiemi di cui si possa dare un procedimento costruttivo
esplicito di de…nizione. Per costruire esempi di insiemi non misurabili bisogna
utilizzare l’assioma della scelta, un assioma della teoria degli insiemi che asserisce
la possibilità di de…nire insiemi con un certo procedimento non costruttivo che
richidede di e¤ettuare in…nite scelte arbitrarie. Un esempio di questo tipo si
trova in [16], §2.3.
Il fatto che operativamente (E) si calcoli come
(E) fa capire che è
invariante per traslazioni ed estende la misura elementare: infatti
è de…nita
75
a partire dalla misura elementare delle n-celle, che è invariante per traslazioni;
inoltre è (numerabilmente e quindi anche …nitamente) additiva; dalla proprietà
di additività …nita e il fatto che la misura delle n-celle sia il volume elementare
segue che la misura degli insiemi elementari (ad esempio, se siamo in R2 o R3
i poligoni e i poliedri, rispettivamente) coincida con la loro misura elementare.
(Si pensi a come, in geometria elementare, si arriva a stabilire le formule per
il calcolo dell’area dei poligoni: si basano tutte sulla formula per l’area del
rettangolo -che è la “misura elementare di una 2-cella”- e l’additività dell’area).
Esempio 8.12 Per visualizzare meglio come agisce la de…nizione di misura di
Lebesgue, facciamo qualche esempio.
1. Poiché la misura di Lebesgue estende la misura elementare, un punto ha
misura nulla (in Rn ; qualunque sia n).
2. D’altro canto la misura è numerabilmente additiva perciò, ogni insieme
numerabile (è misurabile e) ha misura nulla.
3. In R quanto appena a¤ ermato è particolarmente signi…cativo, perché
mostra che Q è un sottoinsieme di R misurabile e di misura nulla, non ostante
il fatto che Q sia denso in R. Si capisce che la valutazione di quanto sia “grande”
un insieme dal punto di vista della teoria della misura e dal punto di vista della
topologia può essere molto diverso. La misurabilità dell’insieme Q è un fatto che
deve far ri‡ettere sulla potenza della teoria: utilizzando le nozioni elementari di
misura dei segmenti, un insieme come Q sarebbe “intrattabile”.
4. Si ri‡etta sul fatto che, ad esempio, una retta (o una curva regolare)
nel piano o nello spazio ha misura nulla, così come un piano (o una super…cie
regolare) nello spazio ha misura nulla. Questo si può vedere ri‡ettendo sulla
de…nizione di
mediante coperture dell’insieme da misurare con successioni
di n-celle. A titolo di esempio, mostriamo che una retta, ad esempio l’asse x,
ha misura nulla nel piano. Per cominciare sia E il semiasse x 0; y = 0 nel
piano, e proviamo che (E) = 0. Possiamo coprire E con l’unione delle 2 celle
così fatte:
E
1
[
[k; k + 1]
k=0
1
X
k=0
[k; k + 1]
h
h
" "i
;
; con
2k 2k
X
" "i
; k
=
1
k
2 2
1
k=0
2"
= 4":
2k
Perciò
(E) = inf f4" : " > 0g = 0: Analogamente si prova che il semiasse
x
0 ha misura nulla, da cui essendo unione di due insiemi di misura nulla
l’asse x ha misura nulla in R2 . Naturalmente, in R l’asse x avrebbe invece
misura in…nita.
5. Tornando al caso unidimensionale di R, ci si può chiedere se solo gli insiemi numerabili hanno misura nulla. In altre parole, esistono in R insiemi non
numerabili di misura nulla? La domanda non è facile, perché i sottoinsiemi non
numerabili di R che vengono subito in mente sono gli intervalli (che sicuramente
hanno misura positiva, pari alla loro lunghezza) o, volendo fare qualche esempio
76
più complicato, l’insieme degli irrazionali, che però è misurabile e ha misura
in…nita, essendo il complementare dell’insieme dei razionali, che è misurabile e
ha misura nulla. Analogamente, l’insieme di tutti gli irrazionali compresi in un
intervallo ha misura pari alla lunghezza dell’intervallo. Un esempio interessante
di sottoinsieme non numerabile di R che ha misura nulla è il ternario di Cantor,
che ora de…niamo.
Si esegue la seguente costruzione iterativa. Consideriamo l’intervallo [0; 1].
Al passo 1, rimuoviamo l’intervallo aperto centrale di lunghezza 1=3, cioè l’intervallo (1=3; 2=3), e chiamiamo T1 l’insieme residuo, cioè [0; 1=3] [ [2=3; 1], che
ha misura 2=3.
Al passo 2, da ciascuno dei due intervallini che costituiscono T1 si rimuove
l’intervallo aperto centrale di lunghezza 1=3 dell’intervallino da cui lo si sta
togliendo, cioè di lunghezza 1=9, e chiamiamo T2 l’insime residuo, che ora ha
misura 4=9.
Si prosegue iterativamente a questo modo. L’insieme Tn costruito al passo
n
n-esimo ha misura (2=3) , perché è l’unione di 2n intervalli ognuno di lunghezza
n
1=3 .
1
\
L’insieme ternario di Cantor è de…nito come T =
Tn . Poiché Tn è una
n=1
successione decrescente di insiemi e T1 ha misura …nita, per la condizionata
continuità da sopra della misura di Lebesgue si ha
(T ) = lim
n!1
n
(Tn ) = lim (2=3) = 0:
n!1
Si potrebbe pensare che questo insieme T , ottenuto continuando a rimuovere
intervalli da [0; 1], sia un insieme vuoto o comunque molto “magro”, quindi
non avremmo trovato niente di interessante. Invece T non è a¤ atto vuoto; è
un insieme chiuso (intersezione di chiusi), che contiene almeno tutti gli estremi
degli intervalli residui, cioè 0; 1=3; 2=3; 1; 1=9; 2=9; :::; ma in realtà contiene molto
di più; si può dimostrare che T è un insieme non numerabile. Per rendercene
conto, ragioniamo così. Come potremmo indicare univocamente un punto di T ?
Assegnamo una sequenza di istruzioni con cui individuarlo, al modo seguente:
al passo 1 della costruzione, il punto si trova nell’intervallino di lunghezza 1=3
di destra o di sinistra? Nel primo caso scriviamo 1, altrimenti scriviamo 0; al
passo 2 della costruzione, il punto si trova dentro l’intervallino di lunghezza 1=3
individuato al passo 1, e precisamente nell’intervallino di destra o di sinistra di
lunghezza 1=9? Nel primo caso scriviamo 1, altrimenti scriviamo 0: Così facendo
associamo ad ogni punto del ternario di Cantor una successione di cifre 0 o 1;
ma la totalità di queste successioni è un insieme non numerabile (ad esempio,
perché possiamo vedere queste successioni come le rappresentazioni in base 2 dei
numeri reali dell’intervallo [0; 1]). Ciò dimostra che T è non numerabile, pur
avendo misura nulla.
6. Una generalizzazione della costruzione precedente ci sarà utile in seguito
per costruire un esempio importante riguardo all’integrale di Lebesgue.
Si esegue la seguente costruzione iterativa. Consideriamo l’intervallo [0; 1]
e …ssiamo un numero positivo e
1=3. Al passo 1, rimuoviamo l’intervallo
77
1
aperto centrale di lunghezza , cioè l’intervallo 12
2 ; 2 + 2 , e chiamiamo T1
1
l’insieme residuo, cioè 0; 12
.
2 [ 2 + 2 ; 1 , che ha misura 1
Al passo 2, da ciascuno dei due intervallini che costituiscono T1 si rimuove
l’intervallo aperto centrale di lunghezza 2 , e chiamiamo T2 l’insime residuo,
che ora ha misura 1
2 2.
Si prosegue iterativamente a questo modo. L’insieme Tn costruito al passo
n-esimo ha misura
1
+2
2
+ 22
3
+ ::: + 2n
1 n
n
X1
=1
k
(2 ) :
k=0
L’insieme ternario di Cantor generalizzato è de…nito come T
=
1
\
Tn .
n=1
Poiché Tn è una successione decrescente di insiemi e T1 ha misura …nita, per
la condizionata continuità da sopra della misura di Lebesgue si ha
"
#
n
X1
k
T = lim
Tn = lim 1
(2 ) =
n!1
=1
n!1
1
X
k=0
k
(2 ) = 1
k=0
1
2
=
1
1
3
:
2
In particolare, per ogni
2 0; 31 il ternario di Cantor generalizzato T ha
misura positiva. L’insieme T 1=3 è il ternario di Cantor “classico” costruito al
punto precedente, e ha misura nulla.
8.4
Restrizione di una misura
Abbiamo costruito la misura di Lebesgue su Rn . Naturalmente in molte questioni non consideriamo lo spazio intero, ma un sottoinsieme di Rn , e vorremmo avere una misura sui sottoinsiemi di . Più in generale, dato uno spazio
di misura astratto ( ; M; ) a volte ci interessa considerare un sottoinsieme
e vorremmo essere sicuri di avere uno spazio di misura su 0 che sia
0
la restrizione di quello già considerato. Questo in e¤etti si può fare in generale,
grazie al prossimo risultato, semplice da dimostrare ma che vale la pena di citare
esplicitamente.
Teorema 8.13 (Restrizione di una misura) Sia ( ; M; ) uno spazio di misura
astratto (qualsiasi), e sia 0
; 0 2 M (cioè 0 è un sottoinsieme misurabile
di ). Allora:
(a) La famiglia di insiemi M0 = fE0 = E \ 0 : E 2 Mg è una -algebra
di sottoinsiemi di 0 .
(b) La funzione d’insieme ristretta a M0 è una misura su ( 0 ; M0 ), quindi
dà luogo ad un nuovo spazio di misura ( 0 ; M0 ; 0 ) dove 0 = =M0 è detta
restrizione della misura a 0 .
78
La costruzione precedente è signi…cativa quando ( 0 ) > 0; altrimenti la
misura restrizione è identicamente nulla.
In particolare, in Rn , dato un qualsiasi sottoinsieme misurabile 0 di misura
positiva, parleremo della misura di Lebesgue in 0 per indicare la restrizione
di a 0 . Naturalmente ha interesse anche de…nire una misura “naturale” su
insiemi come una curva o una super…cie nello spazio R3 , che estenda il concetto
elementare di misura di lunghezza e misura di super…cie che si possono de…nire
mediante il calcolo di¤erenziale e integrale su curve e super…ci regolari. Questo
è però un altro problema, che considereremo brevemente in seguito e porterà al
concetto di misura di Hausdor¤ k-dimensionale.
8.5
Funzioni misurabili
Torniamo ora alla teoria generale astratta. Abbiamo uno spazio di misura qualsiasi ( ; M; ) e vogliamo de…nire l’integrale rispetto a questa misura. Ricordando quanto spiegato nell’introduzione, ci attende ancora un passo preliminare,
quello di de…nire cosa sono le funzioni misurabili, che saranno quelle per cui
la costruzione dell’integrale di Lebesgue è possibile. Cominciamo dal seguente
semplice
Teorema 8.14 Sia ( ; M) uno spazio misurabile qualsiasi e sia f :
Sono equivalenti le seguenti 4 condizioni:
1. fx 2 : f (x) > ag 2 M per ogni a 2 R;
2. fx 2 : f (x) ag 2 M per ogni a 2 R;
3. fx 2 : f (x) < ag 2 M per ogni a 2 R;
4. fx 2 : f (x) ag 2 M per ogni a 2 R.
! R.
Dimostrazione. L’equivalenza di 1 e 4 è ovvia perché i due insiemi sono l’uno
il complementare dell’altro; analogamente 2 e 3 sono ovviamente equivalenti.
L’equivalenza tra 1 e 2, ad esempio, si vede scrivendo
fx 2
: f (x)
ag =
1
\
n=1
x2
: f (x) > a
1
n
;
il che mostra che 2=)1, perché se vale 2 ogni insieme a 2 membro è misurabile,
quindi lo è anche la loro intersezione, perciò vale 1; d’altro canto
fx 2
: f (x) > ag =
1
[
n=1
x2
: f (x)
a+
1
n
;
il che mostra che 1=)2, perché se vale 1 ogni insieme a 2 membro è misurabile,
quindi lo è anche la loro unione, perciò vale 2.
De…nizione 8.15 Sia ( ; M) uno spazio misurabile qualsiasi e sia f : ! R.
Si dice che f è misurabile (su ( ; M)) se vale una delle condizioni equivalenti
espresse dal teorema precedente.
79
Esempio 8.16 Sia ( ; M) uno spazio misurabile qualsiasi ed E
: De…niamo la funzione caratteristica dell’insieme E (un concetto che ci servirà spesso
in seguito),
1 se x 2 E
E (x) =
0 se x 2
= E:
Allora si vede facilmente che
la funzione
E
è misurabile se e solo se l’insieme E è misurabile.
Quindi costruire esempi di funzioni non misurabili è tanto di¢ cile quanto
costruire esempi di insiemi non misurabili. Questo suggerisce che la richiesta
di misurabilità di una funzione sia una richiesta generalmente molto debole.
Esempio 8.17 Sia
uno spazio metrico e sia M la -algebra di Borel in :
Allora: se f :
! R è continua, f è misurabile. Infatti, per una funzione
continua, gli insiemi ai punti 1 e 3 del teorema sopra sono aperti, mentre gli
insiemi ai punti 2 e 4 del teorema sono chiusi; in tutti e 4 i casi, sono insiemi
di Borel.
In particolare se
Rn e M è la -algebra degli insiemi Lebesgue misurabili
(che come sappiamo contiene la -algebra di Borel), se f : ! R è continua,
f è misurabile.
Sappiamo quindi che, nel caso basilare che ci interessa, cioè quello della
misura di Lebesgue in Rn , le funzioni continue sono misurabili. Vediamo una
serie di risultati che dicono come, a partire da funzioni misurabili, costruire altre
funzioni misurabili. Prima però facciamo la seguente osservazione. Abbiamo
visto come per dare la de…nizione di funzione misurabile non occorra avere uno
spazio di misura ( ; M; ), ma solo uno spazio misurabile ( ; M). Tuttavia,
nel seguito della teoria ci sono alcune proprietà delle funzioni misurabili che si
discutono meglio supponendo di avere già introdotto una misura. Ad esempio,
se f è misurabile e g è uguale a f tranne che su un insieme “trascurabile”, vorrei
poter concludere che anche g è misurabile. Questo però presuppone la presenza
di una misura rispetto alla quale valutare la piccolezza dell’insieme in cui g è
diversa da f .
Supponiamo quindi d’ora in poi che ( ; M; ) sia uno spazio di misura e la
misura inoltre sia completa.
Illustriamo subito l’importanza di quest’ipotesi con la prossima proprietà:
Proposizione 8.18 Siano f; g : ! R con f misurabile e g = f tranne che
su un insieme di misura nulla. Allora g è misurabile.
Dimostrazione. Sia E0 = fx 2
nulla. Allora, per ogni a 2 R,
: g (x) 6= f (x)g, che per ipotesi ha misura
fx 2 : g (x) > ag =
= fx 2 : f (x) > ag [ fx 2 : g (x) > a e g (x) 6= f (x)g
n fx 2 : f (x) > a e g (x) 6= f (x)g
= E1 [ E2 n E3
80
dove E1 è misurabile perché f è misurabile, mentre E2 ; E3 sono misurabili perché sono sottoinsiemi dell’insieme di misura nulla E0 ; e la misura è completa.
Pertanto fx 2 : g (x) > ag è misurabile per ogni a 2 R, quindi g è misurabile.
In particolare il teorema precedente implica che nel seguito della teoria possiamo considerare funzioni de…nite in salvo al più un insieme di misura nulla
o, come si dice comunemente, de…nite quasi ovunque (abbreviato in q.o.). Se
f è de…nita q.o. in , possiamo pensare di de…nirla in un qualsiasi modo anche nell’insieme di misura nulla residuo, e la sua misurabilità o meno in non
dipende da come l’abbiamo de…nita (quindi, in de…nitiva, possiamo non de…nirla
proprio).
Teorema 8.19 (Operazioni sulle funzioni misurabili) Siano f; g : ! R
misurabili. Allora:
f g è misurabile; f g è misurabile; cf è misurabile (se c è una costante
reale);
f =g è misurabile purché l’insieme in cui g si annulla abbia misura nulla;
f + = max (f; 0) ; f = min (f; 0) ; jf j sono misurabili;
se : R ! R è continua, (f ) è misurabile;
se : R2 ! R è continua, (f; g) è misurabile.
La dimostrazione è un noioso esercizio. Il teorema precedente mostra sostanzialmente che ogni sequenza …nita di operazioni su funzioni misurabili produce funzioni misurabili. Ci interessano però anche operazioni in…nite, prima fra tutte
il passaggio al limite: è vero che se fn :
! R è una successione di funzioni misurabili convergente puntualmente a f in , anche f è misurabile? Per
provare questo non è facile operare direttamente sull’operazione di limite; più
facile operare su quella di estremo superiore e inferiore.
Proposizione 8.20 Sia fn :
di funzioni misurabili, allora
! [ 1; +1] (per n = 1; 2; 3:::) una successione
f (x) = sup fn (x) e g (x) = inf fn (x)
n
n
(dove f; g sono anch’esse …nite o in…nite) sono misurabili.
La dimostrazione segue subito dal fatto che
x2
n
x2
: sup fn (x) > a
=
n
o
: inf fn (x) < a =
n
1
[
n=1
1
[
n=1
fx 2
: fn (x) > ag
fx 2
: fn (x) < ag :
Vogliamo ricondurre il calcolo del limite a un calcolo di sup / inf, per
sfruttare il risultato precedente. Occorre per questo introdurre il concetto di
limite superiore e limite inferiore di una successione, che ci servirà anche per
altri motivi.
81
1
De…nizione 8.21 Sia fan gn=1 una successione di numeri reali (non necessariamente convergente). Allora la successione
bn = sup ak
k n
è monotona decrescente, quindi ammette limite (…nito o
limsupan = inf
n
n!1
sup ak
= lim
sup ak :
n!+1
k n
1). Si pone
k n
Analogamente, la successione
cn = inf ak
k n
è monotona crescente, quindi ammette limite (…nito o +1). Si pone
liminfan = sup
n!1
n
inf ak
= lim
inf ak :
n!+1
k n
k n
L’importanza dei concetti di liminf e limsup è che per ogni successione di
numeri reali (limitata o illimitata, convergente o no) liminf e limsup esistono
sempre (…niti o in…niti); tra i due numeri vale la relazione liminf an
limsup
an ; essi coincidono tra loro se e solo se la successione è convergente o divergente,
e in quel caso coincidono col limite.
n
Esempio 8.22 1. Sia an = ( 1) + n1 . Si ha:
k
bn = sup ( 1) +
k n
1
=
k
1+
1+
1
n
se n è pari
se n è dispari
1
n+1
quindi
limsupan = lim bn = 1:
n!1
n!+1
k
cn = inf ( 1) +
k n
1
=
k
1
quindi
liminfan = lim cn =
n!1
n!+1
1:
2. Sia an = n sin2 n 3 . Si ha:
liminfan = 0; limsupan = +1:
n!1
n!1
Se ora è fn è una successione di funzioni misurabili in ; dalla misurabilità
di supn fn e inf n fn segue subito la misurabilità di limsupfn e liminffn ; e quindi
la misurabilità del limite di fn ; quando questo esiste. La completezza della
misura consente di provare la seguente versione più ‡essibile del risultato appena
annunciato:
82
Teorema 8.23 Sia fn : ! [ 1; +1] (per n = 1; 2; 3:::) una successione di
funzioni, ciascuna de…nita q.o. in e misurabile, allora le funzioni
liminffn , limsupfn
n!1
n!1
sono de…nite q.o. e misurabili. In particolare se esiste f (x), limite puntuale
q.o. delle fn (x), f è misurabile.
8.6
Integrazione astratta
Abbiamo ora tutti gli ingredienti per de…nire l’integrale rispetto ad una misura
(astratta) qualsiasi. L’integrale di una qualsiasi funzione (misurabile) f sarà
de…nito come estremo superiore o limite di opportune “somme di Lebesgue di
f ”(anziché somme di Cauchy-Riemann), dove queste somme (la cui costruzione
è stata anticipata intuitivamente nell’introduzione) si possono vedere come integrali di opportune funzioni approssimanti, le funzioni semplici, che ora introduciamo. Il titolo “integrazione astratta” ricorda che tutta la costruzione che
descriveremo in questo paragrafo vale in qualsiasi spazio di misura, ma naturalmente vale anche in particolare nel caso della misura di Lebesgue in Rn , e
questo è uno dei casi più interessanti.
Nel seguito supporremo sempre che ( ; M; ) sia uno spazio di misura e la
misura sia completa.
De…nizione 8.24 Si dice che una funzione s :
bile e assume un numero …nito di valori.
! R è semplice se è misura-
Una funzione semplice si può sempre scrivere nella forma
s (x) =
n
X
cj
Ej
(x)
j=1
con E1 ; E2 ; :::; En insiemi misurabili e c1 ; c2 ; :::; cn 2 R. (Ricordare che Ej è la
funzione caratteristica di Ej , che vale 1 in Ej e 0 altrove). Gli insiemi si possono
scegliere a due a due disgiunti (e allora i numeri cj sono esattamente i possibili
valori assunti da s (x)) ma se anche non lo sono la funzione rimane semplice. E’
naturale de…nire l’integrale di s rispetto alla misura come
Z
s (x) d (x) =
n
X
cj (Ej )
j=1
(pensare al caso della misura di Lebesgue sulla retta; se gli insiemi Ej sono intervalli l’integrale risulta l’area sotto il gra…co della poligonale s (x); naturalmente
la teoria è stata fatta proprio per poter considerare le situazioni in cui gli insiemi Ej non sono intervalli ma insiemi molto complicati). L’idea è allora de…nire
l’integrale di una funzione misurabile e positiva, per cominciare, come l’estremo
83
superiore degli integrali delle funzioni semplici s (x)
f (x). Il problema è se
c’è un modo standard di de…nire funzioni semplici che approssimano tanto bene
quanto si vuole la funzione f . Questa è esattamente l’idea, che è stata anticipata
nell’introduzione, di suddividere in parti uguali l’insieme dei valori assunti da
f , anziché il dominio di f . La costruzione è contenuta nel prossimo
Teorema 8.25 (Approssimazione con funzioni semplici) Sia f : ! [0; +1]
misurabile. Esiste una successione monotona crescente di funzioni semplici sk
che converge puntualmente a f in : Se inoltre f è limitata la convergenza è
uniforme.
Dimostrazione. Fissato un intero k = 1; 2; 3:::; sia
Ek = x 2
: f (x) > 2k
Ekj =
:
x2
j
1
2k
e siano
< f (x)
Poniamo
j
2k
per j = 1; 2; ::::; 22k .
2k
sk (x) = 2
k
Ek
(x) +
2
X
j
j=1
1
2k
Ekj
(x) :
Si veri…ca che le sk hanno le proprietà richieste. Si osservi in particolare
che il fatto che la successione sia monotona crescente dipende dal fatto che
ad ogni passo il numero di suddivisioni dell’intervallo 0; 2k (sull’asse y) viene
raddoppiato.
Si può ora dare la seguente
De…nizione 8.26 (Integrale di una funzione positiva) Sia f : ! [0; +1]
misurabile. Si pone
Z
Z
f (x) d (x) = sup
s (x) d (x) : s semplice, s (x) f (x)
(dove l’estremo superiore può essere …nito o +1).
Ci si convince facilmente che questo estremo superiore si può realizzare in
particolare mediante le sk costruite nel teorema precedente, perciò si può anche
scrivere
1
0
Z
k2k
X
j
1
f (x) d (x) = lim @k (Ek ) +
Ekj A
k
k!1
2
j=1
84
vedendo quindi l’integrale come un limite di somme “alla Lebesgue”:
Dunque per ogni funzione misurabile e non negativa è ben de…nito (…nito o
+1) l’integrale di Lebesgue. Si noti in particolare che in questa teoria il caso in
cui la funzione o il dominio sono illimitati vengono trattati direttamente e non,
come accadeva per la teoria di Riemann, in un secondo tempo facendo il limite
di integrali di funzioni limitate su domini limitati.
Per comprendere meglio il signi…cato geometrico della costruzione dell’integrale di Lebesgue, consideriamo il caso particolare in cui f è misurabile, positiva
e limitata, 0 f (x) M . La costruzione del teorema precedente si può allora
ritoccare ponendo
Ekj =
x2
:
j
1
2k
j
M
2k
M < f (x)
per j = 1; 2; ::::; 2k
k
sk (x) = M
k2
X
j
j=1
Z
0
1
f (x) d (x) = lim @M
k!1
Ekj
2k
(x)
k
2
X
j
j=1
1
2k
Ekj
e si ha, per ogni k,
k
M
2
X
j
j=1
1
2k
Ekj
Z
1
A
k
f (x) d (x)
2
X
j
M
k
2
j=1
Ekj ;
dove lo scarto tra l’approssimazione per eccesso e per difetto al passo k non
supera, se ha misura …nita,
k
M
2
X
1
k
2
j=1
k
Ekj
M
2
1 X
2k j=1
85
Ekj =
M
( )
2k
e quindi può essere resa piccola a piacere. In particolare l’integrale in questo
caso è certamente …nito. Per esempio, in un intervallo di R, la funzione di
Dirichlet (che non è Riemann integrabile),
f (x) =
1 per x 2 Q
0 per x 2
=Q
è misurabile, q.o. nulla, quindi è Lebesgue integrabile con integrale nullo. Nella
teoria di Lebesgue dunque, in particolare, tutte le funzioni misurabili e limitate
hanno integrale …nito sugli insiemi di misura …nita.
Arriviamo ora alla de…nizione di integrale di Lebesgue per una funzione di
segno qualsiasi.
De…nizione 8.27 Sia f : ! [ 1; +1] misurabile. Si dice che f è Lebesgue
integrabile, o sommabile, se
Z
jf (x)j d (x) < 1
e in tal caso si pone
Z
Z
f (x) d (x) =
f + (x) d (x)
e risulta ovviamente
Z
f (x) d (x)
Z
Z
f (x) d (x)
jf (x)j d (x) < 1:
Notare che se f è misurabile allora anche jf j lo è (questa è una delle proprietà
delle funzioni misurabili che abbiamo elencato), ma il viceversa non è vero: se
E
è un insieme non misurabile e de…niamo
f (x) =
1 per x 2 E
1 per x 2
=E
allora f non è misurabile, mentre jf j (funzione costante uguale a 1!) ovviamente
lo è. Quindi nella de…nizione precedente è necessario richiedere la misurabilità di f e la …nitezza dell’integrale di jf j, non è possibile esprimere le ipotesi
unicamente su jf j.
Si confrontino le due de…nizioni di integrale introdotte (per funzioni positive
o di segno qualsiasi): per una funzione misurabile e positiva l’integrale è sempre
de…nito (…nito o +1) ma per dar senso all’integrale di una funzione di segno
variabile richiediamo la …nitezza dell’integrale del modulo, che implica quella
della parte positiva e negativa.
De…nizione 8.28 Indichiamo con L1 ( ; M; ) ; o più brevemente con L1 ( )
quando M e si possono sottointendere, l’insieme delle funzioni sommabili nel
senso della de…nizione precedente.
86
Si veri…ca facilmente che L1 ( ; M; ) è uno spazio vettoriale. Studieremo
in seguito questo spazio come spazio vettoriale normato.
Occorre naturalmente provare che l’integrale di Lebesgue soddisfa “le solite”
proprietà elementari dell’integrale. Premettiamo la seguente de…nizione, che ci
serve per dar senso all’integrale di una funzione su un sottoinsieme (misurabile)
di :
De…nizione 8.29 Se E 2 M; poniamo
Z
Z
f (x) d (x) =
(f
E ) (x) d
(x)
E
se f è una funzione misurabile in oppure è una funzione misurabile in E e noi
la de…niamo zero (o qualunque altro valore!) fuori da E. La de…nizione va intesa
nel senso che se f E 2 L1 ( ; M; ) allora diciamo che f 2 L1 E; M=E ; =E
e questa uguaglianza ne assegna l’integrale.
Teorema 8.30 Siano f; g 2 L1 ( ; M; ) allora
1. Linearità dell’integrale: per ogni c1 ; c2 2 R,
Z
Z
Z
[c1 f (x) + c2 g (x)] d (x) = c1
f (x) d (x) + c2
g (x) d (x) ;
2. Monotonia dell’integrale
f (x)
g (x) q.o. in
E; F 2 M; E
F; f
=)
0 =)
Z
Z
f (x) d (x)
f (x) d (x)
E
Z
g (x) d (x) ;
Z
f (x) d (x)
F
3. Proprietà di annullamento
se
(E) = 0 allora
Z
f (x) d (x) = 0;
E
Z
se f (x) = 0 q.o. in allora
f (x) d (x) = 0;
Z
se
jf (x)j d (x) = 0 allora f (x) = 0 q.o. in :
Il teorema precedente si dimostra abbastanza facilmente in base alla de…nizione
di integrale, riconducendosi al caso delle funzioni semplici.
La proprietà di additività rispetto all’insieme di integrazione, che non è compresa nel teorema precedente, vale in una forma più forte di quella che conosciamo per l’integrale di Riemann; precisamente, vale una numerabile additività,
che però enunciamo solo per funzioni positive:
87
1
Teorema 8.31 Sia f : ! [0; +1] misurabile e fEn gn=1 una successione di
sottoinsiemi misurabili di a due a due essenzialmente disgiunti14 . Allora
Z
f (x) d (x) =
[1
n=1 En
1 Z
X
n=1
f (x) d (x) :
En
Si osservi che questo teorema si può rileggere anche dicendo che una funzione
misurabile f : ! [0; +1] induce una nuova misura f su ( ; M) ; de…nita da
Z
f (x) d (x) :
(8.1)
f (E) =
E
Si dice che f è la densità di
f
(rispetto alla misura originaria ).
Serie numeriche come integrali. Consideriamo lo spazio di misura
( ; M; ) dove
= N, M = P (N),
è la misura del conteggio. Qualsiasi
1
successione fan gn=1 a valori reali
si
può
quindi
vedere come una funzione misP1
urabile a (n) su ; se la serie n=1 an risulta assolutamente convergente, la
funzione a sarà sommabile e si avrà
Z
1
X
a (n) d (n) =
an :
n=1
In altre parole, le serie sono particolari integrali astratti. Nella teoria di Lebesgue
quindi l’analisi del discreto e del continuo non hanno più solamente “certe analogie”, ma possono vedersi formalmente come due diverse applicazioni concrete
della medesima teoria astratta. Questo è fondamentale ad esempio nelle applicazioni al Calcolo delle Probabilità, che difatti nella sua formulazione moderna,
dovuta a Kolmogorov, anni 1930, è fondata sulla teoria astratta della misura.
8.7
Relazione tra integrale di Riemann
e integrale di Lebesgue
Particolarizziamo ora la de…nizione di integrale astratto al caso della misura di
Lebesgue sulla retta R. In questo contesto possiamo ora confrontare le nozioni di
integrale di Riemann e integrale di Lebesgue. Per poter e¤ettuare il confronto,
mettiamoci nell’insieme delle funzioni limitate de…nite su un intervallo [a; b].
Tra queste, le funzioni sommabili secondo Lebesgue sono tutte e solo le funzioni
misurabili. Per confronto, si può dimostrare il seguente
Teorema 8.32 Sia f : [a; b] ! R una funzione limitata. Allora f è Riemannintegrabile se e solo se è continua quasi ovunque (dove l’espressione “quasi
ovunque” ha il solito signi…cato, quindi signi…ca che l’insieme dei punti di
discontinuità ha misura di Lebesgue nulla).
1 4 Due
insiemi misurabili si dicono essenzialmente disgiunti se la loro intersezione ha misura
nulla. In particolare, due insiemi disgiunti sono anche essenzialmente disgiunti.
88
Poiché si può dimostrare che tutte le funzioni continue quasi ovunque sono
misurabili, ne segue che tutte le funzioni Riemann integrabili 15 sono anche
Lebesgue integrabili. L’integrale che abbiamo costruito è quindi e¤ettivamente
più generale di quello che conoscevamo dalla teoria classica.
Per esempio, come sappiamo la funzione di Dirichlet (uguale a 1 sui razionali e 0 sugli irrazionali) non è Riemann integrabile, e difatti è discontinua
ovunque. Dal punto di vista della teoria di Lebesgue la funzione di Dirichlet è
indistinguibile dalla funzione identicamente nulla, ovviamente integrabile.
Un esempio più interessante è il seguente:
Esempio 8.33 Consideriamo il ternario di Cantor generalizzato T costruito
nel § 8.3, con < 1=3, che come si ricorderà ha misura positiva, e sia
f : [0; 1] ! R
f (x) = T (x) :
Come qualsiasi funzione caratteristica di un insieme, questa funzione è discontinua nei punti di frontiera dell’insieme stesso. D’altro canto, una delle proprietà signi…cative di T , dovuta alla sua particolare de…nizione iterativa, è quella
di non contenere interamente alcun intervallo (a; b) (ce ne si rende facilmente
conto se si pensa che ogni intervallino che costituisce Tn viene spezzato in 3
intervallini più brevi al passo n + 1, e di questi quello centrale viene rimosso;
quindi l’insieme …nale T non contiene alcun intervallino, per quanto breve).
Ma allora T non possiede alcun punto interno, perciò tutti i suoi punti sono
di frontiera. Questo implica che la funzione caratteristica T è discontinua
in tutti i punti di T , che ha misura positiva. Pertanto, per il teorema precedente, T non è Riemann integrabile. D’altro canto T è sommabile secondo
Lebesgue, con integrale pari alla misura di Lebesgue di T . L’esempio è interessante perché questa funzione, a di¤ erenza della funzione di Dirichlet, non può
essere resa continua alterandola su un insieme di misura nulla.
Per poter calcolare e¤ettivamente l’integrale di Lebesgue in casi semplici ma
signi…cativi è indispensabile capire anche la relazione tra integrale di Lebesgue
e integrale di Riemann generalizzato. Consideriamo prima il caso dell’integrale
di Riemann generalizzato di una funzione limitata su un intervallo illimitato.
Ricordiamo la seguente:
De…nizione 8.34 Sia f : (a; +1) ! R una funzione limitata, con la proprietà
di essere Riemann integrabile su ogni intervallo (a; k) (per k > a). Se esiste
…nito
Z k
lim
f (x) dx = l
k!+1
a
allora si dice che l’integrale di Riemann generalizzato
Z +1
f (x) dx
a
1 5 In
senso proprio, non generalizzato. Della relazione tra integrale di Lebesgue e integrale
di Riemann generalizzato diremo qualcosa tra breve.
89
converge, ed è uguale a l.
Si può dimostrare il seguente
Teorema 8.35 Nelle ipotesi della de…nizione precedente, si supponga inoltre
che per qualche k a si abbia f (x) 0 per ogni x k (oppure f (x) 0 per
ogni x
k). Allora se l’integrale di Riemann generalizzato di f converge, la
funzione f è anche sommabile secondo Lebesgue, e il suo integrale di Lebesgue
su (a; +1) è uguale all’integrale generalizzato.
In pratica, l’ipotesi richiede che la funzione f non cambi di segno in…nite volte
per x ! +1. Un discorso analogo vale ovviamente per l’integrale generalizzato
su ( 1; 0). Qualche esempio chiarirà i modi in cui solitamente si ragiona.
Esempio 8.36 Si consideri
Z
1
x
1
sin dx:
1 + x4
x
0
Si osservi che la funzione è continua e limitata in (0; +1) (in particolare tende
a zero per x ! 0+ ), quindi è Riemann integrabile su ogni intervallo (0; k).
Inoltre, f cambia di segno in…nite volte vicino all’origine, ma è positiva per
ogni x > 1= . Quindi il teorema è applicabile. Controlliamo se l’integrale
generalizzato di f converge.
1
x
sin
1 + x4
x
x
1 + x4
1
per x ! +1,
x3
perciò l’integrale generalizzato converge assolutamente, e quindi converge. Ne
segue che f è sommabile secondo Lebesgue. Si poteva in realtà anche tralasciare la veri…ca sui cambi di segno di f ragionando direttamente su jf j, così:
la funzione jf j è continua e limitata su (0; +1), non negativa, integrabile in
senso generalizzato, quindi jf j è Lebsegue sommabile; poiché f è ovviamente
misurabile, anche f è Lebsegue sommabile.
Esempio 8.37 Si consideri:
Z
1
+1
sin x
dx:
x2
La funzione cambia di segno in…nite volte per x ! 1, perciò non si può applicare
il teorema direttamente a f , ma lo si può applicare a jf j: poiché jf j è continua,
limitata, non negativa, e
1
jf (x)j
;
x2
jf j è integrabile in senso generalizzato perciò è anche Lebesgue sommabile; d’altro canto f è misurabile perché continua, quindi anche f è Lebsegue sommabile.
90
Esempio 8.38 Si consideri:
Z
+1
sin x
dx:
x
1
La funzione cambia di segno in…nite volte per x ! 1, perciò non si può applicare il teorema direttamente a f . D’altro canto ragionando su jf (x)j non si
riesce a concludere la convergenza dell’integrale generalizzato. Il teorema non è
quindi in questo caso di alcuna utilità per stabilire l’esistenza o la non esistenza
dell’integrale di Lebesgue. Si può dimostrare che:
1. L’integrale generalizzato di f converge, ma:
2. la funzione f non è Lebesgue sommabile, in quanto l’integrale di Lebesgue
di jf (x)j diverge.
Questo esempio mostra quindi un tipo di situazione in cui l’integrabilità
secondo Lebesgue risulta una condizione più esigente dell’integrabilità in senso generalizzato secondo Riemann. L’idea geometrica soggiacente è la seguente:
nell’integrale generalizzato di una funzione che cambia di segno in…nite volte si
possono avere compensazioni tra le aree con segno delle porzioni del gra…co di
f che stanno ora sopra ora sotto l’asse delle x; l’integrale di Lebesgue richiede
invece di calcolare prima il contributo totale della parte di gra…co sopra l’asse
delle x, poi quello della parte sotto l’asse delle x, e poi sottrarre: se entrambi
questi numeri sono in…niti, l’integrale perde signi…cato, non consentendo quindi le compensazioni parziali che avvenivano calcolando l’integrale su (0; k) e
facendo poi tendere k a +1.
Proviamo ora le due a¤ ermazioni fatte.
1. Mostriamo la convergenza dell’integrale generalizzato
Z
1
+1
sin x
dx = lim
k!+1
x
Z
1
k
sin x
dx:
x
Integrando per parti:
Z
1
k
cos x
x
dove l’integrale generalizzato
k
Z
k
cos x
dx
x2
1
1
Z k
cos k
cos x
=
+ cos 1
dx
k
x2
1
Z +1
cos x
! cos 1
dx
x2
1
sin x
dx =
x
R +1
1
cos x
x2 dx
cos x
x2
91
converge perché
1
:
x2
2. Proviamo che f non è però assolutamente integrabile secondo Lebsegue.
Z
1
+1
sin x
dx
x
Z
1 Z 5 +2k
X
6
sin x
sin x
dx
dx =
5
1
x
x
[k=1 [ 6 +2k ; 6 +2k ]
k=1 6 +2k
1
1 Z 5 +2k
2
X
6
1X
1=2
3
dx
= +1
5
x
2
+
2k
+2k
k=1 6
k=1 6
in quanto la serie numerica diverge, essendo
2
3
5
6
+ 2k
1
;
3k
serie armonica divergente.
Un discorso completamente analogo si può fare per l’integrale di Riemann
generalizzato per una funzione illimitata su un intervallo illimitato:
De…nizione 8.39 Sia f : (a; b] ! R una funzione con la proprietà di essere
limitata e Riemann integrabile su ogni intervallo [a + "; b] (per " > 0). Se esiste
…nito
Z b
lim
f (x) dx = l
"!0+
a+"
allora si dice che l’integrale di Riemann generalizzato
Z
b
f (x) dx
a
converge, ed è uguale a l.
Si può dimostrare il seguente
Teorema 8.40 Nelle ipotesi della de…nizione precedente, si supponga inoltre
che per qualche "0 > 0 si abbia f (x) 0 per ogni x 2 (a; a + "0 ) (oppure f (x)
0 per ogni x 2 (a; a + "0 )). Allora se l’integrale di Riemann generalizzato di f
converge, la funzione f è anche sommabile secondo Lebesgue, e il suo integrale
di Lebesgue su (a; b) è uguale all’integrale generalizzato.
In questo caso ciò che va escluso è che la funzione cambi di segno in…nite
volte in ogni intorno del punto a in cui la funzione è illimitata. Se la funzione
non ha in…niti cambi di segno, la convergenza dell’integrale di Riemann generalizzato implica la Lebesgue sommabilità della funzione; se invece la funzione
ha in…niti cambi di segno, si può provare la Lebesgue sommabilità mostrando la
convergenza dell’integrale generalizzato del modulo di f . Rimane la possibilità,
però, che una funzione con in…niti cambi di segno in un intorno di un punto in
cui è illimitata abbia integrale di Riemann generalizzato convergente e tuttavia
non sia Lebesgue sommabile.
92
Esempio 8.41 Consideriamo
Z
1
0
1
1
p sin dx:
x
x
La funzione è continua e limitata (quindi Riemann integrabile) in ogni intervallo
["; 1] per " > 0. Poiché
1
1
1
p ;
p sin
x
x
x
per i criteri di integrabilità l’integrale di Riemann generalizzato di jf j converge,
quindi (essendo ovviamente f misurabile), f è Lebesgue sommabile.
Esempio 8.42 Consideriamo
Z
0
1
1
1
sin dx:
x
x
In questo caso la maggiorazione
1
1
sin
x
x
1
x
è inconcludente, perché l’integrale generalizzato di 1=x diverge; d’altro canto la
funzione cambia di segno in…nite volte in (0; 1), perciò il teorema precedente
non è di aiuto a stabilire se la funzione è Lebesgue sommabile oppure no. Si
può dimostrare che non lo è, e che tuttavia l’integrale generalizzato di Riemann
converge. Infatti il cambio di variabili:
Z 1
1
1
sin dx = 1=x = t; dx = 1=t2 dt
x
0 x
Z +1
sin t
=
dt
t
1
riconduce l’integrale a quello dell’Esempio 8.38.
8.8
I teoremi di convergenza per l’integrale di Lebesgue
Finora abbiamo costruito l’integrale di Lebesgue, ne abbiamo elencato le proprietà di base, abbiamo constatato (ultimo paragrafo) che le funzioni Lebesgue
integrabili sono più di quelle Riemann integrabili, ma non abbiamo realmente
illustrato i vantaggi di questo integrale rispetto a quello classico. I vantaggi
consistono soprattutto in alcuni importanti teoremi sul passaggio al limite per
successioni, che qui presenteremo, e che hanno importanti conseguenze.
Torniamo ancora nel contesto astratto di un qualsiasi spazio di misura ( ; M; ),
in cui supponiamo come in precedenza che la misura sia anche completa.
93
Teorema 8.43 (della convergenza monotona) Sia fn :
! [0; +1] una
successione di funzioni misurabili, monotona crescente, cioè fn (x)
fn+1 (x)
per ogni intero n e x 2 . Allora
Z
Z
lim
fn (x) d (x) =
lim fn (x) d (x)
n!+1
n!+1
dove i due membri dell’uguaglianza possono essere …niti o in…niti. (L’esistenza
dei due limiti è parte della tesi).
Dimostrazione. Poiché una successione monotona crescente di numeri reali
ha sempre limite (…nito o +1), è ben de…nita la funzione f : ! [0; +1]
f (x) = lim fn (x) per ogni x 2 .
n!+1
La funzione f è misurabile e non negativa perché
R limite di funzioni misurabili e non negative, quindi esiste, …nito o +1,
f (x) d (x). Inoltre per la
monotonia dell’integrale,
Z
Z
fn (x) f (x) =)
fn (x) d (x)
f (x) d (x)
e per il teorema di permanenza del segno
Z
fn (x) d (x)
lim
n!+1
Z
f (x) d (x) :
(8.2)
Rimane da provare la disuguaglianza opposta. Ricordando la de…nizione di
integrale di una funzione positiva, sia s (x) una qualsiasi funzione semplice
f (x) in e, …ssato un qualsiasi numero c 2 (0; 1) ; consideriamo gli insiemi
En = fx 2
Abbiamo allora per ogni intero n:
Z
Z
fn (x) d (x)
: fn (x)
fn (x) d (x)
En
D’altro canto: poiché per ogni x 2
1
[
cs (x)g :
Z
cs (x) d (x)
(8.3)
En
è fn (x) ! f (x)
s (x) ;
En = ;
n=1
inoltre per la monotonia delle fn è En
En+1 , quindi En % e per la continuità dal basso della misura, (En ) ! (E) per ogni misura su ( ; M), in
particolare per la misura di densità cs (x) (v. (8.1)). Quindi se nella (8.3)
passiamo al limite per n ! 1 abbiamo
Z
c
s (x) d (x) :
94
Questo vale per ogni numero c 2 (0; 1) quindi per c ! 1 abbiamo
Z
s (x) d (x) :
In…ne, questo vale per ogni funzione semplice s (x) f (x), perciò passando al
sup su tutte queste s (x) ; per de…nizione di integrale di f abbiamo
Z
f (x) d (x) ;
che, ricordando (8.2), è quanto restava da provare.
Teorema 8.44 (di Fatou) Sia fn :
misurabili, allora
Z
liminfn!1 fn (x) d (x)
! [0; +1] una successione di funzioni
liminfn!1
Z
fn (x) d (x)
dove, come nel teorema precedente, i due membri possono essere …niti o in…niti.
Si noti che in questo teorema non si suppone a priori l’esistenza di alcun limite; tuttavia, ricordiamo che il liminf di una successione esiste sempre. Conviene
ricordarne la de…nizione:
liminfn!1 an = sup
n
inf ak
= lim
n!+1
k n
inf ak :
k n
Dimostrazione. La successione di funzioni
inf fk (x)
k n
1
n=1
per de…nizione è monotona crescente, quindi possiamo applicare ad essa il
teorema della convergenza monotona, e a¤ermare che
Z
Z
liminfn!1 fn (x) d (x) =
lim
inf fk (x) d (x)
n!+1 k n
Z
= lim
inf fk (x) d (x) :
n!+1
k n
Ora è su¢ ciente maggiorare nell’ultimo integrale:
inf fk (x)
k n
fn (x) :
Tuttavia così facendo non possiamo più essere certi che la successione degli
integrali che ne risulta abbia limite; ne esiste però certamente il liminf. La
catena di passaggi è quindi:
Z
Z
liminfn!1 fn (x) d (x) = lim
inf fk (x) d (x) =
n!+1
k n
Z
Z
= liminfn!1
inf fk (x) d (x) liminfn!1
fn (x) d (x) :
k n
95
I due teoremi precedenti riguardano una successione di funzioni misurabili
e positive, e considerano integrali …niti o in…niti. Il prossimo teorema invece
considera successioni di funzioni di segno qualsiasi, ma sommabili. Questo è
probabilmente il più importante teorema della teoria di Lebesgue:
Teorema 8.45 (della convergenza dominata, o “teorema di Lebesgue”)
Sia fn :
! [ 1; +1] una successione di funzioni misurabili, convergente
puntualmente (quasi ovunque) a una certa funzione f . Supponiamo che esista
una funzione g sommabile in tale che per ogni intero n sia
jfn (x)j
Allora
In particolare,
Z
jfn (x)
lim
n!1
g (x) per q.o. x 2 :
f (x)j d (x) ! 0 per n ! 1:
Z
fn (x) d =
cioè il limite si scambia con l’integrale.
Z
f (x) d
La funzione g che compare nell’ipotesi del teorema si chiama funzione dominante integrabile (perché domina, cioè maggiora, il modulo delle fn ), da cui il
nome del teorema.
Dimostrazione. Dall’ipotesi jfn (x)j g (x) e fn (x) ! f (x) (q.o.) ricaviamo
che anche jf (x)j g (x) (q.o), quindi la successione
n
= 2g
jfn
fj
è non negativa (q.o.); inoltre n (x) ! 2g (x) q.o.; possiamo applicare a
Teorema di Fatou, ottenendo
Z
Z
Z
2gd =
liminf n d
liminf
nd
n!1
n!1
Z
Z
Z
[2g jfn f j] d =
2gd + liminf
jfn f j d
= liminf
n
il
n!1
n!1
R
e sempli…cando ai due membri la quantità (…nita per ipotesi)
2gd abbiamo
Z
Z
0 liminf
jfn f j d = limsup
jfn f j d
n!1
n!1
cioè
limsup
n!1
Z
jfn
f j d = 0;
R
quindi
jfn (x) f (x)j d (x) ! 0: In…ne,
Z
Z
Z
[fn (x) f (x)] d
fn (x) d
f (x) d =
96
Z
jfn (x)
f (x)j d (x)
perciò è anche
R
fn (x) d !
R
f (x) d , e la dimostrazione è completa.
Vediamo ora qualche esempio pratico di passaggio al limite sotto il segno di
integrale per l’integrale di Lebesgue, a confronto con quanto si può dire nella
teoria dell’integrale di Riemann.
Nella teoria di Riemann, se ffn g è una successione di funzioni fn : [a; b] ! R
limitate e Riemann integrabili e inoltre fn ! f uniformemente in [a; b], si può
Rb
Rb
garantire che a fn (x) dx ! a f (x) dx. Supponiamo di sapere soltanto che le
funzioni fn sono misurabili, jfn (x)j c per ogni x 2 [a; b] e per ogni n, e inoltre
fn ! f puntualmente quasi ovunque in [a; b]. Per il teorema di Lebesgue della
Rb
Rb
convergenza dominata risulterà a fn (x) dx ! a f (x) dx, sotto ipotesi che
quindi sono molto più deboli della convergenza uniforme.
1=n
Esempio 8.46 Sia fn (x) = jxj
in [ 1; 1]. Si ha fn (x) ! 1 q.o. ma non
uniformemente (poiché fn (0) = 1 si ha kfn 1k1 = 1). Perciò la teoria
di Riemann non è applicabile. In base al teorema della convergenza dominata, invece, essendo jfn (x)j
1 (e la costante è integrabile in [ 1; 1]) risulta
R1
R1
f
(x)
dx
!
1dx
=
2.
1 n
1
nx
in [0; +1): Controlliamo anzitutto che ciasEsempio 8.47 Sia fn (x) = sin
nx3=2
nx
1
cuna fn 2 L1 . Per x ! 0 è fn (x)
= x1=2
, integrabile in un intorno
nx3=2
sin nx
1
di 0. D’altro canto jfn (x)j = nx3=2
, integrabile in un intorno di 1.
nx3=2
Perciò fn 2 L1 [0; +1):
Per n ! 1; fn (x) ! 0 puntualmente ovunque. Cerchiamo una dominante
integrabile su [0; +1). Per trovarla è più semplice ragionare separatamente
sugli intervalli [0; 1] e [1; +1). Si ha:
1
nx
= x1=2
2 L1 [0; 1] (abbiamo usato la disugper x 2 [0; 1] ; jfn (x)j
nx3=2
uaglianza jsin tj jtj);
1
1
2 L1 [1; +1) (abbiamo usato le
per x 2 [1; +1); jfn (x)j
nx3=2
x3=2
disuguaglianze jsin tj 1 e 1=n 1).
Dunque
jfn (x)j
g (x) =
1
x1=2
1
x3=2
per x 2 [0; 1]
per x 2 [1; +1)
con g 2 L1 [1; +1);
perciò il teorema di Lebesgue è applicabile, e
Z +1
Z +1
fn (x) dx !
0dx = 0:
0
0
Si osservi che, diversamente dall’esempio precedente, questa volta la maggiorante integrabile è una funzione illimitata.
Si poteva anche, del resto, valutare direttamente l’integrale:
Z +1
Z +1
sin nx
dt
sin t dt
dx
=
nx
=
t;
dx
=
=
3=2
3=2 n
n
nx
0
0
n nt
Z +1
c
1
sin t
dt = p ! 0 per n ! 1
=p
n 0
n
t3=2
97
R +1 sin t
perché c = 0
dt è una costante (abbiamo dimostrato all’inizio che ogni
t3=2
fn è L1 , questa integranda è f1 ).
8.9
Lo spazio L1
Abbiamo introdotto lo studio della teoria di Lebesgue con l’esigenza di costruire uno spazio vettoriale di funzioni integrabili che, normato con una norma
integrale, risulti completo. Lo scopo principale di questo paragrafo è mostrare
che lo spazio L1 ( ; M; ) è uno spazio vettoriale normato completo. Occorre
anzitutto una precisazione. Se de…niamo in L1 ( ; M; )
Z
kf kL1 ( ;M; ) =
jf (x)j d (x)
questa risulta soddisfare le proprietà della norma, tranne quella di annullamento.
Infatti, come visto nel Teorema 8.30,
kf kL1 (
;M; )
= 0 =) f (x) = 0 q.o. in
:
Per ottenere una norma è quindi necessario identi…care funzioni uguali q.o. tra
loro, ossia introdurre in L1 la relazione di equivalenza f
g se f = g q.o.
e considerare lo spazio delle classi di equivalenza di funzioni, che può essere
reso uno spazio vettoriale normato a questo modo, come spiegato nel § 7.1.
Questa operazione è coerente anche perché la misura è completa, perciò se f è
misurabile e g = f q.o., anche g è misurabile. Naturalmente sul piano intuitivo
continueremo a pensare gli elementi di L1 come funzioni, che sono tra loro
indistinguibili quando sono uguali quasi ovunque; sul piano formale, invece, gli
elementi di L1 sono classi d’equivalenza di funzioni.
Possiamo ora, sfruttando vari fatti dimostrati …n qui, provare anzitutto
un’a¤ermazione fatta nell’introduzione, ossia:
Proposizione 8.48 Lo spazio vettoriale delle funzioni limitate e Riemannintegrabili su un intervallo [a; b], normato con la norma integrale
kf kL1 =
Z
b
a
jf (x)j dx
(dopo aver identi…cato due funzioni f; g ogni volta che
non è completo.
Rb
a
jf (x)
g (x)j dx = 0)
Dimostrazione. Consideriamo il ternario di Cantor T corrispondente a un
< 1=3; che ha misura di Lebesgue positiva, gli insiemi Tn che compaiono nella
sua costruzione iterativa, e poniamo
fn : [0; 1] ! R
fn = Tn :
98
Ogni insieme Tn è l’unione di un numero …nito di intervalli chiusi, quindi la sua
frontiera è costituita da un numero …nito di punti (gli estremi di tutti questi
intervalli); pertanto fn è discontinua in un numero …nito di punti, perciò è
Riemann integrabile. Questa è dunque una successione di funzioni in R [0; 1].
Per n ! 1; fn (x) ! T (x). Inoltre jfn (x)j 1, e la costante è integrabile
in [0; 1] ; quindi per il teorema della convergenza dominata
kfn
T
kL1 ! 0:
Perciò la successione è di Cauchy in L1 [0; 1], e quindi anche in R [0; 1]. D’altro
canto abbiamo dimostrato in precedenza che T non è Riemann integrabile.
Quindi fn è una successione di Cauchy in R [0; 1] che non converge in R [0; 1], e
questo spazio non è completo.
Passiamo ora al risultato positivo che ci interessa:
Teorema 8.49 Lo spazio vettoriale normato L1 ( ; M; ) (de…nito indenti…cando funzioni uguali q.o.) è completo.
Per provare il teorema ci servirà il seguente risultato astratto:
Proposizione 8.50 Sia X uno spazio vettoriale normato. Allora X è completo
1
se e solo se, per ogni successione fxn gn=1 di elementi di X si ha che:
se la serie numerica
1
X
n=1
la serie
1
X
kxn k converge in R, allora
xn converge in X,
n=1
ossia esiste x 2 X tale che
n
X
k=1
xk
x ! 0 per n ! 1:
Dimostrazione. Il fatto che se X è completo allora vale l’implicazione segnalata si dimostra facilmente, e lo lasciamo per esercizio anche perché questa è la
parte del teorema che non ci servirà. Dimostriamo invece la parte del teorema
che sfrutteremo per provare la completezza di L1 ossia: se la convergenza della
serie delle norme implica la convergenza della serie in X, allora X è completo.
1
Consideriamo quindi una successione fxn gn=1 di Cauchy in X, e proviamo
che converge.
Per de…nizione di successione di Cauchy, possiamo estrarre da fxn g una
successione fxnk g tale che per ogni k = 1; 2; 3; ::: sia
xnk+1
xnk
99
1
.
k2
P1
Dunque
xnk converge in R e per la proprietà che vale per
nk+1
k=1 x
P
1
ipotesi, la serie
x
xnk converge in X ad un certo elemento x.
nk+1
k=1
Ossia:
N
X
xnk+1 xnk ! x per N ! 1:
k=1
D’altro canto
N
X
xnk+1
xnk = xnN +1
xn1
k=1
(somma telescopitca), quindi xnN +1 xn1 ! x e xnN +1 ! x + xn1 per N ! 1.
Abbiamo quindi provato che la successione fxn g contiene una sottosuccessione
convergente, il che unito alla condizione di Cauchy implica16 la convergenza di
tutta la successione fxn g.
Veniamo ora alla
Dimostrazione del teorema di completezza. Proveremo che L1 ( ; M; )
è completo mostrando che vale la proprietà enunciata nella Proposizione prece1
dente. Sia quindi ffn gn=1 una successione di funzioni in L1 ( ; M; ) di cui
sappiamo che
1
X
kfn kL1 < 1
P1
n=1
1
e proviamo che la serie
n=1 fn converge in L ( ; M; ). Introduciamo la
successione delle somme parziali
gk (x) =
k
X
n=1
jfn (x)j :
Le funzioni gk sono non negative e la loro successione è monotona crescente; sia
g (x) = lim gk (x) :
k!1
Per il teorema della convergenza monotona si ha
Z
gd = lim
k!1
Z X
k
n=1
jfn j d = lim
k!1
k Z
X
n=1
jfn j d =
1 Z
X
n=1
jfn j d < 1 per ipotesi.
Si noti che lo scambio tra integrale e sommatoria è stato fatto su una sommatoria …nita, quindi è senz’altro lecito; inoltre, il limite della somma parziale
è per de…nizione la serie. Abbiamo dimostrato quindi che g è sommabile,
e in particolare g (x) è …nita q.o. Ciò signi…ca, essendo per la monotonia
Pk
P1
g (x), che la serie
n=1 jfn (x)j = gk (x)
n=1 fn (x) converge (per q.o.
x) assolutamente e quindi puntualmente. Sia dunque
f (x) =
1
X
fn (x) :
n=1
1 6 come
nella dimostrazione della completezza di R:
100
Per la permanenza del segno si ha anche jf (x)j
g (x) ; quindi anche f è
sommabile.
Introduciamo ora le somme parziali della serie senza i moduli,
sk (x) =
k
X
fn (x) :
n=1
Avremo jsk (x) f (x)j 2g (x) ; dominante integrabile, e poiché sk (x) ! f (x)
puntualmente,
per il teorema della convergenza dominata ksk f k ! 0; cioè la
P1
serie n=1 fn converge in L1 , e per il criterio della Proposizione precedente L1
è completo.
Enunciamo in…ne il seguente fatto, che si può dimostrare combinando le
tecniche delle due dimostrazioni precedenti:
Proposizione 8.51 Da ogni successione ffn g di Cauchy in L1 , e quindi convergente a una certa f in L1 , si può estrarre una sottosuccessione che converge
a f anche in senso puntuale quasi ovunque.
8.10
Il teorema fondamentale del calcolo integrale
Tra le proprietà di base dell’integrale di Riemann che ancora non abbiamo rivisitato all’interno della teoria di Lebesgue ci sono i due teoremi fondamentali
del calcolo integrale, espressi rispettivamente dalle uguaglianze
Z
b
F 0 (x) dx = F (b)
F (a)
(8.4)
a
d
dx
Z
x
f (t) dt = f (x) :
(8.5)
a
Cominciamo dal secondo (che in e¤etti viene spesso dimostrato per primo).
Per l’integrale di Riemann sappiamo che l’ipotesi naturale sotto cui vale è che
f sia continua in [a; b]; allora per ogni x 2 [a; b] vale la (8.5). Ciò signi…ca che
questa fondamentale proprietà dell’integrale di Riemann viene stabilita quando la funzione integranda appartiene ad una classe ben più ristretta di quella
delle funzioni Riemann integrabili. Questa è certamente un’altra caratteristica insoddisfacente della teoria classica dell’integrazione ed in e¤etti, anche se
noi abbiamo motivato l’introduzione dell’integrale di Lebesgue con l’esigenza
di de…nire uno spazio di Banach di funzioni integrabili (munito di una norma
integrale), storicamente la principale motivazione di Lebesgue fu proprio quella
di de…nire un tipo di integrale per cui l’identità (8.5) potesse essere stabilita senza eccezioni per tutte le funzioni integrabili17 . Enunciamo quindi, senza
dimostrazione, il teorema che si può dimostrare nella teoria di Lebesgue:
1 7 Questo è proprio quanto scrive Lebesgue nella prima pagina dell’Introduzione alla sua tesi
del 1902 in cui introduce la nuova teoria della misura e dell’integrazione.
101
Teorema 8.52 Sia f 2 L1 [a; b] ; x0 2 [a; b] e sia
Z x
F (x) =
f (t) dt:
x0
Allora la funzione F è continua; inoltre per q.o. x 2 [a; b] la funzione F è
derivabile in x e per q.o. x vale F 0 (x) = f (x).
Qualche osservazione. Ricordiamo che una funzione f 2 L1 [a; b] è in realtà una classe d’equivalenza di funzioni, o se vogliamo è de…nita solo quasi
ovunque. Tuttavia, qualunque sia la particolare funzione f che noi Rscegliamo
x
come rappresentante della classe d’equivalenza, il valore dell’integrale x0 f (t) dt
non cambia, per x0 e x …ssati. Questo signi…ca che la funzione F (x) è de…nita
in modo univoco in ogni punto x 2 [a; b] (coerentemente al fatto che il teorema
dimostra che F è continua: alterando una funzione continua in un insieme di
misura nulla si trova in generale una funzione discontinua); invece la f può essere
alterata su insiemi di misura nulla. Il teorema a¤erma anzitutto che questa ben
de…nita funzione F è derivabile in quasi ogni punto di [a; b] ; meglio di questo
non si può sperare, cioè non possiamo aspettarci che F sia derivabile in ogni
punto, come mostra il prossimo semplice
Esempio 8.53
f (t) =
e
F (x) =
Z
1 per t 0
0 per t < 0
x
f (t) dt =
0
x per t 0
0 per t < 0:
La funzione F non è derivabile nel punto x = 0.
La seconda a¤ermazione del teorema consiste nell’uguaglianza F 0 (x) = f (x)
quasi ovunque. Di nuovo, meglio di questo non si può sperare, perché se anche
F 0 (x) esistesse ovunque, non potremmo garantire a priori che F 0 (x) sia uguale a
f (x) ovunque, dal momento che il valore f (x) può essere alterato in un insieme
di misura nulla senza cambiare la funzione F (x):
Esempio 8.54 Le funzioni
f1 (t) = 0 in [0; 1]
f2 (t) =
1 per t 2 Q
0 per t 2
=Q
sono rappresentanti diversi della stessa classe d’equivalenza, ossia sono la stessa
funzione L1 [0; 1]. Per questa funzione si ha
Z x
F (x) =
fi (t) dt = 0 (i = 1; 2) , e quindi
0
F 0 (x) = 0.
Come si vede F 0 (x) è uguale quasi ovunque a f2 (x) (mentre è uguale ovunque
a f1 (x)).
102
Le osservazioni precedenti mostrano che il risultato contenuto nel teorema
è ottimale. Del resto l’uguaglianza tra due funzioni L1 è per de…nizione una
uguaglianza quasi ovunque.
Veniamo ora all’altro teorema fondamentale del calcolo integrale, cioè la
(8.4). Nella teoria di Riemann si richiede che F 0 sia una funzione continua,
quindi che F 2 C 1 [a; b]; di nuovo, si chiede qualcosa che è più forte delle ipotesi
minime sotto le quali l’integrale di F 0 ha senso. D’altro canto la continuità di
F 0 non si può far cadere impunemente:
Esempio 8.55 Sia
F (x) =
1 per x 0
0 per x < 0:
Ovviamente esiste F 0 (x) = 0 per ogni x 6= 0 e la funzione F 0 (costante al di fuori
di un unico punto in cui non è de…nita) è Riemann integrabile, ma l’uguaglianza
(8.4) è falsa perché
Z 1
F 0 (x) dx = 0; mentre
1
F (1)
F ( 1) = 1:
Si osservi, per confronto, il prossimo esempio:
Esempio 8.56 Sia
F (x) = jxj
0
Anche in questo caso esiste F (x) = sgn (x) per ogni x 6= 0 e la funzione F 0 è
Riemann integrabile, anche se non è de…nita in x = 0 ed ha una discontinuità
a salto. Le ipotesi del teorema fondamentale del calcolo integrale (nella teoria
di Riemann) non sono veri…cate, quindi. Tuttavia l’uguaglianza (8.4) sussiste
in questo caso perché
Z 1
Z 0
Z 1
F 0 (x) dx =
1dx +
1dx = 1 + 1 = 0; e
1
F (1)
1
F ( 1) = 1
0
1 = 0:
Questo esempio, che nel contesto della teoria di Riemann è anomalo (pur
non contraddicendo alcun teorema), nella teoria di Lebesgue, come vedremo, è
inquadrato in modo naturale. Per orientarci su quali possano essere le ipotesi
minime per la validità di (8.4) ragioniamo così. Se F : R ! R è una funzione
per cui vale la (8.4) per ogni a; b; possiamo anche scrivere
Z x
F (x) = F (x0 ) +
F 0 (t) dt;
x0
il che signi…ca che F (x) è in tal caso la funzione integrale di una opportuna
funzione integrabile (la F 0 ); abbiamo visto d’altro canto (Teorema 8.52) che
103
la funzione integrale di una funzione integrabile è sempre una funzione continua; possiamo trarre quindi subito questa conseguenza: condizione necessaria
a¢ nché valga la (8.4) è che F sia una funzione continua dotata quasi ovunque
di derivata F 0 , con F 0 integrabile. Ci siamo così molto avvicinati alle ipotesi
e¤ettive che il primo teorema fondamentale del calcolo integrale richiede nella
teoria di Lebesgue. Per poter enunciare con precisione tale teorema occorre
prima introdurre una nuova nozione:
De…nizione 8.57 Sia f : [a; b] ! R. Si dice che f è assolutamente continua
in [a; b] (scriveremo f 2 AC [a; b]) se per ogni " > 0 esiste un > 0 tale che
per ogni successione di intervalli [an ; bn ] (n = 1; 2; 3; :::), contenuti in [a; b] ;
disgiunti tra loro, e aventi lunghezza complessiva < , ossia
1
X
n=1
si ha che
1
X
n=1
jbn
an j < ;
jf (bn )
f (an )j < ":
Questa nozione naturalmente implica la continuità, ma è più forte di essa.
Esempio 8.58 1. Se una funzione è Lipschitziana, cioè
jf (x1 )
f (x2 )j
L jx1
x2 j 8x1 ; x2 2 [a; b]
allora è assolutamente continua (…ssato " basta scegliere = "=L).
2. In particolare, se f 2 C 1 [a; b] allora f 2 AC [a; b] (perché ogni funzione
1
C è lipschitziana).
3. Le condizioni 1 o 2 non sono però necessarie a¢ nché f sia assolutamente
continua. Ad esempio, si dimostri per esercizio che
p
f (x) = x
è AC [0; 1] (mentre non è Lip[0; 1]).
3. Un esempio di funzione continua ma non assolutamente continua è il
seguente, in [0; 1]:
x sin x1 se x > 0
f (x) =
0 per x = 0:
Infatti: sia
ak =
1
; bk =
+ 2k
3
2
1
2
1
+ 2k
per k = 1; 2; 3; :::
Si ha:
1
X
k=1
jbk
ak j =
1
X
k=1
1
2
1
+ 2k
3
2
1
+ 2k
104
=
1
X
k=1
1
2
+ 2k
3
2
+ 2k
;
serie convergente, mentre
1
X
k=1
jf (bk )
f (ak )j =
1
X
1
2
k=1
1
+
+ 2k
3
2
1
+ 2k
;
serie divergente. Questo signi…ca che …ssato " = 1 e …ssato qualsiasi
possiamo rendere
1
X
jbk ak j <
> 0;
k=N
pur di scegliere un N opportunamente grande (il resto di una serie convergente
tende a zero), e tuttavia
1
X
k=N
jf (bk )
f (ak )j = 1:
La rilevanza del concetto di assoluta continuità nella teoria di Lebesgue è
dovuta anzitutto al seguente:
Teorema 8.59 Sia f 2 L1 [a; b] ; x0 2 [a; b] e
Z x
F (x) =
f (t) dt:
x0
Allora F 2 AC [a; b].
Il Teorema 8.52 già a¤ermava che F è continua e q.o. derivabile; apprendiamo ora che F è anche assolutamente continua. Poiché in base a tale teorema
è anche F 0 = f q.o., possiamo riscrivere
Z x
F (x) =
F 0 (t) dt
x0
e scopriamo così che se, a partire da una qualsiasi funzione f 2 L1 [a; b] ; costruiamo la funzione integrale F , questa risulta essere assolutamente continua e
soddisfa il primo teorema fondamentale del calcolo. Il fatto interessante è che
vale anche la proprietà inversa, ossia:
Teorema 8.60 Sia f 2 AC [a; b]. Allora f è derivabile per q.o. x 2 [a; b], la
funzione f 0 è L1 [a; b] e inoltre per ogni x0 ; x 2 [a; b] è
Z x
f (x) f (x0 ) =
f 0 (t) dt:
x0
Possiamo quindi concludere che le funzioni assolutamente continue sono tutte
e sole quelle che soddisfano il primo teorema fondamentale del calcolo integrale,
nella teoria di Lebesgue.
105
9
La teoria della misura astratta in probabilità
Dal nascere della teoria della misura e dell’integrazione moderna (Lebesgue 1902,
Carathéodory 1914), una delle prime applicazioni rilevanti della teoria nella sua
versione astratta (in cui cioè lo spazio non è necessariamente un sottoinsieme
di Rn e la misura è una misura “qualsiasi”) è stata quella al calcolo delle probabilità. Nel 1933 N. Kolmogorov diede al calcolo delle probabilità un fondamento
assiomatico che da allora è stato sistematicamente utilizzato. Lo scopo di questo
paragrafo è introdurre la terminologia probabilistica comunemente utilizzata ed
esempli…care, sui primi concetti e proprietà delle variabili aleatorie e del valore
atteso, i vantaggi dell’utilizzo della teoria della misura astratta. Naturalmente
l’importanza dell’impostazione di Kolmogorov va ben oltre le osservazioni elementari che faremo qui. Ulteriori approfondimenti in questa direzione si possono
trovare in [10], cap.9. Si segnala che i concetti di questo paragrafo non avranno
alcuna applicazione nel seguito del corso; lo scopo del paragrafo è semplicemente
fornire allo studente una chiave interpretativa di certe nozioni probabilistiche
che potrebbe aver incontrato altrove.
Uno spazio di probabilità è de…nito come uno spazio di misura ( ; M; P )
dove l’insieme
è lo spazio campionario, detto anche spazio degli eventi elementari, M è la -algebra degli eventi, P la misura di probabilità, e si assume
la condizione P ( ) = 1:
Una variabile aleatoria (abbreviato v.a.) sullo spazio è una qualsiasi funzione X : ! R, M-misurabile; si usano correntemente le seguenti scritture
abbreviate:
fX < tg indica l’insieme f! 2
: X (!) < tg ; per t 2 R,
e analoghi signi…cati hanno le scritture fX tg ; fX = tg ; fX 2 Ig per I
R. Una variabile aleatoria doppia sarà una funzione (X; Y ) :
! R2 , M2
misurabile, nel senso che per ogni aperto A di R risulti f(X; Y ) 2 Ag 2 M.
Analogamente si de…nisce una n-upla di variabili aleatorie (X1 ; X2 ; :::; Xn ),
detta anche vettore aleatorio.
Esempio 9.1 Lanciamo due dadi e guardiamo quanto fa la somma dei punti.
In questo caso
= f(h; k) : h; k = 1; 2; 3; 4; 5; 6g
M=P ( )
1
per ogni (h; k)
P f(h; k)g =
36
(cioè P è la probabilità uniforme su uno spazio campionario …nito). La somma
dei punti dei due dati è la variabile aleatoria
X:
!R
X (h; k) = h + k:
106
La X è ovviamente misurabile perché la -algebra è tutto P ( ). Questo è ciò che
capita sempre nel discreto: si può scegliere P ( ) come -algebra, per cui ogni
funzione X : ! R è una variabile aleatoria; la necessità di usare -algebre
non banali nasce dal continuo.
Vediamo come il formalismo della teoria astratta della misura e dell’integrazione interviene in modo importante nel concetto di valore atteso.
De…nizione 9.2 Sia ( ; M; P ) uno spazio di probabilità e X :
variabile aleatoria. Si de…nisce valore atteso di X il numero
Z
EX =
XdP;
! R una
se questo è …nito.
Dunque il valore atteso è de…nito semplicemente come integrale, ma attenzione: come integrale astratto sullo spazio campionario , non in generale come
integrale su R.
Esempio 9.3 Calcoliamo in base alla de…nizione il valore atteso della somma
del lancio dei due dadi (v. esempio precedente). Poiché
è …nito (con 36
elementi, ciascuno di probabilità 1=36) la X è una funzione semplice, e per
de…nizione il suo integrale si calcola così:
!
Z
6
6
6
X
1 X X
1
=
(h + k) =
EX =
XdP =
(h + k)
36
36
h=1
h;k=1
=
1
36
6
X
h=1
(6h + 21) =
k=1
1
(6 21 + 6 21) = 7:
36
Nelle presentazioni elementari del calcolo delle probabilità il valore atteso
di una v.a. non è de…nito a questo modo ma, dopo aver dato separatamente
le de…nizioni di v.a. discreta e v.a. continua, è de…nita in due modi diversi
per questi due tipi di variabili, usando rispettivamente una serie numerica o un
integrale su R. Vediamo come si recuperano le de…nizioni elementari in questo
quadro più generale. Premettiamo una semplice
Proposizione 9.4 Sia ( ; M; P ) uno spazio di probabilità e X : ! R una
variabile aleatoria. Se, per ogni insieme di Borel E 2 B (R) poniamo
PX (E) = P (X 2 E)
allora:
1. (R; B (R) ; PX ) è uno spazio di probabilità.
2. Per ogni funzione f : R ! R Borel misurabile si ha:
Z
Z
f (X) dP =
f dPX :
R
107
(9.1)
3. In particolare,
EX =
Z
tdPX (t) :
R
Dimostrazione. Per provare 1, osserviamo che se fEn g è una successione di
insiemi di Borel in R a due a due disgiunti, si ha:
!
(
)!
!
1
1
1
[
[
[
PX
En = P
X2
En
=P
fX 2 En g
n=1
n=1
=
1
X
n=1
n=1
P fX 2 En g =
1
X
PX (En ) :
n=1
Proviamo la 2 anzitutto per f = E dove E 2 B (R) : Si ha:
Z
Z
(X)
dP
=
P
(X
2
E)
=
P
(E)
=
E
X
E dPX :
R
Per linearità, la (9.1) risulta allora veri…cata per ogni funzione semplice f ; per
continuità, risulta veri…cata per ogni funzione misurabile f .
R La 3 è semplicemente la 2 applicata alla funzione f (t) = t; perché EX =
XdP:
La misura di probabilità PX si dice distribuzione di X. Chiediamoci ora
che aspetto concreto ha la distribuzione di una variabile aleatoria. E’ qui che
si ritrova il legame con i concetti introdotti nelle presentazioni elementari del
calcolo delle probabilità. Infatti: se X è una v.a. discreta, ossia è un insieme
…nito o numerabile, e quindi X può assumere solo un numero …nito o numerabile
1
di valori fxk gk=1 (spesso in questi casi X è una variabile che conta oggetti di
qualche tipo, e i valori xk sono semplicemente 0; 1; 2; 3:::), si ha:
X
PX (E) =
P (X = xk ) :
xk 2E
I numeri pX (xk ) = P (X = xk ) de…niscono completamente la distribuzione PX .
1
Si dice anche che la successione fpX (xk )gk=1 è la densità discreta di X. Si ha
naturalmente:
pX (xk )
1
X
0 8k
pX (xk ) = 1:
k=1
In questo caso il valore atteso di X si calcola, per il punto 3 delle Proposizione
precedente,
Z
1
X
EX =
tdPX (t) =
xk pX (xk ) ,
R
k=1
se questa serie converge.
108
Esempio 9.5 Calcoliamo di nuovo il valore atteso della somma di due dadi,
usando ora questa proprietà. La v.a. X (h; k) = h + k assume i valori
2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12;
con probabilità, rispettivamente, pari a
1 2 3 4 5 6 5 4 3 2 1
; ; ; ; ; ; ; ; ; ; :
36 36 36 36 36 36 36 36 36 36 36
Perciò
EX = 2
1
2
3
4
5
6
+3
+4
+5
+6
+7
+
36
36
36
36
36
36
5
4
3
2
1
+8
+9
+ 10
+ 11
+ 12
=7
36
36
36
36
36
ma si osservi che in questo caso è più semplice calcolare il valore atteso come
integrale astratto di X su piuttosto che usando la densità discreta di X.
Una v.a. continua X su ( ; M; P ) è per de…nizione una v.a. la cui distribuzione PX è una misura su R dotata di densità rispetto alla misura di
Lebesgue in R. In altre parole, esiste una funzione fX : R ! [0; +1) Borel
misurabile, detta densità di X, tale che
Z
PX (E) =
fX (t) dt per ogni E 2 B (R) .
E
Dev’essere, naturalmente,
Z
fX (t) dt = 1:
R
In questo caso il valore atteso si calcola, per il punto 3 della proposizione
precedente:
Z
Z
EX =
tdPX (t) =
tfX (t) dt;
R
R
in quanto dPX (t) = fX (t) dt.
Nella presentazione elementare del calcolo delle probabilità, solitamente le
v.a. continue sono introdotte direttamente mediante la loro densità, spesso senza
neppure precisare quale sia lo spazio di probabilità soggiacente. Ad esempio, si
dice: “Sia T il tempo di vita di una lampadina, e supponiamo che T abbia legge
esponenziale di parametro ”, intendendo con questo il fatto che
fT (t) =
e t per t > 0
0 per t 0:
Si noti che con questo abbiamo in sostanza speci…cato come si fa a calcolare
P (T 2 E) senza de…nire esplicitamente lo spazio
e la funzione T : ! R:
Potremmo ad esempio pensare che sia l’insieme di tutte le lampadine esistenti,
esistite e che esisteranno, e T sia la funzione che associa a ciascuna di queste il
109
suo tempo di vita. Si tratterebbe di de…nire in qualche modo la probabilità su
, ma comunque fX (t) risulterebbe come sopra. Come si vede, ai …ni pratici
speci…care lo spazio è in questi casi inutile, perciò non lo si fa.
Vediamo ora come l’utilizzo della teoria dell’integrazione astratta intervenga
nella dimostrazione delle proprietà del valore atteso. Ad esempio: il valore
atteso è lineare, cioè se X; Y sono due v.a. dotate di valore atteso …nito, allora
E (X + Y ) = EX + EY:
Nelle presentazioni elementari della probabilità, questa proprietà viene enunciata separatamente per v.a. discrete e continue, e dimostrata separatamente
(utilizzando serie numeriche o integrali). Si noti anzitutto che nell’impostazione
assiomatica della probabilità il concetto di v.a. è più generale rispetto a quella
di v.a. discreta o continua (la distribuzione di X potrebbe essere una misura
né discreta né dotata di densità, ma ad esempio un misto delle due cose). In
secondo luogo, la linearità del valore atteso segue semplicemente dalla linearità
dell’integrale astratto:
Z
Z
Z
E (X + Y ) =
(X + Y ) dP =
XdP +
Y dP = EX + EY:
La dimostrazione di questa proprietà usando le densità sarebbe invece più
tortuosa: nel caso continuo, ad esempio, si tratta di provare che
Z
Z
Z
E (X + Y ) =
tfX+Y (t) dt =
tfX (t) dt + tfY (t) dt = EX + EY (9.2)
R
R
R
cosa non ovvia perché fX+Y (t) 6= fX (t) + fY (t): la densità della somma non è
uguale alla somma delle densità, ma alla convoluzione delle densità:
Z
fX+Y (x) =
fX (x t) fY (t) dt:
(9.3)
R
Quindi bisogna prima provare la (9.3), e poi il fatto che da questo segua la (9.2).
Veniamo all’altra proprietà importante del valore atteso, legato al concetto
di indipendenza.
Ricordiamo che due v.a. X1 ; X2 si dicono indipendenti se
P (X1 2 E1 e X2 2 E2 ) = P (X1 2 E1 ) P (X2 2 E2 )
(9.4)
per ogni coppia di insiemi di Borel E1 ; E2 in R. Si può introdurre la distribuzione
della v.a. doppia (X1 ; X2 ) come la misura di probabilità su R2 de…nita da
P(X1 ;X2 ) (E) = P ((X1 ; X2 ) 2 E)
per ogni insieme di Borel E R2 .
Se X1 ; X2 sono indipendenti allora la distribuzione di (X1 ; X2 ) è la misura
prodotto delle distribuzioni PX1 ; PX2 , in simboli:
P(X1 ;X2 ) = PX1 PX2
110
che signi…ca proprio la (9.4) e implica che negli integrali doppi risulta:
dP(X1 ;X2 ) (t1 ; t2 ) = dPX1 (t1 ) dPX2 (t2 )
(9.5)
Si può provare per le variabili aleatorie doppie una proposizione analoga a
quella prima dimostrata, ossia: per ogni funzione f : R2 ! R Borel misurabile
si ha:
Z
Z
f (X1 ; X2 ) dP =
f dP(X1 ;X2 ) :
R2
In particolare,
E (X1 X2 ) =
Z
R2
t1 t2 dP(X1 ;X2 ) (t1 ; t2 ) :
(9.6)
Si ottiene subito allora la proprietà fondamentale sul valore atteso del prodotto di variabili aleatorie: se due v.a. X1 ; X2 sono indipendenti (e hanno valore
atteso …nito), allora
E (X1 X2 ) = EX1 EX2 :
Infatti per (9.5), (9.6) si ha
Z
Z
E (X1 X2 ) =
t1 t2 dP(X1 ;X2 ) (t1 ; t2 ) =
t1 t2 dPX1 (t1 ) dPX2 (t2 )
2
R2
ZR
Z
=
t1 dPX1 (t1 ) t2 dPX2 (t2 ) = EX1 EX2 :
R
R
Di nuovo, la dimostrazione di questa proprietà utilizzando le densità sarebbe
meno immediata, richiederebbe tecniche diverse nel caso discreto e continuo, e
non coprirebbe il caso generale di variabili né discrete né continue.
10
10.1
Misure di Hausdor¤
Misura e dimensione di Hausdor¤
Abbiamo visto che la misura di Lebesgue in Rn estende la misura elementare,
cioè ad esempio la lunghezza in R, l’area in R2 e il volume in R3 . Ma, anche dal
punto di vista elementare, noi siamo talvolta interessati a calcolare la lunghezza
non di un sottoinsieme della retta, ma di un arco di curva nel piano o nello
spazio, oppure l’area non di un sottoinsieme del piano, ma di una super…cie
nello spazio. In altre parole, un problema naturale che non abbiamo ancora
a¤rontato è quello di misurare sottoinsiemi di Rn aventi dimensione minore di
n (come sono ad esempio le curve o le super…ci regolari in R3 ), usando una
misura appropriata alla loro dimensione (ad es. la lunghezza, cioè una misura
unidimensionale, per una curva, anche se è immersa in uno spazio ambiente
di dimensione 2 o 3). A questo problema risponde il concetto di misura di
Hausdor¤ s-dimensionale in Rn , che ora introduciamo.
Cominciamo dalla seguente precisazione: se C
Rn è un qualsiasi insieme
limitato, si dice diametro di E il numero
diam (C) = sup fjx
111
yj : x; y 2 Eg .
De…nizione 10.1 Sia A Rn un sottoinsieme qualsiasi, e s un numero reale
non negativo …ssato. Per ciascun
0 de…niamo
8
9
1
1
s
<X
=
[
diam (Cj )
H s (A) = inf
(s)
:A
Cj ; diam (Cj )
(10.1)
:
;
2
j=1
j=1
dove
s=2
(s) =
e
è la funzione di Eulero de…nita da
s
2
+1
R1
(t) = 0 e
x t 1
x
dx:
Qualche spiegazione. La costante (s) ha il seguente signi…cato geometrico.
Se s = n, la misura di Lebsegue di una sfera di raggio r in Rn è uguale18 a
(n) rn . Se fosse s = n e uno degli insiemi Cj che compaiono nella (10.1) fosse
una sfera B (x; r) di raggio r, si avrebbe
(n)
diam (Cj )
2
n
=
(n) rn = vol (B (x; r)) :
L’idea della de…nizione precedente è allora la seguente. Vogliamo de…nire la
misura s-dimensionale di un insieme A in Rn . Ricopriamo per prima cosa l’insieme con unioni numerabili di insiemi generici, di cui ciò che conta è soltanto il diametro; di ognuno di questi insiemi, e quindi della loro unione, calcoliamo non il volume, ma una misura s-dimensionale, espressa dalla quantità
s
diam (Cj )
(s)
e dalla somma di questi numeri. Prendiamo in…ne l’estremo
2
S1
inferiore delle misure così ottenute. Per costringere però la copertura j=1 Cj
a “seguire la forma” dell’insieme A, imponiamo che i diametri degli insiemi
Cj siano tutti minori di un …ssato, che immaginiamo piccolo. Spieghiamo il
signi…cato di questa richiesta col prossimo
Esempio 10.2 Sia A
R2 la poligonale di 2 lati aventi vertici (1; 0) ; (0; 0) ; (0; 1)
1 8 Per la spiegazione di questo fatto e qualche dettaglio sulla funzione Gamma di Eulero, si
veda [5], §§ 5.1-5-2.
112
(…g.1).
…g.1
…g.2
Proviamo a misurare la lunghezza di A (che è uguale a 2) usando la precedente
de…nizione di H 1 . Se = 1 possiamo coprire ciascun segmento con un cerchio
di diametro 1 (…g. 2), e troviamo
A
con diam(C1 ) =diam(C2 ) = 1,
2
X
(1)
j=1
C1 [ C2
(1) = 2, perciò
diam (Cj )
2
1
=2
1 1
+
2 2
= 2:
Se decidessimo di ricoprire la poligonale con 4 cerchi di diametro 1=2 ciascuno
(…g.3), otterremmo
4
X
j=1
(1)
diam (Cj )
2
1
=2
1 1 1 1
+ + +
4 4 4 4
= 2:
Si capisce perciò che 2 l’estremo inferiore dei valori che possiamo ottenere con
questo tipo di coperture. Se non avessimo però imposto la condizione diam(Cj )
avremmo potuto p
ricoprire l’intera poligonale con un unico cerchio C di centro
1 1
;
e
diametro
2 (…g.4), trovando
2 2
(1)
diam (C)
2
1
113
=2
p
2 p
= 2,
2
un risultato inferiore, che non esprime la vera lunghezza della poligonale.
…g.3
…g.4
Immaginiamo ora di ripetere la costruzione per una poligonale A i cui vertici
sono ( ; 0) ; (0; 0) ; (0; ), e è molto piccolo. Per trovare la corretta lunghezza
della poligonale dovremmo imporre il vincolo diam(Cj )
per questo . Si
capisce quindi che per avere una de…nizione di misura s-dimensionale che funzioni per ogni insieme occorre far tendere a zero il numero nella de…nizione
di H s . Questo è esattamente quello che si fa:
De…nizione 10.3 Sia A Rn un sottoinsieme qualsiasi, e s un numero reale
non negativo …ssato. Si pone:
H s (A) = lim H s (A) :
!0
Il limite precedente esiste (…nito o +1) perché la funzione 7! H s (A) è
decrescente: diminuendo diminuiscono le famiglie di coperture ammissibili,
quindi l’estremo inferiore aumenta.
La quantità H s (A) viene detta misura di Hausdor¤ s-dimensionale di A in
n
R . A dispetto del nome, non è esattamente una misura, come ora chiariremo.
Notiamo esplicitamente che questo numero è stato de…nito per ogni sottoinsieme
A di Rn e per ogni numero reale s 0; anche non intero.
Enunciamo senza alcuna dimostrazione le proprietà fondamentali di H s ,
rimandando per approfondimenti a [8], Chap.1.
Teorema 10.4 Per ogni s
su Rn , in altre parole
0, la funzione d’insieme H s è una misura esterna
H s : P (Rn ) ! [0; +1]
è numerabilmente subadditiva: per ogni successione di sottoinsiemi Ak
(k = 1; 2; 3; :::) si ha:
!
1
1
[
X
s
H
Ak
H s (Ak ) :
k=1
k=1
114
Rn
Si può utilizzare la costruzione di Carathéodory già descritta nella de…nizione
della misura di Lebesgue in Rn per ottenere a partire da questa misura esterna
una vera misura: è su¢ ciente selezionare tra tutti i sottoinsiemi di Rn quelli
per cui vale la condizione
H s (E) = H s (E \ T ) + H s (E \ T c ) 8T
Rn .
Questi insiemi si diranno H s -misurabili.
Teorema 10.5 Per ogni s
0, la famiglia degli insiemi H s -misurabili in Rn
è una -algebra, contenente la -algebra di Borel. La funzione H s ristretta a
questa -algebra è una misura, che continuiamo a indicare col simbolo H s .
Siamo quindi riusciti a de…nire un concetto di misura s-dimensionale per una
vasta classe di sottoinsiemi di Rn (in particolare, tutti i boreliani) e per ogni
s 0 (anche non intero!). Che aspetto avrà questa misura per i diversi valori
di s? Anzitutto si può provare quanto segue:
Teorema 10.6 Per s = 0 la misura H s è la misura del conteggio.
Per s = n la misura H s è la misura di Lebesgue in Rn .
Per s > n la funzione H s è identicamente nulla.
Per ogni s, la misura H s è invariante per rototraslazioni, e soddisfa l’omogeneità:
H s ( E) = s H s (E) per ogni > 0.
Si può anche dimostrare che per valori interi la misura H s coincide con
quanto ci aspettiamo, ad esempio: se è un arco di curva di classe C 1 nello
spazio R3 , H 1 ( ) coincide con la lunghezza d’arco. Una delle motivazioni per
introdurre la misura di Hausdor¤, tuttavia, è proprio quella di poter misurare
anche oggetti geometrici molto meno regolari.
Poniamoci ora dal seguente punto di vista. Immaginiamo un sottoinsieme
A
Rn molto irregolare, per il quale non sia evidente qual è la dimensione
naturale. In altre parole, per quale s è naturale misurare H s (A)? Il prossimo
teorema chiarisce la situazione che si può veri…care:
Teorema 10.7 Sia A Rn e 0 s < t n:
1. Se H s (A) < 1; allora H t (A) = 0:
2. Se H t (A) > 0; allora H s (A) = 1:
Intuitivamente: se un oggetto geometrico ha misura unidimensionale …nita,
ad esempio è un segmento, la sua area sarà zero; se ha area positiva, ad esempio
è un cerchio, la sua lunghezza (pensandola come linea) sarà in…nita.
La precedente proprietà o¤re la possibilità di de…nire la dimensione di A:
De…nizione 10.8 Sia A
Rn . Si de…nisce dimensione di Hausdor¤ di A il
numero
Hdim (A) = inf fs 0 : H s (A) = 0g .
115
Notiamo che per ogni A Rn risulta Hdim (A) n e che:
per ogni s > Hdim (A) è H s (A) = 0; e
per ogni s < Hdim (A) è H s (A) = 1.
Notiamo esplicitamente che Hdim (A) = s non implica che H s (A) < 1, ad
esempio una retta ha dimensione 1 ma misura unidimensionale in…nita.
Ri‡ettendo sugli esempi più comuni di sottoinsiemi dello spazio è naturale
chiedersi: esistono insiemi la cui dimensione di Hausdor¤ non è intera? La
risposta è a¤ermativa, e questi insiemi si dicono frattali.
Esempio 10.9 (La curva di Koch) Consideriamo la seguente curva nel piano, costruita con un procedimento iterativo. Al passo 0 consideriamo il segmento [0; 1] contenuto nell’asse x, nel piano xy. Al passo 1, dividiamo il segmento
in 3 parti uguali, rimuoviamo il terzo centrale, e al suo posto inseriamo due
segmenti di lunghezza 1=3, ottenendo complessivamente una poligonale 1 fatta
da 4 segmenti di lunghezza 1=3 ciascuno, quindi la poligonale ha lunghezza 4=3.
Al passo 2 suddividiamo ognuno dei 4 intervallini in 3 parti uguali, rimuoviamo
il terzo centrale e lo sostituiamo con 2 intervallini di lunghezza 1=9 ciascuno, ottenendo complessivamente una poligonale 2 fatta da 42 segmenti di lunghezza
2
1=32 ciascuno, quindi la poligonale ha lughezza (4=3) . Procediamo iterativamente a questo modo. Al passo n la poligonale n è costituita da 4n intervallini
n
di lunghezza 1=3n ciascuno, quindi ha lunghezza totale (4=3) .
Si può dimostrare che f n g è una successione di curve continue nel piano, che
1
cioè si possono parametrizzare nella forma f(xn (t) ; yn (t))gn=1 con xn ; yn :
[0; 1] ! R continue, e la successione converge uniformemente a una curva limite (t) = (x (t) ; y (t)), continua, che si dice “curva di Koch”, o “curva …occo
di neve”. Il procedimento iterativo con cui è stata costruita
dà alla curva
limite quella caratteristica di “autosimilarità” tipica degli insiemi frattali: un
particolare della curva, messo sotto il microscopio, assomiglia alla curva tutta
116
n
intera. Poiché n ha lunghezza (4=3) , si capisce che avrà lunghezza in…nita.
In e¤ etti non è un insieme di dimensione 1. Calcoliamone la dimensione di
Hausdor¤ . Al passo n-esimo della costruzione, il modo naturale di ricoprire n
in modo “accurato” consiste nel coprire ogni segmentino di lunghezza 1=3n con
un cerchio di diametro 1=3n ; occorreranno in tutto 4n cerchi Cj di questo tipo,
e si otterrà, per qualsiasi s …ssato,
n
4
X
j=1
(s)
diam (Cj )
2
s
=
(s) 4n
1
2 3n
s
=
(s)
2s
4
3s
n
:
Al crescere di n la copertura richiesta è sempre più …ne, e occorre fare il limite
per n ! 1 della quantità appena scritta. La domanda ora è: per quale valore
di s si ha che
n
(s) 4
lim
n!1 2s
3s
è …nito e diverso da zero? Dovrà essere 34s = 1, cioè s = log3 4. Questo numero
è la dimensione di Hausdor¤ della curva di Koch:
Hdim ( ) = log3 4 ' 1:2619:
Questa dimensione è maggiore di 1, a riprova del fatto che questa curva è “talmente intricata” da essere un oggetto di dimensione maggiore della dimensione
naturale di una curva; la dimensione è anche minore di 2, dimensione dello
spazio ambiente. L’insieme è un frattale.
10.2
La misura (n
metrico
1)-dimensionale e il problema isoperi-
Tra le misure di Hausdor¤, una molto usata in Rn è la H n 1 , che è l’analogo della
misura di super…cie in R3 . Se ad esempio A Rn è un aperto limitato la cui
frontiera @A è regolare, sarà Hdim (@A) = n 1, perciò H n 1 è la misura naturale
sul bordo dei sottoinsiemi “ragionevoli” di Rn . La misura H n 1 compare ad
esempio negli integrali di bordo che sono coinvolti nel teorema della divergenza
in Rn (su cui ritorneremo quando studieremo gli spazi di Sobolev):
Z
Z
divF (x) dx =
F ne dH n 1 (x) :
A
@A
Un altro fatto importante che coinvolge la misura H n 1 è la disuguaglianza isoperimetrica, su cui ora spenderemo qualche parola. Un problema molto
antico19 è il seguente: qual è, tra tutte le …gure geometriche piane, quella che,
a pari perimetro, racchiude l’area massima? La risposta, piuttosto naturale, è:
il cerchio. Analogamente, tra tutti i solidi, quello che, a parità di area della
super…cie laterale, racchiude il volume massimo, è la sfera. Questi enunciati
1 9 Risale
almeno a Zenodoro, matematico greco del 3 secolo a.C.
117
sono tanto intuitivi quanto di¢ cili da dimostrare rigorosamente. Anzitutto infatti bisognerebbe chiarire chi sono “tutte le …gure piane”, ossia qual è l’insieme
di oggetti geometrici tra cui a¤ermiamo che il cerchio ha la proprietà di massimo che abbiamo espresso. Di ciascuna “…gura ammissibile” dobbiamo essere
in grado di misurare area e perimetro, quindi la de…nizione della classe delle
…gure ammissibili dipende da quale teoria della misura si adotta. Si intuisce
che la risoluzione rigorosa di questo problema non poteva essere alla portata
dei greci che se lo posero 2300 anni fa. La teoria della misura del 20 secolo
ha permesso di a¤rontare rigorosamente questo problema, anche nel caso più
generale dei sottoinsiemi di Rn . Come “volume” di A considereremo la misura
di Lebesgue di A in Rn , che indichiamo con jAj. Come “area della super…cie
laterale” di A considereremo H n 1 (@A). Una formulazione quantitativa della
disuguaglianza isoperimetrica si può ottenere a questo modo. Consideriamo il
quoziente adimensionato:
(n 1)=n
jAj
Hn
J (A) =
1
:
(@A)
Diciamo che è adimensionato in quanto J ( A) = J (A) per ogni dilatazione
> 0: Il quoziente, in altre parole, dipende solo dalla forma dell’insieme A ma
non dalle sue dimensioni assolute. La disuguaglianza isoperimetrica a¤erma che
J (A) è massimo quando A è una sfera. Calcoliamo il valore di J (A) quando
A = B (0; r) è una sfera di raggio r. Si ha:
Hn
1
(n) rn
jB (0; r)j =
(n) nrn
(@B (0; r)) =
1
(la misura del bordo della sfera è la derivata del volume rispetto al raggio).
Quindi
(n 1)=n
J (B (0; r)) =
(n 1)=n
jB (0; r)j
[ (n) rn ]
=
H n 1 (@B (0; r))
(n) nrn
=
1
1
1=n
(n)
n
:
Pertanto la disuguaglianza isoperimetrica a¤erma:
(n 1)=n
jAj
Hn
1
1
1=n
(@A)
(n)
n
:
Enunciamo un risultato preciso:
Teorema 10.10 Per ogni insieme A di Borel in Rn , di misura di Lebesgue jAj
…nita, vale la disuguaglianza:
Hn
1
(@A)
1=n
(n)
(n 1)=n
n jAj
:
Questo si può esprimere anche dicendo che il funzionale di insieme
J : B (Rn ) ! [0; 1)
1=n
ammette massimo 1= (n)
sfere.
n; e il massimo è assunto in corrispondenza delle
118
La forma in cui abbiamo enunciato questo teorema non è la migliore possibile.
Il risultato preciso in questa direzione è il teorema dimostrato da Ennio De
Giorgi nel 1958, che stabilisce la proprietà isoperimetrica della sfera in una
classe più ampia di insiemi, precisamente quelli di perimetro …nito, una nozione
introdotta dallo stesso De Giorgi e oggi comunemente utilizzata nella teoria
geometrica della misura. Per un insieme A di perimetro P (A) …nito si ha
sempre H n 1 (@A) P (A), perciò la disuguaglianza di De Giorgi,
P (A)
1=n
(n)
(n 1)=n
n jAj
implica quella che abbiamo sopra enunciato. Si osservi che il risultato di De
Giorgi contiene quindi la soluzione generale di un problema che era aperto da
2300 anni, una soluzione resa possibile dagli sviluppi della teoria della misura, e
successivamente della teoria geometrica della misura, nella prima metà del ’900.
10.3
Misure e distribuzioni di carica
Abbiamo studiato il concetto astratto di misura, ma abbiamo anche incontrato,
in Rn , esempi concreti signi…cativi di misura:
la misura di Lebesgue n-dimensionale;
le misure di Hausdor¤ s-dimensionali;
le misure de…nite da una densità rispetto alla misura di Lebesgue, cioè
d (x) = f (x) dx con f 0 misurabile;
le misure concentrate, tipo “massa di Dirac”.
Vediamo un esempio di situazione …sica in cui queste varie misure sono coinvolte. Supponiamo di studiare il problema elettrostatico di determinare il potenziale del campo generato da una certa distribuzione di cariche elettriche nello
spazio. Dal punto di vista …sico, le cariche elettriche possono essere:
-cariche puntiformi;
-cariche distribuite lungo …li materiali;
-cariche distribuite su super…ci materiali;
-cariche distribuite nello spazio tridimensionale (come in un gas ionizzato, o
in una soluzione elettrolitica).
Nelle trattazioni matematicamente elementari queste situazioni vengono affrontate separatamente, sfruttando concetti diversi: per la carica puntiforme
è comodo trattare direttamente la carica, senza introdurre una funzione densità; per una carica distribuita nello spazio si introduce una funzione densità
volumica, il cui integrale triplo in una certa regione assegna la carica totale
contenuta in quella regione; per …li e super…ci regolari bisogna introdurre una
densità lineare e super…ciale, speci…cando che di quella funzione andrà calcolato
un integrale di linea o di super…cie. Il concetto matematico di misura consente
di fare unità tra tutte queste situazioni:
la distribuzione di una carica è sempre espressa da una misura , in modo
tale che la quantità totale di carica contenuta in una regione A qualsiasi dello
spazio sia pari a (A). Questa misura potrà essere a sua volta somma di vari
addendi:
119
-una carica distribuita in una regione tridimensionale sarà espressa da una
misura
f (x) dx
con f densità volumica, e dx misura di Lebesgue in R3 ;
-una carica distribuita lungo una super…cie sarà espressa da una misura
di Hausdor¤ bidimensionale concentrata lungo , quindi
(x) (x) dH 2 (x)
con
densità super…ciale (e
è la funzione caratteristica di );
-una carica distribuita lungo una curva sarà espressa da una misura di
Hausdor¤ unidimensionale concentrata lungo , quindi
(x) (x) dH 1 (x)
con
densità lineare (e
è la funzione caratteristica di );
-un sistema di cariche puntiformi q1 ; q2 ; :::; qn collocate nei punti x1 ; x2 ; :::; xn
sarà espresso da una combinazione lineare di misure di Dirac, del tipo
n
X
qi
xi
(x) :
i=1
In de…nitiva, potremo esprimere la densità di carica in tutto lo spazio con
un’unica misura
d (x) = f (x) dx +
(x) (x) dH 2 (x) +
(x) (x) dH 1 (x) +
n
X
qi
xi
(x) :
i=1
In ogni regione A dello spazio, di forma e dimensione qualsiasi, la quantità totale
di carica sarà data da (A).
Ricordando ora che l’equazione soddisfatta dal potenziale elettrostatico u in
presenza di una densità di carica (continua) f è l’equazione di Poisson
u = f;
possiamo pensare di formalizzare il problema della ricerca del potenziale elettrostatico dovuto ad una distribuzione di carica di tipo generale mediante un’equazione di Poisson con termine noto misura,
u= ;
ma come andrà intesa quest’equazione? Cosa signi…cherà a¤ermare che u risolve l’equazione? Questi ed altri problemi spinsero il matematico francese
Laurent Schwarz, verso il 1950, a creare la teoria delle distribuzioni che, prendendo a prestito il nome proprio da problemi …sici di questo tipo, introdusse
una signi…cativa generalizzazione del concetto di funzione, derivata, soluzione
di un’equazione di¤erenziale. In questo quadro funzioni e misure sono particolari distribuzioni, un concetto più generale che racchiude questi ed altri oggetti
matematici.
120
11
11.1
Spazi Lp
Gli spazi Lp ( ) per 1 < p < 1
Sia ( ; M; ) uno spazio di misura, con misura completa. Oltre allo spazio
L1 ( ) delle funzioni sommabili, è utile in molte questioni introdurre spazi di
funzioni misurabili una cui opportuna potenza è sommabile. Diamo anzitutto
la seguente
De…nizione 11.1 Per p 2 [1; 1); poniamo
Lp ( ) =
f:
! R misurabile :
Z
p
jf (x)j f (x) < 1 :
Per p = 1 ritroviamo lo spazio L1 ( ) già introdotto, delle funzioni Lebesguesommabili.
p
Chiediamoci: la richiesta che risulti jf j sommabile per qualche p > 1 è più
forte o più debole rispetto a jf j sommabile? In generale le due richieste non
sono confrontabili:
Esempio 11.2 La funzione f (x) = 1=x sta in Lp (1; +1) per p > 1 ma non
per p = 1; invece f (x) = 1=x log2 x sta in L1 (0; 1=2) ma non sta in Lp (0; 1=2)
per nessun p > 1.
Dunque questi spazi non soddisfano reciproche inclusioni banali, in generale.
Approfondiremo in seguito questo punto.
Gli spazi Lp ( ) sono vettoriali anche per p > 1 (per p = 1 lo sappiamo
già). Infatti la combinazione lineare di funzioni misurabili è misurabile, e vale
la disuguaglianza
p
p
p
jf + gj
2p (jf j + jgj ) ;
perciò se f; g 2 Lp ( ) anche f + g 2 Lp ; con
Z
Z
Z
p
p
p
p
jf + gj d
2
jf j d +
jgj d
< 1:
(11.1)
Vorremmo renderli spazi vettoriali normati. E’chiaro che la norma naturale
è (se vogliamo soddisfare l’omogeneità):
kf kLp (
)
=
Z
1=p
p
jf j d
.
(Nel seguito scriveremo spesso kf kp per indicare kf kLp ( ) , quando non c’è pericolo di confusioni). Questa “candidata norma”soddisfa la proprietà di positività
(pur di identi…care come di consueto funzioni tra loro uguali quasi ovunque) e
quella di omogeneità della norma. La disuguaglianza triangolare non è però
121
immediata da dimostrare, perché dalla (11.1) segue
Z
1=p
p
jf + gj d
2
2
Z
" Z
p
jf j d +
Z
1=p
p
jgj d
1=p
p
jf j d
+
Z
1=p
p
jgj d
#
;
col che avremmo ottenuto una disuguaglianza di tipo triangolare ma con una
costante 2 a secondo membro, il che non va bene. Per dimostrare una disuguaglianza triangolare “pulita”occorre un argomento più ra¢ nato. Cominciamo
a dimostrare la seguente disuguaglianza, che ha molte applicazioni:
Teorema 11.3 (Disuguaglianza di Hölder) Siano p; q 2 (1; 1) tali che
1 1
+ =1
p q
(due numeri con queste proprietà si dicono esponenti coniugati). Se f 2 Lp ( )
e g 2 Lq ( ) ; allora f g 2 L1 ( ) e vale la disuguaglianza (di Hölder)
Z
jf gj d
kf kp kgkq :
Prima di proseguire, prendiamo con…denza col concetto di esponenti coniugati. A¢ nché valga la relazione p1 + 1q = 1; più grande è p più piccolo dev’essere
q; in particolare, 2 è il coniugato di se stesso; se 1 < p < 2 il suo coniugato q
soddisfa 2 < q < 1. Ad esempio, il coniugato di p = 3 > 2 è q = 23 < 2: Per
p ! 1+ ; q ! +1. Dalla relazione 1q = 1 p1 ricaviamo:
q=
p
p
1
e anche
pq = p + q:
Per provare la disuguaglianza di Hölder si fa uso della seguente disuguaglianza numerica
Lemma 11.4 (Disuguaglianza di Young) Per ogni a; b
ab
0; si ha
ap
bq
+
p
q
se p; q sono esponenti coniugati.
Dimostrazione della disuguaglianza di Young. Consideriamo la funzione
di due variabili
ap
bq
p + q
f (a; b) =
:
ab
122
Nel primo quadrante a > 0; b > 0 la funzione è positiva, cerchiamo il suo minimo.
Si trova
ap bq bq ap
rf (a; b) =
;
qa2 b
pab2
che si annulla dove ap = bq , punti in cui è
ap
p=q
f a; a
=
1
p
1
q
+
aap=q
= ap
1 p=q
= a0 = 1.
Si veri…ca che questo è e¤ettivamente un punto di minimo, perciò f (a; b) 1,
che è quanto volevamo provare.
Dimostrazione della disugualianza di Hölder. Applicando la disuguaglianza di Young ai numeri:
jf (x)j
jg (x)j
;b =
a=
kf kp
kgkq
per ogni x 2
Z
e integrando in
jf g (x)j
d
kf kp kgkq
abbiamo
!
p
q
jf (x)j
jg (x)j
d
p +
q
p kf kp
q kgkq
Z
Z
1
1
p
q
jf (x)j d +
jg (x)j d
=
p
q
p kf kp
q kgkq
1
1
1 1
p
q
=
+ =1
p kf kp +
q kgkq =
p q
p kf kp
q kgkq
Z
ossia
Z
jf g (x)j
d
kf kp kgkq
1
e quindi la tesi.
Utilizzando il risultato precedente possiamo ora dimostrare la disuguaglianza
triangolare della norma Lp :
Teorema 11.5 (Disuguaglianza di Minkowski) Per ogni p 2 [1; +1); f; g 2
Lp ( ) vale la disuguaglianza
kf + gkp
kf kp + kgkp :
Dimostrazione. Per p = 1 lo sappiamo già. Per p 2 (1; 1) scriviamo:
p
p 1
jf + gj = jf + gj jf + gj
p 1
(jf j + jgj) jf + gj
e quindi
p
kf + gkp =
Z
p
jf + gj d
Z
p 1
jf j jf + gj
123
d +
Z
p 1
jgj jf + gj
d :
Ora in ciascuno degli integrali a secondo membro applichiamo la disuguaglianza
p 1
di Hölder, sfruttando il fatto che f; g 2 Lp e jf + gj
2 Lq con q coniugato di
p, perché
(p 1)q
jf + gj
p 1
jf + gj
q
pq q
p
= jf + gj
= jf + gj , perciò
Z
Z
1=q
(p 1)q
p
=
jf + gj
d
=
jf + gj d
1=q
p=q
= kf + gkp
Dunque:
p
p 1
kf + gkp
kf kp jf + gj
= kf +
p=q
gkp
da cui
+ kgkp jf + gj
q
kf kp + kgkp
p p=q
kf kp + kgkp
kf + gkp
ossia
p 1
q
kf + gkp
kf kp + kgkp :
Dunque Lp ( ) è uno spazio vettoriale normato per tutti i p 2 [1; 1): Chiediamoci ora se c’è una ragione particolare per cui gli spazi Lp non sono stati de…niti
anche per 0 < p < 1. In e¤etti per 0 < p < 1 la “candidata norma” kf kp non
soddisfa la disuguaglianza triangolare, come mostra il seguente
Esempio 11.6 Consideriamo Lp [0; 2] per 0 < p < 1, siano f =
[1;2] . Si ha:
Z
0
1=p
2
p
jf + gj dx
Z
2
0
2
1=p
p
=
1=p
2
= 21=p ;
1dx
Z
1=p
1
1dx
= 1;
0
1=p
p
jgj dx
Z
=
0
jf j dx
0
Z
=
[0;1] ; g
=
Z
1=p
2
1dx
= 1;
1
dunque
kf + gkp = 21=p > 2 = kf kp + kgkp
e la disuguaglianza triangolare viene a cadere.
Vale anche il prossimo fondamentale risultato:
Teorema 11.7 Gli spazi Lp ( ) per 1
p < 1 sono completi.
Per p = 1 lo sappiamo già. Per 1 < p < 1 la dimostrazione è molto simile
a quella vista per p = 1 nel §8.9. Lo studente può provare per esercizio a
modi…care quella dimostrazione per adattarla al caso p > 1 (si tratta solo di
introdurre opportunamente qualche esponente p).
124
11.2
Lo spazio L1
Introduciamo ora uno spazio che in qualche senso completa la scala degli spazi
Lp .
De…nizione 11.8 Poniamo:
L1 ( ) = ff :
! R misurabile : 9K > 0 per cui è jf (x)j
K per q.o. x 2 g :
Le funzioni di questo spazio si dicono anche essenzialmente limitate. Esse
sono limitate salvo un insieme di misura nulla. Se f 2 L1 ( ) si de…nisce
kf kL1 (
)
= inf fK > 0 : jf (x)j
K per q.o. x 2 g .
Quindi in particolare risulta
jf (x)j
kf kL1 (
)
per q.o. x 2 :
Si presti attenzione a non equivocare la de…nizione di “limitatezza essenziale”. I prossimi esempi dovrebbero chiarire le idee.
Esempio 11.9 1. Se f è limitata in in particolare è essenzialmente limitata.
2. La funzione 1=x non è essenzialmente limitata in R. Attenzione: f non
1
K per ogni
è “limitata per x 6= 0”, in quanto per nessun K > 0 è vero che jxj
x 6= 0; o per ogni x appartenente a qualche altro insieme di misura nulla.
3. Un esempio di funzione essenzialmente limitata senza essere limitata è:
f (x) =
sin x per x 2 R n Q
x
per x 2 Q
E’ chiaro infatti che
jf (x)j
1 per q.o. x 2 R;
in quanto Q è un insieme di misura nulla. D’altro canto ovviamente f è illimita
D’altro canto ovviamente f è illimitata.
4. f è essenzialmente limitata se e solo se f è uguale quasi ovunque ad
una funzione limitata. Ad esempio, la f dell’esempio precedente è uguale quasi
ovunque a sin x.
5. La funzione f (x) = log x appartiene in Lp (0; 1) per ogni p 2 [1; 1)
ma non appartiene a L1 (0; 1); la funzione f (x) = sin x appartiene a L1 (R)
ma non appartiene a Lp (R) per nessun p 2 [1; 1), quindi non c’è in generale
alcuna inclusione banale tra lo spazio L1 e gli altri spazi Lp .
Si veri…ca facilmente che L1 ( ) è uno spazio vettoriale normato (con la
solita identi…cazione tra funzioni uguali quasi ovunque). Inoltre:
Teorema 11.10 Lo spazio vettoriale normato L1 ( ) è completo.
125
1
Dimostrazione. Sia ffn gn=1 una successione di Cauchy in L1 ( ) : Questo
signi…ca che kfn fm kL1 ( ) ! 0 per n; m ! 1. D’altro canto
jfn (x)
fm (x)j
kfn
fm kL1 (
)
per ogni x 2
n En;m
dove En;m è un insieme di misura nulla. Poiché l’unione numerabile di insiemi
di misura nulla ha misura nulla, fuori da un certo insieme E di misura nulla
1
(unione di tutti gli insiemi En;m ) la successione ffn gn=1 soddisfa la condizione
di Cauchy per la convergenza uniforme, dunque converge uniformemente a una
certa funzione f; che risulta de…nita e misurabile in n E, quindi de…nita q.o.
e misurabile in : Inoltre kfn f kL1 ( ) ! 0:
Notiamo che il concetto di coppia di esponenti coniugati e la disuguaglianza
di Hölder si estendono a comprendere anche lo spazio L1 , al seguente modo:
De…nizione 11.11 Diciamo che l’esponente coniugato di p = 1 è q = 1; e
l’esponente coniugato di p = 1 è q = 1.
Ora, se f 2 L1 ( ) e g 2 L1 ( ) si ha, essendo jg (x)j kgkL1 ( ) per q.o.
x2 ;
Z
Z
jf g (x)j d (x)
kgkL1 ( ) jf (x)j d (x) = kgkL1 ( ) kf kL1 ( ) :
Perciò la disuguaglianza di Hölder si estende anche ai casi estremi in cui p = 1
o 1.
11.3
Inclusioni tra spazi Lp
Cominciamo a dimostrare il seguente risultato positivo di inclusione tra spazi
Lp su un dominio di misura …nita:
Teorema 11.12 Sia ( ; M; ) uno spazio di misura (con misura completa),
di misura …nita, cioè ( ) < 1. Se 1 p < r 1 allora Lr ( ) Lp ( ) e
vale la disuguaglianza:
1
kf kp
( )p
1
r
kf kr per ogni f 2 Lr ( )
1
dove nel caso r = 1 a secondo membro abbiamo
( ) p kf k1 .
Dimostrazione. Supponiamo prima r < 1: Applichiamo la disuguaglianza di
Hölder, scrivendo:
Z
p
p
kf kp =
jf (x)j 1d (x)
p
e osservando che se f 2 Lr ( ) ; allora jf j 2 Lr=p ( ) e la costante 1 appartiene
allo spazio Ls ( ) con s coniugato di r=p; quindi 1=s = 1 p=r: Perciò:
p
kf kp
Z
p
jf (x)j
r
p
p
r
d (x)
Z
126
1
s
1 d
p
r
p
= kf kr
1 p=r
( )
ed elevando ambo i membri alla 1=p si ha la tesi. Nel caso r = 1 si ha subito
1
1
Z
Z
p
p
1
p
jf (x)j d (x)
kf k1
1d (x)
= ( ) p kf k1 :
Se ( ) = 1 abbiamo già visto con semplici esempi che non valgono inclusioni banali tra gli spazi Lp : Dati due esponenti p; r 2 [1; 1] diversi tra loro,
esistono f 2 Lp ( ) n Lr ( ) e g 2 Lr ( ) n Lp ( ) : Qui sotto si riporta qualche
esempio in tal senso. Si può dimostrare che, ad ogni modo, se f 2 Lp ( )\Lr ( )
per due esponenti p; r con 1 p < r 1; allora f 2 Ls ( ) per ogni s 2 (p; r).
Ad esempio, se f 2 L1 ( ) \ L1 ( ) allora f 2 Ls ( ) per ogni s 2 [1; 1].
Esempio 11.13 1. f (x) = p1x 2 Lp (0; 1) per ogni p 2 [1; 2) ma non per p
2. f (x) = p1x 2 Lp (1; +1) per ogni p 2 (2; +1] ma non per p 2:
3. f (x) = px 1log x 2 Lp (0; 1=2) per ogni p 2 [1; 2] ma non per p > 2:
4. f (x) = px 1log x 2 Lp (2; 1) per ogni p 2 [2; +1] ma non per p < 2:
1
5. f (x) = px(1+jlog
2 Lp (0; 1) se e solo se p = 2:
xj)
6. Se r 2 [1; 1); f (x) =
1
x1=r (1+jlog xj2 )
2:
2 Lp (0; 1) se e solo se p = r:
7. f (x) = sin x 2 Lp (0; 1) se e solo se p = 1:
8. Passando da R a Rn ; chiediamoci ora, per > 0 …ssato, per quali p è
f (x) = jxj1 2 Lp (B1 ), con B1 = fx 2 Rn : jxj < 1g : Con cambio di variabili
polari si ha:
Z
Z 1
Z 1
dx
d
1
n 1
c
d
=
c
< 1 per:
n
n
p =
p
p
n+1
jxj<1 jxj
0
0
p
n + 1 < 1, cioè
n
1 p < ; purché
< n:
Per
n; f 2
= Lp (B1 ) per nessun p.
9. Analogamente chiediamoci per quali p è f (x) = jxj1 2 Lp (Rn n B1 ) : Si
ha ora:
Z
Z +1
dx
d
=
c
< 1 per:
n
p
p
n+1
jxj 1 jxj
1
p
n + 1 > 1, cioè
n
p>
se
p
11.4
1 se
n
> n:
Approssimazione di funzioni Lp
Tutto quanto abbiamo detto …n qui per gli spazi Lp vale su un generico spazio
di misura ( ; M; ) (con completa). Ora ci poniamo un problema che tipicamente ha senso quando è un sottoinsieme misurabile di Rn e la misura
127
di Lebesgue in Rn : è possibile approssimare in norma Lp ( ) una funzione
f 2 Lp ( ) con funzioni continue, oppure regolari (cioè derivabili un certo numero di volte)? Vale in proposito un risultato molto forte, che ci limitiamo
ad enunciare. Sia
un aperto di Rn . Consideriamo lo spazio C01 ( ) delle
funzioni f derivabili in…nite volte in e aventi supporto compatto in ; ossia
tali che esiste un insieme chiuso e limitato K
per cui f (x) = 0 fuori da
K (l’insieme K dipende dalla funzione f ). Si osservi che C01 ( ) è uno spazio
vettoriale, anche se non possiede una norma naturale. E’ovviamente contenuto
in Lp ( ) per ogni p 2 [1; 1]; infatti per il teorema di Weierstrass f è limitata
e si annulla fuori da un insieme limitato, quindi di misura …nita. Con queste
premesse, si ha allora:
Teorema 11.14 Lo spazio C01 ( ) è denso in Lp ( ) per ogni p 2 [1; 1):
Esplicitamente, la densità signi…ca che per ogni f 2 Lp ( ) con p 2 [1; 1)
1
esiste una successione f'n gn=1 C01 ( ) tale che k'n f kp ! 0 per n ! 1.
A maggior ragione, quindi, ogni funzione Lp ( ) con p 2 [1; 1) può essere
approssimata bene quanto vogliamo in norma Lp mediante funzioni continue in
o con funzioni C 1
. E’utile talvolta anche un risultato di approssimazione
di tipo diverso, non mediante funzioni regolari ma mediante funzioni semplici:
Teorema 11.15 Lo spazio delle funzioni semplici in
(cioè misurabili e che
assumono un numero …nito di valori) è denso in Lp ( ) per ogni p 2 [1; 1):
Usando i teoremi precedenti e qualche altro argomento si può dimostrare in
particolare che:
Teorema 11.16 Lo spazio Lp ( ) è separabile per tutti i p 2 [1; 1):
Si osservi esplicitamente che i teoremi precedenti escludono lo spazio L1 ( ).
Infatti, si può dimostrare che lo spazio L1 ( ) non è separabile, e non è possibile approssimare in norma L1 una qualunque funzione L1 mediante funzioni
continue o regolari.
11.5
Integrali doppi in Rn
Lavorando con l’integrale di Lebesgue in Rn , e in particolare quando si studiano
operatori integrali de…niti su spazi di funzioni integrabili, si possono incontrare
integrali del tipo:
Z
Z
f (x; y) dy dx
Rn
Rn
dove sia x che y rappresentano variabili in Rn . Le domande che si pongono
naturalmente sono:
1. E’lecito scambiare l’ordine di integrazione, scrivendo
Z
Z
Z
Z
f (x; y) dy dx =
f (x; y) dx dy ?
(11.2)
Rn
Rn
Rn
128
Rn
2. L’integrale iterato calcolato nella formula precedente, coicide con l’integrale
doppio
Z
f (x; y) dxdy
(11.3)
R2n
che si otterrebbe vedendo f (x; y) come funzione di 2n variabili e calcolandone
l’integrale di Lebesgue in R2n ?
La risposta a queste domande è contenuta nel prossimo teorema. In sostanza,
se almeno uno dei 3 integrali che compaiono nelle (11.2)-(11.3) converge assolutamente (cioè quando si sostituisca f con jf j), allora tutti e tre gli integrali
convergono ed entrambe le domande hanno risposta a¤ermativa.
Teorema 11.17 (di Fubini-Tonelli) Sia f : R2n ! R misurabile.
1. Se f
0; allora l’uguaglianza (11.2) è sempre vera, dove i due membri
possono essere entrambi …niti o entrambi in…niti.
2. Se f ha segno qualsiasi ma almeno uno degli integrali iterati che compaiono in (11.2) converge assolutamente (cioè converge uno degli integrali iterati
di jf j) allora la (11.2) vale, con entrambi i membri …niti. In particolare le
funzioni di una variabile
Z
Z
g (x) =
f (x; y) dy e h (y) =
f (x; y) dx
Rn
Rn
risultano Lebesgue integrabili in Rn , e in particolare …nite quasi ovunque. Inoltre
in questo caso f 2 L1 R2n e l’integrale doppio (11.3) di f coincide con gli
integrali iterati in (11.2).
3. Se è noto a priori che f 2 L1 R2n allora valgono tutte le conclusioni
del punto precedente.
Dal punto di vista operativo i punti più utili del teorema sono i primi due:
raramente si sa a priori che f 2 L1 R2n ; più spesso questa conclusione viene
conquistata grazie al fatto che uno degli integrali iterati converge assolutamente.
Spesso accade che l’integrale che nasce dal problema in esame sia uno dei due
integrali iterati, ma quello che si riesce a calcolare esplicitamente sia l’altro
integrale iterato. Risulta quindi utile sapere a priori che vale l’uguaglianza
(11.2). Questo è vero se l’integrale iterato che si sa più facilmente calcolare o
almeno stimare, converge assolutamente.
Esempio 11.18 1. Calcolare l’integrale di Lebesgue:
Z
1
se 0 < x < 1
x+y 2
f (x; y) dxdy con f (x; y) =
0
altrimenti.
2
R
L’integranda è non negativa, quindi è lecito calcolare l’integrale doppio come
129
integrale iterato in qualsiasi ordine. Calcoliamo:
Z
Z 1 Z
1
dy dx =
f (x; y) dxdy =
x
+
y2
R2
0
R
!
Z 1
+1
y
1
dx
=
2 p arctan p
x 0
x
0
Z 1
p 1
p dx = 2 x 0 = 2 :
=
x
0
Si osservi in particolare che la funzione de…nita dall’integrale interno,
Z
g (x) =
f (x; y) dy = p
x
R
è …nita per quasi ogni x (ma non per ogni x).
2. Stabilire se f 2 L1 R2 , con
x2 y 2
f (x; y) = e
sin (xy) :
La funzione ha segno variabile, ma
jf (x; y)j
e
x2 y 2
:
Maggioriamo l’integrale iterato di f con l’integrale iterato di g (x; y) = e
Z Z
Z Z
2
2
jf (x; y)j dy dx
e x y dy dx
R
R
R
R
Z
Z
2
x2
=
e
dx
e y dy < 1:
R
R
2
p
(E’ noto che R e x dx =
,
confronto, l’integrale iterato di
calcolo precedente non fornisce
3. Stabilire se f 2 L1 R2 ,
x2 y 2
:
R
ma il valore esatto qui non è importante). Per
jf j converge, quindi f 2 L1 R2 . Si noti che il
il valore dell’integrale doppio di f .
con
f (x; y) = e
jxyj
:
La funzione è positiva, calcoliamo l’integrale doppio come integrale iterato:
Z
Z +1
Z +1
f (x; y) dxdy = 2
2
e xy dy dx
R2
0
0
!
Z +1
+1
e xy
=4
dx
x 0
0
Z +1
dx
=4
= +1;
x
0
pertanto f 2
= L1 R2 .
130
11.6
Convoluzione in Rn
Un’operazione che riguarda gli spazi Lp (Rn ) è la convoluzione, di cui ci limitiamo a segnalare la de…nizione e un paio di proprietà.
Teorema 11.19 Se f; g 2 L1 (Rn ) ; allora l’integrale di convoluzione
Z
(f g) (x) =
f (x y) g (y) dy
Rn
è ben de…nito per q.o. x 2 Rn , e risulta:
kf
gkL1 (Rn )
kf kL1 (Rn ) kgkL1 (Rn ) :
Dimostrazione. Tralasciamo di dimostrare il fatto che la funzione di due
variabili f (x y) g (y) è misurabile. Posto questo, proviamo la disuguaglianza
delle norme, da cui in particolare segue che la convoluzione è de…nita per quasi
ogni x.
Z
Z
Z Z
kf gkL1 (Rn ) =
f (x y) g (y) dy dx
jf (x y) g (y)j dydx
Rn
Rn
Rn
Rn
scambiando l’ordine di integrazione nell’integrale iterato (operazione lecita per
il teorema di Fubini-Tonelli in quanto l’integranda è presa in valore assoluto)
Z
Z
=
jg (y)j
jf (x y)j dx dy:
Rn
Ora l’integrale interno è
Z
jf (x
Rn
y)j dx = (traslando x y = t)
Z
=
jf (t)j dt = kf kL1 (Rn ) ;
Rn
Rn
perciò
kf
gkL1 (Rn )
Z
Rn
jg (y)j kf kL1 (Rn ) dy = kf kL1 (Rn ) kgkL1 (Rn ) :
Qualche osservazione. Si noti anzitutto che la de…nizione di convoluzione ha
senso tra due funzioni de…nite su tutto lo spazio Rn . Si veri…ca con un cambio di
variabile che la convoluzione è commutativa, ossia (f g) = (g f ). Si noti che
l’integranda f (x y) g (y), per ogni x …ssato si può vedere come una funzione
di y che è il prodotto di due funzioni L1 , quindi in generale non è L1 . Tuttavia
il teorema appena dimostrato a¤erma che per quasi ogni x in e¤etti è L1 . Ad
esempio, se
1
f (x) = p
( 1;1) (x) ;
jxj
131
la funzione f 2 L1 (R) ; quindi f f 2 L1 (R) e in particolare l’integrale
Z
1
1
p
y) p
(f f ) (x) =
( 1;1) (x
( 1;1) (y) dy
jx yj
jyj
R
è …nito per q.o. x. Però per x = 0 si ha
Z
1
1
p
(f f ) (0) =
( 1;1) ( y) p
jyj
jyj
R
(
1;1) (y) dy =
Z
1
1
dy
= 1:
jyj
E’facile veri…care direttamente che per ogni x 6= 0 invece l’integrale converge.
Segnaliamo anche la seguente estensione del teorema precedente:
Teorema 11.20 (Disuguaglianza di Young) Siano f 2 L1 (Rn ) e g 2 Lp (Rn )
per qualche p 2 [1; 1] : Allora è ben de…nita per q.o. x la convoluzione f g e
si ha:
kf gkLp (Rn ) kf kL1 (Rn ) kgkLp (Rn ) :
12
Cenni su operatori e funzionali lineari continui
Introduciamo ora le prime nozioni sugli operatori e i funzionali lineari continui su spazi vettoriali normati. Questi concetti da una parte di collegano alla
teoria degli spazi Lp che abbiamo appena studiato, dal momento che esempi
signi…cativi di tali operatori e funzionali riguardano questi spazi, d’altro canto
costituiscono un discorso a sé, che ci servirà anche nell’a¤rontare il successivo
studio degli spazi di Hilbert, nel prossimo capitolo.
12.1
Operatori lineari continui
De…nizione 12.1 Siano X; Y due spazi vettoriali normati sul campo K (= R o C).
Una funzione T : X ! Y si dice operatore lineare se
T ( x + y) = T (x) + T (y) 8x; y 2 X; 8 ;
2 K.
Solitamente quando un operatore è lineare si omette la parentesi nell’argomento, e si scrive T x invece che T (x) (ma naturalmente bisogna comunque
scrivere T (x + y) se l’argomento è una somma!).
Teorema 12.2 Siano X; Y due spazi vettoriali normati e T : X ! Y un
operatore lineare. Sono equivalenti le seguenti tre condizioni:
(a) T (vista come funzione tra due spazi metrici) è continua in 0.
(b) T è continua in ogni punto.
(c) vale la seguente condizione di limitatezza:
kT xkY
< 1:
x2X;x6=0 kxkX
sup
132
Dimostrazione. Proviamo che (a)=)(b). Questo è vero per linearità. Proviamo che T è continua in x sapendo che è continua in 0: Occorre mostrare
che
xn ! x =) T xn ! T x:
Ma per linearità:
T xn
T x = T (xn
x) ! 0 perché (xn
x) ! 0 e T è continua in 0.
Proviamo che (b)=)(c). Per assurdo, sia
kT xkY
= +1;
x2X;x6=0 kxkX
sup
1
allora esiste una successione fxn gn=1
X tale che
kT xn kY
kxn kX
Poniamo yn =
si ha
xn
nkxn kX .
Allora kyn kX =
n:
1
n
(12.1)
! 0 perciò essendo T continua in 0
T yn ! 0. Ma:
T yn =
kT xn kY
T xn
perciò kT yn kY =
n kxn kX
n kxn kX
1 per (12.1),
assurdo.
Proviamo che (c)=)(a). Per ipotesi esiste K > 0 tale che
kT xkY
< K per ogni x 2 X; x 6= 0:
kxkX
Allora se xn ! 0;
kT xn kY < K kxn kX ! 0
perciò T xn ! 0; e T è continua in 0. L’equivalenza delle tre condizioni è quindi
provata.
De…nizione 12.3 Un operatore lineare T : X ! Y tra due spazi vettoriali normati X; Y si dice continuo se vale una delle tre condizioni equivalenti espresse
dal teorema precedente. In tal caso si de…nisce norma dell’operatore il numero
kT k =
sup
x2X;x6=0
kT xkY
.
kxkX
Risulta, per de…nizione
kT xkY
kT k kxkX
133
8x 2 X:
Si veri…ca facilmente che ogni combinazione lineare di operatori lineari continui tra X e Y è a sua volta un operatore lineare continuo. Si può considerare
quindi lo spazio L (X; Y ) di tutti gli operatori lineari continui tra gli spazi
vettoriali normati X e Y , che risulta uno spazio vettoriale. Anzi, la norma
operatoriale
kT xkY
kT kL(X;Y ) = sup
x2X;x6=0 kxkX
risulta e¤ettivamente una norma in questo spazio, quindi: L (X; Y ) è uno
spazio vettoriale normato. Si osservi la seguente disuguaglianza, che esprime
il signi…cato della norma:
kT xkY
kT kL(X;Y ) kxkX
8x 2 X:
Viceversa, se si trova una costante K > 0 per cui si abbia
kT xkY
K kxkX
8x 2 X;
(12.2)
allora si può a¤ermare che
kT kL(X;Y )
K;
kT xk
in quanto la norma dell’operatore è l’estremo superiore del quoziente kxk Y e
X
quindi anche l’estremo inferiore delle costanti K per cui è vera la (12.2). Vale
il seguente teorema, che ci limitiamo a enunciare:
Teorema 12.4 Siano X; Y spazio vettoriali normati. Se Y è completo anche
anche L (X; Y ) è completo.
Esempi di operatori lineari continui notevoli
Esempio 12.5 Sia k 2 L1 (Rn ). Allora
T : Lp (Rn ) ! Lp (Rn )
T f = kf
è lineare continuo su Lp (Rn ) ; per ogni p 2 [1; 1] ; con kT k = kkkL1 (Rn ) . T si
dice (ovviamente) operatore di moltiplicazione.
Esempio 12.6 Sia k 2 L1 (Rn ) : Allora
T : Lp (Rn ) ! Lp (Rn )
Tf = k f
è lineare continuo su Lp (Rn ) ; per ogni p 2 [1; 1] ; con kT k = kkkL1 (Rn ) , in base
alla disuguaglianza di Young (Teorema 11.20). T si dice (ovviamente) operatore
di convoluzione.
134
Esempio 12.7 Sia
T : C 0 [0; 1] ! C 0 [0; 1]
Z x
T f (x) =
f (t) dt:
0
T è sostanzialmente l’operatore primitiva. (Abbiamo semplicemente evitato di
aggiungere a T f la costante arbitraria, per rendere T univocamente de…nito).
L’operatore integrale T è lineare continuo,
Z x
Z x
jT f (x)j
jf (t)j dt kf k1
dt = x kf k1
0
kT f k1
0
kf k1 :
Esempio 12.8 Sia
T : C 2 [a; b] ! C 0 [a; b]
T f (x) = (x) f 00 (x) + (x) f 0 (x) + (x) f (x)
con ; ; 2 C 0 [a; b] : L’operatore di¤erenziale T è (ovviamente lineare e)
continuo perché
kT f kC 2 [a;b] c kf kC 0 [a;b]
con c dipendente da k kC 0 [a;b] ; k kC 0 [a;b] ; k kC 0 [a;b] .
Consideriamo ora un generico operatore integrale lineare del tipo
Z
T f (x) =
k (x; y) f (y) dy
dove ( ; M; ) è uno spazio di misura qualsiasi, k :
! R è una funzione
misurabile assegnata (solitamente detta nucleo integrale). Vogliamo precisare
delle ipotesi su k sotto le quali si possa a¤ermare che T è un operatore lineare
continuo su qualche spazio di tipo Lp ( ). Proviamo il seguente
Teorema 12.9 Con le ipotesi e notazioni precedenti, valgono le seguenti proprietà:
a. Se
Z
sup
jk (x; z)j dx < 1;
z2
allora T è lineare continuo come operatore
T : L1 ( ) ! L1 ( ) :
b. Se
Z
2
jk (x; y)j dxdy < 1;
allora T è lineare continuo come operatore
T : L2 ( ) ! L2 ( ) :
135
Dimostrazione. L’operatore è ovviamente lineare. Proviamo le proprietà di
continuità sotto le opportune ipotesi su k.
a.
Z
Z Z
kT f kL1 ( ) =
jT f (x)j dx =
k (x; y) f (y) dy dx
Z Z
jk (x; y)j jf (y)j dydx
ora essendo l’integranda positiva, per il teorema di Fubini-Tonelli (v. §11.5) è
lecito scambiare l’ordine di integrazione, scrivendo
Z
Z
=
jf (y)j
jk (x; y)j dx dy
Z
Z
jf (y)j sup
jk (x; z)j dx dy
z2
Z
Z
= sup
jk (x; z)j dx
jf (y)j dy
z2
= K kf kL1 (
)
K = sup
Z
nell’ipotesi
z2
jk (x; z)j dx < 1:
b. Stimiamo prima, mediante la disuguaglianza di Hölder:
jT f (x)j =
Z
kf kL2 (
k (x; y) f (y) dy
)
Z
1=2
2
k (x; y) dy
:
Perciò
kT f kL2 (
)
=
Z
1=2
kf kL2 (
nell’ipotesi
K=
12.2
2
jT f (x)j dx
)
Z
Z
Z
1=2
2
k (x; y) dy dx
= K kf kL2 (
)
1=2
2
k (x; y) dydx
< 1:
Funzionali lineari continui
Un caso particolare di operatore lineare si ha quando Y coincide con il campo
degli scalari. Un operatore lineare continuo T : X ! R (dove X è uno spazio
vettoriale normato reale) si dice funzionale lineare continuo su X. Lo spazio
136
L (X; R) si dice spazio duale di X e si indica con X o X 0 : In base al Teorema
12.4, X è sempre uno spazio di Banach (perché il secondo spazio, Y = R, lo
è). Quindi il duale di uno spazio vettoriale normato X è lo spazio (vettoriale
normato) dei funzionali lineari continui su X. La norma di un funzionale lineare
continuo è de…nita da
jT xj
.
kT kX = sup
x2X;x6=0 kxkX
Esempio 12.10 1. Sia X = C 0 [a; b]. Fissato un punto x0 2 [a; b], il funzionale
T f = f (x0 )
è ovviamente lineare, ed è continuo perché
jT f j = jf (x0 )j
kT k
kf kC 0 [a;b] , da cui
1:
T si dice funzionale di valutazione (valuta le funzioni nel punto x0 ).
2. Sia X = C 0 [a; b]. L’integrale de…nito è un funzionale lineare continuo:
Z b
Tf =
f (t) dt
a
Z
jT f j
b
a
kT k
jf (t)j dt
(b
kf kC 0 [a;b] (b
a)
a) :
Confrontando gli esempi 1 e 2 vediamo che esistono funzionali lineari continui di tipo molto diverso, sullo spazio C 0 [a; b] :
3. Sia X = Lp ( ), e …ssiamo una funzione g 2 Lq ( ) con q esponente
coniugato a p. Allora:
Z
Tf =
f (x) g (x) dx
è un funzionale lineare continuo su Lp ( ) ; per la disuguaglianza di Hölder:
Z
jT f j
jf (x) g (x)j dx kf kLp ( ) kgkLq ( ) ; perciò
kT k
kgkLq (
)
.
Mostriamo che è, più precisamente, kT k = kgkLq ( ) . E’ su¢ ciente per questo
trovare una speci…ca f per cui risulti
Si ha f 2 Lp perché
p
(q 1)p
jT f j
kf kp
q 1
= kgkq : Poniamo: f = jgj
q
q=p
jf j = jgj
= jgj ; quindi kf kp = kgkq
Z b
Z b
q
q
Tf =
f (t) g (t) dt =
jgj dt = kgkq
a
a
q
kgkq
Tf
q
= kgkq
=
q=p
kf kp
kgkq
q=p
137
= kgkq ;
e
sgn(g) :
quindi kT k = kgkLq ( ) .
L’ultimo esempio si può rileggere così: ogni funzione g 2 Lq ( ) induce
in modo naturale un funzionale lineare continuo su Lp ( ) per p; q coniugati.
Potremmo indicare questo funzionale con
Tg : Lp ( ) ! R
Z b
Tg : f 7 !
f g:
a
Chiediamoci ora: esistono funzionali lineari continui su Lp ( ) di tipo diverso
da questo, cioè che non si rappresentino come integrali contro una funzione Lq ?
La risposta è negativa, e questo signi…ca che conosciamo una caratterizzazione
completa dei funzionali lineari continui su Lp ( ):
Teorema 12.11 (di rappresentazione di Riesz) Sia 1 p < 1. Per ogni
funzionale lineare continuo T su Lp ( ) esiste una funzione g 2 Lq ( ) (con q
esponente coniugato di p) tale che
T :f 7 !
Z
b
f g:
a
Inoltre kT k = kgkq .
Possiamo anche leggere questo teorema dicendo: lo spazio duale di Lp ( )
si può identi…care con Lq ( ) ; per 1 p < 1. Invece, il duale di L1 ( ) non
è L1 ( ).
Si osservi che, in particolare, il duale di L2 ( ) è L2 ( ) stesso (essendo
l’esponente 2 il coniugato di se stesso). Questo fatto è un caso particolare di un
teorema molto più generale, di rappresentazione dei funzionali lineari continui
su uno spazio di Hilbert, di cui parleremo fra non molto.
Si osservi anche che tutto ciò che abbiamo detto vale per gli spazi Lp su
qualsiasi spazio di misura astratto ( ; M; ). Se in particolare consideriamo lo
spazio (N; P (N) ; m) dove m è la misura del conteggio, otteniamo gli spazi Lp
di successioni, indicati col simbolo `p :
8
9
!1=p
1
<
=
X
1
p
`p = x = fxn gn=1 R : kxk`p =
jxn j
< 1 ; per 1 p < 1;
:
;
n=1
`1 =
1
x = fxn gn=1
R : kxk`1 = sup jxn j < 1 :
n
In particolare i funzionali lineari continui su `p sono tutti e soli quelli del tipo:
1
Ty : fxn gn=1 7!
1
X
n=1
1
xn yn con fyn gn=1 2 `q …ssato,
138
e si ha:
1
X
n=1
xn yn
1
X
n=1
p
jxn j
!1=p
1
X
n=1
q
jyn j
!1=q
(disuguaglianza di Holder in spazi `p ). E’ interessante, in particolare, il caso
p = q = 2, per cui la disuguaglianza precedente risulta una generalizzazione
in…nito dimensionale della disuguaglianza (di Cauchy-Schwarz) elementare che
vale per il prodotto scalare in Rn :
!1=2 1
!1=2
1
1
X
X
X
2
2
xn yn
jxn j
jyn j
:
n=1
n=1
n=1
Questa relazione tra spazi in…nito dimensionali, prodotto scalare e funzionali
lineari continui avrà la sua piena chiari…cazione e il suo sviluppo naturale nella
teoria degli spazi di Hilbert, di cui ci occupiamo nel prossimo capitolo.
13
Esercizi sulla Parte 2
A. Esercizi su spazi di misura
Es 13.1 Dimostrare la Proposizione 8.2: Se M è una -algebra, M è chiusa
anche rispetto alle seguenti operazioni insiemistiche: unione …nita, intersezione
…nita o numerabile; di¤ erenza insiemistica.
[Suggerimento: sfruttando le proprietà delle operazioni insiemistiche, si tratta di esprimere ciascuna di queste operazioni mediante quelle per cui già si sa
che M è chiusa, ossia unioni numerabili e complementare.]
Es 13.2 Dimostrare la Proposizione 8.3: Se E P ( ) è una qualsiasi famiglia
di sottoinsiemi di , è ben de…nita la più piccola -algebra contenente E, detta
“ -algebra generata da E” e si indica con (E).
[Suggerimento: Infatti, di -algebre contenenti E ce n’è almeno una: P ( );
consideriamo allora l’intersezione di tutte le -algebre contenenti E; si tratta di
dimostrare che quest’intersezione è a sua volta una -algebra; questa sarà per
costruzione la più piccola -algebra contenente E.]
Es 13.3 Dimostrare il Teorema 8.6, che esprime le varie proprietà di una
misura astratta. Fare contresempi alle proprietà di condizionata sottrattività
e condizionata continuità da sopra, quando non vale l’ipotesi di misura …nita
dell’insieme più grande.
Es 13.4 Dimostrare il Teorema 8.13 sulla restrizione di una misura: sia ( ; M; )
uno spazio di misura e E 2 M un insieme misurabile …ssato. De…niamo:
ME = fA \ E : A 2 Mg ;
E : ME ! [0; +1]
E (A) = (A)
139
(cioè E è la restrizione della misura alla famiglia di insiemi ME ). Allora
ME è una sigma algebra e E una misura su ( ; ME ). (Si dice che E è la
misura restrizione di all’insieme E).
Es 13.5 Ricordando che una proprietà si dice vera quasi ovunque se è vera
salvo al più in un insieme di misura nulla, dimostrare che se una funzione
f : R ! R è continua, allora se f (x) = 0 quasi ovunque, necessariamente f
è identicamente nulla. Fare poi un esempio di funzione zero quasi ovunque ma
non identicamente nulla.
Es 13.6 Stabilire se la seguente funzione è Riemann integrabile in [0; 1]:
f (x) = arctan
1
sin x1
.
[Suggerimento: per prima cosa determinare tutti i punti di discontinuità di
questa funzione in [0; 1].]
Es 13.7 Stabilire quali delle seguenti funzioni d’insieme sono delle misure di
Borel in R, giusti…cando le proprie conclusioni:
Z
2
(E)
=
ex dx;
1
ZE
xe jxj dx;
2 (E) =
E
3 (E) = 3 jEj dove jEj è la misura di Lebesgue;
2
(E) = jEj ;
5 (E) = 2 0 + 5
Z
6 (E) =
4
1
+ 4 1 , dove
e
x2
è la misura di Dirac concentrata in x0 ;
x0
dx.
E\( 1;0)
Es 13.8 Sia f (x) la funzione di Dirichlet,
f (x) =
1 se x 2 R n Q
0 se x 2 Q.
Determinare la funzione integrale (di Lebesgue) F (x) =
Rx
0
f (t) dt:
B. Esercizi sul passaggio al limite sotto il segno di integrale per
l’integrale di Lebesgue, e confronto con l’integrale di Riemann
Nei prossimi esercizi, l’obiettivo è calcolare
Z
lim
fn (x) dx;
n!1
I
evitando se possibile di calcolare ciascun integrale (cioè cercando di applicare
il teorema di Lebesgue della convergenza dominata). Quando I è un intervallo
140
limitato, inoltre, ci si può chiedere se è possibile applicare la teoria di Riemann (criterio della convergenza uniforme). Seguire la traccia indicata in ogni
esercizio, svolgendo i dettagli.
2
2
Es 13.9 Sia fn (x) = nxe n x in [0; 1]. La successione tende a zero puntualmente ma non uniformemente in [0; 1]. In base alla teoria di Riemann non
possiamo quindi calcolare il limite dell’integrale di fn .
[Suggerimento: cerchiamo una maggiorante integrabile. Si calcola fn0 (x) ; si
determina il massimo di fn (x) ; si trova che questo è limitato al variare di n
(anzi è costante), perciò vale una disuguaglianza del tipo jfn (x)j c per ogni
x 2 [0; 1] e per ogni n, e il teorema di Lebsegue è applicabile. Per confronto,
si può calcolare direttamente l’integrale (la primitiva è elementare!) e farne il
limite.]
R +1
Es 13.10 Si calcoli ora il limite di 0 fn (x) dx dove fn sono le stesse funzioni
dell’esempio precedente, applicando il teorema della convergenza dominata.
[Suggerimento: per trovare la maggiorante integrabile in [1; +1) dimostrare
che è fn (x)
f1 (x) se x
1; per far questo, dimostrare che per ogni x
1 la successione ffn (x)g è monotona decrescente; per far questo, calcolare la
derivata... rispetto ad n.]
2
2
Es 13.11 Sia fn (x) = n x e n x in [0; 1]. Studiare il limite dell’integrale su
[0; 1] per ; > 0. (Rispetto all’esempio precedente, in questo caso la funzione
non ha una primitiva elementare per ogni ; > 0; perciò è naturale cercare di
calcolare il limite degli integrali senza calcolare gli integrali).
Traccia: il limite puntuale è zero per ogni ; > 0; perciò se troviamo
una maggiorante integrabile, anche il limite degli integrali è zero. Si osservi il
passaggio:
2 2
2 2
fn (x) = n x e n x = (nx) x
e nx :
La funzione
(nx) e
n2 x2
2
è limitata in [0; 1] perché la funzione g (t) = t e t è limitata su [0; +1)
(veri…carlo) e la funzione precedente è g (nx). Quindi si può scrivere
0
fn (x)
cx
:
Di conseguenza per < + 1 il limite dell’integrale è zero (perché?).
calcolare il limite dell’integrale per
+1 si imposti il calcolo esplicito
RPer
1
di 0 fn (x) dx con la sostituzione nx = t. Cosa si trova? In questi casi quindi,
a posteriori, è vero o falso che
Z
Z
lim
fn (x) dx =
lim fn (x) dx?
n!1
I n!1
I
1
Es 13.12 Sia fn (x) = 1+nx
in [0; 1] con > 0. Calcolare il limite di fn e
dell’integrale di fn , usando il teorema della convergenza dominata.
141
nx
Es 13.13 Sia fn (x) = 1+n
2 x2 . Dimostrare che fn tende a zero puntualmente
ma non uniformemente in [ 1; 1]. Calcolare il limite dell’integrale usando il
teorema di Lebesgue.
nx
Es 13.14 Sia fn (x) = 1+n
2 R. Determinare per quali
2 x2 in [0; +1); con
1
sta in L [0; +1) e per questi calcolare il limite dell’integrale.
[Suggerimento. Dopo aver determinato gli
per i quali fn 2 L1 [0; +1),
cercare una maggiorante “naturale”; per gli per i quali questa è integrabile,
il teorema di Lebesgue è applicabile. Per gli altri ; calcolare esplicitamente
l’integrale oppure valutarlo mediante la sostituzione nx = t.]
R1
xn
Es 13.15 Sia fn (x) = 1+x
10 in [0; 1]. Calcolare limn!1 0 fn (x) dx:
Es 13.16 Sia fn (x) =
x1=n
1+x2
in [0; 1]. Calcolare limn!1
Es 13.17 Sia fn : [0; ] ! R
2n sin (2n x) per x 2 [0; 2
0 altrimenti.
fn (x) =
R1
n
0
fn (x) dx:
]
Vale il passaggio al limite sotto il segno di integrale?
n
Es 13.18 QUI Sia gn = ( 1) fn con fn come nell’esempio precedente. Vale
il passaggio al limite sotto il segno di integrale? Che di¤ erenza si nota rispetto
all’esercizio precedente?
Es 13.19 Sia fn (x) = xn e nx su (0; 1). Suggerimento. Per discutere il limite
dell’integrale, dimostrare che fn (x) f1 (x) per ogni n e per ogni x 2 (0; 1) :
Es 13.20 (Un esempio sul Teorema di Fatou). Sia fn : [0; 2] ! R
fn =
Calcolare separatamente
osserva?
R2
0
se n è pari
se n è dispari.
(0;1)
(1;2)
R2
liminffn (x) dx e liminf 0 fn (x) dx. Che cosa si
Es 13.21 (Un altro esempio sul Teorema di Fatou).
Sia fn (x) = sin2 (nx)
in
R
R
[0; ] per n = 1; 2; 3; ::: Calcolare separatamente 0 liminffn (x) dx e liminf 0 fn (x) dx.
Che cosa si osserva?
Es 13.22 Calcolare i seguenti limiti giusti…cando il procedimento seguito:
1
1
X
X
m
2(nm+1)=(m+2)
1
;
lim
;
lim
2
2
m!1
n + m m!1 n=1 mn + 1 m!1 n=1
n!
n=1
lim
1
X
[Suggerimento: applicare il teorema della convergenza dominata, vedendo la
serie come un integrale astratto in un opportuno spazio di misura.]
142
Es 13.23 Calcolare liminf e limsup della seguente successione di funzioni in
[ 1; 1]:
n
x (x + ( 1) n)
:
fn (x) = 1 +
n + 2x
C. Misura e dimensione di Hausdor¤
Es 13.24 Si consideri l’insieme del piano de…nito col seguente procedimento
iterativo. T0 è un triangolo equilatero di lato 1 (insieme chiuso). Al passo 1,
togliamo da T0 l’interno del triangolo equilatero ottenuto unendo i punti medi
dei 3 lati, chiamiamo T1 l’insieme rimanente, costituito da 3 triangoli equilateri
di lato 1=2. Al passo 2 togliamo a ciascuno dei 3 triangoli che formano T1
l’interno del triangolo equilatero ottenuto unendo i punti medi dei tre triangoli
di T1 ; e chiamiamo T2 ciò che rimane (unione di 9 triangoli equilateri di lato
1/4), e così via. L’insieme T che ci interessa è l’intersezione (cioè “il limite”)
degli insiemi Tn costruiti nel procedimento iterativo. Calcolare la dimensione di
Hausdor¤ di T .
D. Spazi Lp
Es 13.25 Si consideri lo spazio di misura (R; P (R) ; m) dove m è la misura del
conteggio. Si scriva esplicitamente cosa a¤ ermano in questo contesto le disuguaglianze di Hölder e di Minkowski in spazi Lp . (Questi spazi sono chiamati
`p ).
Es 13.26 Stabilire per quali p 2 [1; 1] ciascuna delle seguenti funzioni appartiene a Lp (R) :
2
e x
;
jxj
1
f2 (x) =
;
1 + jxj
log x
f3 (x) =
;
1 + jxj
log x
f4 (x) =
2;
1 + jxj
p
2
3
xe x
f5 (x) =
:
1 ex
f1 (x) =
E. Funzionali e operatori lineari continui, operatori integrali
143
Es 13.27 Di ciascuno dei seguenti, dire se è un operatore lineare continuo tra
gli spazi speci…cato, dimostrando l’a¤ ermazione fatta:
1: T : C 0 [ 2; 2] ! C 0 [ 1; 1] ; T f (x) = f (2x)
Z x
2: T : C 0 [ 2; 2] ! C 1 [ 2; 2] ; T f (x) = 3
f (t) dt
0
Z x
3: T : C 0 [ 2; 2] ! C 1 [ 2; 2] ; T f (x) = f (x) +
f (t) dt
0
Z x
4: T : C 0 [ 2; 2] ! C 0 [ 2; 2] ; T f (x) = f (x) +
f (t) dt
0
Z +1
2
5: T : L1 (R) ! L1 (R) ; T f (x) =
f (x t) e t dt
6: T : L3 (R) ! L3 (R) ; T f (x) =
1
7: T : L
1
(R) ! L
Z
(R) ; T f (x) =
8: T : L1 (R) ! L2 (R) ; T f (x) =
Z
1
+1
f (x
t) e
t2
dt
1
Z
+1
f (x
t) e
t2
dt
1
+1
1
f (x t)
sin tdt
1 + jtj
9: T : L (R) ! L (R) ; T f (x) = f (x) sin2 x
5
5
Es 13.28 Siano X; Y spazi vettoriali normati qualsiasi, e T : X ! Y lineare
continuo. Utilizzando la de…nizione di norma dell’operatore T data nel §12.1,
si veri…chi che questa soddisfa gli assiomi di norma.
Es 13.29 Sia
T f (x) =
Z
k (x; y) f (y) dy
I
Stabilire per ciascuno dei seguenti nuclei k (x; y) ed intervallo I se l’operatore
T è continuo su L1 (I).
k (x; y) =
I=
e xy
[0; 1]
Es 13.30 Sia
T f (x) =
e x=y
[1; +1)
Z
ex=y
1
1+xy
b
k (x; y) f (y) dy:
a
a. Dimostrare che T : L1 [a; b] ! L1 [a; b] è una contrazione se
Z b
sup
jk (x; y)j dx < 1:
y2[a;b]
1.
a
b. Dimostrare che T : L2 [a; b] ! L2 [a; b] è una contrazione se kkkL2 ([a;b]
144
[a;b])
<
Es 13.31 Si consideri l’equazione integrale
Z x
f (x) +
(x t) e (x
t)
f (t) dt = g (x)
0
con g 2 L1 (0; +1) assegnata e f 2 L1 (0; +1) incognita. Stabilire per quali
2 R l’equazione ha una e una sola soluzione in L1 (0; +1) per ogni g 2
1
L (0; +1) assegnata. (Si chiede di giusti…care la risposta utilizzando il teorema
delle contrazioni, e non le trasformate integrali, per chi le conosce).
Es 13.32 Di ciascuno dei seguenti, dire se è un funzionale lineare continuo
sullo spazio speci…cato, dimostrando l’a¤ ermazione fatta:
1: T f = f (0) su C 0 [ 1; 1] :
2: T f = f (0) su L1 [ 1; 1] :
3: T f = f (0) su L1 [ 1; 1]
Z 2
4: T f =
f (t) dt su C 0 [ 2; 2]
0
5: T f =
Z
1
f (t) dt su L1 [ 2; 2]
0
6: T f =
7: T f =
Z
0
f (t) dt su L2 [ 2; 2]
2
2
Z
2
f (t) dt su L2 [ 2; 2]
0
8: T f =
Z
2
f (t) sin3 tdt su L2 [ 2; 2]
2
9: T f = 5f (1) + 3
Z
2
f (t) et dt su C 0 [ 2; 2]
0
13.1
Soluzioni di alcuni esercizi della Parte 2
Soluzione Es. 13.11. Si trova
lim
n!+1
Z
1
n x e
2
2
n x
0
8
< R0 se < + 1
2
+1
dx =
t e t dt se =
: 0
+1 se > + 1:
+1
Poiché l’integranda tende a zero per ogni ; > 0; per
+ 1 non vale il
passaggio al limite.
Soluzione Es. 13.14. fn 2 L1 [0; +1) per 1 < < 1. Ora è
fn (x)
x 1 se x 2 [0; 1]
f1 (x) se x 2 [1; +1)
che è una funzione L1 se 0 <
< 1. Pertanto l’integrale tende a zero per
0 <
< 1. Notare che non si poteva calcolare esplicitamente. Per
= 0
145
l’integrale si calcola e vale 2 . Per 1 < < 0 l’integrale tende a +1; questo si
può vedere eseguendo la sostituzione nx = t nell’integrale. Si noti che nei casi
0 a posteriori si vede che il passaggio al limite sotto il segno di integrale
non vale.
Soluzione Es. 13.17. Puntualmente fn (x) ! 0 in [0; ]. L’integrale vale
2 per ogni n. Perciò non vale il passaggio al limite.
Soluzione Es. 13.18. Qui è ancora gn (x) ! 0 ma questa volta non esiste
n
neppure il limite dell’integrale, perché vale ( 1) 2.
n
n
nx
Soluzione Es. 13.19. fn (x) = x e
= exx . Poiché per ogni x > 0 è
x n
x
è monotona decrescente (e tendente a zero)
0 < ex < 1; la successione ex
per ogni x …ssato. Quindi fn (x) ! 0 puntualmente, inoltre fn (x)
xe x 2
R +1
1
L (0; 1), quindi per il teorema della convergenza dominata 0 fn ! 0:
Soluzione Es. 13.20. Si ha:
Z 2
Z 2
liminffn (x) dx =
0dx = 0
0
liminf
Z
0
2
fn (x) dx = liminf1 = 1:
0
In questo caso quindi nella disuguaglianza del teorema di Fatou vale la disuguaglianza stretta.
Soluzione Es. 13.21.
Z
sin2 (nx) dx = per ogni n 1; quindi
2
0
Z
liminf
fn (x) dx = :
2
0
Invece
f (x) = liminf sin2 (nx) = 0
perché per ogni x 2 [0; ] fsin nxg
convergenti ad ogni nun ha sottosuccessioni
o
2
mero compreso in [ 1; 1] ; quindi (sin nx) ha sottosuccessioni convergenti ad
ogni numero compreso in [0; 1] : Perciò
Z
Z
liminffn (x) dx =
0dx = 0:
0
0
Come nell’esempio precedente quindi nella disuguaglianza del teorema di Fatou
vale la disuguaglianza stretta.
146
Parte III
Spazi di Hilbert
14
Geometria negli spazi di Hilbert
Gli spazi vettoriali dotati di un prodotto scalare sono ambienti astratti in cui si
può de…nire un concetto di ortogonalità analogo a quello euclideo in Rn . Questo
mette a disposizione un sistema di riferimento privilegiato in cui i calcoli sono
particolarmente comodi e semplici, un concetto di proiezione ortogonale che
diventa strumento per approssimare un elemento generico di uno spazio vettoriale (che nelle applicazioni all’analisi è una funzione) mediante elementi di
un particolare sottospazio (che nelle applicazioni sono funzioni di qualche tipo
particolarmente semplice). In dimensione in…nita, come abitualmente si è in
analisi, l’ortogonalità da sola non basterebbe però a garantire il “buon funzionamento” di questo tipo di teoria: la validità della proprietà di completezza (nel
senso degli spazi di Banach) è essenziale a¢ nché si possano dimostrare teoremi signi…cativamente simili a quelli che valgono in Rn . Da questa sintesi di
idee nasce il concetto di spazio di Hilbert, uno spazio di Banach in cui c’è un
prodotto scalare e quindi un concetto di ortogonalità. L’esempio più naturale
di spazio di Hilbert utile in analisi, in un certo senso prototipo di tutti gli altri,
è lo spazio L2 ( ) delle funzioni a quadrato sommabile in qualche dominio
di Rn . Perciò la teoria degli spazi di Hilbert, pur essendo di per sé una teoria
astratta che utilizza solo i concetti propri degli spazi vettoriali normati, nelle sue
applicazioni interessanti ha bisogno della teoria della misura e dell’integrazione
di Lebesgue. E’ una teoria che nasce quindi dall’incontro tra gli sviluppi dell’analisi funzionale astratta con la teoria della misura moderna. A sua volta,
l’applicazione della teoria astratta degli spazi di Hilbert al contesto concreto
dello spazio L2 ( ) richiede, come vedremo, la conoscenza di particolari “sistemi ortonormali completi”di funzioni. Il sistema trigonometrico fsin nx; cos nxg
comunemente usato nell’analisi di Fourier è il primo fondamentale esempio di
sistemi di questo tipo. A seconda del problema in esame (problemi di approssimazione di funzioni in analisi armonica, problemi ai limiti per equazioni differenziali ordinarie o alle derivate parziali), occorre a volte cercare altri tipi di
sistemi ortonormali completi di funzioni speciali, adattati in qualche senso al
problema in esame.
14.1
Spazi vettoriali con prodotto interno
De…nizione 14.1 Sia V uno spazio vettoriale sul campo K (= R o C). Si. dice
che V è uno spazio vettoriale dotato di prodotto interno, o di prodotto scalare, o
anche che V è uno spazio pre-Hilbertiano, se (oltre alle due operazioni proprie
dello spazio vettoriale, cioè la somma di vettori e il prodotto tra un vettore e
uno scalare) è de…nita una (terza) operazione, che chiamiamo prodotto scalare
147
o prodotto interno,
(; ):V
V !K
con le seguenti proprietà:
1. lineare sulla prima componente:
( x + y; z) =
(x; z) + (y; z)
8x; y; z 2 V; ;
2 K;
2.a. se K = R (caso che maggiormente considereremo in seguito): commutativo
(x; y) = (y; x) 8x; y 2 V ;
2.b. se K = C:
(x; y) = (y; x)
8x; y 2 V
dove indica il coniugato nel campo complesso. Si noti che se K = R dalla
commutatività segue anche la linearità sulla seconda componente, per cui in tal
caso diciamo semplicemente che il prodotto scalare è bilineare; se invece K = C
da 1 e 2.b segue
(z; x + y) =
(z; x) + (z; y)
8x; y; z 2 V; ;
2C
e si dice che il prodotto scalare complesso è sesquilineare. Notiamo anche che
nel caso complesso essendo (x; x) = (x; x), risulta (x; x) reale per ogni x 2 V ,
il che dà senso alla prossima richiesta.
3. Positività:
(x; x)
0 8x 2 V e (x; x) = 0 () x = 0:
Esempio 14.2 1. Lo spazio Rn col prodotto scalare
(x; y) =
n
X
xj yj :
j=1
2. Lo spazio Cn (su C) col prodotto scalare
(x; y) =
n
X
xj yj :
j=1
3. Lo spazio Rn col prodotto scalare
n
X
(x; y) =
aij xj yj
i;j=1
n
dove A = (aij )i;j=1 è una qualsiasi matrice simmetrica e de…nita positiva.
4. Lo spazio C [a; b] (funzioni a valori reali) con
(f; g) =
Z
b
f (t) g (t) dt:
a
148
5. Lo spazio C [a; b] (funzioni a valori complessi) con
(f; g) =
Z
b
f (t) g (t)dt:
a
6. Lo spazio L2 ( ) (funzioni a valori reali o complessi),
misurabile di Rn con
Z
(f; g) =
f (x) g (x)dx:
sottoinsieme
Questo sarà l’esempio più importante nel seguito. Se le funzioni hanno valori
reali ovviamente non c’è bisogno di mettere il coniugato sopra g.
1
7. Lo spazio `2 delle successioni x = fxn gn=1 a valori reali o complessi per
le quali si abbia
1
X
2
jxj j < 1;
j=1
col prodotto scalare
(x; y) =
1
X
xj y j .
j=1
Questo è in un certo senso l’analogo discreto dell’esempio precedente. Si noti
l’analogia con il prodotto scalare usuale di Rn .
In tutto il seguito, per sempli…care le notazioni e le dimostrazioni, tratteremo
sempre spazi vettoriali su R. Quello che diremo vale comunque anche per spazi
complessi, con qualche modi…ca di notazione o nelle dimostrazioni.
Teorema 14.3 Sia V uno spazio pre-Hilbertiano. Allora:
1. Vale la disuguaglianza di Cauchy-Schwarz:
p
p
j(x; y)j
(x; x)
(y; y) 8x; y 2 V:
2. Ponendo
kxk =
p
(x; x)
si ottiene che k k è una norma, che si dice “norma del prodotto interno”. Si
noti che la disuguaglianza di Cauchy-Schwarz si riscrive quindi
j(x; y)j
kxk kyk 8x; y 2 V:
(14.1)
3. La norma del prodotto interno soddisfa l’uguaglianza del parallelogramma:
2
2
2
2
kx + yk + kx yk = 2 kxk + kyk
8x; y 2 V:
149
Dimostrazione. Dimostriamo il teorema lavorando per semplicità con uno
spazio pre-Hilbertiano reale. La dimostrazione di tutti i punti si basa sulle
proprietà assiomatiche del prodotto interno.
1. Per ogni 2 R possiamo scrivere: per la positività del prodotto scalare:
0
( x + y; x + y) =
per la bilinearità del prodotto scalare
2
=
(x; x) + 2 (x; y) + (y; y) =
per de…nizione di norma del prodotto scalare
=
2
2
2
kxk + 2 (x; y) + kyk :
Dunque abbiamo
2
2
kxk + 2 (x; y) + kyk
2
0 8 2 R,
il che implica che il discriminante del trinomio di secondo grado in
ossia
2
2
2
(x; y)
kxk kyk
0
sia
0,
da cui (14.1).
p
2. Ponendo kxk = (x; x) si ha, per la positività del prodotto scalare, la
proprietà di positività della norma. Vale l’omogeneità perché
p
p
p
2 (x; x) = j j
k xk = ( x; x) =
(x; x) = j j kxk :
Vale la disuguaglianza triangolare perché per de…nizione di norma e bilinearità
del prodotto scalare
2
2
2
kx + yk = (x + y; x + y) = (x; x) + 2 (x; y) + (y; y) = kxk + 2 (x; y) + kyk
per la (14.1)
2
2
2
kxk + 2 kxk kyk + kyk = (kxk + kyk)
da cui kx + yk kxk + kyk.
3. Per de…nizione di norma e bilinearità del prodotto scalare si ha:
2
kx + yk + kx
2
yk = (x + y; x + y) + (x y; x y)
= (x; x) + 2 (x; y) + (y; y) + (x; x)
2
2 (x; y) + 2 (y; y)
2
= 2 [(x; x) + (y; y)] = 2 kxk + kyk
:
Ogni spazio pre-Hilbertiano è dunque uno spazio vettoriale normato, la cui
norma “proviene da un prodotto scalare” e soddisfa l’uguaglianza del parallelogramma.
Viceversa, potremmo avere uno spazio vettoriale normato (qualsiasi) e chiederci se esista un prodotto scalare che induca quella norma. Da questo punto di
vista, il fatto che valga l’uguaglianza del parallelogramma risulta una condizione
necessaria, come mostra il prossimo
150
Esempio 14.4 Dimostriamo che la norma di L1 [a; b] non proviene da un prodotto scalare. Si faccia attenzione: è chiaro che il prodotto scalare
Z b
(f; g) =
f (t) g (t) dt
a
1
non induce la norma L (perché induce la norma L2 ); noi stiamo a¤ ermando
però che non esiste alcun prodotto scalare (f; g) per cui si abbia
!2
Z
b
(f; f ) =
a
jf (t)j dt
:
Se un tale prodotto scalare esistesse, la norma L1 dovrebbe soddisfare l’uguaglianza del parallelogramma, cosa che non accade, come ora mostriamo. Consideriamo, in L1 [0; 2]:
f (t) = [0;1] (t) ; g (t) = [1;2] (t) :
Poiché j(f
g) (t)j = 1 in [0; 2], si ha:
Z 2
2
2
kf + gkL1 + kf gkL1 =
dt
2
+
0
2
2
Z
2
2
dt
= 4 + 4 = 8;
0
2 kf kL1 + kgkL1 = 2 (1 + 1) = 4
e l’uguaglianza non vale. Pertanto L1 non è uno spazio pre-Hilbertiano.
Si può dimostrare (v. Esercizio 17.1) che se V è uno spazio vettoriale normato
la cui norma soddisfa l’uguaglianza del parallelogramma, allora il prodotto
i
1h
2
2
2
kx + yk
kxk
kyk
(x; y) =
2
è e¤ettivamente un prodotto scalare, che induce la norma k k. Di conseguenza
l’uguaglianza del parallelogramma caratterizza le norme degli spazi pre-hilbertiani.
Questo fa capire che tutta la geometria dell’ortogonalità è scritta, implicitamente, nella semplice uguaglianza del parallelogramma. Difatti, come vedremo presto, quest’uguaglianza giocherà un ruolo centrale nella dimostrazione
di teoremi importanti.
Il prodotto scalare soddisfa una proprietà di continuità rispetto alla norma
che esso stesso induce:
Teorema 14.5 Sia V uno spazio vettoriale pre-hilbertiano. Per un x 2 H
…ssato, si consideri il funzionale:
T :H!R
T : y 7! (x; y) :
Allora T è un funzionale lineare continuo su X (rispetto alla norma indotta dal
prodotto scalare). Inoltre la norma di T come funzionale è uguale alla norma
dell’elemento x.
151
Dimostrazione. La linearità di T segue dalla bilinearità del prodotto scalare;
la continuità di T segue dalla disuguaglianza di Cauchy-Schwarz:
jT yj = j(x; y)j
kxk kyk
da cui T è continuo con
kT kV 0
kxk .
Di più, risulta kT kV 0 = kxk perché
jT xj = j(x; x)j = kxk
2
da cui jT xj = kxk = kxk e kT kV 0 kxk.
La continuità del prodotto scalare rispetto alla norma signi…ca in particolare
che
yn ! y =) (x; yn ) ! (x; y) .
Si può dimostrare anche:
xn ! x; yn ! y =) (xn ; yn ) ! (x; y) ,
relazione che ci sarà utile in seguito.
In uno spazio vettoriale con prodotto interno si può de…nire in maniera
naturale un concetto di ortogonalità:
De…nizione 14.6 Si dice che x; y 2 V sono ortogonali tra loro, e si scrive
x ? y, se (x; y) = 0:
Vale allora il seguente
Teorema 14.7 (di Pitagora) Siano x1 ; x2 ; :::; xn 2 V elementi a due a due
ortogonali. Allora
n
X
2
xj
j=1
=
n
X
j=1
2
kxj k :
Dimostrazione. Si ha, per de…nizione di norma e bilinearità del prodotto
scalare:
0
1
2
n
n
n
n
X
X
X
X
xj = @
xj ;
xi A =
(xi ; xj )
j=1
j=1
i=1
i;j=1
poiché i vettori sono a due a due ortogonali (xi ; xj ) = 0 per i 6= j, perciò
=
n
X
(xj ; xj ) =
j=1
n
X
j=1
152
2
kxj k :
De…nizione 14.8 Sia S V un insieme qualsiasi di vettori. Si dice complemento ortogonale di S, e si indica con S ? , l’insieme
S ? = fx 2 V : (x; s) = 0 8s 2 Sg :
Teorema 14.9 L’insieme S ? è un sottospazio vettoriale chiuso di V (anche se
S non è un sottospazio).
Dimostrazione. Che sia un sottospazio segue dalla bilinearità del prodotto
scalare: se x; y 2 S ? e ; 2 R si ha, per ogni s 2 S;
( x + y; s) =
(x; s) + (y; s) =
0+
0 = 0:
1
Che sia chiuso segue dalla continuità del prodotto scalare. Infatti sia fxn gn=1
S ? tale che xn ! x 2 V; e proviamo che x 2 S ? . Infatti per ogni s 2 S si ha
(x; s) = lim (xn ; s) = lim 0 = 0;
n!1
n!1
quindi x 2 S ? e S ? è chiuso.
14.2
Spazi di Hilbert
De…nizione 14.10 Si dice spazio di Hilbert uno spazio pre-Hilbertiano completo.
Quindi uno spazio di Hilbert è uno spazio di Banach la cui norma proviene
da un prodotto interno.
Esempio 14.11 Passiamo in rassegna agli Esempi 14.2 di spazi vettoriali con
prodotto interno e vediamo quali di essi sono spazi di Hilbert.
Gli esempi 1, 2, 3, 4 sono …nito dimensionali. Questi sono tutti spazi di
Hilbert, per la completezza di Rn .
Gli esempi 4-5 (funzioni continue, prodotto scalare integrale) danno spazi
non completi (sappiamo già che le norme integrali non rendono completo uno
spazio di funzioni continue), quindi non di Hilbert.
L’esempio 6 è L2 ( ), con il prodotto scalare integrale. Questo è di Hilbert
(completezza degli spazi Lp ), ed è l’esempio più importante per il seguito del
discorso. Si noti che stiamo parlando di L2 su un qualsiasi spazio di misura
astratto ( ; M; ), non solo un dominio di Rn con la misura di Lebesgue.
L’esempio 7 è un caso particolare del precedente quando la misura è quella
del conteggio su N. Si ottiene lo spazio `2 di successioni, col prodotto scalare
che generalizza quello usuale di Rn al caso in…nito dimensionale. In un certo
senso lo spazio `2 si può pensare come una sorta di “spazio R1 ”, dove però la
successione
delle coordinate è soggetta a un vincolo preciso, la convergenza della
P
2
serie
jxn j .
153
Nota storica. La teoria astratta degli spazi di Hilbert fu formulata da von
Neumann alla …ne degli anni 1920, come strumentazione matematica per la meccanica quantistica. In questa sua applicazione, è la teoria degli spazi di Hilbert
complessi quella che serve; questo è il motivo per cui abbiamo dato almeno le
de…nizioni iniziali nel caso complesso. Nel seguito del discorso, per semplicità,
considereremo quasi sempre spazi reali, soprattutto nelle dimostrazioni. Hilbert
fu il primo a introdurre lo spazio `2 , nei primi anni del 1900, e a gettare le basi
per l’interesse per questi tipi di spazi vettoriali in…nito dimensionali. Ricordiamo
che la teoria degli spazi di Banach (di cui quelli di Hilbert sono un caso particolare) ebbe il suo importante avvio con il lavoro di Banach del 1932 “Teoria degli
operatori lineari”, quindi fu successiva alla teoria degli spazi di Hilbert. Segnaliamo anche che, mentre nella nostra trattazione introduttiva ci occuperemo
principalmente della geometria degli spazi di Hilbert e di alcune proprietà dei
funzionali lineari continui su spazi di Hilbert, gli sviluppi più signi…cativi della
teoria degli spazi di Hilbert (così come quella degli spazi di Banach, che non
trattiamo) riguardano la teoria degli operatori lineari de…niti su questi spazi.
Lo studente curioso dell’applicazione della teoria degli spazi di Hilbert alla
meccanica quantistica può leggere, per cominciare, il paragrafo molto elementare
[20, Chap. 6, §6.7.], che rimanda a testi più approfonditi. Avvertiamo comunque
che la teoria degli spazi di Hilbert necessaria per comprenderne le applicazioni
alla meccanica quantistica è molto più ampia di quella qui sviluppata.
Negli spazi di Hilbert il teorema di Pitagora dimostrato in precedenza si
estende a somme in…nite, al modo seguente:
1
Teorema 14.12 (di Pitagora, 2a versione) Se fxj gj=1 è una successione di
elementi di
spazio di Hilbert H a due a due
Puno
P1ortogonali e tali che la serie
1
2
numerica j=1 kxj k converge, allora la serie j=1 xj converge in H e vale la
1
X
2
xj
=
1
X
j=1
j=1
2
kxj k :
Dimostrazione. Possiamo anzitutto applicare il teorema di Pitagora in versione …nita ad ogni somma parziale della serie, e scrivere
m
X
j=n
2
xj
=
m
X
j=n
2
kxj k :
(14.2)
P1
2
Poiché la serie numerica j=1 kxj k converge, le sue somme parziali sono una
Pm
2
successione di Cauchy, quindi j=n kxj k ! 0 per n; m ! 1: Per l’uguaglianza
Pm
(14.2) le somme parziali di j=n xj sono allora una successione di Cauchy in
H, ed essendo lo spazio completo la serie converge. Dunque esiste x 2 H tale
154
che
n
X
j=1
n
X
xj ! x; perciò
2
2
xj
! kxk :
j=1
Pn
D’altro canto
2
j=1
xj
=
Pn
(14.3)
2
j=1
n
X
j=1
kxj k ; perciò
2
2
kxj k ! kxk .
(14.4)
Da (14.3) e (14.4) segue
1
X
j=1
1
X
2
kxj k =
2
xj
:
j=1
Il risultato fondamentale sulla geometria degli spazi di Hilbert è il seguente:
Teorema 14.13 (Distanza da un sottospazio chiuso, o Teorema della
proiezione). Sia H uno spazio di Hilbert e V un suo sottospazio vettoriale
chiuso. Allora per ogni x 2 H esiste un unico v 2 V di minima distanza da x,
ossia tale che
kx vk = inf kx vk :
v2V
Inoltre x
v è ortogonale a V . L’elemento v si dice proiezione di x su V .
Dimostrazione. Proviamo l’esistenza. Se x 2 V basta porre v = x, perciò
supponiamo x 2
= V . Sia d = inf v2V kx vk. (Questo inf esiste perché V non
1
è vuoto e kx vk 0). Sia fxn gn=1 V una successione minimizzante, ossia
tale che
kx xn k ! d:
(Tale successione esiste per de…nizione di estremo inferiore). Proviamo che
questa successione è di Cauchy. Si utilizza a questo scopo l’uguaglianza del
parallelogramma:
kxn
2
xm k = k(xn
x) + (x
=
x)
k(xn
Ora, per n; m ! 1 si ha:
kxn
k(xn
x)
(x
2
(x
xk ! d2 ;
2
xm )k
2
2
xm )k + 2 kxn
kx
2
xm )k = kxn + xm
155
2
xk + kx
xm k
:
2
xm k ! d2 ;
2
2xk = 4
xn + xm
2
2
x
4d2
perché, essendo V un sottospazio vettoriale, xn ; xm 2 V =)
segue che
2
lim kxn xm k
4d2 + 2 d2 + d2 = 0;
xn +xm
2
2 V: Ne
n;m!1
1
cioè kxn xm k ! 0, ossia fxn gn=1 è di Cauchy. Poiché H è completo, esiste
allora v 2 H tale che xn ! v; inoltre, poiché V è un sottospazio chiuso di H,
v 2 V . In…ne, poiché
kxn
kxn
xk ! kv
xk ! d;
xk e
si ha kv xk = d. Questo completa la dimostrazione dell’esistenza dell’elemento
di V di minima distanza da x.
Proviamo ora l’unicità. Siano dunque v1 ; v2 due elementi di V tali che
kvi
xk = d per i = 1; 2
e proviamo che allora v1 = v2 . Si usa ancora l’uguaglianza del parallelogramma,
in modo simile a quello già visto:
kv1
2
2
v2 k = k(v1
x) + (x
v2 )k
=
k(v1
x)
(x
=
4
v1 + v2
2
x
2
v2 )k + 2 kv1
2
xk + kx
v2 k
2
2
+ 2 d2 + d2
4d2 + 4d2 = 0
2
2
in quanto v1 ; v2 2 V ) v1 +v
2 V ) v1 +v
x
d: Dunque kv1 v2 k = 0,
2
2
ossia v1 = v2 :
Prima di dimostrare l’ultimo punto del teorema (ortogonalità di x v a V )
ragioniamo sul signi…cato geometrico di questa proprietà, lasciandoci guidare
dall’analogia con il caso …nito dimensionale. Se V è un sottospazio (chiuso) di
H e x è un elemento di H che non appartiene a V , dal punto di vista geometrico
chi sarà l’elemento v 2 V di minima distanza da x? Sarà la proiezione ortogonale
di x su V . Questo signi…ca appunto che x v è ortogonale a tutti gli elementi
156
di V .
Dimostriamolo. Sia w = x v, v 2 V qualsiasi, e proviamo che (w; v) = 0.
Per ogni 2 R, scriviamo (essendo v + v 2 V e kwk = d)
kwk
2
2
kx
(v + v)k = k(x
= (w
v; w
2
= kwk
v) = (w; w)
2 (v; w) +
2
kvk
da cui
2 (v; w)
Ponendo
v)
2
kvk
2
2
vk = kw
2 (v; w) +
2
vk
2
(v; v)
2
8 2 R:
= tsgn(v; w) con t > 0 la precedente si riscrive così
2t j(v; w)j
t2 kvk
2
8t > 0;
da cui dividendo per t e facendo tendere t a zero si ottiene (v; w) = 0, che è la
tesi.
Corollario 14.14 (Decomposizione ortogonale di H rispetto a un suo
sottospazio chiuso). Se H è uno spazio di Hilbert e V un suo sottospazio
chiuso si ha:
H = V V ?;
dove si legge somma diretta e signi…ca quanto segue:
ogni elemento x 2 H si può scrivere come somma di un elemento v 2 V e
un elemento v 0 2 V ? , inoltre V \ V ? = f0g. Le due cose insieme implicano che
la scrittura x = v + v 0 con v 2 V e v 0 2 V ? è unica.
Dimostrazione. Sia V un sottospazio chiuso di H. Se V = H allora V ? = f0g
e la tesi è ovvia. Altrimenti, preso un x 2 H, per il Teorema della proiezione
possiamo scrivere x = v + (x v) con v 2 V e (x v) 2 V ? . E’ poi ovvio
che V \ V ? = f0g in quanto se x 2 V \ V ? si ha (x; x) = 0 e quindi x = 0.
157
Mostriamo anche che la scrittura di un elemento x 2 H nella forma x = v + v 0
con v 2 V e v 0 2 V ? è unica. Supponiamo che esistano due scritture
x = v1 + v10 = v2 + v20
con v1 ; v2 2 V; v10 ; v20 2 V ? . Allora si ha:
v1
v2 = v20
v10 :
Il primo membro è un elemento di V , il secondo membro è un elemento di V ? ,
allora poiché V \ V ? = f0g si ha v1 v2 = 0 = v20 v10 da cui v1 = v2 , v10 = v20
ossia la scrittura è unica.
15
Funzionali lineari continui su uno spazio di
Hilbert
Abbiamo visto in precedenza (v. Teorema 14.5) che ogni elemento xdi uno spazio
di Hilbert permette di de…nire un funzionale lineare continuo su Hmediante
prodotto scalare con x stesso. In altre parole,
ad ogni x 2 H è associato un Tx 2 H 0 tale che
Tx : H ! R
Tx : y 7! (y; x) ;
e risulta kTx kH 0 = kxkH :
Un risultato fondamentale sugli spazi di Hilbert a¤erma che vale anche il
viceversa: ogni funzionale lineare continuo è necessariamente del tipo appena
descritto.
Teorema 15.1 (di rappresentazione di Riesz) Sia H uno spazio di Hilbert
e T un funzionale lineare continuo su H (ossia T 2 H 0 ). Allora esiste un unico
x 2 H che rappresenta T , nel senso che
T y = (y; x) per ogni y 2 H:
Inoltre kT kH 0 = kxkH : Si dice perciò che il duale H 0 di uno spazio di Hilbert
H si può identi…care con H stesso.
Dimostrazione. Proviamo prima l’esistenza di x. Se T è il funzionale identicamente nullo basta porre x = 0, quindi supponiamo che T non sia identicamente
nullo. Per provare l’esistenza di x, proviamo prima a “indovinare” chi può essere. Se esiste x tale che T y = (y; x), T y si annullerà per tutti gli y ortogonali
a x; dunque x è un opportuno elemento ortogonale all’insieme degli y su cui si
annulla T . Guidati da quest’idea, consideriamo il nucleo di T , ossia l’insieme:
KerT = fy 2 H : T y = 0g :
158
Si dimostra facilmente che KerT è un sottospazio vettoriale di H (per linearità di T ) ed è chiuso (per continuità di T ). Allora per il Corollario 14.14
possiamo scrivere
H = KerT KerT ? .
Sia z 2 KerT ? con kzk = 1 (poiché stiamo supponendo T non identicamente
nullo, KerT non esaurisce H, perciò KerT ? ha elementi non nulli e quindi,
essendo uno spazio vettoriale, ha elementi non nulli di norma unitaria). In base
al ragionamento iniziale, l’elemento x che cerchiamo dovrebbe essere del tipo
x = z per qualche 2 R. Il prossimo argomento determinerà in modo che
x = z soddis… e¤ettivamente la proprietà richiesta.
Per ogni y 2 H; l’elemento
Ty
z
y
Tz
appartiene a KerT; in quanto
T
Ty
z
Tz
y
Ty
T z = 0:
Tz
= Ty
(Si noti che ha senso dividere per T z in quanto z è un elemento non nullo di
KerT ? , quindi T z 6= 0): Allora y TT yz z è ortogonale a z, quindi,
0=
z; y
Ty
z
Tz
Ty
(z; z) = (z; y)
Tz
= (z; y)
Ty
;
Tz
da cui
T y = T z (z; y) = (x; y) ;
avendo posto
x = (T z) z:
Questo prova l’esistenza. Il fatto che risulti kT kH 0 = kxkH è già stato provato
nel Teorema 14.5 (ora che sappiamo che T = Tx ).
Proviamo l’unicità. Se esistono due elementi x1 ; x2 2 H tali che
T y = (y; x1 ) = (y; x2 ) per ogni y 2 H
ne segue
(y; x2
e scegliendo y = x2
x1 ) = 0 per ogni y 2 H;
x1 si ottiene x2
x1 = 0; da cui l’unicità.
Osservazione 15.2 (Duale di L2 ( )) Osserviamo che nel caso particolare H =
L2 ( ) ; il teorema precedente garantisce che ogni funzionale lineare continuo su
L2 si rappresenti nella forma
Z
Tf =
fg
0
per qualche g 2 L2 ( ). Ritroviamo quindi il risultato di dualità L2 ( ) =
L2 ( ) ; che è un caso particolare del teorema (che abbiamo enunciato ma non
dimostrato) secondo cui il duale di Lp ( ) è Lq ( ) con p; q esponenti coniugati,
se 1 p < 1.
159
Il teorema precedente è un risultato fondamentale. Vediamo subito una delle
sue conseguenze importanti: il teorema di Lax-Milgram, che gioca un ruolo
fondamentale nella formulazione debole dei problemi ai limiti per equazioni a
derivate parziali, di cui ci occuperemo nell’ultima parte del corso. Premettiamo
qualche de…nizione.
De…nizione 15.3 Sia H uno spazio di Hilbert. Si dice forma bilineare su H
una funzione
a( ; ) : H H ! R
che è lineare in ognuno dei due argomenti, quando l’altro è …ssato. Esplicitamente, signi…ca che, per ogni u; v; w 2 H e ; 2 R è
a ( u + v; w) = a (u; w) + a (v; w)
a (w; u + v) = a (w; u) + a (w; v) :
Una forma bilineare su H si dice:
continua se esiste una costante c > 0 tale che
ja (u; v)j
c kuk kvk per ogni u; v 2 H;
coerciva se esiste una costante c0 > 0 tale che
a (u; u)
2
c0 kuk per ogni u 2 H;
simmetrica se
a (u; v) = a (v; u) per ogni u; v 2 H:
Esempio 15.4 1. In qualunque spazio di Hilbert, il prodotto scalare è una forma bilineare simmetrica, continua (con c = 1, per la disuguaglianza di CauchySchwarz) e coerciva (con c = 1, per de…nizione di norma del prodotto scalare).
2. In Rn una forma bilineare ha sempre la forma:
a (u; v) =
n
X
aij ui vj
i;j=1
n
per un’opportuna matrice A = (aij )i;j=1 . La forma bilineare è simmetrica se la
matrice A è simmetrica; è sempre continua; è coerciva se la matrice è de…nita
positiva, con c =minimo autovalore di A.
3. In L2 ( ) si consideri
Z
a (u; v) =
(x) u (x) v (x) dx;
con funzione L1 ( ) assegnata. Questa è una forma bilineare simmetrica e
continua, qualunque sia 2 L1 ( ). E’ coerciva solo se (x) c0 > 0 quasi
ovunque in .
160
Veniamo al risultato annunciato:
Teorema 15.5 (di Lax-Milgram) Sia H uno spazio di Hilbert e a (u; v) una
forma bilineare continua e coerciva su H. Si consideri il seguente problema:
(P). Assegnato T 2 H 0 (cioè T funzionale lineare continuo su H), determinare u 2 H tale che
a (u; v) = T v per ogni v 2 H:
Sotto le ipotesi precedenti, per ogni T 2 H 0 esiste uno e un solo u 2 H
soluzione del problema (P). Inoltre vale la seguente stima di stabilità:
kukH
1
kT kH 0
c0
dove c0 è la costante che compare nell’ipotesi di coercività.
Questo teorema servirà per provare un risultato di esistenza, unicità e dipendenza continua dai dati, per certi problemi ai limiti per equazioni a derivate
parziali, dopo che questi avranno avuto un’opportuna “formulazione debole”.
Tutto ciò sarà spiegato in dettaglio nell’ultima parte del corso. Per il momento vediamo questo teorema come un risultato astratto di esistenza, unicità e
dipendenza continua dal termine noto T , per la soluzione del problema astratto (P). “Dipendenza continua” signi…ca quanto segue. Il problema è lineare,
nel senso che se u1 ; u2 sono soluzioni del problema (P) con assegnati T1 ; T2
rispettivamente, allora u1 + u2 sarà soluzione del problema (P) con assegnato
T1 + T2 . In particolare allora la stima di stabilità implica che, con le notazioni
precedenti,
1
ku1 u2 kH
kT1 T2 kH 0 ,
c0
stima che si può interpretare al modo seguente: se il dato T1 è vicino al dato
T2 ; anche la soluzione corrispondente a T1 è vicina alla soluzione corrispondente
a T2 . In questo senso la soluzione è stabile rispetto a una perturbazione del
termine noto, o anche “dipende con continuità dal termine noto”.
Dimostrazione. Per semplicità dimostriamo il teorema sotto un’ipotesi aggiuntiva: che la forma bilineare sia anche simmetrica. (La dimostrazione in
assenza di quest’ipotesi è sensibilmente più elaborata, e quest’ipotesi risulterà
veri…cata in diverse applicazioni signi…cative che faremo di questo teorema).
Notiamo che una forma bilineare simmetrica e coerciva su H soddisfa gli
assiomi di prodotto scalare. In altre parole, se poniamo
(u; v) = a (u; v)
(l’asterisco ricorda che questo non è il prodotto scalare originale in H; ma uno
diverso), si ha che:
(u; v) è bilineare perché la forma è bilineare;
(u; v) è commutativo perché la forma è simmetrica;
161
vale la proprietà di positività perché la forma è coerciva:
(u; u) = a (u; u) c0 kuk 0; quindi (u; u) = 0 =) kuk = 0 e u = 0.
Consideriamo ora la norma indotta da questo nuovo prodotto scalare:
q
kuk = (u; u) :
Per la continuità e coercività, risulta:
q
p
p
2
kuk = a (u; u)
c kuk = c kuk
q
p
p
2
kuk = a (u; u)
c0 kuk = c0 kuk
ossia
p
c0 kuk
kuk
p
c kuk per ogni u 2 H:
Le due norme sono dunque equivalenti ; in particolare questo signi…ca che se T
è un funzionale lineare su H continuo rispetto alla norma originaria, kuk, lo è
anche rispetto alla norma kuk : Infatti, per ogni v 2 H si ha
r
p
p
c
kT vk
kT kH 0 kvk :
c kT vk
c kT kH 0 kvk
c0
Possiamo allora applicare il teorema di rappresentazione di Riesz allo spazio di
Hilbert H dotato del prodotto scalare (u; v) ed a¤ermare che esiste uno e un
solo elemento u 2 H tale che
(u; v) = T v per ogni v 2 H; cioè
a (u; v) = T v per ogni v 2 H;
che è quanto volevamo provare. Quanto alla norma di u, si ha:
c0 kuk
2
a (u; u) = T u
da cui
kuk
kT kH 0 kuk ;
1
kT kH 0
c0
che è la stima di stabilità.
16
Analisi di Fourier in spazi di Hilbert
Andremo ora più a fondo del concetto di ortogonalità, vedendo come opportuni
sistemi di vettori ortogonali possano costituire, in uno spazio di Hilbert astratto
così come avveniva in Rn , un buon “sistema di riferimento”.
n
1
De…nizione 16.1 Un insieme …nito fej gj=1 o numerabile fej gj=1 di elementi
di H si dice sistema ortonormale se
(ei ; ej ) =
0 se i 6= j
1 se i = j:
In altre parole, i vettori sono a due a due ortogonali, e ciascuno ha norma
unitaria.
162
Notazione. In questo paragrafo considereremo spesso combinazioni lineari
di vettori, ed è importante distinguere a colpo d’occhio i vettori dalle costanti
che li moltiplicano. Cambiando leggermente notazioni quindi, scriveremo ad
n
esempio ej j=1 per indicare i vettori e
n
X
cj ej
j=1
per indicare una loro combinazione lineare, dove le cj sono costanti.
Cominciamo con l’illustrare alcuni procedimenti e idee che riguardano i
sottospazi di dimensione …nita di uno spazio di Hilbert.
Ricordiamo anzitutto che in base al teorema di Pitagora in spazi di Hilbert
si può scrivere:
n
X
2
cj ej
=
j=1
n
X
cj ej
2
j=1
=
n
X
j=1
2
jcj j :
(16.1)
Quest’uguaglianza in particolare implica che vettori che costituiscono un
sistema ortonormale …nito sono sempre linearmente indipendenti. Infatti se
n
X
cj ej = 0
j=1
per certe costanti c1 ; c2 ; :::; cn , in base a (16.1) si ha
n
X
j=1
2
jcj j = 0
e quindi cj = 0 per j = 1; 2; :::; n; perciò i vettori sono indipendenti.
Un sistema ortonormale …nito costituisce quindi una base dello spazio vettoriale da essi generato. Viceversa, se V0 è un sottospazio …nito dimensionale di
n
H, data una qualsiasi base uj j=1 di V0 è sempre possibile a partire da questa
generarne un’altra che sia costituita da vettori ortonormali. E’su¢ ciente adoperare il procedimento di ortonormalizzazione di Gram-Schmidt, che illustriamo
iterativamente così:
e1 = vers (u1 )
(dove, qui e nel seguito, indichiamo vers (u) =
e2 = vers (u2
u
kuk );
(u2 ; e1 ) e1 )
(spiegazione: dopo aver normalizzato il primo vettore, consideriamo il secondo e
gli sottraiamo la sua componente nella direzione del primo; così u2 (u2 ; e1 ) e1
risulta ortogonale a e1 ; ora lo normalizziamo e abbiamo e2 );
e3 = vers (u3
(u3 ; e1 ) e1
163
(u3 ; e2 ) e2 )
e così via …no a ottenere una base ortonormale ej
n
j=1
di V0 .
Supponiamo ora che V0 , sottospazio …nito dimensionale di H, sia dotato
n
di una base ortonormale ej j=1 (cosa che, come appena visto, si può sempre
supporre). Dato un elemento x2 H; il suo elemento di minima distanza da V0
(che sappiamo già esistere in base al teorema delle proiezioni) non è altro che:
PV0 x =
n
X
x; ej ej :
j=1
Infatti PV0 x 2 V0 e si veri…ca facilmente che x PV0 x 2 V0? . E’ su¢ ciente
calcolare per k = 1; 2; :::; n il prodotto scalare
(x
PV0 x; ek ) = (x; ek )
n
X
x; ej
ej ; ek = (x; ek )
(x; ek ) = 0:
j=1
Quindi la scrittura
x = PV0 x + (x
PV0 x)
mostra, in base al teorema delle proiezioni, che l’elemento di minima distanza di
x da V0 è proprio PV0 x: Ecco quindi che la conoscenza di una base ortonormale
in V0 dà un algoritmo semplice ed esplicito per calcolare l’elemento di minima
distanza di un vettore qualunque da V0 ; mediante la sua proiezione ortogonale.
Prima di proseguire sarà utile illustrare queste idee con un esempio concreto:
Esempio 16.2 Determinare il polinomio di grado
2 che approssima meglio
la funzione f (x) = sin ( x) in L2 (0; 1) :
Ragioniamo così: sia V0 lo spazio vettoriale dei polinomi di grado
2 su
[0; 1]. E’ uno spazio vettoriale di dimensione …nita (3), quindi chiuso; è un
sottospazio di L2 (0; 1) : Il polinomio di grado
2 che approssima meglio la
funzione f in L2 (0; 1) è la proiezione di f su V0 . Per calcolarla, dobbiamo prima costruire una base ortonormale in V0 . Per farlo, partiamo da una base
qualunque di V0 , sceglieremo quella più semplice, costituita da 1; x; x2 , e la
ortonormalizziamo in L2 (0; 1) mediante il procedimento di Gram-Schmidt:
e1 = vers (1) =
1
R1
0
Z
0
1
x
12 dx
1=2
= 1:
e2 = vers (x (x; e1 ) e1 ) ;
Z 1
1
(x; 1) =
xdx = ;
2
0
!1=2 r
2
1
1
1
dx
=
= p ;
2
12
2 3
p
1
e2 = 2 3 x
;
2
e3 = vers x2
164
x2 ; e1 e1
x2 ; e2 e2 ;
2
x ;1 =
Z
1
x2 dx =
0
2
x ; e2 =
Z
1
2
1
;
3
p
1
3
dx =
;
2
6
p
3 p
2 3 x
6
p
x 2 3 x
0
x2
x2 ; e1 e1
x2 ; e2 e2
L2
0
=@
Z
1
3
x2
0
Z
=
1
1
1
x+
6
2
x
0
p
e3 = 6 5 x2
1
6
x+
!1=2
2
dx
1
2
=p
1
2
p
e3 = 6 5 x2
:
;
x+
1
6
:
Ora bisogna calcolare la proiezione di f su V0 ; cioè:
PV0 f = (f; e1 ) e1 + (f; e2 ) e2 + (f; e3 ) e3 :
Calcoliamo dunque:
Z 1
2
(f; e1 ) =
sin ( x) dx = ;
0
(f; e2 ) =
Z
1
p
sin ( x) 2 3 x
0
(f; e3 ) =
Z
1
1
2
p
sin ( x) 6 5 x2
dx = 0;
1
x+
6
0
dx =
p
2 5
2
3
Perciò
PV0 f =
=
2
+
60
p
2 5
2
12
3
2
12
3
x2
165
p
6 5 x2
x +
12
x+
2
1
6
120
3
:
12
11=2
dxA
1
1
= p ;
180
6 5
Ricapitoliamo: una base ortonormale di V0 è costituita dai 3 vettori:
e1 = 1;
p
e2 = 2 3 x
!2
:
Rappresentiamo la funzione f insieme alla sua approssimante:
Supponiamo ora di avere a disposizione (e vedremo in seguito che sarà pro1
prio così in molti esempi interessanti) una successione ej j=1 di vettori che
costituiscono un sistema ortonormale. I procedimenti illustrati precedentemente
si possono applicare iterativamente ai primi n vettori di questa successione, per
n crescente. Si ottiene allora il seguente importante risultato:
1
Teorema 16.3 (Disuguaglianza di Bessel) Se ej j=1 è un sistema ortonormale in uno spazio di Hilbert H; per ogni x2 H vale la disuguaglianza (di
Bessel):
1
X
2
2
x; ej
kxk :
j=1
In particolare, la serie a primo membro converge. Inoltre:
x
n
X
2
x; ej ej
= kxk
j=1
n
X
2
x; ej
2
:
(16.2)
j=1
Dimostrazione. Applichiamo il teorema delle proiezioni e quanto sopra ossern
vato al sottospazio V0 generato dai primi n vettori ej j=1 . Si ha:
n
X
x; ej
j=1
2
2
= kPV0 xk
kxk
2
per n = 1; 2; 3; ::: Passando al limite per n ! 1 si ha la tesi (ricordiamo che
una serie numerica a termini positivi con somme parziali superiormente limitate
è convergente).
D’altro canto la scomposizione
x = PV0 x + (x
PV0 x)
dà, per l’ortogonalità,
2
2
kxk = kPV0 xk + kx
166
PV0 xk
2
e quindi
x
n
X
j=1
2
x; ej ej
= kx
2
PV0 xk = kxk
2
2
kPV0 xk = kxk
2
n
X
x; ej
2
:
j=1
L’idea dell’analisi di Fourier in spazi di Hilbert è approssimare un elemento
x di H mediante la sua proiezione su opportuni sottospazi …nito dimensionali.
Pn
2
Poiché al crescere di n la somma j=1 x; ej
aumenta, dalla (16.2) del teore2
ma precedente leggiamo che la distanza kx PV0 xk diminuisce. Ci piacerebbe
poter a¤ermare che questa distanza non solo diminuisce ma tende a zero. Signi…cherebbe che abbiamo un metodo per approssimare bene quanto vogliamo
un generico elemento di uno spazio di Hilbert, mediante combinazioni lineari di
elementi del sistema ortonormale …ssato. D’altro canto a¢ nché questo accada è
1
necessario che il sistema ortonormale ej j=1 sia su¢ cientemente ricco da “catturare tutte le direzioni di H”: se ad esempio in R3 considerassimo un sistema
ortonormale costituito da soli due vettori, certamente non potremmo approssimare bene quanto vogliamo un generico elemento di R3 con combinazioni lineari
di questi due vettori. Questo porta alla seguente
De…nizione 16.4 Sia H uno spazio di Hilbert. Un sistema ortonormale ej
in H si dice completo se per ogni x2 H,
x; ej = 0
8j
1
j=1
=) x = 0:
Si può dimostrare che:
Teorema 16.5 In ogni spazio di Hilbert separabile esiste un sistema ortonormale completo, nel senso della precedente de…nizione20 .
Ricordiamo che “separabile” signi…ca: che contiene un sottoinsieme denso
numerabile. Ad esempio, se
è un sottoinsieme misurabile di Rn lo spazio
L2 ( ) è separabile. Questo è l’ esempio fondamentale che ci interesserà nel
seguito. Dal punto di vista pratico il teorema precedente non è così importante
nel senso che quando si applica la teoria di solito si conosce esplicitamente un
sistema ortonormale completo, dunque non c’è bisogno di appellarsi a un risultato astratto per garantirne l’esistenza. Ad esempio, come vedremo, in L2 [a; b]
il classico sistema trigonometrico è l’esempio più noto di sistema ortonormale
completo.
Il prossimo teorema condensa i risultati fondamentali di analisi di Fourier in
spazi di Hilbert:
2 0 Si può dare una de…nizione di sistema ortonormale, e quindi di sistema ortonormale completo, non solo …nito o numerabile, ma di cardinalità qualsiasi. Il teorema allora andrebbe
riformulato dicendo “In ogni spazio di Hilbert separabile esiste un sistema ortonormale completo numerabile ”. Non entriamo in questi dettagli perché non ci interesseranno mai spazi di
Hilbert non separabili.
167
Teorema 16.6 (Serie e trasformata di Fourier in spazi di Hilbert) Sia H
1
uno spazio di Hilbert e ej j=1 un sistema ortonormale completo. Per ogni
x2 H; poniamo
x
bj = x; ej per j = 1; 2; 3; :::
Allora
1. La serie di Fourier di x converge in H ad x, cioè:
x=
1
X
j=1
2. L’operatore
x
bj ej
1
F : x 7! fb
xj gj=1
detto trasformata di Fourier su H, è lineare e continuo a valori nello spazio di
successioni `2 ; più precisamente, F è una isometria tra spazi di Hilbert, cioè è
biunivoca e conserva il prodotto scalare e la norma, ossia:
x; y =
1
X
j=1
x
bj ybj 8x; y 2 H (uguaglianza di Plancherel)
(il coniugato ybj è necessario se H è uno spazio di Hilbert complesso);
2
kxk =
1
X
j=1
2
jb
xj j
8x; y 2 H (uguaglianza di Perceval).
Dimostrazione.
L’operatore F è evidentemente lineare; per la disuguaglianza
P1
2
2
1
di Bessel, j=1 jb
xj j
kxk ; in particolare fb
xj gj=1 2 `2 .
1
Mostriamo che F è suriettiva. Data una successione fcj gj=1 2 `2 ; cioè
P1
P1
2
tale che j=1 jcj j < 1; per il Teorema di Pitagora 14.12 la serie j=1 cj ej
converge in H ad un certo elemento x; calcoliamo ora:
!
1
X
x
bj = x; ej =
ck ek ; ej =
k=1
per linearità e continuità del prodotto scalare
=
1
X
ck ek ; ej
k=1
per l’ortonormalità del sistema
= cj .
1
1
xj gj=1 = fcj gj=1 ;
Dunque abbiamo costruito un elemento x2 H tale che fb
perciò F è suriettiva.
1
L’iniettività di F segue dalla completezza del sistema ej j=1 : se x
bj = 0
8j ossia x; ej
= 0 8j; allora x= 0; per de…nizione di sistema ortonormale
168
completo. Dunque F è lineare e biunivoca tra H e `2 . Mostriamo ora che la
serie di Fourier di x converge proprio a x. Segue ancora dalla completezza del
sistema, infatti:
!
1
X
(16.3)
x
(x; ek ) ek ; ej =
k=1
per la linearità e la continuità del prodotto scalare
= x; ej
1
X
k=1
(x; ek ) ek ; ej = x
bj
per l’ortonormalità del sistema
=x
bj
1
X
k=1
x
bk ek ; ej
x
bj = 0:
Dunque essendo il prodotto scalare (16.3) nullo per ogni j, per la completezza
del sistema segue che
1
X
x
(x; ek ) ek = 0; ossia
k=1
x=
1
X
k=1
x
bk ek ,
che è la convergenza della serie di Fourier.
Sapendo questo, l’uguaglianza di Plancherel segue dalla bilinearità e continuità del prodotto scalare:
1
0
1
1 X
1
1
X
X
X
x; y = @
x
bk ek ;
ybj ej A =
x
bk ybj ek ; ej =
k=1
j=1
e per l’ortonormalità
=
k=1 j=1
1
X
j=1
x
bk ybj :
In…ne, l’uguaglianza di Perceval segue dall’uguaglianza di Plancherel per y= x:
Come si vede, gli spazi di Hilbert dotati di un sistema ortonormale completo
numerabile (cioè, per il Teorema 16.5, gli spazi di Hilbert separabili ) sono un
ambiente estremamente naturale per l’analisi di Fourier: i risultati del teorema
precedente sono infatti esaurienti e “puliti”: la serie di Fourier di qualsiasi
elemento x converge ad x, e la trasformata di Fourier è un’isometria tra spazi
di Hilbert, il che signi…ca che tutta l’informazione che identi…ca l’elemento x è
1
codi…cata nella successione numerica fb
xj gj=1 . Naturalmente per applicare la
teoria ad uno spazio di funzioni concreto occorre conoscerne esplicitamente un
sistema ortonormale completo. Nel seguito incontreremo alcuni esempi espliciti
di sistemi ortonormali completi in vari spazi di Hilbert di tipo L2 ( ).
Si ri‡etta anche sul fatto che qualsiasi spazio di Hilbert separabile risulta
identi…cato, tramite la trasformata di Fourier, con lo spazio `2 ; dal punto di
vista della struttura astratta esiste quindi un solo spazio di Hilbert separabile!
169
17
Esercizi sulla Parte 3
A. Spazi di Hilbert
Es 17.1 Sia X uno spazio vettoriale normato la cui norma soddisfa l’uguaglianza del parallelogramma
2
kx + yk + kx
2
2
yk = 2 kxk + kyk
2
8x; y 2 X:
(NON si sta supponendo a priori che tale norma provenga da un prodotto
scalare).
a. Provare che allora vale l’uguaglianza del parallelepipedo:
2
2
2
kx1 + x2 + x3 k = kx1 + x2 k + kx1 + x3 k + kx2 + x3 k
2
2
2
8x1 ; x2 ; x3 2 X: (Perché si chiama così? Visualizzare il signi…cato geometrico
in R3 ).
b. Provare che se si de…nisce
(x; y) =
1h
2
kx + yk
2
2
kxk + kyk
2
i
;
(17.1)
questo “prodotto scalare” soddisfa e¤ ettivamente la proprietà
(u + v; w) = (u; w) + (v; w) :
c. Dal risultato del punto precedente dedurre, successivamente, le seguenti
proprietà
( u; v) = (u; v)
(nu; w) = n (u; w) per n = 1; 2; 3; :::
1
u; w
n
=
( u; v) =
1
(u; v) per n = 1; 2; 3; :::
n
(u; v) per ogni
2Q
d. Dalla de…nizione (17.1) dedurre la proprietà di continuità:
Se xn ! x in X; allora (xn ; y) ! (x; y) per ogni y 2 X:
e. Sfruttando il punto d e l’ultima proprietà del punto c, provare che:
( u; v) =
(u; v) per ogni
2 R:
Risulta così completamente dimostrato che: se in uno spazio vettoriale normato
la norma soddisfa l’uguaglianza del parallelogramma, allora necessariamente
tale norma deriva da un prodotto scalare.
170
2
kx1 k + kx2 k + kx3 k
Es 17.2 In L2 ( 1; 1) ; si consideri il sottospazio V generato dalle funzioni:
1; x; x2 ; x3 :
Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo
di ortonormalizzazione di Gram-Schmidt.
[Osservazione: iterando questo metodo …no a una potenza n qualunque si
costruiscono i polinomi di Legendre].
2
Es 17.3 In R si metta la misura Gaussiana d = e x dx: Si consideri lo spazio
di Hilbert H = L2 (R; d ), cioè lo spazio delle funzioni per cui si ha:
kf kL2 (R;d
)
=
Z
e
x2
1=2
2
f (x) dx
R
< 1:
Si consideri ora il sottospazio V generato dalle funzioni:
1; x; x2 ; x3 :
Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo
di ortonormalizzazione di Gram-Schmidt.
[Osservazione: iterando questo metodo …no a una potenza n qualunque si
costruiscono i polinomi di Hermite].
Es 17.4 In R+ = (0; +1) si metta la misura d = e x dx: Si consideri lo spazio
di Hilbert H = L2 (R+ ; d ), cioè lo spazio delle funzioni per cui si ha:
kf kL2 (R+ ;d
)
=
Z
1=2
+1
e
x
2
f (x) dx
0
< 1:
Si consideri ora il sottospazio V generato dalle funzioni:
1; x; x2 ; x3 :
Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo
di ortonormalizzazione di Gram-Schmidt.
[Osservazione: iterando questo metodo …no a una potenza n qualunque si
costruiscono i polinomi di Laguerre].
Es 17.5 Si supponga di eseguire i due procedimenti seguenti:
a. Nello spazio L2 (0; 1) si ortonormalizzano le funzioni 1; x; x2 ; x3 (in quest’ordine).
b. Nello spazio L2 (0; 1) si ortonormalizzano le funzioni x3 ; x2 ; x; 1; (in
quest’ordine).
Allora:
Si trovano gli stessi due insiemi di vettori. Vero o falso?
Si trovano due sistemi di vettori che generano lo stesso spazio vettoriale.
Vero o falso?
171
Es 17.6 Esibire un sistema ortonormale completo nello spazio `2 delle successioni reali a serie dei quadrati convergente.
Es 17.7 Nello spazio di Hilbert H = L2 ((0; +1) ; e x dx), sia V0 il sottospazio
chiuso dei polinomi di grado 2. Dopo aver costruito una base ortonormale di
V0 , calcolare la proiezione su V0 della funzione f (t) = sin t.
Es 17.8 Di ciascuna delle seguenti forme bilineari sullo spazio di Hilbert speci…cato, dire se è simmetrica o no, continua o no, coerciva o no, giusti…cando le
proprie risposte.
R1
1: a (f; g) = 1 sin ( t) f (t) g (t) dt
su L2 ( 1; 1)
2: a x; y = x1 y1 + 2x1 y2 3x2 y1 + 4x2 y2 su R2
R +1
3: a (f; g) = 3 1 f (t) g 0 (t) dt
su H 1 (R)
R1
4: a (f; g) = 4 1 f (t) g (t) dt
su H01 ( 1; 1)
R1 0
5: a (f; g) = 5 1 f (t) g 0 (t) dt
su H01 ( 1; 1)
R +1
6: a (f; g) = 1 f (t) g (2t) dt
su L2 (R)
R1
7: a (f; g) = 0 cos 3t f (t) g (t) dt
su L2 (0; 1)
172
Parte IV
Applicazioni dei metodi di
ortogonalità
18
18.1
Applicazioni all’analisi armonica
Il sistema trigonometrico. Serie di Fourier in una o
due variabili
Teorema 18.1 Nello spazio L2 [
; ], il sistema trigonometrico
1 cos nx sin nx
p ; p ; p
per n = 1; 2; 3; :::
2
(18.1)
è ortonormale completo.
Dimostrazione. L’ortonormalità si veri…ca elementarmente calcolando opportuni integrali (questo è stato fatto in Analisi 2). Proviamo la completezza. Si
tratta di dimostrare che se f 2 L2 [ ; ] è ortogonale a tutti gli elementi del
sistema trigonometrico (18.1) (il che è come dire: se f ha i coe¢ cienti di Fourier
tutti nulli) allora f è uguale a zero quasi ovunque in [ ; ] (cioè è l’elemento
nullo di L2 [ ; ]). La dimostrazione procede in due passi.
1. Prima si prova la tesi supponendo che f sia anche continua. Notiamo
anzitutto che se f è ortogonale a tutti gli elementi del sistema trigonometrico,
per linearità è ortogonale a tutte le combinazioni lineari …nite di questi elementi,
ossia: per ogni polinomio trigonometrico p (x) si ha:
Z
f (x) p (x) dx = 0:
(18.2)
Mostriamo che sotto quest’ipotesi f è identicamente nulla. Per assurdo, non lo
sia, e sia ad esempio f (x0 ) > 0 (se è < 0 il ragionamento è analogo). Per il
teorema di permanenza del segno esiste un > 0 tale che
f (x) >
f (x0 )
8x 2 (x0
2
; x0 + ) :
Consideriamo ora il polinomio trigonometrico
t (x) = 1 + cos (x
x0 )
cos :
Si veri…ca che
t (x) > 1 per jx
jt (x)j 1 per jx
173
x0 j <
x0 j
:
n
Inoltre se t (x) è un polinomio trigonometrico, anche t (x) lo è, per n =
1; 2; 3; :::. Perciò si ha:
Z
n
0=
f (x) t (x) dx
Z
Z
n
n
=
f (x) t (x) dx +
f (x) t (x) dx;
[
; ]\jx x0 j<
[
; ]\jx x0 j
ossia
Z
[
n
f (x) t (x) dx =
; ]\jx x0 j
Z
[
n
f (x) t (x) dx:
; ]\jx x0 j<
Ora, il primo membro dell’uguaglianza rimane limitato al crescere di n, perché:
Z
[
Z
n
f (x) t (x) dx
; ]\jx x0 j
n
[
; ]\jx x0 j
[
; ]\jx x0 j
Z
jf (x)j jt (x)j dx
jf (x)j dx;
Mostriamo invece che il secondo membro tende a 1 per n ! 1 (da cui l’assurdo). Scegliamo un intervallo [a; b] contenuto nell’insieme [ ; ] \ jx x0 j < ;
su [a; b] la funzione t (x) avrà minimo m > 1, perciò
Z
Z
f (x0 )
n
n
t (x) dx
f (x) t (x) dx
2
[
; ]\jx x0 j<
[
; ]\jx x0 j<
Z
Z
f (x0 ) b
f (x0 ) b n
f (x0 )
n
t (x) dx
m dx =
(b a) mn ! 1 per n ! 1:
2
2
2
a
a
Questo dimostra il teorema nel caso f continua.
2. Sia ora f 2 L2 [ ; ] tale che per ogni polinomio trigonometrico p (x)
vale (18.2). De…niamo
Z
x
F (x) =
f (t) dt:
La funzione F risulta assolutamente continua ed esiste F 0 (x) = f (x) quasi
ovunque (per il Teorema fondamentale del calcolo integrale per l’integrale di
Lebesgue). Calcoliamo i coe¢ cienti di Fourier di F .
Z
Z
sin (nx)
sin (nx)
F (x) cos (nx) dx =
F (x)
f (x) dx = 0
n
n
perché il primo addendo è nullo in quanto sin ( n ) = 0; il secondo è nullo
perché f ha coe¢ cienti di Fourier nulli.
Z
Z
cos (nx)
cos (nx)
F (x) sin (nx) dx =
F (x)
+
f (x) dx =
n
n
174
poiché f ha coe¢ cienti di Fourier nulli
=
perché: F (
cos (n )
cos (n )
F ( )+
F(
n
n
)=0
) = 0 per de…nizione di F come funzione integrale, e
Z
F( )=
f (t) dt = 0
perché f ha anche il coe¢ ciente a0 = 0. In de…nitiva, la funzione F ha nulli i
coe¢ cienti di Fourier Ak e RBk per k
1, mentre non è necessariamente vero
che sia A0 = 0; cioè che sia
F (t) dt = 0. Consideriamo però la funzione
F (x)
A0
= F (x)
2
1
2
Z
F (t) dt:
Questa funzione per de…nizione ha integrale nullo su [ ; ], e d’altro canto
continua ad avere gli altri coe¢ cienti di Fourier nulli. Ne segue che F (x) A20
ha tutti i coe¢ cienti di Fourier nulli, ed è una funzione continua; per la prima
parte della dimostrazione, allora, F (x) A20 è identicamente nulla. Ne segue
che
0
A0
f (x) = F (x)
= 0 quasi ovunque,
2
che è la tesi.
In base al teorema precedente e al Teorema 16.6, possiamo concludere il
risultato di convergenza in L2 [ ; ] delle serie di Fourier:
Teorema 18.2 Sia f 2 L2 [ ; ] ; de…niamo
Z
1
ak =
f (x) cos nxdx per n = 0; 1; 2; 3:::
2
Z
1
bk =
f (x) sin nxdx per n = 1; 2; 3; ::
2
Allora la serie di Fourier di f
1
a0 X
+
(an cos nx + bn sin nx)
2
n=1
converge ad f in L2 [
Z
f (x)
"
; ] : Esplicitamente, questo signi…ca che:
#2
n
a0 X
+
(ak cos kx + bk sin kx)
dx ! 0 per n ! 1:
2
k=1
175
Naturalmente serie e coe¢ cienti di Fourier si possono adattare ad un intervallo [a; b] qualsiasi (v. [5, Cap. 7, §3.4]).
La teoria degli spazi di Hilbert fornisce un risultato semplice e generale sulla convergenza delle serie di Fourier in L2 . Naturalmente è anche interessante
sapere se la serie di Fourier converge puntualmente (cosa che non segue dalla
convergenza in L2 ). In realtà, il problema della convergenza puntuale è il primo
che si è posto, storicamente, col sorgere stesso della teoria delle serie di Fourier
(1822, Fourier, trattato “Teoria analitica del calore”). Il primo studio rigoroso
sulla convergenza puntuale delle serie di Fourier è dovuto a Dirichlet nel 1829.
Si tratta di un problema fondamentale per l’analisi armonica, di cui però non
diremo nulla, in quanto ci interessa qui solo illustrare alcune applicazioni della
teoria degli spazi di Hilbert, che fu creata circa 100 anni dopo le serie di Fourier, come già accennato. Per qualche dettaglio sullo studio della convergenza
puntuale delle serie di Fourier si rimanda a [5, Cap. 7, §3.6] o a [10, Chap.8,
§8.5].
n
Si possono anche de…nire le serie di Fourier in n variabili, sull’insieme [ ; ]
(e quindi, riscalando il sistema trigonometrico, su qualunque “n-parallelepipedo”).
2
Ad esempio, in due variabili si può sviluppare una funzione f (x; y) 2 L2 [ ; ]
in serie di Fourier doppia. Vediamo prima il seguente risultato astratto:
1
Teorema 18.3 Sia fen (x)gn=1 un sistema ortonormale completo in L2 [
Allora
1
fen (x) em (y)gn;n=1
2
è un sistema ortonormale completo in L
[
; ]:
2
; ]
.
Dimostrazione. L’ortonormalità si veri…ca facilmente: per (n; m) 6= (n1 ; m1 )
risulta
Z Z
(en (x) em (y) en1 (x) em1 (y)) dxdy
Z
Z
=
en (x) en1 (x) dx
em (y) em1 (y) dy = 0
perché almeno uno dei due integrali è zero, essendo n 6= m o n1 6= m1 ; mentre
Z Z
Z
Z
2
2
jen (x) em (y)j dxdy =
jen (x)j dx
jem (y)j dy = 1 1 = 1:
Quanto alla completezza, sia f 2 L2 [
Z
Z
2
; ]
e supponiamo che sia
f (x; y) en (x) em (y) dxdy = 0 per ogni n; m:
Fissiamo m e consideriamo la funzione
Z
gm (x) =
f (x; y) em (y) dy:
176
Questa funzione sta in L2 [
Z
; ] ; perché
2
jgm (x)j dx =
Z
Z
2
f (x; y) em (y) dy dx
applicando nell’integrale interno la disuguaglianza di Cauchy-Schwarz
Z
Z
Z
2
2
jf (x; y)j dy
jem (y)j dy dx
Z Z
2
2
jf (x; y)j dydx = kf kL2 ([ ; ]2 ) < 1:
=
Inoltre gm ha tutti i coe¢ cienti di Fourier nulli rispetto al sistema fen (x)g,
dunque gm (x) = 0 quasi ovunque. Questo, per de…nizione di gm ; signi…ca che
per quasi ogni x …ssato la funzione y 7! f (x; y) ha tutti i coe¢ cienti di Fourier
nulli rispetto al sistema fem (y)g ; dunque per q.o. x e per q.o. y è f (x; y) = 0.
Questo prova la completezza del sistema.
La scrittura esplicita del sistema trigonometrico in due variabili è resa complicata dal fatto che occorre moltiplicare ognuna delle tre funzioni
1 cos nx sin nx
p ; p ; p
2
per ognuna delle tre funzioni
1 cos my sin my
p ; p ; p ;
2
mentre viene molto più semplice usando la scrittura complessa
einx
p
2
n2Z
e quindi, in due variabili,
ei(nx+my)
2
2
In questo caso si pone, per f 2 L2 [
fbn;m =
1
2
(2 )
Z
Z
:
n;m2Z
; ]
f (x; y) e
i(nx+my)
dxdy per n; m 2 Z
e si ha quindi
f (x; y) =
+1
X
n;m= 1
177
fbn;m ei(nx+my)
2
con convergenza della serie in L2 [ ; ] . Più esplicitamente, una nozione
di convergenza di una serie de…nita da due indici interi relativi richiede una
de…nizione precisa di somma parziale. Tale de…nizione non è univoca; ad esempio è corretto a¤ermare che, se de…niamo
X
sN (x; y) =
fbn;m ei(nx+my) per N = 0; 1; 2; :::
jnj+jmj N
allora risulta
kf
sN kL2 ([
; ]2 )
! 0 per N ! +1:
Una delle possibili applicazioni delle serie di Fourier in due variabili è alla
compressione delle immagini. Un’immagine in scala di grigi si può vedere come
una funzione f (x; y) de…nita in un rettangolo a valori in [0; 1], dove il valore
f (x; y) rappresenta l’intensità di grigio nel punto (pixel) (x; y), quindi f = 0
vuol dire punto bianco e f = 1 punto nero. Una somma di Fourier parziale
di f immagazzina (in modo approssimato) l’informazione dell’immagine in un
numero limitato di coe¢ cienti di Fourier.
18.2
Base di Haar e wavelets
Nell’utilizzo dell’analisi di Fourier per approssimare un segnale periodico, il
sistema trigonometrico ha, insieme a tanti pregi, un paio di difetti.
1. I polinomi trigonometrici sono funzioni continue e regolari, perciò una
serie di Fourier approssima male una funzione discontinua. L’approssimazione in
L2 rimane, ma non possiamo certamente aspettarci una buona approssimazione
puntuale vicino a un punto di discontinuità.
2. L’approssimazione con polinomi trigonometrici ha una natura globale:
supponiamo di voler approssimare una funzione f 2 L2 [ ; ] che ha un gra…co
“semplice e liscio”in [ ; 0] e piuttosto frastagliato in [0; ]. A¢ nché la somma
parziale di Fourier segua bene il gra…co di f in [0; ] noi dovremo aumentare il
numero di termini, i cui coe¢ cienti sono stati calcolati in base al comportamento
di f su tutto [ ; ]; questo signi…ca che l’unico modo di migliorare i dettagli
dell’approssimazione in [0; ] è quello di aumentare i dettagli in tutto [ ; ];
non possiamo ra¢ nare l’approssimazione su una sola parte dell’intervallo.
Per ovviare a questi due difetti, e in particolare al secondo, si possono utilizzare altri tipi di sistemi ortonormali completi di L2 [ ; ], che hanno la proprietà di permettere un’analisi su scale diverse in parti diverse dell’intervallo, o
come si dice, fare una “analisi multirisoluzione”. Sistemi di questo tipo sono le
wavelets. Ce ne sono di molti tipi, presentiamo qui il più semplice. Rimandiamo
a [12, § 7.6] per qualche dettaglio in più su quanto spiegato qui di seguito, e a
[1] per una trattazione più approfondita.
Ci mettiamo ora nell’intervallo [0; 1]. De…niamo la “funzione madre”
8
per 0 x < 12
< 1
1 per 12 x < 1
(x) =
:
0
altrimenti
178
e la seguente famiglia di funzioni ottenute traslando e riscalando la funzione
madre:
n;k
(x) = 2n=2 (2n x
k) per k = 0; 1; 2; :::; 2n
1; n = 0; 1; 2; 3; :::
Visualizziamo i gra…ci di alcune di queste funzioni.
Ad esempio per n = 2 e quindi k = 0; 1; 2; 3 si ha:
di
Confrontiamo invece tra loro funzioni
n;k per i valori n = 1; 2; 3; 4; sono:
179
n;k
per diversi valori di n. I gra…ci
fNotiamo che per tutte le funzioni
Z
n;k
1
n;k
(x) dx = 0 e
0
Z
si ha
1
2
n;k
(x) dx = 1:
0
E’ facile rendersi conto che il prodotto tra due funzioni diverse tra le n;k o
è identicamente nullo oppure è una delle due moltiplicata per una costante;
perciò queste funzioni sono anche a due a due ortogonali. Poiché tutte queste
funzioni hanno media nulla, se vogliamo sperare di avere un sistema ortonormale
completo è necessario aggiungere almeno una funzione che non abbia media
nulla: la costante 1 va bene. Vale il seguente
Teorema 18.4 Il sistema di funzioni
f1;
n;k gk=0;1;2;:::;2n 1;n=0;1;2;3:::
è ortonormale completo in L2 [0; 1] :
Dimostrazione. L’ortonormalità è stata sostanzialmente dimostrata. Per la
completezza, ci limitiamo a segnalare che si può dimostrare che questo sistema
di funzioni è denso nell’insieme delle funzioni semplici (cioè misurabili e che
assumono un numero …nito di valori), che a sua volta è denso in L2 [0; 1].
Dalla completezza del sistema precedente segue:
Teorema 18.5 Per f 2 L2 [0; 1] de…niamo:
fb0 =
fbn;k =
Z
1
f (x) dx
0
Z
1
f (x)
n;k
(x) dx per n = 0; 1; 2; 3::: e k = 0; 1; 2; :::; 2n
1;
0
allora la serie
converge a f in L2 [0; 1].
n
fb0 +
1 2X1
X
n=0 k=0
fbn;k
n;k
(x)
Poiché le n;k ; e quindi ogni loro somma parziale, è una funzione discontinua,
ci aspettiamo che questo tipo di serie possa approssimare bene anche funzioni
con discontinuità; l’altra faccia della medaglia è che la somma parziale sarà
sempre discontinua, anche quando la funzione da approssimare è continua. Soprattutto però il pregio di questa approssimazione è la sua localizzabilità: ogni
n;k è diversa da zero solo su un intervallino, perciò scegliendo opportunamente
i termini n;k possiamo aumentare il dettaglio dell’approssimazione di f in un
tratto speci…co dell’intervallo [0; 1].
180
Esempio 18.6 Sia
f (x) =
per x 2 0; 14
per x 2 ( 14 ; 1]:
1 x2
log x
Allora il gra…co di f insieme a quello della sua somma parziale
n
fb0 +
3 2X1
X
n=0 k=0
fbn;k
n;k
(x)
(che in tutto ha 16 termini) è il seguente:
Si osserva che nel “gradino” di f l’approssimante segue il salto senza problemi.
D’altro canto l’approssimante è “a gradini” anche nei tratti continui di f . A
titolo di confronto il gra…co di f insieme alla sua somma parziale di Fourier
8
a0 X
+
(an cos (2 nx) + bn sin (2 nx))
2
n=0
181
(che ha in tutto 17 termini) è il seguente:
Un esempio signi…cativo di problema di compressione delle immagini in cui si è
rivelato utile l’uso di wavelets in due variabili è la digitalizzazione dell’archivio
di impronte digitali compiuto dall’FBI negli anni 1990. Una lettura interessante
in tal senso è il saggio [14].
19
19.1
Applicazioni dei metodi di ortogonalità a problemi di¤erenziali
Separazione di variabili per problemi ai limiti per
EDP mediante il sistema trigonometrico
Torniamo ora in un certo senso all’indietro nel percorso storico, illustrando
qualche esempio classico di risoluzione di problemi ai limiti per equazioni a
derivate parziali della …sica matematica mediante il metodo di separazione delle
variabili, che si collocano proprio all’inizio degli utilizzi delle serie trigonometriche per risolvere problemi di¤erenziali ad opera di Fourier. Di questo metodo
metteremo in evidenza alcuni aspetti che hanno un signi…cato più generale.
19.1.1
Di¤usione del calore in una sbarra
Consideriamo una , rappresentata dal segmento [0; L], la cui temperatura al
punto x e all’istante t è u (x; t). Se la temperatura iniziale ha un pro…lo noto u0 (x), la sbarra è termicamente isolata sulla sua super…cie laterale, non ci
sono sorgenti o pozzi di calore interni, e la temperatura agli estremi è tenuta
costante uguale a zero, ci aspettiamo che la temperatura nel tempo raggiungerà
ovunque la temperatura costante zero. Studiamo come avviene nel tempo questo
182
fenomeno. Si dimostra che u soddisfa l’equazione del calore omogenea
8
< ut = cuxx per 0 < x < L; t > 0
u (0; t) = u (L; t) = 0
:
u (x; 0) = u0 (x)
che abbiamo accompagnato con le condizioni ai limiti e iniziali (problema di
Cauchy-Dirichlet per l’equazione del calore omogenea unidimensionale).
Il metodo di separazione delle variabili consiste nel cercare anzitutto soluzioni
di forma particolare, ossia appunto a variabili separate:
U (x; t) = X (x) T (t) :
Sostituendo nell’equazione di¤erenziale si ha:
X (x) T 0 (t) = cX 00 (x) T (t)
X 00 (x)
T 0 (t)
=
:
X (x)
cT (t)
Questa uguaglianza dev’essere identicamente veri…cata per 0 < x < L; t > 0.
D’altro canto il primo membro è una funzione della sola x, il secondo membro
è una funzione della sola t, quindi l’unica possibilità perché l’identità sussista è
che ciascun membro sia costante. Si ha quindi, per qualche 2 R,
X 00 (x)
=
X (x)
T 0 (t)
=
cT (t)
per 0 < x < L
per t > 0:
(19.1)
Ricordiamo ora che devono valere le condizioni ai contorno u (0; t) = u (L; t) = 0
che si traducono in X (0) = X (L) = 0. Dunque l’equazione in X e quella in T
assumono un ruolo asimmetrico, perché la prima (e solo la prima) è corredata
di condizioni al contorno:
X 00 (x) = X (x) per 0 < x < L
X (0) = X (L) = 0:
(19.2)
Con ciò abbiamo ottenuto un problema agli autovalori per l’operatore di¤erend2
ziale dx
2 R (autovalori) e soluzioni X (x) non identica2 : si cercano numeri
mente nulle (autofunzioni) del problema (19.2). Si ri‡etta sul fatto che per ogni
possiamo scrivere l’integrale generale dell’equazione di¤erenziale, dipendente
da due costanti arbitrarie, ma non per ogni è possibile determinare le costanti
di integrazione in modo da soddisfare le condizioni nulle agli estremi:
se = 0; X (x) = c1 x + c2 si annulla in x = 0; x = L solo per c1 = c2 = 0;
se
> 0; X (x) = c1 e x + c2 e x si annulla in x = 0; x = L solo per
c1 = c2 = 0;
p
p
se < 0; X (x) = c1 cos
x + c2 sin
x si annulla in x = 0; x = L
p
2 2
per c1 = 0 e per qualsiasi c2 purché sia sin
L = 0; cioè = nL2 , con
n = 1; 2; 3; :::
183
Abbiamo dunque ricavato autovalori e autofunzioni del problema (19.2):
=
n2 2
n x
; Xn (x) = cn sin
, per n = 1; 2; 3; :::
L2
L
(cn costante arbitraria). Possiamo ora risolvere l’equazione (19.1) per questi
valori di :
n2 2 c
T (t)
L2
T 0 (t) =
Tn (t) = e
n2 2 c
t
L2
e in de…nitiva le soluzioni a variabili separate dell’equazione a derivate parziali
e delle condizioni al contorno:
un (x; t) = Xn (x) Tn (t) = cn sin
n x
e
L
n2 2 c
t
L2
:
Nessuna di queste soluzioni in generale soddisferà anche la condizione iniziale,
perché un (x; 0) = cn sin (n x). L’idea allora è la seguente: essendo l’equazione
di¤erenziale lineare e omogenea, con condizioni agli estremi omogenee, ogni
combinazione lineare …nita delle un soddisferà ancora equazione e condizioni
al contorno. Possiamo cercare una serie in…nita di queste soluzioni che per
un’opportuna scelta dei coe¢ cienti cn converga ed assuma anche la condizione
iniziale. Scriviamo dunque
u (x; t) =
1
X
cn sin
n=1
n x
e
L
n2 2 c
t
L2
(19.3)
e imponiamo la condizione iniziale:
u (x; 0) =
1
X
cn sin
n=1
n x
= u0 (x) per 0 < x < L
L
Si tratta dunque di scegliere i coe¢ cienti cn come i coe¢ cienti di Fourier dello
sviluppo di u0 in serie di soli seni in (0; L) (v. [5, Cp.7, §3.8]). Si ha:
cn =
2
L
Z
L
u0 (y) sin
0
n y
dy
L
e per questa scelta dei coe¢ cienti cn la serie (19.3) assume anche la condizione
iniziale, purché u0 soddis… ipotesi ragionevoli sotto
P1 cui la sua serie di Fourier
converge. Sia ad esempio f 2 L2 (0; L), perciò n=1 c2n < 1. Si noti che per
n2 2 c
n2 2 c
e L2 t che tende a zero espoqualunque t > 0 si ha sin nLx e L2 t
nenzialmente, perciò non solo la serie converge, ma anche la sua serie derivata
rispetto a x o t (qualunque numero di volte) continua a convergere. In altre parole, la funzione rappresentata dalla (19.3) è estremamente regolare per t > 0.
184
L’unico punto delicato da veri…care è in quale senso u (x; t) tenda a u0 (x) per
t ! 0, cosa che qui non approfondiamo.
Si osservi comunque che la possibilità di risolvere il problema di CauchyDirichlet col metodo di separazione delle variabili imponendo una “qualsiasi”
condizione iniziale (eventualmente soddisfacente qualche ipotesi di regolarità)
si basa sul fatto che le autofunzioni Xn (x) del problema (19.2) costituiscano un
sistema ortonormale completo di L2 (0; L). Questo è uno degli aspetti chiave di
questo problema, che vedremo avere uno spettro di applicazione molto ampio.
Prima di passare a problemi più generali è però utile prendere con…denza col
metodo stesso. Lo studente è invitato a sviluppare in dettaglio il seguente
esempio, analogo al precedente:
Es 19.1 (Corda vibrante …ssata agli estremi) Una corda elastica …ssata ai
due estremi, pizzicata in modo da eseguire piccole oscillazioni rispetto all’equilibrio, soddisfa l’equazione di¤ erenziale
utt = c2 uxx
dove u (x; t) rappresenta l’altezza al tempo t del punto della corda che a riposo
si trova nel punto x, e c è una costante positiva con le dimensioni di una velocità. Se la corda è …ssata agli estremi e sono note la sua con…gurazione iniziale
u0 (x) e la sua velocità iniziale (che supponiamo nulla, per semplicità) la u (x; t)
soddisferà il problema di Cauchy-Dirichlet:
8
per 0 < x < L; t > 0
>
> utt = cuxx
<
u (0; t) = u (L; t) = 0 per t > 0
u (x; 0) = u0 (x)
per 0 < x < L
>
>
:
ut (x; 0) = 0
per 0 < x < L:
Si risolva il problema utilizzando esattamente lo stesso metodo visto prima.
Suggerimento. La di¤ erenza riguarda solo l’equazione in T (t). Si trovano le
seguenti soluzioni a variabili separate (dell’equazione e condizioni agli estremi):
un (x; t) = sin
n x
L
an cos
n ct
L
+ bn sin
n ct
L
:
Quindi imponendo le condizioni iniziali si trova
u (x; t) =
1
X
an cos
n=1
con
an =
2
L
Z
n ct
L
L
u0 (y) sin
0
sin
n x
L
n y
dy:
L
Questa volta la derivabilità della serie che rappresenta la soluzione non è ovvia,
ma va ottenuta richiedendo che i coe¢ cienti an tendano a zero abbastanza
velocemente, ossia richiedendo che u0 sia abbastanza regolare.
185
19.1.2
Equazione di Laplace sul cerchio
L’equazione di Laplace in due variabili,
u = uxx + uyy = 0
può avere vari signi…cati …sici, ad esempio: u potenziale gravitazionale (nel
piano) in assenza di massa; u potenziale elettrostatico in assenza di carica;
u temperatura di una lamina che non ha pozzi o sorgenti di calore interni e
ha raggiunto l’equilibrio termico; u altezza sull’orizzontale di una membrana
elastica tesa al contorno e in equilibrio.
La risoluzione esplicita di questa equazione sul cerchio è un punto di partenza
fondamentale per la teoria del potenziale (in due variabili).
Per risolvere l’equazione di Laplace sul cerchio, la prima cosa è riscriverla
in coordinate polari ( ; #). Si trova (v. [5, Cap.4, §5.2]), per l’equazione sul
cerchio di centro (0; 0) e raggio R; con dato al bordo f assegnato:
8 2
1 @2u
< @ u 1 @u
+
+
= 0 per 2 [0; R); # 2 [0; 2 ]
2 @#2
(19.4)
@ 2
@
:
u (R; #) = f (#)
per # 2 [0; 2 ] :
Cerchiamo soluzioni a variabili separate, del tipo:
u ( ; #) = R ( )
(#) :
Sostituendo nell’equazione si ha
1
(#) + R0 ( )
R00 ( )
(#) +
1
2
R( )
00
(#) = 0
R00 ( )
R0 ( )
+
=
R( )
R( )
2
00
(#)
(#)
identità tra una funzione della sola e una funzione della sola #, che quindi
forza ciascun membro ad essere costante. Quindi per qualche 2 R dev’essere:
2
R00 ( ) + R0 ( ) = R ( ) per 2 (0; R)
00
(#) =
(#) per # 2 [0; 2 ] :
Bisogna anche richiedere che
sia 2 periodica: per il signi…cato geometrico
delle coordinate polari, se non è così la funzione u ( ; #) = R ( ) (#) risulta
discontinua. Questo impone
= n2 e
n
(#) = an cos (n#) + bn sin (n#) per n = 0; 1; 2; 3; :::
Con ciò l’equazione in R diventa
2
R00 ( ) + R0 ( )
n2 R ( ) = 0 per
186
2 [0; R] :
Per n 6= 0 è un’equazione di Eulero, si possono cercare soluzioni del tipo R ( ) =
; con da determinarsi:
2
(
2
1)
1
+
(
n2
=0
2
1) +
n =0
= n;
che dà
Rn ( ) = c1
n
+ c2
n
;
ma poiché vogliamo soluzioni regolari in [0; R] dobbiamo escludere le soluzioni
c2 n illimitate nell’origine.
Per n = 0 l’equazione
2
è di Eulero in R0 ( ) =
R00 ( ) + R0 ( ) = 0
;
2
1
+
=0
+1
( + 1)
=0
= 1
1
R0 ( ) =
R ( ) = d1 + d2 log :
Escludendo ancora le soluzioni d2 log
…nitiva
Rn ( ) = c
R0 ( ) = d
n
illimitate nell’origine, otteniamo in deper n = 1; 2; 3; :::
Si trovano in de…nitiva le soluzioni a variabili separate:
un ( ; #) = n [an cos (n#) + bn sin (n#)]
u0 ( ; #) = d:
Come nell’esempio precedente, l’idea è scrivere una soluzione che soddis… anche
la condizione al contorno sommando le in…nite soluzioni a variabili separate:
u ( ; #) = d +
1
X
n
[an cos (n#) + bn sin (n#)] :
n=1
Imporre la condizione al contorno signi…ca quindi scrivere:
u (R; #) = d +
1
X
Rn [an cos (n#) + bn sin (n#)] = f (#)
n=1
187
il che signi…ca che quello scritto dev’essere lo sviluppo di Fourier di f (#) in
[0; 2 ], quindi posto
1
A0 X
+
[An cos (n#) + Bn sin (n#)] , ossia
2
n=1
Z
Z
1 2
1 2
An =
f (#) cos (n#) d#; Bn =
f (#) sin (n#) d#
f (#) =
0
(19.5)
0
si ha
A0
; Rn an = An ; Rn bn = Bn .
2
In conclusione la soluzione del problema (19.4) è:
d=
u ( ; #) =
1
A0 X
+
2
R
n=1
n
[An cos (n#) + Bn sin (n#)]
(19.6)
con An ; Bn assegnati dalle (19.5).
P1
2
2
Osserviamo che se f 2 L2 [0; 2 ], quindi
n=1 An + Bn < 1, questo
è su¢ ciente a garantire che la serie che assegna u ( ; #), e la serie delle sue
derivate di ordine qualunque
rispetto a o a #, converga per < R; per via
P1
n
della serie geometrica n=1 R . Anche in questo caso si vede che la funzione
all’interno del cerchio è regolare, sotto ipotesi molto deboli su f (#); più delicato
è garantire in che senso viene assunto il dato al bordo, e non entreremo in questa
discussione: occorrerà garantire almeno la convergenza puntuale ovunque della
serie di Fourier, chiedendo quindi al dato al bordo di essere per esempio continuo
(periodico) e regolare a tratti.
Di nuovo, osserviamo che uno degli elementi che ha reso praticabile il metodo
di risoluzione del problema al contorno per separazione di variabili è il fatto che
uno dei due sottoproblemi di¤erenziali consista in un problema agli autovalori le
cui soluzioni (autofunzioni) sono un sistema ortonormale completo di L2 [0; 2 ].
La formula integrale di Poisson
Ci interessa ora trasformare questa formula risolutiva “per serie” in una
formula di rappresentazione “integrale”, da cui si potranno leggere altre informazioni. Sostituendo nella (19.6) le espressioni per i coe¢ cienti (conviene
cambiare nome alla variabile di integrazione)
Z
Z
1 2
1 2
An =
f (s) cos (ns) ds; Bn =
f (s) sin (ns) ds
0
0
si ha
u ( ; #) =
+
1
X
n=1
1
2
n
R
Z
2
f (#) ds+
0
1
Z
2
f (s) cos (ns) ds cos (n#) +
0
1
Z
0
188
2
f (s) sin (ns) ds sin (n#)
=
Z
2
f (s)
0
(
1
1
1X
+
2
R
n=1
)
n
[cos (ns) cos (n#) + sin (ns) sin (n#)] ds:
Vediamo di sommare esplicitamente il nucleo integrale f:::g. Anzitutto le formule di addizione e quelle di Eulero danno:
cos (ns) cos (n#) + sin (ns) sin (n#) = cos n (#
s) =
ein(#
s)
+e
2
in(# s)
;
quindi ci si può ricondurre a sommare delle serie geometriche:
1
n
1
1X
+
[cos (ns) cos (n#) + sin (ns) sin (n#)]
2
R
n=1
(
)
1
i
n
n
1 1 1 Xh
in(# s)
in(# s)
=
+
e
+
e
2 2 n=1 R
R
(
)
1
1
X
X
n
n
1
i(# s)
n(# s)
=
1+
e
+
e
2
2
R
R
n=0
n=0
=
1
2
1
1
i(#
Re
s)
+
1
e
R
1
i(# s)
1
e qualche calcolo coi numeri complessi dà
=
1
2
1
=
2
=
1
2
(
R
cos (#
2R [R
[R
R2
cos (#
R
s)
i sin (#
cos (#
2
s)] +
2
R2
2R cos (# s) +
2
s)
+
R
s)]
sin2 (#
2
s)
1
cos (#
)
R
s) + i sin (#
s)
1
:
Abbiamo ottenuto una formula di rappresentazione della soluzione del problema
mediante un integrale:
Z 2
2
1
R2
u ( ; #) =
f (s)
ds:
(19.7)
2 0
R2 2R cos (# s) + 2
Il nucleo integrale trovato si chiama nucleo di Poisson, e la formula ottenuta,
detta formula integrale di Poisson, è molto importante, per vari motivi.
1. Anzitutto, spesso è più comodo calcolare la soluzione a partire dal dato
al bordo, in modo esatto o approssimato, direttamente con questo integrale
anziché con il doppio passaggio che consiste nel calcolare gli in…niti coe¢ cienti
di Fourier di f e poi sommare la serie (19.6).
2. In secondo luogo, formule di rappresentazione mediante operatori integrali sono più adatte a mettere in evidenza le ipotesi minime sul dato f che
garantiscono opportune proprietà della soluzione. Noi non faremo qui un’analisi
189
dettagliata, limitandoci ad osservare che per ogni < R e per ogni # il denominatore è discosto da zero, il che signi…ca che stando strettamente all’interno del
cerchio < R si può derivare in…nite volte sotto il segno di integrale. Quindi
(come già avevamo osservato) la soluzione dell’equazione di Laplace è in…nitamente derivabile all’interno del cerchio. Ma questa formula consentirebbe anche
di provare risultati precisi di convergenza di u ( ; #) al dato f (#) avvicindandosi
al bordo.
3. La formula mette in evidenza anche altre proprietà delle soluzioni dell’equazione di Laplace (funzioni armoniche): sostituendo = 0 si trova
u (0; #) =
1
2
Z
2
f (s) ds;
(19.8)
0
formula di valor medio, che dice che il valore di una funzione armonica in un
punto è la media integrale dei valori assunti sul contorno del cerchio. Notiamo
che se u è armonica in un insieme aperto
del piano, per ogni cerchio BR
contenuto in si può vedere u come soluzione del problema di Dirichlet avente
come dato assegnato sul bordo del cerchio la u stessa. Quindi la precedente si
può riscrivere anche così:
Z 2
1
u (0; #) =
u ( ; s) ds per ogni < R:
2 0
A sua volta questo fatto ha un’importante conseguenza, il principio del massimo
delle funzioni armoniche:
Teorema 19.2 Se u = 0 in
aperto connesso del piano, allora u non può
avere in punti di massimo o minimo relativo interni senza essere costante.
Dimostrazione. Infatti, se per esempio l’origine (a cui ci si può sempre ricondurre per traslazione) fosse un punto di massimo relativo per u; scegliendo un
cerchio B contenuto strettamente nell’insieme in cui 0 è punto di massimo, si
avrebbe:
Z 2
Z 2
1
1
max u = u (0; #) =
u ( ; s) ds
max u ds = max u ,
2 0
2 0
dove l’uguaglianza può valere solo se su tutta la circonferenza è u = max u.
Applicando il ragionamento ad ogni 0 < più piccolo si troverebbe u = max u
su tutto il cerchio di raggio : Dunque se una funzione armonica ha un punto
di massimo, in tutto un intorno di questo è costante. Per connessione, allora,
sarebbe costante in tutto l’aperto connesso :
Difatti i più semplici esempi di funzioni armoniche in due variabili sono
xy; x2
y 2 ; ex sin y;
ex cos y; :::
ed altre funzioni simili i cui gra…ci o non hanno punti stazionari (come le ultime
due) o hanno solo punti stazionari di sella (come le prime due).
190
Queste ultime osservazioni fatte riguardo alla formula integrale di Poisson
sono solo un assaggio dei metodi della teoria del potenziale, con cui a partire da
una formula di rappresentazione semplice ed esplicita si dimostrano proprietà
generali delle funzioni armoniche. Alla luce della formula …nale ottenuta, il
procedimento di separazione di variabili appare un procedimento elaborato il cui
ruolo …nale è quello di permetterci di ottenere una formula di rappresentazione
integrale utile. Ogni volta che, con opportuni scambi tra serie numeriche e
integrali che assegnano coe¢ cienti di Fourier, è possibile scrivere esplicitamente
una formula di rappresentazione integrale, può essere interessante farlo. Non
sempre però è agevole.
Lo studente è invitato a risolvere in dettaglio il prossimo problema (analogo
al precedente dal punto di vista concettuale, ma tecnicamente più semplice).
Es 19.3 (Equazione di Laplace sul rettangolo) Si risolva, col metodo di
separazione delle variabili, il seguente problema di Dirichlet per l’equazione di
Laplace sul rettangolo:
8
< uxx + uyy = 0 per x 2 (0; A) ; y 2 (0; B)
u (x; 0) = u (x; B) = u (A; y) = 0
:
u (0; y) = f (y) :
In altre parole, il dato al contorno assegnato sul bordo del rettangolo è diverso
da zero solo su uno dei 4 lati (per semplicità).
Esempio 19.4 Suggerimento: cercare soluzioni a variabili separate u (x; y) =
X (x) Y (y) coi metodi visti sopra. Il problema agli autovalori è quello nella
Y (y) ; che deve annullarsi a entrambi gli estremi. Scrivere la formula risolutiva
nel modo più semplice e compatto. Si trova:
u (x; y) =
1
X
bn
n=1
2
bn =
B
19.2
Z
n y
Sh [n (A x)]
sin
, con
Sh (n A)
B
B
f (s) sin
0
n s
ds:
B
Problemi di Sturm-Liouville e polinomi ortogonali
Come sottoproblema dei problemi ai limiti risolti per separazione di variabili
nel paragrafo precedente, ci siamo trovati in ogni caso di fronte ad un problema
agli autovalori del tipo:
y 00 (x) + y (x) = 0 per x 2 [0; L]
y (0) = 0 = y (L)
dove a priori sono incogniti sia la funzione y (x) che il numero . Si trova che
necessariamente dev’essere:
n2 2
per n = 1; 2; 3; :::
n =
L2
n x
yn (x) = sin
:
L
191
Il problema agli autovalori ha quindi:
1
1) una successione di autovalori positivi f n gn=1 che tende a +1;
2) una successione di yn corrispondenti, che risultano formare un sistema
ortogonale completo di L2 [0; L].
Quest’a¤ermazione ci è familiare in quanto si tratta del “solito” sistema
trigonometrico. Ma ora è interessante vedere questo fenomeno sotto una luce
diversa: queste funzioni sono un sistema ortogonale completo proprio perché
sono il sistema delle autofunzioni di un problema di¤erenziale ai limiti di un certo
tipo. Esiste cioè una teoria generale di problemi agli autovalori per equazioni
di¤erenziali ordinarie, di cui l’esempio appena discusso è un caso particolare, che
porta a fabbricare sistemi ortonormali completi di L2 [a; b] costituiti da sistemi
di autofunzioni. Daremo ora qualche cenno di questa teoria.
De…nizione 19.5 (Problema di Sturm-Liouville) Si consideri il problema
agli autovalori, detto di Sturm-Liouville:
p (x) du
q (x) u +
dx
u (a) = u (b) = 0
d
dx
(x) u = 0 per x 2 (a; b)
(19.9)
dove a; b 2 R e le funzioni p; q; sono coe¢ cienti assegnati soddisfacenti le
ipotesi: p 2 C 1 (a; b) ; p (x) > 0 in [a; b] ; q 2 C 0 (a; b) ; q (x)
0 in [a; b] ; 2
C 0 (a; b) ; (x) > 0 in [a; b]. Sotto queste ipotesi il problema di Sturm-Liouville
si dice regolare.
Vale in proposito il seguente
Teorema 19.6 Dato un problema di Sturm-Liouville regolare (19.9) esistono:
1
1) una successione di autovalori f n gn=1 tutti positivi, successione crescente
e tendente a +1;
1
2) una successione di autofunzioni fun gn=1 corrispondenti, che costituiscono
un sistema ortonormale completo dello spazio di Hilbert L2 ((a; b) ; (x) dx).
Esplicitamente, questo signi…ca che la misura è la misura pesata d
(x) dx; quindi ortogonalità signi…ca che
Z b
0 per n 6= m
un (x) um (x) (x) dx =
1 per n = m:
a
=
Dimostriamo solo la più semplice delle a¤ermazioni fatte: due autofunzioni
relative a due autovalori distinti sono tra loro ortogonali.
Supponiamo quindi che (u; ) ; (v; ) siano due coppie autofunzione-autovalore,
e proviamo che u; v sono ortogonali in L2 ((a; b) ; (x) dx). Scriviamo perciò:
0
(pu0 )
0
(pv 0 )
qu +
qv +
u=0
v = 0:
Moltiplichiamo la prima equazione per v, la seconda per u e sottraiamo membro
a membro. Otteniamo:
0
(pu0 ) v
0
(pv 0 ) u + (
) uv = 0 in (a; b) ;
192
da cui
(
)
Z
b
uv dx =
a
integrando per parti
0
= [pv u
Z
h
b
a
pu
0
Z
b
v]a
i
0
(pu0 ) v dx =
0
(pv 0 ) u
b
[pu0 v 0
pv 0 u0 ] dx = 0
a
b
perché il secondo integrale è nullo e [pv 0 u pu0 v]a per le condizioni agli estremi
su u e v. Quindi si ottiene
Z b
(
)
uv dx = 0;
a
ed essendo per ipotesi
6=
si ha
Rb
a
uv dx = 0; che è l’ortogonalità voluta.
Il problema dell’esempio iniziale rientra evidentemente in questo caso, con
p = = 1; q = 0. Ci sono altri esempi di problemi di Sturm-Liouville che si incontrano nelle applicazioni (ad esempio, ma non solo, risolvendo per separazione
di variabili dei problemi ai limiti per equazioni a derivate parziali). Il Teorema 19.6 descrive in un certo senso la “situazione ideale”. Purtroppo spesso i
problemi di Sturm-Liouville che nascono dalle applicazioni per un motivo o per
l’altro non soddisfano tutte le ipotesi di quel teorema (e si dicono allora problemi di Sturm-Liouville singolari ); in vari casi signi…cativi, comunque, si riesce
ancora a dimostrare, con tecniche ad hoc, che gli stessi risultati valgono ancora.
Presentiamo tre problemi di Sturm-Liouville singolari che hanno applicazioni
importanti.
1. Equazione di Legendre.
1
x2 y 00
2xy 0 + y = 0 per x 2 ( 1; 1)
(19.10)
che si può riscrivere nella forma
1
x2 y 0
0
+ y = 0.
Si tratta di un problema di Sturm-Liouville su [ 1; 1] con p (x) = 1 x2 ; q (x) =
0; (x) = 1. Il problema è reso singolare dal fatto che il coe¢ ciente p (x) si annulla negli estremi del segmento. La funzione peso è 1, quindi lo spazio di
Hilbert da considerare è L2 ( 1; 1) (con la misura di Lebesgue dx). Rivisitando
la dimostrazione precedente di ortogonalità si osserva che in questo caso non
occorre imporre le condizioni y ( 1) = 0 = y (1) per ottenere l’ortogonalità
di autofunzioni relative ad autovalori diversi. Infatti il termine di integrazione
1
[pu0 v pv 0 u] 1 è nullo a grazie a p (x). Si dimostra il seguente teorema:
Teorema 19.7 L’equazione di Legendre ha soluzioni C 1 [ 1; 1] solo in corrispondenza di una successione di autovalori n = n (n + 1) per n = 0; 1; 2; 3; :::
; detta Pn (x) l’autofunzione corrispondente a n , si ha che:
Pn (x) è un polinomio di grado n;
1
il sistema fPn (x)gn=0 è ortonormale completo in L2 ( 1; 1).
193
Dimostrazione. Cerchiamo soluzioni dell’equazione in forma di serie di potenze (metodo di Frobenius):
y (x) =
y 0 (x) =
y 00 (x) =
1
X
n=0
1
X
n=1
1
X
cn xn
ncn xn
n (n
1
1) cn xn
2
n=2
e sostituiamo nell’equazione:
0 = 1 x2 y 00 2xy 0 + y
1
1
X
X
=
n (n 1) cn xn 2
n (n
=
n=2
1
X
1) cn xn
n=2
n
(n + 2) (n + 1) cn+2 x
n=0
2
1
X
ncn xn +
n=1
1
X
n (n
n
1) cn x
1
X
cn xn
n=0
2
n=2
1
X
n
ncn x +
n=1
1
X
cn xn :
n=0
Uguagliando a zero il coe¢ ciente di xn per ciascun n si ottengono le seguenti
(il modo in cui gli indici variano nelle diverse serie costringe a distinguere i casi
n = 0, n = 1, n 2):
(n + 2) (n + 1) cn+2
ossia
cn+2 =
n (n
2c2 + c0 = 0
6c3 2c1 + c1 = 0
1) cn 2ncn + cn = 0
[n (n + 1)
]
cn per n = 0; 1; 2; :::
(n + 2) (n + 1)
(19.11)
Questo mostra che possiamo scegliere liberamente i coe¢ cienti c0 ; c1 , dopo di
che la soluzione risulta determinata. Dunque per ciascun …ssato si può scrivere
l’integrale generale dell’equazione, dipendente da due costanti arbitrarie. Le due
soluzioni indipendenti saranno una una serie di potenze dispari, l’altra una serie
di potenze pari.
Occorre però controllare che le serie di potenze che assegnano la soluzione
in e¤etti convergano. Poiché
cn+2
[n (n + 1)
]
=
! 1;
cn
(n + 2) (n + 1)
leggiamo due cose: le serie di potenze hanno raggio 1, quindi in e¤etti si è scritto
l’integrale generale in ( 1; 1); d’altro canto per x ! 1 in generale sarà y (x)
illimitata.
194
Il nostro problema agli autovalori, invece, per sua natura ci richiede di determinare soluzioni che siano regolari in tutto [ 1; 1] (come vedremo, è questo
quello che serve quando l’equazione di Legendre nasce nel risolvere un problema
di¤erenziale più complesso). Osservando ancora la formula (19.11) che assegna
i coe¢ cienti si vede che la serie termina se = n (n + 1). In questo caso si trova una sola soluzione limitata, polinomio di grado n: il polinomio di Legendre
Pn (x).
Abbiamo così determinato autovalori e autosoluzioni; l’ortogonalità segue
dalla dimostrazione generale già fatta per un problema di Sturm-Liouville regolare. La completezza segue dal seguente argomento. E’ noto che lo spazio
dei polinomi è denso nello spazio C 0 [ 1; 1] (teorema di Stone-Weierstrass); è
anche noto che lo spazio C 0 [ 1; 1] è denso in L2 [ 1; 1]; ne segue che lo spazio
dei polinomi è denso in L2 [ 1; 1]; dunque ogni funzione L2 [ 1; 1] può essere
approssimato bene quanto vogliamo mediante polinomi, e quindi combinazioni
lineari di polinomi di Legendre. Perciò il sistema dei polinomi di Legendre è
completo.
Sappiamo dunque che:
1
0
x2 Pn0 (x) + n (n + 1) Pn (x) = 0.
Sapendo che Pn sono polinomi e sono ortonormali in L2 ( 1; 1) possiamo
anche determinare esplicitamente questi polinomi, con una procedura iterativa,
ortonormalizzando il sistema di polinomi 1; x; x2 ; x3 ; ::: . Si trova:
1
P0 (x) = p ;
2
r
3
P1 (x) =
x;
2
r
1 5
P2 (x) =
3x2 1 ;
2 2
r
7
3
5
P3 (x) =
x + x3 ;
2
2
2
:::
Si può dimostrare anche la seguente formula generale:
q
n + 12 dn
n
Pn (x) =
x2 1 :
2n n! dxn
I polinomi di Legendre, come molte altre funzioni speciali, si trovano implementati in software di calcolo scienti…co oltre che riportati e tabulati su molti
testi.
195
Di seguito i gra…ci dei primi 6 polinomi Pn (x) (n = 0; 1; 2; 3; 4; 5). Si noti
che Pn (x) ha n zeri in [ 1; 1].
Il fatto di conoscere un sistema ortonormale completo in L2 [ 1; 1] costituito
da polinomi o¤re un metodo per approssimare una generica funzione L2 [ 1; 1]
mediante polinomi di grado n. Anche se l’approssimazione è in L2 [ 1; 1], quando la funzione da approssimare è continua o regolare ci aspettiamo una buona
approssimazione anche puntuale, che sarà di tipo globale sull’intervallo [ 1; 1],
anziché di tipo locale come ad esempio l’approssimazione mediante il polinomio
di Taylor. I polinomi di Legendre sono quindi importanti nella teoria dell’approssimazione di funzioni, oltre al fatto che l’equazione di Legendre compare
come sottoproblema nella risoluzione di certi problemi ai limiti per equazioni a
derivate parziali mediante separazione di variabili.
Data una funzione f 2 L2 [ 1; 1] ; i suoi coe¢ cienti di Fourier rispetto al
1
sistema fPn (x)gn=0 sono de…niti da:
cn =
Z
1
f (y) Pn (y) dy
1
e portano allo sviluppo
f (x) =
1
X
cn Pn (x) :
n=0
196
Esempio 19.8 Sia f (x) = ex sin x: Calcoliamo la somma parziale n = 4 della
serie di f (x) in polinomi di Legendre. Si trova:
Il ra¤ ronto tra i gra…ci di f e
P4
n=0 cn Pn
197
(x) è il seguente:
2. Equazione di Laguerre.
xy 00 + (1
x) y 0 + y = 0
per x 2 (0; +1)
che si può riscrivere nella forma
xe
x 0 0
y
+ e
x
y = 0 per x 2 (0; +1) :
Si tratta di un problema di Sturm-Liouville su (0; +1) con p (x) = (xe x ) ; q (x) =
0; (x) = e x . Il problema è reso singolare dal fatto che l’equazione non è
su un segmento ma su una semiretta e il coe¢ ciente p (x) si annulla in 0 e
a +1. La funzione peso è e x , quindi lo spazio di Hilbert da considerare è
L2 ((0; +1) ; e x dx). Anche in questo caso non occorre imporre condizioni agli
estremi per ottenere l’ortogonalità di autofunzioni relative ad autovalori diversi.
Si dimostra il seguente teorema:
Teorema 19.9 L’equazione di Laguerre ha soluzioni in L2 ((0; +1) ; e x dx)
(cioè: che all’in…nito non vanno +1 troppo rapidamente) solo in corrispondenza di una successione di autovalori n = n per n = 0; 1; 2; 3; ::: La soluzione
Ln (x) dell’equazione di Laguerre corrispondente a n = n è un polinomio di
1
grado n; il sistema fLn (x)gn=0 è ortonormale completo in L2 ((0; +1) ; e x dx).
Dimostrazione (traccia). La tecnica della dimostrazione, nella sua parte
costruttiva, è simile a quella vista per l’equazione di Legendre: si cerca una
soluzione per serie, si ottiene una legge ricorsiva sui coe¢ cienti, in questo caso:
cn+1 =
Poiché
n
2 cn :
(n + 1)
cn+1
cn
1
! 0;
n
la serie di potenze converge in tutto R, ossia una soluzione regolare su tutto
1
1
(0; +1) si trova per ogni ; però la stima cn+1
cn
n porta cn
n! e quindi una
x
2
soluzione con crescita del tipo e , che pertanto non sarebbe L ((0; +1) ; e x dx);
per ottenere l’appartenenza a questo spazio è necessario che la serie termini, il
che accade per = n intero non negativo. In questo caso la soluzione è un
polinomio di grado n. La dimostrazione già vista prova l’ortogonalità. Non
discutiamo del modo in cui si dimostra la completezza.
Esplicitamente, il teorema a¤erma che:
x
xe
con
Z
0
L0n (x) + ne
x
Ln (x) = 0 per x 2 (0; +1)
+1
Ln (x) Lm (x) e
x
dx =
0
198
1 se n = m
0 se n 6= m.
Anche in questo caso è possibile scrivere i primi polinomi di Laguerre ortonormalizzando le funzioni 1; x; x2 ; x3 ; ::: nello spazio L2 ((0; +1) ; e x dx). Si
trova:
L0 (x) = 1
L1 (x) = 1
x;
x2
;
2
3
3x + x2
2
L2 (x) = 1
2x +
L3 (x) = 1
x3
;
6
:::
Si dimostra anche la seguente formula esplicita:
Ln (x) =
ex dn
e
n! dxn
Data una funzione f 2 L2 ((0; +1) ; e
1
al sistema fLn (x)gn=0 sono dati da
cn =
Z
x
x n
x
.
dx) ; i suoi coe¢ cienti di Fourier rispetto
+1
f (x) Ln (x) e
x
dx
0
e portano allo sviluppo
f (x) =
1
X
cn Ln (x)
n=0
Si ri‡etta sul fatto che quando una funzione f viene approssimata in L2 ((0; +1) ; e
con la somma parziale Sn della sua serie di polinomi di Laguerre, ciò che viene
reso piccolo è l’integrale:
Z +1
2
jf (x) Sn (x)j e x dx
0
perciò dal punto di vista visivo è meglio confrontare il gra…co di f (x) e x=2 con
quello di Sn (x) e x=2 (il quadrato di questa di¤erenza è piccola). Le funzioni
(non polinomiali)
Ln (x) e x=2
si dicono funzioni di Laguerre. I loro gra…ci per i primi valori di n sono i seguenti.
199
x
dx)
Si osservi che Ln (x) ha n zeri in (0; +1):
Esempio 19.10 Sia f (x) = x sin x: Calcoliamo la somma parziale n = 10
della serie di f in polinomi di Laguerre. Il ra¤ ronto tra il gra…co di f (x) e x=2
P10
e n=0 cn Ln (x) e x=2 è il seguente:
200
3. Equazione di Hermite.
E’l’equazione:
y 00 2xy 0 + y = 0 per x 2 R
che si può riscrivere nella forma
e
0
x2 0
y
+ e
x2
y=0
2
Si tratta di un problema di Sturm-Liouville su R con p (x) = e x ; (x) = e
reso singolare dal fatto che l’equazione non è sul segmento ma sulla retta.
x2
,
2
Teorema 19.11 L’equazione di Hermite ha soluzioni che in L2 R; e x dx
(cioè: che all’in…nito non vanno +1 troppo rapidamente) solo in corrispondenza di una successione di autovalori n = 2n per n = 0; 1; 2; 3; ::: La soluzione
Hn (x) dell’equazione di Hermite corrispondente a n = 2n è un polinomio di
2
1
grado n; il sistema fHn (x)gn=0 è ortonormale completo in L2 R; e x dx .
Dimostrazione (traccia). La tecnica della dimostrazione è ancora simile: si
cercano soluzioni per serie di potenze, si arriva alla seguente legge ricorsiva sui
coe¢ cienti:
(2n
)
cn+2 =
cn .
(n + 2) (n + 1)
Poiché
cn+2
(2n
)
=
! 0;
cn
(n + 2) (n + 1)
per il criterio del rapporto la serie di potenze converge su tutto R. Quindi per
ogni esistono due soluzioni linearmente indipendenti de…nite su tutto R. Se
= 2n per n intero non negativo, allora la serie termina e diventa un polinomio
di grado k. Se la serie non termina, un’analisi dell’ordine di grandezza dei
coe¢ cienti mostra che la soluzione all’in…nito crescerebbe più velocemente di
2
2
ex =2 , quindi non apparterrebbe a L2 R; e x dx . Le uniche soluzioni in questo
spazio sono quindi quelle polinomiali corrispondenti a = 2n: L’ortogonalità
segue come nell’argomento generale, sfruttando il fatto che il coe¢ ciente p (x)
si annulla a 1. Non discutiamo la dimostrazione di completezza.
Esplicitamente, il teorema a¤erma che:
e
con
Z
x2
Hn0 (x)
0
+ 2ne
+1
Hn (x) Hm (x) e
x2
1
201
x2
dx =
Hn (x) = 0
1 se n = m
0 se n 6= m.
Anche in questo caso è possibile scrivere i primi polinomi di Laguerre ortonor2
malizzando le funzioni 1; x; x2 ; x3 ; ::: nello spazio L2 R; e x dx . Si trova:
1
H0 (x) =
H1 (x) =
1=4
p
2
1=4
x;
2 + 4x2
p
;
2 2 1=4
12x + 8x3
p
;
H3 (x) =
4 3 1=4
:::
H2 (x) =
Si dimostra anche la seguente formula esplicita:
n
n
2 d
( 1)
ex
e
Hn (x) = pp
dxn
2n n!
Data una funzione f 2 L2 R; e
sistema
1
fHn (x)gn=0
x2
x2
.
dx ; i suoi coe¢ cienti di Fourier rispetto al
sono dati da
Z
cn =
+1
x2
f (x) Hn (x) e
dx
1
e portano allo sviluppo
f (x) =
1
X
cn Hn (x)
n=0
2
Ancora, quando una funzione f viene approssimata in L2 R; e x dx con la
somma parziale Sn della sua serie di polinomi di Hermite, ciò che viene reso
piccolo è l’integrale:
Z
+1
1
jf (x)
2
Sn (x)j e
x2
dx
2
perciò dal punto di vista visivo è meglio confrontare il gra…co di f (x) e x =2 con
2
quello di Sn (x) e x =2 (il quadrato di questa di¤erenza è piccola). Le funzioni
(non polinomiali)
2
Hn (x) e x =2
si dicono funzioni di Hermite. I loro gra…ci per i primi valori di n sono i seguenti.
202
Si osservi che Hn (x) ha n zeri in R.
Esempio 19.12 Sia f (x) = ex sin x. Calcoliamo la somma parziale Sn (x) per
n = 5 della serie di f (x) in polinomi di Hermite. Il ra¤ ronto tra i gra…ci di
2
2
f (x) e x =2 e Sn (x) e x =2 è il seguente:
203
19.3
19.3.1
Applicazioni dei polinomi ortogonali in problemi ai
limiti per equazioni a derivate parziali
Laplaciano in coordinate sferiche e polinomi di Legendre
Consideriamo il problema di Dirichlet per l’equazione di Laplace su una sfera
tridimensionale:
u uxx + uyy + uzz = 0 per x2 + y 2 + z 2 < r2
u (x; y; z) = f (x; y; z)
per x2 + y 2 + z 2 = r2 :
Tra i signi…cati …sici di quest’equazione: u può essere il potenziale (elettrostatico o gravitazionale) all’interno della sfera, …ssato il suo valore sul bordo, in
una situazione stazionaria in cui all’interno della sfera non ci sono pozzi o sorgenti del campo (cioè cariche o masse, rispettivamente); oppure u può essere la
temperatura, in stato stazionario, all’interno della sfera, nota la temperatura al
bordo, in assenza di sorgenti o pozzi di calore interni.
Data la geometria sferica, è naturale riscrivere l’operatore di¤erenziale in
coordinate sferiche ( ; #; ') e cercare poi soluzioni a variabili separate nelle
coordinate sferiche. Il laplaciano in coordinate sferiche assume la forma:
8
per 0 < < r;
>
>
@ 2 u 2 @u
1
@
@u
1
@2u
>
>
0<#< ;
+
+
sin
#
+
=
0
<
2 sin # @#
2 sin2 # @'
@ 2
@
@#
0<'<2
>
>
per 0 < # < ;
>
>
: u (r; #; ') = f (#; ')
0<'<2 :
Consideriamo ora la situazione sempli…cata in cui il dato al bordo f non dipende
dalla longitudine ' ma solo dalla colatitudine #. Conseguentemente, ci aspettiamo che la soluzione u sia pure indipendente da '. Il problema precedente si
riscrive quindi nella seguente forma sempli…cata:
8 2
1
@
@u
< @ u 2 @u
+
+ 2
sin #
= 0 per 0 < < r; 0 < # <
@ 2
@
sin # @#
@#
:
u (r; #) = f (#)
per 0 < # < :
(19.12)
Ci concentriamo per semplicità sulla risoluzione del problema (19.12). Il
problema generale (con dato e soluzione dipendente anche da ') si può trattare
con tecniche simili ma più elaborate. Cerchiamo quindi soluzioni a variabili
separate
u ( ; #) = R ( ) (#) .
Sostituendo nell’equazione si ha:
R00
2
+ R0
+
2
1
@
R
(sin # 0 ) = 0
sin # @#
00
R0
2R
+2
=
R
R
204
1
@
(sin #
sin # @#
0
):
Il primo membro è funzione della sola ; il secondo della sola #; quindi ciascun
membro dev’essere costante e otteniamo, per qualche 2 R da determinarsi,
2R
00
+2
R
1
@
(sin #
sin # @#
R0
=
R
0
)=
:
La prima equazione si riscrive
2
R00 + 2 R0
R=0
(19.13)
ed è un’equazione di Eulero, di cui si può determinare in corrispondenza di
ciascun l’integrale generale, cercando soluzioni del tipo R ( ) =
con da
determinarsi (v. [2, Cap.1, §1.2.D]); lo faremo dopo aver determinato . Invece,
l’altra equazione diventa
sin #
00
(#) + cos #
0
(#) =
sin # (#) per # 2 [0; ] :
(19.14)
Si ricordi che l’angolo # ha il signi…cato di colatitudine. La (#) non deve
soddisfare condizioni di periodicità, ma dev’essere regolare su tutto [0; ] (in
particolare, limitata anche agli estremi). L’equazione (19.14) si può riscrivere
in una forma più familiare eseguendo il cambio di variabili:
(#) = P (cos #) ; cos # = t:
Si ha infatti:
0
00
(#) =
sin #P 0 (cos #)
(#) = sin2 #P 00 (cos #)
cos #P 0 (cos #)
e sostituendo nella (19.14)
sin # sin2 #P 00 (cos #)
cos #P 0 (cos #) + cos # [ sin #P 0 (cos #)] + sin #P (cos #) = 0
sin3 #P 00 (cos #)
2 sin # cos #P 0 (cos #) + sin #P (cos #) = 0
sin2 #P 00 (cos #)
1
2 cos #P 0 (cos #) + P (cos #) = 0
t2 P 00 (t)
2tP (t) + P (t) = 0:
L’ultima equazione trovata è l’equazione di Legendre su [ 1; 1] (si ricordi che t =
cos # 2 [ 1; 1]). Poiché vogliamo soluzioni limitate su tutto [ 1; 1] è necessario
che sia:
= n (n + 1) ; n = 0; 1; 2; :::
P (t) = Pn (t) ;
n-esimo polinomio di Legendre. Quindi le soluzioni della (19.14) sono:
n
(#) = Pn (cos #) :
205
Risolviamo ora l’equazione di Eulero (19.13) per
2
Cerchiamo R ( ) =
2
(
R00 + 2 R0
= n (n + 1):
n (n + 1) R = 0:
.
2
1)
1
+2
(
n (n + 1)
=0
1) + 2
n (n + 1) = 0
( + 1) n (n + 1) = 0
= n;
=
(n + 1)
che dà soluzioni
R( ) =
n
;R( ) =
(n+1)
per n = 0; 1; 2; 3:::
Escludendo le soluzioni R ( ) = (n+1) illimitate nell’origine si ottengono in de…nitiva le seguenti soluzioni regolari a variabili separate dell’equazione di Laplace
indipendente dalla longitudine:
un ( ; #) = cn
n
Pn (cos #) ; per n = 0; 1; 2; 3:::
Si tratta ora, al solito, di formare una soluzione data da una serie in…nita di
queste soluzioni e cercare di imporre il dato al bordo scegliendo opportunamente
i coe¢ cienti:
1
X
u ( ; #) =
cn n Pn (cos #)
u (r; #) =
n=0
1
X
n=0
cn rn Pn (cos #) = f (#) per # 2 [0; ] .
Si tratta di sviluppare il dato f (#) in serie di Legendre a questo modo. C’è di
mezzo un cambio di variabile. Osserviamo infatti che:
Z 1
Z
Pn (t) Pm (t) dt = [t = cos #] =
Pn (cos #) Pm (cos #) sin #d#;
1
0
da cui leggiamo che:
1
il sistema fPn (cos #)gn=0 è ortonormale completo in L2 ([0; ] ; sin #d#) :
Quindi possiamo porre:
Z
Cn =
f (s) Pn (cos s) sin sds per n = 0; 1; 2; 3:::
f (#) =
0
1
X
Cn Pn (cos #) =
n=0
1
X
cn rn Pn (cos #) per cn =
n=0
(19.15)
Cn
.
rn
In de…nitiva, la soluzione del problema (19.12) è data da:
u ( ; #) =
1
X
n=0
n
Cn
r
Pn (cos #) con Cn dati da (19.15).
206
Esempio 19.13 Risolviamo il problema (19.12) con f (#) = sin2 #. Poiché
ponendo t = cos # si ha:
r
2 2
2p
2
2P0 (t)
P2 (t) ;
f (t) = 1 t =
3
3 5
si ha
r
2
2 2
2p
u ( ; #) =
2P0
P2 (cos #)
3
3 5 r
2
1 3
2 2
=
+ cos2 # :
3 3 r
2 2
In questo paragrafo abbiamo trattato l’equazione di Laplace in coordinate
sferiche supponendo per semplicità che la soluzione non dipenda dalla longitudine. Nel caso generale l’integrazione del problema agli autovalori porta ad un
sistema a due indici di autofunzioni, dette funzioni di Legendre, e imparentate
con i polinomi di Legendre.
19.3.2
Oscillatore armonico quantistico e polinomi di Hermite
In meccanica quantistica una particella di massa m in moto lungo una retta è descritta da una funzione di stato (x; t), nota la quale si può calcolare
la probabilità che la particella si trovi all’istante t nell’intervallo (a; b) come
l’integrale
Z b
2
j (x; t)j dx:
a
Per il suo signi…cato di probabilità, (x; t) deve soddisfare la condizione di
normalizzazione
Z
2
j (x; t)j dx = 1:
R
La funzione (x; t) soddisfa l’equazione di Schrödinger che, nel caso la particella
di massa m sia soggetta ad un campo di forze di potenziale V (x), è:
i~
@
(x; t) =
@t
(dove ~ = h=2
separate:
~2 @ 2
(x; t) + V (x)
2m @x2
(x; t) per x 2 R; t 2 R
e h è la costante di Planck). Cerchiamo soluzioni a variabili
(x; t) = X (x) T (t)
i~XT 0 =
i~
T0
=
T
~2 00
X T + V (x) XT
2m
~2 X 00
+ V (x)
2m X
207
da cui dev’essere
i~
T0
= E = cost.
T
~2 X 00
+ V (x) = E = cost.
2m X
per qualche costante E 2 R; che dimensionalmente ha il signi…cato di energia.
L’equazione in T si risolve direttamente
T (t) = ce
iE
~ t
:
Poiché jT (t)j = c, la condizione di normalizzazione si traduce in
Z
2
jX (x)j dx = cost.
R
Ci interessa quindi determinare le autosoluzioni L2 (R) dell’equazione:
X 00 +
2m
(E
~2
V (x)) X = 0 in R.
Sottolineiamo il fatto che l’appartenenza a L2 (R) della soluzione X (x) che
stiamo cercando è una condizione necessaria per la sensatezza …sica del problema
così impostato.
Consideriamo ora il caso particolare dell’oscillatore armonico (quantistico,
unidimensionale), per il quale
V (x) =
1
m! 2 x2 :
2
Il modello dell’oscillatore oscillatore quantistico si applica ad esempio al moto
di agitazione termica degli atomi formanti un reticolo cristallino. L’equazione
diventa:
2m
m2 ! 2 2
E
x X (x) = 0:
(19.16)
X 00 (x) +
~2
~2
Per risolverla, l’idea è ricondursi all’equazione di Hermite. Si procede in due
passi.
1. Per prima cosa vogliamo fare un cambio di variabile che renda uguale a
1 il coe¢ ciente di x2 . Sia X (x) = Z ( x) con da determinarsi, allora
2
Z 00 ( x) +
2m
E
~2
m2 ! 2 2
x Z ( x) = 0:
~2
2m
E
~2
m2 ! 2 2
y Z (y) = 0:
2 ~2
Poniamo x = y e abbiamo
2
Z 00 (y) +
208
Ora vogliamo che sia
2
4
m2 ! 2
2 ~2
m2 ! 2
=
2
r~
m!
=
:
~
=
Perciò
X (x) = Z
r
m!
x
~
risolve l’equazione (19.16) se e solo se Z (y) risolve l’equazione:
m! 00
Z (y) +
~
2m
E
~2
Z 00 (y) +
m! 2
y Z (y) = 0
~
2
E
!~
y 2 Z (y) = 0:
(19.17)
2. Ora trasformiamo questa equazione in quella di Hermite ponendo:
Z (y) = e
Z 0 (y) = e
Z 00 (t) = e
e
y2
2
y2 Y
2yY 0
y2
2
y2
2
y2
2
Y (y) :
( yY + Y 0 )
y2 Y
2
E y2 Y = 0
!~
2
2yY 0 +
E 1 Y = 0:
!~
yY 0
Y
yY 0 + Y 00
Y + Y 00 +
Y 00
(19.18)
Dunque Z (y) risolve (19.17) se e solo se Y (y) risolve (19.18). La condizione di
normalizzazione su Y si legge al modo seguente: dev’essere …nito l’integrale
r
r
Z
Z
Z
2
~
m!
2
2
jZ (y)j dy =
jX (x)j dx =
Z
x
dx =
m! R
~
R
R
r
Z
2
~
2
=
e y jY (y)j dy:
m! R
Quindi siamo interessati a individuare autosoluzioni Y e autovalori
di Hermite
Y 00 2yY 0 + Y = 0
per cui si abbia
Z
R
e
y2
2
jY (y)j dy < 1:
209
dell’equazione
Abbiamo visto (Teorema 19.11) che questa condizione può essere soddisfatta
solo per
= 2n e Y (y) = Hn (y) ; n-esimo polinomio di Hermite. Questo
signi…ca che i possibili valori dell’energia sono:
2
E
!~
1 = 2n
En =
n+
1
2
!~ con n = 0; 1; 2; 3; :::
e le autosoluzioni corrispondenti sono
Yn (y) = Hn (y) ; corrispondenti a
Zn (y) = e
y2
2
Hn (y) ;
e quindi per l’equazione iniziale:
Xn (x) = e
m!x2
2~
Hn
r
m!
x :
~
Se i polinomi di Hermite Hn sono quelli normalizzati in modo da avere norma
2
1 in L2 R; e y dy , allora l’autofunzione normalizzata sarà:
Xn (x) =
r
m!
e
~
m!x2
2~
Hn
r
m!
x
~
per n = 0; 1; 2; :::
Si trova quindi che l’oscillatore possiede una successione di possibili livelli energetici En e corrispondenti stati stazionari Xn (x), che vanno dallo stato fondamentale n = 0;
m!x2
!~
1
E0 =
; X0 (x) = 1=4 e 2~
2
ai successivi “stati eccitati” per n 1, ad esempio
p
m!x2
3
2 m!
E1 = !~; X1 (x) = 1=4
xe 2~ :
2
~
2
2
E’signi…cativo osservare anche i gra…ci delle funzioni jXn (x)j e x , che rappresentano le densità di probabilità del sistema nei vari stati stazionari:
210
L’equazione in t è risolta da
1
T (t) = ce i(n+ 2 )!t :
L’equazione di Schrödinger ha quindi soluzioni a variabili separate
r
r
m! m!x2
m!
i(n+ 12 )!t
e 2~ Hn
x
n (x; t) = e
~
~
e la soluzione dell’equazione di Schrödinger con dato iniziale 0 (x) è data allora
da una serie:
r
r
1
X
1
m! m!x2
m!
e 2~ Hn
x
(x; t) =
cn e i(n+ 2 )!t
~
~
n=0
con
0
(x) =
cn =
1
X
cn
n=0
Z +1
1
r
r
m! m!x2
m!
2~
e
Hn
x , quindi
~
~
r
r
m! m!z2
m!
2~
e
Hn
z dz:
0 (z)
~
~
19.4
Il problema agli autovalori per il laplaciano e le sue
applicazioni
19.4.1
Separazione di variabili per le equazioni del calore o delle
onde
Supponiamo di voler studiare l’equazione della di¤usione del calore, in assenza
di sorgenti, in una regione limitata del piano o dello spazio. L’equazione sarà
quindi:
ut = k u per x 2 ; t > 0:
211
(Indichiamo con x il punto generico del dominio bi o tri dimensionale
ad essere nota la condizione iniziale
). Oltre
u (x; 0) = u0 (x) in
potranno essere imposte delle condizioni al contorno, ad esempio:
u (x; t) = 0 per x 2 @
(condizione di temperatura …ssata al bordo), oppure
@u
(x; t) = 0 per x 2 @
@
(condizione di isolamento termico: la derivata normale è nulla al bordo, ossia
il ‡usso di calore è nullo). Complessivamente quindi parliamo di problema di
Cauchy-Dirichlet per l’equazione del calore:
8
per x 2 ; t > 0
< ut = k u
u (x; t) = 0
per x 2 @ ; t > 0
(19.19)
:
u (x; 0) = u0 (x) per x 2
oppure di problema di Cauchy-Neumann per l’equazione del calore:
8
per x 2 ; t > 0
< ut = k u
@u
(x;
t)
=
0
per
x 2 @ ;t > 0
: @
u (x; 0) = u0 (x) per x 2 :
(19.20)
Problemi analoghi si possono considerare per l’equazione delle onde in due o tre
variabili. In due variabili l’equazione rappresenta le vibrazioni di una membrana
elastica, mentre in tre variabili potrebbe rappresentare le vibrazioni sonore nell’aria, o simili. Stando, per …ssare le idee, sull’interpretazione bidimensionale
come membrana vibrante, se la membrana è …ssata al bordo e sono note posizione e velocità iniziali avremo un problema di Cauchy-Dirichlet per l’equazione
delle onde:
8
utt = c2 u
per x 2 ; t > 0
>
>
<
per x 2 @ ; t > 0
u (x; t) = 0
(19.21)
0)
=
u
(x)
per x 2
u
(x;
>
0
>
:
ut (x; 0) = v0 (x) per x 2 :
I problemi (19.19), (19.20), (19.21) hanno alcune caratteristiche matematiche
comuni: l’equazione di¤erenziale è lineare omogenea e le condizioni al contorno
sono omogenee, quindi sovrapposizione di soluzioni di equazione+condizioni al
bordo risolve ancora entrambe; inoltre, le variabili spazio e tempo si possono
assumere variabili in domini separati: x 2 ; t > 0. Tutto ciò suggerisce che si
possono cercare soluzioni a variabili separate in spazio e tempo, cioè del tipo:
u (x; t) = X (x) T (t) :
212
Sostituendo ad esempio in (19.19) si trova:
XT 0 = kT X
T0
X
(t) =
(x)
kT
X
da cui ogni membro dev’essere costante. Abbiamo allora:
T0 =
kT per t > 0
X + X = 0 in ;
X = 0 su @ :
Vediamo cioè che il problema (19.19) si spezza in un problema agli autovalori
X (x) + X (x) = 0
X (x) = 0
x2
x2@
(19.22)
e un’equazione in T;
T 0 (t) =
k T (t) ,
elementarmente integrabile una volta noto
(19.20) porta al problema agli autovalori
. In modo analogo, il problema
X (x) + X (x) = 0
(x) = 0
@X
@
x2
x2@
(19.23)
e alla stessa equazione in T , e il problema (19.21) porta ancora al problema agli
autovalori (19.22), e questa volta all’equazione in T
T 00 (t) =
c2 T (t) .
In conclusione: problemi di Cauchy-Dirichlet o di Cauchy-Neumann per l’equazione del calore o delle onde portano, impostandone la risoluzione per separazione di variabili, a studiare come sottoproblema un problema agli autovalori
per l’equazione di Laplace, su un dominio del piano o dello spazio, con condizioni
al contorno di tipo Dirichlet o di tipo Neumann, cioè (19.22) o (19.23). Vale
la pena quindi dedicare un po’di attenzione a questo problema agli autovalori
di per sé, che si può vedere come un analogo in più variabili di quello che in
una sola variabile sono i problemi di Sturm-Liouville che abbiamo considerato
in precedenza. Si noti che per ora non abbiamo detto niente sul dominio
(dimensioni, forma, regolarità...), tuttavia alcune proprietà di base si possono
stabilire molto in generale.
Teorema 19.14 Sia
un dominio limitato del piano o dello spazio, regolare
quanto basta perché ci si possa applicare il teorema della divergenza. Supponiamo che (X; ) e (Y; ) siano due coppie autofunzione-autovalore (X; Y
) che risolvono il problema (19.22) oppure il
non identicamente nulle e C 2
problema (19.23). Allora:
Z
6= =)
X (x) Y (x) dx = 0:
213
cioè autofunzioni relative ad autovalori distinti sono tra loro ortogonali in L2 ( ).
Inoltre gli autovalori sono positivi.
Dimostrazione. Consideriamo le identità
X (x) + X (x) = 0
Y (x) + Y (x) = 0:
Moltiplichiamo la prima per Y; la seconda per X, sottraiamo e integriamo in
Z
Z
(
)
X (x) Y (x) dx =
(Y X X Y ) dx:
:
Ora trasformiamo l’integranda ricordando che:
r (Y rX) = Y X + rX rY
r (XrY ) = X Y + rY rX
e quindi
(Y
X
X Y ) = r (Y rX
XrY )
e per il teorema della divergenza
Z
Z
Z
(
)
X (x) Y (x) dx =
(Y X X Y ) dx =
r (Y rX
Z
Z
@X
=
(Y rX XrY ) d =
Y
@
@
@
XrY ) dx
X
@Y
@
d =0
perché, a seconda delle condizioni al contorno che sto considerando, o X e Y
@Y
sono nulle su @ (problema di Dirichlet) o @X
(problema
@ ; @ sono nulle su @
di Neumann). Ne segue, essendo 6= ; che
Z
X (x) Y (x) dx = 0:
Proviamo la positività degli autovalori. Moltiplichiamo l’equazione X (x) +
X (x) = 0 per X e integriamo in :
Z
Z
Z
Z
2
2
X X (x) dx =
jrX (x)j dx
r (XrX) dx
X (x) dx =
Z
Z
Z
@X
2
2
=
jrX (x)j dx
X
d =
jrX (x)j dx
@
@
di nuovo per le condizioni al contorno, che comportano l’annullarsi dell’integrale
di bordo. Quindi:
R
2
jrX (x)j dx
= R
> 0:
2
X (x) dx
214
I risultati appena visti e l’analogia con quanto accade per i problemi di
Sturm-Liouville suggeriscono che ci si possa aspettare, almeno per domini
“buoni”, l’esistenza di una successione di autovalori e una famiglia di autofunzioni corrispondenti, che risultino formare un sistema ortonormale completo di
L2 ( ). Se e quando così accade, il problema (19.19), ad esempio, avrà soluzioni
a variabili separate del tipo:
un (x; t) = Xn (x) e
k
nt
e quindi potremo cercare una soluzione
u (x; t) =
1
X
cn Xn (x) e
k
nt
(19.24)
n=0
imponendo
u0 (x) =
1
X
cn Xn (x)
n=0
ossia pur di saper sviluppare u0 in serie di autofunzioni del laplaciano. Analoghi
procedimenti valgono per l’equazione delle onde: il problema (19.21) avrà soluzioni
a variabili separate del tipo:
h
i
p
p
un (x; t) = Xn (x) an cos c
(19.25)
n t + bn sin c
nt
e quindi potremo cercare una soluzione
u (x; t) = X0 (x) +
1
X
n=1
h
p
Xn (x) an cos c
nt
p
+ bn sin c
nt
i
imponendo
u0 (x) = X0 (x) +
1
X
an Xn (x)
n=1
v0 (x) =
1
X
n=1
p
bn c
n Xn
(x)
ossia pur di saper sviluppare u0 e v0 in serie di autofunzioni del laplaciano.
Tutta la discussione precedente mostra quindi che è utile studiare il problema agli autovalori per il laplaciano su vari domini del piano e dello spazio e
stabilire se e quando questo possiede un sistema ortonormale completo di autosoluzioni. Quando la geometria di
è semplice, il problema agli autovalori
può essere a sua volta impostato mediante separazione di variabili. In un piccolo
numero di geometrie semplici questi problemi sono stati sviscerati classicamente:
se
è un rettangolo, un cerchio, una sfera, un cilindro, di questi problemi si
sa tutto; le autofunzioni sono scritte esplicitamente in termini di opportune
215
funzioni speciali, gli autovalori sono noti in forma esatta. Per domini più generali ciò che è possibile fare è da una parte dimostrare teoremi di esistenza sotto
opportune ipotesi, d’altro canto sviluppare metodi di calcolo numerico approssimato di autofunzioni e autovalori. Nel seguito di questo paragrafo tratteremo
le due situazioni geometricamente più semplici: rettangolo e cerchio. Ritorneremo brevemente su questo problema in seguito, dopo che avremo sviluppato il
quadro concettuale moderno in cui teoremi di esistenza di questo tipo possono
essere enunciati.
19.4.2
L’equazione di Helmholz sul rettangolo
L’equazione
u+ u=0
è detta anche equazione di Helmholz. Studiamola sul rettangolo, con condizione
al contorno di Dirichlet nulla:
8
0 x a; 0 y b
< uxx + uyy + u = 0
u (0; y) = u (a; y) = 0 0 y b
:
u (x; 0) = u (x; b) = 0 0 x a:
Impostiamo il problema per separazione delle variabili, cercando
u (x; y) = X (x) Y (y) :
Si trova:
X 00 Y + XY 00 + XY = 0
X 00
=
X
+
Y 00
Y
e ciascuno dei due membri dev’essere costante, poiché il primo è funzione di x
e il secondo di y. Quindi per qualche reale si ha, tenendo conto anche delle
condizioni al contorno:
X 00 = X
X (0) = X (a) = 0
Y 00 = (
+ )Y
Y (0) = Y (b) = 0:
Si tratta di due problemi agli autovalori, distinti e simili. Il primo, in X;
come soluzioni:
Xn (x) = sin
n x
;
a
=
n
a
2
, n = 1; 2; 3; :::
Il secondo, in Y; , ha come soluzioni
Ym (x) = sin
m y
;
b
216
=
m
b
2
ha
il che porta in de…nitiva a una successione a due indici di autovalori e autofunzioni:
m y
n x
sin
a
b
n 2
m 2
=
+
=
a
b
un;m (x; y) = sin
n;m
2
n2
m2
+
a2
b2
.
Si noti che abbiamo e¤ettivamente ottenuto una successione di autofunzioni
che costituisce un sistema ortonormale completo di L2 ([0; a] [0; b]) con una
successione di autovalori che tende a +1.
Se ad esempio stessimo risolvendo questo problema per risolvere poi il problema di Cauchy-Dirichlet (19.21) per l’equazione delle onde avremmo, in base
alla discussione fatta in precedenza e alla (19.25)
1
X
n x
m y
sin
a
b
n;m=1
"
!
!#
r
r
m2
m2
n2
n2
an;m cos c
+ 2 t + bn;m sin c
+ 2t
;
a2
b
a2
b
u (x; y; t) =
sin
nella quale potremmo determinare i coe¢ cienti an;m ; bn;m per soddisfare le condizioni iniziali. Si osservi che le frequenze proprie di vibrazione della membrana
sono i numeri
r
m2
c n2
+ 2:
2
2 a
b
Se stessimo risolvendo il problema agli autovalori per risolvere poi il problema
di Cauchy-Dirichlet (19.19) per l’equazione del calore avremmo, in base alla
discussione fatta in precedenza e alla (19.24)
u (x; y; t) =
1
X
n;m=1
cn;m sin
n x
m y
sin
e
a
b
k
2
n2
a2
2
+m
b2
t
;
nella quale potremmo determinare i coe¢ cienti cn;m per soddisfare la condizione
iniziale.
19.4.3
L’equazione di Helmholz sul cerchio
Studiamo ora l’equazione di Helmholz sul cerchio unitario, con condizione al
contorno di Dirichlet nulla. Scrivendo il laplaciano in coordinate polari si ha:
8 2
1 @2u
< @ u 1 @u
+
+
+ u = 0 0 < < 1; 0 # 2
2 @#
(19.26)
@ 2
@
:
u (1; #) = 0
0 # 2 :
217
Separiamo le variabili cercando
u ( ; #) = R ( )
R00
1
+ R0
+
2
1
2
R
00
+ R
R0
R00
+
+
R
R
(#) :
=0
2
00
=
che porta a:
00
2
00
0
R + R +
2
=
R = 0:
La prima equazione, unita alla condizione di periodicità su
n
; porta a
(#) = an cos (n#) + bn sin (n#)
= n2 ; n = 0; 1; 2; :::
e la seconda diventa
2
R00 + R0 +
2
n2 R = 0;
problema agli autovalori in da risolversi per
dizione al contorno nulla), e R (0) …nita.
(19.27)
2 [0; 1], con R (1) = 0 (con-
Equazione di Bessel ed autofunzioni sul cerchio
Riscrivendo l’equazione (19.27) nella forma
n2
R00 + R0 +
R=0
e quindi
0
( R0 ) +
n2
R = 0 per
2 (0; 1) ,
si vede che si tratta di un problema di Sturm-Liouville singolare (il coe¢ ciente
p ( ) = si annulla in 0). Da questa forma dell’equazione si legge che per
autosoluzioni relative ad autovalori distinti sono ortogonali in L2 ((0; 1) ; d ).
Si osservi che in questa equazione l’intero n = 0; 1; 2; ::: è …ssato (cioè: per ogni n
stiamo studiando una diversa equazione); il numero che cerchiamo è senz’altro
positivo perché per come è stato impostato il problema è un autovalore del
Laplaciano. Siamo interessati a determinare le soluzioni R ( ) dell’equazione in
(0; 1) che siano limitate in 0 e si annullino in 1.
Si procede così: poniamo = ! 2 ed eseguiamo il cambio di variabili ! = x:
d
si ha:
Poiché dd = ! dx
2
! 2 R00 + !R0 + ! 2
2
x2 R00 + xR0 + x2
n2 R = 0;
n2 R = 0 per x 2 (0; !) , con
R (!) = 0; R (0) limitata.
218
L’equazione
x2 R00 + xR0 + x2
n2 R = 0 per x 2 (0; +1)
(19.28)
si dice equazione di Bessel di ordine n = 0; 1; 2; 3; ::: A noi interessa risolverla
in (0; !) imponendo la condizione R (!) = 0 (e la limitatezza in 0), ma poiché
! è ancora incognita, diciamo che ci interessa risolverla in (0; +1).
Enunciamo senza dimostrazione una serie di proprietà che riguardano l’equazione di Bessel.
1. L’integrale generale dell’equazione di Bessel di ordine n ha la forma
c1 Jn (x) + c2 Yn (x)
dove Jn (x), detta funzione di Bessel di prima specie di ordine n = 0; 1; 2; :::; è
regolare in [0; +1), mentre Yn (x), detta funzione di Bessel di seconda specie
di ordine n = 0; 1; 2; :::; è regolare in (0; +1) ma illimitata in 0. Quindi la
soluzione che ci interessa della (19.28) è R (x) = Jn (x).
2. La funzione Jn (x) ha in…nite oscillazioni in (0; +1) ; in particolare ha
1
una successione di zeri fkn;m gm=1 che tende a in…nito.
Gra…ci delle funzioni Jn (x) per n da 0 a 5
219
Jn (x) ; n !
kn;m ; m #
1
2
3
4
0
1
2
3
4
5
2:405
5:520
8:654
11:792
3:832
7:016
10:173
13:324
5:136
8:417
11:620
14:796
6:380
9:761
13:015
16:223
7:588
11:065
14:372
17:616
8:771
12:339
15:700
18:980
Valori di alcuni zeri delle funzioni di Bessel
Poiché vogliamo R (!) = 0 dovrà essere
! = kn;m per qualche m;
2
kn;m
.
ossia =
Quindi, per ogni intero n = 0; 1; 2; :::; l’equazione (19.27) ha
1
2
soluzioni solo se è uno dei valori kn;m
, e in tal caso la soluzione è
m=1
R ( ) = Jn (kn;m ) .
Gra…ci di J0 (k0;m x) per m = 1; 2; 3; 4:
Gra…ci di J1 (k1;m x) per m = 1; 2; 3; 4:
220
Gra…ci di J2 (k2;m x) per m = 1; 2; 3; 4:
1
Per ciascun n …ssato il sistema (a un solo indice) fJn (kn;m )gm=1 è ortogonale completo in L2 ([0; 1] ; d ). L’ortogonalità è già stata dimostrata. Non
dimostriamo la completezza.
3. Si hanno quindi le seguenti autosoluzioni a variabili separate di (19.26):
Jn (kn;m ) cos (n#) per n = 1; 2; 3; ::: m = 1; 2; 3; :::
Jn (kn;m ) sin (n#) per n = 1; 2; 3; ::: m = 1; 2; 3; :::
J0 (k0;m )
per n = 1; 2; 3; :::
(19.29)
1
2
corrispondenti alla successione a due indici di autovalori kn;m
.
n=0;1;2;:::m=1;2;:::
Gli autovalori sono i quadrati di tutti gli zeri di tutte le funzioni di Bessel di
prima specie. Le autofunzioni (19.29) costituiscono un sistema ortogonale completo in L2 ([0; 1] [0; 2 ] ; d d#) ossia, passando in coordinate cartesiane, in
L2 del cerchio unitario. Questo discende dal seguente argomento generale.
1
Sappiamo già che per ogni n …ssato fJn (kn;m )gm=1 è ortogonale completo
2
in L ([0; 1] ; d );
1
sappiamo che fcos (n#) ; sin (n#) ; 1gn=1 è ortogonale completo in L2 ([0; 2 ] ; d#);
2
allora presa una funzione f 2 L ([0; 1] [0; 2 ] ; d d#) possiamo:
1. per …ssato sviluppare f in serie di Fourier rispetto a #:
1
A0 ( ) X
f ( ; #) =
+
fAn ( ) cos (n#) + Bn ( ) sin (n#)g ;
2
n=1
1
ora per ogni n sviluppiamo An e Bn in serie rispetto al sistema fJn (kn;m )gm=1 ,
1
e sviluppiamo A0 in serie rispetto al sistema fJ0 (k0;m )gm=1 . Otteniamo:
1
1 X
a0;m J0 (k0;m ) +
(19.30)
2 m=1
( 1
)
1
1
X
X
X
+
an;m Jn (kn;m ) cos (n#) +
bn;m Jn (kn;m ) sin (n#)
f ( ; #) =
n=1
m=1
m=1
221
che è esattamente uno sviluppo rispetto al sistema (19.29), che pertanto risulta
completo.
Le funzioni (19.29) sono ortogonali complete ma non normalizzate. Per
calcolare i coe¢ cienti di normalizzazione occorre sapere che:
Z 1
1 2
2
Jn (kn;m ) d = Jn+1
(kn;m ) :
2
0
Tenuto conto di questo, i coe¢ cienti dello sviluppo (19.30) si calcolano così:
an;m =
2
2
Jn+1
(kn;m )
Z
2
cos (n#)
0
Z
1
f ( ; #) Jn (kn;m ) d d#
0
per n = 0; 1; 2; :::; m = 1; 2; :::
Z 2
Z 1
2
bn;m =
sin (n#)
f ( ; #) Jn (kn;m ) d d#
2
Jn+1
(kn;m ) 0
0
per n = 1; 2; :::; m = 1; 2; :::
Si possono ora trarre conseguenze sulla soluzione di un problema di CauchyDirichlet per l’equazione del calore o delle onde sul cerchio. Ad esempio, per
la membrana vibrante circolare con velocità iniziale nulla e posizione iniziale
f ( ; #) si troverà soluzione:
u (t; ; #) =
+
1
1 X
a0;m J0 (k0;m ) cos (k0;m ct)
2 m=1
1
X
n=1
Jn (kn;m )
1
X
[an;m cos (n#) + bn;m sin (n#)] cos (kn;m ct) :
m=1
In particolare, le frequenze proprie di vibrazione della membrana circolare …ssata
al bordo risultano essere
kn;m c
:
2
Un caso particolarmente semplice ma interessante è quando la condizione iniziale
è di tipo radiale. Si ha in tal caso:
1
1 X
u (t; ; #) =
a0;m J0 (k0;m ) cos (k0;m ct)
2 m=1
dove
f( )=
1
1 X
a0;m J0 (k0;m ) :
2 m=1
222
20
Esercizi sulla Parte 4
A. Metodo di separazione delle variabili
Es 20.1 Risolvere col metodo di separazione delle variabili il seguente problema
di Cauchy-Dirichlet per l’equazione del calore omogenea sul segmento:
8
< ut = 3uxx per 0 < x < 1; t > 0
u (0; t) = u (1; t) = 0
:
u (x; 0) = sin3 ( x)
Es 20.2 Risolvere col metodo di separazione delle variabili il seguente problema
di Cauchy-Dirichlet per l’equazione della corda vibrante:
8
utt = 4uxx per 0 < x < ; t > 0
>
>
<
u (0; t) = u ( ; t) = 0
u (x; 0) = sin 2x cos 3x
>
>
:
ut (x; 0) = 0:
Es 20.3 Risolvere col metodo di separazione delle variabili il seguente problema
di Dirichlet per l’equazione di Laplace sul cerchio:
8 2
1 @2u
< @ u 1 @u
+
+ 2 2 = 0 per 2 [0; 1); # 2 [0; 2 ]
2
@
@
@#
:
u (R; #) = # (2
#)
per # 2 [0; 2 ] :
Es 20.4 Risolvere col metodo di separazione delle variabili il seguente problema
di Dirichlet per l’equazione di Laplace sulla corona circolare:
8 2
@ u 1 @u
1 @2u
>
>
<
+
+
= 0 per 2 (1; 2) ; # 2 [0; 2 ]
2 @#2
@ 2
@
u (1; #) = 1
per # 2 [0; 2 ]
>
>
:
u (2; #) = 3
per # 2 [0; 2 ]
Es 20.5 Risolvere col metodo di separazione delle variabili il problema di Dirichlet per l’equazione di Laplace sul rettangolo:
8
< uxx + uyy = 0 per x 2 (0; 1) ; y 2 (0; 2)
u (x; 0) = u (x; 2) = u (1; y) = 0
:
u (0; y) = sin y cos 2 y:
Es 20.6 Risolvere col metodo di separazione delle
agli autovalori per il Laplaciano sul rettangolo:
8
0 x
< uxx + uyy + u = 0
u (0; y) = u (1; y) = 0 0 y
:
u (x; 0) = u (x; 2) = 0 0 x
223
variabili il seguente problema
1; 0
2
1:
y
2
Es 20.7 Risolvere esplicitamente mediante separazione di variabili il seguente
problema di Cauchy-Dirichlet per un’equazione di di¤ usione e trasporto sul segmento:
8
< ut = uxx + 2ux per x 2 [0; L] ; t > 0
u (0; t) = u (L; t) = 0 per t > 0
:
u (x; 0) = 2e x sin 3Lx per x 2 [0; L] :
Es 20.8 Risolvere mediante separazione di variabili il seguente problema di
Dirichlet per il laplaciano su una corona circolare (il problema è già scritto
in coordinate polari):
8
1
1
< u + u + 2 u## = 0 per 1 < < 2; # 2 [0; 2 ]
u (1; #) = 0
:
u (2; #) = 1 + sin # + 3 cos 2#:
Es 20.9 Risolvere esplicitamente, mediante separazione di variabili il seguente
problema di Dirichlet per un’equazione di Laplace con termine di ordine zero,
sul quadrato Q = [0; 1] [0; 1]:
8
uxx uyy + u = 0 per (x; y) 2 [0; 1] [0; 1]
>
>
<
u (0; y) = u (1; y) = 0 per y 2 [0; 1]
u (x; 1) = 0 per x 2 [0; 1]
>
>
:
u (x; 0) = sin (5 x) per x 2 [0; 1] :
B. Polinomi ortogonali e problemi di Sturm-Liouville
Es 20.10 Determinare il polinomio di grado
3 che meglio approssima sin x
in L2 ( 1; 1). Suggerimento: usare i polinomi di Legendre, calcolandoli dalla
formula
q
n+
Pn (x) =
2n n!
1
2
dn
x2
dxn
1
n
:
Es 20.11 Dimostrare l’ortogonalità delle autosoluzioni relative ad autovalori
distinti per l’equazione di Laguerre:
xe
x 0 0
y
+ e
x
y = 0 per x 2 (0; +1) :
Es 20.12 Risolvere il seguente problema di Sturm-Liouville regolare, determinando autovalori e autofunzioni:
0
(xy 0 ) + xy = 0 per x 2 (1; 2)
y (1) = y (2) = 0:
Suggerimento: per prima cosa scrivere per esteso l’equazione di¤ erenziale e determinare il suo integrale generale in funzione di . (E’un’equazione di Eulero...
Ricordare che per reale è xi = ei log x = cos ( log x)+i sin ( log x)). Quindi
imporre le condizioni agli estremi.
224
Es 20.13 Nello spazio di Hilbert L2 (0; 1), ortonormalizzare le funzioni x2 ; x; 1
(in quest’ordine).
Es 20.14 I primi polinomi di Legendre sono:
P0 (x) =
P2 (x) =
p1 ;
2
q
1
5
2
2
P1 (x) =
3x2
1 ;
P3 (x) =
q
3
q2
x;
7
2
3
2x
+ 52 x3 :
Tenendo presente questo, determinare il polinomio di grado
approssima in L2 [ 1; 1] la funzione f (x) = cos ( x) :
2 che meglio
Es 20.15 I primi polinomi di Laguerre sono:
L0 (x) = 1;
L2 (x) = 1 2x +
Calcolare il polinomio di grado
ex=4 nello spazio L2 ((0; +1) ; e
20.1
x
x2
2 ;
L1 (x) = 1
:::
x;
2 che meglio approssima la funzione f (x) =
dx).
Soluzione di alcuni esercizi sulla Parte 4
A. Metodo di separazione delle variabili
Soluzione Es. 20.7. Cerchiamo u (x; t) = X (x) T (t) : L’equazione diventa:
T 0 X = T X 00 + 2T X 0
T0
X 00 + 2X 0
(t) =
(x)
T
X
da cui
per qualche
T0
X 00 + 2X 0
=
=
T
X
costante. Si deve avere quindi:
X 00 (x) + 2X 0 (x) = X (x) per x 2 (0; L)
X (0) = X (L) = 0
T 0 (t) = T (t) per t > 0:
Risolviamo:
X 00 + 2X 0
X = 0 in (0; L)
X (0) = X (L) = 0
che porta:
+ 1 < 0;
X (x) = e
x
sin
225
p
j1 + jx
con
p
j1 + jL = n
e quindi
h
2
( nL )
un (x; t) = cn e
2
n
L
=
i
+1 t
1
x
e
n
x :
L
sin
Cerchiamo ora la soluzione
1
X
cn e
sin
3 x
L
u (x; t) =
n=1
x
che soddis… u (x; 0) = 2e
2e
x
sin
h
2
( nL )
i
+1 t
e
x
n
x
L
sin
: A¢ nché sia:
3 x
L
1
X
=
cn e
x
n
x
L
sin
n=1
si dovrà avere:
c3 = 2; cn = 0 per n 6= 3;
e in de…nitiva la soluzione cercata è:
h
2
( 3L )
u (x; t) = 2e
i
+1 t
e
x
sin
3
x :
L
Soluzione Es. 20.9. Cercando u (x; y) = X (x) Y (y) si trova:
X 00
=1
X
Y 00
=
Y
= cost.
Le condizioni u (0; y) = u (1; y) = 0 portano al problema agli autovalori:
X 00 = X
X (0) = X (1) = 0
che dà
Xn (x) = sin (n x)
n
=
n2
2
; n = 1; 2; 3; :::
Quindi si ha:
Y 00 = 1 + n2
2
Y
che ha integrale generale
p
Yn (y) = an e
1+n2
2y
226
+ bn e
p
1+n2
2y
:
Imponendo anche la condizione Yn (1) = 0 si trova (dopo qualche calcolo)
p
Sh 1 + n2 2 (1 y)
p
Yn (y) = cn
Sh 1 + n2 2
quindi
u (x; y) =
1
X
cn
p
1 + n2 2 (1 y)
p
sin (n x)
Sh 1 + n2 2
Sh
n=1
e imponendo u (x; 0) = sin (5 x) si ha c5 = 1; gli altri coe¢ cienti nulli. Perciò:
p
Sh 1 + 25 2 (1 y)
p
u (x; y) =
sin (5 x) :
Sh 1 + 25 2
Soluzione Es. 20.15. Calcoliamo anzitutto:
Z +1
f (x) xn e x dx per n = 0; 1; 2:
0
Z
Z
+1
x=4
e
e
x
dx =
0
+1
Z
+1
4
e
3
dx =
0
ex=4 xe
x
dx =
0
Z
+1
3x=4
xe
+1
ex=4 x2 e
x
dx =
0
Z
2
4
3
=
dx =
0
8
=0+
3
Z
=
0
4
3
+1
3x=4
+
Z
3x=4
0
+1
4 2
x e
3
dx =
+1
3x=4
8 16
:
3 9
dx =
4
3
3x=4
xe
3x=4
0
+
Z
4
e
3
+1
0
0
dx =
xe
+1
0
16
9
+1
x2 e
+1
3x=4
4
xe
3
0
=0+
Z
3x=4
e
3x=4
4
2xe
3
dx
3x=4
dx
Quindi:
hf; L0 i =
hf; L1 i =
hf; L2 i =
4
3
Z
+1
e
3x=4
e
3x=4
dx
0
Z
0
Z
+1
0
+1
dx
2
Z
+1
xe
3x=4
0
227
dx +
1
2
Z
16
=
9
0
4
9
+1
x2 e
3x=4
dx =
4
3
2
16 1 8 16
4
+
=
9
2 3 9
27
e la proiezione richiesta è:
P f (x) = hf; L0 i L0 + hf; L1 i L1 + hf; L2 i L2
4
4
(1 x) +
1
9
27
4
4
4 4
=
+
+x
3 9 27
9
4
2 2
28
+ x+ x :
=
27 27
27
=
Gra…co di f (x) e
x=2
4
3
e P f (x) e
x=2
:
228
2x +
x2
2
8
27
+
2 2
x
27
Parte V
Formulazione debole dei problemi
ai limiti per equazioni ellittiche
21
21.1
Derivate deboli e spazi di Sobolev
Il concetto di derivata debole
Gli spazi di funzioni …n qui incontrati nel corso sono di due tipi: gli spazi C k
di funzioni continue o derivabili, adatti ad esempio allo studio classico delle
equazioni di¤erenziali ordinarie, e gli spazi di Lebesgue Lp e in particolare L2 ,
adatti allo studio dei problemi di analisi di Fourier e approssimazione di funzioni. Nello studio delle equazioni a derivate parziali, l’individuazione degli spazi
funzionali opportuni si è rivelato essere un problema tanto cruciale quanto delicato. Gli spazi C k in più variabili, molto usati nel 19 secolo soprattutto nello
sviluppo dei metodi di risoluzione esplicita di problemi ai limiti per equazioni
a derivate parziali piuttosto semplici e su domini semplici, si sono rivelati inadeguati per il successivo sviluppo della teoria: risultati generali di esistenza
e unicità per problemi ai limiti per equazioni a derivate parziali non valgono
mai in questi spazi. Ad esempio, …n dagli inizi del 20 secolo è noto che per
l’equazione di Poisson
u=f
esistono funzioni f continue per cui l’equazione non ha soluzione C 2 . Per ottenere la risolubilità in senso classico dell’equazione, il termine noto f dev’essere
“un po’più che continuo”, precisamente dev’essere hölderiano, ossia soddisfare
una condizione di continuità del tipo:
jf (x1 )
f (x2 )j
c jx1
x2 j
per qualche
2 (0; 1] (se
= 1 stiamo parlando delle funzioni lipschitziane
che già conosciamo; la condizione di Hölder è in generale più debole). Sotto
quest’ipotesi l’equazione ha soluzioni classiche non solo C 2 , ma con derivate
seconde a loro volta hölderiane. E’ questo il contenuto della teoria sviluppata
da Schauder nel 1934, che rappresenta un quadro concettuale coerente in cui
trattare certe classi di equazioni a derivate parziali dal punto di vista classico (ossia richiedendo che la soluzione abbia tutte le derivate che compaiono
nell’equazione almeno continue e l’equazione sia soddisfatta in ogni punto del
dominio). Questa teoria (di cui nel seguito non diremo nulla) non costituisce
però l’ultima parola sull’argomento. In e¤etti lo studio delle equazioni a derivate
parziali compiuto nel 20 secolo ha messo in luce come anche in questo contesto
l’integrale di Lebesgue abbia un ruolo centrale, e gli spazi di funzioni in cui studiare EDP debbano essere anch’essi in qualche modo modellati sull’integrale.
Cerchiamo di motivare questa a¤ermazione con qualche osservazione più speci…ca, mentre per un quadro storico di ampio respiro sull’evoluzione dello studio
229
delle equazioni a derivate parziali nel 20 secolo rimandiamo al saggio [7], in
particolare §§11-14.
1. L’equazione di Poisson per il potenziale newtoniano è:
u=f
dove f ha il signi…cato di densità (di carica o di massa). Ora, dal punto di
vista …sico una funzione densità tipicamente può essere discontinua, ed è il
suo integrale su un certo dominio ad esprimere una grandezza …sica misurabile
(carica o massa totale). Quand’è così, l’equazione di¤erenziale esprime allora
un’uguaglianza tra le derivate seconde della soluzione e una funzione integrabile
ma generalmente discontinua. Quindi è sensato cercare la soluzione in uno spazio
di funzioni le cui derivate di ordine massimo siano integrabili ma generalmente
discontinue.
2. Nella deduzione di molte equazioni a derivate parziali della …sica matematica, ad esempio l’equazione di Poisson per il potenziale, l’equazione di di¤usione del calore, l’equazione di continuità, le equazioni di Maxwell, la deduzione
matematica dell’equazione di¤erenziale segue uno schema ricorrente:
(i) si scrivono opportune equazioni di bilancio che eguagliano tra loro due
integrali, esprimenti in modo diverso una stessa quantità …sica (tipicamente tale
quantità è la velocità istantanea di incremento di una certa grandezza …sica in
una regione …nita dello spazio);
(ii) applicando il teorema della divergenza o del rotore (cioè analoghi multidimensionali della “formula di integrazione per parti” tipica degli integrali in
una variabile) si riscrive l’equazione come un unico integrale, esteso ad una
generica regione dello spazio, uguagliato a zero;
(iii) per la genericità di tale regione, se ne deduce che la funzione integranda deve annullarsi, quindi si ottiene un’equazione (di¤erenziale) che dev’essere
soddisfatta puntualmente.
Vediamo quindi che nella deduzione stessa delle equazioni di¤erenziali, le
grandezze dotate di un signi…cato …sico diretto sono spesso integrali di certe
espressioni (contenenti le derivate della funzione incognita e termini noti). Ad
esempio, l’equazione di di¤usione del calore in condizioni stazionarie si può
scrivere nella forma:
div (a (x) ru (x)) = f (x)
dove u è la funzione incognita (temperatura), a (x) un coe¢ ciente di conducibilità, f (x) un termine di sorgente di calore. In realtà il coe¢ ciente di
conducibilità a (x) può realisticamente essere discontinuo, quindi l’epressione
div (a (x) ru (x)) ha un signi…cato dubbio, dal punto di vista del concetto classico di derivata. Se si seguono i passi della deduzione di questa equazione,
si osserva però che il primo membro nasce dall’applicazione del teorema della
divergenza all’integrale di super…cie:
Z
a (x) ru (x) dS,
@
che esprime il ‡usso termico uscente dalla regione . A¢ nché questo abbia
signi…cato è su¢ ciente che il prodotto a (x) ru (x) sia una funzione continua
230
(non necessariamente derivabile), il che può accadere anche in casi in cui il
coe¢ ciente a (x) e il gradiente ru (x) siano ciascuno discontinuo. Si capisce
quindi che per poter considerare situazioni …sicamente interessanti, occorre a
volte attenuare le richieste di regolarità sulla soluzione.
3. Ci sono grandezze importanti dal punto di vista sia matematico che …sico,
legate a certi problemi ai limiti per EDP, espresse da integrali della soluzione
o di sue derivate. Ad esempio abbiamo visto che se u è un’autofunzione del
laplaciano
u + u = 0 in
u = 0 su @
allora è
R
2
= R
jruj dx
2
juj dx
(quoziente di Rayleigh). Gli autovalori sono quantità importanti tanto per lo
sviluppo della teoria matematica quanto per il loro signi…cato …sico (frequenze
di vibrazione del sistema, livelli energetici...). Il fatto che un autovalore sia il
quoziente tra le norme L2 del gradiente della soluzione e della soluzione stessa
signi…ca che queste norme integrali hanno un ruolo importante nello studio
dell’equazione.
La conclusione di queste osservazioni è la seguente: è naturale, nello studio
delle equazioni a derivate parziali, introdurre degli spazi di funzioni in cui la
norma pesi certi integrali della funzione e certi integrali di sue derivate. Queste
norme infatti controllano quantità che sono signi…cative sia nel processo di deduzione dell’equazione, sia in relazione ai termini che compaiono nell’equazione
stessa, sia in relazione a certe proprietà matematicamente e …sicamente rilevanti
della soluzione.
Tuttavia sappiamo già che se gli spazi C k vengono muniti di norme integrali,
quelli che si ottengono sono spazi non completi. Questo signi…ca che le norme
integrali che dobbiamo de…nire non dovranno pesare le “solite” derivate: se
vogliamo sperare di ottenere spazi completi, dovremo anche generalizzare il concetto di derivata, e introdurre norme che pesino l’integrale di queste “derivate
generalizzate”. Come per ottenere uno spazio completo di funzioni integrabili è stato necessario de…nire un concetto di integrale più ‡essibile (quello di
Lebesgue), grazie a cui più funzioni risultano integrabili, analogamente occorrerà ora de…nire un concetto di derivata più ‡essibile, grazie a cui più funzioni
risultino derivabili. E’ questo il concetto di derivata debole, che ora introdurremo. Gli spazi di funzioni derivabili in questo senso debole sono gli spazi di
Sobolev, introdotti a metà anni 1930 e a tutt’oggi quadro funzionale standard
per molti problemi di equazioni a derivate parziali. I risultati di esistenza per
problemi ai limiti che dimostreremo successivamente sono invece degli anni 1950.
Per generalizzare il concetto di funzione derivabile in un contesto di funzioni integrabili l’idea, suggerita anche dalle osservazioni fatte in precedenza, è
quella di assegnare un ruolo centrale alla formula di integrazione per parti (e
analogamente, in più variabili, al teorema della divergenza). Infatti è proprio
231
questa, nella deduzione …sica delle equazioni, a costituire il passaggio chiave che
trasforma una quantità sempre dotata di signi…cato …sico in un’altra che solo
nei casi regolari lo è.
Illustriamo l’idea matematica di derivata debole, prima nel caso unidimensionale e poi in quello n-dimensionale.
21.2
Derivata debole, caso unidimensionale
De…nizione 21.1 Sia (a; b) un intervallo aperto in R (può anche essere a =
1; b = +1). Chiamiamo spazio delle “funzioni test” sull’intervallo (a; b) lo
spazio C01 (a; b) delle funzioni in…nitamente derivabili in (a; b) e identicamente
nulle fuori da un intervallo chiuso e limitato strettamente contenuto in (a; b).
De…nizione 21.2 Chiamiamo L1loc (a; b) lo spazio delle funzioni localmente integrabili in (a; b) ; cioè delle funzioni f che appartengono a L1 [ ; ] per ogni
intervallo chiuso e limitato [ ; ] strettamente contenuto in (a; b).
Si noti che, in particolare, se f 2 L1loc (a; b) e 2 C01 (a; b) allora f 2
L (a; b).
Consideriamo ora due funzioni 2 C01 (a; b) e f 2 C 1 (a; b). Allora si ha
(formula di integrazione per parti):
1
Z
a
b
Z
b
f 0 dx = [f ]a
e quindi (per l’annullamento di
Z
b
f 0 dx
a
agli estremi)
b
f 0 dx =
a
Z
b
f 0 dx:
(21.1)
a
Avendo in mente questa uguaglianza quando f 2 C 1 (a; b) ; diamo ora la seguente
de…nizione:
De…nizione 21.3 (Derivata debole) Sia f 2 L1loc (a; b). Diciamo che f ha
derivata debole in (a; b) se esiste una funzione g 2 L1loc (a; b) tale che
Z
a
b
f 0 dx =
Z
b
g dx
a
8 2 C01 (a; b) :
In tal caso si scrive g = f 0 . Nella de…nzione precedente, l’integrale è quello di
Lebesgue.
E’ chiaro che se f 2 C 1 (a; b) allora la derivata classica di f soddisfa la
de…nizione precedente, cioè: se f è derivabile in senso classico in (a; b) ; allora è
derivabile anche in senso debole in (a; b), e la derivata debole coincide con quella
classica. Si tratta di capire cos’abbiamo guadagnato con questa de…nizione, cioè
quali altre funzioni risultano avere derivata debole.
232
Esempio 21.4 Sia f (x) = jxj in ( 1; 1). Proviamo a calcolare la derivata
debole di f . Si ha:
Z 1
Z 0
Z 1
jxj 0 (x) dx =
x 0 (x) dx +
x 0 (x) dx =
1
1
0
in ciascun integrale possiamo ora fare le integrazioni per parti standard
Z 0
Z 1
1
0
= [ x 0 (x)] 1 +
(x) dx + [x 0 (x)]0
(x) dx =
1
poiché
0
( 1) = 0
=
Z
0
(x) dx
1
Z
1
(x) dx =
0
Z
1
g (x) (x) dx
1
con g (x) =sgn(x). Pertanto esiste la derivata debole
0
jxj = sgn (x) .
Si potrebbe commentare: sapevamo già che la derivata del modulo è il segno
di x! Questa osservazione non coglierebbe il punto, però. Occorre ri‡ettere sul
fatto che il concetto di derivata debole è un concetto globale, non puntuale o
locale: data una funzione f 2 L1loc (a; b) ; o si può determinare una funzione
che abbia il diritto di chiamarsi sua derivata debole sull’intervallo (a; b), oppure
diremo che la funzione non ha derivata debole in (a; b). In particolare, non ha
senso dire che una funzione è derivabile in senso debole in ( 1; 1) per x 6= 0.
Nell’esempio appena visto, la funzione sgn(x) è una funzione L1loc ( 1; 1) (in
particolare non dà problema il fatto che sia de…nita solo quasi ovunque), che
soddisfa la de…nizione di derivata debole di jxj in ( 1; 1) ; mentre dal punto
0
di vista classico è jxj =sgn(x) solo per x 6= 0. Come mostreranno i prossimi
esempi, se f è derivabile in senso classico tranne un numero …nito di punti,
questo di per sé non implica che la funzione uguale alla derivata classica quando
questa esiste sia una derivata debole.
Esempio 21.5 Sia f (x) = sgn (x) in ( 1; 1). Proviamo a calcolare la derivata
debole di f . Si ha:
Z 1
Z 0
Z 1
0
0
sgn (x) 0 (x) dx =
(x) dx +
(x) dx =
1
1
=
0
(0) + ( 1) + (1)
(0) =
2 (0)
poiché ( 1) = 0. A¢ nché esista la derivata debole di f dovrebbe esistere una
funzione g 2 L1loc ( 1; 1) tale che
Z
1
sgn (x)
1
0
(x) dx =
Z
1
g (x) (x) dx
1
233
8 2 C01 ( 1; 1)
cioè tale che
Z
1
8 2 C01 ( 1; 1) :
g (x) (x) dx = 2 (0)
1
E’facile capire che tale g non può esistere: l’integrale di g contro una funzione
test non può produrre sempre il valore della test in un punto. Quindi f non ha
derivata debole in ( 1; 1). Si osservi che dal punto di vista classico la derivata di
f esiste quasi ovunque ed è zero dove esiste. Tuttavia la funzione identicamente
nulla non è la derivata debole di f .
Esempio 21.6 Sia f (x) = x con 2 R, in (0; 1). Si osservi che qualunque sia
(anche negativo) f 2 L1loc (0; 1) (anche se in generale non sarà f 2 L1 (0; 1)).
Calcoliamo la derivata debole al modo seguente:
Z 1
Z 1
x 0 (x) dx =
x 0 (x) dx
0
"
C01
(0; 1) l’integrale in realtà è esteso a un intervallo
(si noti che per ogni 2
("; 1) con " > 0; dove " dipende dalla particolare ); nell’integrale scritto così si
può integrare per parti
Z 1
Z 1
=
x 1 (x) dx =
x 1 (x) dx:
"
0
0
Si ha ovviamente (x ) = x 1 anche nel senso delle derivate deboli. Per
2 (0; 1) questo esempio dà una funzione che nell’origine non è derivabile in
senso classico, e la cui derivata debole è comunque integrabile; per < 0 questo
esempio dà una funzione la cui derivata debole non è neppure integrabile, ma è
comunque localmente integrabile.
Il seguente teorema fa un po’ di chiarezza nelle situazioni che si possono
veri…care nel caso unidimensionale:
Teorema 21.7 Se f 2 L1loc (a; b) ha derivata debole L1loc (a; b), allora esiste una
funzione fe uguale quasi ovunque a f tale che fe 2 C (a; b). Più precisamente fe
è assolutamente continua:
Z x2
fe(x1 ) fe(x2 ) =
f 0 (t) dt per ogni x1 ; x2 2 (a; b) .
x1
In particolare: se una funzione è discontinua in un punto interno all’intervallo, certamente non ha derivata debole. E’possibile invece che abbia derivata
debole pur essendo non derivabile dal punto di vista classico in qualche punto
interno all’intervallo. Il teorema non si inverte, cioè non ogni funzione continua ha derivata debole. Infatti, non ogni funzione continua è assolutamente
continua:
234
Esempio 21.8 La funzione
f (x) =
x sin x12
0
per x > 0
per x 0
è continua ma non assolutamente continua in ( 1; 1) ; pertanto non ha derivata
debole in ( 1; 1). Omettiamo la dimostrazione di quest’a¤ ermazione.
21.3
Derivata debole, caso multidimensionale
Diamo ora la de…nizione analoga ma più generale di derivata debole di ordine
qualsiasi e in dimensione qualsiasi.
De…nizione 21.9 Sia
un aperto in Rn . Chiamiamo spazio delle “funzioni
1
test” su lo spazio C0 ( ) delle funzioni in…nitamente derivabili in e identicamente nulle fuori da un insieme chiuso e limitato strettamente contenuto in
.
De…nizione 21.10 Chiamiamo L1loc ( ) lo spazio delle funzioni localmente integrabili in ; cioè delle funzioni f che appartengono a L1 (K) per ogni insieme
chiuso e limitato K strettamente contenuto in .
De…nizione 21.11 (Derivata debole) Sia f 2 L1loc ( ). Fissato un multiindice
= ( 1 ; 2 ; :::; n )
con
j
interi non negativi, posto
j j=
1
+
2
+ ::: +
n;
diciamo che f ha derivata debole D f in se esiste una funzione g 2 L1loc ( )
tale che
Z
Z
@j j
j j
dx
=
(
1)
g dx 8 2 C01 ( ) :
f 1 2
@x1 @x2 :::@xnn
In tal caso si scrive g = D f . Nella de…nzione precedente, l’integrale è quello
di Lebesgue.
E’ chiaro che se f 2 C j j ( ) allora la derivata classica di f soddisfa la
de…nizione precedente, cioè: se f è derivabile in senso classico in ; allora è
derivabile anche in senso debole in , e la derivata debole coincide con quella
classica. Troveremo però anche funzioni derivabili in senso debole senza essere
derivabili classicamente. Inoltre, come mostreranno gli esempi, a di¤erenza del
caso unidimensionale una funzione che ha tutte le derivate deboli del prim’ordine
non è necessariamente continua.
235
2
Esempio 21.12 Sia f (x; y) = jxj y in ( 1; 1) . Proviamo a calcolare la derivata debole di Dx f . Si ha:
Z 1Z 1
Z 1
Z 0
Z 1
jxj y x (x; y) dxdy =
y
x x (x; y) dx +
x x (x; y) dx dy
1
1
=
Z
=
1
1
y
1
Z
1
0
Z
1
1
Z
(x; y) dx +
1
Z
0
1
(x; y) dx dy
0
1
sgn (x) y (x; y) dxdy
1
quindi esiste la derivata debole Dx f = sgn (x) y.
Esempio 21.13 Sia f (x; y) = x2 + y 2 con 2 R: Calcoliamo la derivata
debole Dx f in
= fx2 + y 2 < 1g (per simmetria, Dy f esisterà nelle stesse
ipotesi). Cominciamo a osservare che f 2 L1loc ( ) quando converge l’integrale
Z
1
2
d ;
0
cioè per 2 + 1 >
Z Z
1;
>
1: Quindi assumiamo
Z
Z p 2
x
1: Si ha:
1 y
1
x2 + y 2
>
(x; y) dxdy =
p
1
x2 + y 2
x
!
(x; y) dx dy
1 y2
per ogni y …ssato diverso da 0, la funzione x2 + y 2
è limitata e derivabile
anche se < 0, quindi nell’integrale interno in dx si può integrare per parti,
ottenendo
!
Z
Z p 2
1
=
1
=
Z Z
1 y
p
1
x2 + y 2
Basta ora controllare per quali
2x (x; y) dx dy
2x (x; y) dxdy:
risulta localmente integrabile la funzione
1
x2 + y 2
Stimiamo l’integrale in polari:
Z 1
Z
2(
1)
2
d =2
0
1
x2 + y 2
1 y2
2x:
1
0
2
d < 1 per
>
1=2:
Quindi la funzione ha derivata debole Dx f (e, per simmetria, Dy f ) per ogni
> 1=2: Si osservi che per < 0 in particolare la funzione f è discontinua,
e ciò non ostante ha derivate deboli del prim’ordine.
236
2
Esempio 21.14 Sia f (x; y) = x2xy
+y 2 in ( 1; 1) . Calcoliamo la derivata debole
Dx f (per simmetria, la derivata Dy f si calcolerà in modo analogo).
Z 1 Z 1
xy
(x; y) dx dy
2 + y2 x
x
1
1
per ogni y …ssato diverso da 0 la funzione x2xy
+y 2 è derivabile e limitata in x,
perciò nell’integrale interno si può integrare per parti e si ha:
!
Z 1 Z 1
y x2 + y 2
2x2 y
=
(x; y) dx dy
x2 + y 2
1
1
Z Z
y y 2 x2
=
(x; y) dxdy:
2
2 2
( 1;1)2 (x + y )
Controlliamo che la derivata trovata è L1loc :
Z Z
x2 +y 2 <1
y y2
x2
(x2 +
2
y2 )
dxdy
c
Z
0
1
3
4
d = c:
Quindi esistono le derivate prime deboli. Di nuovo, notare che la f (x; y) è
discontinua.
Esempio 21.15 Sia f (x; y) =sgn(x). La funzione non ha derivata debole in
2
( 1; 1) : La dimostrazione è analoga al caso unidimensionale.
L’esempio precedente ha un signi…cato generale: una funzione di 2 variabili
dotata di derivate deboli prime può essere discontinua in un punto, ma non può
avere una discontinuità a gradino lungo un segmento. Non può, ad esempio,
essere la funzione caratteristica di un aperto. Più in generale:
Esempio 21.16 In Rn , sia
contenuto nel primo.
un aperto e A
f (x) =
non ha derivate deboli prime in
:
un aperto strettamente
1 se x 2 A
0 se x 2
=A
Un risultato utile che dà una condizione su¢ ciente per la derivabilità in
senso debole è il seguente:
Teorema 21.17 (di Rademacher) Sia
Rn un aperto e f lipschitziana
in : Allora:
1. f ammette derivate parziali prime in senso classico quasi ovunque in ;
2. le derivate parziali prime di f sono funzioni L1 ( );
3. le derivate parziali prime di f sono anche derivate deboli.
Si tratta di un teorema profondo, che unisce idee classiche sulla derivabilità
alle idee di teoria della misura.
237
21.4
Spazi di Sobolev
Possiamo ora introdurre gli spazi di funzioni derivabili in senso debole:
De…nizione 21.18 (Spazi di Sobolev) Sia
spazio di Sobolev:
Rn un aperto. De…niamo lo
H 1 ( ) = f 2 L2 ( ) : f ha derivate deboli prime in L2 ( ) ;
munito della norma
kf kH 1 (
)
= kf kL2 (
)
+ kjrf jkL2 (
)
:
Più in generale, per k = 1; 2; 3::::
H k ( ) = f 2 L2 ( ) : f ha derivate deboli di tutti gli ordini …no a k in L2 ( ) ;
munito della norma
kf kH k (
)
= kf kL2 (
)+
k X
X
j=1 j j=j
kD f kL2 (
)
:
Come per gli spazi di Lebesgue, a¢ nché queste siano e¤ettivamente delle
norme occorre identi…care tra loro funzioni uguali quasi ovunque. In altre parole,
formalmente un elemento di uno spazio di Sobolev non è una funzione ma una
classe d’equivalenza di funzioni.
Gli spazi di Sobolev che abbiamo appena de…nito sono modellati sullo spazio
L2 . In modo analogo si possono de…nire per ogni p 2 [1; 1] spazi di Sobolev
di funzioni Lp con derivate deboli in Lp , ed in e¤etti nell’odierna teoria delle
equazioni a derivate parziali questi spazi di Sobolev sono fondamentali, ma per
le applicazioni che abbiamo in mente il caso p = 2 sarà su¢ ciente. Ciò che
rende speciali gli spazi di Sobolev H 1 e H k ; modellati su L2 , è che la loro
norma proviene da un prodotto scalare:
kf kH 1 (
= hf; f i con
Z
Z
hf; gi =
f gdx +
rf rgdx
)
(se considerassimo funzioni a valori complessi dovremmo de…nire il prodotto
scalare con un coniugato sul secondo fattore dell’integranda). Analogamente:
kf kH k (
= hf; f i con
Z
k X Z
X
(D f ) (D g) dx:
hf; gi =
f gdx +
)
j=1 j j=j
Il prossimo risultato è ormai semplice da dimostrare ma fondamentale. In
un certo senso è la motivazione della de…nizione di derivata debole che abbiamo
dato:
238
Teorema 21.19 Gli spazi H k ( ) (k = 1; 2; 3; :::) sono completi. Dunque sono
spazi di Banach e di Hilbert.
Dimostrazione. Proviamolo per k = 1, il caso generale si ottiene iterando lo
1
stesso argomento. Sia dunque ffk gk=1 una successione di Cauchy in H 1 ( ).
Per come è de…nita la norma H 1 , questo signi…ca che:
1
ffk gk=1 è di Cauchy in L2 ( ) ;
1
(fk )x1 k=1 è di Cauchy in L2 ( ) ;
...
1
(fk )xn k=1 è di Cauchy in L2 ( ) :
Poiché L2 ( ) è completo, esisteranno f; g1 ; :::; gn 2 L2 ( ) tali che
fk ! f in L2 ( ) ;
2
(fk )xi ! gi in L ( ) ; per i = 1; 2; :::; n:
(21.2)
(21.3)
Proviamo che esiste la derivata debole fxi = gi per i = 1; 2; :::; n. Infatti per
de…nizione di derivata debole di fk si ha:
Z
Z
fk xi dx =
(fk )xi dx per ogni 2 C01 ( ) ; i = 1; 2; :::; n:
Passando al limite per k ! 1, per la continuità del prodotto scalare si ha:
Z
Z
f xi dx =
gi dx per ogni 2 C01 ( ) ; i = 1; 2; :::; n;
e questo signi…ca appunto che esiste fxi = gi per i = 1; 2; :::; n. Ma allora le
(21.3) dicono che (fk )xi ! fxi ; che insieme alla (21.2) dà fk ! f in H 1 ( ), e
H 1 ( ) è completo.
Osservazione 21.20 (Spazio H 1 e energia …nita) In diverse interpretazioni
…siche delle equazioni a derivate parziali che andremo a studiare negli spazi di
Sobolev, se u è la soluzione dell’equazione, l’integrale
Z
2
jruj dx
ha il signi…cato di energia. Per esempio, la densità di energia del campo elettrico
è data da
1
D E:
2
Nel vuoto i due campi sono proporzionali e pari al gradiente del potenziale
elettrostatico u; perciò
Z
Z
2
Energia in =
cru rudx = c
jruj dx:
239
Analoga relazione vale per l’energia del campo magnetico. Se invece u (x; y)
rappresenta la con…gurazione di una membrana elastica in equilibrio, la sua
energia potenziale elastica è ancora proporzionale a
Z
2
jruj dx:
Perciò lo spazio H 1 ( ) ha il signi…cato …sico di insieme di stati di un sistema
aventi energia …nita.
Abbiamo già detto che le funzioni regolari in senso classico hanno anche
derivate deboli. Se ad esempio u 2 C 1
con aperto limitato, certamente
u 2 H k ( ) per ogni k. E’ interessante chiedersi se, oltre a ciò, ogni funzione
in uno spazio di Sobolev può essere approssimata mediante funzioni regolari.
Il prossimo teorema raccoglie i risultati fondamentali in questa direzione. (Si
tratta in realtà di due diversi teoremi, che abbiamo condensato in un unico
enunciato. La dimostrazione di questi fatti è lunga ed elaborata, non la faremo).
Teorema 21.21 (Approssimazione con funzioni regolari) 1. Sia
Rn
k
1
un aperto qualsiasi e u 2 H ( ). Allora esiste una successione fuj g C ( )
tale che uj ! u in H k ( ). In altre parole: C 1 ( ) \ H k ( ) è denso in H k ( ).
2. Se inoltre
ha frontiera regolare, allora esiste una successione fuj g
C1
(funzioni regolari …no al bordo) tale che uj ! u in H k ( ). Nel caso in
cui è illimitato, si possono comunque scegliere le uj aventi ciascuna supporto
limitato. In altre parole: C 1
è denso in H k ( ).
Si osservi che il secondo risultato di approssimazione è più forte del primo,
e vale sotto un’ipotesi di regolarità sulla frontiera di , mentre il primo vale su
qualsiasi aperto :
Nello studio dei problemi ai limiti per equazioni a derivate parziali sarà
importante poter a¤ermare che una certa funzione appartenente ad H 1 ( ) si
annulla sul bordo del dominio. Il signi…cato di questa a¤ermazione però non è
ovvio, perché le funzioni H 1 ( ) sono de…nite quasi ovunque, e @ in generale
ha misura nulla, per cui non è chiaro che si possa dire quanto vale una funzione
di H 1 ( ) nei punti del bordo. Il modo in cui diciamo che u si annulla sul
bordo di fa intervenire l’approssimazione con funzioni regolari. Si consideri
la prossima:
De…nizione 21.22 Se
Rn è un aperto, de…niamo lo spazio H01 ( ) come
la chiusura di C01 ( ) in H 1 ( ). Esplicitamente, H01 ( ) è de…nito come il
sottoinsieme di H 1 ( ) costituito da quelle funzioni che sono limite in norma
H 1 ( ) di una successione di funzioni C01 ( ):
o
n
1
H01 ( ) = f 2 H 1 ( ) : 9 f k gk=1 C01 ( ) : k k f kH 1 ( ) ! 0 :
240
Si veri…ca facilmente che H01 ( ) è un sottospazio vettoriale di H 1 ( ), chiuso
e quindi completo. In altre parole, anche H01 ( ) è uno spazio di Hilbert. Questo
spazio contiene in particolare le funzioni regolari che si annullano puntualmente
sul bordo di . Più in generale, i suoi elementi sono le funzioni nulle sul bordo
nel senso degli spazi di Sobolev.
Si possono de…nire anche spazi di funzioni nulle su parte della frontiera:
De…nizione 21.23 Se
Rn è un aperto e
@ è una parte della frontiera
n 1
tale che H
( ) > 0, de…niamo lo spazio H 1 ( ) come la chiusura in H 1 ( )
dello spazio delle funzioni C 1 ( ) che si annullano in un intorno di :
H1 ( ) = f 2 H1 ( ) : 9 f
k
1
k gk=1
= 0 in un intorno di
C1 ( ) ;
:k
f kH 1 (
k
)
o
!0 :
La de…nizione di derivata debole è modellata sulla formula di integrazione
per parti. Ci aspettiamo che la formula di integrazione per parti “funzioni bene”
perciò tra due funzioni in spazi di Sobolev. Infatti:
Teorema 21.24 (Integrazione per parti) Per ogni f 2 H 1 ( ) ; g 2 H01 ( )
si ha:
Z
Z
f gxi dx =
fxi gdx:
(21.4)
1
Dimostrazione. Poiché g 2 H01 ( ) esiste f k gk=1
C01 ( ) : k ! g in
1
H ( ). Per queste k possiamo scrivere, per de…nizione di derivata debole di
f;
Z
Z
f ( k )xi dx =
fxi k dx:
Ora passiamo al limite per k ! 1 e per la continuità del prodotto scalare
abbiamo (21.4), poiché k ! g in L2 e ( k )xi ! gxi in L2 .
Si noti che la precedente formula di integrazione per parti ha bisogno che
almeno una delle due funzioni sia nulla al bordo. Altrimenti nel caso classico
comparirebbe anche un integrale di super…cie. Dobbiamo capire che cosa diventa
questa formula quando entrambe le funzioni sono H 1 ( ) ma non nulle al bordo.
Questo coinvolge il concetto di traccia di una funzione H 1 ( ) sul bordo di .
La domanda è: è possibile de…nire i valori di u su @ (pur essendo questo un
insieme di misura nulla)? La risposta, non scontata, è a¤ermativa: per quanto in
generale le funzioni H 1 ( ) siano de…nite quasi ovunque, la loro extra-regolarità
dovuta all’esistenza di derivate deboli fa sì che su insiemi di misura nulla ma
“abbastanza grandi”come sono gli insiemi di dimensione di Hausdor¤ n 1 (se
è un aperto regolare di Rn , il suo bordo è un insieme di dimensione n 1)
abbia senso considerare la restrizione di u. Questa restrizione risulta essere una
funzione L2 (@ ) ; quindi è anch’essa de…nita quasi ovunque rispetto alla misura
H n 1 su @ .
241
Teorema 21.25 Sia un dominio limitato di Rn con frontiera regolare, oppure
sia un semispazio di Rn : Esiste un operatore lineare continuo, detto operatore
di traccia,
1
2
0 : H ( ) ! L (@ )
è 0 u (x) = u (x) per x 2 @ , e per ogni u 2 H01 ( )
tale che per ogni u 2 C 1
è 0 u 0: La continuità di 0 signi…ca che vale la stima
k 0 ukL2 (@
con c dipendente solo da
c kukH 1 (
)
(21.5)
)
:
Dimostrazione. Lo proviamo nel caso del semispazio. Sia quindi
= fx = (x0 ; xn ) : xn
0g :
Sfrutteremo il Teorema 21.21 di approssimazione con funzioni regolari: ogni
aventi supporu 2 H 1 ( ) può essere approssimata mediante funzioni C 1
1
con supporto di u contenuto in
to limitato. Sia dunque prima u 2 C
fx = (x0 ; xn ) : xn Kg per qualche K 1, e proviamo per queste u una stima
di tipo (21.5). Scriviamo:
Z xn
i
d h
2
2
2
u (x0 ; xn ) = u (x0 ; 0) +
u (x0 ; t) dt
dt
0
Z xn
@u
2
2
(x0 ; t) dt
u (x0 ; 0) = u (x0 ; xn )
2u (x0 ; t)
@xn
0
Z xn
1=2
1=2 Z xn
@u
2
2
2
0
0
u (x ; xn ) + 2
u (x ; t) dt
(x0 ; t) dt
@xn
0
0
dove si è usata la disuguglianza di Schwarz. Poiché 2ab a2 + b2 si ha allora:
Z xn
Z xn
2
@u
2
2
2
0
0
0
ju (x ; 0)j
ju (x ; xn )j +
ju (x ; t)j dt +
(x0 ; t) dt
@xn
0
0
e integrando in x0 2 Rn 1 e poi in xn 2 (0; K)
Z
Z KZ
2
2
0
0
K
ju (x ; 0)j dx
ju (x0 ; xn )j dx0 dxn
Rn
1
+
Z
0
K
Rn
Rn
0
Z
Z
K
Z
1
1
Z
xn
0
Z
2
ju (x0 ; t)j dtdx0 dxn
2
xn
@u
(x0 ; t) dtdx0 dxn
@x
n
1
n
0
R
0
Z K
Z
2
2
= kukL2 ( ) +
(K t)
ju (x0 ; t)j dx0 dt
0
Rn 1
!
Z K
Z
2
@u
+
(K t)
(x0 ; t) dx0 dt
0
Rn 1 @xn
+
2
kukL2 (
2
) + K kukL2 (
242
)+K
@u
@xn
2
L2 ( )
e dividendo per K
1
2
ku ( ; 0)kL2 (@
)
1+
1
K
2
kukL2 (
2
@u
@xn
)+
2
2 kukH 1 (
L2 ( )
)
:
Si noti che la stima …nale ottenuta non contiene K, quindi non dipende dal sup1
porto della particolare funzione u. Sia ora u 2 H 1 ( ) e sia fuk gk=1 C 1
1
una successione uk ! u in H ( ) ; per le uk uh vale la stima precedente,
perciò:
2
2
kuk ( ; 0) uh ( ; 0)kL2 (@ ) 2 kuk uh kH 1 ( ) :
(21.6)
1
Poiché fuk gk=1 converge in H 1 ( ), è di Cauchy in H 1 ( ), pertanto tende a zero
il secondo membro della (21.6), e quindi anche il primo. Perciò la successione
1
fuk ( ; 0)gk=1 è di Cauchy in L2 (@ ), pertanto converge a una certa funzione
2
f 2 L (@ ); porremo
0u = f .
Si ha naturalmente
2
k 0 ukL2 (@
2
2 kukH 1 (
)
)
:
Inoltre questa funzione 0 u non dipende dalla particolare successione approssi1
1
mante fuk gk=1 , in quanto se fe
uk gk=1 è un’altra successione tendente a u in
H 1 ( ) si ha:
kuk ( ; 0)
2
u
ek ( ; 0)kL2 (@
)
2 kuk
2
u
ek kH 1 (
)
! 0;
quindi le due successioni fuk ( ; 0)g ; fe
uk ( ; 0)g individuano lo stesso limite L2 (@ ).
La tesi è quindi dimostrata.
Il concetto di traccia permette ora di stabilire nel contesto di H 1 ( ) delle
formule di integrazione per parti perfettamente analoghe a quelle classiche:
Teorema 21.26 (Formule di Green) Sia
un dominio regolare di Rn (su
cui vale il teorema della divergenza classico). Allora, indicando con il versore
normale esterno su @ :
1) Se u; v 2 H 1 ( ) ;vale la:
Z
Z
Z
uvxi dx =
uxi vdx +
( 0 u) ( 0 v) i dH n 1 :
(21.7)
@
2) Se u 2 H 1 ( ) ; v 2 H 2 ( )vale la:
Z
Z
Z
n
X
u vdx =
ru rvdx +
( 0 u)
( 0 vxi ) i dH n
@
1
:
(21.8)
i=1
Le due identità precedenti si possono riscrivere in forma più espressiva così:
Z
Z
Z
uvxi dx =
uxi vdx +
uv i dH n 1
@
Z
Z
Z
@v
u vdx =
ru rvdx +
u dH n 1
@
@
243
sottointendendo che negli integrali di bordo le integrande vanno intese nel senso
delle tracce.
Dimostrazione. Siano u; v 2 H 1 ( ), e siano fuk g ; fvk g
C1
tali che
1
uk ! u e vk ! v in H ( ) (poiché il dominio è regolare questa approssimazione
si può fare, in base al Teorema 21.21). Per il teorema della divergenza classico
si ha:
Z
Z
Z
uk (vk )xi dx =
(uk )xi vk dx +
uk vk i dH n 1 :
@
Ora passando al limite per k ! 1, poiché
uk ! u in L2 ( )
vk ! v in L2 ( )
(uk )xi ! uxi in L2 ( )
(vk )xi ! vxi in L2 ( )
uk !
vk !
0u
in L2 (@ )
0v
in L2 (@ )
per la continuità del prodotto scalare si ha:
Z
Z
Z
uvxi dx =
uxi vdx +
( 0 u) ( 0 v) i dH n
1
:
@
Siano ora u 2 H 1 ( ) ; v 2 H 2 ( ), allora applicando la precedente con v
sostituita da vxi e poi sommando in i si ha:
Z
u vdx =
Z
ru rvdx +
Z
@
( 0 u)
n
X
( 0 vxi ) i dH n
1
:
i=1
L’ultimo risultato che ci occorre riguardo agli spazi di Sobolev è la seguente
disuguaglianza che riguarda le funzioni nulle al bordo:
Teorema 21.27 (Disuguaglianza di Poincaré) Sia
itato. Allora per ogni u 2 H01 ( ) vale la:
kukL2 (
)
diam ( ) krukL2 (
)
:
Rn un dominio lim(21.9)
Lo stesso vale per u 2 H 1 ( ) dove è una porzione di frontiera di
avente
misura H n 1 positiva (con una costante c ( ) che potrebbe essere diversa dal
diametro).
In base al teorema precedente, nello spazio H01 ( ) la norma H 1 ( ) è equivalente alla sola norma L2 del gradiente.
244
Dimostrazione. Proviamo solo il risultato per H01 ( ). Poiché
particolare è contenuto in una striscia del tipo:
x = (x0 ; xn ) : x0 2 Rn
S
1
è limitato, in
; a < xn < b
con a; b 2 R. Consideriamo prima una funzione u 2 C01 ( ). Allora si ha
(essendo u nulla sul bordo di S; quindi u (x0 ; a) = 0):
Z xn
@u
u (x0 ; xn ) =
(x0 ; t) dt:
@xn
a
Per la disuguaglianza di Schwarz:
0
ju (x ; xn )j
(xn
2
(xn
ju (x0 ; xn )j
Z
2
xn
@u
a)
(x0 ; t) dt
@xn
a
!
Z xn
2
@u
0
a)
(x ; t) dt
@xn
a
!
Z b
2
@u
0
a)
(x ; t) dt
a @xn
1=2
(b
!1=2
e integrando
2
kukL2 ( )
=
Z
Rn
(b
1
Z
b
a
a)
Z
Rn
2
(b
a)
2
ju (x0 ; xn )j dxn dx0
1
Z
b
Z
a
a
2
krukL2 ( )
b
2
@u
(x0 ; t) dtdx0 dxn
@xn
1
da cui la (21.9) per u 2 C01 ( ). Sia ora u 2 H01 ( ) ; sia fuk gk=1
tale che uk ! u in H 1 ( ). Per quanto appena dimostrato è
kuk kL2 (
)
(b
a) kruk kL2 (
)
C01 ( )
per ogni k:
Passando al limite per k ! 1 si ha la (21.9) per u. E’chiaro in…ne che se
è limitato, orientando opportunamente gli assi si può sempre scegliere l’insieme
S in modo che (b a) uguagli il diametro di :
Si noti che la dimostrazione fatta sfrutta l’annullamento delle funzioni solo
su una porzione di frontiera di . Si intuisce quindi che il teorema possa valere
anche per funzioni H 1 ( ) nulle su una porzione qualunque di @ . Ne omettiamo
la dimostrazione.
245
22
Formulazione debole di problemi ellittici
22.1
Operatori uniformemente ellittici
Consideriamo ora la seguente classe di equazioni a derivate parziali di tipo
stazionario:
Lu
n
X
(aij (x) uxi )xj +
i;j=1
n
X
bi (x) uxi + c (x) u = f (x) in
Rn :
i=1
Si dice che la parte principale (cioè quella contenente le derivate seconde) è
scritta in forma di divergenza, in quanto
n
X
(aij (x) uxi )xj =
i;j=1
div (A (x) ru (x))
n
con A (x) = (aij (x))i;j=1 . Questa classe di operatori di¤erenziali contiene al
proprio interno vari casi signi…cativi. Ad esempio, in un’equazione di di¤usione
del calore in un mezzo omogeneo e isotropo la parte principale sarà del tipo
c u;
che corrisponde ad una matrice A costante multipla dell’identità. Se il mezzo
è isotropo ma non omogeneo, la matrice A sarà del tipo a (x) I con I matrice
identità, e la parte principale sarà
div (a (x) ru) :
In…ne se il mezzo è anche non isotropo, in generale la A sarà una matrice piena.
Questo signi…ca che un gradiente di temperatura ru porta ad un ‡usso di calore
q non parallelo a ru, ma ruotato secondo la matrice A; cioè con una legge
q=
A (x) ru:
Il fatto che il calore passi dal corpo più caldo al corpo più freddo signi…ca che q
e ru devono sempre formare un angolo acuto, ossia A (x) ru ru > 0. Questa
disuguaglianza deve discendere da una proprietà della matrice A (x), in modo
che possa valere qualunque sia il vettore ru. Dev’essere cioè
A (x)
> 0 per ogni
2 Rn ; x 2 :
Si suppone anzi, di solito, che questa condizione di positività della matrice sia
soddisfatta in modo uniforme rispetto a x, ossia che esista una costante positiva
per cui è
2
A (x)
j j per ogni 2 Rn ; x 2 ;
(22.1)
condizione che viene detta di uniforme ellitticità (della matrice o dell’operatore
di¤erenziale).
246
La parte principale dell’operatore è detta, per il suo signi…cato …sico, termine
di di¤ usione. Veniamo agli altri termini dell’equazione. La parte che coinvolge le
derivate prime di u è il termine di trasporto. Ad esempio, è quello che descrive
la variazione di temperatura in un mezzo continuo dovuta ad un movimento
convettivo nel mezzo stesso (cioè ad uno spostamento di materia calda, anziché
alla di¤usione di calore in materia immobile).
Un’equazione di di¤usione può descrivere non solo la di¤usione del calore in
un corpo, ma anche la di¤usione di un soluto in un solvente. In questo caso
la funzione incognita u ha il signi…cato di concentrazione del soluto, anziché di
temperatura.
In…ne, il termine contenente la u è detto termine di reazione, e compare ad
esempio in modelli di di¤usione (di un soluto in un solvente) in cui una certa porzione del soluto viene assorbita o decade. Per il suo signi…cato …sico ed
anche per motivi matematici, il coe¢ ciente c (x) di questo termine è generalmente assunto di segno non negativo: questo segno signi…ca che il termine è
responsabile di una diminuzione del soluto, nel tempo. Si tenga presente che
stiamo studiando un’equazione stazionaria che è pensata come punto d’arrivo,
all’equilibrio, dello stato di un sistema che per sua natura evolve nel tempo. In
altre parole, il signi…cato …sico dei vari termini dell’equazione si capisce meglio
pensando alla corrispondente equazione di evoluzione ut + Lu = 0:
Supporremo che tutti i coe¢ cienti dell’equazione, aij ; bj ; c siano misurabili
e limitati (ma non necessariamente continui o derivabili, neppure i coe¢ cienti
aij che pure compaiono sotto derivata!). Questo corrisponde …sicamente ad ammettere la presenza di discontinuità nella composizione del mezzo. Supporremo
sempre che valga la condizione di uniforme ellitticità (22.1). (Quando questa
non vale, si dice che l’operatore è degenere, e la teoria corrispondente può essere
decisamente più complessa).
Il termine noto f sarà supposto in L2 ( ). Per un’equazione di questo tipo
si è interessati a studiare vari tipi di problemi al contorno:
1. Problema di Dirichlet: equazione di¤erenziale + condizione
u = g su @ :
Per esempio, signi…ca che la temperatura al bordo del corpo è mantenuta controllata (termostato).
2. Problema di Neumann: equazione di¤erenziale + condizione
@u
= h su @ :
@
Per esempio, signi…ca che il ‡usso termico al bordo del corpo è mantenuto
controllato. In particolare, se h = 0 signi…ca che il corpo è termicamente isolato.
La condizione di Neumann ha questa forma quando la matrice dei coe¢ cienti
faij g è diagonale (mezzo isotropo); altrimenti va sostituita con una condizione
sulla derivata conormale:
aij (x) uxi
j
= h su @ :
247
La derivata conormale di u è la derivata nella direzione A (x) : è questa la
direzione del ‡usso di¤usivo legato ad un’equazione di questo tipo. Si può
anche scrivere in forma più espressiva:
@u
= h su @ :
@ A
3. Problema misto: equazione di¤erenziale + condizioni
u = g su
@u
= h su
@ A
0
1
dove @ = 0 [ 1 . Signi…ca che su parte del bordo è controllata la temperatura
mentre su un’altra parte del bordo è controllato il ‡usso termico.
4. Problema di Robin: equazione di¤erenziale + condizioni
@u
+ k (u
@ A
u0 ) = 0 su @
con k > 0 costante. Signi…ca che sul bordo il ‡usso termico è proporzionale alla
di¤erenza tra la temperatura del corpo e la temperatura esterna u0 . Questo è
ciò che accade se il corpo scambia liberamente calore con l’ambiente esterno.
Abbiamo riportato per completezza questo tipo di problema, di cui però non ci
occuperemo in seguito.
Vediamo che cosa signi…ca esattamente, dal punto di vista matematico, risolvere uno di questi problemi, ossia: discutiamo cosa si possa intendere per
soluzione di un problema di questi tipi. Come vedremo, una buona de…nizione
di soluzione in questo contesto non è a¤atto ovvia, ed è un buon punto di
partenza per dimostrare un risultato di esistenza della soluzione.
22.2
Problemi ai limiti e de…nizione di soluzione debole
1. Problema di Dirichlet omogeneo, parte principale laplaciano.
Consideriamo il problema di Dirichlet per l’equazione Lu = f . Per gradualità, cominciamo dal caso in cui la parte principale è il laplaciano e il dato al
bordo è zero:
Pn
u + i=1 bi uxi + cu = f in
(22.2)
u=0
su @ :
Possiamo pensare di imporre la condizione al contorno u = 0 su @ semplicemente richiedendo che la soluzione appartenga a H01 ( ) (che è stato de…nito
appunto come spazio delle funzioni nulle al bordo). In questo modo la condizione al contorno è incorporata nello spazio funzionale. Però l’equazione è del
second’ordine, perciò a¢ nché si possa calcolare u la soluzione dovrebbe stare
in H 2 ( ) ; non solo in H 1 ( ). Vogliamo trovare una formulazione alternativa
dell’equazione di¤erenziale che sia basata sulla de…nizione di derivata debole,
248
cioè sulla formula di integrazione per parti. L’idea è: per cominciare supponiamo che la funzione u sia abbastanza regolare da poter soddisfare l’equazione
in senso puntuale quasi ovunque: supponiamo che u 2 H 2 ( ) \ H01 ( ) risolva
l’equazione:
n
X
u+
bi uxi + cu = f
i=1
che in questo caso può essere interpretata come uguaglianza tra due funzioni
L2 ( ), quindi uguaglianza quasi ovunque. Si dice che u è soluzione dell’equazione in senso forte. Adesso moltiplichiamo ambo i membri per una funzione
2 H01 ( ) ed integriamo in :
Z
udx +
n Z
X
bi uxi dx +
i=1
Z
cu dx =
Z
f dx
in…ne integriamo per parti nel primo integrale, l’unico che coinvolge derivate
seconde della u. In base alle formule di Green (21.8) per u 2 H 2 ( ) e 2 H01 ( )
si ha (avendo la traccia nulla su @ )
Z
r
rudx +
n Z
X
i=1
bi uxi dx +
Z
cu dx =
Z
f dx 8 2 H01 ( ) . (22.3)
Quindi se u 2 H 2 ( ) \ H01 ( ) e u risolve l’equazione quasi ovunque, allora è
soddisfatta questa identità. D’altro canto questa identità non coinvolge derivate
seconde di u; ma ha senso per ogni funzione u 2 H01 ( ). Diremo allora che:
De…nizione 22.1 u è soluzione debole del problema (22.2) se u 2 H01 ( ) e
vale la (22.3).
Il pregio di questa de…nizione è duplice: da una parte è basata su una
formulazione integrale che come abbiamo spiegato è naturale da vari punti di
vista; dall’altra, richiede una derivata in meno rispetto a quelle che sono scritte
nell’equazione.
Supponiamo di sapere che u è soluzione debole dell’equazione. In generale, u
avrà solo derivate prime, e non potrà soddisfare l’equazione in senso puntuale. Se
però sapessimo che u 2 H 2 ( ) ; allora potremmo fare il passaggio di integrazione
per parti a ritroso arrivando a
Z
(Lu f ) = 0 per ogni 2 H01 ( ) :
In particolare l’uguaglianza vale per ogni 2 C01 ( ) ; e per noti teoremi di
annullamento questo è su¢ ciente per a¤ermare che Lu f = 0 quasi ovunque
in :
Conclusione: se u è soluzione in senso debole e inoltre u 2 H 2 ( ), allora
u è anche soluzione in senso forte. Questo chiarisce che la nozione di soluzione
249
debole è una generalizzazione della nozione di soluzione forte (o classica, quando
coe¢ cienti e soluzione sono regolari), consistente con essa.
Osserviamo ora che la (22.3) ha la seguente struttura logica:
determinare u 2 H01 ( ) tale che
a (u; ) = T
dove
a (u; ) =
Z
r
per ogni
rudx +
n Z
X
2 H01 ( ) ;
bi uxi dx +
i=1
Z
cu dx
è una forma bilineare sullo spazio di Hilbert H01 ( ), e
Z
T =
f dx
è un funzionale lineare continuo su H01 ( ). Il Teorema di Lax-Milgram sarà
quindi lo strumento per provare l’esistenza delle soluzioni. Prima di discutere
in dettaglio i risultati di esistenza, però, passiamo in rassegna ad altri problemi
ai limiti, per illustrare le corrispondenti de…nizioni di soluzione.
2. Problema di Dirichlet omogeneo, parte principale in forma di
divergenza.
Consideriamo ora il problema:
Pn
Pn
in
i;j=1 (aij (x) uxi )xj +
i=1 bi uxi + cu = f
(22.4)
u=0
su @ :
Ragioniamo in modo analogo al caso precedente. Supponiamo in un primo
momento che u 2 H 2 ( ) \ H01 ( ) e che i coe¢ cienti aij siano regolari (è
su¢ ciente lipschitziani), in modo che l’equazione possa essere soddisfatta in
senso forte, cioè sia un’uguaglianza in L2 ( ). Moltiplichiamo ambo i membri
dell’equazione per 2 H01 ( ) e integriamo in :
n Z
X
(aij uxi )xj dx +
i;j=1
n Z
X
bi uxi dx +
i=1
Z
cu dx =
Z
f dx:
Quindi integriamo per parti nel primo integrale (l’unico che coinvolge derivate
seconde della soluzione). Poiché 2 H01 ( ) e se u 2 H 2 ( ) e aij 2 Lip ( )
allora aij (x) uxi 2 H 1 ( ), per (21.7) si ha:
n Z
X
i;j=1
aij uxi
xj dx +
n Z
X
bi uxi dx +
i=1
Z
cu dx =
Z
f dx 8 2 H01 ( ) ;
(22.5)
identità che ha il pregio di avere senso per ogni u 2 H01 ( ) e inoltre per aij 2
L1 ( ). Diremo quindi che:
250
De…nizione 22.2 u è soluzione debole di (22.4) se u 2 H01 ( ) e vale la (22.5).
3. Problema di Dirichlet non omogeneo, parte principale in forma
di divergenza.
Consideriamo ora il problema:
Pn
Pn
in
i;j=1 (aij (x) uxi )xj +
i=1 bi uxi + cu = f
(22.6)
u=g
su @ :
Se il dato al bordo non è zero, non possiamo più assumere u 2 H01 ( ).
Occorre anche precisare che tipo di funzione è g, e dove risulta de…nita. Supponiamo, per semplicità, che la funzione g non sia de…nita solo su @ , ma sia
g 2 H 1 ( ). Sappiamo che in questo caso è ben de…nita la traccia di g su @ ;
in altre parole il dato al bordo è ben de…nito. Dire che u = g su @ dovrebbe
essere equivalente a dire che u g = 0 su @ ; che a sua volta si può esprimere
con la richiesta u g 2 H01 ( ). Chiederemo quindi che il dato al bordo sia
soddisfatto in questo senso:
si cerca u 2 H 1 ( ) tale che u g 2 H01 ( ).
Sia v = u g: Allora se u risolve l’equazione di partenza, formalmente v
risolve l’equazione
n
X
(aij vxi )xj +
i;j=1
0
=@
=f+
n
X
bi vxi + cv
i=1
n
X
(aij uxi )xj +
i=1
i;j=1
n
X
n
X
(aij gxi )xj
n
X
1
bi uxi + cuA
bi gxi
0
@
n
X
(aij gxi )xj +
n
X
i=1
i;j=1
1
bi gxi + cg A
cg:
i=1
i;j=1
Si osservi che se g 2 H 1 ( ) allora
F
f
n
X
bi gxi
i=1
mentre
n
X
(aij gxi )xj
n
X
j=1
i;j=1
cg 2 L2 ( ) ;
(Fj )xj con Fj 2 L2 ( ) :
Quindi: la soluzione che cerchiamo è la funzione u = g + v dove v è de…nita
come la soluzione in H01 ( ) dell’equazione
n
X
i;j=1
(aij vxi )xj +
n
X
bi vxi + cv = F +
i=1
n
X
j=1
251
(Fj )xj
che andrà interpretata anch’essa in senso debole, così:
Z
Z
n Z
n Z
X
X
aij vxi xj dx +
bi vxi dx +
cv dx =
F dx
i;j=1
i=1
n Z
X
Fj
xj dx
j=1
(22.7)
8 2 H01 ( ).
Quindi la risoluzione di un problema di Dirichlet con dato al bordo non zero
si trasforma, con il cambio di incognita u = g + v, in un altro problema di
Dirichlet con dato al bordo nullo ma termine noto dell’equazione un po’ più
complicato.
4. Problema di Neumann omogeneo.
Consideriamo ora il problema:
Pn
Pn
(a (x) uxi )xj + i=1 bi uxi + cu = f
Pn i;j=1 ij
i;j=1 aij uxi j = 0
in
su @ :
(22.8)
dove la condizione al contorno, di tipo Neumann, consiste nel chiedere che la
derivata conormale di u, cioè la derivata nella direzione A (x) , sia nulla. E’
questa la direzione del ‡usso di¤usivo legato ad un’equazione di questo tipo. Se
la parte principale fosse il laplaciano, o comunque la matrice A (x) fosse del tipo
a (x) I (isotropia del mezzo) ritroveremmo la solita derivata normale.
La soluzione non sarà in generale una funzione H01 ( ). Supponiamo prima
che u 2 H 2 ( ) ; aij siano regolari, e u soddis… l’equazione. Moltiplichiamo per
2 H 1 ( ) e integriamo su :
n Z
X
(aij uxi )xj dx +
n Z
X
bi uxi dx +
i=1
i;j=1
Z
cu dx =
Ora integriamo per parti il primo integrale. Poiché aij uxi e
funzioni H 1 ( ) la formula di Green (21.7) dà:
n Z
X
i;j=1
(aij uxi )xj dx =
n Z
X
aij uxi
xj dx
n Z
X
i;j=1
i;j=1
(
0
Z
f dx:
sono entrambe
(aij uxi )) (
0
) i dH n
@
Pn
Ora poiché 2 H 1 ( ) in generale ( 0 ) 6= 0; in compenso i;j=1 ( 0 (aij uxi )) i
è proprio la derivata conormale di u; che per ipotesi è nulla. Otteniamo quindi:
Z
Z
n Z
n Z
X
X
aij uxi xj dx +
bi uxi dx +
cu dx =
f dx 8 2 H 1 ( ) :
i;j=1
i=1
(22.9)
Questa formulazione ha senso nelle sole ipotesi aij 2 L1 ( ) e u 2 H 1 ( ),
perciò:
De…nizione 22.3 Diremo che u è soluzione debole di (22.8) se u 2 H 1 ( ) e
vale la (22.9).
252
1
:
Si osservi che la formulazione è molto simile a quella del problema di Dirichlet
omogeneo, con la di¤erenza che ora sia la u che la stanno in H 1 ( ) anziché
in H01 ( ).
5. Problema misto omogeneo.
Consideriamo ora il problema misto:
Pn
8 Pn
<
i;j=1 (aij (x) uxi )xj +
i=1 bi uxi + cu = f
u=0
: Pn
i;j=1 aij uxi j = 0
in
su
su
(22.10)
0
1
dove 0 [ 1 = @ ; 0 \ 1 = ;. Cominciamo a imporre la condizione nulla di
Dirichlet su 0 chiedendo che u 2 H 10 ( ). Supponendo u anche in H 2 ( ) e i
coe¢ cienti aij regolari, moltiplichiamo l’equazione per 2 H 10 ( ) e integriamo
in :
Z
Z
n Z
n Z
X
X
(aij uxi )xj dx +
bi uxi dx +
cu dx =
f dx:
i;j=1
i=1
Ora integriamo per parti il primo integrale. Poiché aij uxi e sono entrambe
funzioni H 1 ( ) la formula di Green (21.7) dà:
n Z
n Z
n Z
X
X
X
(aij uxi )xj dx =
aij uxi xj dx
( 0 (aij uxi )) ( 0 ) i dH n
i;j=1
i;j=1
i;j=1
Analizziamo ora l’integrale di bordo
n Z
X
( 0 (aij uxi )) ( 0 ) i dH n 1
i;j=1 @
n Z
X
(
=
i;j=1
0
(aij uxi )) (
0
) i dH
n 1
+
0
n Z
X
i;j=1
(
0
@
(aij uxi )) (
0
) i dH n
1
:
1
Poiché
2 H 10 ( ) nel
Pnprimo integrale è ( 0 ) = 0 e il primo integrale si
annulla; d’altro canto i;j=1 ( 0 (aij uxi )) i è la derivata conormale di u; che
per ipotesi è nulla su 1 , quindi il secondo integrale è pure nullo. Otteniamo
quindi:
Z
Z
n Z
n Z
X
X
bi uxi dx +
cu dx =
f dx 8 2 H 10 ( ) ;
aij uxi xj dx +
i;j=1
i=1
(22.11)
formulazione che ha senso nelle sole ipotesi u 2 H 1 ( ) ; aij 2 L1 ( ).
De…nizione 22.4 Diremo che u risolve (22.10) se u 2 H 10 ( ) e vale (22.11).
La formulazione è ancora analoga a quella del problema di Dirichlet omogeneo e del problema di Neumann omogeneo, soltanto che ora sia u che
appartengono allo spazio di Hilbert H 10 ( ).
253
1
:
22.3
Risultati di esistenza
Passiamo ora nuovamente in rassegna ai vari problemi che abbiamo impostato nel paragrafo precedente per stabilire dei risultati di esistenza, unicità e
dipendenza continua delle soluzioni dai dati, sotto opportune ipotesi.
1.-2. Problema di Dirichlet omogeneo, parte principale in forma
di divergenza
Consideriamo il problema:
Pn
Pn
in
i;j=1 (aij (x) uxi )xj +
i=1 bi uxi + cu = f
(22.12)
u=0
su @
(il caso in cui la parte principale è il Laplaciano è un caso particolare). Supponiamo che sia un dominio limitato di Rn , la matrice aij sia simmetrica, i
coe¢ cienti aij 2 L1 ( ) e sia soddisfatta la condizione di uniforme ellitticità:
n
X
2
j j
2
aij (x)
j j per ogni
i j
i;j=1
2 Rn .
(22.13)
Delle due disuguaglianze precedenti, l’ellitticità è la prima, cioè la stima dal
basso della forma quadratica; la stima dall’alto è un modo di esprimere la limitatezza dei coe¢ cienti aij ; come vedremo, è comodo scrivere la condizione in
questa forma. I numeri e esprimono limitazioni dal basso e dall’alto per il
minimo e il massimo autovalore della matrice faij (x)g, rispettivamente.
Supponiamo anche:
n
X
b2i
i=1
!1=2
bi ; c 2 L1 ( ) , con
(22.14)
B;
L1 (
)
kckL1 (
)
C;
f 2 L2 ( ) :
La formulazione debole del problema è:
n Z
X
aij uxi
xj dx
+
i;j=1
n Z
X
bi uxi dx +
i=1
2 H01 ( ):
Poniamo allora, per u;
a (u; ) =
n Z
X
aij uxi
xj dx
+
i;j=1
T
=
Z
Z
n Z
X
i=1
f dx
254
cu dx =
Z
f dx 8 2 H01 ( ) :
bi uxi dx +
Z
cu dx
e osserviamo quanto segue:
1. T è un funzionale lineare continuo su H01 ( ). La linearità è ovvia, mentre
per Schwarz:
Z
jT j =
f dx
kf kL2 ( ) k kL2 ( ) kf kL2 ( ) k kH 1 ( ) :
In particolare quindi
kT k
kf kL2 (
)
:
2. La forma a (u; v) è bilineare e continua su H01 ( ). La bilinearità è ovvia,
proviamo la continuità. Osserviamo preliminarmente che la forma bilineare su
Rn
n
X
( ; )=
aij i j
i;j=1
soddisfa la de…nizione di prodotto scalare (l’uniforme ellitticità della matrice
implica la proprietà di positività), per cui la disuguaglianza di Cauchy-Schwarz
implica la seguente disuguaglianza algebrica:
0
11=2 0
11=2
n
n
n
X
X
X
@
aij i j
aij i j A @
aij i j A
i;j=1
i;j=1
2
i;j=1
1=2
2
j j
e quindi
n Z
X
aij uxi
1=2
j j
Z
xj dx
i;j=1
=
j jj j
jruj jr j dx
Allora si ha, applicando la disuguaglianza di Schwarz e le ipotesi di limitatezza
sui coe¢ cienti:
ja (u; )j
n Z
X
aij uxi
xj dx
+
i;j=1
Z
n Z
X
bi uxi dx +
i=1
jruj jr j dx +
kjrujkL2 (
)
Z
kjr jkL2 (
( + B + C) kukH 1 (
n
X
b2i
i=1
)
!1=2
cu dx
jruj j j dx +
+ B kjrujkL2 (
) k kH 1 (
Z
)
Z
k kL2 (
jcu j dx
)
+ C kukL2 (
):
Perciò la forma bilineare è continua.
3. Studiamo la coercività della forma bilineare su H01 ( ) :
a (u; u) =
n Z
X
aij uxi uxj dx +
i;j=1
n Z
X
i=1
255
bi uxi udx +
Z
cu2 dx:
)
k kL2 (
)
Ora per l’ellitticità:
n Z
X
Z
aij uxi uxj dx
i;j=1
2
jruj dx:
(22.15)
Supponiamo che valga la condizione di segno
c (x)
allora
Z
0;
cu2 dx
(22.16)
0:
(22.17)
In…ne, per il calcolo già visto sopra
n Z
X
bi uxi udx
B kjrujkL2 (
i=1
)
kukL2 (
)
:
(22.18)
Ricordiamo che per la disuguaglianza di Poincaré, essendo u 2 H01 ( ) si ha:
kukL2 (
diam ( ) kjrujkL2 (
)
)
:
(22.19)
Combinando (22.15), (22.17), (22.18), (21.9) si ha:
2
a (u; u)
kjrujkL2 (
(
)
Bdiam (
B kjrujkL2 (
2
)) kjrujkL2 ( )
)
kukL2 (
)
:
Se vale la condizione (di piccolezza dei termini del prim’ordine, o di piccolezza
del dominio )
B
(22.20)
2diam ( )
allora si ha
2
a (u; u)
kjrujkL2 (
2
In…ne, ancora per la disuguaglianza di Poincaré,
kukH 1 (
)
= kukL2 (
)
+ kjrujkL2 (
)
)
:
(diam ( ) + 1) kjrujkL2 (
)
perciò
a (u; u)
2 (diam ( ) + 1)
kukH 1 (
)
e la forma è coerciva, sotto le ipotesi (22.16) e (22.20). Raccogliamo nel prossimo
teorema ciò che si può allora concludere applicando il teorema di Lax-Milgram
alla forma bilineare a sullo spazio di Hilbert H01 ( ):
256
Teorema 22.5 Si consideri il problema (22.12) su un dominio
Rn . Assumiamo le ipotesi (22.13), (22.14) e inoltre
c (x)
0 quasi ovunque in
B
2diam ( )
limitato di
;e
:
Allora per ogni f 2 L2 ( ) esiste una e una sola soluzione u 2 H01 ( ) del
problema, e vale la stima di stabilità (dipendenza continua della soluzione dal
termine noto f )
kukH 1 ( ) c kf kL2 ( ) ;
0
con
c=
2 (diam ( ) + 1)
.
Osservazione 22.6 La richiesta che i coe¢ cienti del termine del prim’ordine
siano piccoli non è del tutto naturale per il problema in esame, a di¤ erenza
della condizione sul segno di c. Quest’ipotesi dipende piuttosto dalla tecnica
dimostrativa usata. Se, oltre al teorema di Lax-Milgram, si fa uso anche della
teoria di Fredholm degli operatori compatti su spazi di Hilbert e di opportuni
principi di massimo per l’equazione ellittica, ques’ipotesi si riesce a rimuovere
(v. [11, Cap. 8]). Il prezzo da pagare è però lo sviluppo di una corposa teoria
di analisi funzionale. In e¤ etti la teoria di esistenza mediante il solo teorema
di Lax-Milgram è solo l’inizio della teoria delle soluzioni deboli per le equazioni
ellittiche.
3. Problema di Dirichlet non omogeneo, parte principale in forma
di divergenza.
Consideriamo ora il problema:
Pn
Pn
in
i;j=1 (aij (x) uxi )xj +
i=1 bi uxi + cu = f
(22.21)
u=g
su @ :
Abbiamo visto che la soluzione che cerchiamo è la funzione u = g + v dove
v è de…nita come la soluzione in H01 ( ) dell’equazione
n
X
(aij vxi )xj +
i;j=1
n
X
bi vxi + cv = F +
i=1
con
F
f
n
X
n
X
i;j=1
(aij gxi )xj
bi gxi
n
X
j=1
(Fj )xj
j=1
i=1
mentre
n
X
cg 2 L2 ( ) ;
(Fj )xj con Fj 2 L2 ( ) :
257
E’ cambiato solo il secondo membro dell’equazione.
debole, si cerca u 2 H01 ( ) tale che
a (u; ) =
Z
Z X
n
F dx
Fj
xj dx
Nella formulazione
T :
j=1
Veri…chiamo che T è ancora un funzionale lineare continuo su H01 ( ):
jT j =
Z "
n
X
f
i=1
kf kL2 (
+
bi gxi
)
cg
#
+ B kjrgjkL2 (
dx
n Z
X
(aij gxi )
)
+ C kgkL2 (
kjrgjkL2 ( ) kjr jkL2 ( )
n
k kH 1 ( ) kf kL2 ( ) + (B +
)
k kL2 (
+ C) kgkH 1 (
)
perciò T è continuo, con
kT k
kf kL2 (
)
xj dx
i;j=1
+ (B +
+ C) kgkH 1 (
)
o
)
+
;
.
La forma bilineare è la stessa che nel caso del problema omogeneo, perciò è
continua e coerciva sotto le stesse ipotesi. Concludiamo:
Teorema 22.7 Si consideri il problema (22.21) su un dominio
Rn . Assumiamo le ipotesi (22.13), (22.14) e inoltre
c (x)
B
0 quasi ovunque in
2diam ( )
limitato di
;e
:
Allora per ogni f 2 L2 ( ) ed ogni g 2 H 1 ( ) esiste una e una sola soluzione
u 2 H 1 ( ) del problema, e vale la stima di stabilità
n
o
kukH 1 ( ) c kf kL2 ( ) + kgkH 1 ( ) .
4. Problema di Neumann omogeneo.
Consideriamo ora il problema:
Pn
Pn
(a (x) uxi )xj + i=1 bi uxi + cu = f
Pn i;j=1 ij
i;j=1 aij uxi j = 0
in
su @ :
La formulazione debole consiste nel cercare u 2 H 1 ( ) tale che
Z
a (u; ) =
f dx per ogni 2 H 1 ( ) ;
258
(22.22)
dove a è la stessa forma considerata ai punti precedenti. La di¤erenza sta
nello spazio di Sobolev che ora è H 1 ( ). Per funzioni H 1 ( ) non vale la
disuguaglianza di Poincaré, perciò la stima di coercività va rifatta:
Z
2
a (u; u)
kjrujkL2 ( ) B kjrujkL2 ( ) kukL2 ( ) +
cu2 dx:
Ora abbiamo bisogno di una condizione forte sul segno di c (x) se vogliamo
controllare dal basso la forma anche mediante la norma kukL2 ( ) . Chiederemo:
c (x)
c0 > 0:
Il termine c (x) dev’essere cioè discosto da zero. Si ha allora:
a (u; u)
2
kjrujkL2 (
k kjrujkL2 (
B kjrujkL2 (
)
)
2
)
+ kukL2 (
kukL2 (
2
)
+ c0 kukL2 (
)
)
per qualche k > 0; purché risulti
B2
4c0 < 0:
Ad esempio, se i termini del prim’ordine sono assenti e c (x) è discosto da zero, la
forma è coerciva; più in generale, i termini del prim’ordine devono essere piccoli
rispetto alla costante c0 . In compenso non abbiamo avuto bisogno di imporre
che sia limitato. Concludiamo:
Teorema 22.8 Si consideri il problema (22.22) su un dominio
sumiamo le ipotesi (22.13), (22.14) e inoltre
c (x)
B
2
c0 > 0 quasi ovunque in
di Rn . As-
;e
4c0 < 0:
Allora per ogni f 2 L2 ( ) esiste una e una sola soluzione u 2 H 1 ( ) del
problema, e vale la stima di stabilità
kukH 1 (
)
c kf kL2 (
)
.
Si ri‡etta sulla condizione c (x) c0 > 0 che è stata richiesta. In particolare
signi…ca che il termine di ordine zero non può mancare. Si consideri infatti il
problema:
Pn
Pn
(aij (x) uxi )xj + i=1 bi uxi = f in
i;j=1
Pn
su @ :
i;j=1 aij uxi j = 0
Si osserva che la funzione u compare tanto nell’equazione quanto nelle condizioni
al contorno solo mediante le sue derivate. Perciò se u è soluzione del problema,
anche u+costante è soluzione. Viene a cadere l’unicità, pertanto il teorema non
può essere vero sotto queste ipotesi.
259
5. Problema misto omogeneo.
Consideriamo ora il problema misto:
Pn
8 Pn
<
i;j=1 (aij (x) uxi )xj +
i=1 bi uxi + cu = f
u
=
0
: Pn
i;j=1 aij uxi j = 0
in
su
su
(22.23)
0
1
dove 0 [ 1 = @ ; 0 \ 1 = ; con H n 1 ( 0 ) > 0. La formulazione debole del
problema consiste nel cercare u 2 H 10 ( ) tale che
Z
a (u; ) =
f dx per ogni 2 H 10 ( )
dove la forma bilineare è la stessa considerata in precedenza. Cambia ora lo
spazio di Hilbert. Su H 10 ( ) vale la disuguaglianza di Poincaré, quindi la
coercività si prova come nel caso 1, con la costante diam ( ) sostituita da una
più generica costante c ( ). La conclusione quindi è la seguente:
Teorema 22.9 Si consideri il problema (22.23) su un dominio
di Rn limin 1
( 0 ) > 0. Assumiamo le ipotesi
tato, con @ = 0 [ 1 ; 0 \ 1 = ;; H
(22.13), (22.14) e inoltre
c (x)
B
0 quasi ovunque in
c( )
;e
:
Allora per ogni f 2 L2 ( ) esiste una e una sola soluzione u 2 H 10 ( ) del
problema, e vale la stima di stabilità
kukH 1 (
)
c kf kL2 (
)
.
Terminiamo questa rassegna di risultati di esistenza citando senza dimostrazione
il seguente risultato sul problema agli autovalori per il laplaciano:
Teorema 22.10 Sia
valori:
un dominio limitato e regolare. Il problema agli autou + u = 0 in
u 2 H01 ( )
1
ammette una successione crescente di autovalori positivi f k gk=1 ,
un sistema di autofunzioni uk 2 H01 ( ) corrispondenti, tali che:
1
2
1) fu
n k gk=1
o è un sistema ortonormale completo di L ( );
2)
puk
R
k
1
k=1
k
! +1 e
è un sistema ortonormale completo di H01 ( ) con il prodotto
scalare
ru rvdx.
In particolare ciò signi…ca che
k
=
Z
2
jruk j dx:
260
Questo risultato in particolare ci dice che si può risolvere un problema di
Cauchy-Dirichlet per l’equazione del calore o delle onde, con dato al bordo nullo,
applicando la separazione di variabili e sviluppando il dato iniziale (supposto in
L2 ( )) in serie di autofunzioni uk .
22.4
Risultati di regolarità
Una domanda che può venire spontanea a questo punto è: abbiamo provato che
certi problemi hanno una soluzione debole in H 1 ( ); a questo modo però non si
arriva a provare che la soluzione possieda due derivate e soddis… l’equazione in
senso puntuale quasi ovunque (o ovunque). Da una parte, è ragionevole che sia
così quando i coe¢ cienti hanno la minima regolarità richiesta, L1 ( ). D’altro
canto, però, almeno nel caso in cui i coe¢ cienti siano più regolari, vorremmo
poter recuperare una nozione più forte di soluzione. Questo in e¤etti è possibile,
e fa parte della cosiddetta teoria della regolarità per le equazioni ellittiche. Si
può dire che tutta la …loso…a della teoria delle soluzioni deboli consista appunto
nello spezzare il problema della ricerca delle soluzioni in due due sottoproblemi:
1. Provare, sotto ipotesi minime, l’esistenza e unicità di una soluzione debole.
Questo, come abbiamo visto, non è di¢ cile, grazie alla teoria degli spazi di
Hilbert.
2. Provare che, nel caso i vari ingredienti dell’equazione (coe¢ cienti, termine noto, eventuali dati al bordo, e se richiesto anche il dominio stesso) sono
più regolari, anche la soluzione debole è in e¤etti una funzione più regolare, e
soddisfa l’equazione in un senso più forte.
Enunciamo, in modo schematico e senza dimostrazioni, i risultati che si ottengono, limitandoci per semplicità al caso del problema di Dirichlet omogeneo
(a cui comunque si riconduce anche il problema di Dirichlet non omogeneo). Nel
prossimo schema riassumiamo solo le ipotesi di regolarità, senza più ripetere le
ipotesi di altro tipo che devono comunque essere soddisfatte (uniforme ellitticità, condizione di segno su c (x) ; condizione di piccolezza del coe¢ ciente delle
derivate prime):
Soluzione u
in senso:
Ipotesi:
minime:
ulteriori:
ulteriori:
ulteriori:
1
coe¢ cienti aij ; bj ; c 2 LP
( );
n
termine noto T = f0 + j=1 (fj )xj
con fj 2 L2 ( )
coe¢ cienti aij 2 Lip ( ) ;
termine noto f 2 L2 ( )
dominio con frontiera C 2
coe¢ cienti aij ; bj ; c regolari
(ad es.21 aij 2 C 2
; bj ; c 2 C 1
)
1
termine noto f regolare (ad es. f 2 C
)
dominio regolare (ad es. con frontiera C 3 )
coe¢ cienti, termine noto e dominio di classe C 1
261
u2
debole
H1 ( )
forte (q.o.)
H2 ( )
classico
C2
classico
C1
22.5
Risoluzione numerica di problemi ai limiti
in forma debole
Se, da una parte, la potenza del metodo basato sugli spazi di Hilbert è quella di
permetterci di dimostrare risultati di esistenza, unicità e dipendenza continua
della soluzione dai dati in condizioni molto generali (dominio di forma arbitraria, coe¢ cienti molto poco regolari), d’altro canto è facile capire che quando
ci si trova e¤ettivamente in una situazione generale (ad esempio siamo in più
variabili e il dominio non ha una forma semplice) non sarà possibile determinare
la soluzione esatta. In questo caso è utile ricorrere a metodi di calcolo numerico.
Un aspetto interessante della teoria in spazi di Hilbert è che si presta in modo naturale allo sviluppo di corrispondenti metodi numerici. Illustriamo l’idea
generale del metodo di Galerkin per discretizzare un problema ai limiti dei tipi
trattati in precedenza.
Sia V uno spazio di Hilbert, a (u; v) una forma bilineare continua e coerciva
su V :
ja (u; v)j
a (u; a)
M kukV kvkV
2
kukV
;
(22.24)
(22.25)
e consideriamo il problema:
determinare u 2 V tale che a (u; v) = T v per ogni v 2 V;
(22.26)
dove T 2 V 0 è assegnato. Ricordiamo che i problemi di Dirichlet omogeneo,
Neumann omogeneo e misto omogeneo si possono formulare in questo modo,
scegliendo rispettivamente V = H01 ( ), V = H 1 ( ), V = H 1 ( ). Supponiamo
di avere una famiglia fVh gh>0 di sottospazi di V …nito dimensionali, dimVh =
Nh . La famiglia di sottospazi è indiciata su un parametro reale positivo che si
farà tendere a zero; il signi…cato di questo parametro potrebbe essere quello di
ampiezza della griglia di discretizzazione, come si spiegherà meglio in seguito.
Consideriamo il problema discretizzato:
determinare uh 2 Vh tale che a (uh ; vh ) = T vh per ogni vh 2 V
(22.27)
Per questo problema, ovviamente, vale a maggior ragione il risultato di esistenza, unicità e dipendenza continua della soluzione dai dati, in quanto la forma
bilineare è continua e coerciva a maggior ragione su uno spazio più piccolo. In
particolare varrà una stima di dipendenza continua
kuh kV
1
kT kV 0
con la stessa costante 1 che vale su tutto V . Concretamente, il problema
discretizzato si può risolvere così. Fissiamo una base in Vh ;
1;
2 ; :::;
262
Nh .
La validità della condizione
a (uh ; vh ) = T vh per ogni vh 2 Vh
è equivalente alla validità delle Nh condizioni
a (uh ;
j)
=T
j
per j = 1; 2; :::; Nh
(22.28)
(in quanto ogni vh 2 Vh si può scrivere come combinazione lineare delle funzioni
della base). A sua volta, la ricerca di uh equivale alla ricerca dei coe¢ cienti
Nh
fci gi=1
che permettono di scrivere
uh =
Nh
X
ci
(22.29)
i
i=1
e sostituendo questa scrittura nelle Nh equazioni (22.28) si trova il sistema:
!
Nh
X
a
ci i ; j = T j e quindi
i=1
Nh
X
a ( i;
j ) ci
=T
j;
(22.30)
i=1
che è un sistema Nh
Nh nelle incognite ci avente per matrice dei coe¢ cienti
A = fa ( i ;
Nh
j )gi;j=1
e per termini noti i numeri T j . Sappiamo già che il problema dev’essere solubile, ma veri…chiamo direttamente che questa matrice è invertibile mostrando
che è de…nita positiva:
0
1
2
Nh
Nh
Nh
Nh
X
X
X
X
A
a ( i; j ) i j = a @
i i;
j j
j j
i;j=1
i=1
j=1
j=1
V
PNh
e questa norma si annulla solo se j=1 j j = 0; il che accade solo se tutti i
numeri i sono nulli, poiché i vettori i sono per ipotesi linearmente indipendenti. Dunque A è de…nita positiva e perciò invertibile. Il sistema lineare
Nh Nh (22.30) è quindi risolubile e i coe¢ cienti ci una volta determinati ci
forniscono mediante (22.29) la soluzione del problema discretizzato (22.27). Si
tratta ora di provare che la soluzione del problema discretizzato (22.27) converge alla soluzione del problema originario (22.26). E’questo il contenuto del
prossimo teorema:
Teorema 22.11 (Convergenza del metodo di Galerkin) Nelle ipotesi precedenti (22.24), (22.25), supponiamo che la famiglia di sottospazi fVh g sia scelta
in modo che
lim inf kvh vkV = 0 per ogni v 2 V .
h!0 vh 2Vh
263
Allora detta uh la soluzione del problema (22.27) e u la soluzione del problema
(22.26), si ha
lim kuh ukV = 0:
h!0
Dimostrazione. Sappiamo che
a (uh ; vh ) = T vh 8vh 2 Vh
(22.31)
e
a (u; v) = T v 8v 2 V;
quindi in particolare è anche
a (u; vh ) = T vh 8vh 2 Vh :
(22.32)
Sottraendo membro a membro (22.31) e (22.32) otteniamo
a (u
uh ; vh ) = 0 8vh 2 Vh :
(22.33)
Ora scriviamo, sfruttando la coercività, bilinearità e continuità della forma
a:
ku
2
uh k
a (u
= a (u
uh ; u
uh ; u
uh ) = a (u uh ; u vh ) + a (u
vh ) M ku uh k ku vh k ;
dove abbiamo sfruttato il fatto che, per (22.33), a (u
vh uh 2 Vh . Di conseguenza
ku
ku
uh k
2
uh k
u h ; vh
u h ; vh
uh )
uh ) = 0 perché
M ku uh k ku vh k
M
ku vh k 8vh 2 Vh
e quindi passando all’estremo inferiore al variare di vh 2 Vh ;
ku
uh k
M
inf ku
vh 2Vh
vh k :
Ora per la nostra ipotesi sulla famiglia di sottospazi fVh g, il 2 membro tende
a zero per h ! 0, dunque anche il primo, e la tesi è dimostrata.
Il metodo di Galerkin appena descritto è in realtà una famiglia di metodi,
o se vogliamo una strategia generale di risoluzione numerica del problema ai
limiti considerato. Per applicarlo concretamente occorre de…nire la famiglia di
sottospazi …nito dimensionali fVh g di V , e prima ancora naturalmente …ssare
l’attenzione su un particolare problema (Dirichlet, Neumann, misto) e quindi
…ssare lo spazio di Hilbert V . Poiché qui si entra qui nel calcolo numerico vero
e proprio, che esula dal contenuto di questo corso, daremo solo qualche cenno
schematico, rimandando al testo [17] per una trattazione approfondita.
264
Consideriamo per …ssare le idee il problema di Dirichlet omogeneo, per cui
V = H01 ( ), e supponiamo anche, per semplicità, che l’operatore abbia la forma
semplice
Lu = r (a (x) ru) + cu;
cioè la forma bilineare sia
Z
Z
a (u; v) =
a (x) ru (x) rv (x) dx +
c (x) u (x) v (x) dx:
(22.34)
Consideriamo brevemente i due casi: è un intervallo della retta (problema
unidimensionale) o è un aperto limitato del piano (problema bidimensionale).
Metodo degli elementi …niti nel caso unidimensionale
Sia = (a; b), suddividiamo (a; b) in N sottointervalli di ampiezza massima
h. De…niamo Vh come lo spazio delle funzioni continue in [a; b] e zero agli
estremi, che ristrette a ciascuno degli N intervallini risulti un polinomio di
grado r, con r = 1; 2; 3; ::: E’possibile scegliere una base di questo spazio in
modo che ogni elemento della base abbia supporto contenuto in non più di 3
intervallini adiacenti. A questo modo, quando si va a calcolare la matrice del
sistema lineare che corrisponde al problema discretizzato
a ( i;
j) ;
se la forma bilineare ha la forma (22.34) la matrice risulta tridiagonale, il che
ovviamente alleggerisce i calcoli rispetto al caso generale in cui la matrice sia
piena.
Si dimostra che in questo caso kuh ukV tende a zero dell’ordine di hr dove,
ricordiamo, h è l’ampiezza massima degli intervallini e r l’ordine dei polinomi,
purché però la soluzione esatta appartenga allo spazio H r+1 (a; b), cosa che
si può garantire se i coe¢ cienti a (x) ; c (x) sono su¢ cientemente regolari. Se
ad esempio a 2 Lip (a; b) ; c 2 L1 (a; b) si può scegliere solo r = 1. Se a 2
C 2 [a; b] ; c 2 C 1 [a; b] si può scegliere r = 2; e così via.
Metodo degli elementi …niti nel caso bidimensionale
In questo caso il dominio viene triangolato, ossia suddiviso, seguendo certe
avvertenze in cui qui non entriamo, in un certo numero di triangoli ciascuno di
diametro
h. (Supponiamo per semplicità che sia in partenza un dominio
poligonale, altrimenti la sua triangolazione potrà solo approssimare ma non
esaurirlo). Analogamente al caso unidimensionale, sceglieremo come Vh lo spazio
delle funzioni continue in
e zero su @ tali che la loro restrizione a ciascun
triangolino sia un polinomio in due variabili di grado r. Si può scegliere una
base di Vh costituita da elementi il cui supporto è contenuto in un piccolo numero
di triangoli (precisamente, tutti quelli contenenti un nodo …ssato). Questo farà
sì che, se la la forma bilineare ha la forma (22.34), la matrice fa ( i ; j )g risulti
sparsa. Di nuovo, si dimostra che kuh ukV tende a zero dell’ordine di hr dove
h è il diametro massimo dei triangolini e r l’ordine dei polinomi, purché però
la soluzione esatta appartenga allo spazio H r+1 ( ) ; il che, come già spiegato,
265
si può garantire a priori sotto opportune ipotesi di regolarità dei coe¢ cienti
dell’equazione.
Per una trattazione del metodo di Galerkin in generale, ed in particolare del
metodo degli elementi …niti, rimandiamo a [17, Cap.3]. In…ne, segnaliamo che
gli elementi …niti non sono l’unico metodo per costruire sottospazi …nito dimensionali di H 1 ( ) adatti alla discretizzione dei problemi ai limiti. Si possono
utilizzare anche i cosiddetti metodi spettrali, che consistono nel de…nire spazi di
polinomi globali su , anziché funzioni aventi restrizione polinomiale su ciascun
intervallino o triangolino. Si rimanda per questo a [17, Cap. 4].
22.6
Alcuni esempi svolti
Esempio 22.12 Risolvere il seguente problema ai limiti unidimensionale:
0
(a (x) u0 (x)) = 1 per x 2 ( 1; 1)
u ( 1) = u (1) = 0
dove a (x) =
1 per x < 0
2 per x > 0
Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una
sbarra che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di
sinistra (es.: due metalli diversi saldati insieme); la temperatura ai due estremi
è tenuta costante zero; una sorgente di calore riscalda uniformemente la sbarra
in tutta la sua lunghezza (il termine noto 1).
Si osservi che la discontinuità di a (x) rende impossibile interpretare classicamente l’equazione. Più precisamente, dal punto di vista classico si potrebbe
ragionare come segue:
per x < 0 la u risolve l’equazione:
u00 = 1 in ( 1; 0)
u ( 1) = 0
quindi
x2
+ ax + b
2
e imponendo la condizione nell’estremo sinistro
u (x) =
u (x) = a (x + 1) +
x2
1
2
Per x > 0 la u risolve l’equazione
2u00 = 1 in (0; 1)
u (1) = 0
266
:
quindi
x2
+ cx + d
4
e imponendo la condizione nell’estremo destro
u (x) =
u (x) = c (x
Ricapitoliamo:
u (x) =
(
1) +
x2
1
4
:
2
a (x + 1) + 1 2x per x < 0
2
c (x 1) + 1 4x per x > 0
(22.35)
Ci servirà anche tener presente che:
u0 (x) =
a
c
x per x < 0
x
2 per x > 0
A questo punto abbiamo ancora due parametri da determinare, e dobbiamo
decidere come raccordare le due funzioni in x = 0.
Per avere una soluzione C 2 ( 1; 1) dovremmo imporre:
il raccordo continuo di u;
il raccordo continuo di u0 ;
il raccordo continuo di u00 :
Non è possibile: sono 3 condizioni, e abbiamo solo due coe¢ cienti. Bisogna
rinunciare ad avere una soluzione C 2 e fare qualche compromesso. Qual è il
compromesso giusto? La mentalità classica probabilmente suggerirebbe: se non
possiamo avere u 2 C 2 ( 1; 1) ; scegliamo almeno u 2 C 1 ( 1; 1). Imponiamo
quindi:
il raccordo continuo di u;
il raccordo continuo di u0 :
Facendo così si ha:
a + 12 =
a=c
c+
1
4
raccordo continuo di u in 0
raccordo continuo di u0 in 0
che dà
a=c=
267
1
8
e in de…nitiva
u (x) =
(
1
8
1
8
(x + 1) +
(x 1) +
1 x2
2
1 x2
4
per x < 0
per x > 0
Vediamo invece che cosa richiede la de…nizione di soluzione debole. La prima
parte del discorso, cioè la scrittura di u nella forma (22.35) con i coe¢ cienti a; c
da determinarsi, è ancora corretta perché:
1. Se u è soluzione debole del problema su tutto ( 1; 1) ; lo è anche su ( 1; 0)
e su (0; 1): per vederlo, basta scegliere come particolari funzioni test H01 ( 1; 1)
funzioni che siano identicamente nulle su metà dell’intervallo.
2. D’altro canto su ( 1; 0) e su (0; 1) il coe¢ ciente a (x) è continuo (costante!),
perciò la soluzione debole è semplicemente la soluzione classica, che abbiamo
appunto determinato.
Questo mostra che anche la soluzione debole soddisfa le (22.35).
Sappiamo che le funzioni H 1 ( 1; 1) sono continue, quindi il raccordo di
continuità in 0 è necessario. Anche in questo caso dovrà valere quindi la
condizione:
a+
1
2
=
c+
1
4
raccordo continuo di u in 0.
Imponiamo, in…ne, che valga la de…nizione di soluzione debole:
Z 1
Z 1
0
0
a (x) u (x) (x) dx =
1 (x) dx
1
cioè
Z
1
0
0
u (x)
1
0
(x) dx + 2
Z
1
0
u (x)
0
0
(x) dx =
Z
1
(x) dx
1
e quindi usando le espressioni che abbiamo calcolato per u0 nei due sottointervalli:
Z 0
Z 1
Z 1
x 0
(a x) 0 (x) dx + 2
c
(x) dx =
(x) dx:
2
1
0
1
268
Possiamo ora integrare per parti in ciascuno dei due integrali a primo membro.
Ricordando che ( 1) = 0 si ha:
[(a
0
x) (x)]
1+
Z
0
(x) dx + 2
1
a (0) +
Z
h
x
2
c
0
(x) dx
Z
i1
(x) + 2
0
1
0
2c (0) +
1
Z
0
1
(x) dx =
2
1
(x) dx =
Z
Z
1
(x) dx
1
1
(x) dx
1
che dà semplicemente
a (0)
che dovendo valere per ogni
2c (0) = 0;
porta
a
2c = 0
una condizione di raccordo diversa da quella classica (a = c); che unita alla
condizione di raccordo continuo già imposta porta il sistema
a + 21 = c +
a 2c = 0
1
4
a=
c=
1
6
1
12
e quindi
u (x) =
(
1
6 (x +
1
12 (x
2
1) + 1 2x per x < 0
2
1) + 1 4x per x > 0
Si osserva che questa soluzione non è C 1 ( 1; 1). La derivata prima di u è
discontinua. In compenso, la funzione a (x) u0 (x) è continua.
A questo punto ci si può chiedere: la temperatura della sbarra metallica
cosa fa in realtà? E’la soluzione classica di compromesso, C 1 ma non C 2 , o è
la soluzione debole, H 1 ma non C 1 ; con u0 discontinua ma au0 continua?
Se si ripercorre la deduzione matematica dell’equazione di di¤usione del
calore, si vede che la funzione j (x) = a (x) u0 (x) ha il signi…cato …sico di
densità di corrente termica (legge di Fourier di di¤usione del calore). In presenza di una discontinuità a salto nel coe¢ ciente di conducibilità, cioè in presenza
di una brusca discontinuità nelle proprietà …siche del mezzo, non c’è una ragione
269
…sica per cui la derivata della temperatura debba essere continua. La continuità
della densità di corrente termica è invece una condizione più naturale. Inoltre
la funzione au0 (e non direttamente la funzione u0 ) viene a sua volta derivata.
La de…nizione di soluzione debole porta in questo caso a richiedere la continuità delle due funzioni che vengono derivate: u e au0 . La soluzione …sicamente
signi…cativa è quella debole.
Esempio 22.13 Determinare la soluzione debole del seguente problema ai limiti:
div (a (x; y) ru) = 1
u=0
con a (x; y) =
per x2 + y 2 < 4
per x2 + y 2 = 4
1 per x2 + y 2 < 1
2 per 1 < x2 + y 2 < 4
Signi…cato …sico: equazione di di¤ usione del calore (in regime stazionario) in
una piastra metallica circolare costituita da due materiali con coe¢ ciente di
conducibilità diverso, uno che occupa un disco centrale e l’altro la corona circolare esterna. La temperatura al bordo è …ssata a zero, la piastra è riscaldata
uniformemente (il termine di sorgente 1).
Ragioniamo così. Anzitutto poiché l’equazione, il dominio, il dato al bordo
e il termine noto sono radiali, ci aspettiamo una soluzione radiale, del tipo
u (x; y) = u ( ).
Sul cerchio interno x2 + y 2 < 1 la u risolve l’equazione
u = 1;
senza condizioni al contorno. In coordinate polari (supponendo già u radiale) si
riscrive così:
1 0
u = 1;
u00
che ponendo u0 = v si risolve come equazione lineare del prim’ordine in v e poi
per integrazione in u. Si trova:
2
u ( ) = a log
4
+ b;
ma la parte in logaritmo non è accettabile perché vogliamo una soluzione limitata in 0, quindi a = 0 e
2
u( ) =
Sulla corona circolare
4
+ b per
2 (0; 1) :
2 (1; 2) la u soddisfa invece l’equazione
2 u = 1;
270
che diventa
1
u00
u0 =
1
;
2
con integrale generale
2
u ( ) = c log
8
+ d per
2 (1; 2)
e ora non c’è motivo di scartare la soluzione logaritmica perché siamo su (1; 2).
In compenso dobbiamo imporre la condizione al contorno u (2) = 0 che dà
c=
1
2
d
;
log 2
quindi
u( ) =
1
2
d
log 2
2
log
8
+ d per
2 (1; 2) :
Ora dobbiamo ragionare su come raccordare i due pezzi di soluzione per
= 1.
Una funzione H 1 di due variabili in generale può essere discontinua, ma se
è radiale non può avere una discontinuità a salto in , perché questo corrisponderebbe ad una discontinuità a salto della funzione in due variabili lungo una
circonferenza, cosa incompatibile con l’esistenza di derivate deboli. Quindi la
u ( ) deve raccordarsi con continuità in = 1: Questo porta a:
1
+ d;
8
1
b=d+ ;
8
1
+b=
4
quindi
u( ) =
u0 ( ) =
(
(
2
4
1
d
log 2
2
+d+
1
8
log
8
d
log 2
+d
per
2
1
2
per
2
1
4
per
per
2 (0; 1)
2 (1; 2)
2 (0; 1)
2 (1; 2)
Ora imponiamo che sia soddisfatta la de…nizione di soluzione debole, per
determinare l’ultimo coe¢ ciente. La condizione
Z
Z
a (x; y) ru r dxdy =
dxdy;
x2 +y 2 <4
applicata a delle
x2 +y 2 <4
radiali e riscrivendo gli integrali in coordinate polari dà
Z 2
Z 2
0
0
a( )u ( ) ( ) d =
( ) d
0
0
271
(si faccia attenzione alla comparsa del fattore dovuto al passaggio in coordinate
polari) che possiamo ora riscrivere esplicitamente:
Z
1
0
2
2
0
( )d +
Z
1
2
2
d
log 2
2
1
1
0
4
( )d =
Z
2
( ) d :
0
Ora integriamo per parti in ciascun integrale a primo membro e ricordiamo che
(2) = 0 (attenzione: (0) non è zero in generale, perché = 0 è l’origine, non
il bordo del dominio)
1
2
+
Z
2
1
( )d =
2
Z 2
( )
+
0
Z
1
1 2d
log 2
( )d +
0
( ) d
0
che porta a
1
(1)
2
ossia
1 2d
log 2
1 2d
log 2
1
2
= 0; d =
(1) = 0
1
2
e in de…nitiva otteniamo la soluzione del problema iniziale:
(
2
5
per 2 (0; 1)
42 + 8
u( ) =
1
+
per 2 (1; 2)
8
2
272
2
2
2
( )
1
Esempio 22.14 Si risolva il seguente problema di Sturm-Liouville con coe¢ ciente discontinuo, nel senso delle soluzioni deboli.
0
(a (x) u0 ) + u = 0 per x 2 ( 1; 1)
u ( 1) = u (1) = 0
con
a (x) =
1 per x < 0
2 per x > 0
Si osservi che a (x) per quanto discontinuo è discosto da zero, come nei problemi di Sturm-Liouville regolari. Ci aspettiamo quindi che esista una successione
di autovalori e una successione di corrispondenti autofunzioni che siano un sistema ortonormale completo di L2 ( 1; 1). Veri…cheremo questo fatto risolvendo
il problema. Per intanto possiamo dire che, grazie alla solita dimostrazione,
gli eventuali autovalori sono necessariamente positivi: se u è autofunzione
corrispondente a ;
Z 1
Z 1
Z 1
2
2
2
0
0
u (x) dx
a (x) u (x) dx =
u (x) dx;
1
da cui
1
1
> 0:
In ( 1; 0) la u risolve
u00 + u = 0 per x 2 ( 1; 0)
u ( 1) = 0
(senza condizione …ssata in 0), da cui (essendo
u (x) = a cos
p
x + b sin
273
> 0),
p
x
e imponendo la condizione u ( 1) = 0;
0 = a cos
p
p
b sin
;
p
b = a cot
;
h
p
p
u (x) = a cos
x + cot
sin
p
x
Analogamente,
i
per x 2 ( 1; 0) :
2u00 + u = 0 per x 2 (0; 1)
u (1) = 0
da cui
u (x) = c cos
r
2
!
x
e imponendo la condizione u (1) = 0
r !
r !
0 = c cos
d=
c cot
"
u (x) = c cos
+ d sin
2
r !
2
2
!
x
;
;
2
r
2
+ d sin
r
!
x
cot
r !
2
sin
r
2
!#
x
per x 2 (0; 1) :
Ora dobbiamo imporre delle condizioni di raccordo in x = 0. La u dev’essere
continua, quindi imponiamo
u (0) = a = c:
Poiché il problema è omogeneo, l’unico parametro rimasto si può …ssare uguale
a 1. Perciò abbiamo
8
p
p
p
>
x + cot
sin
x
per x 2 ( 1; 0)
< cos
q
q
q
u (x) =
>
cot
sin
per x 2 (0; 1) :
: cos
2x
2
2x
8 p
p
p
p
p
>
sin
x +
cot
cos
x
per x 2 ( 1; 0)
<
q
q
q
q
q
u0 (x) =
>
cos
per x 2 (0; 1) :
:
2 sin
2x
2 cot
2
2x
Con identità trigonometriche la u si riscrive in forma più semplice:
8
p
sin(
(x+1))
>
>
p
per x 2 ( 1; 0)
<
sin(
)
p
u (x) =
sin
2 (1 x)
>
>
p
per x 2 (0; 1) :
:
sin
2
274
Non abbiamo ancora determinato , e non abbiamo ancora sfruttato la
de…nizione di soluzione debole. Imponiamo ora:
Z 1
Z 1
a (x) u0 (x) 0 (x) dx =
u (x) (x) dx
Z
1
0
u0 (x)
0
(x) dx + 2
1
Z
u0 (x)
0
1
1
Z
1
(x) dx =
0
u (x) (x) dx
1
e integriamo per parti nei due integrali a primo membro, all’interno dei quali la
u0 è continua. Si ha (il calcolo è più chiaro se non scriviamo la forma esplicita
di u e u0 ):
0
0
[u (x) (x)]
=
Z
1
1
Z
0
00
1
(x)]0
0
u (x) (x) dx + [2u (x)
1
Z
1
u00 (x) (x) dx
0
u (x) (x) dx:
1
Ora per come è stata determinata la u, risulta u00 = u in ( 1; 0) e in (0; 1),
perciò gli integrali si sempli…cano e, sfruttando ( 1) = 0; si ha
u0 0
2u0 0+
(0) = 0
e quindi
u0 0
p
cot
p
cot
p
= 2u0 0+
r
=
2
=
p
2
cot
2 cot
r !
2
r !
2
:
(22.36)
Questa è l’equazione che, risolta in , dà gli autovalori. Ponendo t =
tratta di cercare gli zeri della funzione
f (t) = cot t +
p
2 cot
275
t
p
2
:
p
si
Il gra…co è il seguente:
1
e si vede che esiste e¤ettivamente una successione f n gn=1 di autovalori.
Determinando numericamente le prime soluzioni approssimate dell’equazione
f (t) = 0 e ricordando che gli autovalori sono i quadrati di questi zeri possiamo
scrivere i primi autovalori:
1
3:58458
2
12:9095
3
4
31:6026
52:9368
5
85:4482
Tracciamo i gra…ci delle prime autofunzioni corrispondenti
8
p
sin(
n (x+1))
>
>
p
per x 2 ( 1; 0)
<
sin(
n)
p
un (x) =
n
sin
2 (1 x)
>
>
p
per x 2 (0; 1) :
:
n
sin
2
276
6
122:133
Le autofunzioni un quindi hanno l’andamento qualitativo di funzioni del tipo
sin (n x); in particolare un (x) ha n 1 zeri nell’intervallo ( 1; 1). Si tratta di
un sistema ortogonale completo di L2 ( 1; 1).
Un’applicazione del problema di Sturm-Liouville precedente potrebbe essere
la seguente:
Esempio 22.15 Si risolva il seguente problema di Cauchy-Dirichlet per l’equazione del calore con coe¢ ciente di conducibilià discontinuo, nel senso delle
soluzioni deboli.
8
per x 2 ( 1; 1) ; t > 0
< ut = (a (x) ux )x
u ( 1; t) = u (1; t) = 0 per t > 0
:
u (x; 0) = sin x
per x 2 ( 1; 1)
con
a (x) =
1 per x < 0
2 per x > 0
Impostando il problema mediante separazione di variabili,
u (x; t) = X (x) T (t)
277
si trova
0
XT 0 = T (a (x) X 0 )
0
T0
(a (x) X 0 )
(t) =
=
T
X
che porta
0
(a (x) X 0 ) + X = 0 per x 2 ( 1; 1)
X ( 1) = X (1) = 0
e
T0 =
T:
Dunque si trova il problema di Sturm-Liouville precedente, e le soluzioni a
variabili separate sono
un (x; t) = e n t Xn (x)
dove
Xn (x) =
e
p
n
8
>
>
<
p
sin(
n (x+1))
p
sin(
n)
sin
>
>
:
p
sin
n
2
p
per x 2 ( 1; 0)
(1 x)
per x 2 (0; 1) :
n
2
è l’n-esima soluzione positiva dell’equazione
cot t +
p
2 cot
t
p
2
= 0.
La soluzione del problema sarà del tipo
u (x; t) =
1
X
cn e
nt
Xn (x)
n=1
con cn scelti in modo che sia
1
X
cn Xn (x) = sin x:
n=1
Calcoliamo i primi coe¢ cienti. Ci serve anzitutto calcolare i coe¢ cienti di
normalizzazione
Z 1
2
In =
Xn (x) dx:
1
Il calcolo numerico dà i seguenti valori per i primi interi n:
In
n=1
1:08375
2
4:1915
3
2:23712
4
1:31944
5
23:4058
6
1:00234
Calcoliamo quindi i coe¢ cienti di Fourier di sin x rispetto a questo sistema
ortogonale:
Z 1
1
cn =
(sin x) Xn (x) dx:
In
1
278
cn
n=1
0:102342
2
0:466046
3
4
0:172129
5
0:0881589
6
0:00230943
0:0333009
A titolo di veri…ca, il gra…co di u0 (x) = sin ( x) ra¤rontato con la somma
parziale
6
X
S6 (x) =
cn Xn (x)
n=1
è il seguente:
La corrispondente somma parziale della soluzione u (x; t),
u6 (x; t) =
6
X
cn e
nt
Xn (x)
n=1
ha il seguente gra…co:
ed è una buona approssimazione della soluzione del problema iniziale.
279
23
Esercizi sulla Parte 5
A. Derivate deboli e spazi di Sobolev
Es 23.1 Calcolare in base alla de…nizione la derivata debole di u (x) = jxj in
( 1; 1) ; stabilendo per quali 2 R:
a) la derivata debole esiste (in L1loc ( 1; 1));
b) la funzione u 2 H 1 ( 1; 1).
Es 23.2 Stabilire quali delle seguenti funzioni appartengono ad H 1 ( 1; 1):
f1 (x) = x log jxj f2 (x) = arctan x1
p
x per x > 0
jxj
f4 (x) = logjxj
f5 (x) =
0 per x < 0
f3 (x) =
f5 (x) =
1
x
1 per x 2 Q
0 per x 2 R
Es 23.3 Si consideri la funzione
u (x; y) =
sin (xy)
2
sul quadrato Q = (0; 1) .
y
Si dimostri che u 2 H 1 (Q) e si determini la traccia di u su @ . A questa
funzione è applicabile la disuguaglianza di Poincaré?
Es 23.4 Stabilire se le seguenti funzioni appartengono a H 1 (Q) con Q = ( 1; 1)
( 1; 1):
p
p
f1 (x; y) = pjxj + jyj
f2 (x; y) = pjxyj
f3 (x; y) = x2 + y 2
f4 (x; y) = 4 x2 + y 2
2
2xy x per y > x
x2 y 2 per y > x
f5 (x; y) =
f6 (x; y) =
xy
per y < x
x2 + y 2 per y < x
Es 23.5 Dimostrare la Proposizione ?? [Suggerimenti. Primo punto (unicità):
supporre che ci siano due funzioni che g1 ; g2 che soddisfano la de…nizione di
derivata debole e mostrare che g1 g2 = 0 q.o. per un opportuno teorema
di annullamento degli integrali; secondo punto (linearità): basta applicare la
de…nizione di derivata debole e la linearità dell’integrale].
B. Formulazione debole di problemi ai limiti per equazioni ellittiche
Es 23.6 Determinare la soluzione debole del seguente problema ai limiti unidimensionale:
u00 = f (x)
per x 2 ( 1; 1)
u ( 1) = u (1) = 0
dove f (x) =
0 per x < 0
1 per x > 0
280
Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una
sbarra che ha un coe¢ ciente di conducibilità costante; la temperatura ai due
estremi è tenuta costante zero; una sorgente di calore (il termine noto f (x))
riscalda uniformemente la metà destra della sbarra, mentre la metà sinistra non
ha pozzi o sorgenti di calore.
Es 23.7 Determinare la soluzione debole del seguente problema ai limiti unidimensionale:
0
(a (x) u0 (x)) = f (x) per x 2 ( 1; 1)
u ( 1) = u (1) = 0
dove a (x) =
1 per x < 0
f (x) =
2 per x > 0
0 per x < 0
1 per x > 0
Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una
sbarra che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di
sinistra (es.: due metalli diversi saldati insieme); la temperatura ai due estremi
è tenuta costante zero; una sorgente di calore (il termine noto f (x)) riscalda
uniformemente la metà destra della sbarra, mentre la metà sinistra non ha pozzi
o sorgenti di calore.
Es 23.8 Determinare la soluzione debole del seguente problema ai limiti unidimensionale:
0
(a (x) u0 (x)) + b (x) u0 (x) = 1
u ( 1) = u (1) = 0
dove a (x) =
1 per x < 0
b (x) =
2 per x > 0
per x 2 ( 1; 1)
1 per x < 0
0 per x > 0
Signi…cato …sico: equazione di di¤ usione e trasporto del calore (in stato stazionario)
in un mezzo che ha un coe¢ ciente di conducibilità diverso nella metà di destra e
di sinistra (es.: due ‡uidi diversi a contatto in 0); solo nella metà di sinistra c’è
anche un fenomeno di trasporto; la temperatura ai due estremi è tenuta costante
zero; una sorgente di calore (il termine noto f (x)) riscalda uniformemente il
mezzo.
Es 23.9 Determinare la soluzione debole del seguente problema ai limiti unidimensionale:
0
(a (x) u0 (x)) + c (x) u (x) = 1
u ( 1) = u (1) = 0
dove a (x) =
1 per x < 0
c (x) =
2 per x > 0
per x 2 ( 1; 1)
2
0
per x < 0
per x > 0
Signi…cato …sico: equazione di di¤ usione e reazione di una certa sostanza (in
stato stazionario) in un mezzo che ha un coe¢ ciente di di¤ usione diverso nella
metà di destra e di sinistra (es.: due ‡uidi diversi a contatto in 0); solo nella
metà di sinistra c’è anche un fenomeno di reazione, che distrugge parte della
sostanza; la concentrazione u ai due estremi è tenuta costante zero; una sorgente
(il termine noto f (x)) immette sostanza nel mezzo uniformemente.
281
Es 23.10 Determinare la soluzione debole del seguente problema ai limiti unidimensionale:
(
0
1
(a (x) u0 (x)) = p
per x 2 ( 1; 1)
3
u ( 1) = u (1) = 0
dove a (x) =
jxj
1 per x < 0
2 per x > 0
Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una
sbarra che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di
sinistra (es.: due metalli diversi saldati insieme); la temperatura ai due estremi
è tenuta costante zero; una sorgente di calore (il termine noto f (x)) concentrata
vicino all’origine riscalda la sbarra.
Es 23.11 Determinare la soluzione debole del seguente problema ai limiti unidimensionale:
0
(a (x) u0 (x)) = f (x) per x 2 ( 1; 1)
u ( 1) = u (1) = 0
dove a (x) =
1
2
1
3
per x < 0
f (x) = jxj
per x > 0
Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una
sbarra che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di
sinistra (es.: due metalli diversi saldati insieme); la temperatura ai due estremi
è tenuta costante zero; è presente una sorgente di calore (il termine noto f (x))
che riscalda la sbarra in modo non uniforme.
Es 23.12 Si consideri il seguente problema di Dirichlet sul quadrato Q = [ 1; 1]
[ 1; 1]:
8
1
+arctan x
<
exy
1
div
ru (x; y) + 2+cos(1=y)
u (x; y) = @x p
in Q
4
1+y 2
x2 +y 2
:
u = 0 su @Q:
Scrivere esplicitamente la formulazione debole di questo problema (cioè: “trovare
u nello spazio... tale che valga l’equazione integrale... per ogni :::”). Quindi
dimostrare, sfruttando opportunamente il Teorema di Lax-Milgram, che il problema ha una e una sola soluzione: Si chiede di veri…care esplicitamente che sono
veri…cate le ipotesi richieste, eseguendo esplicitamente le maggiorazioni con le
costanti corrette.
Es 23.13 Si consideri il seguente problema di Neumann sul quadrato Q =
[ 1; 1] [ 1; 1]:
(
xy
x2 +y 2 u (x; y) = f (x; y) in Q
div 1 + x2xy
+y 2 ru (x; y) + e
@u
@
= 0 su @Q:
282
Scrivere esplicitamente la formulazione debole di questo problema (cioè: trovare
u nello spazio... tale che valga l’equazione integrale... per ogni :::). Quindi
dimostrare, sfruttando opportunamente il Teorema di Lax-Milgram, che il problema ha una e una sola soluzione per ogni f 2 L2 (Q) : Si chiede di veri…care
esplicitamente che sono veri…cate le ipotesi richieste, eseguendo esplicitamente
le maggiorazioni con le costanti corrette.
Es 23.14 Si consideri il seguente problema di Dirichlet sul quadrato Q = [ 1; 1]
[ 1; 1]:
(
2 2
y
1 x2xy
+ xx4 +y
1 + x2xy
4 u = f (x; y) in Q
+y 2 ux
+y 2 uy
x
y
u = 0 su @Q:
Scrivere esplicitamente la formulazione debole di questo problema (cioè: trovare
u nello spazio... tale che valga l’equazione integrale... per ogni :::). Quindi
dimostrare, sfruttando opportunamente il Teorema di Lax-Milgram, che il problema ha una e una sola soluzione per ogni f 2 L2 (Q) : Si chiede di veri…care
esplicitamente che sono veri…cate le ipotesi richieste, eseguendo esplicitamente
le maggiorazioni con le costanti corrette.
23.1
Soluzioni di alcuni esercizi della Parte 5
Soluzione Es. 23.6.
u (x) =
1
4
(x + 1)
x2
1
2 + 4x +
per x < 0
per x > 0
1
4
Soluzione Es. 23.7.
u (x) =
0
1
4
Soluzione Es. 23.8.
8
5
< x+1
2
3 2e
u (x) =
: 41 1 x2 +
per x < 0
per x > 0
x2
1
ex
1
1
4
e
3 2e
e
1
per x < 0
(x
1) per x > 0
1
1
Si noti la di¤erenza tra il ruolo di a (x) u0 e b (x) u0 nell’equazione: imponendo
che l’equazione sia soddisfatta in senso debole si trova che dev’essere continua
(oltra alla u stessa) la funzione a (x) u0 ; non la funzione b (x) u0 .
Soluzione Es. 23.9.
1
u (x) =
2
+ cos x
3
4 +
x2
4
1
2
3
2
+ 23 sin x per x < 0
x + 1 + 12
per x > 0
Anche in questo caso risultano continue u (x) e a (x) uxi ; mentre il termine
di ordine zero c (x) u (x) risulta discontinuo.
283
Soluzione Es. 23.10.
u (x) =
9
10
9
20
3
10
3
20
x5=3 + 1
1 x5=3
(x + 1) per x < 0
(x 1) per x > 0
Soluzione Es. 23.11. Risolviamo prima separatamente nelle due metà
[ 1; 0] ; [0; 1] in cui a e f sono regolari e la soluzione è quella classica.
In [ 1; 0]:
u00 (x) = 2x per x 2 ( 1; 0)
u ( 1) = 0
che dà:
x3
+ ax + b
3
1
0 = u ( 1) =
3
1
a= :
3
u (x) =
b
a+b
In [0; 1]:
u00 (x) = 3x per x 2 (0; 1)
u (1) = 0
che dà:
x3
+ cx + d
2
1
+c+d
0 = u (1) =
2
1
c+d= :
2
u (x) =
Imponendo la continuità di u in 0 (necessaria a¢ nché u sia H 1 ( 1; 1)) si
trova b = d. Quindi abbiamo:
( 3
x
ax + b
per x 2 ( 1; 0)
3 +
u (x) =
x3
2 + cx + b per x 2 (0; 1)
con
b a=
c+b=
1
3
1
2
La terza condizione mancante per determinare i coe¢ cienti si ottiene imponendo
che u sia soluzione in senso debole su tutto ( 1; 1):
Z 1
Z 1
a (x) u0 (x) 0 (x) dx =
f (x) (x) dx
1
1
ossia, calcolando
u0 (x) =
x2 + a
per x 2 ( 1; 0)
3 2
x
+
c
per x 2 (0; 1)
2
284
Z
0
1
1 2
x +a
2
0
Z
(x) dx+
1
0
1
3
3 2
x +c
2
0
(x) dx =
Z
0
1
Z
x (x) dx+
1
x (x) dx
0
Integrando per parti a primo membro:
Z 1
Z 0
a
x2
c
x2
0
0
+
(x) dx +
+
(x) dx
2
2
2
3
0
1
Z 0
0
x2
a
=
+
(x)
x (x) dx
2
2
1
1
Z 1
1
c
x2
+
(x) +
x (x) dx
+
2
3
0
0
Z 0
Z 1
a c
=
(0)
x (x) dx +
x (x) dx
2 3
1
0
che uguagliato al secondo membro dà la condizione
a
2
c
= 0:
3
(Equivalente alla condizione di continuità di a (x) u0 (x) in 0).
Si tratta ora di risolvere il sistema
8
8
1
< a = 15
< b a = 13
2
1
b= 5
c+b=
che dà:
:
: a c 2
1
=
0
c
= 10
2
3
e quindi la soluzione:
u (x) =
(
x
2
x3
3 +
15 + 5
x3
x
2
2 + 10 + 5
per x 2 ( 1; 0)
per x 2 (0; 1)
A titolo illustrativo, scriviamo esplicitamente anche la densità di corrente termica, che risulta continua:
( 2
x
1
per x 2 ( 1; 0)
0
2 +
30
a (x) u (x) =
x2
1
+
per
x 2 (0; 1)
2
30
Soluzione Es. 23.13. Formulazione debole del problema:
determinare u 2 H01 (Q) per cui si abbia:
Z Z
xy
xy
1+ 2
ux (x; y) x (x; y) + 1
uy (x; y)
2
2 + y2
x
+
y
x
Q
2 2
+
x y
u (x; y) (x; y) dxdy =
+ y4
x4
Z Z
Q
Ipotesi da veri…care:
285
y
(x; y)
(23.1)
f (x; y) (x; y) dxdy 8 2 H01 (Q) :
1. I coe¢ cienti della parte principale devono essere misurabili ed essenzialmente limitati.
Sono misurabili perché continui tranne in un punto; sono essenzialmente
limitati perché
x2
xy
= (in polari)
+ y2
2
cos # sin #
2
=
1
sin 2#
2
1
:
2
2. Coercività:
1+
xy
x2 + y 2
2
1
xy
x2 + y 2
+ 1
2
2
2
1
+
2
2
:
(23.2)
Vero perché:
1+
1
xy
+ y2
xy
2
x + y2
x2
1
1
1
1
= ;
2
2
1
1
=
2
2
(per la maggiorazione precedente), quindi la (23.2) vale con = 1=2:
3. Condizione di segno del coe¢ ciente del termine di ordine zero:
x2 y 2
x4 + y 4
0,
ovvio.
Pertanto il Lemma di Lax Milgram implica che la forma bilineare data dal
primo membro della (23.1) è continua e coerciva su H01 (Q), perciò il problema
nella sua formulazione debole è ben posto.
286
Riferimenti bibliogra…ci
[1] A. Boggess, F. J. Narcowich: A First Course in Wavelets with Fourier
Analysis. Jouhn Wiley & Sons, 2009.
[2] M. Bramanti: Esercitazioni di Analisi 2. Ed. Esculapio, Bologna, 2012.
[3] M. Bramanti: Esercitazioni di Analisi 3. CUSL, 1993.
[4] M. Bramanti, C. D. Pagani, S. Salsa: Analisi Matematica 1, Zanichelli
2008.
[5] M. Bramanti, C. D. Pagani, S. Salsa: Analisi Matematica 2, Zanichelli
2009.
[6] H. Brezis: Analisi Funzionale. Teoria e Applicazioni. Liguori Ed.
[7] H. Brezis, F. Browder: Partial Di¤erential Equations in the 20th Century.
Advances in Mathematics 135, 76 144 (1998).
[8] L. Fanghua, Y. Xiaoping: Geometric measure theory. An introduction.
Science Press, 2002.
[9] S. Farlow: Partial di¤erential equations for scientists and engineers. Dover,
1982.
[10] G. Folland: Real Analysis. Modern applications and techniques. Wiley,
1984.
[11] D. Gilbarg, N. S. Trudinger: Elliptic Partial Di¤erential Equations of
Second Order. 2nd edition. 1983, Springer.
[12] J. H. Hunter, B. Nachtergaele: Applied Analysis. World Scienti…c, 2001.
[13] T. Jones: The Legendre and Laguerre polynomials and the elmentary quantum mechanical model of the hydrogen atom.
http://www.physics.drexel.edu/~tim/open/hydro…n/hyd.pdf
[14] R. Onyshczak, A.Youssef: Fingerprint Image Compression and the Wavelet
Scalar Quantization Speci…cation, Chap. 19 in N. Ratha, R. Bolle, Editors:
Automatic Fingerprint Recognition System, Springer 2004.
[15] C.D. Pagani, S. Salsa: Analisi Matematica vol. 2, Masson, 1991.
[16] V. Pata: Analisi reale e funzionale. Dispensa in rete scaricabile dalla pagina
(le due righe qui sotto formano un unico link):
http://www.mate.polimi.it/viste/studenti/send_new.php?tipo=
a&id=121&id_insegnamento=419&id_blob=22627
[17] A. Quarteroni: Modellistica numerica per problemi di¤erenziali. Terza ed.
Springer, 2006.
287
[18] S. Salsa, F. Vegni, A. Zaretti, P. Zunino: Invito alle equazioni a derivate
parziali. Springer, 2009.
[19] S. Salsa, G. Verzini: Equazioni a derivate parziali. Complementi ed esercizi.
Springer, 2007.
[20] K. Saxe. Beginning functional analysis. Springer 2010.
[21] W. Rudin: Real and complex analysis. McGraw-Hill Book Co., New York,
1987.
[22] H. Weinberger: A …rst course in partial di¤erential equations. Dover, 1965.
288