Appunti per il Corso di Metodi Matematici per l’Ingegneria A.A. 2013/2014 Marco Bramanti Politecnico di Milano 9 aprile 2014 Indice I Spazi di Lagrange 8 1 Spazi vettoriali, spazi metrici 1.1 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Spazi metrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 8 11 2 Richiami sulla cardinalità di insiemi 16 3 Convergenza e completezza 18 3.1 Teoremi di convergenza in R e in Rn . . . . . . . . . . . . . . . . 18 3.2 Completezza in spazi metrici . . . . . . . . . . . . . . . . . . . . 22 4 Successioni di funzioni, spazi di funzioni continue 4.1 Successioni di funzioni e convergenza uniforme . . 4.2 Spazi di funzioni derivabili . . . . . . . . . . . . . . 4.3 Spazi di funzioni in…nitamente derivabili . . . . . . 4.4 Funzioni Lipschitziane . . . . . . . . . . . . . . . . o derivabili 25 . . . . . . . . 25 . . . . . . . . 32 . . . . . . . . 36 . . . . . . . . 38 5 Il teorema delle contrazioni in spazi metrici e le sue applicazioni 5.1 Teorema delle contrazioni . . . . . . . . . . . . . . . . . . . . . . 5.2 Applicazioni al problema di Cauchy per sistemi di equazioni differenziali ordinarie . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Equazioni integrali di Fredholm . . . . . . . . . . . . . . . . . . . 5.3.1 Equazione integrale di Fredholm di seconda specie in C 0 [a; b] 5.3.2 Il metodo della serie di Neumann e l’approssimazione di Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.3 Applicazione a un modello di di¤usione . . . . . . . . . . 1 39 39 41 46 46 48 50 6 Esercizi sulla Parte 1 55 II 61 Misura e integrale di Lebesgue 7 Motivazioni per studiare la teoria della misura e dell’integrazione di Lebesgue 61 7.1 Inadeguatezza dell’integrale di Riemann per gli scopi dell’analisi funzionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 7.2 L’idea dell’integrale di Lebegue . . . . . . . . . . . . . . . . . . . 65 7.3 Il problema di de…nire una “buona” misura . . . . . . . . . . . . 67 7.4 Sviluppo e impatto della teoria della misura e dell’integrale di Lebesgue . . . . . . . . . . . . . . 70 8 Teoria della misura e dell’integrale di Lebesgue 8.1 Spazi misurabili . . . . . . . . . . . . . . . . . . . . . 8.2 Misura . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Costruzione della misura di Lebesgue in Rn . . . . . 8.4 Restrizione di una misura . . . . . . . . . . . . . . . 8.5 Funzioni misurabili . . . . . . . . . . . . . . . . . . . 8.6 Integrazione astratta . . . . . . . . . . . . . . . . . . 8.7 Relazione tra integrale di Riemann e integrale di Lebesgue . . . . . . . . . . . . . . . . . 8.8 I teoremi di convergenza per l’integrale di Lebesgue . 8.9 Lo spazio L1 . . . . . . . . . . . . . . . . . . . . . . 8.10 Il teorema fondamentale del calcolo integrale . . . . 71 71 72 73 78 79 83 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 . 93 . 98 . 101 9 La teoria della misura astratta in probabilità 106 10 Misure di Hausdor¤ 10.1 Misura e dimensione di Hausdor¤ . . . . . . . . . . . . . . . . . . 10.2 La misura (n 1)-dimensionale e il problema isoperimetrico . . . 10.3 Misure e distribuzioni di carica . . . . . . . . . . . . . . . . . . . 111 111 117 119 11 Spazi Lp 11.1 Gli spazi Lp ( ) per 1 < p < 1 11.2 Lo spazio L1 . . . . . . . . . . 11.3 Inclusioni tra spazi Lp . . . . . 11.4 Approssimazione di funzioni Lp 11.5 Integrali doppi in Rn . . . . . . 11.6 Convoluzione in Rn . . . . . . . 121 121 125 126 127 128 131 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Cenni su operatori e funzionali lineari continui 132 12.1 Operatori lineari continui . . . . . . . . . . . . . . . . . . . . . . 132 12.2 Funzionali lineari continui . . . . . . . . . . . . . . . . . . . . . . 136 2 13 Esercizi sulla Parte 2 139 13.1 Soluzioni di alcuni esercizi della Parte 2 . . . . . . . . . . . . . . 145 III Spazi di Hilbert 147 14 Geometria negli spazi di Hilbert 147 14.1 Spazi vettoriali con prodotto interno . . . . . . . . . . . . . . . . 147 14.2 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 15 Funzionali lineari continui su uno spazio di Hilbert 158 16 Analisi di Fourier in spazi di Hilbert 162 17 Esercizi sulla Parte 3 170 IV Applicazioni dei metodi di ortogonalità 173 18 Applicazioni all’analisi armonica 173 18.1 Il sistema trigonometrico. Serie di Fourier in una o due variabili 173 18.2 Base di Haar e wavelets . . . . . . . . . . . . . . . . . . . . . . . 178 19 Applicazioni dei metodi di ortogonalità a problemi di¤erenziali182 19.1 Separazione di variabili per problemi ai limiti per EDP mediante il sistema trigonometrico . . . . . . . . . . . . . . . . . . . . . . . 182 19.1.1 Di¤usione del calore in una sbarra . . . . . . . . . . . . . 182 19.1.2 Equazione di Laplace sul cerchio . . . . . . . . . . . . . . 186 19.2 Problemi di Sturm-Liouville e polinomi ortogonali . . . . . . . . 191 19.3 Applicazioni dei polinomi ortogonali in problemi ai limiti per equazioni a derivate parziali . . . . . . . . . . . . . . . . . . . . . 204 19.3.1 Laplaciano in coordinate sferiche e polinomi di Legendre . 204 19.3.2 Oscillatore armonico quantistico e polinomi di Hermite . . 207 19.4 Il problema agli autovalori per il laplaciano e le sue applicazioni . 211 19.4.1 Separazione di variabili per le equazioni del calore o delle onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 19.4.2 L’equazione di Helmholz sul rettangolo . . . . . . . . . . . 216 19.4.3 L’equazione di Helmholz sul cerchio . . . . . . . . . . . . 217 20 Esercizi sulla Parte 4 223 20.1 Soluzione di alcuni esercizi sulla Parte 4 . . . . . . . . . . . . . . 225 V Formulazione debole dei problemi ai limiti per equazioni ellittiche 229 3 21 Derivate deboli e spazi di Sobolev 21.1 Il concetto di derivata debole . . . . . . 21.2 Derivata debole, caso unidimensionale . 21.3 Derivata debole, caso multidimensionale 21.4 Spazi di Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Formulazione debole di problemi ellittici 22.1 Operatori uniformemente ellittici . . . . . . . . . . 22.2 Problemi ai limiti e de…nizione di soluzione debole 22.3 Risultati di esistenza . . . . . . . . . . . . . . . . . 22.4 Risultati di regolarità . . . . . . . . . . . . . . . . 22.5 Risoluzione numerica di problemi ai limiti in forma debole . . . . . . . . . . . . . . . . . . . . 22.6 Alcuni esempi svolti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 229 232 235 238 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 246 248 254 261 . . . . . . . . 262 . . . . . . . . 266 23 Esercizi sulla Parte 5 280 23.1 Soluzioni di alcuni esercizi della Parte 5 . . . . . . . . . . . . . . 283 4 Introduzione al corso di Metodi Matematici per l’ingegneria In questo corso, prendendo le mosse dai soli corsi di matematica di base (Analisi 1 e 2, Algebra Lineare), si vogliono introdurre alcuni temi, idee e metodi dell’analisi matematica moderna e mostrarne alcune applicazioni signi…cative a diversi settori di grande interesse per le applicazioni alla …sica e all’ingegneria: sistemi di equazioni di¤erenziali ordinarie, analisi di Fourier, equazioni alle derivate parziali. Nel corso di Analisi 1 lo studente incontra i concetti di base del calcolo di¤erenziale e integrale in una variabile, il cui nascere si è accompagnato storicamente al nascere della scienza moderna (Newton) agli inizi del 18 secolo. In Analisi 2 si incontrano le equazioni di¤erenziali ordinarie, strumento fondamentale della modellizzazione matematica dei fenomeni …sici, e si gettano le basi del calcolo di¤erenziale e integrale in più variabili, necessari per la formulazione delle equazioni alle derivate parziali, che modellizzano la …sica dei mezzi continui, intensamente studiata nel 19 secolo. Di queste equazioni però non si arriva a parlare se non di sfuggita nel corso di Analisi 2. C’è ancora una lunga e interessante storia da raccontare, quindi, riguardo ai rapporti tra l’analisi matematica e la …sica. Da una parte, ancora nel 19 secolo, c’è un …orire di tecniche e strumenti per la risoluzione esplicita di problemi per equazioni alle derivate parziali, quando questo è possibile: serie, trasformate integrali, funzioni speciali vengono utilizzate per risolvere i problemi di¤erenziali che modellizzano fenomeni di di¤usione del calore, vibrazione di corde e membrane, ricerca del potenziale elettrostatico o gravitazionale in presenza di un’assegnata distribuzione di cariche o masse, e così via. Poi, tra la …ne del 19 secolo e i primi decenni del 20 , sulla spinta di problemi sempre più complessi posti dalle applicazioni, problemi per cui non è facile ottenere soluzioni esplicite, ed anche per la tendenza, che intorno al 1900 va attraversando tutto il mondo matematico, a sviluppare teorie e concetti sempre più generali e astratti, si viene a¤ermando il nuovo punto di vista dell’analisi funzionale: la soluzione del problema che si va cercando è una funzione che viene vista come un punto di uno spazio astratto, un “punto”la cui esistenza si cerca di dimostrare con ragionamenti sempre più so…sticati. Si assiste così allo sviluppo di teorie astratte (spazi di Hilbert, spazi di Banach...) e a una vera rivoluzione nel modo di concepire le idee fondamentali dell’analisi: con Lebesgue, intorno al 1910, una nuova teoria dell’integrazione, con gli spazi di Sobolev, intorno al 1930, una nuova idea di derivata, con la teoria delle distribuzioni, 1950, un nuovo concetto di funzione.... Queste idee e teorie astratte si rivelano potenti ed e¢ caci nel gettare luce anche sui problemi concreti che la scienza pone, in forma sempre più complessa, e sono fondamentali per capire i metodi matematici oggi comunemente utilizzati nelle applicazioni …siche e ingegneristiche. In questo corso si farà una panoramica su alcune delle idee qui sopra accennate, seguendo un percorso che, senza entrare nelle teorie più impegnative (che richiederebbero più tempo a disposizione) e senza nessuna pretesa di sistematic- 5 ità, mostri un ventaglio interessante e vario di idee, metodi e problemi, arrivando a qualche applicazione signi…cativa in campi diversi: i sistemi di equazioni di¤erenziali ordinarie, l’analisi di Fourier, i problemi ai limiti per equazioni a derivate parziali da un punto di vista classico e moderno. E’un corso rivolto a studenti a cui piace la matematica nel suo intreccio di astratto e concreto. Il percorso seguito è suggerito dal tentativo di soddisfare due esigenze tra loro antagoniste. Ricordiamo ancora infatti che tra il punto di arrivo dei corsi di matematica di base alle applicazioni odierne dei metodi matematici intercorrono più di 100 anni di storia, e la matematica generalmente non fa sconti sulla consequenzialità logica. Si è cercato quindi di arrivare, mediante un percorso appositamente “ritagliato”in modo da evitare investimenti teorici troppo onerosi per un corso di 5 crediti, ad almeno alcune idee e tecniche relativamente recenti, senza però snaturare completamente la consequenzialità logica, e quindi partendo da temi che sviluppano nella direzione dell’analisi funzionale moderna i concetti del calcolo di¤erenziale classico con cui lo studente è già familiare. Dal punto di vista matematico, questo si è tradotto nel privilegiare sistematicamente nel corso il tema della completezza a discapito di quello della compattezza, le tecniche di ortogonalità e spazi di Hilbert rispetto a quelle di spazi di Banach; per lo stesso motivo si è deciso di non a¤rontare la teoria degli operatori. Per ridurre al minimo le sovrapposizioni col corso di Analisi Funzionale e Trasformate, in…ne, si è anche scelto di non trattare (e non darne per scontata la conoscenza) le trasformate integrali (di Fourier e Laplace), privilegiando, nella risoluzione di problemi ai limiti per equazioni a derivate parziali, i domini limitati su cui si può applicare il metodo di separazione di variabili e gli sviluppi in serie, e non trattare la teoria delle distribuzioni, concentrandosi sulla de…nizione di derivata in senso debole. Una panoramica sul corso La prima parte del corso tratta gli spazi classici di funzioni continue o derivabili; se ne mostra la completezza a partire dalle nozioni di base dell’analisi e dallo studio delle proprietà della convergenza uniforme di successioni di funzioni, e si mostra come queste proprietà, grazie al teorema di punto …sso in spazi metrici, consenta di ottenere risultati classici di esistenza e unicità per problemi di¤erenziali ed equazioni integrali. Successivamente (Parte 2) si presentano le idee fondamentali della teoria della misura e dell’integrazione di Lebesgue, motivati dalla necessità di ottenere spazi completi di funzioni integrabili. Questa teoria è un vero punto di svolta nella matematica di inizio 1900, ed è un passaggio imprescindibile per avvicinarsi a tutte le idee importanti nelle applicazioni dell’analisi matematica da 100 anni a questa parte. Gli spazi di funzioni a quadrato integrabile rispetto a una misura, in particolare, saranno l’esempio e il modello principale di spazio di Hilbert, il successivo concetto chiave che si introduce nel corso. La teoria degli spazi di Hilbert (Parte 3) unisce l’idea analitico funzionale di completezza all’idea geometrica di ortogonalità. In questo quadro astratto viene sviluppata su¢ ciente “geometria in…nito dimensionale” da permettere di sviluppare le idee fondamentali dell’analisi di Fourier in spazi di Hilbert; il tema 6 dei funzionali lineari continui e delle forme bilineari, con gli importanti teoremi di esistenza di Riesz e di Lax-Milgram, fornirà invece la strumentazione per le applicazioni dell’ultima parte del corso, ai teoremi di esistenza per problemi ai limiti per equazioni a derivate parziali. Nella Parte 4 si vuole mostrare qualche applicazione dell’analisi di Fourier in spazi di Hilbert all’analisi di Fourier “concreta”, con i suoi problemi di approssimazione di segnali periodici mono o multidimensionali. In secondo luogo, si illustrano applicazioni a problemi di¤erenziali classici: problemi ai limiti per le equazioni a derivate parziali della …sica matematica, in geometrie semplici, che si risolvono per separazione di variabili sfruttando idee di ortogonalità e completezza in spazi di Hilbert. La quinta e ultima parte del corso vuole introdurre alla cosiddetta formulazione debole dei problemi ai limiti per equazioni a derivate parziali di tipo stazionario. Il quadro funzionale è quello degli spazi di Sobolev Hilbertiani. Con‡uisce qui da una parte la teoria della misura e dell’integrazione di Lebesgue, dall’altra la teoria astratta degli spazi di Hilbert, per ottenere una de…nizione di soluzione di un problema ai limiti che permetta di dimostrare teoremi di esistenza e unicità anche in geometrie molto generali, in cui la risoluzione esplicita in termini esatti appare preclusa. Maggio 2012 7 Parte I Spazi di Lagrange 1 Spazi vettoriali, spazi metrici Cominciamo con l’introdurre o richiamare alcune strutture astratte che si utilizzano per studiare gli spazi di funzioni che sono coinvolti nei problemi analitici che incontreremo. 1.1 Spazi vettoriali Iniziamo a ricordare la de…nizione di spazio vettoriale che lo studente ha incontrato nello studio dell’algebra lineare. De…nizione 1.1 (Spazio vettoriale) Uno spazio vettoriale sul campo K (= R o C) è un insieme X su cui sono de…nite: 1. un’operazione + (“somma di vettori”), che associa ad ogni coppia di vettori (x; y) un vettore x + y; l’operazione di somma soddisfa le proprietà (per ogni x; y; z 2 X): -commutativa: x + y = y + x; -associativa: x + (y + z) = (x + y) + z; -esistenza dell’elemento neutro 0; tale che x + 0 = 0 + x = x; -esistenza dell’opposto x di ogni elemento x, tale che x + ( x) = 0: 2. Un’operazione di prodotto tra un vettore e uno scalare, che associa a una coppia ( ; x) con 2 K; x 2 X un vettore x 2 X; l’operazione1 soddisfa le proprietà (per ogni x; y 2 X; ; 2 K): -distribuitva del prodotto per uno scalare rispetto alla somma di vettori: (x + y) = x + y -distribuitva del prodotto per uno scalare rispetto alla somma di scalari: ( + ) x = x + x; -pseudoassociativa: ( x) = ( ) x; -l’elemento neutro del prodotto tra scalari è elemento neutro del prodotto per uno scalare: 1 x = x: Ricordiamo che uno spazio X ha dimensione …nita quando esiste un numero …nito di elementi e1 ; e2 ; :::; en 2 X tali che ogni altro elemento di X è combinazione lineare di questi. Altrimenti si dice che X ha dimensione in…nita. Nel corso di algebra lineare e geometria lo studente ha incontrato soprattutto spazi vettoriali di dimensione …nita, come sono gli spazi Rn e Cn , gli spazi di matrici, gli spazi di polinomi di grado minore o uguale di un n …ssato. In analisi ci interessano spazi vettoriali di funzioni, e questi sono solitamente di dimensione in…nita. 1 Come nell’algebra usuale, il simbolo sottointeso. di prodotto tra vettore e scalare è comunemente 8 De…nizione 1.2 (Spazio di funzioni) Sia F = ff : un insieme qualsiasi e sia ! Rg : (Si potrebbero considerare anche funzioni a valori in Rn o Cn , ma per semplicità limitiamoci ora a questo caso). F è uno spazio vettoriale su R, con le operazioni naturali di somma di funzioni: (f + g) (x) = f (x) + g (x) e prodotto di una funzione per uno scalare: ( f ) (x) = f (x) : La veri…ca delle proprietà delle operazioni richieste dalla de…nizione di spazio vettoriale è immediata, seguendo queste dalle analoghe proprietà delle operazioni su numeri reali. Notiamo che se ad esempio = (a; b) R, F ha dimensione in…nita: non esiste un numero …nito di funzioni di cui tutte le altre siano combinazioni lineari (ad esempio, le funzioni xn per n = 1; 2; 3; ::: sono un esempio di in…nite funzioni di cui nessuna è combinazione lineare di un numero …nito delle altre, e naturalmente esistono funzioni di tipo ancora diverso). Di solito si studiano spazi di funzioni con qualche proprietà aggiuntiva (ad esempio funzioni continue, o integrabili, o derivabili...). Esempio 1.3 C 0 (a; b) = ff : (a; b) ! R : f è continuag è uno spazio vettoriale. Il modo più semplice di dimostrarlo non è veri…care daccapo le proprietà delle operazioni, ma veri…care che questo sottoinsieme di F(a;b) è un sottospazio vettoriale. Questo consiste nel veri…care che la combinazione lineare di due elementi di C 0 (a; b) è ancora un elemento di C 0 (a; b), il che segue per le proprietà note delle funzioni continue. Puntualizziamo quindi il Teorema 1.4 (Criterio di riconoscimento dei sottospazi) Dato uno spazio vettoriale X su K e un sottoinsieme X0 X; X0 risulta un sottospazio vettoriale (cioè uno spazio vettoriale rispetto alle medesime operazioni) se x + y 2 X0 per ogni x; y 2 X0 ; ; 2 K: Esempio 1.5 Applicando il criterio precedente è immediato veri…care che sono spazi vettoriali i seguenti: C 0 [a; b] ; insieme delle funzioni continue su [a; b] C 1 [a; b] ; insieme delle funzioni derivabili con derivata continua su [a; b] L [a; b] ; insieme delle funzioni limitate su [a; b] 9 e analoghi spazi di funzioni de…nite su tutto R oppure su un opportuno insieme Rn . Invece, non è uno spazio vettoriale l’insieme P (R) , insieme delle funzioni periodiche su R, in quanto la somma di due funzioni periodiche non sempre è periodica, come mostra l’esempio f (x) = sin x + sin ( x) . Quando in analisi si parla di “spazio di funzioni” solitamente si intende indicare uno spazio vettoriale, i cui elementi sono funzioni (con qualche proprietà particolare). Nei casi (non così frequenti) in cui ci interessa considerare un insieme di funzioni che non costituisce uno spazio vettoriale, solitamente si utilizzano termini come insieme delle funzioni... o classe delle funzioni..., rinunciando cioè a usare la parola spazio. Come negli spazi Rn esiste il modulo (o norma) di un vettore, così in molti spazi vettoriali esiste una norma che consente di misurare la “grandezza”di un vettore e quindi la distanza tra due vettori: De…nizione 1.6 (Spazio vettoriale normato) Sia X uno spazio vettoriale su K. Si dice norma su X una funzione k k : X ! [0; +1) che ad ogni vettore associa un numero reale non negativo, con le seguenti proprietà (per ogni x; y 2 X; 2 K): -proprietà di annullamento: kxk = 0 () x = 0 -omogeneità: k xk = j j kxk -disuguaglianza triangolare: kx + yk kxk + kyk. In questo caso (X; k k) si dice spazio vettoriale normato. Esempio 1.7 1. In Rn la norma usuale è v u n uX 2 jxj = t jxi j i=1 che veri…ca le proprietà precedenti. Non è l’unica norma naturale in Rn . Sono norme anche: jxj0 = jxj1 = max i=1;2;:::;n n X i=1 jxi j oppure jxi j : Si può dimostrare che queste tre norme sono tutte tra loro equivalenti, il che signi…ca che per certe costanti c1 ; c2 > 0 risulta c1 jxj0 jxj 10 c2 jxj0 e analoghe disuguaglianze permettono di confrontare jxj con jxj1 e jxj0 con jxj1 . 2. In C 0 [a; b] possiamo de…nire: kf kC 0 [a;b] = max jf (x)j , x2[a;b] che risulta …nita per ogni f 2 C 0 [a; b] in base al teorema di Weierstrass. E’ immediato veri…care che valgono le proprietà di norma. Analoga norma si può de…nire più in generale in C 0 (K) dove K è un sottoinsieme chiuso e limitato di Rn . 3. In C 0 [a; b] possiamo de…nire anche2 : Z b kf kL1 [a;b] = jf (x)j dx. a 0 Anche questa risulta una norma su C [a; b], pur essendo sostanzialmente diversa dalla norma kf kC 0 [a;b] . Le norme k kC 0 e k kL1 non sono equivalenti. Vediamo quindi che su uno spazio di funzioni, diversamente che in Rn , possono esistere norme sostanzialmente diverse tra loro. 4. Se provassimo a de…nire la norma kf kC 0 o kf kL1 in C 0 (a; b) (che pure è uno spazio vettoriale), queste norme non risulterebbero …nite per ogni f 2 C 0 (a; b), in quanto C 0 (a; b) contiene anche funzioni illimitate. Quindi su questo spazio queste non sarebbero norme. Vediamo quindi che non in ogni spazio vettoriale esistono norme “naturali”. 1.2 Spazi metrici Una diversa struttura astratta utile in analisi è quello di spazio metrico, che ora introduciamo. De…nizione 1.8 (Spazio metrico) Si dice spazio metrico un insieme X dotato di una funzione distanza d:X X ! [0; 1] che soddisfa le seguenti proprietà (per ogni x; y 2 X): -proprietà di annullamento: d (x; y) = 0 () x = y -simmetria: d (x; y) = d (y; x) -disuguaglianza triangolare: d (x; y) d (x; z) + d (z; y). Notiamo subito che ogni spazio vettoriale normato è uno spazio metrico: ponendo d (x; y) = kx yk si ha che d soddisfa le proprietà della distanza. Tuttavia la struttura di spazio metrico non presuppone di per sé quella di spazio vettoriale. Ad esempio è immediata la seguente: 2 L’origine del nome L1 dato a questa norma si chiarirà in un prossimo capitolo, parlando dell’integrale di Lebesgue. Per ora è solo un simbolo come un altro scelto per denotare questa norma integrale. 11 Proposizione 1.9 Se (X; d) è uno spazio metrico e X0 sieme qualsiasi, anche (X0 ; d) è uno spazio metrico. X un suo sottoin- In particolare: qualunque sottoinsieme di uno spazio vettoriale normato è uno spazio metrico, pur non essendo più, in generale, uno spazio vettoriale. Esempio 1.10 1. Sia X un qualunque sottoinsieme di Rn e d (x; y) = jx yj. Questo è uno spazio metrico (e in generale, non è uno spazio vettoriale). 2. X = C 0 [a; b] con d (f; g) = kf gkC 0 è uno spazio metrico, essendo uno spazio vettoriale normato. 3. X = f 2 C 0 [a; b] : kf kC 0 1 con d (f; g) = kf gkC 0 è uno spazio metrico, essendo sottoinsieme di uno spazio vettoriale normato. Non è uno spazio vettoriale (combinazione lineare di funzioni che soddisfano kf kC 0 1 in generale non soddisfa la stessa limitazione). 4. X = ff : R ! R : f periodica e limitatag con d (f; g) = kf gkC 0 è uno spazio metrico. Infatti, anche se la di¤ erenza tra due funzioni periodiche può non essere periodica, quindi X non è uno spazio vettoriale, è comunque vero che la di¤ erenza tra due funzioni periodiche e limitate è limitata, quindi kf gkC 0 risulta …nita. Gli spazi metrici che ci interesseranno nel seguito saranno quasi sempre sottoinsiemi di uno spazio vettoriale normato. In tutti gli spazi metrici, quindi in particolare negli spazi vettoriali normati, si possono introdurre nozioni topologiche in modo analogo a quanto si fa in Rn . Data la somiglianza di questi concetti con quelli che dovrebbero essere già noti in Rn non ci so¤ermeremo molto nell’esempli…care. De…nizione 1.11 (Intorni sferici) Sia (X; d) uno spazio metrico. Si dice sfera aperta o intorno sferico di centro x0 2 X e raggio r > 0 l’insieme Br (x0 ) = fx 2 X : d (x; x0 ) < rg : De…nizione 1.12 (Punti di un insieme) Sia (X; d) uno spazio metrico e E X. Un punto x 2 X si dice: interno ad E se esiste un intorno sferico Br (x) E; esterno ad E se esiste un intorno sferico Br (x) E c (il simbolo E c indice il complementare di E; cioè E c = X n E); di frontiera per E se non è né interno né esterno. Esplicitamente: x è di frontiera per E se ogni intorno sferico Br (x) contiene un punto y 2 E e un punto z 2 = E: De…nizione 1.13 (Tipi di insiemi) Sia (X; d) uno spazio metrico e E Si dice che: E è aperto se ogni punto di E è interno ad E; E è chiuso se il complementare di E è aperto. Naturalmente un insieme può non essere né aperto né chiuso. 12 X. Teorema 1.14 (Operazioni su aperti e chiusi) Sia fA g 2I una famiglia [ qualsiasi (cioè: anche in…nita) di aperti. Allora A è aperto; 2I sia \ n fAi gi=1 sia fC g una famiglia …nita di aperti. Allora n \ Ai è aperto; n [ Ai è chiuso. i=1 una famiglia qualsiasi (cioè: anche in…nita) di chiusi. Allora 2I C è chiuso; 2I n sia fCi gi=1 una famiglia …nita di chiusi. Allora i=1 Dimostrazione (traccia). Le prime due proprietà si dimostrano direttamente in base alla [ de…nizione di aperto e di intorno sferico: Sia x 2 A ; dunque x 2 A per un certo A che è aperto, dunque esiste Br (x) A Sia x 2 Bri (x) Br (x) 2I n \ [ i=1 A ; dunque x è interno ad 2I [ A e questo è aperto. 2I Ai ; dunque x 2 Ai per ogni Ai che è aperto, dunque esiste Ai per ogni i = 1; 2; :::; n: Posto r = min (ri : i = 1; 2; :::; n) si ha che n \ Ai e questo è aperto. i=1 Le ultime due seguono, in base alla de…nizione di chiuso come complementare di un aperto, per dualità, cioè ricordando che !c \ [ C = Cc 2I n [ i=1 Ci !c 2I = n \ Cic : i=1 Notiamo che invece in generale l’unione di una famiglia in…nita di chiusi può non essere chiuso e l’intersezione di una famiglia in…nita di aperti può non essere un aperto. Esempio 1.15 In R; gli intervalli (a; b) sono aperti, gli intervalli [a; b] sono chiusi. Si osservi che: 1 [ 0; 1 1 = [0; 1) che non è chiuso, e n 0; 1 + 1 n n=1 1 \ n=1 = (0; 1] che non è aperto. 13 De…nizione 1.16 Sia (X; d) uno spazio metrico e E X: Si dice: interno di E, e si indica con E , l’insieme dei punti interni di E; frontiera di E; e si indica con @E; l’insieme dei punti di frontiera di E; chiusura di un insieme, e si indica con E; l’insieme E [ @E. Si veri…cano facilmente le seguenti proprietà (dimostrare per esercizio): Teorema 1.17 Per ogni E X: E E E; E è aperto e E è chiuso; E è aperto se e solo se E = E ; E è chiuso se e solo se E = E. Esempio 1.18 In R2 determinare interno, frontiera, chiusura, interno della chiusura, dei seguenti insiemi: (a) E = (x; y) : 0 < x2 + y 2 < 1 : (b) E = R Q. Soluzioni (a): E = E; E = (x; y) : x2 + y 2 1 ; @E = f(0; 0)g[ (x; y) : x2 + y 2 = 1 ; E = (x; y) : x2 + y 2 < 1 . Notiamo in particolare che E 2 (b): E = ;; E = R ; @E = E; E 2 6= E: = R . Anche in questo caso E 6= E: De…nizione 1.19 Sia (X; d) uno spazio metrico e E X: Si dice che E è limitato se esiste una sfera (di raggio e centro qualsiasi) Br (x0 ) E. In particolare in uno spazio vettoriale normato si dice che E è limitato se esiste K > 0 tale che kxk < K per ogni x 2 E. In ogni spazio metrico, e quindi in particolare negli spazi vettoriali normati, si può de…nire il concetto di limite di successione: De…nizione 1.20 (Limite di successione) Sia (X; d) uno spazio metrico e 1 fxn gn=1 X. Si dice che xn ! x se d (xn ; x) ! 0: Esplicitamente, questo signi…ca che: per ogni " > 0 esiste n0 tale che per ogni n n0 è xn 2 B" (x) : Si noti come la convergenza in X è stata ricondotta, via il concetto di distanza, alla convergenza in R. Questo è del resto ciò che si fa anche per de…nire la convergenza in Rn . Vale naturalmente il teorema di unicità del limite, con “la solita” dimostrazione. Molto importante è la prossima proprietà, che getta un ponte tra il concetto topologico di insieme chiuso e quello di successione convergente: Teorema 1.21 (Caratterizzazione successionale dei chiusi) Sia (X; d) uno spazio metrico e C X: L’insieme C è chiuso se e solo se vale la seguente proprietà: 14 1 per ogni successione fxn gn=1 C tale che xn ! x per qualche x 2 X si ha che x 2 C: Detto altrimenti: un insieme è chiuso se e solo se contiene i limiti di tutte le proprie successioni convergenti in X. (Si noti che la successione fxn g per ipotesi ha limite in X; il punto è che questo limite appartenga in e¤ etti al sottoinsieme C). Dimostrazione. 1. Proviamo prima che se C è chiuso allora vale la proprietà. 1 Sia dunque fxn gn=1 C tale che xn ! x 2 X; e proviamo che x 2 C: Per assurdo, sia x 2 C c . Poiché C è chiuso, C c è aperto, perciò x è interno a C c ; sia dunque Br (x) C c . Per de…nizione di limite, esiste n0 tale che per ogni n n0 è xn 2 Br (x) C c ; assurdo perché questo implicherebbe che in…niti elementi xn stanno in C c ; mentre per ipotesi sono tutti elementi di C: 2. Proviamo ora che se vale la proprietà allora C è chiuso. Lo mostriamo provando che C c è aperto. Sia dunque x 2 C c e proviamo che x è interno a C c , cioè esiste Br (x) C c . Per assurdo non sia così. Allora per ogni n la sfera B1=n (x) non è contenuta in C c , ossia esiste xn 2 B1=n (x) \ C. Dunque la successione fxn g è contenuta in C; e d’altro canto converge a x perché d (x; xn ) < 1=n. Per la proprietà ammessa per ipotesi, questo implica x 2 C; assurdo perché per ipotesi x 2 C c : La de…nizione di limite consente di de…nire, al solito modo, il concetto di funzione continua su uno spazio metrico, a valori reali o in un altro spazio metrico: De…nizione 1.22 Siano (X; dX ) ; (Y; dY ) due spazi metrici. Una funzione f : X ! Y si dice continua in x 2 X se per ogni successione fxn g X tale che xn ! x in X si ha f (xn ) ! f (x) in Y: Equivalentemente, se per ogni " > 0 esiste > 0 tale che dX (x; x) < =) dY (f (x) ; f (x)) < ": La funzione f si dice continua in X se è continua in ogni punto x 2 X. Si possono formulare i concetti topologici di insieme aperto e chiuso in termini di funzioni continue: Teorema 1.23 (Insiemi aperti e chiusi de…niti mediante funzioni continue) Sia (X; d) metrico e f : X ! R continua. Allora gli insiemi: E1 = fx 2 X : f (x) > 0g E2 = fx 2 X : f (x) < 0g E3 = fx 2 X : f (x) 6= 0g sono aperti; gli insiemi: E4 = fx 2 X : f (x) 0g E5 = fx 2 X : f (x) 0g E6 = fx 2 X : f (x) = 0g sono chiusi. Dimostrazione. Proviamo che E1 è aperto mostrando che ogni suo punto è interno. Sia x0 2 E1 ; quindi f (x0 ) > 0: Per continuità di f esiste allora Br (x0 ) 15 in cui f (x) > 0 (lo studente è invitato a mostrarlo in dettaglio). Dunque Br (x0 ) E1 , ed E1 è aperto. In modo analogo si mostra che E2 è aperto. Allora E3 = E1 [ E2 è aperto perché unione di aperti. Gli insiemi E4 ; E5 ; E6 sono, rispettivamente, il complementare di E1 ; E2 ; E3 ; dunque sono chiusi perché complementare di aperti. Esempio 1.24 In uno spazio vettoriale normato (X; k k) gli insiemi fx 2 X : kxk = 1g ; fx 2 X : kxk fx 2 X : kxk > 1g è aperto. 1g sono chiusi; Terminiamo con la seguente De…nizione 1.25 Sia (X; d) uno spazio metrico. Un sottoinsieme E X si dice denso in X se E = X. Equivalentemente: E è denso in X se per ogni 1 x 2 X esiste una successione fxn gn=1 E tale che xn ! x: Quindi un sottoinsieme denso, pur possedendo meno elementi di X; consente di approssimare bene quanto vogliamo qualsiasi elemento di X. Ad esempio, Q è denso in R. 2 Richiami sulla cardinalità di insiemi Richiamiamo molto brevemente alcuni fatti che ci serviranno in seguito, riguardanti la cardinalità (numerosità) degli insiemi in…niti. De…nizione 2.1 Due insiemi X; Y si dicono avere uguale cardinalità se esiste una corrispondenza biunivoca tra X e Y: Si dice che cardX <cardY se X ha la stessa cardinalità di un sottoinsieme proprio di Y; e inoltre X non ha la stessa cardinalità di Y: L’ultima precisazione nella de…nizione precedente è resa necessaria dalla prossima: De…nizione 2.2 Un insieme X si dice in…nito quando esiste un suo sottoinsieme proprio X0 X che ha la stessa cardinalità di X. In altre parole: ogni insieme in…nito ha la stessa cardinalità di qualche suo sottoinsieme proprio, ma non necessariamente di ogni suo sottoinsieme proprio. Esempio 2.3 L’insieme N = f0; 1; 2; 3; :::g è in corrispondenza biunivoca col suo sottoinsieme proprio f1; 2; 3; :::g, dove la corrispondenza biunivoca è quella che associa ad ogni numero naturale il suo successivo. Perciò N è in…nito. De…nizione 2.4 Un insieme E si dice numerabile se ha la stessa cardinalità 1 di N. Quindi E si può rappresentare come successione: E = fxn gn=0 . 16 Si possono dimostrare i seguenti risultati: Teorema 2.5 Gli insiemi N; Z; Q sono numerabili. 1 Teorema 2.6 Se fEn gn=1 è una successione di insiemi tali che ogni En è 1 [ numerabile, anche En è numerabile. n=1 1 Questo ad esempio signi…ca che una successione a due indici naturali fxn;m gn;m=1 individua un insieme che si può rappresentare anche come successione a un solo 1 indice fyk gk=1 . Teorema 2.7 L’insieme R non è numerabile, ed ha la stessa cardinalità dell’insieme delle parti P (N), cioè l’insieme di tutti i sottoinsiemi di N: cardR = cardP (N) : Inoltre, qualunque intervallo non vuoto (e non ridotto a un punto) in R non è numerabile. Il teorema precedente ci o¤re il primo esempio di confronto tra cardinalità diverse di insiemi in…niti: R ha cardinalità maggiore del suo sottoinsieme N (ed anche del suo sottoinsieme Q); si noti che, invece, R ha la stessa cardinalità del suo sottoinsieme (0; 1). Si confronti con quanto osservato dopo la de…nizione di insieme in…nito. Il teorema a¤erma anche che cardN <cardP (N). Questo fatto si può generalizzare: Teorema 2.8 Per ogni insieme X si ha cardX <cardP (X). Questo implica che la scala delle cardinalità non ha un limite superiore: di ogni insieme esiste sempre un insieme più numeroso. Tornando agli spazi metrici, possiamo dare ora la seguente De…nizione 2.9 (Spazio separabile) Sia (X; d) uno spazio metrico. Si dice che X è separabile se esiste un suo sottoinsieme denso numerabile. Per quanto a¤ermato dopo la de…nizione di insieme denso, questo signi…ca che esiste un sottoinsieme di X, chiamiamolo X0 , che è numerabile (mentre X in generale non è numerabile) tale ogni elemento di X può essere approssimato bene quanto vogliamo con un elemento di X0 . Quindi in uno spazio separabile esistono “relativamente pochi” elementi (un sottoinsieme numerabile) che permettono di approssimare tutti gli altri. Ad esempio R o Rn sono insiemi separabili, perché Q è denso in R e Qn è denso in Rn . Vedremo nel seguito esempi di spazi di funzioni separabili. 17 3 Convergenza e completezza I teoremi di esistenza dell’analisi, per esempio per problemi relativi ad equazioni di¤erenziali o per problemi di minimo, vengono spesso provati costruendo opportune successioni di elementi che dovrebbero approssimare la soluzione desiderata, e poi sfruttando teoremi che garantiscano la convergenza della successione (o di una sua sottosuccessione). Questi teoremi di convergenza ruotano attorno a due concetti chiave dell’analisi: completezza e compattezza. In questo corso approfondiremo ed utilizzeremo solo la prima di queste due nozioni, che è la più semplice e già consente molte applicazioni interessanti. Tutti i teoremi di convergenza di successioni in spazi di funzioni o spazi più astratti, a loro volta, si fondano in ultima analisi su teoremi di convergenza “basici” che valgono in R. E’naturale quindi partire proprio da qui. 3.1 Teoremi di convergenza in R e in Rn Cominciamo col richiamare la proprietà di R che sta alla radice di tutti i teoremi di esistenza che valgono in Rn e negli spazi di funzioni reali de…nite su sottoinsiemi di Rn : la proprietà dell’estremo superiore, detta anche proprietà di completezza di R. De…nizione 3.1 (Maggiorante, massimo, estremo superiore) Sia E R. Si dice che E è superiormente limitato se esiste un numero K 2 R tale che x K per ogni x 2 E. Tale numero K si dice maggiorante di E. Se ne esiste uno (cioè se E è superiormente limitato) allora ne esistono in…niti (tutti i numeri > K sono a loro volta maggioranti). Se un maggiorante di E appartiene ad E, si dice che è il massimo di E: Analogamente si de…niscono i concetti di insieme inferiormente limitato, minorante, elemento minimo. Se E è superiormente limitato e l’insieme dei maggioranti ammette elemento minimo, questo si chiama estremo superiore di E, e si indica con sup E. Analogamente si de…nisce inf E come il massimo dei minoranti di E (se esiste). Osserviamo che un insieme ha massimo se e solo se ha estremo superiore e questo appartiene all’insieme stesso. Se esiste sup E ma questo non appartiene ad E, l’insieme non ha massimo. La proprietà dell’estremo superiore a¤erma quanto segue: Proposizione 3.2 Se E R è un insieme non vuoto e superiormente limitato, allora esiste sup E 2 R. (Analogamente, esiste l’estremo inferiore di un insieme non vuoto e inferiormente limitato). A seconda della forma logica in cui si presenta la teoria dei numeri reali, ossia in forma assiomatica oppure in forma costruttiva (a partire dalla teoria dei numeri razionali), la proposizione precedente assume lo status di assioma oppure di teorema. Ricordiamo che la de…nizione assiomatica di R consiste nel dichiarare che R è un campo ordinato che soddisfa la proprietà dell’estremo superiore. Che 18 questi fatti siano assunti come assiomi o siano dimostrati a partire da fatti più elementari, in ogni caso ciò che conta per il seguito del discorso è tutto qui. Una conseguenza abbastanza semplice della proprietà dell’estremo superiore è il seguente: 1 Teorema 3.3 (di monotonia) Sia fxn gn=1 una successione di numeri reali, monotona crescente e superiormente limitata. Allora essa ammette limite …nito, e il limite è l’estremo superiore dell’insieme dei valori fxn : n = 1; 2; 3:::g : Fin qui abbiamo richiamato fatti che dovrebbero essere ben noti dall’Analisi 1. Vediamo ora altro sviluppo del discorso che lo studente potrebbe non conoscere. 1 Teorema 3.4 (di Bolzano-Weierstrass) Sia fxn gn=1 una successione limi1 tata di numeri reali. Allora esiste una sua sottosuccessione fxnk gk=1 convergente. Quelli appena enunciati sono i due fondamentali teoremi di convergenza in R. Su di essi si basano, ad esempio, i teoremi importanti sulle funzioni continue su un intervallo. 1 Ricordiamo che una sottosuccessione di fxn gn=1 è una successione estratta 1 da questa, cioè del tipo fxnk gk=1 con n1 < n2 < n3 < ::: In altre parole, la successione degli indici della sottosuccessione è monotona, anche se la sottosuccessione stessa può non esserla. Esempi di sottosuccessioni sono la sottosuccessione dei termini di indice pari, o di indice dispari, o di indice 3n, e così via. 1 Dimostrazione del Teorema di Bolzano-Weierstrass. Poiché fxn gn=1 1 è limitata, sia [a; b] un intervallo chiuso e limitato contenente fxn gn=1 . Sia c = (a + b) =2 il punto medio dell’intervallo. Almeno uno dei due sottointervalli [a; c] ; [c; b] deve contenere termini xn per un numero in…nito di interi n. Chiamiamo [a1 ; b1 ] questo sottointervallo (o uno dei due, se entrambi vanno bene), e scegliamo un termine xk1 2 [a1 ; b1 ]. Ora consideriamo il punto medio c1 = (a1 + b1 ) =2 di [a1 ; b1 ]. Almeno uno dei due sottointervalli [a1 ; c1 ] ; [c1 ; b1 ] deve contenere termini xn per in…niti interi n > k1 . Chiamiamo [a2 ; b2 ] questo sottointervallo (o uno dei due, se entrambi vanno bene), e scegliamo un termine xk2 2 [a2 ; b2 ], con k2 > k1 . Proseguendo iterativamente a questo modo, costruiamo una successione di intervalli [an ; bn ], ognuno contenuto nel precedente e 1 di lunghezza la metà del precedente, e una sottosuccessione fxkn gn=1 tale che xkn 2 [an ; bn ]. Valgono dunque le seguenti proprietà: 1 1. fan gn=1 è una successione crescente e contenuta in [a; b] ; 1 2. fbn gn=1 è una successione decrescente e contenuta in [a; b] ; 3. bn an = (b a) =2n 8n: 4. an < xkn < bn 8n: Allora: per (1) e il teorema di monotonia, esiste tale che an ! ; inoltre per il teorema di permanenza del segno, 2 [a; b]. Analogamente per (2) esiste 2 [a; b] tale che bn ! . Per (3) = perché an bn ! 0. Per (4) e il 19 teorema del confronto, anche xkn ! (= ). Abbiamo quindi provato che la 1 sottosuccessione fxkn gn=1 converge. Il teorema precedente si estende a Rn : 1 Teorema 3.5 (di Bolzano-Weierstrass in Rn ) Sia fxk gk=1 una successione 1 limitata in Rn . Allora esiste una sua sottosuccessione xkj j=1 convergente. Dimostrazione. Il teorema si può dedurre da quello precedente (in R) col seguente argomento, che illustriamo per semplicità nel caso n = 2. 1 1 Sia f(xk ; yk )gk=1 una successione limitata in R2 . Allora fxk gk=1 è una successione limitata in R; e per il teorema precedente ammetterà una sottosuc1 cessione convergente a un certo x; chiamiamola fxnk gk=1 . Consideriamo allora 1 2 la sottosuccessione f(xnk ; ynk )gk=1 , limitata in R e tale che xnk ! x: Per il teo1 rema precedente la successione fynk gk=1 , limitata in R, ha una sottosuccessione n o1 convergente a un certo y, chiamiamola ynjk . Allora ynjk ! y e xnjk ! x, k=1 n o1 1 essendo xnjk una sottosuccessione di fxnk gk=1 che già convergeva a x. k=1 Ne segue che xnjk ; ynjk ! (x; y), e il teorema è dimostrato. Mostriamo subito un esempio di applicazione del teorema di Bolzano-Weierstrass alla dimostrazione di un teorema che lo studente conosce già: Teorema 3.6 (di Weierstrass) Sia K Rn un insieme chiuso e limitato, e sia f : K ! R continua. Allora f ha massimo e minimo in K. Dimostrazione. Sia = sup ff (x) : x 2 Kg, intendendo ora che tale sup può essere …nito oppure in…nito (nel caso f non fosse limitata in K; eventualità che escluderemo nel corso della dimostrazione). Distinguiamo due casi. 1 1 1. < 1. Sia allora fxn gn=1 K tale che f (xn ) n (per de…nizione di estremo superiore, questi valori f (xn ) esistono certamente). La successione 1 fxn gn=1 è contenuta in K che è limitato, quindi è limitata. Perciò per il teorema di Bolzano-Weierstrass ammette una sottosuccessione convergente, xkn ! c. Inoltre poiché K è chiuso, c 2 K: Poiché f è continua in K; f (xn ) ! f (c). 1 D’altro canto f (xn ) per il teorema di permanenza n implica f (c) del segno, ed essendo f (c) per de…nizione di estremo superiore, si ha che f (c) = , perciò c è un punto di massimo di f e il massimo. 1 2. = 1: Sia allora fxn gn=1 K tale che f (xn ) n. Di nuovo, la 1 successione fxn gn=1 è limitata, perciò ammette una sottosuccessione convergente, xkn ! c 2 K: Poiché f è continua in K; f (xn ) ! f (c). D’altro canto f (xn ) n implica f (xn ) ! 1; assurdo perché f (c) è …nito. Quindi il caso 2 non può presentarsi. Analogamente si mostra che f ammette minimo. Il teorema di Bolzano-Weierstrass è in un certo senso caratteristico di Rn . Negli spazi vettoriali normati di dimensione in…nita un analogo teorema non vale, come mostrano i prossimi esempi. 20 Esempio 3.7 Sia X lo spazio vettoriale normato delle successioni reali limitate: X = `1 = 1 x = fxn gn=1 : kxk`1 = sup jxn j < 1 : n In X consideriamo la successione n n de…nita da: = 0; 0; 0; :::; 0; 1; 0; 0; ::: : n Chiaramente si ha k n k`1 = 1 per ogni n, dunque questa è una successione limitata in `1 , che però non ha alcuna sottosuccessione convergente. (La dimostrazione di quest’ultima a¤ ermazione sarà più facilmente svolta in seguito). Quindi in `1 il teorema di Bolzano-Weierstrass non vale. Esempio 3.8 Sia X = C 0 [ 1; 1] con la norma del sup, e sia p n x se x 0 p fn (x) = n x se x 0 Si ha kfn kC 0 [ 1;1] = 1 per ogni n, d’altro canto la successione converge puntualmente alla funzione discontinua 8 < 1 se x > 0 0 se x = 0 f (x) = : 1 se x < 0 perciò non può contenere nessuna sottosuccessione convergente in norma k kC 0 [ 1;1] a una funzione continua: infatti la convergenza in norma implica la convergenza puntuale, perciò il limite di tale sottosuccessione convergente in norma dovrebbe essere f , che però non appartiene a C 0 [ 1; 1]. Nell’esempio precedente la successione limitata non ha una sottosuccessione convergente nello spazio, perché, in un certo senso, converge a un limite che sta in un altro spazio (di funzioni discontinue). Un fenomeno diverso si presenta nel prossimo esempio, dove la successione non ha sottosuccessioni convergenti in alcun senso ad alcuna funzione: Esempio 3.9 Sia X = C 0 [0; 1] con la norma del sup, e sia fn (x) = sin (n x). E’ chiaro che kfn k1 = 1 per ogni n; d’altro canto fn non ammette alcuna sottosuccessione convergente. (Anche in questo caso, non è così facile a questo punto del corso dimostrare rigorosamente questa a¤ ermazione, ma potrà essere fatto più avanti). Molta analisi funzionale è stata sviluppata per ottenere negli spazi di dimensione in…nita qualche surrogato del teorema di Bolzano-Weierstrass. Questa linea di ricerca porta allo studio del concetto di compattezza, che però, come già segnalato, non perseguiremo nel corso. A noi il teorema di Bolzano-Weierstrass in Rn serve principalmente per provare un risultato di completezza, di cui ora ci occuperemo. 21 3.2 Completezza in spazi metrici Torniamo ora nel contesto astratto degli spazi metrici, per dare la seguente de…nizione fondamentale. De…nizione 3.10 (Successione di Cauchy) Sia (X; d) uno spazio metrico e 1 fxn gn=1 X: Si dice che questa successione è di Cauchy se: 8" > 0 9n0 : 8n; m n0 si ha d (xn ; xm ) < ": Detto in modo meno preciso ma più intuitivo: una successione è di Cauchy se i suoi termini sono sempre più vicini tra loro, o anche: se d (xn ; xm ) ! 0 per n; m ! 1. Per ra¤ronto, si noti che una successione è convergente (a x) se i suoi termini sono sempre più vicini a x. E’facile allora capire che: Proposizione 3.11 Se una successione converge in (X; d) ; allora è di Cauchy in (X; d). Dimostrazione. Fissiamo " > 0: Per ipotesi xn ! x per un certo x, dunque esisterà n0 tale che 8n n0 si ha d (xn ; x) < "=2: Di conseguenza per 8n; m n0 si ha d (xn ; xm ) d (xn ; x) + d (xm ; x) < "; e la successione è di Cauchy. Il fatto che una successione sia di Cauchy è quindi una condizione necessaria, in ogni spazio metrico, a¢ nché la successione sia convergente. Il fatto che una successione sia di Cauchy o meno si può veri…care senza sapere preliminarmente quale sia il “candidato limite” x, mentre per provare che fxn g è convergente in base alla de…nizione di limite occorre già avere un’idea su quale sia il limite stesso. Ad ogni modo la condizione necessaria non è in generale su¢ ciente, come mostra il prossimo n Esempio 3.12 Sia xn = 1 + n1 per n = 1; 2; 3; ::: E’ noto che xn ! e per n ! 1, e che e è un numero irrazionale, mentre tutti i numeri xn sono razion1 ali. Dunque la successione fxn gn=1 nello spazio metrico Q non è convergente. Tuttavia la successione in R è convergente, quindi è di Cauchy; ma allora è di Cauchy anche in Q, perché la distanza usata in Q ed R è la stessa (quella euclidea). Abbiamo quindi un esempio, nello spazio metrico Q, di successione di Cauchy ma non convergente. Il prossimo esempio mostra invece l’utilità della condizione di Cauchy per provare che una successione non converge. Esempio 3.13 Dimostriamo rigorosamente l’a¤ ermazione fatta nell’Esempio 3.7: nello spazio `1 = 1 x = fxn gn=1 : kxk`1 = sup jxn j < 1 : n 22 la successione n de…nita da: n = 0; 0; 0; :::; 0; 1; 0; 0; ::: n 1 non ammette alcuna sottosuccessione convergente. Infatti, sia f kn gn=1 una sua qualsiasi sottosuccessione, e mostriamo che questa non è di Cauchy. Infatti (supponendo per …ssare le idee che sia kn < km ): kn km k kn = 0; 0; 0; 1 ; 0; :::; 0; 1; 0; ::: km k`1 kn km = 1 per ogni n; m; quindi la condizione di Cauchy non vale. Proviamo anche la seguente semplice 1 Proposizione 3.14 Se una successione fxn gn=1 è di Cauchy in (X; d), allora è limitata. Dimostrazione. Applichiamo la de…nizione di successione di Cauchy. Fissato " = 1 esiste n0 tale che per ogni n; m n0 è d (xn ; xm ) < 1. In particolare quindi d (xn ; xn0 ) < 1 8n n0 : I termini della successione che non soddisfano la relazione precedente sono solo un numero …nito: x1 ; x2 ; :::; xn 1 . Detto M = max (1; d (x1 ; xn0 ) ; d (x2 ; xn0 ) ; :::; d (xn ; xn0 )) si ha d (xn ; xn0 ) M 8n; e la successione è limitata. Diamo ora la seguente De…nizione 3.15 (Spazio metrico completo) Uno spazio metrico (X; d) si dice completo se ogni successione di Cauchy in X è convergente in X. Quindi negli spazi metrici completi la condizione di Cauchy risulta equivalente alla convergenza. In uno spazio completo se veri…chiamo che una successione è di Cauchy (il che, ricordiamolo ancora, non richiede la previa conoscenza del candidato limite) ne segue che esiste un elemento x 2 X a cui la successione converge. Dunque la completezza dello spazio sarà un’ipotesi importante nei teoremi di esistenza. L’Esempio 3.12 mostra che lo spazio metrico Q non è completo. Vale invece il seguente fondamentale Teorema 3.16 Rn è completo. 23 1 Dimostrazione. Sia fxk gk=1 una successione di Cauchy in Rn . Allora la successione è limitata (Proposizione 3.14), quindi per il Teorema di Bolzano1 Weierstrass ha una sottosuccessione fxik gk=1 convergente a un certo x. Mostriamo che, in qualsiasi spazio metrico, se una successione di Cauchy ha uno sottosuccessione convergente, allora la successione intera converge (allo stesso limite). Poiché la sottosuccessione converge, …ssato " > 0 esiste n0 tale che se ij n0 allora d xij x < "=2; poiché la successione è di Cauchy, esiste n1 tale che k; ij n1 implica d xk ; xij < "=2: Quindi per k; ij max (n0 ; n1 ) è d (xk ; x) d xk ; xij + d xij x < "; in particolare per k > max (n0 ; n1 ) è d (xk ; x) < "; e la successione converge. Si osservi che nella dimostrazione precedente l’unico passaggio che non vale in uno spazio metrico qualsiasi è l’applicazione del teorema di Bolzano-Weierstrass, che vale in Rn . Tornando agli spazi metrici qualsiasi proviamo ora che: Teorema 3.17 Se (X; d) è uno spazio metrico completo e C chiuso. Allora (C; d) è uno spazio metrico completo. X è un insieme 1 Dimostrazione. Sia fxn gn=1 una successione di Cauchy in C. Allora è di Cauchy anche in X. Poiché X è completo, la successione converge a un elemento x 2 X. D’altro canto C è chiuso perciò x 2 C (Teorema 1.21). Dunque la successione converge in C. Perciò C è completo. De…nizione 3.18 (Spazio di Banach) Uno spazio vettoriale normato, completo rispetto alla distanza della norma, si dice spazio di Banach. Ad esempio Rn è uno spazio di Banach. La cosa importante per dimostrare teoremi di esistenza per problemi di analisi è trovare spazi di funzioni (quindi in…nito dimensionali) che siano di Banach. Esempio 3.19 Consideriamo lo spazio C 0 [ 1; 1] con la norma integrale: Z 1 kf kL1 [ 1;1] = jf (x)j dx: 1 Mostriamo che non è completo. Consideriamo la successione: p n x se x 0 p fn (x) = n x se x 0: La successione è di Cauchy. Infatti per n > m si ha: Z 1 Z kfn fm kL1 [ 1;1] = jfn (x) fm (x)j dx = 2 1 =2 1 1+ 1 p n x p m 0 1 n 1 1 1+ m 24 ! 0 per n; m ! 1: x dx D’altro canto la successione non converge ad alcun elemento dello spazio. Questa a¤ ermazione non è facile da giusti…care rigorosamente a questo livello del corso. In sostanza, tuttavia, il ragionamento è il seguente: la successione converge (con questa norma) alla funzione limite fn (x) = 1 1 se x > 0 se x > 0 che è discontinua, ossia non sta nello spazio considerato. Perciò, in questo spazio, la successione non converge. L’esempio precedente mostra che garantire la completezza di uno spazio di funzioni non è scontato, e in particolare dipende in modo cruciale dalla norma che si considera. Nel seguito di questo capitolo ci occuperemo di spazi di funzioni continue e derivabili e mostreremo la loro completezza, nella norma opportuna. Questi sono gli spazi di Lagrange, in cui ad esempio si ambienta lo studio classico dei sistemi di equazioni di¤erenziali ordinarie; in questo contesto dimostreremo il teorema di esistenza e unicità per un problema di Cauchy. In seguito ci occuperemo di spazi di funzioni integrabili, gli spazi di Lebesgue, e mostreremo come per ottenere spazi di Banach di questo tipo sia stato necessario sviluppare un nuovo tipo di integrale. Questo ci porterà alla teoria della misura e dell’integrazione nata all’inizio del 1900, su cui si basa ad esempio lo studio moderno delle equazioni alle derivate parziali, dell’analisi armonica, del calcolo delle variazioni. 4 Successioni di funzioni, spazi di funzioni continue o derivabili Vogliamo ora studiare gli spazi di funzioni C 0 [a; b] ; C k [a; b] ; o i loro analoghi per funzioni di più variabili, e provare che sono spazi di Banach. Per far questo è necessario uno studio preliminare di certi concetti legati alla convergenza di successioni di funzioni, di cui ora ci occuperemo. 4.1 Successioni di funzioni e convergenza uniforme De…nizione 4.1 (Convergenza puntuale) Sia fn : I ! R per n = 1; 2; 3; ::: 1 con I R o in Rn . Si dice che la successione ffn gn=1 converge in x0 2 I se la 1 1 successione reale ffn (x0 )gn=1 è convergente; si dice che la successione ffn gn=1 converge puntualmente in I se converge in x0 per ogni x0 2 I: In questo caso risulta de…nita una nuova funzione f : I ! R, f (x) = limn!1 fn (x), detta 1 limite puntuale della successione ffn gn=1 in I. La nozione di convergenza puntuale è semplice ma anche molto debole. Ci si rende conto facilmente, infatti, che il limite puntuale di una successione di funzioni talvolta non “eredita”le buone proprietà possedute dalle fn . I prossimi esempi vogliono illustrare i tipi di fenomeni che si possono presentare. 25 Esempio 4.2 Sia fn (x) = xn in [0; 1). 8 < 0 se x 2 [0; 1) 1 se x = 1 fn (x) ! : +1 se x > 1: La successione converge puntualmente solo nell’intervallo [0; 1], in cui risulta de…nita la funzione limite puntuale f (x) = 0 se x 2 [0; 1) 1 se x = 1: Osserviamo che in questo caso il limite puntuale è una funzione discontinua, sebbene le fn siano tutte funzioni continue. p Esempio 4.3 Sia fn (x) = n jxjsgn(x) in [ 1; 1]. 8 < 1 se x 2 (0; 1] 0 se x = 0 fn (x) ! : 1 se x 2 [ 1; 0): Anche in questo caso il limite puntuale è una funzione discontinua, sebbene le fn siano tutte funzioni continue. Esempio 4.4 Sia fn : [0; +1) ! R de…nita per n = 1; 2; 3; :::da: 1 x per x 2 [ n1 ; 1) nx per x 2 0; n1 : fn (x) = Si ha: fn (x) ! 1 x per x 2 (0; 1) 0 per x = 0: In questo caso il limite puntuale di una successione di funzioni continue e limitate è una funzione discontinua e illimitata. (Si noti che il limite è …nito in ogni punto). Esempio 4.5 Sappiamo che l’insieme Q\ [0; 1] è numerabile, perciò possiamo 1 elencare i suoi elementi in una successione3 fxn gn=1 . Sia ora: fn (x) = 1 se x = x1 ; x2 ; x3 ; :::; xn 0 altrimenti. Si ha: fn (x) ! 1 se x 2 Q 0 altrimenti. Si noti che ogni funzione fn : [0; 1] ! R è continua tranne che in n punti; in particolare è Riemann integrabile. Invece la funzione limite f [0; 1] ! R è discontinua in tutti i punti e non è Riemann integrabile. 3 Non si tratterà di una successione monotona. Ad esempio, i suoi primi termini potrebbero essere: 0; 1; 1=2; 1=3; 2=3; 1=4; 3=4; 1=5; 2=5; ::: 26 Esempio 4.6 Sia fn : R ! R de…nita per n = 1; 2; 3; ::: da 1 1+ n fn (x) = jxj : Si ha: fn (x) ! jxj : 1 Notiamo che ogni fn è derivabile: fn0 (x) = 1 + n1 jxj n sgn(x), in particolare esiste fn0 (0) = 0 e si ha fn 2 C 1 (R), mentre il limite puntuale f non è derivabile in x = 0. Si ha f 2 C 0 (R) n C 1 (R) : La morale di questi esempi è: in generale la convergenza puntuale di una successione di funzioni non permette di a¤ermare che la funzione limite f abbia le “buone proprietà” delle singole fn . Per poter provare dei risultati che permettono di trasferire proprietà delle fn alla f è necessario introdurre e studiare una nozione più forte delle convergenza puntuale: la convergenza uniforme, che ora introduciamo. De…nizione 4.7 (Convergenza uniforme) Sia fn : I ! R per n = 1; 2; 3; ::: 1 con I R o in Rn . Si dice che la successione ffn gn=1 converge uniformemente in I alla funzione f : I ! R se sup jfn (x) x2I f (x)j ! 0 per n ! +1 ossia se 8" > 0 9n0 tale che n n0 =) jfn (x) f (x)j < " 8x 2 I: A titolo di confronto, notiamo che invece a¤ermare che fn ! f puntualmente in I signi…ca che 8x 2 I; 8" > 0 9n0 tale che n n0 =) jfn (x) f (x)j < ": Dal punto di vista logico, la di¤erenza sta tutta nella posizione del quanti…catore “8x 2 I”; nel caso della convergenza puntuale, a¤ermare che per ogni x e per ogni " esiste n0 tale che..., implicitamente signi…ca che il numero n0 può dipendere anche da x (oltre che da "); nel caso della convergenza uniforme invece l’ordine dei quanti…catori ci dice che n0 non dipende da x. Questo si traduce nel fatto che la distanza tra il gra…co di fn e quello di f diventa uniformemente piccolo; precisamente, tutto il gra…co di fn (x) in I è compreso nella striscia (f (x) "; f (x) + ") non appena n n0 . 1+1=n Esempio 4.8 La successione fn (x) = jxj converge uniformemente in [ 1; 1] a f (x) = jxj. (Questa a¤ ermazione sarà provata in un esempio successivo). Illustriamo il signi…cato geometrico di questa a¤ ermazione. Tracciamo per prima 27 cosa il gra…co di f insieme al gra…co delle prime fn : Ora tracciamo il gra…co di f (x) insieme a quello di f (x) + 0:1 e f (x) 0:1; ottenendo così una striscia in cui devono essere contenuti i gra…ci interi delle funzioni fn ; almeno per n abbastanza grande: f1 non sta nella striscia f2 non sta nella striscia f3 sta nella striscia f4 sta nella striscia, e così via p Esempio 4.9 La successione fn (x) = n jxjsgn(x) converge a 8 < 1 se x 2 (0; 1] 0 se x = 0 f (x) = : 1 se x 2 [ 1; 0): (come già visto nell’Esempio 4.3). Mostriamo che la convergenza non è uniforme. Come sopra, tracciamo per prima cosa il gra…co di f insieme al gra…co 28 delle prime fn : Ora tracciamo il gra…co di f (x) insieme a quello di f (x) + 0:1 e f (x) 0:1, ottenendo così una striscia in cui devono essere contenuti i gra…ci interi delle funzioni fn ; almeno per n abbastanza grande: f1 non sta nella striscia f3 non sta nella striscia f6 non sta nella striscia f10 non sta nella striscia e si capisce che anche aumentando l’indice n non è possibile che il gra…co intero sia contenuto nella striscia. Infatti il gra…co di ogni fn è continuo, perciò non può entrare nei due pezzi di striscia, che sono tra loro discosti. Si noti anche che: fn ! f uniformemente in I () kfn f kC 0 (I) ! 0: In altre parole, la norma C 0 (I) è la norma della convergenza uniforme. Si osservi tuttavia che la nozione di convergenza uniforme si può applicare anche 29 a funzioni discontinue. In altre parole qui stiamo usando la norma di C 0 (I) per calcolare la distanza tra due funzioni qualsiasi de…nite su I (e naturalmente tale distanza non sempre è …nita). Vediamo ora alcuni risultati che mostrano come per una successione di funzioni uniformemente convergente alcune buone proprietà delle fn si trasferiscano al limite f . Teorema 4.10 (Convergenza uniforme e continuità) Siano fn : I ! R, con I Rn , funzioni continue per n = 1; 2; 3:::; e supponiamo che fn ! f uniformemente in I. Allora f è continua in I. Dimostrazione. Proviamo che f è continua in un generico punto x 2 I. Scriviamo anzitutto jf (x) f (x)j jf (x) fn (x)j + jfn (x) fn (x)j + jfn (x) f (x)j ; con un n che ora sceglieremo. Per " > 0 …ssato, per de…nizione di convergenza uniforme esiste n0 tale che per ogni n n0 si ha jf (x) fn (x)j < ": In particolare allora si ha: jf (x) f (x)j " + jfn0 (x) fn0 (x)j + ": Poiché fn0 è continua, …ssato " > 0 esiste > 0 tale che jx jfn0 (x) fn0 (x)j < ": Allora per jx xj < si ha jf (x) f (x)j xj < =) 3"; e f è continua in x. Teorema 4.11 (Convergenza uniforme e limitatezza) Siano fn : I ! R, con I Rn , funzioni limitate per n = 1; 2; 3:::; e supponiamo che fn ! f uniformemente in I. Allora f è limitata in I. Dimostrazione. Fissato " = 1, per l’ipotesi di convergenza uniforme esiste n0 tale che per ogni n n0 è jfn (x) f (x)j < 1 per ogni x 2 I, perciò jf (x)j jfn0 (x) f (x)j + jfn0 (x)j < 1 + jfn0 (x)j : D’altro canto per ipotesi fn0 è limitata, perciò esiste K > 0 tale che jfn0 (x)j < K per ogni x 2 I, e jf (x)j < 1 + K per ogni x 2 I; perciò f è limitata. Ci limitiamo a enunciare anche il prossimo: Teorema 4.12 (Convergenza uniforme e integrabilità) Siano fn : [a; b] ! R, funzioni limitate e Riemann integrabili per n = 1; 2; 3:::; e supponiamo che fn ! f uniformemente in I. Allora f è (limitata e) Riemann integrabile in [a; b]. 30 E’interessante rileggere alla luce di questi teoremi gli esempi presentati in precedenza: negli esempi 4.2 e 4.3 una successione di funzioni continue converge a una funzione discontinua; nell’esempio 4.4 una successione di funzioni limitate converge a una funzione illimitata; nell’esempio 4.5 una successione di funzioni Riemann integrabili converge a una funzione non integrabile. Evidentemente in tutti questi esempi la convergenza non è uniforme. Si invita il lettore a rendersene conto ragionando sul gra…co delle funzioni e sul signi…cato geometrico di convergenza uniforme. Illustriamo ora un criterio che sarà utile a provare la completezza degli spazi di funzioni continue. Teorema 4.13 (Condizione di Cauchy per la convergenza uniforme) Siano fn : I ! R, con I Rn , per n = 1; 2; 3::: e supponiamo che valga la seguente condizione di Cauchy: 8" > 09n0 tale che 8n; m n0 ; 8x 2 I risulta jfn (x) fm (x)j < ": (4.1) Allora la successione fn converge uniformemente in I ad una certa funzione f : I ! R. Viceversa, se fn converge uniformemente in I ad una certa funzione f : I ! R; allora vale la (4.1). L’ipotesi del teorema si chiama appunto condizione di Cauchy per la convergenza uniforme, e si può scrivere anche così: 8" > 09n0 tale che 8n; m n0 ; 8x 2 I risulta kfn fm k1 < ": (4.2) Dimostrazione. Assumiamo che valga la (4.1). Allora per ogni x 2 I …ssato, 1 la successione reale ffn (x)gn=1 risulta di Cauchy. Quindi, per la completezza di R, fn (x) converge a un limite, che chiameremo f (x). Risulta così de…nita una funzione che è limite puntuale delle fn . Dobbiamo provare che è anche limite uniforme. Fissato " > 0 applichiamo l’ipotesi (4.1) e nella disuguaglianza jfn (x) fm (x)j < " passiamo al limite per m ! 1; poiché fm (x) ! f (x), per il teorema di permanenza del segno si ha: jfn (x) f (x)j " 8x 2 I: Quindi …ssato " > 0 esiste n0 tale che per ogni n n0 risulta jfn (x) f (x)j < " per ogni x 2 I, perciò fn ! f uniformemente, che è la tesi. Viceversa, se la successione converge uniformemente, cioè converge nella norma k k1 ; allora è di Cauchy in norma k k1 (stessa dimostrazione vista per provare che in uno spazio metrico una successione convergente è di Cauchy), quindi vale la (4.1). Possiamo ora provare il primo risultato fondamentale di completezza di uno spazio di funzioni: Teorema 4.14 Sia K Rn un insieme chiuso e limitato. Allora lo spazio 0 vettoriale normato C (K) (delle funzioni f : K ! R continue, con la norma k kC 0 (K) ) è completo, cioè è uno spazio di Banach. 31 Dimostrazione. Ricordiamo anzitutto che l’ipotesi K chiuso e limitato serve a garantire che le funzioni in C 0 (K) siano limitate (per il teorema di Weierstrass) e quindi la loro norma k kC 0 (K) sia …nita. 1 Sia ffn gn=1 C 0 (K) una successione di Cauchy in C 0 (K) , e proviamo 0 che converge in C (K). Dire che è di Cauchy nello spazio vettoriale normato C 0 (K) signi…ca dire che vale la (4.2), quindi la (4.1); perciò per il Teorema 1 4.13 ffn gn=1 converge uniformemente, cioè in norma k kC 0 (K) , a una certa f . D’altro canto, essendo limite uniforme di funzioni continue, per il Teorema 4.10 anche f 2 C 0 (K). Quindi fn ! f in C 0 (K), e C 0 (K) è completo. 4.2 Spazi di funzioni derivabili Vorremmo ora dimostrare che analoghi spazi di funzioni derivabili sono completi. Ragioniamo sullo spazio C 1 [a; b], che si può vedere come sottospazio vettoriale di C 0 [a; b]. Sappiamo che un sottoinsieme chiuso di uno spazio metrico completo è completo, quindi se mettiamo in C 1 [a; b] la norma k kC 0 [a;b] possiamo vedere C 1 [a; b] ; k kC 0 [a;b] come sottoinsieme dello spazio metrico completo C 0 [a; b] ; k kC 0 [a;b] . Se questo risulta chiuso, allora è completo. Non è così però, come mostra il prossimo 1 1+ n Esempio 4.15 Sia fn (x) = jxj 1; 2; 3; :::; con fn0 (x) = 1+ 1 n in [ 1; 1] : Si ha fn 2 C 1 [ 1; 1] per n = 1 jxj n sgn (x) per x 6= 0; fn0 (0) = 0: Risulta: fn (x) ! f (x) = jxj per x ! 1. Si veri…ca inoltre che questa convergenza è uniforme, infatti: max jfn (x) f (x)j = per simmetria x2[ 1;1] = max x2[0;1] Ora cerchiamo il massimo di g (x) = x g 0 (x) = 1 1+ 1 1 + n1 x max g (x) = g x2[0;1] = 1 n 1 x1+ n . 0 per n 1 1 + n1 1 1 + n1 1 xn 1 x1+ n : x n ! 1 = n 1 + n1 ! 1 n 1 + n1 32 n 1 1 1+ 1 ! 0: en 1 n ! Pertanto fn ! f uniformemente in C 0 [ 1; 1], ossia fn ! f in norma C 0 [ 1; 1] : Tuttavia il limite f non appartiene a C 1 [ 1; 1] (f (x) = jxj non è derivabile in 0), quindi C 1 [ 1; 1] non è un sottoinsieme chiuso di C 0 [ 1; 1]. Inoltre: poiché fn ! f in norma C 0 [ 1; 1] ; fn è di Cauchy in norma C 0 [ 1; 1] e dunque è di Cauchy anche in C 1 [ 1; 1] ; k kC 0 [ 1;1] , ma non converge in C 1 [ 1; 1] perché f non sta in questo spazio. Pertanto lo spazio completo. C 1 [ 1; 1] ; k kC 0 [ 1;1] non è Si presti attenzione al signi…cato dell’esempio precedente, che mostra due cose distinte: 1. Lo spazio vettoriale normato C 1 [ 1; 1] ; k kC 0 [ 1;1] non è completo. 2. Lo spazio C 1 [ 1; 1] ; k kC 0 [ 1;1] , visto come sottoinsieme dello spazio metrico C 0 [ 1; 1] ; k kC 0 [ 1;1] , non è chiuso. La seconda cosa è in un certo senso la giusti…cazione intuitiva della prima. Una successione di Cauchy in C 1 [ 1; 1] ; k kC 0 [ 1;1] è anche di Cauchy in C 0 [ 1; 1] ; k kC 0 [ 1;1] , pertanto in questo secondo spazio converge per- ché questo spazio è completo; il limite sta in C 0 [ 1; 1] ma non necessariamente in C 1 [ 1; 1]; in quest’ultimo caso abbiamo una successione di Cauchy in C 1 [ 1; 1] ; k kC 0 [ 1;1] ma non convergente in questo spazio. All’origine di questo problema sta il fatto che stiamo mettendo in C 1 [ 1; 1] la norma sbagliata: quella k kC 0 [ 1;1] , che dà un controllo sulla f ma non su f 0 . L’idea è che se vogliamo sperare che uno spazio vettoriale normato di funzioni sia completo, la norma deve controllare le proprietà importanti della funzione che determinano l’appartenenza allo spazio stesso: se stiamo studiando uno spazio di funzioni derivabili, a¢ nché sia completo sarà necessario mettere una norma che controlli anche la derivata; se studiamo uno spazio di funzioni integrabili, a¢ nché sia completo sarà necessario mettere una norma che controlli l’integrale, e così via. Facciamo anche la seguente ulteriore osservazione. Nell’esempio appena considerato, fn ! f uniformemente, ma fn0 (x) = 1+ 1 n 1 jxj n sgn (x) ! sgn (x) (per x 6= 0), e questa convergenza non è certamente uniforme, dal momento che le fn0 sono continue mentre il loro limite è discontinuo. Questo suggerisce che per conservare la derivabilità del limite della successione occorra richiedere la convergenza uniforme delle derivate. E’quanto a¤erma il prossimo teorema: Teorema 4.16 (Convergenza uniforme e derivabilità) Sia fn : [a; b] ! R, fn 2 C 1 [a; b] e supponiamo che: 1. La successione fn0 converge uniformemente in [a; b] a una certa funzione g. 33 2. La successione fn converge in almeno un punto x0 2 [a; b]. Allora: La successione fn converge uniformemente in [a; b] a una certa f 2 C 1 [a; b], 0 e f = g: Dimostrazione. Proviamo anzitutto che ffn g converge uniformemente in [a; b] mostrando che è soddisfatta la condizione di Cauchy per la convergenza uniforme (4.1). Per far questo applichiamo il teorema di Lagrange alla funzione fn fm sull’intervallo [x0 ; x] (dove x0 è il punto che compare nell’ipotesi 2, e x è qualsiasi punto in [a; b]). Esiste dunque un punto tn;m;x (cioè dipendente da n; m; x) in [x0 ; x] tale che fn (x) fm (x) = fn (x0 ) fm (x0 ) + (x x0 ) [fn0 (tn;m;x ) 0 fm (tn;m;x )] : Fissato " > 0; per la convergenza uniforme delle fn0 (e quindi la condizione di Cauchy soddisatta dalle fn0 ) esiste n0 tale che per ogni n; m n0 si ha jfn0 (tn;m;x ) 0 fm (tn;m;x )j < " per ogni x 2 [a; b] : Per l’ipotesi 2 (e quindi la condizione di Cauchy soddisfatta dalla successione numerica ffn (x0 )g), inoltre, esiste n1 tale che per ogni n; m n1 è jfn (x0 ) Quindi per ogni n; m jfn (x) fm (x0 )j < ": N = max (n0 ; n1 ) si ha fm (x)j < " + jx x0 j " " (1 + jb aj) per ogni x 2 [a; b] : Questo dimostra la condizione di Cauchy per la convergenza uniforme delle fn , perciò la successione fn converge uniformemente a una certa f; con f 2 C 0 [a; b] (perché limite uniforme di funzioni continue). Mostriamo ora che f è derivabile con derivata g. Fissato x 2 [a; b] qualunque e h opportunamente piccolo, consideriamo f (x + h) f (x) = [f (x + h) fn (x + h)]+[fn (x + h) fn (x)]+[fn (x) f (x)] : Applichiamo il teorema di Lagrange a fn su [x; x + h]; esisterà tn;x;h 2 [x; x + h] tale che fn (x + h) fn (x) = hfn0 (tn;x;h ) . 1 Per ogni x; h …ssato, la successione ftn;x;h gn=1 [x; x + h] è limitata, quindi per 1 il teorema di Bolzano-Weierstrass ammette una sottosuccessione ftkn ;x;h gn=1 convergente a un certo t 2 [x; x + h] : Mostriamo che allora fk0 n (tkn ;x;h ) ! g t : Infatti fk0 n (tkn ;x;h ) g t = fk0 n (tkn ;x;h ) 34 g (tkn ;x;h ) + g (tkn ;x;h ) g t : Ora: fk0 n (tkn ;x;h ) g (tkn ;x;h ) ! 0 per la convergenza uniforme di fn0 a g; g (tkn ;x;h ) g t ! 0 perché g è continua, in quanto limite uniforme delle fn0 continue. Passando al limite per n ! 1 nella f (x + h) f (x) = [f (x + h) fkn (x + h)] + [hfn0 (tn;x;h )] + [fkn (x) f (x)] si ha allora f (x + h) f (x) = hg t per un certo t 2 [x; x + h] : Dunque f (x + h) f (x) = g t ! g (x) per h ! 0; h perché per h ! 0 è t ! x; e come già ricordato g è continua. Perciò esiste f 0 = g. Già sappiamo che g è continua, perciò f 0 è continua, ossia f 2 C 1 [a; b]. Possiamo ora dimostrare il seguente risultato fondamentale: Teorema 4.17 Lo spazio C 1 [a; b] ; con la norma kf kC 1 [a;b] = kf kC 0 [a;b] + kf 0 kC 0 [a;b] è di Banach. 1 Dimostrazione. Sia ffn gn=1 una successione di Cauchy in C 1 [a; b] : Per 1 1 de…nizione di norma kf kC 1 [a;b] ; questo signi…ca che sia ffn gn=1 che ffn0 gn=1 soddisfano la condizione di Cauchy per la convergenza uniforme; pertanto esistono f; g 2 C 0 [a; b] tali che fn ! f uniformemente e fn0 ! g uniformemente in [a; b] : Per il teorema precedente, questo implica che f 2 C 1 [a; b] e f 0 = g; dunque kfn f kC 0 [a;b] ! 0 e kfn0 f 0 kC 0 [a;b] ! 0; ossia fn ! f in C 1 [a; b]. Questo risultato si può generalizzare a funzioni di classe C k anche in più variabili. De…niamo quindi con precisione gli spazi vettoriali normati classici di funzioni derivabili: De…nizione 4.18 (Spazi di Lagrange) Sia Rn un aperto limitato. Ricordiamo anzitutto la scrittura a multiindice per le derivate parziali di qualsiasi ordine di una funzione reale di n variabili: = ( 1 ; 2 ; :::; n ) ; dove i sono interi j j = 1 + 2 + ::: + n ; allora @ f (x) = @ 1 x1 0 e poniamo @j jf (x) : @x22 :::@xnn Per k = 1; 2; 3; ::: de…niamo: Ck = f: ! R : f 2 C0 e @ f 2 C0 35 8 con j j k : Poniamo kf kC k ( ) = kf kC 0 ( ) + k X X j=1 j j=j k@ f kC 0 ( ) : Osservazione 4.19 (Perché ?) Si noti che mentre lo spazio C 0 (K) è de…nito con K sottoinsieme chiuso e limitato di Rn , perché in base al teorema di Weierstrass questo è su¢ ciente a garantire la …nitezza della norma kf kC 0 (K) ; per calcolare le derivate parziali di f abbiamo bisogno di essere in un insieme aperto; partiamo perciò da un insieme aperto e limitato , la cui chiusura è un insieme chiuso e limitato; f si suppone de…nita e continua in ; le derivate parziali di f esistono in e si suppone si possano prolungare con continuità …no al bordo di ; a questo modo f e le @ f sono continue sul chiuso e limitato ; quindi kf kC k ( ) è …nita. Vale il seguente risultato: Teorema 4.20 Gli spazi C k sopra de…niti sono di Banach. Abbiamo dimostrato questo teorema per k = 1 e n = 1 (Teorema 4.17). La dimostrazione del teorema generale, ad ogni modo, presenta solo qualche complicazione notazionale in più, ma il nocciolo delle idee è già tutto nel teorema base che abbiamo dimostrato, perciò non aggiungeremo altri dettagli sulla dimostrazione. Segnaliamo anzi che il risultato precedente si estende senza di¢ coltà agli spazi di funzioni a valori vettoriali Ck ; Rm = f : ! Rm : f = (f1 ; f2 ; :::; fm ) con f1 ; f2 ; :::; fm 2 C k munito della norma kf kC k ( 4.3 ;Rm )= m X j=1 ; kfj kC k ( ) . Spazi di funzioni in…nitamente derivabili Completiamo il discorso sugli spazi C k con qualche osservazione sugli spazi di funzioni derivabili in…nite volte, che pure spesso si usano in analisi. De…nizione 4.21 Se Rn è un aperto limitato, de…niamo C1 = 1 \ Ck ; k=1 cioè lo spazio delle funzioni continue e con derivate di qualsiasi ordine continue su tutto . 36 Questo è uno spazio vettoriale, che non ha però una norma “naturale”. E’ chiaro infatti che qualunque norma k kC k ( ) è ben de…nita per le funzioni di questo spazio, ma nessuna di esse è su¢ ciente a “catturare” l’informazione sull’in…nita derivabilità. In altre parole, ci aspettiamo (ed in e¤etti è così) che lo spazio C 1 ; k kC k ( ) (comunque scelto un intero k) risulti uno spazio vettoriale normato non completo. De…nizione 4.22 Se C01 ( ) = f 2 C 1 Rn è un aperto (anche non limitato), de…niamo : 9K chiuso e limitato, K : f (x) = 0 8x 2 =K : Le funzioni di questo spazio si dicono di solito “funzioni C 1 a supporto compatto”; il supporto è l’insieme su cui la funzione è diversa da zero, e si richiede che esista un chiuso e limitato (che in Rn è sinonimo di “compatto”, termine che però non abbiamo mai usato) che fa da supporto ad f ; questo supporto può essere diverso da funzione a funzione. Poiché f e le sue derivate sono diverse da zero solo su un insieme chiuso e limitato, su cui sono continue, sono automaticamente limitate anche se fosse illimitato, perciò anche per le funzioni in C01 ( ) tutte le norme k kC k ( ) risultano …nite. Come per lo spazio C1 , però, lo spazio C01 ( ) ; k kC k ( ) è uno spazio vettoriale normato non completo. Si noti che una funzione C01 ( ) in particolare dev’essere C 1 ; quindi sulla frontiera del supporto, cioè là dove comincia ad annullarsi, deve annullarsi f insieme a tutte le sue derivate. Che esistano funzioni di questo tipo non è ovvio. Vale la pena quindi fare un Esempio 4.23 Sia f : R ! R così de…nita: ( 1 e x2 1 per x 2 ( 1; 1) f (x) = 0 altrove. 1 La funzione e x2 1 si annulla con velocità esponenziale per x ! 1 e per x ! 1+ , e lo stesso fanno le sue derivate di ogni ordine. Perciò la funzione si raccorda in modo C 1 con la costante zero nei punti 1, ed f risulta C 1 (R), con supporto in [ 1; 1]. Perciò f 2 C01 (R) o C01 (a; b) per ogni intervallo (a; b) [ 1; 1]. 37 4.4 Funzioni Lipschitziane Introduciamo uno spazio di funzioni che pure useremo talvolta, ed è uno spazio intermedio tra C 0 e C 1 . De…nizione 4.24 Sia Lip Rn un aperto limitato. Poniamo: n o = f : ! R : jf jLip( ) < 1 , con jf jLip( ) = sup x;y2 ;x6=y jf (x) jx f (y)j , yj e kf kLip( ) = kf kC 0 ( ) + jf jLip( ) : Le funzioni in Lip (dette “Lipschitziane in ”) sono automaticamente è uno spazio vettoriale, normato con la norma continue; lo spazio Lip kf kLip( ) . Si può dimostrare4 che: Teorema 4.25 Lo spazio Lip con la norma kf kLip( ) è di Banach. Rispetto alle funzioni continue, le funzioni lipschitziane in aggiunta hanno rapporto incrementale limitato. Per esempio, in una variabile queste sono funzioni che non possono avereppunti a tangente verticale: la funzione jxj è Lipschtziana in [ 1; 1] ; mentre 3 x non lo è. Le funzioni lipschitziane non sono necessariamente derivabili, come mostra già l’esempio jxj, tuttavia si può dimostrare (Teorema di Rademacher) che sono derivabili “in quasi ogni punto”. A questo stadio del corso però non è ancora possibile spiegare il signi…cato preciso di questa a¤ermazione. Ci ritorneremo in seguito. Si noti invece che le funzioni C 1 sono certamente lipschitziane, come conseguenza del teorema di Lagrange. Infatti per ogni x; y 2 ; x 6= y; esiste un punto t 2 [x; y] (dove il simbolo [x; y] in questo caso non indica un intervallo sulla retta, ma il segmento di estremi x; y in ) tale che f (x) f (y) = (x y) rf (t) ; da cui jf (x) f (y)j jx yj jrf (t)j K jx yj ; in quanto jrf j è limitato in perché f 2 C 1 . Come anticipato, quindi, Lip è uno spazio di funzioni intermedio tra C 0 e C1 ; di funzioni “più che continue e quasi derivabili”. 4 Una traccia di questa dimostrazione sarà fornita nell’Esercizio 6.31. 38 5 Il teorema delle contrazioni in spazi metrici e le sue applicazioni 5.1 Teorema delle contrazioni Torniamo ora al contesto astratto degli spazi metrici, per presentare un teorema, abbastanza semplice nella dimostrazione ma profondo per le conseguenze. Lo utilizzeremo in seguito per dimostrare risultati di esistenza e unicità per problemi di¤erenziali. Teorema 5.1 (Teorema delle contrazioni, di Banach-Caccioppoli) (X; d) uno spazio metrico completo, e sia 5 Sia f :X!X una contrazione di X in se stesso, ossia una funzione tale che, per un certo 2 (0; 1) sia d (f (x) ; f (y)) d (x; y) 8x; y 2 X: Allora f ammette uno e un solo punto …sso, cioè elemento x 2 X tale che f (x) = x: La funzione f si può vedere come una trasformazione geometrica dello spazio X in sè. Si dice contrazione perché avvicina i punti: la distanza tra i punti trasformati f (x) e f (y) è sempre strettamente minore della distanza di x da y, poiché < 1. (Tranne il caso in cui x = y; ovviamente). Il punto x si chiama punto …sso, o punto unito, perché non viene spostato da f . Il teorema garantisce l’esistenza e unicità del punto …sso di f . Si tratta del primo di una serie di teoremi di punto …sso dell’analisi funzionale, che in contesti di varia e crescente astrazione garantiscono sotto varie ipotesi l’esistenza (e solo talvolta anche l’unicità) di punti …ssi. Questi risultati servono a provare teoremi di esistenza per problemi, generalmente non lineari, per equazioni di¤erenziali o integrali. Dimostrazione. Proviamo l’esistenza del punto …sso. Sia x0 2 X un punto qualsiasi, e consideriamo la successione delle iterate di f a partire da x0 ; ossia la successione: x1 = f (x0 ) x2 = f (x1 ) ::: xn+1 = f (xn ) ::: 5 Risultato ottenuto da S. Banach nel 1922 e R. Caccioppoli nel 1939. 39 1 Proviamo che la successione fxn gn=1 è di Cauchy. Anzitutto si ha, per de…nizione di xn e per l’ipotesi su f : d (xj ; xj+1 ) = d (f (xj 1) ; f (xj )) d (xj 1 ; xj ) e quindi iterativamente j d (xj ; xj+1 ) d (x0 ; x1 ) per ogni j: Allora, per ogni n; m (con n > m) si ha, per la disuguaglianza triangolare d (xn ; xm ) n X d (xj ; xj 1) j=m+1 n X j d (x0 ; x1 ) j=m+1 = d (x0 ; x1 ) m+1 nX m 1 m+1 j d (x0 ; x1 ) j=0 1 essendo 2 (0; 1). Ne segue che d (xn ; xm ) ! 0 per n; m ! 1: Dunque la 1 successione fxn gn=1 è di Cauchy, perciò per la completezza di X esiste x tale che xn ! x. Poiché f : X ! X è continua (perché è una contrazione) sarà f (xn ) ! f (x) : Allora passando al limite nell’identità xn+1 = f (xn ) si ha x = f (x) , ed è provata l’esistenza del punto …sso. Proviamo l’unicità. Se esistono x; y tali che x = f (x) ; y = f (y) allora si ha: d (x; y) = d (f (x) ; f (y)) da cui (1 ) d (x; y) d (x; y) 0; perciò d (x; y) = 0 e x = y, il che prova l’unicità. Esempio 5.2 Sia X = C 0 [0; 1]. Sappiamo che è uno spazio metrico completo con k kC 0 [0;1] . Sia f :X!X Z 1 t f (x) (t) = cos [x (s)] ds: 2 0 Detto in parole, la funzione continua x (t) viene trasformata da f nella funzione integrale indicata. La funzione integrale è continua, quindi e¤ ettivamente f : X ! X: Proviamo che è una contrazione. Poiché jcos cos j 40 j j si ha jf (x) (t) Z 1 t f (y) (t)j = cos [x (s)] cos [y (s)] ds 2 0 Z t 1 jcos [x (s)] cos [y (s)]j ds 2 0 Z t 1 jx (s) y (s)j ds 2 0 Z 1 t t kx ykC 0 [0;1] ds = kx ykC 0 [0;1] ; 2 0 2 perciò 1 kx ykC 0 [0;1] ; 2 e f è una contrazione di X in sé. Per il teorema precedente, esiste dunque una e una sola funzione x (t) 2 C 0 [0; 1] per cui risulti Z 1 t x (t) = cos [x (s)] ds per ogni t 2 [0; 1] : 2 0 kf (x) f (y)kC 0 [0;1] Si noti che determinare esplicitamente questa x non è banale. Osservazione 5.3 Non ostante l’ambientazione astratta, questo teorema di esistenza ha un aspetto costruttivo: il punto …sso è ottenuto come limite di una successione che, almeno in teoria, si può sempre pensare di costruire, e in questo caso o¤ re anche un algoritmo di calcolo approssimato della soluzione e¤ ettiva. In molti casi in realtà la forma esplicita dell’iterata di f è così complicata da rendere questo procedimento inutilizzabile. Tuttavia vedremo che quest’idea della successione approssimante può essere e¤ ettivamente utile. 5.2 Applicazioni al problema di Cauchy per sistemi di equazioni di¤erenziali ordinarie Consideriamo un sistema di n equazioni di¤erenziali ordinarie del prim’ordine in forma normale, ossia: 8 0 y = f1 (t; y1 ; y2 ; :::; yn ) > > < 10 y2 = f2 (t; y1 ; y2 ; :::; yn ) (5.1) ::: > > : 0 yn = fn (t; y1 ; y2 ; :::; yn ) dove le incognite sono le n funzioni yi (t) ; reali di variabile reale, e sono assegnate n funzioni fi : ! R, con Rn+1 . Osserviamo che si può riscrivere in questa forma anche una singola equazione di¤erenziale ordinaria di ordine n in forma normale: y (n) = F t; y; y 0 ; y 00 ; :::; y (n 41 1) : (5.2) E’su¢ ciente infatti porre: 8 0 y1 = y2 > > > > < y20 = y3 ::: > > y0 = yn > > : n0 1 yn = F (t; y1 ; y2 ; :::; yn ) col che l’equazione (5.2) ha assunto la forma di sistema di n equazioni del 1 ordine. Questa procedura funziona anche con sistemi di equazioni di ordine superiore al primo, scritte in forma normale. Consideriamo, ad esempio, il sistema di equazioni che regge la dinamica di un punto materiale mobile nello spazio R3 in base alla legge di Newton. Da F = ma; se (x; y; z) (t) indica la posizione del punto materiale all’istante t e la forza F dipende dal tempo, dalla posizione e dalla velocità del punto, si ha (ponendo f = F =m) 8 00 < x = f1 (t; x; y; z; x0 ; y 0 ; z 0 ) y 00 = f2 (t; x; y; z; x0 ; y 0 ; z 0 ) : 00 z = f3 (t; x; y; z; x0 ; y 0 ; z 0 ) sistema di 3 equazioni del 2 nella forma (5.1) così: 8 0 y > > > 10 > y > > < 20 y3 y40 > > > > y0 > > : 50 y6 ordine in forma normale, che può riscriversi ancora = y2 = f1 (t; y1 ; y2 ; y3 ; y4 ; y5 ; y6 ) = y4 = f2 (t; y1 ; y2 ; y3 ; y4 ; y5 ; y6 ) = y6 = f3 (t; y1 ; y2 ; y3 ; y4 ; y5 ; y6 ) : Tutto ciò per ricordare che i sistemi di equazioni di¤erenziali ordinarie del prim’ordine costituiscono un quadro concettuale entro cui si può studiare una varietà di problemi di¤erenziali. A sua volta, un sistema (5.1) si può scrivere in forma compatta con notazioni vettoriali: y 0 = f t; y dove ora f è una funzione vettoriale di variabile reale. Come è noto, un sistema di¤erenziale ha in generale in…nite soluzioni, mentre possiamo sperare che abbia un’unica soluzione un problema di Cauchy associato al sistema, ossia y 0 = f t; y y (t0 ) = y 0 (5.3) A¢ nché il problema abbia senso, la funzione f dev’essere almeno de…nita e continua in un aperto Rn+1 contenente 42 t0 ; y 0 . Risolvere il problema di Cauchy (5.3) signi…ca determinare un intorno I di t0 in R e una funzione y2 C 1 (I; Rn ) per cui risulti y 0 (t) = f t; y (t) per ogni t 2 I; e sia soddisfatta la condizione iniziale. In particolare I dovrà essere abbastanza piccolo da far sì che t; y (t) 2 per ogni t 2 I, motivo per cui ci si aspetta una soluzione “in piccolo”, cioè locale, del problema di Cauchy. Il risultato che vale in proposito è il seguente: Teorema 5.4 (di esistenza e unicità in piccolo) Sia f : ! Rn con n+1 aperto di R ; f continua in e localmente lipschitziana in rispetto a y; uniformemente rispetto a t, il che signi…ca che per ogni t0 ; y 0 un intorno U di t0 ; y 0 f t; y 1 contenuto in f t; y 2 Allora per ogni t0 ; y 0 2 1 2 esistono e una costante K tale che K y1 y2 8 t; y 1 ; t; y 2 2 U: esiste un intorno I = [t0 ; t0 + ] ed esiste una n funzione y2 C (I; R ) soluzione del problema (5.3). Inoltre la soluzione è unica nel senso che coincide con qualunque altra eventuale soluzione nell’intervallo in cui sono de…nite entrambe. Notiamo che le ipotesi su f sono abbondantemente soddisfatte se ad esempio f 2 C 1 ( ; Rn ). Dimostrazione. La dimostrazione si articola in vari passi. 1. Per prima cosa riformuliamo il problema di Cauchy sotto forma di equazione integrale. Se y2 C 1 (I; Rn ) risolve il problema (5.3), allora integrando ambo i membri in (t0 ; t) possiamo scrivere6 : y (t) = y 0 + Z t t0 f s; y (s) ds per ogni t 2 [t ;t + ]: (5.4) Viceversa, se una funzione y2 C 0 (I; Rn ) risolve (5.4), la funzione integranda f s; y (s) risulta continua per composizione di funzioni continue, dunque la funzione integrale risulta derivabile, dunque anche il primo membro y (t) risulta derivabile e derivando ambo i membri rispetto a t troviamo y 0 (t) = f t; y (t) per ogni t 2 [t ; t + ], ossia la y risolve l’equazione. Di più, essendo y 0 uguale alla funzione continua f t; y (t) , in realtà y2 C 1 (I; Rn ). In…ne, ancora 6 Stiamo usando l’integrale di una funzione vettoriale di variabile reale, de…nita ovviamente da: Z b (F1 (s) ; F2 (s) ; :::; Fn (s)) ds a = Z b F1 (s) ds; a Z b F2 (s) ds; :::; a 43 Z b Fn (s) ds : a dalla (5.4) per t = t0 leggiamo che y(t0 ) = y 0 , e anche la condizione iniziale è soddisfatta. Possiamo quindi concludere: y 2 C 0 (I; Rn ) risolve (5.4) , y 2 C 1 (I; Rn ) risolve (5.3). Nel seguito proveremo quindi esistenza e unicità della soluzione dell’equazione integrale. 2. Ambientiamo ora l’equazione integrale che vogliamo risolvere in un quadro funzionale più preciso. Fissate le condizioni iniziali t0 ; y 0 2 ; scegliamo un intorno di t0 ; y 0 contenuto in = e poniamo n ; del tipo: t; y : jt t0 j a; y y0 b o M = max f t; y ; L = costante di Lipschitz di f in : De…niamo ora X= y 2 C 0 [t0 ; t0 + ] : y y0 C 0 [t0 ;t0 + ] b con a da scegliersi in seguito. Si osservi che X è un sottoinsieme chiuso (precisamente: una sfera chiusa) dello spazio C 0 [t0 ; t0 + ], quindi X è uno spazio metrico completo, per il Teorema 3.17. 3. Mostriamo che è possibile scegliere su¢ cientemente piccolo in modo che la funzione F de…nita in X da: Z F y = y0 + f s; y (s) ds t0 risulti una contrazione di X in sè. Si osservi che risolvere l’equazione integrale signi…ca trovare y per cui sia y= F y ; cioè trovare un punto …sso di F: (a) Sia y2 X; allora F y (t) y0 Z F y y0 t f s; y (s) ds t0 M jt quindi C 0 [t0 M ; ;t0 + ] perciò F y 2 X se M Sotto quest’ipotesi è ben de…nita F : X ! X. 44 b: t0 j ; (b) Siano y 1 ; y2 2 X; allora F y 1 (t) Z F y 2 (t) t t0 Z t t0 per l’ipotesi di Lipschitzianità Z t L y 1 (s) y 2 (s) ds f s; y 1 (s) f s; y 1 (s) L y1 t0 y2 f s; y 2 (s) ds f s; y 2 (s) C 0 [t0 ;t0 + ] jt ds t0 j quindi F y1 F y2 C 0 [t0 ;t0 + ] L y1 y2 C 0 [t0 ;t0 + ] ; perciò F è una contrazione di X in sé purché L < 1: E’su¢ ciente scegliere allora = min b 1 ; M 2L per garantire che sullo spazio X de…nito da questo la F sia una contrazione. Sotto quest’ipotesi esiste uno e un solo y2 X punto …sso di F; ossia una e una sola soluzione dell’equazione integrale. 4. Unicità. Due soluzioni del problema di Cauchy, cioè y 1 de…nita in [t0 1 ; t0 + 1 ] e y 2 de…nita in [t0 2 ; t0 + 2 ], sarebbero due punti …ssi di F sullo spazio X de…nito da = min ( 1 ; 2 ) ; ma per il teorema delle contrazioni il punto …sso è unico. Quindi sull’intervallo comune di de…nizione le due soluzioni devono coincidere. Osservazione 5.5 E’ istruttivo ri‡ettere sui vari ingredienti coinvolti nella dimostrazione precedente. 1. Abbiamo applicato il teorema delle contrazioni allo spazio metrico completo X: Si osservi che X non è uno spazio vettoriale normato, ma una sfera chiusa entro uno spazio vettoriale normato completo, perciò è uno spazio metrico completo. Questo mostra che per applicare il teorema delle contrazioni in questa dimostrazione è necessario conoscere il teorema al livello di astrazione degli spazi metrici; un teorema analogo in spazi vettoriali normati non basterebbe. 2. Abbiamo sfruttato la completezza di C 0 ([a; b] ; Rn ), risultato che è stato ottenuto mediante lo studio delle proprietà della convergenza uniforme delle successioni di funzioni e fondandosi sulla completezza di R: 3. Si è utilizzata la teoria classica dell’integrale di Riemann (in particolare il teorema fondamentale del calcolo integrale all’interno della teoria di Riemann) per provare l’equivalenza tra soluzione del problema di Cauchy e soluzione dell’equazione integrale. 45 Si tratta quindi di un insieme di ingredienti astratti e concreti, alcuni molto classici (19 sec.) altri più moderni (inizio 20 sec.). Osservazione 5.6 (Linee integrali di un campo vettoriale) Una classica interpretazione del teorema di esistenza e unicità per il problema di Cauchy, che può valer la pena di puntualizzare, riguarda le linee integrali di un campo vettoriale. Supponiamo, per …ssare le idee, di avere un campo di forze F (x; y; z) de…nito e continuo in un certo aperto A R3 . Una linea integrale del campo vettoriale passante per il punto P0 2 A è un arco di curva regolare r: [t0 ; t 0 + ] ! R3 tale che r (t0 ) = P0 e per ogni t 2 [t0 ; t0 + ] risulta tangente al campo vettoriale, ossia tale che r0 (t) = F (r (t)) : Il teorema di esistenza e unicità a¤ erma che per ogni (t0 ; P0 ) esiste una e una sola curva con queste caratteristiche, de…nita almeno in piccolo. La condizione di regolarità della curva, cioè jr0 (t)j = 6 0 è veri…cata se il campo stesso F (x; y; z) non si annulla nella regione considerata. Il teorema di esistenza e unicità locale appena dimostrato è solo il punto di avvio della teoria generale dei sistemi di equazioni di¤erenziali ordinarie. Si apre ora la questione di provare risultati di esistenza e unicità in grande, risultati di prolungabilità, di dipendenza continua delle soluzioni dagli ingredienti del problema... Non ci occuperemo tuttavia di questi aspetti, in quanto il nostro obiettivo non è sviluppare lo studio delle equazioni di¤erenziali ordinarie ma piuttosto mostrare il ruolo che giocano in questa teoria gli strumenti di analisi funzionale illustrati …nora. Piuttosto, ci interessa mostrare come gli stessi metodi matematici possano essere utili a risolvere problemi diversi. E’ quello che ora esempli…cheremo. 5.3 5.3.1 Equazioni integrali di Fredholm Equazione integrale di Fredholm di seconda specie in C 0 [a; b] Abbiamo visto che per applicare il teorema delle contrazioni alla dimostrazione del teorema di esistenza e unicità per un problema di Cauchy è stato utile riformulare il problema sotto forma di equazione integrale. Le equazioni integrali compaiono in vari contesti della matematica e delle sue applicazioni, ed il teorema delle contrazioni consente di risolvere altri problemi in questo contesto. Vogliamo qui dare qualche cenno a questo argomento, per illustrare meglio la portata dei metodi matematici …n qui sviluppati. Segnaliamo anche che fu proprio lo studio approfondito delle equazioni integrali compiuto nei primi anni del 1900 da parte di Fredholm, Hilbert e altri matematici, a fornire uno dei maggiori impulsi iniziali allo sviluppo della nascente analisi funzionale. 46 De…nizione 5.7 Si dice equazione di Fredholm (di seconda specie) un’equazione integrale del tipo Z b f (x) k (x; y) f (y) dy = g (x) (5.5) a dove l’incognita è la funzione f; mentre il nucleo k e il termine noto g sono assegnati. Segnaliamo per completezza che si dice equazione di Fredholm (di prima specie) un’equazione integrale del tipo Z b k (x; y) f (y) dy = g (x) : a Pur essendo “più facile da scrivere” l’equazione di prima specie è molto più di¢ cile da risolvere, e non ne parleremo. Mettiamoci nel seguente quadro funzionale. Assumiamo 2 k 2 C 0 [a; b] ; g 2 C 0 [a; b] ; de…niamo l’operatore T : C 0 [a; b] ! C 0 [a; b] Z b T f (x) = g (x) + k (x; y) f (y) dy: a Allora risolvere l’equazione (5.5) è equivalente a trovare un punto …sso di T . Cominciamo a mostrare che e¤ettivamente T porta lo spazio C 0 [a; b] in se stesso. La funzione g è assunta continua, quindi si tratta di mostrare la continuità della funzione: Z b x 7! Si ha: Z b k (x1 ; y) f (y) dy a Z k (x; y) f (y) dy: a b k (x2 ; y) f (y) dy = Z b [k (x1 ; y) k (x2 ; y)] f (y) dy a a Z a b jk (x1 ; y) kf kC 0 [a;b] Z a k (x2 ; y)j jf (y)j dy b jk (x1 ; y) k (x2 ; y)j dy: Si tratta ora di sfruttare il fatto che la funzione k (x; y) essendo continua in 2 [a; b] è anche uniformemente continua 7 , in particolare …ssato " > 0 esiste > 0 tale che jx1 x2 j < =) jk (x1 ; y) k (x2 ; y)j < " per ogni y 2 [a; b] . 7 La nozione di uniforme continuità non è stata discussa in precedenza. Si rimanda per un breve approfondimento a [4, Cap.6, §11.2] e [5, Cap.3, §9.1.]. 47 Allora si ha Z b k (x1 ; y) f (y) dy Z a b k (x2 ; y) f (y) dy < " (b a) kf kC 0 [a;b] a purché jx1 x2 j < , il che dimostra che T f 2 C 0 [a; b]. Per provare sotto che ipotesi T è una contrazione consideriamo invece: Z b Z b k (x; y) f1 (y) dy k (x; y) f2 (y) dy jT f1 (x) T f2 (x)j = a a Z a perciò b jk (x; y)j jf1 (y) kT f1 f2 (y)j dy T f2 kC 0 [a;b] kf1 Pertanto T è una contrazione se sup x2[a;b] kf1 f2 kC 0 [a;b] Z f2 kC 0 [a;b] sup x2[a;b] Z a Z a b jk (x; y)j dy b jk (x; y)j dy: b jk (x; y)j dy < 1: a (5.6) Facendo uso del teorema delle contrazioni otteniamo dunque il seguente risultato: 2 Teorema 5.8 Sia k 2 C 0 [a; b] 0 soddisfacente (5.6). Allora per ogni g 2 C [a; b] esiste una e una sola f 2 C 0 [a; b] soddisfacente l’equazione integrale (5.5). 5.3.2 Il metodo della serie di Neumann e l’approssimazione di Born Formulato così, questo è solo un risultato astratto di esistenza. Tuttavia, come abbiamo già accennato, dalla dimostrazione del teorema delle contrazioni si può estrarre un algoritmo di costruzione della soluzione. Illustriamo questo procedimento, che permette di introdurre su questo esempio speci…co alcune idee di portata più generale. Sia: Z b Kf (x) = k (x; y) f (y) dy: a Abbiamo già visto che Kf 2 C 0 [a; b] se f 2 C 0 [a; b] ; in altre parole K : C 0 [a; b] ! C 0 [a; b] è un operatore tra quesi due spazi, che risulta anche lineare8 . Indicando con I : C 0 [a; b] ! C 0 [a; b] I : f 7! f 8 Ossia K ( 1 f1 + 2 f2 ) = 1 Kf1 + 2 Kf2 per ogni operatori lineari diremo qualcosa di più in seguito. 48 1; 2 2 R e f1 ; f2 2 C 0 [a; b]. Di l’operatore identità, l’equazione (5.5) si può riscrivere in forma operatoriale: (I K) f = g con g assegnato e f incognita. Il problema è dunque invertire l’operatore 1 (I K) ; cioè ottenere f = (I K) g. Il teorema che abbiamo dimostrato si può leggere dicendo che sotto la condizione (5.6), cioè se (I K) è una piccola perturbazione dell’identità, sappiamo invertire (I K). Ricordiamo ora come procede la dimostrazione del teorema di punto …sso. Abbiamo scelto un elemento iniziale qualsiasi, f0 2 C 0 [a; b] e abbiamo costruito le iterate dell’operatore T f = g + Kf: Quindi, sfruttando la linearità dell’operatore K, f1 = T f0 = g + Kf0 f2 = T f1 = g + K (g + Kf0 ) = g + Kg + K 2 f0 f3 = T f2 = g + K g + Kg + K 2 f0 = g + Kg + K 2 g + K 3 f0 ::: ! n X1 fn = g + Kg + K 2 g + ::: + K n 1 g + K n f0 = K k g + K n f0 : k=0 Sappiamo che il punto …sso di T è " f = lim fn = lim n!1 n!1 n X1 k K g k=0 ! n # + K f0 : D’altro canto sappiamo che jKf0 (x)j kf0 kC 0 [a;b] ; quindi kKf0 kC 0 [a;b] kf0 kC 0 [a;b] e iterando n n kK f0 kC 0 [a;b] kf0 kC 0 [a;b] ! 0; pertanto la soluzione dell’equazione integrale è: f = lim n!1 n X1 Kkg = 1 X K n g: n=0 k=0 dove questa serie, detta serie di Neumann, converge nello spazio di Banach C 0 [a; b]. Si osservi che il risultato ottenuto si può riscrivere nella forma (I K) 1 g= 1 X K n g; n=0 con una forte analogia formale con la serie geometrica! Si ricordi comunque che il simbolo K n g indica la composizione n volte dell’operatore K; applicata 49 a g, ossia l’iterata n-esima di g mediante K; un oggetto solitamente di¢ cile da calcolare in modo esplicito per n grande, ma che almeno in certi casi si può ragionevomente calcolare o approssimare per i primi valori di n. L’utilizzo di una somma parziale di una serie di Neumann per approssimare la soluzione dell’equazione integrale viene detta approssimazione di Born. Esplicitamente, per il nostro operatore K si ha: g + Kg + K 2 g + ::: (x) = Z b Z = g (x) + k (x; y) g (y) dy + b k (x; y) a a Z b k (y; z) g (z) dzdy + ::: a Poiché la convergenza della serie di Neumann alla soluzione cercata, in base al teorema delle contrazioni, avviene nello spazio metrico C 0 [a; b] ; la convergenza della somma parziale alla soluzione che cerchiamo sarà uniforme in [a; b], una buona notizia. 5.3.3 Applicazione a un modello di di¤usione Consideriamo il fenomeno della di¤usione del calore in una sbarra metallica, rappresentata dall’intervallo [0; 1]. Se la temperatura è …ssata agli estremi, una sorgente di calore f (x) è distribuita lungo la lunghezza della sbarra, e la sbarra è termicamente isolata sulla sua super…cie laterale, la temperatura u (x) in stato stazionario soddisferà u00 (x) = f (x) per x 2 (0; 1) u (0) = T0 ; u (1) = T1 ; (5.7) problema che si può risolvere esplicitamente con i metodi visti in Analisi 2. Se l’isolamento laterale non è perfetto, la sbarra scambierà calore con l’ambiente anche per tutta la sua lunghezza. In questo caso, assumendo T = 0 la temperatura esterna, la u in condizioni stazionarie soddisferà l’equazione modi…cata u00 (x) + q (x) u (x) = f (x) per x 2 (0; 1) u (0) = T0 ; u (1) = T1 ; (5.8) dove q (x) è un coe¢ ciente noto che descrive la conduzione di calore verso l’esterno. Non appena q (x) è una funzione non costante, i metodi elementari studiati in analisi 2 non consentono in generale di integrare l’equazione e i risultati teorici sulle equazioni lineari studiati in analisi 2 garantiscono l’esistenza di soluzioni per l’equazione di¤erenziale e per un problema di Cauchy ad esso relativo, ma non per un problema ai limiti, come questo è. L’idea è allora vedere il problema (5.8) come una perturbazione del problema (5.7), che sappiamo risolvere esplicitamente, e utilizzare i metodi visti in precedenza per esprimere la soluzione, esatta o approssimata, di (5.8). Mostriamo in dettaglio come si può procedere, in vari passi. 1. Anzitutto è utile riscrivere il problema in una forma che abbia condizioni agli estremi nulle. Introducendo la funzione lineare w (x) = (1 x) T0 + xT1 50 si vede che se u risolve (5.8) allora v (x) = u (x) w (x) risolve v 00 (x) + q (x) v (x) = f (x) + q (x) w (x) v (0) = 0; v (1) = 0; g (x) per x 2 (0; 1) (5.9) quindi il problema è ricondotto ad un problema analogo, con dove l’equazione è simile ma ha un diverso termine noto, e le condizioni agli estremi sono nulle. 2. Adesso cominciamo col risolvere esplicitamente il problema nel caso q (x) 0. Il problema v 00 (x) = f (x) per x 2 (0; 1) v (0) = 0; v (1) = 0; si può integrare direttamente, così: Z x 0 v (x) = f (t) dt + a 0 Z x Z t v (x) = f ( )d 0 dt + ax + b: 0 Imponendo le condizioni agli estremi: 0 = v (0) = b 0 = v (1) = a= Z 1 0 Z Z 0 t 1 Z f ( )d dt + a; perciò 0 f ( )d dt 0 e la soluzione del problema è: Z x Z t v (x) = f ( )d 0 t dt + x 0 Z 0 1 Z t f ( )d dt: 0 Vogliamo scriverla in forma più leggibile, trasformandola in un’espressione del tipo Z 1 v (x) = k (x; t) f (t) dt 0 cioè con la soluzione espressa da un operatore integrale che agisce sul termine noto. Perciò procediamo così, scambiando l’ordine di integrazione negli integrali 51 iterati: v (x) = x Z 1 Z Z t f ( )d dt 0 0 0<t<1;0< <t)0< <1; <t<1 = Z 1 f( ) 0 = Z 1 Z Z 1 xdt d f ( ) [x (1 )] d t f ( )d dt = 0 0 0<t<x;0< <t)0< <x; <t<x x 0 Z x 0 Z x f( ) Z f ( ) (x x dt d )d 0 spezzando l’intervallo di integrazione del primo integrale per sempli…carlo col secondo Z x Z 1 = f ( ) [x (1 ) (x )] d + f ( ) [x (1 )] d 0 = Z x f ( ) [ (1 x)] d + 0 = Z Z x 1 f ( ) [x (1 )] d x 1 f ( ) k (x; ) d 0 dove k (x; ) = (1 x (1 x) se 0 ) se x x 1: (5.10) Gra…co di k (x; ) . Possiamo concludere questa prima discussione a¤ermando che la soluzione del problema con q (x) 0 e termine noto f (x) è assegnata dall’operatore 52 integrale Kf (x) = Z 1 f ( ) k (x; ) d 0 con k come in (5.10). 3. Se ora v è soluzione del problema v 00 (x) + q (x) v (x) = g (x) per x 2 (0; 1) v (0) = 0; v (1) = 0; v sarà anche soluzione di v 00 (x) = g (x) q (x) v (x) per x 2 (0; 1) v (0) = 0; v (1) = 0; quindi risulterà v = K (g qv) = Kg K (qv) dove ge = Kg è una funzione nota, e Z 1 e (x) K (qv) (x) = f ( ) [k (x; ) q ( )] d = Kf 0 e è un nuovo operatore integrale, con nucleo e dove K k (x; ) = k (x; ) q ( ). Il problema che ci interessa si è dunque trasformato nell’equazione integrale di Fredholm di seconda specie e v = ge + Kv; a cui possiamo applicare il Teorema 5.8. Occorre garantire che valga la condizione Z 1 sup jk (x; ) q ( )j d < 1: x2[0;1] Stimiamo Z 0 1 jk (x; ) q ( )j d quindi calcoliamo Z 1 Z jk (x; )j d = 0 0 x (1 x) d + 0 = (1 kqkC 0 [a;b] x) 1 2 = x 2 x2 +x 2 " 3 Z 0 x (1 x 2 (1 ) 2 x2[0;1] = x) x 1 = 2 8 53 2 = (1 x) x 3 2x + x (1 jk (x; )j d ; )d #1 e poiché max 1 1 2 x +x Z (1 x) x 2 x2 (1 x) +x 2 2 si ha sup x2[0;1] Z 1 0 jk (x; ) q ( )j d 1 kqkC 0 [a;b] 8 e questo è < 1 purché risulti kqkC 0 [0;1] < 8: In base al Teorema 5.8 possiamo allora concludere che: Teorema 5.9 Se q 2 C 0 [0; 1] con kqkC 0 [0;1] < 8 allora per ogni f 2 C 0 [0; 1] esiste una e una sola soluzione v 2 C 2 [0; 1] del problema (5.9). (Il lettore è invitato a veri…care che anche se la v è inizialmente ottenuta come soluzione e implica che il primo C 0 [0; 1] dell’equazione integrale, l’identità v = ge + Kv 2 membro sia e¤ ettivamente una funzione C [0; 1]). La soluzione può essere approssimata mediante la somma parziale della serie di Neumann: n X e k (e v' K g) k=0 e è l’operatore integrale di nucleo k (x; ) q ( ) e dove K ge (x) = Kg (x) = Z 1 k (x; ) [f ( ) + q ( ) w ( )] d : 0 Abbiamo ottenuto la risolubilità unica del problema di partenza sotto l’ipotesi che il coe¢ ciente q non sia troppo grande. Il fatto che una condizione di questo tipo sia necessaria, almeno da un punto di vista matematico, si può evidenziare anche con la seguente osservazione: la funzione v (x) = sin ( x) risolve il problema 2 v 00 (x) v (x) = 0 per x 2 (0; 1) v (0) = 0; v (1) = 0: 2 Questo signi…ca che se q (x) (notare che 2 > 8; quindi questo coe¢ ciente q (x) non soddisfa la condizione del teorema) il problema iniziale con termine noto nullo ha una soluzione non banale, ossia (per la linearità del problema) viene a cadere l’unicità per il problema con termine noto qualsiasi. (Se v risolve il problema con termine noto f; anche v (x)+sin ( x) risolve lo stesso problema). Approfondendo questo esempio, supponiamo di voler risolvere il problema non omogeneo: v 00 (x) k 2 v (x) = 1 per x 2 (0; 1) v (0) = 0; v (1) = 0 54 con k > 0 costante. Questo problema (coe¢ cienti costanti) si può risolvere esplicitamente in modo elementare. Per k 6= n la soluzione esiste ed è unica: v (x) = 1 k2 1 cos (kx) + sin (kx) cos k 1 sin k : Per k = n con n dispari il problema non ha alcuna soluzione; per n pari ha le in…nite soluzioni v (x) = 1 n2 2 (1 cos (n x)) + c sin (n x) al variare di c 2 R. E¤ettivamente quindi il problema non è in generale ben posto per kqkC 0 [0;1] > 8. 2 Segnaliamo che il contresempio q (x) = ha un signi…cato matematico ma non …sico, in quanto per il suo signi…cato …sico q (x) 0. 6 Esercizi sulla Parte 1 A. Esercizi su spazi vettoriali, spazi vettoriali normati, spazi metrici, completezza Es 6.1 Dire quali dei seguenti insiemi di funzioni è uno spazio vettoriale: (a) C 0 (a; b) (b) C 0 [a; b] (c) f 2 C 0 [0; 2] : f (1) = 1 (d) f 2 C 1 [0; 2] : f (0) = 0; f 0 (2) = 0 (e) f 2 C 2 (R) : ex f 00 (x) + (sin x) f 0 (x) 5f (x) = 0 (f ) nf 2 C 2 (R) : ex f 00 (x) f (x) + 5f 0 (x) = 0 o Rx 3 (g) f 2 C 0 (R) : f (x) = f (0) + 0 (x t) f (t) dt Es 6.2 Dire chi sono i punti interni, esterni, di frontiera, di accumulazione per E; dire se E è o non è aperto, chiuso, limitato, nei seguenti esempi. Dire anche qual è l’interno, l’esterno, la frontiera di E. E = (x; y) 2 R2 : x2 + y 2 < 1 E = (x; y) 2 R2 : 0 < x2 + y 2 E = (x; y) 2 R2 : xy 6= 0 E = Q \ [0; 1] in X = R; E= x= in X = R2 ; 1 in X = R2 ; in X = R2 ; 1 : n = 1; 2; 3; ::: [ f0g in X = R: n Es 6.3 Fare esempi (in R) di un’unione di in…niti chiusi che non è chiusa, e di un’intersezione di in…niti aperti che non è aperta. Es 6.4 Veri…care che lo C (a; b) è uno spazio vettoriale ma non risulta uno spazio normato, con la norma C 0 . 55 Es 6.5 Veri…care che lo spazio P (R) delle funzioni de…nite su tutto R; continue e periodiche non è uno spazio vettoriale. [Suggerimento: cercare due funzioni di periodi diversi la cui somma non è periodica]. Tuttavia, se si pone d (f; g) = max jf (x) g (x)j x2R questo risulta uno spazio metrico: veri…care che 8f; g 2 P (R) risulta d (f; g) < 1. Es 6.6 Nello spazio C 0 [a; b] si de…nisca: Z b d (f; g) = jf (x) p g (x)j dx a per qualche p 2 (0; 1) …ssato. Provare che d è una distanza. Provare poi che, se si tentasse di de…nire una norma ponendo: !1=p Z b kf kp = a p jf (x)j dx (sempre per p 2 (0; 1)) questa veri…cherebbe i primi due assiomi della norma ma non la disuguaglianza triangolare, ossia esibire due funzioni f; g per cui risulta kf + gkp > kf kp + kgkp : (Quindi abbiamo uno spazio di funzioni che è vettoriale e metrico, in cui la distanza però non proviene da una norma). Es 6.7 Di ciascuna delle seguenti funzioni in R, stabilire se soddisfa gli assiomi di distanza: 2 d1 (x; y) = (x y) p d2 (x; y) = jx yj d3 (x; y) = x2 y 2 d4 (x; y) = jx 2yj d5 (x; y) = jx yj 1 + jx yj [Suggerimento per d5 . Provare a parte che la funzione f (t) = la disuguglianza f (a + b) f (a) + f (b) per a; b > 0:] t 1+t soddisfa Es 6.8 Di ciascuna delle seguenti funzioni in R2 provare che è una norma. Disegnare poi la sfera di centro l’origine e raggio 1 rispetto a questa norma. k(x; y)k0 = max (jxj ; jyj) k(x; y)k1 = jxj + jyj 3 3 k(x; y)k3 = jxj + jyj 56 1=3 Es 6.9 Fare un esempio, in R2 , di: a. insieme chiuso con interno vuoto; b. un insieme con interno vuoto la cui chiusura è R2 . Es 6.10 Sia (X; d) uno spazio metrico; de…niamo d (x; y) . 1 + d (x; y) d0 (x; y) = Provare che anche d0 è una distanza, e che (X; d0 ) è limitato anche se (X; d) non lo è. Es 6.11 Dire in quali dei seguenti spazi di funzioni continue è ben de…nita la norma dell’estremo superiore, cioè kf kC 0 (I) = sup jf (x)j : x2I (a) (b) (c) (d) (e) C 0 (R) C 0 (0; 1) C 0 [0; 1] f 2 C 0 (R) : limx! 1 f (x) = 0 f 2 C 0 (R) : 9K > 0 (K dipendente da f ) tale che f (x) = 0 per jxj Es 6.12 Sia kf kL1 (a;b) = Z a b jf (x)j dx: Dire se k kL1 (a;b) risulta una norma: (a) sullo spazio C 0 [a; b]; (b) sullo spazio delle funzioni limitate e Riemann integrabili in [a; b] : Es 6.13 Sia kf kP = Z b a jf 0 (x)j dx: Dire se k kP risulta una norma: (a) sullo spazio C 1 [a; b]; (b) sullo spazio X = f 2 C 1 [a; b] : f (a) = 0 : Es 6.14 Sia P = fpolinomi p (x) in [0; 1]g. Si dica se P è un sottospazio vettoriale di C 0 [0; 1] e in caso a¤ ermativo se è un sottospazio chiuso, rispetto alla norma dell’estremo superiore. B. Esercizi sulla convergenza di successioni di funzioni. Convergenza e completezza Es 6.15 Sia fn (x) = x n . Studiare la convergenza puntuale e uniforme negli intervalli (1; +1) e (2; +1). 57 K : 2 2 Es 6.16 Sia fn (x) = nxe n x . Studiare la convergenza puntuale e uniforme negli intervalli (1; +1) e [0; 1]. Es 6.17 Sia fn (x) = n xe n converge uniformemente in R. Es 6.18 Sia fn (x) = [0; +1). x 1+nx . 2 x2 . Determinare per quali la successione Studiare la convergenza puntuale e uniforme in nx . Studiare la convergenza puntuale e uniforme in Es 6.19 Sia fn (x) = 1+nx [0; +1) e in [r; +1) per r > 0. Es 6.20 Sia fn (x) = [0; 1]. 1 1+nx . Studiare la convergenza puntuale e uniforme in Es 6.21 Sia fn (x) = [0; 1]. 1 n+x . Studiare la convergenza puntuale e uniforme in Es 6.22 Sia fn (x) = [ 1; 1]. x 1+n2 x2 . Studiare la convergenza puntuale e uniforme in Es 6.23 Sia fn (x) = [ 1; 1]. nx 1+n2 x2 . Studiare la convergenza puntuale e uniforme in Es 6.24 Calcolare il limite puntuale della successione di funzioni fn (x) = (n + 1) x2 (1 + nx2 ) (1 + x2 ) in R. Stabilire poi se tale limite è uniforme, giusti…cando le proprie conclusioni. Es 6.25 Calcolare il limite puntuale della successione di funzioni fn (x) = n sin x 1 + n2 x2 in R. Stabilire poi se tale limite è uniforme, giusti…cando le proprie conclusioni. Es 6.26 Sia X lo spazio vettoriale delle successioni convergenti di numeri reali, con la norma: 1 kxk = sup jxk j dove x = fxk gk=1 . k Provare che (X; k k) è uno spazio vettoriale normato, completo. [Suggerimento: ricordare che una successione X è una successione di n oin 1 (k) (k) 1 successioni: fxk gk=1 X signi…ca che xk = n con n 2 R:] n=1 Es 6.27 Si consideri C 0 [a; b] con la norma integrale: Z b kf k = jf (x)j dx: a Provare con un esempio che con questa norma lo spazio C 0 [a; b] non è completo. 58 Es 6.28 Provare che C 1 [ 1; 1] con la norma di C 0 non è di Banach. [Suggerimento: costruire una successione di funzioni C 1 [ 1; 1] che converge in norma C 0 a una funzione che non sta in C 1 [ 1; 1]]. 15. Trovare un esempio di successione limitata in C 1 [0; 1] che non ha alcuna sottosuccessione convergente. C. Esercizi su spazi di funzioni derivabili, funzioni Lipschitziane Es 6.29 Costruire, per un intero n C n+1 (R). 1 …ssato, un esempio di funzione C n (R)n Es 6.30 Modi…cando l’Esempio 4.23 di funzione C01 (R), costruire una funzione f 2 C01 (a; b) per (a; b) qualsiasi. Es 6.31 Dimostrare che lo spazio Lip [a; b] con la norma kf kLip[a;b] = kf kC 0 [a;b] + jf jLip[a;b] ; dove jf jLip[a;b] = sup x1 ;x2 2[a;b];x1 6=x2 jf (x1 ) jx1 f (x2 )j x2 j è di Banach. Seguire questa traccia, inserendo tutti i dettagli necessari: a. Si veri…ca che Lip [a; b] è un sottospazio vettoriale di C 0 [a; b] : b. Si considera una successione ffn g di Cauchy in Lip [a; b]. Per come è de…nita la norma, in particolare è di Cauchy in C 0 [a; b] quindi esiste f 2 C 0 [a; b] tale che kfn f kC 0 [a;b] ! 0. c. Si scrive ora la condizione di Cauchy su jfn fm jLip[a;b] : 8" > 0 9n0 tale che 8n; m n0 si ha j[fn (x1 ) fm (x1 )] [fn (x2 ) fm (x2 )]j < " jx1 Da questa per m ! 1 si ricava che 8" > 0 9n0 tale che 8n j[fn (x1 ) f (x1 )] [fn (x2 ) f (x2 )]j < " jx1 x2 j : n0 si ha x2 j : (6.1) d. Dalla precedente relazione, unita al fatto che fn0 è Lipschitziana con una certa costante L si ricava che f 2 Lip [a; b] con costante L + ": e. Ancora dalla (6.1) si ricava che jfn f jLip[a;b] ! 0; che unita al punto b dà fn ! f in Lip [a; b], quindi lo spazio è completo. 59 D. Esercizi sul teorema delle contrazioni in spazi metrici Es 6.32 Sia 1 T x (t) = 3 Z t 0 log (1 + jx (s)j) ds: Dimostrare che T : C 0 [0; 2] ! C 0 [0; 2] è una contrazione. Es 6.33 Sia T f (x) = Z 0 x h 2 (x t) f (t) + (x 3 t) i dt: Dimostrare che T : C 0 [0; 1] ! C 0 [0; 1] è una contrazione. Es 6.34 Modi…cando l’esempio visto nel §5.3.3, determinare sotto quale ipotesi sulla funzione q (x) il seguente problema di¤ erenziale ha una e una sola soluzione u 2 C 2 [0; 1] per ogni dato f 2 C 0 [0; 1] assegnato: u00 (x) + q (x) u (x) = f (x) u (0) = 0; u (1) = 0 0 [Interpretazione …sica: una sbarra [0; 1] omogenea è scaldata da sorgenti di calore f (x) distribuite lungo la sua lunghezza; all’estremità x = 0 è isolata, mentre all’estremità x = 1 è termostatata a temperatura 0; nella sua lunghezza scambia calore con l’ambiente circostante, con coe¢ ciente di conducibilità verso l’esterno q (x)]. Traccia: occorre prima risolvere esplicitamente il problema analogo con q (x) 0; scrivendo la soluzione nella forma Z 1 u (x) = k (x; t) f (t) dt 0 con k esplicitamente calcolato. Allora se u risolve il problema iniziale è anche soluzione dell’equazione integrale Z 1 u (x) = k (x; t) [f (t) q (t) u (t)] dt; 0 che è un’equazione integrale di Fredholm di seconda specie a nucleo continuo. 60 Parte II Misura e integrale di Lebesgue 7 7.1 Motivazioni per studiare la teoria della misura e dell’integrazione di Lebesgue Inadeguatezza dell’integrale di Riemann per gli scopi dell’analisi funzionale Abbiamo visto come gli spazi di Lagrange C k [a; b] costituiscano un ambiente funzionale adatto allo studio delle funzioni derivabili : lo spazio C 1 [a; b], ad esempio, è uno spazio vettoriale normato completo, costituito dalle funzioni derivabili con continuità; la norma dello spazio esprime un controllo uniforme della “grandezza” sia della funzione che della sua derivata; proprio questo fa sì che la convergenza in questa norma conservi le proprietà caratteristiche delle funzioni di questo spazio, cioè appunto l’essere derivabili con continuità, ed esprima l’approssimazione della funzione limite e della sua derivata con le funzioni approssimanti e le loro derivate. Inoltre la completezza dello spazio si può esprimere intuitivamente dicendo che la convergenza in questa norma9 garantisce l’appartenenza del limite allo spazio stesso. Un’esigenza altrettanto naturale è quella di de…nire uno spazio vettoriale normato di funzioni integrabili, ad esempio su un intervallo [a; b]. Non solo lo spazio dovrà contenere soltanto funzioni integrabili, ma la norma dovrà esprimere un controllo sulla “grandezza” dell’integrale della funzione, in modo che la convergenza in questa norma conservi l’integrabilità e al tempo stesso esprima l’approssimazione dell’integrale della funzione limite con l’integrale delle funzioni approssimanti. Verosimilmente se tutte queste proprietà risultano soddisfatte lo spazio sarà completo rispetto a questa norma. Proviamo a de…nire uno spazio di questo tipo utilizzando l’integrale di Riemann, cioè quello che si studia nei corsi di analisi di base, che è anche quello che è stato utilizzato …no alla …ne del 19 secolo. La candidata naturale come norma (usiamo il simbolo provvisorio kkI con I come integrale per distinguerla da altre norme viste …n qui) è: kf kI = Z b a jf (x)j dx; 9 Rigorosamente si dovrebbe dire che il fatto che la successione sia di Cauchy garantisce l’esistenza del limite nello spazio. Tuttavia per gli spazi di funzioni di solito è vero che una successione di Cauchy nello spazio X è una successione convergente “in qualche spazio Y ”, eventualmente più grande di X. Perciò intuitivamente pensiamo la completezza come il fatto che il limite di una successione convergente appartenga allo spazio stesso. 61 che soddisfa sicuramente la proprietà di omogeneità, Z a b k f kI = j j kf kI 8 2 R cioè Z b j f (x)j dx = j j jf (x)j dx a e la disuguaglianza triangolare, Z a kf + gkI b jf (x) + g (x)j dx kf kI + kgkI cioè Z b Z b jf (x)j dx + jg (x)j dx: a a Lasciamo un momento in sospeso la veri…ca della prima proprietà della norma (quella di annullamento) e chiediamoci su quale spazio di funzioni mettere questa norma. Una prima possibilità è C 0 [a; b], dal momento che le funzioni continue su [a; b] sono certamente Riemann integrabili. Su questo spazio la norma soddisfa anche la proprietà di annullamento: per una funzione continua su [a; b] è vero che Z b a jf (x)j dx = 0 =) f (x) = 0 8x 2 [a; b] : Perciò C 0 [a; b] ; k kI è uno spazio vettoriale normato; la norma misura la grandezza dell’integrale, e la convergenza in norma esprime un’approssimazione dell’integrale. Il problema è che questa convergenza non conserva l’appartenenza allo spazio stesso, in altre parole questo spazio non è completo. Infatti: Esempio 7.1 Sia fn (x) = sgn (x) Si vede che kfn p n jxj in [ 1; 1] : f kI ! 0 con f (x) = 1 per x > 0 1 per x < 0: In particolare f 2 = C 0 [ 1; 1], anche se la successione è di Cauchy. In un certo senso, abbiamo scelto un insieme di funzioni troppo piccolo: le funzioni continue sono solo una parte delle funzioni Riemann integrabili, e l’approssimazione in norma integrale può fare uscire dallo spazio delle funzioni continue. Lo spazio C 0 [a; b] ; k kI non è completo, quindi non è un ambiente funzionale in cui sia facile dimostrare teoremi di esistenza. Non è adeguato per gli scopi dell’analisi funzionale. Pensiamo allora di considerare lo spazio R [a; b] di tutte le funzioni limitate e Riemann integrabili su [a; b], e di munirlo della norma k kI . Una prima complicazione è che questa non soddisfa la proprietà di annullamento: per una generica funzione integrabile, Z b jf (x)j dx = 0 ; f (x) = 0 8x 2 [a; b] : a 62 Ad esempio, una funzione nulla tranne in un numero …nito di punti ha integrale del modulo nullo, eppure non è identicamente nulla. Si esce da questo problema decidendo di identi…care con 0 le funzioni per cui kf kI = 0 e identi…care tra loro funzioni la cui di¤erenza ha norma nulla. Poiché questo problema non si presenta solo in quest’esempio, ma si presenterà nella teoria di Lebesgue di cui vorremo parlare, ne appro…ttiamo per spiegare questo punto rigorosamente. Nell’insieme R [a; b] introduciamo una relazione di equivalenza, ponendo f g, Z b a jf (x) g (x)j dx = 0: La relazione soddisfa le proprietà ri‡essiva, simmetrica e transitiva, perciò è una relazione di equivalenza. L’insieme R [a; b] risulta così ripartito in classi di equivalenza, cioè insiemi a due a due disgiunti di funzioni tali che per ogni Rb coppia f; g di funzioni nella stessa classe risulta a jf (x) g (x)j dx = 0. Indichiamo con ff g la classe di equivalenza a cui appartiene f (si dice che f è un rappresentante della classe), e consideriamo ora l’insieme R [a; b] = (che si dice insieme quoziente di R [a; b] rispetto alla relazione di equivalenza ) che ha per elementi le classi di equivalenza. E’uno spazio vettoriale, con le operazioni ff g + fgg = ff + gg c ff g = fcf g : La classe f0g che contiene la funzione identicamente nulla e tutte quelle che hanno integrale del modulo nullo, è lo zero dello spazio vettoriale: ff g + f0g = ff g. Poniamo ora: kff gkI = kf kI : Notare che la de…nizione è coerente perché se g è un’altra funzione della classe ff g ; si avrà kgkI = kf kI : Infatti per la disuguaglianza triangolare si ha kgkI kf kI kg kf f kI + kf kI gkI + kgkI e poiché, essendo f g, risulta kg f kI = 0, concludiamo kgkI viceversa. Il vantaggio di essere passati all’insieme quoziente è che ora se kf kI e kff gkI = 0; questo implica ora che kf kI = 0 cioè f 0, quindi ff g = f0g, ossia: se una classe di equivalenza ha norma nulla, questa è la classe che contiene lo zero, cioè la classe f0g. Quindi vale anche la proprietà di annullamento, ossia lo spazio quoziente R [a; b] = con la norma kf gkI risulta uno spazio vettoriale normato. 63 Introdurre uno spazio di “classi di equivalenza di funzioni”è il modo, rigoroso ma molto pesante, in cui la teoria degli insiemi formalizza questa situazione. L’idea intuitiva con cui noi possiamo pensare questo spazio, più agilmente, è che i suoi elementi siano le solite funzioni, con l’avvertenza però che due funzioni la cui di¤erenza ha norma nulla sono pensate come la stessa funzione; in particolare una funzione a norma nulla si indenti…ca con la funzione identicamente nulla. Si comincia a vedere all’orizzonte come la ri‡essione sull’integrale dal punto di vista dell’analisi funzionale spinga a modi…care un po’ il modo tradizionale di pensare le funzioni. Questo spunto sarà approfondito nel seguito, parlando di integrale di Lebesgue. Proseguiamo con l’analisi dello spazio (R [a; b] ; k kI ) (seguendo l’idea intuitiva appena enunciata, continuiamo a indicarlo senza far uso delle notazioni relative alle classi di equivalenza). Si constata che, purtroppo, lo spazio (R [a; b] ; k kI ) non è completo. Un esempio di successione che in questo spazio è di Cauchy ma non converge si potrà dare più facilmente quando avremo introdotto una parte della teoria dell’integrale di Lebesgue. Ma segnaliamo da subito questo risultato negativo. Prima di proseguire commentando la non completezza di questo spazio, segnaliamo qualche altra proprietà insoddisfacente di questo spazio. Si consideri il seguente 1 Esempio 7.2 Sia fxn gn=1 la successione dei razionali dell’intervallo [0; 1] (poiché sono un’in…nità numerabile, possono essere messi in successione, anche se questa non sarà una successione monotona) e sia fn : [0; 1] ! R fn (x) = 1 per x = x1 ; x2 ; :::; xn 0 altrimenti. Si ha fn (x) ! f (x) = 1 per x 2 Q 0 altrimenti. Notiamo che ciascuna fn è Riemann-integrabile, con kfn kI = 0; mentre f (che è la famosa “funzione di Dirichlet”) non è Riemann integrabile. Nello spazio delle classi di equivalenza, ciascuna fn è la funzione identicamente nulla (!!!), quindi nello spazio considerato questa è una successione costante (nulla), che ovviamente tende a zero, eppure dal punto di vista della convergenza puntuale fn ! f non integrabile. La situazione è strana: il passaggio alle classi di equivalenza non è coerente col concetto di convergenza puntuale di una successione di funzioni. Questo accade perché la classe delle funzioni Riemann-integrabili non è chiusa rispetto al limite puntuale. (Se la funzione di Dirichlet fosse Riemann integrabile -e avesse integrale nullo-, avremmo una successione nulla che tende a zero: niente di interessante, ma niente di strano). 64 Se nello spazio delle funzioni Riemann integrabili, in…ne, mettessimo la norma C 0 (della convergenza uniforme) otterremmo sì uno spazio completo (limite uniforme di funzioni Riemann integrabili è Riemann integrabile), ma a prezzo di perdere una delle motivazioni da cui siamo partiti: usare una norma integrale, in modo che la convergenza in norma traduca l’approssimazione dell’integrale della funzione limite con l’integrale delle funzioni approssimanti. La convergenza uniforme è una condizione troppo forte, che implica la convergenza degli integrali, ma non è soddisfatta in tutte le situazioni in cui gli integrali convergono. 7.2 L’idea dell’integrale di Lebegue Torniamo ora a commentare la non completezza dello spazio (R [a; b] ; k kI ). Così come la non completezza dello spazio C 0 [a; b] ; k kI è stata interpretata dicendo che le funzioni continue sono solo una parte delle funzioni integrabili, e perciò la convergenza in norma integrale può far uscire dallo spazio delle funzioni continue, così potremmo immaginare che anche le funzioni Riemann-integrabili siano solo una parte di quelle per cui è possibile (in qualche altro modo) de…nire un integrale, che naturalmente coincida col solito integrale quando applicato a funzioni Riemann-integrabili. Nasce quindi l’idea che si possa allargare la classe delle funzioni integrabili, per ottenere uno spazio completo. Questo però potrà essere fatto solo cambiando la de…nizione di integrale (…nché l’integrale è quello, le funzioni integrabili sono quelle!), e più precisamente cambiandolo in un senso che renda meno restrittiva la richiesta di integrabilità. Ricordiamo ora come è stato de…nito l’integrale di Riemann come limite di somme: lim sn = lim n!1 n!1 n X b k=1 a n f (n) k dove al passo n-esimo l’intervallo [a; b] è stato suddiviso in n intervalli uguali (n) (n) (n) (n) mediante i punti a = x0 ; x1 ; x2 h; :::; xn =i b e ad ogni passo si sono scelti, (n) (n) (n) arbitrariamente, gli n punti k 2 xk 1 ; xk , k = 1; 2; :::; n. La funzione f si dice Riemann-integrabile se il limite esiste …nito e non dipende da come si sono (n) scelti, ad ogni passo, i punti k . Si capisce dalla de…nizione che ciò che “mette a rischio”l’integrabilità è il fatto che f abbia numerosi punti di discontinuità, e quindi nel corso della costruzione succeda “tanteh volte” chei scegliendo il punto (n) (n) (n) in modi diversi all’interno dell’intervallino xk 1 ; xk si ottengano delle k variazioni importanti nel valore di sn . Ad esempio, la funzione di Dirichlet non è integrabile perché, ad ogni passo della costruzione iterativa, è possibile (n) scegliere i punti k tutti razionali, e allora sn = 1, o tutti irrazionali, e allora sn = 0; perciò certamente successioni di Cauchy-Riemann diverse hanno limiti diversi. Se vogliamo dare una de…nizione di integrale diversa, che risulti meno restrittiva, dobbiamo trovare il modo di neutralizzare, nell’algoritmo di calcolo dell’integrale, gli e¤ etti di instabilità dovuti alle (eventuali) grandi oscillazioni o discontinuità della funzione. 65 Un’idea di questo tipo si trova nella nozione di integrale introdotta da Henri Lebesgue nel 1902 nella sua tesi di dottorato presentata alla Facoltà di Scienze di Parigi. L’idea, apparentemente banale, è: invece di fare una costruzione iterativa suddividendo l’intervallo [a; b] sull’asse x in parti uguali, facciamo una costruzione iterativa suddividendo in parti uguali, sull’asse y, un intervallo che contenga l’insieme dei valori assunti dalla funzione (che per il momento supponiamo limitata). Ad esempio, se la funzione ha valori in [0; 1], al passo n-esimo suddivideremo [0; 1] in parti uguali e considereremo gli insiemi (n) Ek = x 2 [a; b] : k 1 n f (x) < k n , con k = 1; 2; :::; n: Ovviamente un’approssimazione, per difetto o per eccesso, dell’area sotto il gra…co di f si ottiene, rispettivamente, con le somme: sn = s+ n = n X k=1 n X (n) Ek k 1 n (n) Ek k=1 ; k ; n dove jEk j indica la misura dell’insieme Ek , cioè se ad es. è un intervallo la sua lunghezza, se è l’unione di più intervalli la somma delle lunghezze degli itervalli, e così via10 . Una somma di Riemann di passo 3 1 0 Come vedremo, buona parte del problema da a¤rontare sta in questo semplicistico “e così via”. 66 Una somma di Lebesgue di passo 3 della stessa funzione Ciò che dimostra quanto sia buona quest’idea, e quanto sia diversa da quella dell’integrale di Riemann (non ostante l’apparente simmetria: suddividiamo l’asse x / suddividiamo l’asse y) è che per come sono costruite le somme risulta sempre n X 1 (n) 1 0 s+ s = Ek = n n n n k=1 per cui lo scarto tra le approssimazioni per eccesso e per difetto tende necessariamente a zero! Signi…ca che questo algoritmo di approssimazione restituisce “sempre”un limite. Apparentemente, ogni funzione risulta integrabile a questo modo. In realtà, abbiamo in un certo senso spostato il problema: data una (n) funzione f e interi n; k qualsiasi, come sarà fatto l’insieme Ek ? Se f ha molte oscillazioni e discontinuità potrà essere un insieme molto diverso da un intervallo o l’unione di un numero …nito di intervalli. Ad esempio, per la funzione di (n) Dirichlet tra gli insiemi Ek ci saranno fx 2 [0; 1] : x 2 Qg ; fx 2 [0; 1] : x 2 = Qg , che non sono esprimibili come unioni …nite di intervalli. Dunque: per costruire una teoria dell’integrazione di questo nuovo tipo dobbiamo prima impegnarci a costruire una “teoria della misura” che sia in grado di assegnare una “lunghezza” anche a sottoinsiemi molto irregolari della retta. 7.3 Il problema di de…nire una “buona” misura Dobbiamo dunque trovare il modo di de…nire la “lunghezza” (d’ora in poi la chiameremo “misura”) di un sottoinsieme della retta il più possibile generico. Idealmente, ad ogni sottoinsieme E di R vorremmo poter assegnare un numero (E), non negativo ed eventualmente in…nito (la retta intera, o una semiretta, 67 hanno lunghezza in…nita), in modo che questa “funzione d’insieme”11 : P (R) ! [0; 1] abbia alcune proprietà ragionevoli. Certamente vorremo che sia (;) = 0. Non sarà vero il viceversa, ossia: ci saranno insiemi non vuoti di misura nulla (un punto ha lunghezza nulla). La misura elementare è additiva (la misura del tutto è somma della misura delle parti), quindi vorremo che risulti (A [ B) = (A) + (B) ogni volta che A \ B = ;: Se teniamo presente che uno dei nostri obiettivi …nali è costruire uno spazio di funzioni integrabili che risulti completo, sarà fondamentale che la nostra teoria permetta di trattare agevolmente i limiti di successioni di funzioni; sarà prudente allora richiedere che già al livello della misura le successioni (in questo caso di insiemi) abbiano un posto di riguardo. Chiediamo perciò che la misura risulti additiva anche per successioni di insiemi : ! 1 1 [ X En = (En ) n=1 n=1 1 fEn gn=1 per ogni successione di insiemi a due a due disgiunti. Questa proprietà si chiama numerabile additività. In…ne, stiamo costruendo una misura che generalizzi l’idea elementare di lunghezza, quindi vogliamo che per un intervallo [a; b] risulti ([a; b]) = b a (lunghezza elementare). Riassumiamo: vorremmo de…nire una funzione : P (R) ! [0; 1] (7.1) tale che 1 [ n=1 1 (;) = 0 ! 1 X En = (En ) (7.2) (7.3) n=1 per ogni successione fEn gn=1 di insiemi a due a due disgiunti, e ([a; b]) = b a 8a; b 2 R; a b (7.4) Purtroppo questo programma si è rivelato impossibile. Infatti un profondo teorema di S. Ulam (1909-1984) mostra che non esiste alcuna funzione che soddis… simultaneamente (7.1), (7.2), (7.3), (7.4). Precisamente, il teorema di Ulam a¤erma che: 1 1 Il R. simbolo P (R) indica l’insieme delle parti di R, cioè l’insieme di tutti i sottoinsiemi di 68 “L’unica funzione soddisfacente (7.1), (7.2), (7.3) e tale che per ogni x 2 R sia (fxg) = 0 (cioè l’insieme costituito da un punto solo ha sempre misura nulla) è quella identicamente nulla”. Poiché la proprietà (7.4) implica che per ogni x 2 R è (fxg) = 0 (prendere a = b = x) e implica anche che non è identicamente nulla (prendere a < b), ne segue quanto abbiamo a¤ermato. A quale delle 4 proprietà possiamo rinunciare? L’unica scelta possibile, in vista del nostro obiettivo, è rinunciare a (7.1): costruiremo una misura che abbia proprietà ragionevoli ed estenda la misura elementare, ma non tutti i sottoinsiemi di R risulteranno misurabili. La misura sarà de…nita solo su una certa famiglia L di sottoinsiemi di R. Come scegliere L? Che proprietà dovrà avere? Per coerenza con le richieste (7.2) e (7.3), L dovrà contenere l’insieme vuoto, e inoltre dovrà essere chiuso per unioni numerabili: En 2 L per n = 1; 2; 3; ::: =) 1 [ n=1 En 2 L. (7.5) Anche l’insieme R (cioè lo spazio intero) dovrà essere misurabile (con misura in…nita, ci aspettiamo); inoltre, L dovrà essere chiuso per qualche altra operazione insiemistica elementare, ad esempio la complementazione: se sappiamo misurare E, dovremmo saper misurare anche il complementare E c di E: E 2 L =) E c 2 L. In…ne, per coerenza con la richiesta (7.4), L dovrà contenere gli intervalli. Siamo così arrivati a capire che per costruire una buona misura dobbiamo anzitutto occuparci di individuare un’opportuna famiglia di sottoinsiemi di R su cui de…nirla, famiglia che deve anch’essa godere di oppurtune proprietà algebriche, rispetto alle operazioni insiemistiche. Provando a guardare in avanti, immaginiamo ora che cosa succederà quando, avendo costruito una buona misura sulla retta, che assegna una “lunghezza”appropriata ad ogni insieme E 2 L, dovremo de…nire l’integrale di una funzione f (x); a¢ nché l’algoritmo di approssimazione ideato da Lebesgue sia utilizzabile, occorrerà che gli insiemi (n) Ek = x 2 [a; b] : k 1 n f (x) < k n appartengano tutti alla famiglia L; questo si traduce in una richiesta sulla funzione f , che non potrà essere totalmente arbitraria, ma dovrà essere anch’essa “misurabile”, il che per de…nizione signi…cherà appunto che tutti gli insiemi (n) di livello Ek sono misurabili. Ragionevolmente, quindi, non tutte le funzioni risulteranno integrabili secondo Lebesgue; tuttavia, dovrebbero risultare integrabili molte più funzioni di quelle Riemann-integrabili; soprattutto, data la “intrinseca stabilità”della de…nizione di integrale di Lebesgue e dato che tra le proprietà della misura abbiamo inserito la numerabile additività, che dovrebbe essere d’aiuto nel dimostrare proprietà delle successioni di funzioni, possiamo sperare che questo spazio risulti completo rispetto alla norma integrale. 69 Il percorso logico che ci attende è ora sostanzialmente capovolto rispetto a quello seguito in questa introduzione. Dovremo: 1. De…nire e studiare particolari famiglie di sottoinsiemi dell’insieme universo (che nel discorso fatto …n qui era R, ma potrebbe essere Rn o anche un insieme diverso), le cosiddette “ -algebre”; 2. de…nire il concetto di misura e studiarne le proprietà; de…nire una particolare misura, quella di Lebesgue, che estende la misura elementare in Rn ; 3. de…nire cosa si intenda per “funzioni misurabili”e studiarne le proprietà; 4. de…nire l’integrale di una funzione misurabile e dimostrarne le proprietà; 5. de…nire uno spazio vettoriale normato di funzioni Lebesgue integrabili e dimostrarne la completezza. 7.4 Sviluppo e impatto della teoria della misura e dell’integrale di Lebesgue Nel percorrere i passi appena descritti di questa teoria, ci si è resi conto che buona parte di essa può essere sviluppata in un contesto molto astratto, cioè senza supporre che lo spazio ambiente sia R o Rn , e qualora anche lo spazio ambiente sia Rn , senza supporre che la misura estenda la misura elementare. In altre parole, risulta importante sia costruire una misura e un integrale sui consueti sottoinsiemi di Rn che generalizzi la misura elementare e l’integrale di Riemann, permettendo di costruire spazi di funzioni integrabili che siano di Banach, sia costruire una teoria della misura e dell’integrazione astratta, (cioè rispetto ad una misura “qualsiasi” in uno spazio ambiente “qualsiasi”), che sia uno strumento teorico ‡essibile e applicabile a situazioni diverse. La teoria di Lebesgue ha rivoluzionato l’analisi matematica del R20 secolo in molti modi. L’idea di identi…care due funzioni f; g ogni volta che jf gj = 0 (si dirà che “f e g sono uguali quasi ovunque”) ha cambiato il modo stesso di pensare al concetto di funzione, rispetto alla de…nizione “punto per punto”data da Dirichlet negli anni 1830; gli spazi di funzioni integrabili secondo Lebesgue, uniti a un altro sviluppo dell’analisi funzionale astratta di cui parleremo in seguito, cioè la teoria degli spazi di Hilbert, ha gettato nuova luce sullo studio delle serie di Fourier, rivoluzionando l’analisi armonica; il teorema fondamentale del calcolo integrale nel contesto della teoria dell’integrazione di Lebesgue è stato il punto di partenza per una generalizzazione del concetto di derivata, la cosiddetta “derivata debole”, di cui parleremo, che entra nella de…nizione degli spazi di funzioni (“spazi di Sobolev”) che costituiscono dagli anni 1950 il contesto standard in cui studiare le equazioni alle derivate parziali. La versione astratta della teoria dell’integrazione ha avuto altri risvolti fondamentali: negli anni 1930 Kolmogorov ha rifondato assiomaticamente il calcolo delle probabilità dandogli la veste che ha ancor oggi, interamente fondata sulla teoria della misura astratta; la teoria astratta della misura ha anche dato la possibilità di de…nire le misure di dimensione inferiore a quella dello spazio ambiente (misura di super…cie nello spazio tridimensionale, ad es.), creando una teoria adatta a studiare anche oggetti geometrici molto irregolari; ne è nata la teoria geometrica della misura, che ha saputo risolvere questioni che erano 70 aperte da secoli, come il problema isoperimetrico classico, e ha dato strumenti potenti al calcolo delle variazioni. L’idea di derivata debole, già citata, e la teoria della misura, in…ne, sono stati tra gli spunti per la nascita della teoria delle distribuzioni, che negli anni 1950 ha ampiamente generalizzato il concetto di funzione, derivata, trasformata di Fourier, con conseguenze vaste sia sullo studio delle equazioni a derivate parziali che sull’analisi armonica. 8 Teoria della misura e dell’integrale di Lebesgue Per approfondimenti sul contenuto di questa sezione si rimanda a: [16], [21], [20], [10]. 8.1 Spazi misurabili De…nizione 8.1 Sia un insieme. Si dice -algebra (su ) una famiglia M di sottoinsiemi di (cioè12 M P ( )) tale che: 2 M; E 2 M =) E c 2 M (dove E c indica il complementareSdi E in ); 1 1 se fEn gn=1 è una successione di insiemi di M, allora n=1 En 2 M. Gli insiemi di M si dicono insiemi misurabili, ( ; M) si dice spazio misurabile. Ogni insieme ha due -algebre banali: la più piccola è quella costituita solo da e ;; la più grande è tutto P ( ). Dalla de…nizione segue facilmente la: Proposizione 8.2 Se M è una -algebra, M è chiusa anche rispetto alle seguenti operazioni insiemistiche: unione …nita, intersezione …nita o numerabile; di¤ erenza insiemistica13 . Proposizione 8.3 Se E P ( ) è una qualsiasi famiglia di sottoinsiemi di , è ben de…nita la più piccola -algebra contenente E, detta “ -algebra generata da E” e si indica con (E). Infatti, di -algebre contenenti E ce n’è almeno una: P ( ); consideriamo allora l’intersezione di tutte le -algebre contenenti E; si tratta di dimostrare che quest’intersezione è a sua volta una -algebra (facile esercizio); questa sarà per costruzione la più piccola -algebra contenente E. Esempio 8.4 (Relazione tra topologia e teoria della misura) Sia uno spazio metrico qualsiasi, e A la famiglia di tutti gli insiemi aperti di . La 1 2 dove P ( ) indica l’insieme delle parti di compresi stesso e l’insieme vuoto ; 1 3 La di¤erenza insiemistica è de…nita così: ; cioè l’insieme di tutti i sottoinsiemi di A n B = A \ Bc: 71 ; -algebra (A) (generata da A nel senso della de…nizione precedente) si dice algebra di Borel in , si indica con B ( ), e i suoi insiemi si chiamano boreliani di : Tra i boreliani troviamo tutti gli insiemi aperti, tutti i chiusi, ma anche tutti gli insiemi (generalmente né aperti né chiusi) che si ottengono facendo unione numerabile di chiusi o intersezione numerabile di aperti. Se ad esempio = Rn (con la distanza euclidea), diciamo pure che è molto di¢ cile costruire un insieme di che non sia un boreliano. Questa -algebra è quindi una classe molto ampia e generale di sottoinsiemi di . 8.2 Misura De…nizione 8.5 Sia ( ; M) uno spazio misurabile. Si dice misura (su questo spazio) una qualunque funzione (d’insieme) : M ! [0; +1] 1 che sia numerabilmente additiva, ossia tale che per ogni successione fEn gn=1 di insiemi di M a due a due disgiunti, si abbia ! 1 1 [ X En = En . n=1 n=1 (Dove ambo i membri possono essere …niti o in…niti). In tal caso ( ; M; ) si dice spazio di misura. Da questa sola richiesta di numerabile additività seguono in realtà molte altre proprietà della misura: Teorema 8.6 Sia ( ; M; ) uno spazio di misura. Allora: 1. (;) = 0; 2. è …nitamente additiva, cioè per ogni famiglia …nita E1 ; E2 ; :::; En di insiemi di M a due a due disgiunti si ha ! n n X [ Ei ; Ei = i=1 i=1 3. è monotona, cioè 8A; B 2 M, A B =) (A) (B) ; 4. è condizionatamente sottrattiva, cioè 8A; B 2 M, A B e (B) < 1 =) (B n A) = (B) (A) ; 1 5. è continua da sotto: se fEn gn=1 S1è una successione di insiemi di M tale che En % E (cioè: En En+1 8n e n=1 En = E) allora (En ) ! (E) ; 1 6. è condizionatamente continua da sopra: se fEn gn=1 èTuna successione 1 di insiemi di M tale che En & E (cioè: En En+1 8n e n=1 En = E) e inoltre (E1 ) < 1, allora (En ) ! (E) ; 1 7. è numerabilmente subadditiva, cioè se fEn gn=1 è una successione di insiemi di M ( non necessariamente a due a due disgiunti), allora ! 1 1 [ X En En . n=1 n=1 72 Lo studente può provare per esercizio a dimostrare qualcuna di queste proprietà. Nel seguito, come vedremo, saranno molto importanti gli insiemi di misura nulla. Notiamo che se E; E0 2 M, E0 E e (E) = 0, allora (per la monotonia della misura) anche (E0 ) = 0. Talvolta siamo in una situazione leggermente diversa: abbiamo un insieme E 2 M tale che (E) = 0; e un altro insieme E0 E (di cui a priori non sappiamo che sia misurabile); ci piacerebbe poter comunque concludere che (E0 ) = 0 (cioè: che E0 2 M, e quindi (E0 ) = 0). Questo non è vero per tutte le misure, ma solo per quelle per cui è noto che i sottoinsiemi degli insiemi di misura nulla sono tutti misurabili (e quindi di misura nulla). De…nizione 8.7 Sia ( ; M; ) uno spazio di misura. Si dice che la misura è completa se i sottoinsiemi degli insiemi di misura nulla sono tutti misurabili (e quindi hanno misura nulla). Esempi di misure. Non è così semplice costruire misure signi…cative. Cominciamo a introdurre un paio di esempi semplici (ma comunque importanti). La misura del conteggio. Sia un insieme qualsiasi, M = P ( ) e : M ! [0; +1] tale che (A) = numero di elementi di A, se A è …nito; 1 altrimenti. Si veri…ca che è una misura detta misura del conteggio. Come vedremo, l’integrale rispetto a questa misura risulterà una serie numerica, quindi la teoria astratta dell’integrazione assorbirà al suo interno la teoria delle serie numeriche. La misura atomica o di Dirac. Sia un insieme qualsiasi, x0 2 un suo elemento …ssato, e M = P ( ). De…niamo : M ! [0; +1] tale che (A) = 1 se x0 2 A 0 altrimenti. Si veri…ca che è una misura, detta misura di Dirac concentrata in x0 e indicata talvolta col simbolo x0 . Vediamo ora come costruire la misura fondamentale che ci interessa negli spazi Rn , che permetterà di de…nire un integrale che estenda l’integrale classico di Riemann. 8.3 Costruzione della misura di Lebesgue in Rn Il nostro obiettivo ora è costruire una -algebra di sottoinsiemi di Rn che contenga gli insiemi elementari (di conseguenza, conterrà i boreliani), e de…nire su di essa una misura che estenda la misura elementare. La costruzione che faremo non è quella originale di Lebesgue ma è dovuta a Carathéodory, e procede in due passi. In un primo tempo si de…nisce una funzione d’insieme non negativa 73 che è de…nita su tutti i sottoinsiemi di Rn , estende la misura elementare, ma non è una misura (non può esserlo, in base al teorema di Ulam). Questa si chiamerà misura esterna. In un secondo tempo individueremo una -algebra L di sottoinsiemi di Rn tale che , ristretta a L, sia numerabilmente additiva, quindi una misura: L sarà la -algebra degli insiemi Lebsegue misurabili (e conterrà la -algebra di Borel), e la restrizione di a L sarà la misura di Lebsegue . Consideriamo gli insiemi più semplici che sono l’analogo in Rn degli intervalli sulla retta. De…niamo n-cella un insieme del tipo: I = [a1 ; b1 ] [a2 ; b2 ] ::: [an ; bn ] ; con ai ; bi 2 R: Per ogni n-cella I come sopra poniamo (I) = jb1 (Cioè sulle n-celle ogni E Rn ; a1 j jb2 a2 j ::: jbn an j : è de…nito come il volume elementare). Ora poniamo, per (E) = inf ( 1 X (Ik ) : E k=1 1 [ k=1 Ik ) : In altre parole: si considerano tutte le successioni di n-celle la cui unione ricopre E (poiché le n-celle sono una successione e non un numero …nito, si può ricoprire anche un insieme E illimitato); per ciascuna di queste successioni di n-celle si considera la somma (serie) delle misure elementari; quindi si prende l’estremo inferiore al variare delle coperture di E con n-celle. Notare che se ogni possibile copertura di E con n celle è tale che la serie delle misure sia in…nita, si avrà (E) = 1. Se E è un insieme limitato, certamente (E) < 1 (ma può essere (E) < 1 anche per certi E illimitati). Come anticipato nell’introduzione di questo paragrafo, la funzione non è una misura. La proprietà importante che si può dimostrare per è espressa dal seguente: Teorema 8.8 La funzione è numerabilmente subadditiva, cioè per ogni suc1 cessione fEk gk=1 di sottoinsiemi di Rn (non necessariamente a due a due disgiunti), si ha ! 1 1 [ X Ek (Ek ) : k=1 k=1 (Dove i due membri possono essere eventualmente in…niti). Il punto fondamentale è che anche se gli insiemi Ek si assumono a due a due disgiunti, in generale non si può garantire che nella disuguaglianza precendente valga il segno di =. Per questo non è una misura. Del resto, per il teorema di Ulam, non potrebbe esistere una misura de…nita su tutti i sottoinsiemi di Rn che estenda la misura elementare. 74 Aprendo una parentesi, diamo la seguente de…nizione astratta, che ci sarà utile più avanti: De…nizione 8.9 Sia un insieme qualsiasi. Si dice misura esterna su qualunque funzione d’insieme una : P ( ) ! [0; +1] 1 che sia numerabilmente subadditiva, ossia tale che per ogni successione fEk gk=1 di sottoinsiemi di si abbia ! 1 1 X [ Ek (Ek ) : k=1 k=1 Torniamo al contesto di Rn e alla misura esterna . L’idea ingegnosa di Carathéodory consiste nell’individuare una condizione che permetta di selezionare, mediante , una -algebra di insiemi su cui sia numerabilmente additiva. De…nizione 8.10 Si dice che T (E) = (E \ T ) + Rn ha la proprietà di Carathéodory se (E \ T c ) per ogni E Rn . Detto a parole: un insieme ha la proprietà di Carathéodory se suddivide additivamente ogni sottoinsieme di Rn . Vale il seguente Teorema 8.11 (di Carathéodory) Sia L la famiglia dei sottoinsiemi di Rn aventi la proprietà di Carathéodory. Allora: L è una -algebra; L contiene la -algebra di Borel; la funzione ristretta a L è una misura , detta misura di Lebesgue; la misura di Lebsegue è completa; la misura di Lebesgue è invariante per traslazioni ed estende la misura elementare. Qualche commento sul teorema precedente. Dal punto di vista pratico, la misura di Lebesgue è de…nita esattamente come la misura esterna , soltanto che la classe di insiemi misurabili non coincide con P (Rn ) ma è più ristretta. In realtà la classe degli insiemi Lebesgue misurabili è veramente molto ampia e comprende non solo tutti gli insiemi di Borel, come a¤ermato dal teorema, ma in pratica tutti gli insiemi di cui si possa dare un procedimento costruttivo esplicito di de…nizione. Per costruire esempi di insiemi non misurabili bisogna utilizzare l’assioma della scelta, un assioma della teoria degli insiemi che asserisce la possibilità di de…nire insiemi con un certo procedimento non costruttivo che richidede di e¤ettuare in…nite scelte arbitrarie. Un esempio di questo tipo si trova in [16], §2.3. Il fatto che operativamente (E) si calcoli come (E) fa capire che è invariante per traslazioni ed estende la misura elementare: infatti è de…nita 75 a partire dalla misura elementare delle n-celle, che è invariante per traslazioni; inoltre è (numerabilmente e quindi anche …nitamente) additiva; dalla proprietà di additività …nita e il fatto che la misura delle n-celle sia il volume elementare segue che la misura degli insiemi elementari (ad esempio, se siamo in R2 o R3 i poligoni e i poliedri, rispettivamente) coincida con la loro misura elementare. (Si pensi a come, in geometria elementare, si arriva a stabilire le formule per il calcolo dell’area dei poligoni: si basano tutte sulla formula per l’area del rettangolo -che è la “misura elementare di una 2-cella”- e l’additività dell’area). Esempio 8.12 Per visualizzare meglio come agisce la de…nizione di misura di Lebesgue, facciamo qualche esempio. 1. Poiché la misura di Lebesgue estende la misura elementare, un punto ha misura nulla (in Rn ; qualunque sia n). 2. D’altro canto la misura è numerabilmente additiva perciò, ogni insieme numerabile (è misurabile e) ha misura nulla. 3. In R quanto appena a¤ ermato è particolarmente signi…cativo, perché mostra che Q è un sottoinsieme di R misurabile e di misura nulla, non ostante il fatto che Q sia denso in R. Si capisce che la valutazione di quanto sia “grande” un insieme dal punto di vista della teoria della misura e dal punto di vista della topologia può essere molto diverso. La misurabilità dell’insieme Q è un fatto che deve far ri‡ettere sulla potenza della teoria: utilizzando le nozioni elementari di misura dei segmenti, un insieme come Q sarebbe “intrattabile”. 4. Si ri‡etta sul fatto che, ad esempio, una retta (o una curva regolare) nel piano o nello spazio ha misura nulla, così come un piano (o una super…cie regolare) nello spazio ha misura nulla. Questo si può vedere ri‡ettendo sulla de…nizione di mediante coperture dell’insieme da misurare con successioni di n-celle. A titolo di esempio, mostriamo che una retta, ad esempio l’asse x, ha misura nulla nel piano. Per cominciare sia E il semiasse x 0; y = 0 nel piano, e proviamo che (E) = 0. Possiamo coprire E con l’unione delle 2 celle così fatte: E 1 [ [k; k + 1] k=0 1 X k=0 [k; k + 1] h h " "i ; ; con 2k 2k X " "i ; k = 1 k 2 2 1 k=0 2" = 4": 2k Perciò (E) = inf f4" : " > 0g = 0: Analogamente si prova che il semiasse x 0 ha misura nulla, da cui essendo unione di due insiemi di misura nulla l’asse x ha misura nulla in R2 . Naturalmente, in R l’asse x avrebbe invece misura in…nita. 5. Tornando al caso unidimensionale di R, ci si può chiedere se solo gli insiemi numerabili hanno misura nulla. In altre parole, esistono in R insiemi non numerabili di misura nulla? La domanda non è facile, perché i sottoinsiemi non numerabili di R che vengono subito in mente sono gli intervalli (che sicuramente hanno misura positiva, pari alla loro lunghezza) o, volendo fare qualche esempio 76 più complicato, l’insieme degli irrazionali, che però è misurabile e ha misura in…nita, essendo il complementare dell’insieme dei razionali, che è misurabile e ha misura nulla. Analogamente, l’insieme di tutti gli irrazionali compresi in un intervallo ha misura pari alla lunghezza dell’intervallo. Un esempio interessante di sottoinsieme non numerabile di R che ha misura nulla è il ternario di Cantor, che ora de…niamo. Si esegue la seguente costruzione iterativa. Consideriamo l’intervallo [0; 1]. Al passo 1, rimuoviamo l’intervallo aperto centrale di lunghezza 1=3, cioè l’intervallo (1=3; 2=3), e chiamiamo T1 l’insieme residuo, cioè [0; 1=3] [ [2=3; 1], che ha misura 2=3. Al passo 2, da ciascuno dei due intervallini che costituiscono T1 si rimuove l’intervallo aperto centrale di lunghezza 1=3 dell’intervallino da cui lo si sta togliendo, cioè di lunghezza 1=9, e chiamiamo T2 l’insime residuo, che ora ha misura 4=9. Si prosegue iterativamente a questo modo. L’insieme Tn costruito al passo n n-esimo ha misura (2=3) , perché è l’unione di 2n intervalli ognuno di lunghezza n 1=3 . 1 \ L’insieme ternario di Cantor è de…nito come T = Tn . Poiché Tn è una n=1 successione decrescente di insiemi e T1 ha misura …nita, per la condizionata continuità da sopra della misura di Lebesgue si ha (T ) = lim n!1 n (Tn ) = lim (2=3) = 0: n!1 Si potrebbe pensare che questo insieme T , ottenuto continuando a rimuovere intervalli da [0; 1], sia un insieme vuoto o comunque molto “magro”, quindi non avremmo trovato niente di interessante. Invece T non è a¤ atto vuoto; è un insieme chiuso (intersezione di chiusi), che contiene almeno tutti gli estremi degli intervalli residui, cioè 0; 1=3; 2=3; 1; 1=9; 2=9; :::; ma in realtà contiene molto di più; si può dimostrare che T è un insieme non numerabile. Per rendercene conto, ragioniamo così. Come potremmo indicare univocamente un punto di T ? Assegnamo una sequenza di istruzioni con cui individuarlo, al modo seguente: al passo 1 della costruzione, il punto si trova nell’intervallino di lunghezza 1=3 di destra o di sinistra? Nel primo caso scriviamo 1, altrimenti scriviamo 0; al passo 2 della costruzione, il punto si trova dentro l’intervallino di lunghezza 1=3 individuato al passo 1, e precisamente nell’intervallino di destra o di sinistra di lunghezza 1=9? Nel primo caso scriviamo 1, altrimenti scriviamo 0: Così facendo associamo ad ogni punto del ternario di Cantor una successione di cifre 0 o 1; ma la totalità di queste successioni è un insieme non numerabile (ad esempio, perché possiamo vedere queste successioni come le rappresentazioni in base 2 dei numeri reali dell’intervallo [0; 1]). Ciò dimostra che T è non numerabile, pur avendo misura nulla. 6. Una generalizzazione della costruzione precedente ci sarà utile in seguito per costruire un esempio importante riguardo all’integrale di Lebesgue. Si esegue la seguente costruzione iterativa. Consideriamo l’intervallo [0; 1] e …ssiamo un numero positivo e 1=3. Al passo 1, rimuoviamo l’intervallo 77 1 aperto centrale di lunghezza , cioè l’intervallo 12 2 ; 2 + 2 , e chiamiamo T1 1 l’insieme residuo, cioè 0; 12 . 2 [ 2 + 2 ; 1 , che ha misura 1 Al passo 2, da ciascuno dei due intervallini che costituiscono T1 si rimuove l’intervallo aperto centrale di lunghezza 2 , e chiamiamo T2 l’insime residuo, che ora ha misura 1 2 2. Si prosegue iterativamente a questo modo. L’insieme Tn costruito al passo n-esimo ha misura 1 +2 2 + 22 3 + ::: + 2n 1 n n X1 =1 k (2 ) : k=0 L’insieme ternario di Cantor generalizzato è de…nito come T = 1 \ Tn . n=1 Poiché Tn è una successione decrescente di insiemi e T1 ha misura …nita, per la condizionata continuità da sopra della misura di Lebesgue si ha " # n X1 k T = lim Tn = lim 1 (2 ) = n!1 =1 n!1 1 X k=0 k (2 ) = 1 k=0 1 2 = 1 1 3 : 2 In particolare, per ogni 2 0; 31 il ternario di Cantor generalizzato T ha misura positiva. L’insieme T 1=3 è il ternario di Cantor “classico” costruito al punto precedente, e ha misura nulla. 8.4 Restrizione di una misura Abbiamo costruito la misura di Lebesgue su Rn . Naturalmente in molte questioni non consideriamo lo spazio intero, ma un sottoinsieme di Rn , e vorremmo avere una misura sui sottoinsiemi di . Più in generale, dato uno spazio di misura astratto ( ; M; ) a volte ci interessa considerare un sottoinsieme e vorremmo essere sicuri di avere uno spazio di misura su 0 che sia 0 la restrizione di quello già considerato. Questo in e¤etti si può fare in generale, grazie al prossimo risultato, semplice da dimostrare ma che vale la pena di citare esplicitamente. Teorema 8.13 (Restrizione di una misura) Sia ( ; M; ) uno spazio di misura astratto (qualsiasi), e sia 0 ; 0 2 M (cioè 0 è un sottoinsieme misurabile di ). Allora: (a) La famiglia di insiemi M0 = fE0 = E \ 0 : E 2 Mg è una -algebra di sottoinsiemi di 0 . (b) La funzione d’insieme ristretta a M0 è una misura su ( 0 ; M0 ), quindi dà luogo ad un nuovo spazio di misura ( 0 ; M0 ; 0 ) dove 0 = =M0 è detta restrizione della misura a 0 . 78 La costruzione precedente è signi…cativa quando ( 0 ) > 0; altrimenti la misura restrizione è identicamente nulla. In particolare, in Rn , dato un qualsiasi sottoinsieme misurabile 0 di misura positiva, parleremo della misura di Lebesgue in 0 per indicare la restrizione di a 0 . Naturalmente ha interesse anche de…nire una misura “naturale” su insiemi come una curva o una super…cie nello spazio R3 , che estenda il concetto elementare di misura di lunghezza e misura di super…cie che si possono de…nire mediante il calcolo di¤erenziale e integrale su curve e super…ci regolari. Questo è però un altro problema, che considereremo brevemente in seguito e porterà al concetto di misura di Hausdor¤ k-dimensionale. 8.5 Funzioni misurabili Torniamo ora alla teoria generale astratta. Abbiamo uno spazio di misura qualsiasi ( ; M; ) e vogliamo de…nire l’integrale rispetto a questa misura. Ricordando quanto spiegato nell’introduzione, ci attende ancora un passo preliminare, quello di de…nire cosa sono le funzioni misurabili, che saranno quelle per cui la costruzione dell’integrale di Lebesgue è possibile. Cominciamo dal seguente semplice Teorema 8.14 Sia ( ; M) uno spazio misurabile qualsiasi e sia f : Sono equivalenti le seguenti 4 condizioni: 1. fx 2 : f (x) > ag 2 M per ogni a 2 R; 2. fx 2 : f (x) ag 2 M per ogni a 2 R; 3. fx 2 : f (x) < ag 2 M per ogni a 2 R; 4. fx 2 : f (x) ag 2 M per ogni a 2 R. ! R. Dimostrazione. L’equivalenza di 1 e 4 è ovvia perché i due insiemi sono l’uno il complementare dell’altro; analogamente 2 e 3 sono ovviamente equivalenti. L’equivalenza tra 1 e 2, ad esempio, si vede scrivendo fx 2 : f (x) ag = 1 \ n=1 x2 : f (x) > a 1 n ; il che mostra che 2=)1, perché se vale 2 ogni insieme a 2 membro è misurabile, quindi lo è anche la loro intersezione, perciò vale 1; d’altro canto fx 2 : f (x) > ag = 1 [ n=1 x2 : f (x) a+ 1 n ; il che mostra che 1=)2, perché se vale 1 ogni insieme a 2 membro è misurabile, quindi lo è anche la loro unione, perciò vale 2. De…nizione 8.15 Sia ( ; M) uno spazio misurabile qualsiasi e sia f : ! R. Si dice che f è misurabile (su ( ; M)) se vale una delle condizioni equivalenti espresse dal teorema precedente. 79 Esempio 8.16 Sia ( ; M) uno spazio misurabile qualsiasi ed E : De…niamo la funzione caratteristica dell’insieme E (un concetto che ci servirà spesso in seguito), 1 se x 2 E E (x) = 0 se x 2 = E: Allora si vede facilmente che la funzione E è misurabile se e solo se l’insieme E è misurabile. Quindi costruire esempi di funzioni non misurabili è tanto di¢ cile quanto costruire esempi di insiemi non misurabili. Questo suggerisce che la richiesta di misurabilità di una funzione sia una richiesta generalmente molto debole. Esempio 8.17 Sia uno spazio metrico e sia M la -algebra di Borel in : Allora: se f : ! R è continua, f è misurabile. Infatti, per una funzione continua, gli insiemi ai punti 1 e 3 del teorema sopra sono aperti, mentre gli insiemi ai punti 2 e 4 del teorema sono chiusi; in tutti e 4 i casi, sono insiemi di Borel. In particolare se Rn e M è la -algebra degli insiemi Lebesgue misurabili (che come sappiamo contiene la -algebra di Borel), se f : ! R è continua, f è misurabile. Sappiamo quindi che, nel caso basilare che ci interessa, cioè quello della misura di Lebesgue in Rn , le funzioni continue sono misurabili. Vediamo una serie di risultati che dicono come, a partire da funzioni misurabili, costruire altre funzioni misurabili. Prima però facciamo la seguente osservazione. Abbiamo visto come per dare la de…nizione di funzione misurabile non occorra avere uno spazio di misura ( ; M; ), ma solo uno spazio misurabile ( ; M). Tuttavia, nel seguito della teoria ci sono alcune proprietà delle funzioni misurabili che si discutono meglio supponendo di avere già introdotto una misura. Ad esempio, se f è misurabile e g è uguale a f tranne che su un insieme “trascurabile”, vorrei poter concludere che anche g è misurabile. Questo però presuppone la presenza di una misura rispetto alla quale valutare la piccolezza dell’insieme in cui g è diversa da f . Supponiamo quindi d’ora in poi che ( ; M; ) sia uno spazio di misura e la misura inoltre sia completa. Illustriamo subito l’importanza di quest’ipotesi con la prossima proprietà: Proposizione 8.18 Siano f; g : ! R con f misurabile e g = f tranne che su un insieme di misura nulla. Allora g è misurabile. Dimostrazione. Sia E0 = fx 2 nulla. Allora, per ogni a 2 R, : g (x) 6= f (x)g, che per ipotesi ha misura fx 2 : g (x) > ag = = fx 2 : f (x) > ag [ fx 2 : g (x) > a e g (x) 6= f (x)g n fx 2 : f (x) > a e g (x) 6= f (x)g = E1 [ E2 n E3 80 dove E1 è misurabile perché f è misurabile, mentre E2 ; E3 sono misurabili perché sono sottoinsiemi dell’insieme di misura nulla E0 ; e la misura è completa. Pertanto fx 2 : g (x) > ag è misurabile per ogni a 2 R, quindi g è misurabile. In particolare il teorema precedente implica che nel seguito della teoria possiamo considerare funzioni de…nite in salvo al più un insieme di misura nulla o, come si dice comunemente, de…nite quasi ovunque (abbreviato in q.o.). Se f è de…nita q.o. in , possiamo pensare di de…nirla in un qualsiasi modo anche nell’insieme di misura nulla residuo, e la sua misurabilità o meno in non dipende da come l’abbiamo de…nita (quindi, in de…nitiva, possiamo non de…nirla proprio). Teorema 8.19 (Operazioni sulle funzioni misurabili) Siano f; g : ! R misurabili. Allora: f g è misurabile; f g è misurabile; cf è misurabile (se c è una costante reale); f =g è misurabile purché l’insieme in cui g si annulla abbia misura nulla; f + = max (f; 0) ; f = min (f; 0) ; jf j sono misurabili; se : R ! R è continua, (f ) è misurabile; se : R2 ! R è continua, (f; g) è misurabile. La dimostrazione è un noioso esercizio. Il teorema precedente mostra sostanzialmente che ogni sequenza …nita di operazioni su funzioni misurabili produce funzioni misurabili. Ci interessano però anche operazioni in…nite, prima fra tutte il passaggio al limite: è vero che se fn : ! R è una successione di funzioni misurabili convergente puntualmente a f in , anche f è misurabile? Per provare questo non è facile operare direttamente sull’operazione di limite; più facile operare su quella di estremo superiore e inferiore. Proposizione 8.20 Sia fn : di funzioni misurabili, allora ! [ 1; +1] (per n = 1; 2; 3:::) una successione f (x) = sup fn (x) e g (x) = inf fn (x) n n (dove f; g sono anch’esse …nite o in…nite) sono misurabili. La dimostrazione segue subito dal fatto che x2 n x2 : sup fn (x) > a = n o : inf fn (x) < a = n 1 [ n=1 1 [ n=1 fx 2 : fn (x) > ag fx 2 : fn (x) < ag : Vogliamo ricondurre il calcolo del limite a un calcolo di sup / inf, per sfruttare il risultato precedente. Occorre per questo introdurre il concetto di limite superiore e limite inferiore di una successione, che ci servirà anche per altri motivi. 81 1 De…nizione 8.21 Sia fan gn=1 una successione di numeri reali (non necessariamente convergente). Allora la successione bn = sup ak k n è monotona decrescente, quindi ammette limite (…nito o limsupan = inf n n!1 sup ak = lim sup ak : n!+1 k n 1). Si pone k n Analogamente, la successione cn = inf ak k n è monotona crescente, quindi ammette limite (…nito o +1). Si pone liminfan = sup n!1 n inf ak = lim inf ak : n!+1 k n k n L’importanza dei concetti di liminf e limsup è che per ogni successione di numeri reali (limitata o illimitata, convergente o no) liminf e limsup esistono sempre (…niti o in…niti); tra i due numeri vale la relazione liminf an limsup an ; essi coincidono tra loro se e solo se la successione è convergente o divergente, e in quel caso coincidono col limite. n Esempio 8.22 1. Sia an = ( 1) + n1 . Si ha: k bn = sup ( 1) + k n 1 = k 1+ 1+ 1 n se n è pari se n è dispari 1 n+1 quindi limsupan = lim bn = 1: n!1 n!+1 k cn = inf ( 1) + k n 1 = k 1 quindi liminfan = lim cn = n!1 n!+1 1: 2. Sia an = n sin2 n 3 . Si ha: liminfan = 0; limsupan = +1: n!1 n!1 Se ora è fn è una successione di funzioni misurabili in ; dalla misurabilità di supn fn e inf n fn segue subito la misurabilità di limsupfn e liminffn ; e quindi la misurabilità del limite di fn ; quando questo esiste. La completezza della misura consente di provare la seguente versione più ‡essibile del risultato appena annunciato: 82 Teorema 8.23 Sia fn : ! [ 1; +1] (per n = 1; 2; 3:::) una successione di funzioni, ciascuna de…nita q.o. in e misurabile, allora le funzioni liminffn , limsupfn n!1 n!1 sono de…nite q.o. e misurabili. In particolare se esiste f (x), limite puntuale q.o. delle fn (x), f è misurabile. 8.6 Integrazione astratta Abbiamo ora tutti gli ingredienti per de…nire l’integrale rispetto ad una misura (astratta) qualsiasi. L’integrale di una qualsiasi funzione (misurabile) f sarà de…nito come estremo superiore o limite di opportune “somme di Lebesgue di f ”(anziché somme di Cauchy-Riemann), dove queste somme (la cui costruzione è stata anticipata intuitivamente nell’introduzione) si possono vedere come integrali di opportune funzioni approssimanti, le funzioni semplici, che ora introduciamo. Il titolo “integrazione astratta” ricorda che tutta la costruzione che descriveremo in questo paragrafo vale in qualsiasi spazio di misura, ma naturalmente vale anche in particolare nel caso della misura di Lebesgue in Rn , e questo è uno dei casi più interessanti. Nel seguito supporremo sempre che ( ; M; ) sia uno spazio di misura e la misura sia completa. De…nizione 8.24 Si dice che una funzione s : bile e assume un numero …nito di valori. ! R è semplice se è misura- Una funzione semplice si può sempre scrivere nella forma s (x) = n X cj Ej (x) j=1 con E1 ; E2 ; :::; En insiemi misurabili e c1 ; c2 ; :::; cn 2 R. (Ricordare che Ej è la funzione caratteristica di Ej , che vale 1 in Ej e 0 altrove). Gli insiemi si possono scegliere a due a due disgiunti (e allora i numeri cj sono esattamente i possibili valori assunti da s (x)) ma se anche non lo sono la funzione rimane semplice. E’ naturale de…nire l’integrale di s rispetto alla misura come Z s (x) d (x) = n X cj (Ej ) j=1 (pensare al caso della misura di Lebesgue sulla retta; se gli insiemi Ej sono intervalli l’integrale risulta l’area sotto il gra…co della poligonale s (x); naturalmente la teoria è stata fatta proprio per poter considerare le situazioni in cui gli insiemi Ej non sono intervalli ma insiemi molto complicati). L’idea è allora de…nire l’integrale di una funzione misurabile e positiva, per cominciare, come l’estremo 83 superiore degli integrali delle funzioni semplici s (x) f (x). Il problema è se c’è un modo standard di de…nire funzioni semplici che approssimano tanto bene quanto si vuole la funzione f . Questa è esattamente l’idea, che è stata anticipata nell’introduzione, di suddividere in parti uguali l’insieme dei valori assunti da f , anziché il dominio di f . La costruzione è contenuta nel prossimo Teorema 8.25 (Approssimazione con funzioni semplici) Sia f : ! [0; +1] misurabile. Esiste una successione monotona crescente di funzioni semplici sk che converge puntualmente a f in : Se inoltre f è limitata la convergenza è uniforme. Dimostrazione. Fissato un intero k = 1; 2; 3:::; sia Ek = x 2 : f (x) > 2k Ekj = : x2 j 1 2k e siano < f (x) Poniamo j 2k per j = 1; 2; ::::; 22k . 2k sk (x) = 2 k Ek (x) + 2 X j j=1 1 2k Ekj (x) : Si veri…ca che le sk hanno le proprietà richieste. Si osservi in particolare che il fatto che la successione sia monotona crescente dipende dal fatto che ad ogni passo il numero di suddivisioni dell’intervallo 0; 2k (sull’asse y) viene raddoppiato. Si può ora dare la seguente De…nizione 8.26 (Integrale di una funzione positiva) Sia f : ! [0; +1] misurabile. Si pone Z Z f (x) d (x) = sup s (x) d (x) : s semplice, s (x) f (x) (dove l’estremo superiore può essere …nito o +1). Ci si convince facilmente che questo estremo superiore si può realizzare in particolare mediante le sk costruite nel teorema precedente, perciò si può anche scrivere 1 0 Z k2k X j 1 f (x) d (x) = lim @k (Ek ) + Ekj A k k!1 2 j=1 84 vedendo quindi l’integrale come un limite di somme “alla Lebesgue”: Dunque per ogni funzione misurabile e non negativa è ben de…nito (…nito o +1) l’integrale di Lebesgue. Si noti in particolare che in questa teoria il caso in cui la funzione o il dominio sono illimitati vengono trattati direttamente e non, come accadeva per la teoria di Riemann, in un secondo tempo facendo il limite di integrali di funzioni limitate su domini limitati. Per comprendere meglio il signi…cato geometrico della costruzione dell’integrale di Lebesgue, consideriamo il caso particolare in cui f è misurabile, positiva e limitata, 0 f (x) M . La costruzione del teorema precedente si può allora ritoccare ponendo Ekj = x2 : j 1 2k j M 2k M < f (x) per j = 1; 2; ::::; 2k k sk (x) = M k2 X j j=1 Z 0 1 f (x) d (x) = lim @M k!1 Ekj 2k (x) k 2 X j j=1 1 2k Ekj e si ha, per ogni k, k M 2 X j j=1 1 2k Ekj Z 1 A k f (x) d (x) 2 X j M k 2 j=1 Ekj ; dove lo scarto tra l’approssimazione per eccesso e per difetto al passo k non supera, se ha misura …nita, k M 2 X 1 k 2 j=1 k Ekj M 2 1 X 2k j=1 85 Ekj = M ( ) 2k e quindi può essere resa piccola a piacere. In particolare l’integrale in questo caso è certamente …nito. Per esempio, in un intervallo di R, la funzione di Dirichlet (che non è Riemann integrabile), f (x) = 1 per x 2 Q 0 per x 2 =Q è misurabile, q.o. nulla, quindi è Lebesgue integrabile con integrale nullo. Nella teoria di Lebesgue dunque, in particolare, tutte le funzioni misurabili e limitate hanno integrale …nito sugli insiemi di misura …nita. Arriviamo ora alla de…nizione di integrale di Lebesgue per una funzione di segno qualsiasi. De…nizione 8.27 Sia f : ! [ 1; +1] misurabile. Si dice che f è Lebesgue integrabile, o sommabile, se Z jf (x)j d (x) < 1 e in tal caso si pone Z Z f (x) d (x) = f + (x) d (x) e risulta ovviamente Z f (x) d (x) Z Z f (x) d (x) jf (x)j d (x) < 1: Notare che se f è misurabile allora anche jf j lo è (questa è una delle proprietà delle funzioni misurabili che abbiamo elencato), ma il viceversa non è vero: se E è un insieme non misurabile e de…niamo f (x) = 1 per x 2 E 1 per x 2 =E allora f non è misurabile, mentre jf j (funzione costante uguale a 1!) ovviamente lo è. Quindi nella de…nizione precedente è necessario richiedere la misurabilità di f e la …nitezza dell’integrale di jf j, non è possibile esprimere le ipotesi unicamente su jf j. Si confrontino le due de…nizioni di integrale introdotte (per funzioni positive o di segno qualsiasi): per una funzione misurabile e positiva l’integrale è sempre de…nito (…nito o +1) ma per dar senso all’integrale di una funzione di segno variabile richiediamo la …nitezza dell’integrale del modulo, che implica quella della parte positiva e negativa. De…nizione 8.28 Indichiamo con L1 ( ; M; ) ; o più brevemente con L1 ( ) quando M e si possono sottointendere, l’insieme delle funzioni sommabili nel senso della de…nizione precedente. 86 Si veri…ca facilmente che L1 ( ; M; ) è uno spazio vettoriale. Studieremo in seguito questo spazio come spazio vettoriale normato. Occorre naturalmente provare che l’integrale di Lebesgue soddisfa “le solite” proprietà elementari dell’integrale. Premettiamo la seguente de…nizione, che ci serve per dar senso all’integrale di una funzione su un sottoinsieme (misurabile) di : De…nizione 8.29 Se E 2 M; poniamo Z Z f (x) d (x) = (f E ) (x) d (x) E se f è una funzione misurabile in oppure è una funzione misurabile in E e noi la de…niamo zero (o qualunque altro valore!) fuori da E. La de…nizione va intesa nel senso che se f E 2 L1 ( ; M; ) allora diciamo che f 2 L1 E; M=E ; =E e questa uguaglianza ne assegna l’integrale. Teorema 8.30 Siano f; g 2 L1 ( ; M; ) allora 1. Linearità dell’integrale: per ogni c1 ; c2 2 R, Z Z Z [c1 f (x) + c2 g (x)] d (x) = c1 f (x) d (x) + c2 g (x) d (x) ; 2. Monotonia dell’integrale f (x) g (x) q.o. in E; F 2 M; E F; f =) 0 =) Z Z f (x) d (x) f (x) d (x) E Z g (x) d (x) ; Z f (x) d (x) F 3. Proprietà di annullamento se (E) = 0 allora Z f (x) d (x) = 0; E Z se f (x) = 0 q.o. in allora f (x) d (x) = 0; Z se jf (x)j d (x) = 0 allora f (x) = 0 q.o. in : Il teorema precedente si dimostra abbastanza facilmente in base alla de…nizione di integrale, riconducendosi al caso delle funzioni semplici. La proprietà di additività rispetto all’insieme di integrazione, che non è compresa nel teorema precedente, vale in una forma più forte di quella che conosciamo per l’integrale di Riemann; precisamente, vale una numerabile additività, che però enunciamo solo per funzioni positive: 87 1 Teorema 8.31 Sia f : ! [0; +1] misurabile e fEn gn=1 una successione di sottoinsiemi misurabili di a due a due essenzialmente disgiunti14 . Allora Z f (x) d (x) = [1 n=1 En 1 Z X n=1 f (x) d (x) : En Si osservi che questo teorema si può rileggere anche dicendo che una funzione misurabile f : ! [0; +1] induce una nuova misura f su ( ; M) ; de…nita da Z f (x) d (x) : (8.1) f (E) = E Si dice che f è la densità di f (rispetto alla misura originaria ). Serie numeriche come integrali. Consideriamo lo spazio di misura ( ; M; ) dove = N, M = P (N), è la misura del conteggio. Qualsiasi 1 successione fan gn=1 a valori reali si può quindi vedere come una funzione misP1 urabile a (n) su ; se la serie n=1 an risulta assolutamente convergente, la funzione a sarà sommabile e si avrà Z 1 X a (n) d (n) = an : n=1 In altre parole, le serie sono particolari integrali astratti. Nella teoria di Lebesgue quindi l’analisi del discreto e del continuo non hanno più solamente “certe analogie”, ma possono vedersi formalmente come due diverse applicazioni concrete della medesima teoria astratta. Questo è fondamentale ad esempio nelle applicazioni al Calcolo delle Probabilità, che difatti nella sua formulazione moderna, dovuta a Kolmogorov, anni 1930, è fondata sulla teoria astratta della misura. 8.7 Relazione tra integrale di Riemann e integrale di Lebesgue Particolarizziamo ora la de…nizione di integrale astratto al caso della misura di Lebesgue sulla retta R. In questo contesto possiamo ora confrontare le nozioni di integrale di Riemann e integrale di Lebesgue. Per poter e¤ettuare il confronto, mettiamoci nell’insieme delle funzioni limitate de…nite su un intervallo [a; b]. Tra queste, le funzioni sommabili secondo Lebesgue sono tutte e solo le funzioni misurabili. Per confronto, si può dimostrare il seguente Teorema 8.32 Sia f : [a; b] ! R una funzione limitata. Allora f è Riemannintegrabile se e solo se è continua quasi ovunque (dove l’espressione “quasi ovunque” ha il solito signi…cato, quindi signi…ca che l’insieme dei punti di discontinuità ha misura di Lebesgue nulla). 1 4 Due insiemi misurabili si dicono essenzialmente disgiunti se la loro intersezione ha misura nulla. In particolare, due insiemi disgiunti sono anche essenzialmente disgiunti. 88 Poiché si può dimostrare che tutte le funzioni continue quasi ovunque sono misurabili, ne segue che tutte le funzioni Riemann integrabili 15 sono anche Lebesgue integrabili. L’integrale che abbiamo costruito è quindi e¤ettivamente più generale di quello che conoscevamo dalla teoria classica. Per esempio, come sappiamo la funzione di Dirichlet (uguale a 1 sui razionali e 0 sugli irrazionali) non è Riemann integrabile, e difatti è discontinua ovunque. Dal punto di vista della teoria di Lebesgue la funzione di Dirichlet è indistinguibile dalla funzione identicamente nulla, ovviamente integrabile. Un esempio più interessante è il seguente: Esempio 8.33 Consideriamo il ternario di Cantor generalizzato T costruito nel § 8.3, con < 1=3, che come si ricorderà ha misura positiva, e sia f : [0; 1] ! R f (x) = T (x) : Come qualsiasi funzione caratteristica di un insieme, questa funzione è discontinua nei punti di frontiera dell’insieme stesso. D’altro canto, una delle proprietà signi…cative di T , dovuta alla sua particolare de…nizione iterativa, è quella di non contenere interamente alcun intervallo (a; b) (ce ne si rende facilmente conto se si pensa che ogni intervallino che costituisce Tn viene spezzato in 3 intervallini più brevi al passo n + 1, e di questi quello centrale viene rimosso; quindi l’insieme …nale T non contiene alcun intervallino, per quanto breve). Ma allora T non possiede alcun punto interno, perciò tutti i suoi punti sono di frontiera. Questo implica che la funzione caratteristica T è discontinua in tutti i punti di T , che ha misura positiva. Pertanto, per il teorema precedente, T non è Riemann integrabile. D’altro canto T è sommabile secondo Lebesgue, con integrale pari alla misura di Lebesgue di T . L’esempio è interessante perché questa funzione, a di¤ erenza della funzione di Dirichlet, non può essere resa continua alterandola su un insieme di misura nulla. Per poter calcolare e¤ettivamente l’integrale di Lebesgue in casi semplici ma signi…cativi è indispensabile capire anche la relazione tra integrale di Lebesgue e integrale di Riemann generalizzato. Consideriamo prima il caso dell’integrale di Riemann generalizzato di una funzione limitata su un intervallo illimitato. Ricordiamo la seguente: De…nizione 8.34 Sia f : (a; +1) ! R una funzione limitata, con la proprietà di essere Riemann integrabile su ogni intervallo (a; k) (per k > a). Se esiste …nito Z k lim f (x) dx = l k!+1 a allora si dice che l’integrale di Riemann generalizzato Z +1 f (x) dx a 1 5 In senso proprio, non generalizzato. Della relazione tra integrale di Lebesgue e integrale di Riemann generalizzato diremo qualcosa tra breve. 89 converge, ed è uguale a l. Si può dimostrare il seguente Teorema 8.35 Nelle ipotesi della de…nizione precedente, si supponga inoltre che per qualche k a si abbia f (x) 0 per ogni x k (oppure f (x) 0 per ogni x k). Allora se l’integrale di Riemann generalizzato di f converge, la funzione f è anche sommabile secondo Lebesgue, e il suo integrale di Lebesgue su (a; +1) è uguale all’integrale generalizzato. In pratica, l’ipotesi richiede che la funzione f non cambi di segno in…nite volte per x ! +1. Un discorso analogo vale ovviamente per l’integrale generalizzato su ( 1; 0). Qualche esempio chiarirà i modi in cui solitamente si ragiona. Esempio 8.36 Si consideri Z 1 x 1 sin dx: 1 + x4 x 0 Si osservi che la funzione è continua e limitata in (0; +1) (in particolare tende a zero per x ! 0+ ), quindi è Riemann integrabile su ogni intervallo (0; k). Inoltre, f cambia di segno in…nite volte vicino all’origine, ma è positiva per ogni x > 1= . Quindi il teorema è applicabile. Controlliamo se l’integrale generalizzato di f converge. 1 x sin 1 + x4 x x 1 + x4 1 per x ! +1, x3 perciò l’integrale generalizzato converge assolutamente, e quindi converge. Ne segue che f è sommabile secondo Lebesgue. Si poteva in realtà anche tralasciare la veri…ca sui cambi di segno di f ragionando direttamente su jf j, così: la funzione jf j è continua e limitata su (0; +1), non negativa, integrabile in senso generalizzato, quindi jf j è Lebsegue sommabile; poiché f è ovviamente misurabile, anche f è Lebsegue sommabile. Esempio 8.37 Si consideri: Z 1 +1 sin x dx: x2 La funzione cambia di segno in…nite volte per x ! 1, perciò non si può applicare il teorema direttamente a f , ma lo si può applicare a jf j: poiché jf j è continua, limitata, non negativa, e 1 jf (x)j ; x2 jf j è integrabile in senso generalizzato perciò è anche Lebesgue sommabile; d’altro canto f è misurabile perché continua, quindi anche f è Lebsegue sommabile. 90 Esempio 8.38 Si consideri: Z +1 sin x dx: x 1 La funzione cambia di segno in…nite volte per x ! 1, perciò non si può applicare il teorema direttamente a f . D’altro canto ragionando su jf (x)j non si riesce a concludere la convergenza dell’integrale generalizzato. Il teorema non è quindi in questo caso di alcuna utilità per stabilire l’esistenza o la non esistenza dell’integrale di Lebesgue. Si può dimostrare che: 1. L’integrale generalizzato di f converge, ma: 2. la funzione f non è Lebesgue sommabile, in quanto l’integrale di Lebesgue di jf (x)j diverge. Questo esempio mostra quindi un tipo di situazione in cui l’integrabilità secondo Lebesgue risulta una condizione più esigente dell’integrabilità in senso generalizzato secondo Riemann. L’idea geometrica soggiacente è la seguente: nell’integrale generalizzato di una funzione che cambia di segno in…nite volte si possono avere compensazioni tra le aree con segno delle porzioni del gra…co di f che stanno ora sopra ora sotto l’asse delle x; l’integrale di Lebesgue richiede invece di calcolare prima il contributo totale della parte di gra…co sopra l’asse delle x, poi quello della parte sotto l’asse delle x, e poi sottrarre: se entrambi questi numeri sono in…niti, l’integrale perde signi…cato, non consentendo quindi le compensazioni parziali che avvenivano calcolando l’integrale su (0; k) e facendo poi tendere k a +1. Proviamo ora le due a¤ ermazioni fatte. 1. Mostriamo la convergenza dell’integrale generalizzato Z 1 +1 sin x dx = lim k!+1 x Z 1 k sin x dx: x Integrando per parti: Z 1 k cos x x dove l’integrale generalizzato k Z k cos x dx x2 1 1 Z k cos k cos x = + cos 1 dx k x2 1 Z +1 cos x ! cos 1 dx x2 1 sin x dx = x R +1 1 cos x x2 dx cos x x2 91 converge perché 1 : x2 2. Proviamo che f non è però assolutamente integrabile secondo Lebsegue. Z 1 +1 sin x dx x Z 1 Z 5 +2k X 6 sin x sin x dx dx = 5 1 x x [k=1 [ 6 +2k ; 6 +2k ] k=1 6 +2k 1 1 Z 5 +2k 2 X 6 1X 1=2 3 dx = +1 5 x 2 + 2k +2k k=1 6 k=1 6 in quanto la serie numerica diverge, essendo 2 3 5 6 + 2k 1 ; 3k serie armonica divergente. Un discorso completamente analogo si può fare per l’integrale di Riemann generalizzato per una funzione illimitata su un intervallo illimitato: De…nizione 8.39 Sia f : (a; b] ! R una funzione con la proprietà di essere limitata e Riemann integrabile su ogni intervallo [a + "; b] (per " > 0). Se esiste …nito Z b lim f (x) dx = l "!0+ a+" allora si dice che l’integrale di Riemann generalizzato Z b f (x) dx a converge, ed è uguale a l. Si può dimostrare il seguente Teorema 8.40 Nelle ipotesi della de…nizione precedente, si supponga inoltre che per qualche "0 > 0 si abbia f (x) 0 per ogni x 2 (a; a + "0 ) (oppure f (x) 0 per ogni x 2 (a; a + "0 )). Allora se l’integrale di Riemann generalizzato di f converge, la funzione f è anche sommabile secondo Lebesgue, e il suo integrale di Lebesgue su (a; b) è uguale all’integrale generalizzato. In questo caso ciò che va escluso è che la funzione cambi di segno in…nite volte in ogni intorno del punto a in cui la funzione è illimitata. Se la funzione non ha in…niti cambi di segno, la convergenza dell’integrale di Riemann generalizzato implica la Lebesgue sommabilità della funzione; se invece la funzione ha in…niti cambi di segno, si può provare la Lebesgue sommabilità mostrando la convergenza dell’integrale generalizzato del modulo di f . Rimane la possibilità, però, che una funzione con in…niti cambi di segno in un intorno di un punto in cui è illimitata abbia integrale di Riemann generalizzato convergente e tuttavia non sia Lebesgue sommabile. 92 Esempio 8.41 Consideriamo Z 1 0 1 1 p sin dx: x x La funzione è continua e limitata (quindi Riemann integrabile) in ogni intervallo ["; 1] per " > 0. Poiché 1 1 1 p ; p sin x x x per i criteri di integrabilità l’integrale di Riemann generalizzato di jf j converge, quindi (essendo ovviamente f misurabile), f è Lebesgue sommabile. Esempio 8.42 Consideriamo Z 0 1 1 1 sin dx: x x In questo caso la maggiorazione 1 1 sin x x 1 x è inconcludente, perché l’integrale generalizzato di 1=x diverge; d’altro canto la funzione cambia di segno in…nite volte in (0; 1), perciò il teorema precedente non è di aiuto a stabilire se la funzione è Lebesgue sommabile oppure no. Si può dimostrare che non lo è, e che tuttavia l’integrale generalizzato di Riemann converge. Infatti il cambio di variabili: Z 1 1 1 sin dx = 1=x = t; dx = 1=t2 dt x 0 x Z +1 sin t = dt t 1 riconduce l’integrale a quello dell’Esempio 8.38. 8.8 I teoremi di convergenza per l’integrale di Lebesgue Finora abbiamo costruito l’integrale di Lebesgue, ne abbiamo elencato le proprietà di base, abbiamo constatato (ultimo paragrafo) che le funzioni Lebesgue integrabili sono più di quelle Riemann integrabili, ma non abbiamo realmente illustrato i vantaggi di questo integrale rispetto a quello classico. I vantaggi consistono soprattutto in alcuni importanti teoremi sul passaggio al limite per successioni, che qui presenteremo, e che hanno importanti conseguenze. Torniamo ancora nel contesto astratto di un qualsiasi spazio di misura ( ; M; ), in cui supponiamo come in precedenza che la misura sia anche completa. 93 Teorema 8.43 (della convergenza monotona) Sia fn : ! [0; +1] una successione di funzioni misurabili, monotona crescente, cioè fn (x) fn+1 (x) per ogni intero n e x 2 . Allora Z Z lim fn (x) d (x) = lim fn (x) d (x) n!+1 n!+1 dove i due membri dell’uguaglianza possono essere …niti o in…niti. (L’esistenza dei due limiti è parte della tesi). Dimostrazione. Poiché una successione monotona crescente di numeri reali ha sempre limite (…nito o +1), è ben de…nita la funzione f : ! [0; +1] f (x) = lim fn (x) per ogni x 2 . n!+1 La funzione f è misurabile e non negativa perché R limite di funzioni misurabili e non negative, quindi esiste, …nito o +1, f (x) d (x). Inoltre per la monotonia dell’integrale, Z Z fn (x) f (x) =) fn (x) d (x) f (x) d (x) e per il teorema di permanenza del segno Z fn (x) d (x) lim n!+1 Z f (x) d (x) : (8.2) Rimane da provare la disuguaglianza opposta. Ricordando la de…nizione di integrale di una funzione positiva, sia s (x) una qualsiasi funzione semplice f (x) in e, …ssato un qualsiasi numero c 2 (0; 1) ; consideriamo gli insiemi En = fx 2 Abbiamo allora per ogni intero n: Z Z fn (x) d (x) : fn (x) fn (x) d (x) En D’altro canto: poiché per ogni x 2 1 [ cs (x)g : Z cs (x) d (x) (8.3) En è fn (x) ! f (x) s (x) ; En = ; n=1 inoltre per la monotonia delle fn è En En+1 , quindi En % e per la continuità dal basso della misura, (En ) ! (E) per ogni misura su ( ; M), in particolare per la misura di densità cs (x) (v. (8.1)). Quindi se nella (8.3) passiamo al limite per n ! 1 abbiamo Z c s (x) d (x) : 94 Questo vale per ogni numero c 2 (0; 1) quindi per c ! 1 abbiamo Z s (x) d (x) : In…ne, questo vale per ogni funzione semplice s (x) f (x), perciò passando al sup su tutte queste s (x) ; per de…nizione di integrale di f abbiamo Z f (x) d (x) ; che, ricordando (8.2), è quanto restava da provare. Teorema 8.44 (di Fatou) Sia fn : misurabili, allora Z liminfn!1 fn (x) d (x) ! [0; +1] una successione di funzioni liminfn!1 Z fn (x) d (x) dove, come nel teorema precedente, i due membri possono essere …niti o in…niti. Si noti che in questo teorema non si suppone a priori l’esistenza di alcun limite; tuttavia, ricordiamo che il liminf di una successione esiste sempre. Conviene ricordarne la de…nizione: liminfn!1 an = sup n inf ak = lim n!+1 k n inf ak : k n Dimostrazione. La successione di funzioni inf fk (x) k n 1 n=1 per de…nizione è monotona crescente, quindi possiamo applicare ad essa il teorema della convergenza monotona, e a¤ermare che Z Z liminfn!1 fn (x) d (x) = lim inf fk (x) d (x) n!+1 k n Z = lim inf fk (x) d (x) : n!+1 k n Ora è su¢ ciente maggiorare nell’ultimo integrale: inf fk (x) k n fn (x) : Tuttavia così facendo non possiamo più essere certi che la successione degli integrali che ne risulta abbia limite; ne esiste però certamente il liminf. La catena di passaggi è quindi: Z Z liminfn!1 fn (x) d (x) = lim inf fk (x) d (x) = n!+1 k n Z Z = liminfn!1 inf fk (x) d (x) liminfn!1 fn (x) d (x) : k n 95 I due teoremi precedenti riguardano una successione di funzioni misurabili e positive, e considerano integrali …niti o in…niti. Il prossimo teorema invece considera successioni di funzioni di segno qualsiasi, ma sommabili. Questo è probabilmente il più importante teorema della teoria di Lebesgue: Teorema 8.45 (della convergenza dominata, o “teorema di Lebesgue”) Sia fn : ! [ 1; +1] una successione di funzioni misurabili, convergente puntualmente (quasi ovunque) a una certa funzione f . Supponiamo che esista una funzione g sommabile in tale che per ogni intero n sia jfn (x)j Allora In particolare, Z jfn (x) lim n!1 g (x) per q.o. x 2 : f (x)j d (x) ! 0 per n ! 1: Z fn (x) d = cioè il limite si scambia con l’integrale. Z f (x) d La funzione g che compare nell’ipotesi del teorema si chiama funzione dominante integrabile (perché domina, cioè maggiora, il modulo delle fn ), da cui il nome del teorema. Dimostrazione. Dall’ipotesi jfn (x)j g (x) e fn (x) ! f (x) (q.o.) ricaviamo che anche jf (x)j g (x) (q.o), quindi la successione n = 2g jfn fj è non negativa (q.o.); inoltre n (x) ! 2g (x) q.o.; possiamo applicare a Teorema di Fatou, ottenendo Z Z Z 2gd = liminf n d liminf nd n!1 n!1 Z Z Z [2g jfn f j] d = 2gd + liminf jfn f j d = liminf n il n!1 n!1 R e sempli…cando ai due membri la quantità (…nita per ipotesi) 2gd abbiamo Z Z 0 liminf jfn f j d = limsup jfn f j d n!1 n!1 cioè limsup n!1 Z jfn f j d = 0; R quindi jfn (x) f (x)j d (x) ! 0: In…ne, Z Z Z [fn (x) f (x)] d fn (x) d f (x) d = 96 Z jfn (x) f (x)j d (x) perciò è anche R fn (x) d ! R f (x) d , e la dimostrazione è completa. Vediamo ora qualche esempio pratico di passaggio al limite sotto il segno di integrale per l’integrale di Lebesgue, a confronto con quanto si può dire nella teoria dell’integrale di Riemann. Nella teoria di Riemann, se ffn g è una successione di funzioni fn : [a; b] ! R limitate e Riemann integrabili e inoltre fn ! f uniformemente in [a; b], si può Rb Rb garantire che a fn (x) dx ! a f (x) dx. Supponiamo di sapere soltanto che le funzioni fn sono misurabili, jfn (x)j c per ogni x 2 [a; b] e per ogni n, e inoltre fn ! f puntualmente quasi ovunque in [a; b]. Per il teorema di Lebesgue della Rb Rb convergenza dominata risulterà a fn (x) dx ! a f (x) dx, sotto ipotesi che quindi sono molto più deboli della convergenza uniforme. 1=n Esempio 8.46 Sia fn (x) = jxj in [ 1; 1]. Si ha fn (x) ! 1 q.o. ma non uniformemente (poiché fn (0) = 1 si ha kfn 1k1 = 1). Perciò la teoria di Riemann non è applicabile. In base al teorema della convergenza dominata, invece, essendo jfn (x)j 1 (e la costante è integrabile in [ 1; 1]) risulta R1 R1 f (x) dx ! 1dx = 2. 1 n 1 nx in [0; +1): Controlliamo anzitutto che ciasEsempio 8.47 Sia fn (x) = sin nx3=2 nx 1 cuna fn 2 L1 . Per x ! 0 è fn (x) = x1=2 , integrabile in un intorno nx3=2 sin nx 1 di 0. D’altro canto jfn (x)j = nx3=2 , integrabile in un intorno di 1. nx3=2 Perciò fn 2 L1 [0; +1): Per n ! 1; fn (x) ! 0 puntualmente ovunque. Cerchiamo una dominante integrabile su [0; +1). Per trovarla è più semplice ragionare separatamente sugli intervalli [0; 1] e [1; +1). Si ha: 1 nx = x1=2 2 L1 [0; 1] (abbiamo usato la disugper x 2 [0; 1] ; jfn (x)j nx3=2 uaglianza jsin tj jtj); 1 1 2 L1 [1; +1) (abbiamo usato le per x 2 [1; +1); jfn (x)j nx3=2 x3=2 disuguaglianze jsin tj 1 e 1=n 1). Dunque jfn (x)j g (x) = 1 x1=2 1 x3=2 per x 2 [0; 1] per x 2 [1; +1) con g 2 L1 [1; +1); perciò il teorema di Lebesgue è applicabile, e Z +1 Z +1 fn (x) dx ! 0dx = 0: 0 0 Si osservi che, diversamente dall’esempio precedente, questa volta la maggiorante integrabile è una funzione illimitata. Si poteva anche, del resto, valutare direttamente l’integrale: Z +1 Z +1 sin nx dt sin t dt dx = nx = t; dx = = 3=2 3=2 n n nx 0 0 n nt Z +1 c 1 sin t dt = p ! 0 per n ! 1 =p n 0 n t3=2 97 R +1 sin t perché c = 0 dt è una costante (abbiamo dimostrato all’inizio che ogni t3=2 fn è L1 , questa integranda è f1 ). 8.9 Lo spazio L1 Abbiamo introdotto lo studio della teoria di Lebesgue con l’esigenza di costruire uno spazio vettoriale di funzioni integrabili che, normato con una norma integrale, risulti completo. Lo scopo principale di questo paragrafo è mostrare che lo spazio L1 ( ; M; ) è uno spazio vettoriale normato completo. Occorre anzitutto una precisazione. Se de…niamo in L1 ( ; M; ) Z kf kL1 ( ;M; ) = jf (x)j d (x) questa risulta soddisfare le proprietà della norma, tranne quella di annullamento. Infatti, come visto nel Teorema 8.30, kf kL1 ( ;M; ) = 0 =) f (x) = 0 q.o. in : Per ottenere una norma è quindi necessario identi…care funzioni uguali q.o. tra loro, ossia introdurre in L1 la relazione di equivalenza f g se f = g q.o. e considerare lo spazio delle classi di equivalenza di funzioni, che può essere reso uno spazio vettoriale normato a questo modo, come spiegato nel § 7.1. Questa operazione è coerente anche perché la misura è completa, perciò se f è misurabile e g = f q.o., anche g è misurabile. Naturalmente sul piano intuitivo continueremo a pensare gli elementi di L1 come funzioni, che sono tra loro indistinguibili quando sono uguali quasi ovunque; sul piano formale, invece, gli elementi di L1 sono classi d’equivalenza di funzioni. Possiamo ora, sfruttando vari fatti dimostrati …n qui, provare anzitutto un’a¤ermazione fatta nell’introduzione, ossia: Proposizione 8.48 Lo spazio vettoriale delle funzioni limitate e Riemannintegrabili su un intervallo [a; b], normato con la norma integrale kf kL1 = Z b a jf (x)j dx (dopo aver identi…cato due funzioni f; g ogni volta che non è completo. Rb a jf (x) g (x)j dx = 0) Dimostrazione. Consideriamo il ternario di Cantor T corrispondente a un < 1=3; che ha misura di Lebesgue positiva, gli insiemi Tn che compaiono nella sua costruzione iterativa, e poniamo fn : [0; 1] ! R fn = Tn : 98 Ogni insieme Tn è l’unione di un numero …nito di intervalli chiusi, quindi la sua frontiera è costituita da un numero …nito di punti (gli estremi di tutti questi intervalli); pertanto fn è discontinua in un numero …nito di punti, perciò è Riemann integrabile. Questa è dunque una successione di funzioni in R [0; 1]. Per n ! 1; fn (x) ! T (x). Inoltre jfn (x)j 1, e la costante è integrabile in [0; 1] ; quindi per il teorema della convergenza dominata kfn T kL1 ! 0: Perciò la successione è di Cauchy in L1 [0; 1], e quindi anche in R [0; 1]. D’altro canto abbiamo dimostrato in precedenza che T non è Riemann integrabile. Quindi fn è una successione di Cauchy in R [0; 1] che non converge in R [0; 1], e questo spazio non è completo. Passiamo ora al risultato positivo che ci interessa: Teorema 8.49 Lo spazio vettoriale normato L1 ( ; M; ) (de…nito indenti…cando funzioni uguali q.o.) è completo. Per provare il teorema ci servirà il seguente risultato astratto: Proposizione 8.50 Sia X uno spazio vettoriale normato. Allora X è completo 1 se e solo se, per ogni successione fxn gn=1 di elementi di X si ha che: se la serie numerica 1 X n=1 la serie 1 X kxn k converge in R, allora xn converge in X, n=1 ossia esiste x 2 X tale che n X k=1 xk x ! 0 per n ! 1: Dimostrazione. Il fatto che se X è completo allora vale l’implicazione segnalata si dimostra facilmente, e lo lasciamo per esercizio anche perché questa è la parte del teorema che non ci servirà. Dimostriamo invece la parte del teorema che sfrutteremo per provare la completezza di L1 ossia: se la convergenza della serie delle norme implica la convergenza della serie in X, allora X è completo. 1 Consideriamo quindi una successione fxn gn=1 di Cauchy in X, e proviamo che converge. Per de…nizione di successione di Cauchy, possiamo estrarre da fxn g una successione fxnk g tale che per ogni k = 1; 2; 3; ::: sia xnk+1 xnk 99 1 . k2 P1 Dunque xnk converge in R e per la proprietà che vale per nk+1 k=1 x P 1 ipotesi, la serie x xnk converge in X ad un certo elemento x. nk+1 k=1 Ossia: N X xnk+1 xnk ! x per N ! 1: k=1 D’altro canto N X xnk+1 xnk = xnN +1 xn1 k=1 (somma telescopitca), quindi xnN +1 xn1 ! x e xnN +1 ! x + xn1 per N ! 1. Abbiamo quindi provato che la successione fxn g contiene una sottosuccessione convergente, il che unito alla condizione di Cauchy implica16 la convergenza di tutta la successione fxn g. Veniamo ora alla Dimostrazione del teorema di completezza. Proveremo che L1 ( ; M; ) è completo mostrando che vale la proprietà enunciata nella Proposizione prece1 dente. Sia quindi ffn gn=1 una successione di funzioni in L1 ( ; M; ) di cui sappiamo che 1 X kfn kL1 < 1 P1 n=1 1 e proviamo che la serie n=1 fn converge in L ( ; M; ). Introduciamo la successione delle somme parziali gk (x) = k X n=1 jfn (x)j : Le funzioni gk sono non negative e la loro successione è monotona crescente; sia g (x) = lim gk (x) : k!1 Per il teorema della convergenza monotona si ha Z gd = lim k!1 Z X k n=1 jfn j d = lim k!1 k Z X n=1 jfn j d = 1 Z X n=1 jfn j d < 1 per ipotesi. Si noti che lo scambio tra integrale e sommatoria è stato fatto su una sommatoria …nita, quindi è senz’altro lecito; inoltre, il limite della somma parziale è per de…nizione la serie. Abbiamo dimostrato quindi che g è sommabile, e in particolare g (x) è …nita q.o. Ciò signi…ca, essendo per la monotonia Pk P1 g (x), che la serie n=1 jfn (x)j = gk (x) n=1 fn (x) converge (per q.o. x) assolutamente e quindi puntualmente. Sia dunque f (x) = 1 X fn (x) : n=1 1 6 come nella dimostrazione della completezza di R: 100 Per la permanenza del segno si ha anche jf (x)j g (x) ; quindi anche f è sommabile. Introduciamo ora le somme parziali della serie senza i moduli, sk (x) = k X fn (x) : n=1 Avremo jsk (x) f (x)j 2g (x) ; dominante integrabile, e poiché sk (x) ! f (x) puntualmente, per il teorema della convergenza dominata ksk f k ! 0; cioè la P1 serie n=1 fn converge in L1 , e per il criterio della Proposizione precedente L1 è completo. Enunciamo in…ne il seguente fatto, che si può dimostrare combinando le tecniche delle due dimostrazioni precedenti: Proposizione 8.51 Da ogni successione ffn g di Cauchy in L1 , e quindi convergente a una certa f in L1 , si può estrarre una sottosuccessione che converge a f anche in senso puntuale quasi ovunque. 8.10 Il teorema fondamentale del calcolo integrale Tra le proprietà di base dell’integrale di Riemann che ancora non abbiamo rivisitato all’interno della teoria di Lebesgue ci sono i due teoremi fondamentali del calcolo integrale, espressi rispettivamente dalle uguaglianze Z b F 0 (x) dx = F (b) F (a) (8.4) a d dx Z x f (t) dt = f (x) : (8.5) a Cominciamo dal secondo (che in e¤etti viene spesso dimostrato per primo). Per l’integrale di Riemann sappiamo che l’ipotesi naturale sotto cui vale è che f sia continua in [a; b]; allora per ogni x 2 [a; b] vale la (8.5). Ciò signi…ca che questa fondamentale proprietà dell’integrale di Riemann viene stabilita quando la funzione integranda appartiene ad una classe ben più ristretta di quella delle funzioni Riemann integrabili. Questa è certamente un’altra caratteristica insoddisfacente della teoria classica dell’integrazione ed in e¤etti, anche se noi abbiamo motivato l’introduzione dell’integrale di Lebesgue con l’esigenza di de…nire uno spazio di Banach di funzioni integrabili (munito di una norma integrale), storicamente la principale motivazione di Lebesgue fu proprio quella di de…nire un tipo di integrale per cui l’identità (8.5) potesse essere stabilita senza eccezioni per tutte le funzioni integrabili17 . Enunciamo quindi, senza dimostrazione, il teorema che si può dimostrare nella teoria di Lebesgue: 1 7 Questo è proprio quanto scrive Lebesgue nella prima pagina dell’Introduzione alla sua tesi del 1902 in cui introduce la nuova teoria della misura e dell’integrazione. 101 Teorema 8.52 Sia f 2 L1 [a; b] ; x0 2 [a; b] e sia Z x F (x) = f (t) dt: x0 Allora la funzione F è continua; inoltre per q.o. x 2 [a; b] la funzione F è derivabile in x e per q.o. x vale F 0 (x) = f (x). Qualche osservazione. Ricordiamo che una funzione f 2 L1 [a; b] è in realtà una classe d’equivalenza di funzioni, o se vogliamo è de…nita solo quasi ovunque. Tuttavia, qualunque sia la particolare funzione f che noi Rscegliamo x come rappresentante della classe d’equivalenza, il valore dell’integrale x0 f (t) dt non cambia, per x0 e x …ssati. Questo signi…ca che la funzione F (x) è de…nita in modo univoco in ogni punto x 2 [a; b] (coerentemente al fatto che il teorema dimostra che F è continua: alterando una funzione continua in un insieme di misura nulla si trova in generale una funzione discontinua); invece la f può essere alterata su insiemi di misura nulla. Il teorema a¤erma anzitutto che questa ben de…nita funzione F è derivabile in quasi ogni punto di [a; b] ; meglio di questo non si può sperare, cioè non possiamo aspettarci che F sia derivabile in ogni punto, come mostra il prossimo semplice Esempio 8.53 f (t) = e F (x) = Z 1 per t 0 0 per t < 0 x f (t) dt = 0 x per t 0 0 per t < 0: La funzione F non è derivabile nel punto x = 0. La seconda a¤ermazione del teorema consiste nell’uguaglianza F 0 (x) = f (x) quasi ovunque. Di nuovo, meglio di questo non si può sperare, perché se anche F 0 (x) esistesse ovunque, non potremmo garantire a priori che F 0 (x) sia uguale a f (x) ovunque, dal momento che il valore f (x) può essere alterato in un insieme di misura nulla senza cambiare la funzione F (x): Esempio 8.54 Le funzioni f1 (t) = 0 in [0; 1] f2 (t) = 1 per t 2 Q 0 per t 2 =Q sono rappresentanti diversi della stessa classe d’equivalenza, ossia sono la stessa funzione L1 [0; 1]. Per questa funzione si ha Z x F (x) = fi (t) dt = 0 (i = 1; 2) , e quindi 0 F 0 (x) = 0. Come si vede F 0 (x) è uguale quasi ovunque a f2 (x) (mentre è uguale ovunque a f1 (x)). 102 Le osservazioni precedenti mostrano che il risultato contenuto nel teorema è ottimale. Del resto l’uguaglianza tra due funzioni L1 è per de…nizione una uguaglianza quasi ovunque. Veniamo ora all’altro teorema fondamentale del calcolo integrale, cioè la (8.4). Nella teoria di Riemann si richiede che F 0 sia una funzione continua, quindi che F 2 C 1 [a; b]; di nuovo, si chiede qualcosa che è più forte delle ipotesi minime sotto le quali l’integrale di F 0 ha senso. D’altro canto la continuità di F 0 non si può far cadere impunemente: Esempio 8.55 Sia F (x) = 1 per x 0 0 per x < 0: Ovviamente esiste F 0 (x) = 0 per ogni x 6= 0 e la funzione F 0 (costante al di fuori di un unico punto in cui non è de…nita) è Riemann integrabile, ma l’uguaglianza (8.4) è falsa perché Z 1 F 0 (x) dx = 0; mentre 1 F (1) F ( 1) = 1: Si osservi, per confronto, il prossimo esempio: Esempio 8.56 Sia F (x) = jxj 0 Anche in questo caso esiste F (x) = sgn (x) per ogni x 6= 0 e la funzione F 0 è Riemann integrabile, anche se non è de…nita in x = 0 ed ha una discontinuità a salto. Le ipotesi del teorema fondamentale del calcolo integrale (nella teoria di Riemann) non sono veri…cate, quindi. Tuttavia l’uguaglianza (8.4) sussiste in questo caso perché Z 1 Z 0 Z 1 F 0 (x) dx = 1dx + 1dx = 1 + 1 = 0; e 1 F (1) 1 F ( 1) = 1 0 1 = 0: Questo esempio, che nel contesto della teoria di Riemann è anomalo (pur non contraddicendo alcun teorema), nella teoria di Lebesgue, come vedremo, è inquadrato in modo naturale. Per orientarci su quali possano essere le ipotesi minime per la validità di (8.4) ragioniamo così. Se F : R ! R è una funzione per cui vale la (8.4) per ogni a; b; possiamo anche scrivere Z x F (x) = F (x0 ) + F 0 (t) dt; x0 il che signi…ca che F (x) è in tal caso la funzione integrale di una opportuna funzione integrabile (la F 0 ); abbiamo visto d’altro canto (Teorema 8.52) che 103 la funzione integrale di una funzione integrabile è sempre una funzione continua; possiamo trarre quindi subito questa conseguenza: condizione necessaria a¢ nché valga la (8.4) è che F sia una funzione continua dotata quasi ovunque di derivata F 0 , con F 0 integrabile. Ci siamo così molto avvicinati alle ipotesi e¤ettive che il primo teorema fondamentale del calcolo integrale richiede nella teoria di Lebesgue. Per poter enunciare con precisione tale teorema occorre prima introdurre una nuova nozione: De…nizione 8.57 Sia f : [a; b] ! R. Si dice che f è assolutamente continua in [a; b] (scriveremo f 2 AC [a; b]) se per ogni " > 0 esiste un > 0 tale che per ogni successione di intervalli [an ; bn ] (n = 1; 2; 3; :::), contenuti in [a; b] ; disgiunti tra loro, e aventi lunghezza complessiva < , ossia 1 X n=1 si ha che 1 X n=1 jbn an j < ; jf (bn ) f (an )j < ": Questa nozione naturalmente implica la continuità, ma è più forte di essa. Esempio 8.58 1. Se una funzione è Lipschitziana, cioè jf (x1 ) f (x2 )j L jx1 x2 j 8x1 ; x2 2 [a; b] allora è assolutamente continua (…ssato " basta scegliere = "=L). 2. In particolare, se f 2 C 1 [a; b] allora f 2 AC [a; b] (perché ogni funzione 1 C è lipschitziana). 3. Le condizioni 1 o 2 non sono però necessarie a¢ nché f sia assolutamente continua. Ad esempio, si dimostri per esercizio che p f (x) = x è AC [0; 1] (mentre non è Lip[0; 1]). 3. Un esempio di funzione continua ma non assolutamente continua è il seguente, in [0; 1]: x sin x1 se x > 0 f (x) = 0 per x = 0: Infatti: sia ak = 1 ; bk = + 2k 3 2 1 2 1 + 2k per k = 1; 2; 3; ::: Si ha: 1 X k=1 jbk ak j = 1 X k=1 1 2 1 + 2k 3 2 1 + 2k 104 = 1 X k=1 1 2 + 2k 3 2 + 2k ; serie convergente, mentre 1 X k=1 jf (bk ) f (ak )j = 1 X 1 2 k=1 1 + + 2k 3 2 1 + 2k ; serie divergente. Questo signi…ca che …ssato " = 1 e …ssato qualsiasi possiamo rendere 1 X jbk ak j < > 0; k=N pur di scegliere un N opportunamente grande (il resto di una serie convergente tende a zero), e tuttavia 1 X k=N jf (bk ) f (ak )j = 1: La rilevanza del concetto di assoluta continuità nella teoria di Lebesgue è dovuta anzitutto al seguente: Teorema 8.59 Sia f 2 L1 [a; b] ; x0 2 [a; b] e Z x F (x) = f (t) dt: x0 Allora F 2 AC [a; b]. Il Teorema 8.52 già a¤ermava che F è continua e q.o. derivabile; apprendiamo ora che F è anche assolutamente continua. Poiché in base a tale teorema è anche F 0 = f q.o., possiamo riscrivere Z x F (x) = F 0 (t) dt x0 e scopriamo così che se, a partire da una qualsiasi funzione f 2 L1 [a; b] ; costruiamo la funzione integrale F , questa risulta essere assolutamente continua e soddisfa il primo teorema fondamentale del calcolo. Il fatto interessante è che vale anche la proprietà inversa, ossia: Teorema 8.60 Sia f 2 AC [a; b]. Allora f è derivabile per q.o. x 2 [a; b], la funzione f 0 è L1 [a; b] e inoltre per ogni x0 ; x 2 [a; b] è Z x f (x) f (x0 ) = f 0 (t) dt: x0 Possiamo quindi concludere che le funzioni assolutamente continue sono tutte e sole quelle che soddisfano il primo teorema fondamentale del calcolo integrale, nella teoria di Lebesgue. 105 9 La teoria della misura astratta in probabilità Dal nascere della teoria della misura e dell’integrazione moderna (Lebesgue 1902, Carathéodory 1914), una delle prime applicazioni rilevanti della teoria nella sua versione astratta (in cui cioè lo spazio non è necessariamente un sottoinsieme di Rn e la misura è una misura “qualsiasi”) è stata quella al calcolo delle probabilità. Nel 1933 N. Kolmogorov diede al calcolo delle probabilità un fondamento assiomatico che da allora è stato sistematicamente utilizzato. Lo scopo di questo paragrafo è introdurre la terminologia probabilistica comunemente utilizzata ed esempli…care, sui primi concetti e proprietà delle variabili aleatorie e del valore atteso, i vantaggi dell’utilizzo della teoria della misura astratta. Naturalmente l’importanza dell’impostazione di Kolmogorov va ben oltre le osservazioni elementari che faremo qui. Ulteriori approfondimenti in questa direzione si possono trovare in [10], cap.9. Si segnala che i concetti di questo paragrafo non avranno alcuna applicazione nel seguito del corso; lo scopo del paragrafo è semplicemente fornire allo studente una chiave interpretativa di certe nozioni probabilistiche che potrebbe aver incontrato altrove. Uno spazio di probabilità è de…nito come uno spazio di misura ( ; M; P ) dove l’insieme è lo spazio campionario, detto anche spazio degli eventi elementari, M è la -algebra degli eventi, P la misura di probabilità, e si assume la condizione P ( ) = 1: Una variabile aleatoria (abbreviato v.a.) sullo spazio è una qualsiasi funzione X : ! R, M-misurabile; si usano correntemente le seguenti scritture abbreviate: fX < tg indica l’insieme f! 2 : X (!) < tg ; per t 2 R, e analoghi signi…cati hanno le scritture fX tg ; fX = tg ; fX 2 Ig per I R. Una variabile aleatoria doppia sarà una funzione (X; Y ) : ! R2 , M2 misurabile, nel senso che per ogni aperto A di R risulti f(X; Y ) 2 Ag 2 M. Analogamente si de…nisce una n-upla di variabili aleatorie (X1 ; X2 ; :::; Xn ), detta anche vettore aleatorio. Esempio 9.1 Lanciamo due dadi e guardiamo quanto fa la somma dei punti. In questo caso = f(h; k) : h; k = 1; 2; 3; 4; 5; 6g M=P ( ) 1 per ogni (h; k) P f(h; k)g = 36 (cioè P è la probabilità uniforme su uno spazio campionario …nito). La somma dei punti dei due dati è la variabile aleatoria X: !R X (h; k) = h + k: 106 La X è ovviamente misurabile perché la -algebra è tutto P ( ). Questo è ciò che capita sempre nel discreto: si può scegliere P ( ) come -algebra, per cui ogni funzione X : ! R è una variabile aleatoria; la necessità di usare -algebre non banali nasce dal continuo. Vediamo come il formalismo della teoria astratta della misura e dell’integrazione interviene in modo importante nel concetto di valore atteso. De…nizione 9.2 Sia ( ; M; P ) uno spazio di probabilità e X : variabile aleatoria. Si de…nisce valore atteso di X il numero Z EX = XdP; ! R una se questo è …nito. Dunque il valore atteso è de…nito semplicemente come integrale, ma attenzione: come integrale astratto sullo spazio campionario , non in generale come integrale su R. Esempio 9.3 Calcoliamo in base alla de…nizione il valore atteso della somma del lancio dei due dadi (v. esempio precedente). Poiché è …nito (con 36 elementi, ciascuno di probabilità 1=36) la X è una funzione semplice, e per de…nizione il suo integrale si calcola così: ! Z 6 6 6 X 1 X X 1 = (h + k) = EX = XdP = (h + k) 36 36 h=1 h;k=1 = 1 36 6 X h=1 (6h + 21) = k=1 1 (6 21 + 6 21) = 7: 36 Nelle presentazioni elementari del calcolo delle probabilità il valore atteso di una v.a. non è de…nito a questo modo ma, dopo aver dato separatamente le de…nizioni di v.a. discreta e v.a. continua, è de…nita in due modi diversi per questi due tipi di variabili, usando rispettivamente una serie numerica o un integrale su R. Vediamo come si recuperano le de…nizioni elementari in questo quadro più generale. Premettiamo una semplice Proposizione 9.4 Sia ( ; M; P ) uno spazio di probabilità e X : ! R una variabile aleatoria. Se, per ogni insieme di Borel E 2 B (R) poniamo PX (E) = P (X 2 E) allora: 1. (R; B (R) ; PX ) è uno spazio di probabilità. 2. Per ogni funzione f : R ! R Borel misurabile si ha: Z Z f (X) dP = f dPX : R 107 (9.1) 3. In particolare, EX = Z tdPX (t) : R Dimostrazione. Per provare 1, osserviamo che se fEn g è una successione di insiemi di Borel in R a due a due disgiunti, si ha: ! ( )! ! 1 1 1 [ [ [ PX En = P X2 En =P fX 2 En g n=1 n=1 = 1 X n=1 n=1 P fX 2 En g = 1 X PX (En ) : n=1 Proviamo la 2 anzitutto per f = E dove E 2 B (R) : Si ha: Z Z (X) dP = P (X 2 E) = P (E) = E X E dPX : R Per linearità, la (9.1) risulta allora veri…cata per ogni funzione semplice f ; per continuità, risulta veri…cata per ogni funzione misurabile f . R La 3 è semplicemente la 2 applicata alla funzione f (t) = t; perché EX = XdP: La misura di probabilità PX si dice distribuzione di X. Chiediamoci ora che aspetto concreto ha la distribuzione di una variabile aleatoria. E’ qui che si ritrova il legame con i concetti introdotti nelle presentazioni elementari del calcolo delle probabilità. Infatti: se X è una v.a. discreta, ossia è un insieme …nito o numerabile, e quindi X può assumere solo un numero …nito o numerabile 1 di valori fxk gk=1 (spesso in questi casi X è una variabile che conta oggetti di qualche tipo, e i valori xk sono semplicemente 0; 1; 2; 3:::), si ha: X PX (E) = P (X = xk ) : xk 2E I numeri pX (xk ) = P (X = xk ) de…niscono completamente la distribuzione PX . 1 Si dice anche che la successione fpX (xk )gk=1 è la densità discreta di X. Si ha naturalmente: pX (xk ) 1 X 0 8k pX (xk ) = 1: k=1 In questo caso il valore atteso di X si calcola, per il punto 3 delle Proposizione precedente, Z 1 X EX = tdPX (t) = xk pX (xk ) , R k=1 se questa serie converge. 108 Esempio 9.5 Calcoliamo di nuovo il valore atteso della somma di due dadi, usando ora questa proprietà. La v.a. X (h; k) = h + k assume i valori 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; con probabilità, rispettivamente, pari a 1 2 3 4 5 6 5 4 3 2 1 ; ; ; ; ; ; ; ; ; ; : 36 36 36 36 36 36 36 36 36 36 36 Perciò EX = 2 1 2 3 4 5 6 +3 +4 +5 +6 +7 + 36 36 36 36 36 36 5 4 3 2 1 +8 +9 + 10 + 11 + 12 =7 36 36 36 36 36 ma si osservi che in questo caso è più semplice calcolare il valore atteso come integrale astratto di X su piuttosto che usando la densità discreta di X. Una v.a. continua X su ( ; M; P ) è per de…nizione una v.a. la cui distribuzione PX è una misura su R dotata di densità rispetto alla misura di Lebesgue in R. In altre parole, esiste una funzione fX : R ! [0; +1) Borel misurabile, detta densità di X, tale che Z PX (E) = fX (t) dt per ogni E 2 B (R) . E Dev’essere, naturalmente, Z fX (t) dt = 1: R In questo caso il valore atteso si calcola, per il punto 3 della proposizione precedente: Z Z EX = tdPX (t) = tfX (t) dt; R R in quanto dPX (t) = fX (t) dt. Nella presentazione elementare del calcolo delle probabilità, solitamente le v.a. continue sono introdotte direttamente mediante la loro densità, spesso senza neppure precisare quale sia lo spazio di probabilità soggiacente. Ad esempio, si dice: “Sia T il tempo di vita di una lampadina, e supponiamo che T abbia legge esponenziale di parametro ”, intendendo con questo il fatto che fT (t) = e t per t > 0 0 per t 0: Si noti che con questo abbiamo in sostanza speci…cato come si fa a calcolare P (T 2 E) senza de…nire esplicitamente lo spazio e la funzione T : ! R: Potremmo ad esempio pensare che sia l’insieme di tutte le lampadine esistenti, esistite e che esisteranno, e T sia la funzione che associa a ciascuna di queste il 109 suo tempo di vita. Si tratterebbe di de…nire in qualche modo la probabilità su , ma comunque fX (t) risulterebbe come sopra. Come si vede, ai …ni pratici speci…care lo spazio è in questi casi inutile, perciò non lo si fa. Vediamo ora come l’utilizzo della teoria dell’integrazione astratta intervenga nella dimostrazione delle proprietà del valore atteso. Ad esempio: il valore atteso è lineare, cioè se X; Y sono due v.a. dotate di valore atteso …nito, allora E (X + Y ) = EX + EY: Nelle presentazioni elementari della probabilità, questa proprietà viene enunciata separatamente per v.a. discrete e continue, e dimostrata separatamente (utilizzando serie numeriche o integrali). Si noti anzitutto che nell’impostazione assiomatica della probabilità il concetto di v.a. è più generale rispetto a quella di v.a. discreta o continua (la distribuzione di X potrebbe essere una misura né discreta né dotata di densità, ma ad esempio un misto delle due cose). In secondo luogo, la linearità del valore atteso segue semplicemente dalla linearità dell’integrale astratto: Z Z Z E (X + Y ) = (X + Y ) dP = XdP + Y dP = EX + EY: La dimostrazione di questa proprietà usando le densità sarebbe invece più tortuosa: nel caso continuo, ad esempio, si tratta di provare che Z Z Z E (X + Y ) = tfX+Y (t) dt = tfX (t) dt + tfY (t) dt = EX + EY (9.2) R R R cosa non ovvia perché fX+Y (t) 6= fX (t) + fY (t): la densità della somma non è uguale alla somma delle densità, ma alla convoluzione delle densità: Z fX+Y (x) = fX (x t) fY (t) dt: (9.3) R Quindi bisogna prima provare la (9.3), e poi il fatto che da questo segua la (9.2). Veniamo all’altra proprietà importante del valore atteso, legato al concetto di indipendenza. Ricordiamo che due v.a. X1 ; X2 si dicono indipendenti se P (X1 2 E1 e X2 2 E2 ) = P (X1 2 E1 ) P (X2 2 E2 ) (9.4) per ogni coppia di insiemi di Borel E1 ; E2 in R. Si può introdurre la distribuzione della v.a. doppia (X1 ; X2 ) come la misura di probabilità su R2 de…nita da P(X1 ;X2 ) (E) = P ((X1 ; X2 ) 2 E) per ogni insieme di Borel E R2 . Se X1 ; X2 sono indipendenti allora la distribuzione di (X1 ; X2 ) è la misura prodotto delle distribuzioni PX1 ; PX2 , in simboli: P(X1 ;X2 ) = PX1 PX2 110 che signi…ca proprio la (9.4) e implica che negli integrali doppi risulta: dP(X1 ;X2 ) (t1 ; t2 ) = dPX1 (t1 ) dPX2 (t2 ) (9.5) Si può provare per le variabili aleatorie doppie una proposizione analoga a quella prima dimostrata, ossia: per ogni funzione f : R2 ! R Borel misurabile si ha: Z Z f (X1 ; X2 ) dP = f dP(X1 ;X2 ) : R2 In particolare, E (X1 X2 ) = Z R2 t1 t2 dP(X1 ;X2 ) (t1 ; t2 ) : (9.6) Si ottiene subito allora la proprietà fondamentale sul valore atteso del prodotto di variabili aleatorie: se due v.a. X1 ; X2 sono indipendenti (e hanno valore atteso …nito), allora E (X1 X2 ) = EX1 EX2 : Infatti per (9.5), (9.6) si ha Z Z E (X1 X2 ) = t1 t2 dP(X1 ;X2 ) (t1 ; t2 ) = t1 t2 dPX1 (t1 ) dPX2 (t2 ) 2 R2 ZR Z = t1 dPX1 (t1 ) t2 dPX2 (t2 ) = EX1 EX2 : R R Di nuovo, la dimostrazione di questa proprietà utilizzando le densità sarebbe meno immediata, richiederebbe tecniche diverse nel caso discreto e continuo, e non coprirebbe il caso generale di variabili né discrete né continue. 10 10.1 Misure di Hausdor¤ Misura e dimensione di Hausdor¤ Abbiamo visto che la misura di Lebesgue in Rn estende la misura elementare, cioè ad esempio la lunghezza in R, l’area in R2 e il volume in R3 . Ma, anche dal punto di vista elementare, noi siamo talvolta interessati a calcolare la lunghezza non di un sottoinsieme della retta, ma di un arco di curva nel piano o nello spazio, oppure l’area non di un sottoinsieme del piano, ma di una super…cie nello spazio. In altre parole, un problema naturale che non abbiamo ancora a¤rontato è quello di misurare sottoinsiemi di Rn aventi dimensione minore di n (come sono ad esempio le curve o le super…ci regolari in R3 ), usando una misura appropriata alla loro dimensione (ad es. la lunghezza, cioè una misura unidimensionale, per una curva, anche se è immersa in uno spazio ambiente di dimensione 2 o 3). A questo problema risponde il concetto di misura di Hausdor¤ s-dimensionale in Rn , che ora introduciamo. Cominciamo dalla seguente precisazione: se C Rn è un qualsiasi insieme limitato, si dice diametro di E il numero diam (C) = sup fjx 111 yj : x; y 2 Eg . De…nizione 10.1 Sia A Rn un sottoinsieme qualsiasi, e s un numero reale non negativo …ssato. Per ciascun 0 de…niamo 8 9 1 1 s <X = [ diam (Cj ) H s (A) = inf (s) :A Cj ; diam (Cj ) (10.1) : ; 2 j=1 j=1 dove s=2 (s) = e è la funzione di Eulero de…nita da s 2 +1 R1 (t) = 0 e x t 1 x dx: Qualche spiegazione. La costante (s) ha il seguente signi…cato geometrico. Se s = n, la misura di Lebsegue di una sfera di raggio r in Rn è uguale18 a (n) rn . Se fosse s = n e uno degli insiemi Cj che compaiono nella (10.1) fosse una sfera B (x; r) di raggio r, si avrebbe (n) diam (Cj ) 2 n = (n) rn = vol (B (x; r)) : L’idea della de…nizione precedente è allora la seguente. Vogliamo de…nire la misura s-dimensionale di un insieme A in Rn . Ricopriamo per prima cosa l’insieme con unioni numerabili di insiemi generici, di cui ciò che conta è soltanto il diametro; di ognuno di questi insiemi, e quindi della loro unione, calcoliamo non il volume, ma una misura s-dimensionale, espressa dalla quantità s diam (Cj ) (s) e dalla somma di questi numeri. Prendiamo in…ne l’estremo 2 S1 inferiore delle misure così ottenute. Per costringere però la copertura j=1 Cj a “seguire la forma” dell’insieme A, imponiamo che i diametri degli insiemi Cj siano tutti minori di un …ssato, che immaginiamo piccolo. Spieghiamo il signi…cato di questa richiesta col prossimo Esempio 10.2 Sia A R2 la poligonale di 2 lati aventi vertici (1; 0) ; (0; 0) ; (0; 1) 1 8 Per la spiegazione di questo fatto e qualche dettaglio sulla funzione Gamma di Eulero, si veda [5], §§ 5.1-5-2. 112 (…g.1). …g.1 …g.2 Proviamo a misurare la lunghezza di A (che è uguale a 2) usando la precedente de…nizione di H 1 . Se = 1 possiamo coprire ciascun segmento con un cerchio di diametro 1 (…g. 2), e troviamo A con diam(C1 ) =diam(C2 ) = 1, 2 X (1) j=1 C1 [ C2 (1) = 2, perciò diam (Cj ) 2 1 =2 1 1 + 2 2 = 2: Se decidessimo di ricoprire la poligonale con 4 cerchi di diametro 1=2 ciascuno (…g.3), otterremmo 4 X j=1 (1) diam (Cj ) 2 1 =2 1 1 1 1 + + + 4 4 4 4 = 2: Si capisce perciò che 2 l’estremo inferiore dei valori che possiamo ottenere con questo tipo di coperture. Se non avessimo però imposto la condizione diam(Cj ) avremmo potuto p ricoprire l’intera poligonale con un unico cerchio C di centro 1 1 ; e diametro 2 (…g.4), trovando 2 2 (1) diam (C) 2 1 113 =2 p 2 p = 2, 2 un risultato inferiore, che non esprime la vera lunghezza della poligonale. …g.3 …g.4 Immaginiamo ora di ripetere la costruzione per una poligonale A i cui vertici sono ( ; 0) ; (0; 0) ; (0; ), e è molto piccolo. Per trovare la corretta lunghezza della poligonale dovremmo imporre il vincolo diam(Cj ) per questo . Si capisce quindi che per avere una de…nizione di misura s-dimensionale che funzioni per ogni insieme occorre far tendere a zero il numero nella de…nizione di H s . Questo è esattamente quello che si fa: De…nizione 10.3 Sia A Rn un sottoinsieme qualsiasi, e s un numero reale non negativo …ssato. Si pone: H s (A) = lim H s (A) : !0 Il limite precedente esiste (…nito o +1) perché la funzione 7! H s (A) è decrescente: diminuendo diminuiscono le famiglie di coperture ammissibili, quindi l’estremo inferiore aumenta. La quantità H s (A) viene detta misura di Hausdor¤ s-dimensionale di A in n R . A dispetto del nome, non è esattamente una misura, come ora chiariremo. Notiamo esplicitamente che questo numero è stato de…nito per ogni sottoinsieme A di Rn e per ogni numero reale s 0; anche non intero. Enunciamo senza alcuna dimostrazione le proprietà fondamentali di H s , rimandando per approfondimenti a [8], Chap.1. Teorema 10.4 Per ogni s su Rn , in altre parole 0, la funzione d’insieme H s è una misura esterna H s : P (Rn ) ! [0; +1] è numerabilmente subadditiva: per ogni successione di sottoinsiemi Ak (k = 1; 2; 3; :::) si ha: ! 1 1 [ X s H Ak H s (Ak ) : k=1 k=1 114 Rn Si può utilizzare la costruzione di Carathéodory già descritta nella de…nizione della misura di Lebesgue in Rn per ottenere a partire da questa misura esterna una vera misura: è su¢ ciente selezionare tra tutti i sottoinsiemi di Rn quelli per cui vale la condizione H s (E) = H s (E \ T ) + H s (E \ T c ) 8T Rn . Questi insiemi si diranno H s -misurabili. Teorema 10.5 Per ogni s 0, la famiglia degli insiemi H s -misurabili in Rn è una -algebra, contenente la -algebra di Borel. La funzione H s ristretta a questa -algebra è una misura, che continuiamo a indicare col simbolo H s . Siamo quindi riusciti a de…nire un concetto di misura s-dimensionale per una vasta classe di sottoinsiemi di Rn (in particolare, tutti i boreliani) e per ogni s 0 (anche non intero!). Che aspetto avrà questa misura per i diversi valori di s? Anzitutto si può provare quanto segue: Teorema 10.6 Per s = 0 la misura H s è la misura del conteggio. Per s = n la misura H s è la misura di Lebesgue in Rn . Per s > n la funzione H s è identicamente nulla. Per ogni s, la misura H s è invariante per rototraslazioni, e soddisfa l’omogeneità: H s ( E) = s H s (E) per ogni > 0. Si può anche dimostrare che per valori interi la misura H s coincide con quanto ci aspettiamo, ad esempio: se è un arco di curva di classe C 1 nello spazio R3 , H 1 ( ) coincide con la lunghezza d’arco. Una delle motivazioni per introdurre la misura di Hausdor¤, tuttavia, è proprio quella di poter misurare anche oggetti geometrici molto meno regolari. Poniamoci ora dal seguente punto di vista. Immaginiamo un sottoinsieme A Rn molto irregolare, per il quale non sia evidente qual è la dimensione naturale. In altre parole, per quale s è naturale misurare H s (A)? Il prossimo teorema chiarisce la situazione che si può veri…care: Teorema 10.7 Sia A Rn e 0 s < t n: 1. Se H s (A) < 1; allora H t (A) = 0: 2. Se H t (A) > 0; allora H s (A) = 1: Intuitivamente: se un oggetto geometrico ha misura unidimensionale …nita, ad esempio è un segmento, la sua area sarà zero; se ha area positiva, ad esempio è un cerchio, la sua lunghezza (pensandola come linea) sarà in…nita. La precedente proprietà o¤re la possibilità di de…nire la dimensione di A: De…nizione 10.8 Sia A Rn . Si de…nisce dimensione di Hausdor¤ di A il numero Hdim (A) = inf fs 0 : H s (A) = 0g . 115 Notiamo che per ogni A Rn risulta Hdim (A) n e che: per ogni s > Hdim (A) è H s (A) = 0; e per ogni s < Hdim (A) è H s (A) = 1. Notiamo esplicitamente che Hdim (A) = s non implica che H s (A) < 1, ad esempio una retta ha dimensione 1 ma misura unidimensionale in…nita. Ri‡ettendo sugli esempi più comuni di sottoinsiemi dello spazio è naturale chiedersi: esistono insiemi la cui dimensione di Hausdor¤ non è intera? La risposta è a¤ermativa, e questi insiemi si dicono frattali. Esempio 10.9 (La curva di Koch) Consideriamo la seguente curva nel piano, costruita con un procedimento iterativo. Al passo 0 consideriamo il segmento [0; 1] contenuto nell’asse x, nel piano xy. Al passo 1, dividiamo il segmento in 3 parti uguali, rimuoviamo il terzo centrale, e al suo posto inseriamo due segmenti di lunghezza 1=3, ottenendo complessivamente una poligonale 1 fatta da 4 segmenti di lunghezza 1=3 ciascuno, quindi la poligonale ha lunghezza 4=3. Al passo 2 suddividiamo ognuno dei 4 intervallini in 3 parti uguali, rimuoviamo il terzo centrale e lo sostituiamo con 2 intervallini di lunghezza 1=9 ciascuno, ottenendo complessivamente una poligonale 2 fatta da 42 segmenti di lunghezza 2 1=32 ciascuno, quindi la poligonale ha lughezza (4=3) . Procediamo iterativamente a questo modo. Al passo n la poligonale n è costituita da 4n intervallini n di lunghezza 1=3n ciascuno, quindi ha lunghezza totale (4=3) . Si può dimostrare che f n g è una successione di curve continue nel piano, che 1 cioè si possono parametrizzare nella forma f(xn (t) ; yn (t))gn=1 con xn ; yn : [0; 1] ! R continue, e la successione converge uniformemente a una curva limite (t) = (x (t) ; y (t)), continua, che si dice “curva di Koch”, o “curva …occo di neve”. Il procedimento iterativo con cui è stata costruita dà alla curva limite quella caratteristica di “autosimilarità” tipica degli insiemi frattali: un particolare della curva, messo sotto il microscopio, assomiglia alla curva tutta 116 n intera. Poiché n ha lunghezza (4=3) , si capisce che avrà lunghezza in…nita. In e¤ etti non è un insieme di dimensione 1. Calcoliamone la dimensione di Hausdor¤ . Al passo n-esimo della costruzione, il modo naturale di ricoprire n in modo “accurato” consiste nel coprire ogni segmentino di lunghezza 1=3n con un cerchio di diametro 1=3n ; occorreranno in tutto 4n cerchi Cj di questo tipo, e si otterrà, per qualsiasi s …ssato, n 4 X j=1 (s) diam (Cj ) 2 s = (s) 4n 1 2 3n s = (s) 2s 4 3s n : Al crescere di n la copertura richiesta è sempre più …ne, e occorre fare il limite per n ! 1 della quantità appena scritta. La domanda ora è: per quale valore di s si ha che n (s) 4 lim n!1 2s 3s è …nito e diverso da zero? Dovrà essere 34s = 1, cioè s = log3 4. Questo numero è la dimensione di Hausdor¤ della curva di Koch: Hdim ( ) = log3 4 ' 1:2619: Questa dimensione è maggiore di 1, a riprova del fatto che questa curva è “talmente intricata” da essere un oggetto di dimensione maggiore della dimensione naturale di una curva; la dimensione è anche minore di 2, dimensione dello spazio ambiente. L’insieme è un frattale. 10.2 La misura (n metrico 1)-dimensionale e il problema isoperi- Tra le misure di Hausdor¤, una molto usata in Rn è la H n 1 , che è l’analogo della misura di super…cie in R3 . Se ad esempio A Rn è un aperto limitato la cui frontiera @A è regolare, sarà Hdim (@A) = n 1, perciò H n 1 è la misura naturale sul bordo dei sottoinsiemi “ragionevoli” di Rn . La misura H n 1 compare ad esempio negli integrali di bordo che sono coinvolti nel teorema della divergenza in Rn (su cui ritorneremo quando studieremo gli spazi di Sobolev): Z Z divF (x) dx = F ne dH n 1 (x) : A @A Un altro fatto importante che coinvolge la misura H n 1 è la disuguaglianza isoperimetrica, su cui ora spenderemo qualche parola. Un problema molto antico19 è il seguente: qual è, tra tutte le …gure geometriche piane, quella che, a pari perimetro, racchiude l’area massima? La risposta, piuttosto naturale, è: il cerchio. Analogamente, tra tutti i solidi, quello che, a parità di area della super…cie laterale, racchiude il volume massimo, è la sfera. Questi enunciati 1 9 Risale almeno a Zenodoro, matematico greco del 3 secolo a.C. 117 sono tanto intuitivi quanto di¢ cili da dimostrare rigorosamente. Anzitutto infatti bisognerebbe chiarire chi sono “tutte le …gure piane”, ossia qual è l’insieme di oggetti geometrici tra cui a¤ermiamo che il cerchio ha la proprietà di massimo che abbiamo espresso. Di ciascuna “…gura ammissibile” dobbiamo essere in grado di misurare area e perimetro, quindi la de…nizione della classe delle …gure ammissibili dipende da quale teoria della misura si adotta. Si intuisce che la risoluzione rigorosa di questo problema non poteva essere alla portata dei greci che se lo posero 2300 anni fa. La teoria della misura del 20 secolo ha permesso di a¤rontare rigorosamente questo problema, anche nel caso più generale dei sottoinsiemi di Rn . Come “volume” di A considereremo la misura di Lebesgue di A in Rn , che indichiamo con jAj. Come “area della super…cie laterale” di A considereremo H n 1 (@A). Una formulazione quantitativa della disuguaglianza isoperimetrica si può ottenere a questo modo. Consideriamo il quoziente adimensionato: (n 1)=n jAj Hn J (A) = 1 : (@A) Diciamo che è adimensionato in quanto J ( A) = J (A) per ogni dilatazione > 0: Il quoziente, in altre parole, dipende solo dalla forma dell’insieme A ma non dalle sue dimensioni assolute. La disuguaglianza isoperimetrica a¤erma che J (A) è massimo quando A è una sfera. Calcoliamo il valore di J (A) quando A = B (0; r) è una sfera di raggio r. Si ha: Hn 1 (n) rn jB (0; r)j = (n) nrn (@B (0; r)) = 1 (la misura del bordo della sfera è la derivata del volume rispetto al raggio). Quindi (n 1)=n J (B (0; r)) = (n 1)=n jB (0; r)j [ (n) rn ] = H n 1 (@B (0; r)) (n) nrn = 1 1 1=n (n) n : Pertanto la disuguaglianza isoperimetrica a¤erma: (n 1)=n jAj Hn 1 1 1=n (@A) (n) n : Enunciamo un risultato preciso: Teorema 10.10 Per ogni insieme A di Borel in Rn , di misura di Lebesgue jAj …nita, vale la disuguaglianza: Hn 1 (@A) 1=n (n) (n 1)=n n jAj : Questo si può esprimere anche dicendo che il funzionale di insieme J : B (Rn ) ! [0; 1) 1=n ammette massimo 1= (n) sfere. n; e il massimo è assunto in corrispondenza delle 118 La forma in cui abbiamo enunciato questo teorema non è la migliore possibile. Il risultato preciso in questa direzione è il teorema dimostrato da Ennio De Giorgi nel 1958, che stabilisce la proprietà isoperimetrica della sfera in una classe più ampia di insiemi, precisamente quelli di perimetro …nito, una nozione introdotta dallo stesso De Giorgi e oggi comunemente utilizzata nella teoria geometrica della misura. Per un insieme A di perimetro P (A) …nito si ha sempre H n 1 (@A) P (A), perciò la disuguaglianza di De Giorgi, P (A) 1=n (n) (n 1)=n n jAj implica quella che abbiamo sopra enunciato. Si osservi che il risultato di De Giorgi contiene quindi la soluzione generale di un problema che era aperto da 2300 anni, una soluzione resa possibile dagli sviluppi della teoria della misura, e successivamente della teoria geometrica della misura, nella prima metà del ’900. 10.3 Misure e distribuzioni di carica Abbiamo studiato il concetto astratto di misura, ma abbiamo anche incontrato, in Rn , esempi concreti signi…cativi di misura: la misura di Lebesgue n-dimensionale; le misure di Hausdor¤ s-dimensionali; le misure de…nite da una densità rispetto alla misura di Lebesgue, cioè d (x) = f (x) dx con f 0 misurabile; le misure concentrate, tipo “massa di Dirac”. Vediamo un esempio di situazione …sica in cui queste varie misure sono coinvolte. Supponiamo di studiare il problema elettrostatico di determinare il potenziale del campo generato da una certa distribuzione di cariche elettriche nello spazio. Dal punto di vista …sico, le cariche elettriche possono essere: -cariche puntiformi; -cariche distribuite lungo …li materiali; -cariche distribuite su super…ci materiali; -cariche distribuite nello spazio tridimensionale (come in un gas ionizzato, o in una soluzione elettrolitica). Nelle trattazioni matematicamente elementari queste situazioni vengono affrontate separatamente, sfruttando concetti diversi: per la carica puntiforme è comodo trattare direttamente la carica, senza introdurre una funzione densità; per una carica distribuita nello spazio si introduce una funzione densità volumica, il cui integrale triplo in una certa regione assegna la carica totale contenuta in quella regione; per …li e super…ci regolari bisogna introdurre una densità lineare e super…ciale, speci…cando che di quella funzione andrà calcolato un integrale di linea o di super…cie. Il concetto matematico di misura consente di fare unità tra tutte queste situazioni: la distribuzione di una carica è sempre espressa da una misura , in modo tale che la quantità totale di carica contenuta in una regione A qualsiasi dello spazio sia pari a (A). Questa misura potrà essere a sua volta somma di vari addendi: 119 -una carica distribuita in una regione tridimensionale sarà espressa da una misura f (x) dx con f densità volumica, e dx misura di Lebesgue in R3 ; -una carica distribuita lungo una super…cie sarà espressa da una misura di Hausdor¤ bidimensionale concentrata lungo , quindi (x) (x) dH 2 (x) con densità super…ciale (e è la funzione caratteristica di ); -una carica distribuita lungo una curva sarà espressa da una misura di Hausdor¤ unidimensionale concentrata lungo , quindi (x) (x) dH 1 (x) con densità lineare (e è la funzione caratteristica di ); -un sistema di cariche puntiformi q1 ; q2 ; :::; qn collocate nei punti x1 ; x2 ; :::; xn sarà espresso da una combinazione lineare di misure di Dirac, del tipo n X qi xi (x) : i=1 In de…nitiva, potremo esprimere la densità di carica in tutto lo spazio con un’unica misura d (x) = f (x) dx + (x) (x) dH 2 (x) + (x) (x) dH 1 (x) + n X qi xi (x) : i=1 In ogni regione A dello spazio, di forma e dimensione qualsiasi, la quantità totale di carica sarà data da (A). Ricordando ora che l’equazione soddisfatta dal potenziale elettrostatico u in presenza di una densità di carica (continua) f è l’equazione di Poisson u = f; possiamo pensare di formalizzare il problema della ricerca del potenziale elettrostatico dovuto ad una distribuzione di carica di tipo generale mediante un’equazione di Poisson con termine noto misura, u= ; ma come andrà intesa quest’equazione? Cosa signi…cherà a¤ermare che u risolve l’equazione? Questi ed altri problemi spinsero il matematico francese Laurent Schwarz, verso il 1950, a creare la teoria delle distribuzioni che, prendendo a prestito il nome proprio da problemi …sici di questo tipo, introdusse una signi…cativa generalizzazione del concetto di funzione, derivata, soluzione di un’equazione di¤erenziale. In questo quadro funzioni e misure sono particolari distribuzioni, un concetto più generale che racchiude questi ed altri oggetti matematici. 120 11 11.1 Spazi Lp Gli spazi Lp ( ) per 1 < p < 1 Sia ( ; M; ) uno spazio di misura, con misura completa. Oltre allo spazio L1 ( ) delle funzioni sommabili, è utile in molte questioni introdurre spazi di funzioni misurabili una cui opportuna potenza è sommabile. Diamo anzitutto la seguente De…nizione 11.1 Per p 2 [1; 1); poniamo Lp ( ) = f: ! R misurabile : Z p jf (x)j f (x) < 1 : Per p = 1 ritroviamo lo spazio L1 ( ) già introdotto, delle funzioni Lebesguesommabili. p Chiediamoci: la richiesta che risulti jf j sommabile per qualche p > 1 è più forte o più debole rispetto a jf j sommabile? In generale le due richieste non sono confrontabili: Esempio 11.2 La funzione f (x) = 1=x sta in Lp (1; +1) per p > 1 ma non per p = 1; invece f (x) = 1=x log2 x sta in L1 (0; 1=2) ma non sta in Lp (0; 1=2) per nessun p > 1. Dunque questi spazi non soddisfano reciproche inclusioni banali, in generale. Approfondiremo in seguito questo punto. Gli spazi Lp ( ) sono vettoriali anche per p > 1 (per p = 1 lo sappiamo già). Infatti la combinazione lineare di funzioni misurabili è misurabile, e vale la disuguaglianza p p p jf + gj 2p (jf j + jgj ) ; perciò se f; g 2 Lp ( ) anche f + g 2 Lp ; con Z Z Z p p p p jf + gj d 2 jf j d + jgj d < 1: (11.1) Vorremmo renderli spazi vettoriali normati. E’chiaro che la norma naturale è (se vogliamo soddisfare l’omogeneità): kf kLp ( ) = Z 1=p p jf j d . (Nel seguito scriveremo spesso kf kp per indicare kf kLp ( ) , quando non c’è pericolo di confusioni). Questa “candidata norma”soddisfa la proprietà di positività (pur di identi…care come di consueto funzioni tra loro uguali quasi ovunque) e quella di omogeneità della norma. La disuguaglianza triangolare non è però 121 immediata da dimostrare, perché dalla (11.1) segue Z 1=p p jf + gj d 2 2 Z " Z p jf j d + Z 1=p p jgj d 1=p p jf j d + Z 1=p p jgj d # ; col che avremmo ottenuto una disuguaglianza di tipo triangolare ma con una costante 2 a secondo membro, il che non va bene. Per dimostrare una disuguaglianza triangolare “pulita”occorre un argomento più ra¢ nato. Cominciamo a dimostrare la seguente disuguaglianza, che ha molte applicazioni: Teorema 11.3 (Disuguaglianza di Hölder) Siano p; q 2 (1; 1) tali che 1 1 + =1 p q (due numeri con queste proprietà si dicono esponenti coniugati). Se f 2 Lp ( ) e g 2 Lq ( ) ; allora f g 2 L1 ( ) e vale la disuguaglianza (di Hölder) Z jf gj d kf kp kgkq : Prima di proseguire, prendiamo con…denza col concetto di esponenti coniugati. A¢ nché valga la relazione p1 + 1q = 1; più grande è p più piccolo dev’essere q; in particolare, 2 è il coniugato di se stesso; se 1 < p < 2 il suo coniugato q soddisfa 2 < q < 1. Ad esempio, il coniugato di p = 3 > 2 è q = 23 < 2: Per p ! 1+ ; q ! +1. Dalla relazione 1q = 1 p1 ricaviamo: q= p p 1 e anche pq = p + q: Per provare la disuguaglianza di Hölder si fa uso della seguente disuguaglianza numerica Lemma 11.4 (Disuguaglianza di Young) Per ogni a; b ab 0; si ha ap bq + p q se p; q sono esponenti coniugati. Dimostrazione della disuguaglianza di Young. Consideriamo la funzione di due variabili ap bq p + q f (a; b) = : ab 122 Nel primo quadrante a > 0; b > 0 la funzione è positiva, cerchiamo il suo minimo. Si trova ap bq bq ap rf (a; b) = ; qa2 b pab2 che si annulla dove ap = bq , punti in cui è ap p=q f a; a = 1 p 1 q + aap=q = ap 1 p=q = a0 = 1. Si veri…ca che questo è e¤ettivamente un punto di minimo, perciò f (a; b) 1, che è quanto volevamo provare. Dimostrazione della disugualianza di Hölder. Applicando la disuguaglianza di Young ai numeri: jf (x)j jg (x)j ;b = a= kf kp kgkq per ogni x 2 Z e integrando in jf g (x)j d kf kp kgkq abbiamo ! p q jf (x)j jg (x)j d p + q p kf kp q kgkq Z Z 1 1 p q jf (x)j d + jg (x)j d = p q p kf kp q kgkq 1 1 1 1 p q = + =1 p kf kp + q kgkq = p q p kf kp q kgkq Z ossia Z jf g (x)j d kf kp kgkq 1 e quindi la tesi. Utilizzando il risultato precedente possiamo ora dimostrare la disuguaglianza triangolare della norma Lp : Teorema 11.5 (Disuguaglianza di Minkowski) Per ogni p 2 [1; +1); f; g 2 Lp ( ) vale la disuguaglianza kf + gkp kf kp + kgkp : Dimostrazione. Per p = 1 lo sappiamo già. Per p 2 (1; 1) scriviamo: p p 1 jf + gj = jf + gj jf + gj p 1 (jf j + jgj) jf + gj e quindi p kf + gkp = Z p jf + gj d Z p 1 jf j jf + gj 123 d + Z p 1 jgj jf + gj d : Ora in ciascuno degli integrali a secondo membro applichiamo la disuguaglianza p 1 di Hölder, sfruttando il fatto che f; g 2 Lp e jf + gj 2 Lq con q coniugato di p, perché (p 1)q jf + gj p 1 jf + gj q pq q p = jf + gj = jf + gj , perciò Z Z 1=q (p 1)q p = jf + gj d = jf + gj d 1=q p=q = kf + gkp Dunque: p p 1 kf + gkp kf kp jf + gj = kf + p=q gkp da cui + kgkp jf + gj q kf kp + kgkp p p=q kf kp + kgkp kf + gkp ossia p 1 q kf + gkp kf kp + kgkp : Dunque Lp ( ) è uno spazio vettoriale normato per tutti i p 2 [1; 1): Chiediamoci ora se c’è una ragione particolare per cui gli spazi Lp non sono stati de…niti anche per 0 < p < 1. In e¤etti per 0 < p < 1 la “candidata norma” kf kp non soddisfa la disuguaglianza triangolare, come mostra il seguente Esempio 11.6 Consideriamo Lp [0; 2] per 0 < p < 1, siano f = [1;2] . Si ha: Z 0 1=p 2 p jf + gj dx Z 2 0 2 1=p p = 1=p 2 = 21=p ; 1dx Z 1=p 1 1dx = 1; 0 1=p p jgj dx Z = 0 jf j dx 0 Z = [0;1] ; g = Z 1=p 2 1dx = 1; 1 dunque kf + gkp = 21=p > 2 = kf kp + kgkp e la disuguaglianza triangolare viene a cadere. Vale anche il prossimo fondamentale risultato: Teorema 11.7 Gli spazi Lp ( ) per 1 p < 1 sono completi. Per p = 1 lo sappiamo già. Per 1 < p < 1 la dimostrazione è molto simile a quella vista per p = 1 nel §8.9. Lo studente può provare per esercizio a modi…care quella dimostrazione per adattarla al caso p > 1 (si tratta solo di introdurre opportunamente qualche esponente p). 124 11.2 Lo spazio L1 Introduciamo ora uno spazio che in qualche senso completa la scala degli spazi Lp . De…nizione 11.8 Poniamo: L1 ( ) = ff : ! R misurabile : 9K > 0 per cui è jf (x)j K per q.o. x 2 g : Le funzioni di questo spazio si dicono anche essenzialmente limitate. Esse sono limitate salvo un insieme di misura nulla. Se f 2 L1 ( ) si de…nisce kf kL1 ( ) = inf fK > 0 : jf (x)j K per q.o. x 2 g . Quindi in particolare risulta jf (x)j kf kL1 ( ) per q.o. x 2 : Si presti attenzione a non equivocare la de…nizione di “limitatezza essenziale”. I prossimi esempi dovrebbero chiarire le idee. Esempio 11.9 1. Se f è limitata in in particolare è essenzialmente limitata. 2. La funzione 1=x non è essenzialmente limitata in R. Attenzione: f non 1 K per ogni è “limitata per x 6= 0”, in quanto per nessun K > 0 è vero che jxj x 6= 0; o per ogni x appartenente a qualche altro insieme di misura nulla. 3. Un esempio di funzione essenzialmente limitata senza essere limitata è: f (x) = sin x per x 2 R n Q x per x 2 Q E’ chiaro infatti che jf (x)j 1 per q.o. x 2 R; in quanto Q è un insieme di misura nulla. D’altro canto ovviamente f è illimita D’altro canto ovviamente f è illimitata. 4. f è essenzialmente limitata se e solo se f è uguale quasi ovunque ad una funzione limitata. Ad esempio, la f dell’esempio precedente è uguale quasi ovunque a sin x. 5. La funzione f (x) = log x appartiene in Lp (0; 1) per ogni p 2 [1; 1) ma non appartiene a L1 (0; 1); la funzione f (x) = sin x appartiene a L1 (R) ma non appartiene a Lp (R) per nessun p 2 [1; 1), quindi non c’è in generale alcuna inclusione banale tra lo spazio L1 e gli altri spazi Lp . Si veri…ca facilmente che L1 ( ) è uno spazio vettoriale normato (con la solita identi…cazione tra funzioni uguali quasi ovunque). Inoltre: Teorema 11.10 Lo spazio vettoriale normato L1 ( ) è completo. 125 1 Dimostrazione. Sia ffn gn=1 una successione di Cauchy in L1 ( ) : Questo signi…ca che kfn fm kL1 ( ) ! 0 per n; m ! 1. D’altro canto jfn (x) fm (x)j kfn fm kL1 ( ) per ogni x 2 n En;m dove En;m è un insieme di misura nulla. Poiché l’unione numerabile di insiemi di misura nulla ha misura nulla, fuori da un certo insieme E di misura nulla 1 (unione di tutti gli insiemi En;m ) la successione ffn gn=1 soddisfa la condizione di Cauchy per la convergenza uniforme, dunque converge uniformemente a una certa funzione f; che risulta de…nita e misurabile in n E, quindi de…nita q.o. e misurabile in : Inoltre kfn f kL1 ( ) ! 0: Notiamo che il concetto di coppia di esponenti coniugati e la disuguaglianza di Hölder si estendono a comprendere anche lo spazio L1 , al seguente modo: De…nizione 11.11 Diciamo che l’esponente coniugato di p = 1 è q = 1; e l’esponente coniugato di p = 1 è q = 1. Ora, se f 2 L1 ( ) e g 2 L1 ( ) si ha, essendo jg (x)j kgkL1 ( ) per q.o. x2 ; Z Z jf g (x)j d (x) kgkL1 ( ) jf (x)j d (x) = kgkL1 ( ) kf kL1 ( ) : Perciò la disuguaglianza di Hölder si estende anche ai casi estremi in cui p = 1 o 1. 11.3 Inclusioni tra spazi Lp Cominciamo a dimostrare il seguente risultato positivo di inclusione tra spazi Lp su un dominio di misura …nita: Teorema 11.12 Sia ( ; M; ) uno spazio di misura (con misura completa), di misura …nita, cioè ( ) < 1. Se 1 p < r 1 allora Lr ( ) Lp ( ) e vale la disuguaglianza: 1 kf kp ( )p 1 r kf kr per ogni f 2 Lr ( ) 1 dove nel caso r = 1 a secondo membro abbiamo ( ) p kf k1 . Dimostrazione. Supponiamo prima r < 1: Applichiamo la disuguaglianza di Hölder, scrivendo: Z p p kf kp = jf (x)j 1d (x) p e osservando che se f 2 Lr ( ) ; allora jf j 2 Lr=p ( ) e la costante 1 appartiene allo spazio Ls ( ) con s coniugato di r=p; quindi 1=s = 1 p=r: Perciò: p kf kp Z p jf (x)j r p p r d (x) Z 126 1 s 1 d p r p = kf kr 1 p=r ( ) ed elevando ambo i membri alla 1=p si ha la tesi. Nel caso r = 1 si ha subito 1 1 Z Z p p 1 p jf (x)j d (x) kf k1 1d (x) = ( ) p kf k1 : Se ( ) = 1 abbiamo già visto con semplici esempi che non valgono inclusioni banali tra gli spazi Lp : Dati due esponenti p; r 2 [1; 1] diversi tra loro, esistono f 2 Lp ( ) n Lr ( ) e g 2 Lr ( ) n Lp ( ) : Qui sotto si riporta qualche esempio in tal senso. Si può dimostrare che, ad ogni modo, se f 2 Lp ( )\Lr ( ) per due esponenti p; r con 1 p < r 1; allora f 2 Ls ( ) per ogni s 2 (p; r). Ad esempio, se f 2 L1 ( ) \ L1 ( ) allora f 2 Ls ( ) per ogni s 2 [1; 1]. Esempio 11.13 1. f (x) = p1x 2 Lp (0; 1) per ogni p 2 [1; 2) ma non per p 2. f (x) = p1x 2 Lp (1; +1) per ogni p 2 (2; +1] ma non per p 2: 3. f (x) = px 1log x 2 Lp (0; 1=2) per ogni p 2 [1; 2] ma non per p > 2: 4. f (x) = px 1log x 2 Lp (2; 1) per ogni p 2 [2; +1] ma non per p < 2: 1 5. f (x) = px(1+jlog 2 Lp (0; 1) se e solo se p = 2: xj) 6. Se r 2 [1; 1); f (x) = 1 x1=r (1+jlog xj2 ) 2: 2 Lp (0; 1) se e solo se p = r: 7. f (x) = sin x 2 Lp (0; 1) se e solo se p = 1: 8. Passando da R a Rn ; chiediamoci ora, per > 0 …ssato, per quali p è f (x) = jxj1 2 Lp (B1 ), con B1 = fx 2 Rn : jxj < 1g : Con cambio di variabili polari si ha: Z Z 1 Z 1 dx d 1 n 1 c d = c < 1 per: n n p = p p n+1 jxj<1 jxj 0 0 p n + 1 < 1, cioè n 1 p < ; purché < n: Per n; f 2 = Lp (B1 ) per nessun p. 9. Analogamente chiediamoci per quali p è f (x) = jxj1 2 Lp (Rn n B1 ) : Si ha ora: Z Z +1 dx d = c < 1 per: n p p n+1 jxj 1 jxj 1 p n + 1 > 1, cioè n p> se p 11.4 1 se n > n: Approssimazione di funzioni Lp Tutto quanto abbiamo detto …n qui per gli spazi Lp vale su un generico spazio di misura ( ; M; ) (con completa). Ora ci poniamo un problema che tipicamente ha senso quando è un sottoinsieme misurabile di Rn e la misura 127 di Lebesgue in Rn : è possibile approssimare in norma Lp ( ) una funzione f 2 Lp ( ) con funzioni continue, oppure regolari (cioè derivabili un certo numero di volte)? Vale in proposito un risultato molto forte, che ci limitiamo ad enunciare. Sia un aperto di Rn . Consideriamo lo spazio C01 ( ) delle funzioni f derivabili in…nite volte in e aventi supporto compatto in ; ossia tali che esiste un insieme chiuso e limitato K per cui f (x) = 0 fuori da K (l’insieme K dipende dalla funzione f ). Si osservi che C01 ( ) è uno spazio vettoriale, anche se non possiede una norma naturale. E’ovviamente contenuto in Lp ( ) per ogni p 2 [1; 1]; infatti per il teorema di Weierstrass f è limitata e si annulla fuori da un insieme limitato, quindi di misura …nita. Con queste premesse, si ha allora: Teorema 11.14 Lo spazio C01 ( ) è denso in Lp ( ) per ogni p 2 [1; 1): Esplicitamente, la densità signi…ca che per ogni f 2 Lp ( ) con p 2 [1; 1) 1 esiste una successione f'n gn=1 C01 ( ) tale che k'n f kp ! 0 per n ! 1. A maggior ragione, quindi, ogni funzione Lp ( ) con p 2 [1; 1) può essere approssimata bene quanto vogliamo in norma Lp mediante funzioni continue in o con funzioni C 1 . E’utile talvolta anche un risultato di approssimazione di tipo diverso, non mediante funzioni regolari ma mediante funzioni semplici: Teorema 11.15 Lo spazio delle funzioni semplici in (cioè misurabili e che assumono un numero …nito di valori) è denso in Lp ( ) per ogni p 2 [1; 1): Usando i teoremi precedenti e qualche altro argomento si può dimostrare in particolare che: Teorema 11.16 Lo spazio Lp ( ) è separabile per tutti i p 2 [1; 1): Si osservi esplicitamente che i teoremi precedenti escludono lo spazio L1 ( ). Infatti, si può dimostrare che lo spazio L1 ( ) non è separabile, e non è possibile approssimare in norma L1 una qualunque funzione L1 mediante funzioni continue o regolari. 11.5 Integrali doppi in Rn Lavorando con l’integrale di Lebesgue in Rn , e in particolare quando si studiano operatori integrali de…niti su spazi di funzioni integrabili, si possono incontrare integrali del tipo: Z Z f (x; y) dy dx Rn Rn dove sia x che y rappresentano variabili in Rn . Le domande che si pongono naturalmente sono: 1. E’lecito scambiare l’ordine di integrazione, scrivendo Z Z Z Z f (x; y) dy dx = f (x; y) dx dy ? (11.2) Rn Rn Rn 128 Rn 2. L’integrale iterato calcolato nella formula precedente, coicide con l’integrale doppio Z f (x; y) dxdy (11.3) R2n che si otterrebbe vedendo f (x; y) come funzione di 2n variabili e calcolandone l’integrale di Lebesgue in R2n ? La risposta a queste domande è contenuta nel prossimo teorema. In sostanza, se almeno uno dei 3 integrali che compaiono nelle (11.2)-(11.3) converge assolutamente (cioè quando si sostituisca f con jf j), allora tutti e tre gli integrali convergono ed entrambe le domande hanno risposta a¤ermativa. Teorema 11.17 (di Fubini-Tonelli) Sia f : R2n ! R misurabile. 1. Se f 0; allora l’uguaglianza (11.2) è sempre vera, dove i due membri possono essere entrambi …niti o entrambi in…niti. 2. Se f ha segno qualsiasi ma almeno uno degli integrali iterati che compaiono in (11.2) converge assolutamente (cioè converge uno degli integrali iterati di jf j) allora la (11.2) vale, con entrambi i membri …niti. In particolare le funzioni di una variabile Z Z g (x) = f (x; y) dy e h (y) = f (x; y) dx Rn Rn risultano Lebesgue integrabili in Rn , e in particolare …nite quasi ovunque. Inoltre in questo caso f 2 L1 R2n e l’integrale doppio (11.3) di f coincide con gli integrali iterati in (11.2). 3. Se è noto a priori che f 2 L1 R2n allora valgono tutte le conclusioni del punto precedente. Dal punto di vista operativo i punti più utili del teorema sono i primi due: raramente si sa a priori che f 2 L1 R2n ; più spesso questa conclusione viene conquistata grazie al fatto che uno degli integrali iterati converge assolutamente. Spesso accade che l’integrale che nasce dal problema in esame sia uno dei due integrali iterati, ma quello che si riesce a calcolare esplicitamente sia l’altro integrale iterato. Risulta quindi utile sapere a priori che vale l’uguaglianza (11.2). Questo è vero se l’integrale iterato che si sa più facilmente calcolare o almeno stimare, converge assolutamente. Esempio 11.18 1. Calcolare l’integrale di Lebesgue: Z 1 se 0 < x < 1 x+y 2 f (x; y) dxdy con f (x; y) = 0 altrimenti. 2 R L’integranda è non negativa, quindi è lecito calcolare l’integrale doppio come 129 integrale iterato in qualsiasi ordine. Calcoliamo: Z Z 1 Z 1 dy dx = f (x; y) dxdy = x + y2 R2 0 R ! Z 1 +1 y 1 dx = 2 p arctan p x 0 x 0 Z 1 p 1 p dx = 2 x 0 = 2 : = x 0 Si osservi in particolare che la funzione de…nita dall’integrale interno, Z g (x) = f (x; y) dy = p x R è …nita per quasi ogni x (ma non per ogni x). 2. Stabilire se f 2 L1 R2 , con x2 y 2 f (x; y) = e sin (xy) : La funzione ha segno variabile, ma jf (x; y)j e x2 y 2 : Maggioriamo l’integrale iterato di f con l’integrale iterato di g (x; y) = e Z Z Z Z 2 2 jf (x; y)j dy dx e x y dy dx R R R R Z Z 2 x2 = e dx e y dy < 1: R R 2 p (E’ noto che R e x dx = , confronto, l’integrale iterato di calcolo precedente non fornisce 3. Stabilire se f 2 L1 R2 , x2 y 2 : R ma il valore esatto qui non è importante). Per jf j converge, quindi f 2 L1 R2 . Si noti che il il valore dell’integrale doppio di f . con f (x; y) = e jxyj : La funzione è positiva, calcoliamo l’integrale doppio come integrale iterato: Z Z +1 Z +1 f (x; y) dxdy = 2 2 e xy dy dx R2 0 0 ! Z +1 +1 e xy =4 dx x 0 0 Z +1 dx =4 = +1; x 0 pertanto f 2 = L1 R2 . 130 11.6 Convoluzione in Rn Un’operazione che riguarda gli spazi Lp (Rn ) è la convoluzione, di cui ci limitiamo a segnalare la de…nizione e un paio di proprietà. Teorema 11.19 Se f; g 2 L1 (Rn ) ; allora l’integrale di convoluzione Z (f g) (x) = f (x y) g (y) dy Rn è ben de…nito per q.o. x 2 Rn , e risulta: kf gkL1 (Rn ) kf kL1 (Rn ) kgkL1 (Rn ) : Dimostrazione. Tralasciamo di dimostrare il fatto che la funzione di due variabili f (x y) g (y) è misurabile. Posto questo, proviamo la disuguaglianza delle norme, da cui in particolare segue che la convoluzione è de…nita per quasi ogni x. Z Z Z Z kf gkL1 (Rn ) = f (x y) g (y) dy dx jf (x y) g (y)j dydx Rn Rn Rn Rn scambiando l’ordine di integrazione nell’integrale iterato (operazione lecita per il teorema di Fubini-Tonelli in quanto l’integranda è presa in valore assoluto) Z Z = jg (y)j jf (x y)j dx dy: Rn Ora l’integrale interno è Z jf (x Rn y)j dx = (traslando x y = t) Z = jf (t)j dt = kf kL1 (Rn ) ; Rn Rn perciò kf gkL1 (Rn ) Z Rn jg (y)j kf kL1 (Rn ) dy = kf kL1 (Rn ) kgkL1 (Rn ) : Qualche osservazione. Si noti anzitutto che la de…nizione di convoluzione ha senso tra due funzioni de…nite su tutto lo spazio Rn . Si veri…ca con un cambio di variabile che la convoluzione è commutativa, ossia (f g) = (g f ). Si noti che l’integranda f (x y) g (y), per ogni x …ssato si può vedere come una funzione di y che è il prodotto di due funzioni L1 , quindi in generale non è L1 . Tuttavia il teorema appena dimostrato a¤erma che per quasi ogni x in e¤etti è L1 . Ad esempio, se 1 f (x) = p ( 1;1) (x) ; jxj 131 la funzione f 2 L1 (R) ; quindi f f 2 L1 (R) e in particolare l’integrale Z 1 1 p y) p (f f ) (x) = ( 1;1) (x ( 1;1) (y) dy jx yj jyj R è …nito per q.o. x. Però per x = 0 si ha Z 1 1 p (f f ) (0) = ( 1;1) ( y) p jyj jyj R ( 1;1) (y) dy = Z 1 1 dy = 1: jyj E’facile veri…care direttamente che per ogni x 6= 0 invece l’integrale converge. Segnaliamo anche la seguente estensione del teorema precedente: Teorema 11.20 (Disuguaglianza di Young) Siano f 2 L1 (Rn ) e g 2 Lp (Rn ) per qualche p 2 [1; 1] : Allora è ben de…nita per q.o. x la convoluzione f g e si ha: kf gkLp (Rn ) kf kL1 (Rn ) kgkLp (Rn ) : 12 Cenni su operatori e funzionali lineari continui Introduciamo ora le prime nozioni sugli operatori e i funzionali lineari continui su spazi vettoriali normati. Questi concetti da una parte di collegano alla teoria degli spazi Lp che abbiamo appena studiato, dal momento che esempi signi…cativi di tali operatori e funzionali riguardano questi spazi, d’altro canto costituiscono un discorso a sé, che ci servirà anche nell’a¤rontare il successivo studio degli spazi di Hilbert, nel prossimo capitolo. 12.1 Operatori lineari continui De…nizione 12.1 Siano X; Y due spazi vettoriali normati sul campo K (= R o C). Una funzione T : X ! Y si dice operatore lineare se T ( x + y) = T (x) + T (y) 8x; y 2 X; 8 ; 2 K. Solitamente quando un operatore è lineare si omette la parentesi nell’argomento, e si scrive T x invece che T (x) (ma naturalmente bisogna comunque scrivere T (x + y) se l’argomento è una somma!). Teorema 12.2 Siano X; Y due spazi vettoriali normati e T : X ! Y un operatore lineare. Sono equivalenti le seguenti tre condizioni: (a) T (vista come funzione tra due spazi metrici) è continua in 0. (b) T è continua in ogni punto. (c) vale la seguente condizione di limitatezza: kT xkY < 1: x2X;x6=0 kxkX sup 132 Dimostrazione. Proviamo che (a)=)(b). Questo è vero per linearità. Proviamo che T è continua in x sapendo che è continua in 0: Occorre mostrare che xn ! x =) T xn ! T x: Ma per linearità: T xn T x = T (xn x) ! 0 perché (xn x) ! 0 e T è continua in 0. Proviamo che (b)=)(c). Per assurdo, sia kT xkY = +1; x2X;x6=0 kxkX sup 1 allora esiste una successione fxn gn=1 X tale che kT xn kY kxn kX Poniamo yn = si ha xn nkxn kX . Allora kyn kX = n: 1 n (12.1) ! 0 perciò essendo T continua in 0 T yn ! 0. Ma: T yn = kT xn kY T xn perciò kT yn kY = n kxn kX n kxn kX 1 per (12.1), assurdo. Proviamo che (c)=)(a). Per ipotesi esiste K > 0 tale che kT xkY < K per ogni x 2 X; x 6= 0: kxkX Allora se xn ! 0; kT xn kY < K kxn kX ! 0 perciò T xn ! 0; e T è continua in 0. L’equivalenza delle tre condizioni è quindi provata. De…nizione 12.3 Un operatore lineare T : X ! Y tra due spazi vettoriali normati X; Y si dice continuo se vale una delle tre condizioni equivalenti espresse dal teorema precedente. In tal caso si de…nisce norma dell’operatore il numero kT k = sup x2X;x6=0 kT xkY . kxkX Risulta, per de…nizione kT xkY kT k kxkX 133 8x 2 X: Si veri…ca facilmente che ogni combinazione lineare di operatori lineari continui tra X e Y è a sua volta un operatore lineare continuo. Si può considerare quindi lo spazio L (X; Y ) di tutti gli operatori lineari continui tra gli spazi vettoriali normati X e Y , che risulta uno spazio vettoriale. Anzi, la norma operatoriale kT xkY kT kL(X;Y ) = sup x2X;x6=0 kxkX risulta e¤ettivamente una norma in questo spazio, quindi: L (X; Y ) è uno spazio vettoriale normato. Si osservi la seguente disuguaglianza, che esprime il signi…cato della norma: kT xkY kT kL(X;Y ) kxkX 8x 2 X: Viceversa, se si trova una costante K > 0 per cui si abbia kT xkY K kxkX 8x 2 X; (12.2) allora si può a¤ermare che kT kL(X;Y ) K; kT xk in quanto la norma dell’operatore è l’estremo superiore del quoziente kxk Y e X quindi anche l’estremo inferiore delle costanti K per cui è vera la (12.2). Vale il seguente teorema, che ci limitiamo a enunciare: Teorema 12.4 Siano X; Y spazio vettoriali normati. Se Y è completo anche anche L (X; Y ) è completo. Esempi di operatori lineari continui notevoli Esempio 12.5 Sia k 2 L1 (Rn ). Allora T : Lp (Rn ) ! Lp (Rn ) T f = kf è lineare continuo su Lp (Rn ) ; per ogni p 2 [1; 1] ; con kT k = kkkL1 (Rn ) . T si dice (ovviamente) operatore di moltiplicazione. Esempio 12.6 Sia k 2 L1 (Rn ) : Allora T : Lp (Rn ) ! Lp (Rn ) Tf = k f è lineare continuo su Lp (Rn ) ; per ogni p 2 [1; 1] ; con kT k = kkkL1 (Rn ) , in base alla disuguaglianza di Young (Teorema 11.20). T si dice (ovviamente) operatore di convoluzione. 134 Esempio 12.7 Sia T : C 0 [0; 1] ! C 0 [0; 1] Z x T f (x) = f (t) dt: 0 T è sostanzialmente l’operatore primitiva. (Abbiamo semplicemente evitato di aggiungere a T f la costante arbitraria, per rendere T univocamente de…nito). L’operatore integrale T è lineare continuo, Z x Z x jT f (x)j jf (t)j dt kf k1 dt = x kf k1 0 kT f k1 0 kf k1 : Esempio 12.8 Sia T : C 2 [a; b] ! C 0 [a; b] T f (x) = (x) f 00 (x) + (x) f 0 (x) + (x) f (x) con ; ; 2 C 0 [a; b] : L’operatore di¤erenziale T è (ovviamente lineare e) continuo perché kT f kC 2 [a;b] c kf kC 0 [a;b] con c dipendente da k kC 0 [a;b] ; k kC 0 [a;b] ; k kC 0 [a;b] . Consideriamo ora un generico operatore integrale lineare del tipo Z T f (x) = k (x; y) f (y) dy dove ( ; M; ) è uno spazio di misura qualsiasi, k : ! R è una funzione misurabile assegnata (solitamente detta nucleo integrale). Vogliamo precisare delle ipotesi su k sotto le quali si possa a¤ermare che T è un operatore lineare continuo su qualche spazio di tipo Lp ( ). Proviamo il seguente Teorema 12.9 Con le ipotesi e notazioni precedenti, valgono le seguenti proprietà: a. Se Z sup jk (x; z)j dx < 1; z2 allora T è lineare continuo come operatore T : L1 ( ) ! L1 ( ) : b. Se Z 2 jk (x; y)j dxdy < 1; allora T è lineare continuo come operatore T : L2 ( ) ! L2 ( ) : 135 Dimostrazione. L’operatore è ovviamente lineare. Proviamo le proprietà di continuità sotto le opportune ipotesi su k. a. Z Z Z kT f kL1 ( ) = jT f (x)j dx = k (x; y) f (y) dy dx Z Z jk (x; y)j jf (y)j dydx ora essendo l’integranda positiva, per il teorema di Fubini-Tonelli (v. §11.5) è lecito scambiare l’ordine di integrazione, scrivendo Z Z = jf (y)j jk (x; y)j dx dy Z Z jf (y)j sup jk (x; z)j dx dy z2 Z Z = sup jk (x; z)j dx jf (y)j dy z2 = K kf kL1 ( ) K = sup Z nell’ipotesi z2 jk (x; z)j dx < 1: b. Stimiamo prima, mediante la disuguaglianza di Hölder: jT f (x)j = Z kf kL2 ( k (x; y) f (y) dy ) Z 1=2 2 k (x; y) dy : Perciò kT f kL2 ( ) = Z 1=2 kf kL2 ( nell’ipotesi K= 12.2 2 jT f (x)j dx ) Z Z Z 1=2 2 k (x; y) dy dx = K kf kL2 ( ) 1=2 2 k (x; y) dydx < 1: Funzionali lineari continui Un caso particolare di operatore lineare si ha quando Y coincide con il campo degli scalari. Un operatore lineare continuo T : X ! R (dove X è uno spazio vettoriale normato reale) si dice funzionale lineare continuo su X. Lo spazio 136 L (X; R) si dice spazio duale di X e si indica con X o X 0 : In base al Teorema 12.4, X è sempre uno spazio di Banach (perché il secondo spazio, Y = R, lo è). Quindi il duale di uno spazio vettoriale normato X è lo spazio (vettoriale normato) dei funzionali lineari continui su X. La norma di un funzionale lineare continuo è de…nita da jT xj . kT kX = sup x2X;x6=0 kxkX Esempio 12.10 1. Sia X = C 0 [a; b]. Fissato un punto x0 2 [a; b], il funzionale T f = f (x0 ) è ovviamente lineare, ed è continuo perché jT f j = jf (x0 )j kT k kf kC 0 [a;b] , da cui 1: T si dice funzionale di valutazione (valuta le funzioni nel punto x0 ). 2. Sia X = C 0 [a; b]. L’integrale de…nito è un funzionale lineare continuo: Z b Tf = f (t) dt a Z jT f j b a kT k jf (t)j dt (b kf kC 0 [a;b] (b a) a) : Confrontando gli esempi 1 e 2 vediamo che esistono funzionali lineari continui di tipo molto diverso, sullo spazio C 0 [a; b] : 3. Sia X = Lp ( ), e …ssiamo una funzione g 2 Lq ( ) con q esponente coniugato a p. Allora: Z Tf = f (x) g (x) dx è un funzionale lineare continuo su Lp ( ) ; per la disuguaglianza di Hölder: Z jT f j jf (x) g (x)j dx kf kLp ( ) kgkLq ( ) ; perciò kT k kgkLq ( ) . Mostriamo che è, più precisamente, kT k = kgkLq ( ) . E’ su¢ ciente per questo trovare una speci…ca f per cui risulti Si ha f 2 Lp perché p (q 1)p jT f j kf kp q 1 = kgkq : Poniamo: f = jgj q q=p jf j = jgj = jgj ; quindi kf kp = kgkq Z b Z b q q Tf = f (t) g (t) dt = jgj dt = kgkq a a q kgkq Tf q = kgkq = q=p kf kp kgkq q=p 137 = kgkq ; e sgn(g) : quindi kT k = kgkLq ( ) . L’ultimo esempio si può rileggere così: ogni funzione g 2 Lq ( ) induce in modo naturale un funzionale lineare continuo su Lp ( ) per p; q coniugati. Potremmo indicare questo funzionale con Tg : Lp ( ) ! R Z b Tg : f 7 ! f g: a Chiediamoci ora: esistono funzionali lineari continui su Lp ( ) di tipo diverso da questo, cioè che non si rappresentino come integrali contro una funzione Lq ? La risposta è negativa, e questo signi…ca che conosciamo una caratterizzazione completa dei funzionali lineari continui su Lp ( ): Teorema 12.11 (di rappresentazione di Riesz) Sia 1 p < 1. Per ogni funzionale lineare continuo T su Lp ( ) esiste una funzione g 2 Lq ( ) (con q esponente coniugato di p) tale che T :f 7 ! Z b f g: a Inoltre kT k = kgkq . Possiamo anche leggere questo teorema dicendo: lo spazio duale di Lp ( ) si può identi…care con Lq ( ) ; per 1 p < 1. Invece, il duale di L1 ( ) non è L1 ( ). Si osservi che, in particolare, il duale di L2 ( ) è L2 ( ) stesso (essendo l’esponente 2 il coniugato di se stesso). Questo fatto è un caso particolare di un teorema molto più generale, di rappresentazione dei funzionali lineari continui su uno spazio di Hilbert, di cui parleremo fra non molto. Si osservi anche che tutto ciò che abbiamo detto vale per gli spazi Lp su qualsiasi spazio di misura astratto ( ; M; ). Se in particolare consideriamo lo spazio (N; P (N) ; m) dove m è la misura del conteggio, otteniamo gli spazi Lp di successioni, indicati col simbolo `p : 8 9 !1=p 1 < = X 1 p `p = x = fxn gn=1 R : kxk`p = jxn j < 1 ; per 1 p < 1; : ; n=1 `1 = 1 x = fxn gn=1 R : kxk`1 = sup jxn j < 1 : n In particolare i funzionali lineari continui su `p sono tutti e soli quelli del tipo: 1 Ty : fxn gn=1 7! 1 X n=1 1 xn yn con fyn gn=1 2 `q …ssato, 138 e si ha: 1 X n=1 xn yn 1 X n=1 p jxn j !1=p 1 X n=1 q jyn j !1=q (disuguaglianza di Holder in spazi `p ). E’ interessante, in particolare, il caso p = q = 2, per cui la disuguaglianza precedente risulta una generalizzazione in…nito dimensionale della disuguaglianza (di Cauchy-Schwarz) elementare che vale per il prodotto scalare in Rn : !1=2 1 !1=2 1 1 X X X 2 2 xn yn jxn j jyn j : n=1 n=1 n=1 Questa relazione tra spazi in…nito dimensionali, prodotto scalare e funzionali lineari continui avrà la sua piena chiari…cazione e il suo sviluppo naturale nella teoria degli spazi di Hilbert, di cui ci occupiamo nel prossimo capitolo. 13 Esercizi sulla Parte 2 A. Esercizi su spazi di misura Es 13.1 Dimostrare la Proposizione 8.2: Se M è una -algebra, M è chiusa anche rispetto alle seguenti operazioni insiemistiche: unione …nita, intersezione …nita o numerabile; di¤ erenza insiemistica. [Suggerimento: sfruttando le proprietà delle operazioni insiemistiche, si tratta di esprimere ciascuna di queste operazioni mediante quelle per cui già si sa che M è chiusa, ossia unioni numerabili e complementare.] Es 13.2 Dimostrare la Proposizione 8.3: Se E P ( ) è una qualsiasi famiglia di sottoinsiemi di , è ben de…nita la più piccola -algebra contenente E, detta “ -algebra generata da E” e si indica con (E). [Suggerimento: Infatti, di -algebre contenenti E ce n’è almeno una: P ( ); consideriamo allora l’intersezione di tutte le -algebre contenenti E; si tratta di dimostrare che quest’intersezione è a sua volta una -algebra; questa sarà per costruzione la più piccola -algebra contenente E.] Es 13.3 Dimostrare il Teorema 8.6, che esprime le varie proprietà di una misura astratta. Fare contresempi alle proprietà di condizionata sottrattività e condizionata continuità da sopra, quando non vale l’ipotesi di misura …nita dell’insieme più grande. Es 13.4 Dimostrare il Teorema 8.13 sulla restrizione di una misura: sia ( ; M; ) uno spazio di misura e E 2 M un insieme misurabile …ssato. De…niamo: ME = fA \ E : A 2 Mg ; E : ME ! [0; +1] E (A) = (A) 139 (cioè E è la restrizione della misura alla famiglia di insiemi ME ). Allora ME è una sigma algebra e E una misura su ( ; ME ). (Si dice che E è la misura restrizione di all’insieme E). Es 13.5 Ricordando che una proprietà si dice vera quasi ovunque se è vera salvo al più in un insieme di misura nulla, dimostrare che se una funzione f : R ! R è continua, allora se f (x) = 0 quasi ovunque, necessariamente f è identicamente nulla. Fare poi un esempio di funzione zero quasi ovunque ma non identicamente nulla. Es 13.6 Stabilire se la seguente funzione è Riemann integrabile in [0; 1]: f (x) = arctan 1 sin x1 . [Suggerimento: per prima cosa determinare tutti i punti di discontinuità di questa funzione in [0; 1].] Es 13.7 Stabilire quali delle seguenti funzioni d’insieme sono delle misure di Borel in R, giusti…cando le proprie conclusioni: Z 2 (E) = ex dx; 1 ZE xe jxj dx; 2 (E) = E 3 (E) = 3 jEj dove jEj è la misura di Lebesgue; 2 (E) = jEj ; 5 (E) = 2 0 + 5 Z 6 (E) = 4 1 + 4 1 , dove e x2 è la misura di Dirac concentrata in x0 ; x0 dx. E\( 1;0) Es 13.8 Sia f (x) la funzione di Dirichlet, f (x) = 1 se x 2 R n Q 0 se x 2 Q. Determinare la funzione integrale (di Lebesgue) F (x) = Rx 0 f (t) dt: B. Esercizi sul passaggio al limite sotto il segno di integrale per l’integrale di Lebesgue, e confronto con l’integrale di Riemann Nei prossimi esercizi, l’obiettivo è calcolare Z lim fn (x) dx; n!1 I evitando se possibile di calcolare ciascun integrale (cioè cercando di applicare il teorema di Lebesgue della convergenza dominata). Quando I è un intervallo 140 limitato, inoltre, ci si può chiedere se è possibile applicare la teoria di Riemann (criterio della convergenza uniforme). Seguire la traccia indicata in ogni esercizio, svolgendo i dettagli. 2 2 Es 13.9 Sia fn (x) = nxe n x in [0; 1]. La successione tende a zero puntualmente ma non uniformemente in [0; 1]. In base alla teoria di Riemann non possiamo quindi calcolare il limite dell’integrale di fn . [Suggerimento: cerchiamo una maggiorante integrabile. Si calcola fn0 (x) ; si determina il massimo di fn (x) ; si trova che questo è limitato al variare di n (anzi è costante), perciò vale una disuguaglianza del tipo jfn (x)j c per ogni x 2 [0; 1] e per ogni n, e il teorema di Lebsegue è applicabile. Per confronto, si può calcolare direttamente l’integrale (la primitiva è elementare!) e farne il limite.] R +1 Es 13.10 Si calcoli ora il limite di 0 fn (x) dx dove fn sono le stesse funzioni dell’esempio precedente, applicando il teorema della convergenza dominata. [Suggerimento: per trovare la maggiorante integrabile in [1; +1) dimostrare che è fn (x) f1 (x) se x 1; per far questo, dimostrare che per ogni x 1 la successione ffn (x)g è monotona decrescente; per far questo, calcolare la derivata... rispetto ad n.] 2 2 Es 13.11 Sia fn (x) = n x e n x in [0; 1]. Studiare il limite dell’integrale su [0; 1] per ; > 0. (Rispetto all’esempio precedente, in questo caso la funzione non ha una primitiva elementare per ogni ; > 0; perciò è naturale cercare di calcolare il limite degli integrali senza calcolare gli integrali). Traccia: il limite puntuale è zero per ogni ; > 0; perciò se troviamo una maggiorante integrabile, anche il limite degli integrali è zero. Si osservi il passaggio: 2 2 2 2 fn (x) = n x e n x = (nx) x e nx : La funzione (nx) e n2 x2 2 è limitata in [0; 1] perché la funzione g (t) = t e t è limitata su [0; +1) (veri…carlo) e la funzione precedente è g (nx). Quindi si può scrivere 0 fn (x) cx : Di conseguenza per < + 1 il limite dell’integrale è zero (perché?). calcolare il limite dell’integrale per +1 si imposti il calcolo esplicito RPer 1 di 0 fn (x) dx con la sostituzione nx = t. Cosa si trova? In questi casi quindi, a posteriori, è vero o falso che Z Z lim fn (x) dx = lim fn (x) dx? n!1 I n!1 I 1 Es 13.12 Sia fn (x) = 1+nx in [0; 1] con > 0. Calcolare il limite di fn e dell’integrale di fn , usando il teorema della convergenza dominata. 141 nx Es 13.13 Sia fn (x) = 1+n 2 x2 . Dimostrare che fn tende a zero puntualmente ma non uniformemente in [ 1; 1]. Calcolare il limite dell’integrale usando il teorema di Lebesgue. nx Es 13.14 Sia fn (x) = 1+n 2 R. Determinare per quali 2 x2 in [0; +1); con 1 sta in L [0; +1) e per questi calcolare il limite dell’integrale. [Suggerimento. Dopo aver determinato gli per i quali fn 2 L1 [0; +1), cercare una maggiorante “naturale”; per gli per i quali questa è integrabile, il teorema di Lebesgue è applicabile. Per gli altri ; calcolare esplicitamente l’integrale oppure valutarlo mediante la sostituzione nx = t.] R1 xn Es 13.15 Sia fn (x) = 1+x 10 in [0; 1]. Calcolare limn!1 0 fn (x) dx: Es 13.16 Sia fn (x) = x1=n 1+x2 in [0; 1]. Calcolare limn!1 Es 13.17 Sia fn : [0; ] ! R 2n sin (2n x) per x 2 [0; 2 0 altrimenti. fn (x) = R1 n 0 fn (x) dx: ] Vale il passaggio al limite sotto il segno di integrale? n Es 13.18 QUI Sia gn = ( 1) fn con fn come nell’esempio precedente. Vale il passaggio al limite sotto il segno di integrale? Che di¤ erenza si nota rispetto all’esercizio precedente? Es 13.19 Sia fn (x) = xn e nx su (0; 1). Suggerimento. Per discutere il limite dell’integrale, dimostrare che fn (x) f1 (x) per ogni n e per ogni x 2 (0; 1) : Es 13.20 (Un esempio sul Teorema di Fatou). Sia fn : [0; 2] ! R fn = Calcolare separatamente osserva? R2 0 se n è pari se n è dispari. (0;1) (1;2) R2 liminffn (x) dx e liminf 0 fn (x) dx. Che cosa si Es 13.21 (Un altro esempio sul Teorema di Fatou). Sia fn (x) = sin2 (nx) in R R [0; ] per n = 1; 2; 3; ::: Calcolare separatamente 0 liminffn (x) dx e liminf 0 fn (x) dx. Che cosa si osserva? Es 13.22 Calcolare i seguenti limiti giusti…cando il procedimento seguito: 1 1 X X m 2(nm+1)=(m+2) 1 ; lim ; lim 2 2 m!1 n + m m!1 n=1 mn + 1 m!1 n=1 n! n=1 lim 1 X [Suggerimento: applicare il teorema della convergenza dominata, vedendo la serie come un integrale astratto in un opportuno spazio di misura.] 142 Es 13.23 Calcolare liminf e limsup della seguente successione di funzioni in [ 1; 1]: n x (x + ( 1) n) : fn (x) = 1 + n + 2x C. Misura e dimensione di Hausdor¤ Es 13.24 Si consideri l’insieme del piano de…nito col seguente procedimento iterativo. T0 è un triangolo equilatero di lato 1 (insieme chiuso). Al passo 1, togliamo da T0 l’interno del triangolo equilatero ottenuto unendo i punti medi dei 3 lati, chiamiamo T1 l’insieme rimanente, costituito da 3 triangoli equilateri di lato 1=2. Al passo 2 togliamo a ciascuno dei 3 triangoli che formano T1 l’interno del triangolo equilatero ottenuto unendo i punti medi dei tre triangoli di T1 ; e chiamiamo T2 ciò che rimane (unione di 9 triangoli equilateri di lato 1/4), e così via. L’insieme T che ci interessa è l’intersezione (cioè “il limite”) degli insiemi Tn costruiti nel procedimento iterativo. Calcolare la dimensione di Hausdor¤ di T . D. Spazi Lp Es 13.25 Si consideri lo spazio di misura (R; P (R) ; m) dove m è la misura del conteggio. Si scriva esplicitamente cosa a¤ ermano in questo contesto le disuguaglianze di Hölder e di Minkowski in spazi Lp . (Questi spazi sono chiamati `p ). Es 13.26 Stabilire per quali p 2 [1; 1] ciascuna delle seguenti funzioni appartiene a Lp (R) : 2 e x ; jxj 1 f2 (x) = ; 1 + jxj log x f3 (x) = ; 1 + jxj log x f4 (x) = 2; 1 + jxj p 2 3 xe x f5 (x) = : 1 ex f1 (x) = E. Funzionali e operatori lineari continui, operatori integrali 143 Es 13.27 Di ciascuno dei seguenti, dire se è un operatore lineare continuo tra gli spazi speci…cato, dimostrando l’a¤ ermazione fatta: 1: T : C 0 [ 2; 2] ! C 0 [ 1; 1] ; T f (x) = f (2x) Z x 2: T : C 0 [ 2; 2] ! C 1 [ 2; 2] ; T f (x) = 3 f (t) dt 0 Z x 3: T : C 0 [ 2; 2] ! C 1 [ 2; 2] ; T f (x) = f (x) + f (t) dt 0 Z x 4: T : C 0 [ 2; 2] ! C 0 [ 2; 2] ; T f (x) = f (x) + f (t) dt 0 Z +1 2 5: T : L1 (R) ! L1 (R) ; T f (x) = f (x t) e t dt 6: T : L3 (R) ! L3 (R) ; T f (x) = 1 7: T : L 1 (R) ! L Z (R) ; T f (x) = 8: T : L1 (R) ! L2 (R) ; T f (x) = Z 1 +1 f (x t) e t2 dt 1 Z +1 f (x t) e t2 dt 1 +1 1 f (x t) sin tdt 1 + jtj 9: T : L (R) ! L (R) ; T f (x) = f (x) sin2 x 5 5 Es 13.28 Siano X; Y spazi vettoriali normati qualsiasi, e T : X ! Y lineare continuo. Utilizzando la de…nizione di norma dell’operatore T data nel §12.1, si veri…chi che questa soddisfa gli assiomi di norma. Es 13.29 Sia T f (x) = Z k (x; y) f (y) dy I Stabilire per ciascuno dei seguenti nuclei k (x; y) ed intervallo I se l’operatore T è continuo su L1 (I). k (x; y) = I= e xy [0; 1] Es 13.30 Sia T f (x) = e x=y [1; +1) Z ex=y 1 1+xy b k (x; y) f (y) dy: a a. Dimostrare che T : L1 [a; b] ! L1 [a; b] è una contrazione se Z b sup jk (x; y)j dx < 1: y2[a;b] 1. a b. Dimostrare che T : L2 [a; b] ! L2 [a; b] è una contrazione se kkkL2 ([a;b] 144 [a;b]) < Es 13.31 Si consideri l’equazione integrale Z x f (x) + (x t) e (x t) f (t) dt = g (x) 0 con g 2 L1 (0; +1) assegnata e f 2 L1 (0; +1) incognita. Stabilire per quali 2 R l’equazione ha una e una sola soluzione in L1 (0; +1) per ogni g 2 1 L (0; +1) assegnata. (Si chiede di giusti…care la risposta utilizzando il teorema delle contrazioni, e non le trasformate integrali, per chi le conosce). Es 13.32 Di ciascuno dei seguenti, dire se è un funzionale lineare continuo sullo spazio speci…cato, dimostrando l’a¤ ermazione fatta: 1: T f = f (0) su C 0 [ 1; 1] : 2: T f = f (0) su L1 [ 1; 1] : 3: T f = f (0) su L1 [ 1; 1] Z 2 4: T f = f (t) dt su C 0 [ 2; 2] 0 5: T f = Z 1 f (t) dt su L1 [ 2; 2] 0 6: T f = 7: T f = Z 0 f (t) dt su L2 [ 2; 2] 2 2 Z 2 f (t) dt su L2 [ 2; 2] 0 8: T f = Z 2 f (t) sin3 tdt su L2 [ 2; 2] 2 9: T f = 5f (1) + 3 Z 2 f (t) et dt su C 0 [ 2; 2] 0 13.1 Soluzioni di alcuni esercizi della Parte 2 Soluzione Es. 13.11. Si trova lim n!+1 Z 1 n x e 2 2 n x 0 8 < R0 se < + 1 2 +1 dx = t e t dt se = : 0 +1 se > + 1: +1 Poiché l’integranda tende a zero per ogni ; > 0; per + 1 non vale il passaggio al limite. Soluzione Es. 13.14. fn 2 L1 [0; +1) per 1 < < 1. Ora è fn (x) x 1 se x 2 [0; 1] f1 (x) se x 2 [1; +1) che è una funzione L1 se 0 < < 1. Pertanto l’integrale tende a zero per 0 < < 1. Notare che non si poteva calcolare esplicitamente. Per = 0 145 l’integrale si calcola e vale 2 . Per 1 < < 0 l’integrale tende a +1; questo si può vedere eseguendo la sostituzione nx = t nell’integrale. Si noti che nei casi 0 a posteriori si vede che il passaggio al limite sotto il segno di integrale non vale. Soluzione Es. 13.17. Puntualmente fn (x) ! 0 in [0; ]. L’integrale vale 2 per ogni n. Perciò non vale il passaggio al limite. Soluzione Es. 13.18. Qui è ancora gn (x) ! 0 ma questa volta non esiste n neppure il limite dell’integrale, perché vale ( 1) 2. n n nx Soluzione Es. 13.19. fn (x) = x e = exx . Poiché per ogni x > 0 è x n x è monotona decrescente (e tendente a zero) 0 < ex < 1; la successione ex per ogni x …ssato. Quindi fn (x) ! 0 puntualmente, inoltre fn (x) xe x 2 R +1 1 L (0; 1), quindi per il teorema della convergenza dominata 0 fn ! 0: Soluzione Es. 13.20. Si ha: Z 2 Z 2 liminffn (x) dx = 0dx = 0 0 liminf Z 0 2 fn (x) dx = liminf1 = 1: 0 In questo caso quindi nella disuguaglianza del teorema di Fatou vale la disuguaglianza stretta. Soluzione Es. 13.21. Z sin2 (nx) dx = per ogni n 1; quindi 2 0 Z liminf fn (x) dx = : 2 0 Invece f (x) = liminf sin2 (nx) = 0 perché per ogni x 2 [0; ] fsin nxg convergenti ad ogni nun ha sottosuccessioni o 2 mero compreso in [ 1; 1] ; quindi (sin nx) ha sottosuccessioni convergenti ad ogni numero compreso in [0; 1] : Perciò Z Z liminffn (x) dx = 0dx = 0: 0 0 Come nell’esempio precedente quindi nella disuguaglianza del teorema di Fatou vale la disuguaglianza stretta. 146 Parte III Spazi di Hilbert 14 Geometria negli spazi di Hilbert Gli spazi vettoriali dotati di un prodotto scalare sono ambienti astratti in cui si può de…nire un concetto di ortogonalità analogo a quello euclideo in Rn . Questo mette a disposizione un sistema di riferimento privilegiato in cui i calcoli sono particolarmente comodi e semplici, un concetto di proiezione ortogonale che diventa strumento per approssimare un elemento generico di uno spazio vettoriale (che nelle applicazioni all’analisi è una funzione) mediante elementi di un particolare sottospazio (che nelle applicazioni sono funzioni di qualche tipo particolarmente semplice). In dimensione in…nita, come abitualmente si è in analisi, l’ortogonalità da sola non basterebbe però a garantire il “buon funzionamento” di questo tipo di teoria: la validità della proprietà di completezza (nel senso degli spazi di Banach) è essenziale a¢ nché si possano dimostrare teoremi signi…cativamente simili a quelli che valgono in Rn . Da questa sintesi di idee nasce il concetto di spazio di Hilbert, uno spazio di Banach in cui c’è un prodotto scalare e quindi un concetto di ortogonalità. L’esempio più naturale di spazio di Hilbert utile in analisi, in un certo senso prototipo di tutti gli altri, è lo spazio L2 ( ) delle funzioni a quadrato sommabile in qualche dominio di Rn . Perciò la teoria degli spazi di Hilbert, pur essendo di per sé una teoria astratta che utilizza solo i concetti propri degli spazi vettoriali normati, nelle sue applicazioni interessanti ha bisogno della teoria della misura e dell’integrazione di Lebesgue. E’ una teoria che nasce quindi dall’incontro tra gli sviluppi dell’analisi funzionale astratta con la teoria della misura moderna. A sua volta, l’applicazione della teoria astratta degli spazi di Hilbert al contesto concreto dello spazio L2 ( ) richiede, come vedremo, la conoscenza di particolari “sistemi ortonormali completi”di funzioni. Il sistema trigonometrico fsin nx; cos nxg comunemente usato nell’analisi di Fourier è il primo fondamentale esempio di sistemi di questo tipo. A seconda del problema in esame (problemi di approssimazione di funzioni in analisi armonica, problemi ai limiti per equazioni differenziali ordinarie o alle derivate parziali), occorre a volte cercare altri tipi di sistemi ortonormali completi di funzioni speciali, adattati in qualche senso al problema in esame. 14.1 Spazi vettoriali con prodotto interno De…nizione 14.1 Sia V uno spazio vettoriale sul campo K (= R o C). Si. dice che V è uno spazio vettoriale dotato di prodotto interno, o di prodotto scalare, o anche che V è uno spazio pre-Hilbertiano, se (oltre alle due operazioni proprie dello spazio vettoriale, cioè la somma di vettori e il prodotto tra un vettore e uno scalare) è de…nita una (terza) operazione, che chiamiamo prodotto scalare 147 o prodotto interno, (; ):V V !K con le seguenti proprietà: 1. lineare sulla prima componente: ( x + y; z) = (x; z) + (y; z) 8x; y; z 2 V; ; 2 K; 2.a. se K = R (caso che maggiormente considereremo in seguito): commutativo (x; y) = (y; x) 8x; y 2 V ; 2.b. se K = C: (x; y) = (y; x) 8x; y 2 V dove indica il coniugato nel campo complesso. Si noti che se K = R dalla commutatività segue anche la linearità sulla seconda componente, per cui in tal caso diciamo semplicemente che il prodotto scalare è bilineare; se invece K = C da 1 e 2.b segue (z; x + y) = (z; x) + (z; y) 8x; y; z 2 V; ; 2C e si dice che il prodotto scalare complesso è sesquilineare. Notiamo anche che nel caso complesso essendo (x; x) = (x; x), risulta (x; x) reale per ogni x 2 V , il che dà senso alla prossima richiesta. 3. Positività: (x; x) 0 8x 2 V e (x; x) = 0 () x = 0: Esempio 14.2 1. Lo spazio Rn col prodotto scalare (x; y) = n X xj yj : j=1 2. Lo spazio Cn (su C) col prodotto scalare (x; y) = n X xj yj : j=1 3. Lo spazio Rn col prodotto scalare n X (x; y) = aij xj yj i;j=1 n dove A = (aij )i;j=1 è una qualsiasi matrice simmetrica e de…nita positiva. 4. Lo spazio C [a; b] (funzioni a valori reali) con (f; g) = Z b f (t) g (t) dt: a 148 5. Lo spazio C [a; b] (funzioni a valori complessi) con (f; g) = Z b f (t) g (t)dt: a 6. Lo spazio L2 ( ) (funzioni a valori reali o complessi), misurabile di Rn con Z (f; g) = f (x) g (x)dx: sottoinsieme Questo sarà l’esempio più importante nel seguito. Se le funzioni hanno valori reali ovviamente non c’è bisogno di mettere il coniugato sopra g. 1 7. Lo spazio `2 delle successioni x = fxn gn=1 a valori reali o complessi per le quali si abbia 1 X 2 jxj j < 1; j=1 col prodotto scalare (x; y) = 1 X xj y j . j=1 Questo è in un certo senso l’analogo discreto dell’esempio precedente. Si noti l’analogia con il prodotto scalare usuale di Rn . In tutto il seguito, per sempli…care le notazioni e le dimostrazioni, tratteremo sempre spazi vettoriali su R. Quello che diremo vale comunque anche per spazi complessi, con qualche modi…ca di notazione o nelle dimostrazioni. Teorema 14.3 Sia V uno spazio pre-Hilbertiano. Allora: 1. Vale la disuguaglianza di Cauchy-Schwarz: p p j(x; y)j (x; x) (y; y) 8x; y 2 V: 2. Ponendo kxk = p (x; x) si ottiene che k k è una norma, che si dice “norma del prodotto interno”. Si noti che la disuguaglianza di Cauchy-Schwarz si riscrive quindi j(x; y)j kxk kyk 8x; y 2 V: (14.1) 3. La norma del prodotto interno soddisfa l’uguaglianza del parallelogramma: 2 2 2 2 kx + yk + kx yk = 2 kxk + kyk 8x; y 2 V: 149 Dimostrazione. Dimostriamo il teorema lavorando per semplicità con uno spazio pre-Hilbertiano reale. La dimostrazione di tutti i punti si basa sulle proprietà assiomatiche del prodotto interno. 1. Per ogni 2 R possiamo scrivere: per la positività del prodotto scalare: 0 ( x + y; x + y) = per la bilinearità del prodotto scalare 2 = (x; x) + 2 (x; y) + (y; y) = per de…nizione di norma del prodotto scalare = 2 2 2 kxk + 2 (x; y) + kyk : Dunque abbiamo 2 2 kxk + 2 (x; y) + kyk 2 0 8 2 R, il che implica che il discriminante del trinomio di secondo grado in ossia 2 2 2 (x; y) kxk kyk 0 sia 0, da cui (14.1). p 2. Ponendo kxk = (x; x) si ha, per la positività del prodotto scalare, la proprietà di positività della norma. Vale l’omogeneità perché p p p 2 (x; x) = j j k xk = ( x; x) = (x; x) = j j kxk : Vale la disuguaglianza triangolare perché per de…nizione di norma e bilinearità del prodotto scalare 2 2 2 kx + yk = (x + y; x + y) = (x; x) + 2 (x; y) + (y; y) = kxk + 2 (x; y) + kyk per la (14.1) 2 2 2 kxk + 2 kxk kyk + kyk = (kxk + kyk) da cui kx + yk kxk + kyk. 3. Per de…nizione di norma e bilinearità del prodotto scalare si ha: 2 kx + yk + kx 2 yk = (x + y; x + y) + (x y; x y) = (x; x) + 2 (x; y) + (y; y) + (x; x) 2 2 (x; y) + 2 (y; y) 2 = 2 [(x; x) + (y; y)] = 2 kxk + kyk : Ogni spazio pre-Hilbertiano è dunque uno spazio vettoriale normato, la cui norma “proviene da un prodotto scalare” e soddisfa l’uguaglianza del parallelogramma. Viceversa, potremmo avere uno spazio vettoriale normato (qualsiasi) e chiederci se esista un prodotto scalare che induca quella norma. Da questo punto di vista, il fatto che valga l’uguaglianza del parallelogramma risulta una condizione necessaria, come mostra il prossimo 150 Esempio 14.4 Dimostriamo che la norma di L1 [a; b] non proviene da un prodotto scalare. Si faccia attenzione: è chiaro che il prodotto scalare Z b (f; g) = f (t) g (t) dt a 1 non induce la norma L (perché induce la norma L2 ); noi stiamo a¤ ermando però che non esiste alcun prodotto scalare (f; g) per cui si abbia !2 Z b (f; f ) = a jf (t)j dt : Se un tale prodotto scalare esistesse, la norma L1 dovrebbe soddisfare l’uguaglianza del parallelogramma, cosa che non accade, come ora mostriamo. Consideriamo, in L1 [0; 2]: f (t) = [0;1] (t) ; g (t) = [1;2] (t) : Poiché j(f g) (t)j = 1 in [0; 2], si ha: Z 2 2 2 kf + gkL1 + kf gkL1 = dt 2 + 0 2 2 Z 2 2 dt = 4 + 4 = 8; 0 2 kf kL1 + kgkL1 = 2 (1 + 1) = 4 e l’uguaglianza non vale. Pertanto L1 non è uno spazio pre-Hilbertiano. Si può dimostrare (v. Esercizio 17.1) che se V è uno spazio vettoriale normato la cui norma soddisfa l’uguaglianza del parallelogramma, allora il prodotto i 1h 2 2 2 kx + yk kxk kyk (x; y) = 2 è e¤ettivamente un prodotto scalare, che induce la norma k k. Di conseguenza l’uguaglianza del parallelogramma caratterizza le norme degli spazi pre-hilbertiani. Questo fa capire che tutta la geometria dell’ortogonalità è scritta, implicitamente, nella semplice uguaglianza del parallelogramma. Difatti, come vedremo presto, quest’uguaglianza giocherà un ruolo centrale nella dimostrazione di teoremi importanti. Il prodotto scalare soddisfa una proprietà di continuità rispetto alla norma che esso stesso induce: Teorema 14.5 Sia V uno spazio vettoriale pre-hilbertiano. Per un x 2 H …ssato, si consideri il funzionale: T :H!R T : y 7! (x; y) : Allora T è un funzionale lineare continuo su X (rispetto alla norma indotta dal prodotto scalare). Inoltre la norma di T come funzionale è uguale alla norma dell’elemento x. 151 Dimostrazione. La linearità di T segue dalla bilinearità del prodotto scalare; la continuità di T segue dalla disuguaglianza di Cauchy-Schwarz: jT yj = j(x; y)j kxk kyk da cui T è continuo con kT kV 0 kxk . Di più, risulta kT kV 0 = kxk perché jT xj = j(x; x)j = kxk 2 da cui jT xj = kxk = kxk e kT kV 0 kxk. La continuità del prodotto scalare rispetto alla norma signi…ca in particolare che yn ! y =) (x; yn ) ! (x; y) . Si può dimostrare anche: xn ! x; yn ! y =) (xn ; yn ) ! (x; y) , relazione che ci sarà utile in seguito. In uno spazio vettoriale con prodotto interno si può de…nire in maniera naturale un concetto di ortogonalità: De…nizione 14.6 Si dice che x; y 2 V sono ortogonali tra loro, e si scrive x ? y, se (x; y) = 0: Vale allora il seguente Teorema 14.7 (di Pitagora) Siano x1 ; x2 ; :::; xn 2 V elementi a due a due ortogonali. Allora n X 2 xj j=1 = n X j=1 2 kxj k : Dimostrazione. Si ha, per de…nizione di norma e bilinearità del prodotto scalare: 0 1 2 n n n n X X X X xj = @ xj ; xi A = (xi ; xj ) j=1 j=1 i=1 i;j=1 poiché i vettori sono a due a due ortogonali (xi ; xj ) = 0 per i 6= j, perciò = n X (xj ; xj ) = j=1 n X j=1 152 2 kxj k : De…nizione 14.8 Sia S V un insieme qualsiasi di vettori. Si dice complemento ortogonale di S, e si indica con S ? , l’insieme S ? = fx 2 V : (x; s) = 0 8s 2 Sg : Teorema 14.9 L’insieme S ? è un sottospazio vettoriale chiuso di V (anche se S non è un sottospazio). Dimostrazione. Che sia un sottospazio segue dalla bilinearità del prodotto scalare: se x; y 2 S ? e ; 2 R si ha, per ogni s 2 S; ( x + y; s) = (x; s) + (y; s) = 0+ 0 = 0: 1 Che sia chiuso segue dalla continuità del prodotto scalare. Infatti sia fxn gn=1 S ? tale che xn ! x 2 V; e proviamo che x 2 S ? . Infatti per ogni s 2 S si ha (x; s) = lim (xn ; s) = lim 0 = 0; n!1 n!1 quindi x 2 S ? e S ? è chiuso. 14.2 Spazi di Hilbert De…nizione 14.10 Si dice spazio di Hilbert uno spazio pre-Hilbertiano completo. Quindi uno spazio di Hilbert è uno spazio di Banach la cui norma proviene da un prodotto interno. Esempio 14.11 Passiamo in rassegna agli Esempi 14.2 di spazi vettoriali con prodotto interno e vediamo quali di essi sono spazi di Hilbert. Gli esempi 1, 2, 3, 4 sono …nito dimensionali. Questi sono tutti spazi di Hilbert, per la completezza di Rn . Gli esempi 4-5 (funzioni continue, prodotto scalare integrale) danno spazi non completi (sappiamo già che le norme integrali non rendono completo uno spazio di funzioni continue), quindi non di Hilbert. L’esempio 6 è L2 ( ), con il prodotto scalare integrale. Questo è di Hilbert (completezza degli spazi Lp ), ed è l’esempio più importante per il seguito del discorso. Si noti che stiamo parlando di L2 su un qualsiasi spazio di misura astratto ( ; M; ), non solo un dominio di Rn con la misura di Lebesgue. L’esempio 7 è un caso particolare del precedente quando la misura è quella del conteggio su N. Si ottiene lo spazio `2 di successioni, col prodotto scalare che generalizza quello usuale di Rn al caso in…nito dimensionale. In un certo senso lo spazio `2 si può pensare come una sorta di “spazio R1 ”, dove però la successione delle coordinate è soggetta a un vincolo preciso, la convergenza della P 2 serie jxn j . 153 Nota storica. La teoria astratta degli spazi di Hilbert fu formulata da von Neumann alla …ne degli anni 1920, come strumentazione matematica per la meccanica quantistica. In questa sua applicazione, è la teoria degli spazi di Hilbert complessi quella che serve; questo è il motivo per cui abbiamo dato almeno le de…nizioni iniziali nel caso complesso. Nel seguito del discorso, per semplicità, considereremo quasi sempre spazi reali, soprattutto nelle dimostrazioni. Hilbert fu il primo a introdurre lo spazio `2 , nei primi anni del 1900, e a gettare le basi per l’interesse per questi tipi di spazi vettoriali in…nito dimensionali. Ricordiamo che la teoria degli spazi di Banach (di cui quelli di Hilbert sono un caso particolare) ebbe il suo importante avvio con il lavoro di Banach del 1932 “Teoria degli operatori lineari”, quindi fu successiva alla teoria degli spazi di Hilbert. Segnaliamo anche che, mentre nella nostra trattazione introduttiva ci occuperemo principalmente della geometria degli spazi di Hilbert e di alcune proprietà dei funzionali lineari continui su spazi di Hilbert, gli sviluppi più signi…cativi della teoria degli spazi di Hilbert (così come quella degli spazi di Banach, che non trattiamo) riguardano la teoria degli operatori lineari de…niti su questi spazi. Lo studente curioso dell’applicazione della teoria degli spazi di Hilbert alla meccanica quantistica può leggere, per cominciare, il paragrafo molto elementare [20, Chap. 6, §6.7.], che rimanda a testi più approfonditi. Avvertiamo comunque che la teoria degli spazi di Hilbert necessaria per comprenderne le applicazioni alla meccanica quantistica è molto più ampia di quella qui sviluppata. Negli spazi di Hilbert il teorema di Pitagora dimostrato in precedenza si estende a somme in…nite, al modo seguente: 1 Teorema 14.12 (di Pitagora, 2a versione) Se fxj gj=1 è una successione di elementi di spazio di Hilbert H a due a due Puno P1ortogonali e tali che la serie 1 2 numerica j=1 kxj k converge, allora la serie j=1 xj converge in H e vale la 1 X 2 xj = 1 X j=1 j=1 2 kxj k : Dimostrazione. Possiamo anzitutto applicare il teorema di Pitagora in versione …nita ad ogni somma parziale della serie, e scrivere m X j=n 2 xj = m X j=n 2 kxj k : (14.2) P1 2 Poiché la serie numerica j=1 kxj k converge, le sue somme parziali sono una Pm 2 successione di Cauchy, quindi j=n kxj k ! 0 per n; m ! 1: Per l’uguaglianza Pm (14.2) le somme parziali di j=n xj sono allora una successione di Cauchy in H, ed essendo lo spazio completo la serie converge. Dunque esiste x 2 H tale 154 che n X j=1 n X xj ! x; perciò 2 2 xj ! kxk : j=1 Pn D’altro canto 2 j=1 xj = Pn (14.3) 2 j=1 n X j=1 kxj k ; perciò 2 2 kxj k ! kxk . (14.4) Da (14.3) e (14.4) segue 1 X j=1 1 X 2 kxj k = 2 xj : j=1 Il risultato fondamentale sulla geometria degli spazi di Hilbert è il seguente: Teorema 14.13 (Distanza da un sottospazio chiuso, o Teorema della proiezione). Sia H uno spazio di Hilbert e V un suo sottospazio vettoriale chiuso. Allora per ogni x 2 H esiste un unico v 2 V di minima distanza da x, ossia tale che kx vk = inf kx vk : v2V Inoltre x v è ortogonale a V . L’elemento v si dice proiezione di x su V . Dimostrazione. Proviamo l’esistenza. Se x 2 V basta porre v = x, perciò supponiamo x 2 = V . Sia d = inf v2V kx vk. (Questo inf esiste perché V non 1 è vuoto e kx vk 0). Sia fxn gn=1 V una successione minimizzante, ossia tale che kx xn k ! d: (Tale successione esiste per de…nizione di estremo inferiore). Proviamo che questa successione è di Cauchy. Si utilizza a questo scopo l’uguaglianza del parallelogramma: kxn 2 xm k = k(xn x) + (x = x) k(xn Ora, per n; m ! 1 si ha: kxn k(xn x) (x 2 (x xk ! d2 ; 2 xm )k 2 2 xm )k + 2 kxn kx 2 xm )k = kxn + xm 155 2 xk + kx xm k : 2 xm k ! d2 ; 2 2xk = 4 xn + xm 2 2 x 4d2 perché, essendo V un sottospazio vettoriale, xn ; xm 2 V =) segue che 2 lim kxn xm k 4d2 + 2 d2 + d2 = 0; xn +xm 2 2 V: Ne n;m!1 1 cioè kxn xm k ! 0, ossia fxn gn=1 è di Cauchy. Poiché H è completo, esiste allora v 2 H tale che xn ! v; inoltre, poiché V è un sottospazio chiuso di H, v 2 V . In…ne, poiché kxn kxn xk ! kv xk ! d; xk e si ha kv xk = d. Questo completa la dimostrazione dell’esistenza dell’elemento di V di minima distanza da x. Proviamo ora l’unicità. Siano dunque v1 ; v2 due elementi di V tali che kvi xk = d per i = 1; 2 e proviamo che allora v1 = v2 . Si usa ancora l’uguaglianza del parallelogramma, in modo simile a quello già visto: kv1 2 2 v2 k = k(v1 x) + (x v2 )k = k(v1 x) (x = 4 v1 + v2 2 x 2 v2 )k + 2 kv1 2 xk + kx v2 k 2 2 + 2 d2 + d2 4d2 + 4d2 = 0 2 2 in quanto v1 ; v2 2 V ) v1 +v 2 V ) v1 +v x d: Dunque kv1 v2 k = 0, 2 2 ossia v1 = v2 : Prima di dimostrare l’ultimo punto del teorema (ortogonalità di x v a V ) ragioniamo sul signi…cato geometrico di questa proprietà, lasciandoci guidare dall’analogia con il caso …nito dimensionale. Se V è un sottospazio (chiuso) di H e x è un elemento di H che non appartiene a V , dal punto di vista geometrico chi sarà l’elemento v 2 V di minima distanza da x? Sarà la proiezione ortogonale di x su V . Questo signi…ca appunto che x v è ortogonale a tutti gli elementi 156 di V . Dimostriamolo. Sia w = x v, v 2 V qualsiasi, e proviamo che (w; v) = 0. Per ogni 2 R, scriviamo (essendo v + v 2 V e kwk = d) kwk 2 2 kx (v + v)k = k(x = (w v; w 2 = kwk v) = (w; w) 2 (v; w) + 2 kvk da cui 2 (v; w) Ponendo v) 2 kvk 2 2 vk = kw 2 (v; w) + 2 vk 2 (v; v) 2 8 2 R: = tsgn(v; w) con t > 0 la precedente si riscrive così 2t j(v; w)j t2 kvk 2 8t > 0; da cui dividendo per t e facendo tendere t a zero si ottiene (v; w) = 0, che è la tesi. Corollario 14.14 (Decomposizione ortogonale di H rispetto a un suo sottospazio chiuso). Se H è uno spazio di Hilbert e V un suo sottospazio chiuso si ha: H = V V ?; dove si legge somma diretta e signi…ca quanto segue: ogni elemento x 2 H si può scrivere come somma di un elemento v 2 V e un elemento v 0 2 V ? , inoltre V \ V ? = f0g. Le due cose insieme implicano che la scrittura x = v + v 0 con v 2 V e v 0 2 V ? è unica. Dimostrazione. Sia V un sottospazio chiuso di H. Se V = H allora V ? = f0g e la tesi è ovvia. Altrimenti, preso un x 2 H, per il Teorema della proiezione possiamo scrivere x = v + (x v) con v 2 V e (x v) 2 V ? . E’ poi ovvio che V \ V ? = f0g in quanto se x 2 V \ V ? si ha (x; x) = 0 e quindi x = 0. 157 Mostriamo anche che la scrittura di un elemento x 2 H nella forma x = v + v 0 con v 2 V e v 0 2 V ? è unica. Supponiamo che esistano due scritture x = v1 + v10 = v2 + v20 con v1 ; v2 2 V; v10 ; v20 2 V ? . Allora si ha: v1 v2 = v20 v10 : Il primo membro è un elemento di V , il secondo membro è un elemento di V ? , allora poiché V \ V ? = f0g si ha v1 v2 = 0 = v20 v10 da cui v1 = v2 , v10 = v20 ossia la scrittura è unica. 15 Funzionali lineari continui su uno spazio di Hilbert Abbiamo visto in precedenza (v. Teorema 14.5) che ogni elemento xdi uno spazio di Hilbert permette di de…nire un funzionale lineare continuo su Hmediante prodotto scalare con x stesso. In altre parole, ad ogni x 2 H è associato un Tx 2 H 0 tale che Tx : H ! R Tx : y 7! (y; x) ; e risulta kTx kH 0 = kxkH : Un risultato fondamentale sugli spazi di Hilbert a¤erma che vale anche il viceversa: ogni funzionale lineare continuo è necessariamente del tipo appena descritto. Teorema 15.1 (di rappresentazione di Riesz) Sia H uno spazio di Hilbert e T un funzionale lineare continuo su H (ossia T 2 H 0 ). Allora esiste un unico x 2 H che rappresenta T , nel senso che T y = (y; x) per ogni y 2 H: Inoltre kT kH 0 = kxkH : Si dice perciò che il duale H 0 di uno spazio di Hilbert H si può identi…care con H stesso. Dimostrazione. Proviamo prima l’esistenza di x. Se T è il funzionale identicamente nullo basta porre x = 0, quindi supponiamo che T non sia identicamente nullo. Per provare l’esistenza di x, proviamo prima a “indovinare” chi può essere. Se esiste x tale che T y = (y; x), T y si annullerà per tutti gli y ortogonali a x; dunque x è un opportuno elemento ortogonale all’insieme degli y su cui si annulla T . Guidati da quest’idea, consideriamo il nucleo di T , ossia l’insieme: KerT = fy 2 H : T y = 0g : 158 Si dimostra facilmente che KerT è un sottospazio vettoriale di H (per linearità di T ) ed è chiuso (per continuità di T ). Allora per il Corollario 14.14 possiamo scrivere H = KerT KerT ? . Sia z 2 KerT ? con kzk = 1 (poiché stiamo supponendo T non identicamente nullo, KerT non esaurisce H, perciò KerT ? ha elementi non nulli e quindi, essendo uno spazio vettoriale, ha elementi non nulli di norma unitaria). In base al ragionamento iniziale, l’elemento x che cerchiamo dovrebbe essere del tipo x = z per qualche 2 R. Il prossimo argomento determinerà in modo che x = z soddis… e¤ettivamente la proprietà richiesta. Per ogni y 2 H; l’elemento Ty z y Tz appartiene a KerT; in quanto T Ty z Tz y Ty T z = 0: Tz = Ty (Si noti che ha senso dividere per T z in quanto z è un elemento non nullo di KerT ? , quindi T z 6= 0): Allora y TT yz z è ortogonale a z, quindi, 0= z; y Ty z Tz Ty (z; z) = (z; y) Tz = (z; y) Ty ; Tz da cui T y = T z (z; y) = (x; y) ; avendo posto x = (T z) z: Questo prova l’esistenza. Il fatto che risulti kT kH 0 = kxkH è già stato provato nel Teorema 14.5 (ora che sappiamo che T = Tx ). Proviamo l’unicità. Se esistono due elementi x1 ; x2 2 H tali che T y = (y; x1 ) = (y; x2 ) per ogni y 2 H ne segue (y; x2 e scegliendo y = x2 x1 ) = 0 per ogni y 2 H; x1 si ottiene x2 x1 = 0; da cui l’unicità. Osservazione 15.2 (Duale di L2 ( )) Osserviamo che nel caso particolare H = L2 ( ) ; il teorema precedente garantisce che ogni funzionale lineare continuo su L2 si rappresenti nella forma Z Tf = fg 0 per qualche g 2 L2 ( ). Ritroviamo quindi il risultato di dualità L2 ( ) = L2 ( ) ; che è un caso particolare del teorema (che abbiamo enunciato ma non dimostrato) secondo cui il duale di Lp ( ) è Lq ( ) con p; q esponenti coniugati, se 1 p < 1. 159 Il teorema precedente è un risultato fondamentale. Vediamo subito una delle sue conseguenze importanti: il teorema di Lax-Milgram, che gioca un ruolo fondamentale nella formulazione debole dei problemi ai limiti per equazioni a derivate parziali, di cui ci occuperemo nell’ultima parte del corso. Premettiamo qualche de…nizione. De…nizione 15.3 Sia H uno spazio di Hilbert. Si dice forma bilineare su H una funzione a( ; ) : H H ! R che è lineare in ognuno dei due argomenti, quando l’altro è …ssato. Esplicitamente, signi…ca che, per ogni u; v; w 2 H e ; 2 R è a ( u + v; w) = a (u; w) + a (v; w) a (w; u + v) = a (w; u) + a (w; v) : Una forma bilineare su H si dice: continua se esiste una costante c > 0 tale che ja (u; v)j c kuk kvk per ogni u; v 2 H; coerciva se esiste una costante c0 > 0 tale che a (u; u) 2 c0 kuk per ogni u 2 H; simmetrica se a (u; v) = a (v; u) per ogni u; v 2 H: Esempio 15.4 1. In qualunque spazio di Hilbert, il prodotto scalare è una forma bilineare simmetrica, continua (con c = 1, per la disuguaglianza di CauchySchwarz) e coerciva (con c = 1, per de…nizione di norma del prodotto scalare). 2. In Rn una forma bilineare ha sempre la forma: a (u; v) = n X aij ui vj i;j=1 n per un’opportuna matrice A = (aij )i;j=1 . La forma bilineare è simmetrica se la matrice A è simmetrica; è sempre continua; è coerciva se la matrice è de…nita positiva, con c =minimo autovalore di A. 3. In L2 ( ) si consideri Z a (u; v) = (x) u (x) v (x) dx; con funzione L1 ( ) assegnata. Questa è una forma bilineare simmetrica e continua, qualunque sia 2 L1 ( ). E’ coerciva solo se (x) c0 > 0 quasi ovunque in . 160 Veniamo al risultato annunciato: Teorema 15.5 (di Lax-Milgram) Sia H uno spazio di Hilbert e a (u; v) una forma bilineare continua e coerciva su H. Si consideri il seguente problema: (P). Assegnato T 2 H 0 (cioè T funzionale lineare continuo su H), determinare u 2 H tale che a (u; v) = T v per ogni v 2 H: Sotto le ipotesi precedenti, per ogni T 2 H 0 esiste uno e un solo u 2 H soluzione del problema (P). Inoltre vale la seguente stima di stabilità: kukH 1 kT kH 0 c0 dove c0 è la costante che compare nell’ipotesi di coercività. Questo teorema servirà per provare un risultato di esistenza, unicità e dipendenza continua dai dati, per certi problemi ai limiti per equazioni a derivate parziali, dopo che questi avranno avuto un’opportuna “formulazione debole”. Tutto ciò sarà spiegato in dettaglio nell’ultima parte del corso. Per il momento vediamo questo teorema come un risultato astratto di esistenza, unicità e dipendenza continua dal termine noto T , per la soluzione del problema astratto (P). “Dipendenza continua” signi…ca quanto segue. Il problema è lineare, nel senso che se u1 ; u2 sono soluzioni del problema (P) con assegnati T1 ; T2 rispettivamente, allora u1 + u2 sarà soluzione del problema (P) con assegnato T1 + T2 . In particolare allora la stima di stabilità implica che, con le notazioni precedenti, 1 ku1 u2 kH kT1 T2 kH 0 , c0 stima che si può interpretare al modo seguente: se il dato T1 è vicino al dato T2 ; anche la soluzione corrispondente a T1 è vicina alla soluzione corrispondente a T2 . In questo senso la soluzione è stabile rispetto a una perturbazione del termine noto, o anche “dipende con continuità dal termine noto”. Dimostrazione. Per semplicità dimostriamo il teorema sotto un’ipotesi aggiuntiva: che la forma bilineare sia anche simmetrica. (La dimostrazione in assenza di quest’ipotesi è sensibilmente più elaborata, e quest’ipotesi risulterà veri…cata in diverse applicazioni signi…cative che faremo di questo teorema). Notiamo che una forma bilineare simmetrica e coerciva su H soddisfa gli assiomi di prodotto scalare. In altre parole, se poniamo (u; v) = a (u; v) (l’asterisco ricorda che questo non è il prodotto scalare originale in H; ma uno diverso), si ha che: (u; v) è bilineare perché la forma è bilineare; (u; v) è commutativo perché la forma è simmetrica; 161 vale la proprietà di positività perché la forma è coerciva: (u; u) = a (u; u) c0 kuk 0; quindi (u; u) = 0 =) kuk = 0 e u = 0. Consideriamo ora la norma indotta da questo nuovo prodotto scalare: q kuk = (u; u) : Per la continuità e coercività, risulta: q p p 2 kuk = a (u; u) c kuk = c kuk q p p 2 kuk = a (u; u) c0 kuk = c0 kuk ossia p c0 kuk kuk p c kuk per ogni u 2 H: Le due norme sono dunque equivalenti ; in particolare questo signi…ca che se T è un funzionale lineare su H continuo rispetto alla norma originaria, kuk, lo è anche rispetto alla norma kuk : Infatti, per ogni v 2 H si ha r p p c kT vk kT kH 0 kvk : c kT vk c kT kH 0 kvk c0 Possiamo allora applicare il teorema di rappresentazione di Riesz allo spazio di Hilbert H dotato del prodotto scalare (u; v) ed a¤ermare che esiste uno e un solo elemento u 2 H tale che (u; v) = T v per ogni v 2 H; cioè a (u; v) = T v per ogni v 2 H; che è quanto volevamo provare. Quanto alla norma di u, si ha: c0 kuk 2 a (u; u) = T u da cui kuk kT kH 0 kuk ; 1 kT kH 0 c0 che è la stima di stabilità. 16 Analisi di Fourier in spazi di Hilbert Andremo ora più a fondo del concetto di ortogonalità, vedendo come opportuni sistemi di vettori ortogonali possano costituire, in uno spazio di Hilbert astratto così come avveniva in Rn , un buon “sistema di riferimento”. n 1 De…nizione 16.1 Un insieme …nito fej gj=1 o numerabile fej gj=1 di elementi di H si dice sistema ortonormale se (ei ; ej ) = 0 se i 6= j 1 se i = j: In altre parole, i vettori sono a due a due ortogonali, e ciascuno ha norma unitaria. 162 Notazione. In questo paragrafo considereremo spesso combinazioni lineari di vettori, ed è importante distinguere a colpo d’occhio i vettori dalle costanti che li moltiplicano. Cambiando leggermente notazioni quindi, scriveremo ad n esempio ej j=1 per indicare i vettori e n X cj ej j=1 per indicare una loro combinazione lineare, dove le cj sono costanti. Cominciamo con l’illustrare alcuni procedimenti e idee che riguardano i sottospazi di dimensione …nita di uno spazio di Hilbert. Ricordiamo anzitutto che in base al teorema di Pitagora in spazi di Hilbert si può scrivere: n X 2 cj ej = j=1 n X cj ej 2 j=1 = n X j=1 2 jcj j : (16.1) Quest’uguaglianza in particolare implica che vettori che costituiscono un sistema ortonormale …nito sono sempre linearmente indipendenti. Infatti se n X cj ej = 0 j=1 per certe costanti c1 ; c2 ; :::; cn , in base a (16.1) si ha n X j=1 2 jcj j = 0 e quindi cj = 0 per j = 1; 2; :::; n; perciò i vettori sono indipendenti. Un sistema ortonormale …nito costituisce quindi una base dello spazio vettoriale da essi generato. Viceversa, se V0 è un sottospazio …nito dimensionale di n H, data una qualsiasi base uj j=1 di V0 è sempre possibile a partire da questa generarne un’altra che sia costituita da vettori ortonormali. E’su¢ ciente adoperare il procedimento di ortonormalizzazione di Gram-Schmidt, che illustriamo iterativamente così: e1 = vers (u1 ) (dove, qui e nel seguito, indichiamo vers (u) = e2 = vers (u2 u kuk ); (u2 ; e1 ) e1 ) (spiegazione: dopo aver normalizzato il primo vettore, consideriamo il secondo e gli sottraiamo la sua componente nella direzione del primo; così u2 (u2 ; e1 ) e1 risulta ortogonale a e1 ; ora lo normalizziamo e abbiamo e2 ); e3 = vers (u3 (u3 ; e1 ) e1 163 (u3 ; e2 ) e2 ) e così via …no a ottenere una base ortonormale ej n j=1 di V0 . Supponiamo ora che V0 , sottospazio …nito dimensionale di H, sia dotato n di una base ortonormale ej j=1 (cosa che, come appena visto, si può sempre supporre). Dato un elemento x2 H; il suo elemento di minima distanza da V0 (che sappiamo già esistere in base al teorema delle proiezioni) non è altro che: PV0 x = n X x; ej ej : j=1 Infatti PV0 x 2 V0 e si veri…ca facilmente che x PV0 x 2 V0? . E’ su¢ ciente calcolare per k = 1; 2; :::; n il prodotto scalare (x PV0 x; ek ) = (x; ek ) n X x; ej ej ; ek = (x; ek ) (x; ek ) = 0: j=1 Quindi la scrittura x = PV0 x + (x PV0 x) mostra, in base al teorema delle proiezioni, che l’elemento di minima distanza di x da V0 è proprio PV0 x: Ecco quindi che la conoscenza di una base ortonormale in V0 dà un algoritmo semplice ed esplicito per calcolare l’elemento di minima distanza di un vettore qualunque da V0 ; mediante la sua proiezione ortogonale. Prima di proseguire sarà utile illustrare queste idee con un esempio concreto: Esempio 16.2 Determinare il polinomio di grado 2 che approssima meglio la funzione f (x) = sin ( x) in L2 (0; 1) : Ragioniamo così: sia V0 lo spazio vettoriale dei polinomi di grado 2 su [0; 1]. E’ uno spazio vettoriale di dimensione …nita (3), quindi chiuso; è un sottospazio di L2 (0; 1) : Il polinomio di grado 2 che approssima meglio la funzione f in L2 (0; 1) è la proiezione di f su V0 . Per calcolarla, dobbiamo prima costruire una base ortonormale in V0 . Per farlo, partiamo da una base qualunque di V0 , sceglieremo quella più semplice, costituita da 1; x; x2 , e la ortonormalizziamo in L2 (0; 1) mediante il procedimento di Gram-Schmidt: e1 = vers (1) = 1 R1 0 Z 0 1 x 12 dx 1=2 = 1: e2 = vers (x (x; e1 ) e1 ) ; Z 1 1 (x; 1) = xdx = ; 2 0 !1=2 r 2 1 1 1 dx = = p ; 2 12 2 3 p 1 e2 = 2 3 x ; 2 e3 = vers x2 164 x2 ; e1 e1 x2 ; e2 e2 ; 2 x ;1 = Z 1 x2 dx = 0 2 x ; e2 = Z 1 2 1 ; 3 p 1 3 dx = ; 2 6 p 3 p 2 3 x 6 p x 2 3 x 0 x2 x2 ; e1 e1 x2 ; e2 e2 L2 0 =@ Z 1 3 x2 0 Z = 1 1 1 x+ 6 2 x 0 p e3 = 6 5 x2 1 6 x+ !1=2 2 dx 1 2 =p 1 2 p e3 = 6 5 x2 : ; x+ 1 6 : Ora bisogna calcolare la proiezione di f su V0 ; cioè: PV0 f = (f; e1 ) e1 + (f; e2 ) e2 + (f; e3 ) e3 : Calcoliamo dunque: Z 1 2 (f; e1 ) = sin ( x) dx = ; 0 (f; e2 ) = Z 1 p sin ( x) 2 3 x 0 (f; e3 ) = Z 1 1 2 p sin ( x) 6 5 x2 dx = 0; 1 x+ 6 0 dx = p 2 5 2 3 Perciò PV0 f = = 2 + 60 p 2 5 2 12 3 2 12 3 x2 165 p 6 5 x2 x + 12 x+ 2 1 6 120 3 : 12 11=2 dxA 1 1 = p ; 180 6 5 Ricapitoliamo: una base ortonormale di V0 è costituita dai 3 vettori: e1 = 1; p e2 = 2 3 x !2 : Rappresentiamo la funzione f insieme alla sua approssimante: Supponiamo ora di avere a disposizione (e vedremo in seguito che sarà pro1 prio così in molti esempi interessanti) una successione ej j=1 di vettori che costituiscono un sistema ortonormale. I procedimenti illustrati precedentemente si possono applicare iterativamente ai primi n vettori di questa successione, per n crescente. Si ottiene allora il seguente importante risultato: 1 Teorema 16.3 (Disuguaglianza di Bessel) Se ej j=1 è un sistema ortonormale in uno spazio di Hilbert H; per ogni x2 H vale la disuguaglianza (di Bessel): 1 X 2 2 x; ej kxk : j=1 In particolare, la serie a primo membro converge. Inoltre: x n X 2 x; ej ej = kxk j=1 n X 2 x; ej 2 : (16.2) j=1 Dimostrazione. Applichiamo il teorema delle proiezioni e quanto sopra ossern vato al sottospazio V0 generato dai primi n vettori ej j=1 . Si ha: n X x; ej j=1 2 2 = kPV0 xk kxk 2 per n = 1; 2; 3; ::: Passando al limite per n ! 1 si ha la tesi (ricordiamo che una serie numerica a termini positivi con somme parziali superiormente limitate è convergente). D’altro canto la scomposizione x = PV0 x + (x PV0 x) dà, per l’ortogonalità, 2 2 kxk = kPV0 xk + kx 166 PV0 xk 2 e quindi x n X j=1 2 x; ej ej = kx 2 PV0 xk = kxk 2 2 kPV0 xk = kxk 2 n X x; ej 2 : j=1 L’idea dell’analisi di Fourier in spazi di Hilbert è approssimare un elemento x di H mediante la sua proiezione su opportuni sottospazi …nito dimensionali. Pn 2 Poiché al crescere di n la somma j=1 x; ej aumenta, dalla (16.2) del teore2 ma precedente leggiamo che la distanza kx PV0 xk diminuisce. Ci piacerebbe poter a¤ermare che questa distanza non solo diminuisce ma tende a zero. Signi…cherebbe che abbiamo un metodo per approssimare bene quanto vogliamo un generico elemento di uno spazio di Hilbert, mediante combinazioni lineari di elementi del sistema ortonormale …ssato. D’altro canto a¢ nché questo accada è 1 necessario che il sistema ortonormale ej j=1 sia su¢ cientemente ricco da “catturare tutte le direzioni di H”: se ad esempio in R3 considerassimo un sistema ortonormale costituito da soli due vettori, certamente non potremmo approssimare bene quanto vogliamo un generico elemento di R3 con combinazioni lineari di questi due vettori. Questo porta alla seguente De…nizione 16.4 Sia H uno spazio di Hilbert. Un sistema ortonormale ej in H si dice completo se per ogni x2 H, x; ej = 0 8j 1 j=1 =) x = 0: Si può dimostrare che: Teorema 16.5 In ogni spazio di Hilbert separabile esiste un sistema ortonormale completo, nel senso della precedente de…nizione20 . Ricordiamo che “separabile” signi…ca: che contiene un sottoinsieme denso numerabile. Ad esempio, se è un sottoinsieme misurabile di Rn lo spazio L2 ( ) è separabile. Questo è l’ esempio fondamentale che ci interesserà nel seguito. Dal punto di vista pratico il teorema precedente non è così importante nel senso che quando si applica la teoria di solito si conosce esplicitamente un sistema ortonormale completo, dunque non c’è bisogno di appellarsi a un risultato astratto per garantirne l’esistenza. Ad esempio, come vedremo, in L2 [a; b] il classico sistema trigonometrico è l’esempio più noto di sistema ortonormale completo. Il prossimo teorema condensa i risultati fondamentali di analisi di Fourier in spazi di Hilbert: 2 0 Si può dare una de…nizione di sistema ortonormale, e quindi di sistema ortonormale completo, non solo …nito o numerabile, ma di cardinalità qualsiasi. Il teorema allora andrebbe riformulato dicendo “In ogni spazio di Hilbert separabile esiste un sistema ortonormale completo numerabile ”. Non entriamo in questi dettagli perché non ci interesseranno mai spazi di Hilbert non separabili. 167 Teorema 16.6 (Serie e trasformata di Fourier in spazi di Hilbert) Sia H 1 uno spazio di Hilbert e ej j=1 un sistema ortonormale completo. Per ogni x2 H; poniamo x bj = x; ej per j = 1; 2; 3; ::: Allora 1. La serie di Fourier di x converge in H ad x, cioè: x= 1 X j=1 2. L’operatore x bj ej 1 F : x 7! fb xj gj=1 detto trasformata di Fourier su H, è lineare e continuo a valori nello spazio di successioni `2 ; più precisamente, F è una isometria tra spazi di Hilbert, cioè è biunivoca e conserva il prodotto scalare e la norma, ossia: x; y = 1 X j=1 x bj ybj 8x; y 2 H (uguaglianza di Plancherel) (il coniugato ybj è necessario se H è uno spazio di Hilbert complesso); 2 kxk = 1 X j=1 2 jb xj j 8x; y 2 H (uguaglianza di Perceval). Dimostrazione. L’operatore F è evidentemente lineare; per la disuguaglianza P1 2 2 1 di Bessel, j=1 jb xj j kxk ; in particolare fb xj gj=1 2 `2 . 1 Mostriamo che F è suriettiva. Data una successione fcj gj=1 2 `2 ; cioè P1 P1 2 tale che j=1 jcj j < 1; per il Teorema di Pitagora 14.12 la serie j=1 cj ej converge in H ad un certo elemento x; calcoliamo ora: ! 1 X x bj = x; ej = ck ek ; ej = k=1 per linearità e continuità del prodotto scalare = 1 X ck ek ; ej k=1 per l’ortonormalità del sistema = cj . 1 1 xj gj=1 = fcj gj=1 ; Dunque abbiamo costruito un elemento x2 H tale che fb perciò F è suriettiva. 1 L’iniettività di F segue dalla completezza del sistema ej j=1 : se x bj = 0 8j ossia x; ej = 0 8j; allora x= 0; per de…nizione di sistema ortonormale 168 completo. Dunque F è lineare e biunivoca tra H e `2 . Mostriamo ora che la serie di Fourier di x converge proprio a x. Segue ancora dalla completezza del sistema, infatti: ! 1 X (16.3) x (x; ek ) ek ; ej = k=1 per la linearità e la continuità del prodotto scalare = x; ej 1 X k=1 (x; ek ) ek ; ej = x bj per l’ortonormalità del sistema =x bj 1 X k=1 x bk ek ; ej x bj = 0: Dunque essendo il prodotto scalare (16.3) nullo per ogni j, per la completezza del sistema segue che 1 X x (x; ek ) ek = 0; ossia k=1 x= 1 X k=1 x bk ek , che è la convergenza della serie di Fourier. Sapendo questo, l’uguaglianza di Plancherel segue dalla bilinearità e continuità del prodotto scalare: 1 0 1 1 X 1 1 X X X x; y = @ x bk ek ; ybj ej A = x bk ybj ek ; ej = k=1 j=1 e per l’ortonormalità = k=1 j=1 1 X j=1 x bk ybj : In…ne, l’uguaglianza di Perceval segue dall’uguaglianza di Plancherel per y= x: Come si vede, gli spazi di Hilbert dotati di un sistema ortonormale completo numerabile (cioè, per il Teorema 16.5, gli spazi di Hilbert separabili ) sono un ambiente estremamente naturale per l’analisi di Fourier: i risultati del teorema precedente sono infatti esaurienti e “puliti”: la serie di Fourier di qualsiasi elemento x converge ad x, e la trasformata di Fourier è un’isometria tra spazi di Hilbert, il che signi…ca che tutta l’informazione che identi…ca l’elemento x è 1 codi…cata nella successione numerica fb xj gj=1 . Naturalmente per applicare la teoria ad uno spazio di funzioni concreto occorre conoscerne esplicitamente un sistema ortonormale completo. Nel seguito incontreremo alcuni esempi espliciti di sistemi ortonormali completi in vari spazi di Hilbert di tipo L2 ( ). Si ri‡etta anche sul fatto che qualsiasi spazio di Hilbert separabile risulta identi…cato, tramite la trasformata di Fourier, con lo spazio `2 ; dal punto di vista della struttura astratta esiste quindi un solo spazio di Hilbert separabile! 169 17 Esercizi sulla Parte 3 A. Spazi di Hilbert Es 17.1 Sia X uno spazio vettoriale normato la cui norma soddisfa l’uguaglianza del parallelogramma 2 kx + yk + kx 2 2 yk = 2 kxk + kyk 2 8x; y 2 X: (NON si sta supponendo a priori che tale norma provenga da un prodotto scalare). a. Provare che allora vale l’uguaglianza del parallelepipedo: 2 2 2 kx1 + x2 + x3 k = kx1 + x2 k + kx1 + x3 k + kx2 + x3 k 2 2 2 8x1 ; x2 ; x3 2 X: (Perché si chiama così? Visualizzare il signi…cato geometrico in R3 ). b. Provare che se si de…nisce (x; y) = 1h 2 kx + yk 2 2 kxk + kyk 2 i ; (17.1) questo “prodotto scalare” soddisfa e¤ ettivamente la proprietà (u + v; w) = (u; w) + (v; w) : c. Dal risultato del punto precedente dedurre, successivamente, le seguenti proprietà ( u; v) = (u; v) (nu; w) = n (u; w) per n = 1; 2; 3; ::: 1 u; w n = ( u; v) = 1 (u; v) per n = 1; 2; 3; ::: n (u; v) per ogni 2Q d. Dalla de…nizione (17.1) dedurre la proprietà di continuità: Se xn ! x in X; allora (xn ; y) ! (x; y) per ogni y 2 X: e. Sfruttando il punto d e l’ultima proprietà del punto c, provare che: ( u; v) = (u; v) per ogni 2 R: Risulta così completamente dimostrato che: se in uno spazio vettoriale normato la norma soddisfa l’uguaglianza del parallelogramma, allora necessariamente tale norma deriva da un prodotto scalare. 170 2 kx1 k + kx2 k + kx3 k Es 17.2 In L2 ( 1; 1) ; si consideri il sottospazio V generato dalle funzioni: 1; x; x2 ; x3 : Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo di ortonormalizzazione di Gram-Schmidt. [Osservazione: iterando questo metodo …no a una potenza n qualunque si costruiscono i polinomi di Legendre]. 2 Es 17.3 In R si metta la misura Gaussiana d = e x dx: Si consideri lo spazio di Hilbert H = L2 (R; d ), cioè lo spazio delle funzioni per cui si ha: kf kL2 (R;d ) = Z e x2 1=2 2 f (x) dx R < 1: Si consideri ora il sottospazio V generato dalle funzioni: 1; x; x2 ; x3 : Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo di ortonormalizzazione di Gram-Schmidt. [Osservazione: iterando questo metodo …no a una potenza n qualunque si costruiscono i polinomi di Hermite]. Es 17.4 In R+ = (0; +1) si metta la misura d = e x dx: Si consideri lo spazio di Hilbert H = L2 (R+ ; d ), cioè lo spazio delle funzioni per cui si ha: kf kL2 (R+ ;d ) = Z 1=2 +1 e x 2 f (x) dx 0 < 1: Si consideri ora il sottospazio V generato dalle funzioni: 1; x; x2 ; x3 : Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo di ortonormalizzazione di Gram-Schmidt. [Osservazione: iterando questo metodo …no a una potenza n qualunque si costruiscono i polinomi di Laguerre]. Es 17.5 Si supponga di eseguire i due procedimenti seguenti: a. Nello spazio L2 (0; 1) si ortonormalizzano le funzioni 1; x; x2 ; x3 (in quest’ordine). b. Nello spazio L2 (0; 1) si ortonormalizzano le funzioni x3 ; x2 ; x; 1; (in quest’ordine). Allora: Si trovano gli stessi due insiemi di vettori. Vero o falso? Si trovano due sistemi di vettori che generano lo stesso spazio vettoriale. Vero o falso? 171 Es 17.6 Esibire un sistema ortonormale completo nello spazio `2 delle successioni reali a serie dei quadrati convergente. Es 17.7 Nello spazio di Hilbert H = L2 ((0; +1) ; e x dx), sia V0 il sottospazio chiuso dei polinomi di grado 2. Dopo aver costruito una base ortonormale di V0 , calcolare la proiezione su V0 della funzione f (t) = sin t. Es 17.8 Di ciascuna delle seguenti forme bilineari sullo spazio di Hilbert speci…cato, dire se è simmetrica o no, continua o no, coerciva o no, giusti…cando le proprie risposte. R1 1: a (f; g) = 1 sin ( t) f (t) g (t) dt su L2 ( 1; 1) 2: a x; y = x1 y1 + 2x1 y2 3x2 y1 + 4x2 y2 su R2 R +1 3: a (f; g) = 3 1 f (t) g 0 (t) dt su H 1 (R) R1 4: a (f; g) = 4 1 f (t) g (t) dt su H01 ( 1; 1) R1 0 5: a (f; g) = 5 1 f (t) g 0 (t) dt su H01 ( 1; 1) R +1 6: a (f; g) = 1 f (t) g (2t) dt su L2 (R) R1 7: a (f; g) = 0 cos 3t f (t) g (t) dt su L2 (0; 1) 172 Parte IV Applicazioni dei metodi di ortogonalità 18 18.1 Applicazioni all’analisi armonica Il sistema trigonometrico. Serie di Fourier in una o due variabili Teorema 18.1 Nello spazio L2 [ ; ], il sistema trigonometrico 1 cos nx sin nx p ; p ; p per n = 1; 2; 3; ::: 2 (18.1) è ortonormale completo. Dimostrazione. L’ortonormalità si veri…ca elementarmente calcolando opportuni integrali (questo è stato fatto in Analisi 2). Proviamo la completezza. Si tratta di dimostrare che se f 2 L2 [ ; ] è ortogonale a tutti gli elementi del sistema trigonometrico (18.1) (il che è come dire: se f ha i coe¢ cienti di Fourier tutti nulli) allora f è uguale a zero quasi ovunque in [ ; ] (cioè è l’elemento nullo di L2 [ ; ]). La dimostrazione procede in due passi. 1. Prima si prova la tesi supponendo che f sia anche continua. Notiamo anzitutto che se f è ortogonale a tutti gli elementi del sistema trigonometrico, per linearità è ortogonale a tutte le combinazioni lineari …nite di questi elementi, ossia: per ogni polinomio trigonometrico p (x) si ha: Z f (x) p (x) dx = 0: (18.2) Mostriamo che sotto quest’ipotesi f è identicamente nulla. Per assurdo, non lo sia, e sia ad esempio f (x0 ) > 0 (se è < 0 il ragionamento è analogo). Per il teorema di permanenza del segno esiste un > 0 tale che f (x) > f (x0 ) 8x 2 (x0 2 ; x0 + ) : Consideriamo ora il polinomio trigonometrico t (x) = 1 + cos (x x0 ) cos : Si veri…ca che t (x) > 1 per jx jt (x)j 1 per jx 173 x0 j < x0 j : n Inoltre se t (x) è un polinomio trigonometrico, anche t (x) lo è, per n = 1; 2; 3; :::. Perciò si ha: Z n 0= f (x) t (x) dx Z Z n n = f (x) t (x) dx + f (x) t (x) dx; [ ; ]\jx x0 j< [ ; ]\jx x0 j ossia Z [ n f (x) t (x) dx = ; ]\jx x0 j Z [ n f (x) t (x) dx: ; ]\jx x0 j< Ora, il primo membro dell’uguaglianza rimane limitato al crescere di n, perché: Z [ Z n f (x) t (x) dx ; ]\jx x0 j n [ ; ]\jx x0 j [ ; ]\jx x0 j Z jf (x)j jt (x)j dx jf (x)j dx; Mostriamo invece che il secondo membro tende a 1 per n ! 1 (da cui l’assurdo). Scegliamo un intervallo [a; b] contenuto nell’insieme [ ; ] \ jx x0 j < ; su [a; b] la funzione t (x) avrà minimo m > 1, perciò Z Z f (x0 ) n n t (x) dx f (x) t (x) dx 2 [ ; ]\jx x0 j< [ ; ]\jx x0 j< Z Z f (x0 ) b f (x0 ) b n f (x0 ) n t (x) dx m dx = (b a) mn ! 1 per n ! 1: 2 2 2 a a Questo dimostra il teorema nel caso f continua. 2. Sia ora f 2 L2 [ ; ] tale che per ogni polinomio trigonometrico p (x) vale (18.2). De…niamo Z x F (x) = f (t) dt: La funzione F risulta assolutamente continua ed esiste F 0 (x) = f (x) quasi ovunque (per il Teorema fondamentale del calcolo integrale per l’integrale di Lebesgue). Calcoliamo i coe¢ cienti di Fourier di F . Z Z sin (nx) sin (nx) F (x) cos (nx) dx = F (x) f (x) dx = 0 n n perché il primo addendo è nullo in quanto sin ( n ) = 0; il secondo è nullo perché f ha coe¢ cienti di Fourier nulli. Z Z cos (nx) cos (nx) F (x) sin (nx) dx = F (x) + f (x) dx = n n 174 poiché f ha coe¢ cienti di Fourier nulli = perché: F ( cos (n ) cos (n ) F ( )+ F( n n )=0 ) = 0 per de…nizione di F come funzione integrale, e Z F( )= f (t) dt = 0 perché f ha anche il coe¢ ciente a0 = 0. In de…nitiva, la funzione F ha nulli i coe¢ cienti di Fourier Ak e RBk per k 1, mentre non è necessariamente vero che sia A0 = 0; cioè che sia F (t) dt = 0. Consideriamo però la funzione F (x) A0 = F (x) 2 1 2 Z F (t) dt: Questa funzione per de…nizione ha integrale nullo su [ ; ], e d’altro canto continua ad avere gli altri coe¢ cienti di Fourier nulli. Ne segue che F (x) A20 ha tutti i coe¢ cienti di Fourier nulli, ed è una funzione continua; per la prima parte della dimostrazione, allora, F (x) A20 è identicamente nulla. Ne segue che 0 A0 f (x) = F (x) = 0 quasi ovunque, 2 che è la tesi. In base al teorema precedente e al Teorema 16.6, possiamo concludere il risultato di convergenza in L2 [ ; ] delle serie di Fourier: Teorema 18.2 Sia f 2 L2 [ ; ] ; de…niamo Z 1 ak = f (x) cos nxdx per n = 0; 1; 2; 3::: 2 Z 1 bk = f (x) sin nxdx per n = 1; 2; 3; :: 2 Allora la serie di Fourier di f 1 a0 X + (an cos nx + bn sin nx) 2 n=1 converge ad f in L2 [ Z f (x) " ; ] : Esplicitamente, questo signi…ca che: #2 n a0 X + (ak cos kx + bk sin kx) dx ! 0 per n ! 1: 2 k=1 175 Naturalmente serie e coe¢ cienti di Fourier si possono adattare ad un intervallo [a; b] qualsiasi (v. [5, Cap. 7, §3.4]). La teoria degli spazi di Hilbert fornisce un risultato semplice e generale sulla convergenza delle serie di Fourier in L2 . Naturalmente è anche interessante sapere se la serie di Fourier converge puntualmente (cosa che non segue dalla convergenza in L2 ). In realtà, il problema della convergenza puntuale è il primo che si è posto, storicamente, col sorgere stesso della teoria delle serie di Fourier (1822, Fourier, trattato “Teoria analitica del calore”). Il primo studio rigoroso sulla convergenza puntuale delle serie di Fourier è dovuto a Dirichlet nel 1829. Si tratta di un problema fondamentale per l’analisi armonica, di cui però non diremo nulla, in quanto ci interessa qui solo illustrare alcune applicazioni della teoria degli spazi di Hilbert, che fu creata circa 100 anni dopo le serie di Fourier, come già accennato. Per qualche dettaglio sullo studio della convergenza puntuale delle serie di Fourier si rimanda a [5, Cap. 7, §3.6] o a [10, Chap.8, §8.5]. n Si possono anche de…nire le serie di Fourier in n variabili, sull’insieme [ ; ] (e quindi, riscalando il sistema trigonometrico, su qualunque “n-parallelepipedo”). 2 Ad esempio, in due variabili si può sviluppare una funzione f (x; y) 2 L2 [ ; ] in serie di Fourier doppia. Vediamo prima il seguente risultato astratto: 1 Teorema 18.3 Sia fen (x)gn=1 un sistema ortonormale completo in L2 [ Allora 1 fen (x) em (y)gn;n=1 2 è un sistema ortonormale completo in L [ ; ]: 2 ; ] . Dimostrazione. L’ortonormalità si veri…ca facilmente: per (n; m) 6= (n1 ; m1 ) risulta Z Z (en (x) em (y) en1 (x) em1 (y)) dxdy Z Z = en (x) en1 (x) dx em (y) em1 (y) dy = 0 perché almeno uno dei due integrali è zero, essendo n 6= m o n1 6= m1 ; mentre Z Z Z Z 2 2 jen (x) em (y)j dxdy = jen (x)j dx jem (y)j dy = 1 1 = 1: Quanto alla completezza, sia f 2 L2 [ Z Z 2 ; ] e supponiamo che sia f (x; y) en (x) em (y) dxdy = 0 per ogni n; m: Fissiamo m e consideriamo la funzione Z gm (x) = f (x; y) em (y) dy: 176 Questa funzione sta in L2 [ Z ; ] ; perché 2 jgm (x)j dx = Z Z 2 f (x; y) em (y) dy dx applicando nell’integrale interno la disuguaglianza di Cauchy-Schwarz Z Z Z 2 2 jf (x; y)j dy jem (y)j dy dx Z Z 2 2 jf (x; y)j dydx = kf kL2 ([ ; ]2 ) < 1: = Inoltre gm ha tutti i coe¢ cienti di Fourier nulli rispetto al sistema fen (x)g, dunque gm (x) = 0 quasi ovunque. Questo, per de…nizione di gm ; signi…ca che per quasi ogni x …ssato la funzione y 7! f (x; y) ha tutti i coe¢ cienti di Fourier nulli rispetto al sistema fem (y)g ; dunque per q.o. x e per q.o. y è f (x; y) = 0. Questo prova la completezza del sistema. La scrittura esplicita del sistema trigonometrico in due variabili è resa complicata dal fatto che occorre moltiplicare ognuna delle tre funzioni 1 cos nx sin nx p ; p ; p 2 per ognuna delle tre funzioni 1 cos my sin my p ; p ; p ; 2 mentre viene molto più semplice usando la scrittura complessa einx p 2 n2Z e quindi, in due variabili, ei(nx+my) 2 2 In questo caso si pone, per f 2 L2 [ fbn;m = 1 2 (2 ) Z Z : n;m2Z ; ] f (x; y) e i(nx+my) dxdy per n; m 2 Z e si ha quindi f (x; y) = +1 X n;m= 1 177 fbn;m ei(nx+my) 2 con convergenza della serie in L2 [ ; ] . Più esplicitamente, una nozione di convergenza di una serie de…nita da due indici interi relativi richiede una de…nizione precisa di somma parziale. Tale de…nizione non è univoca; ad esempio è corretto a¤ermare che, se de…niamo X sN (x; y) = fbn;m ei(nx+my) per N = 0; 1; 2; ::: jnj+jmj N allora risulta kf sN kL2 ([ ; ]2 ) ! 0 per N ! +1: Una delle possibili applicazioni delle serie di Fourier in due variabili è alla compressione delle immagini. Un’immagine in scala di grigi si può vedere come una funzione f (x; y) de…nita in un rettangolo a valori in [0; 1], dove il valore f (x; y) rappresenta l’intensità di grigio nel punto (pixel) (x; y), quindi f = 0 vuol dire punto bianco e f = 1 punto nero. Una somma di Fourier parziale di f immagazzina (in modo approssimato) l’informazione dell’immagine in un numero limitato di coe¢ cienti di Fourier. 18.2 Base di Haar e wavelets Nell’utilizzo dell’analisi di Fourier per approssimare un segnale periodico, il sistema trigonometrico ha, insieme a tanti pregi, un paio di difetti. 1. I polinomi trigonometrici sono funzioni continue e regolari, perciò una serie di Fourier approssima male una funzione discontinua. L’approssimazione in L2 rimane, ma non possiamo certamente aspettarci una buona approssimazione puntuale vicino a un punto di discontinuità. 2. L’approssimazione con polinomi trigonometrici ha una natura globale: supponiamo di voler approssimare una funzione f 2 L2 [ ; ] che ha un gra…co “semplice e liscio”in [ ; 0] e piuttosto frastagliato in [0; ]. A¢ nché la somma parziale di Fourier segua bene il gra…co di f in [0; ] noi dovremo aumentare il numero di termini, i cui coe¢ cienti sono stati calcolati in base al comportamento di f su tutto [ ; ]; questo signi…ca che l’unico modo di migliorare i dettagli dell’approssimazione in [0; ] è quello di aumentare i dettagli in tutto [ ; ]; non possiamo ra¢ nare l’approssimazione su una sola parte dell’intervallo. Per ovviare a questi due difetti, e in particolare al secondo, si possono utilizzare altri tipi di sistemi ortonormali completi di L2 [ ; ], che hanno la proprietà di permettere un’analisi su scale diverse in parti diverse dell’intervallo, o come si dice, fare una “analisi multirisoluzione”. Sistemi di questo tipo sono le wavelets. Ce ne sono di molti tipi, presentiamo qui il più semplice. Rimandiamo a [12, § 7.6] per qualche dettaglio in più su quanto spiegato qui di seguito, e a [1] per una trattazione più approfondita. Ci mettiamo ora nell’intervallo [0; 1]. De…niamo la “funzione madre” 8 per 0 x < 12 < 1 1 per 12 x < 1 (x) = : 0 altrimenti 178 e la seguente famiglia di funzioni ottenute traslando e riscalando la funzione madre: n;k (x) = 2n=2 (2n x k) per k = 0; 1; 2; :::; 2n 1; n = 0; 1; 2; 3; ::: Visualizziamo i gra…ci di alcune di queste funzioni. Ad esempio per n = 2 e quindi k = 0; 1; 2; 3 si ha: di Confrontiamo invece tra loro funzioni n;k per i valori n = 1; 2; 3; 4; sono: 179 n;k per diversi valori di n. I gra…ci fNotiamo che per tutte le funzioni Z n;k 1 n;k (x) dx = 0 e 0 Z si ha 1 2 n;k (x) dx = 1: 0 E’ facile rendersi conto che il prodotto tra due funzioni diverse tra le n;k o è identicamente nullo oppure è una delle due moltiplicata per una costante; perciò queste funzioni sono anche a due a due ortogonali. Poiché tutte queste funzioni hanno media nulla, se vogliamo sperare di avere un sistema ortonormale completo è necessario aggiungere almeno una funzione che non abbia media nulla: la costante 1 va bene. Vale il seguente Teorema 18.4 Il sistema di funzioni f1; n;k gk=0;1;2;:::;2n 1;n=0;1;2;3::: è ortonormale completo in L2 [0; 1] : Dimostrazione. L’ortonormalità è stata sostanzialmente dimostrata. Per la completezza, ci limitiamo a segnalare che si può dimostrare che questo sistema di funzioni è denso nell’insieme delle funzioni semplici (cioè misurabili e che assumono un numero …nito di valori), che a sua volta è denso in L2 [0; 1]. Dalla completezza del sistema precedente segue: Teorema 18.5 Per f 2 L2 [0; 1] de…niamo: fb0 = fbn;k = Z 1 f (x) dx 0 Z 1 f (x) n;k (x) dx per n = 0; 1; 2; 3::: e k = 0; 1; 2; :::; 2n 1; 0 allora la serie converge a f in L2 [0; 1]. n fb0 + 1 2X1 X n=0 k=0 fbn;k n;k (x) Poiché le n;k ; e quindi ogni loro somma parziale, è una funzione discontinua, ci aspettiamo che questo tipo di serie possa approssimare bene anche funzioni con discontinuità; l’altra faccia della medaglia è che la somma parziale sarà sempre discontinua, anche quando la funzione da approssimare è continua. Soprattutto però il pregio di questa approssimazione è la sua localizzabilità: ogni n;k è diversa da zero solo su un intervallino, perciò scegliendo opportunamente i termini n;k possiamo aumentare il dettaglio dell’approssimazione di f in un tratto speci…co dell’intervallo [0; 1]. 180 Esempio 18.6 Sia f (x) = per x 2 0; 14 per x 2 ( 14 ; 1]: 1 x2 log x Allora il gra…co di f insieme a quello della sua somma parziale n fb0 + 3 2X1 X n=0 k=0 fbn;k n;k (x) (che in tutto ha 16 termini) è il seguente: Si osserva che nel “gradino” di f l’approssimante segue il salto senza problemi. D’altro canto l’approssimante è “a gradini” anche nei tratti continui di f . A titolo di confronto il gra…co di f insieme alla sua somma parziale di Fourier 8 a0 X + (an cos (2 nx) + bn sin (2 nx)) 2 n=0 181 (che ha in tutto 17 termini) è il seguente: Un esempio signi…cativo di problema di compressione delle immagini in cui si è rivelato utile l’uso di wavelets in due variabili è la digitalizzazione dell’archivio di impronte digitali compiuto dall’FBI negli anni 1990. Una lettura interessante in tal senso è il saggio [14]. 19 19.1 Applicazioni dei metodi di ortogonalità a problemi di¤erenziali Separazione di variabili per problemi ai limiti per EDP mediante il sistema trigonometrico Torniamo ora in un certo senso all’indietro nel percorso storico, illustrando qualche esempio classico di risoluzione di problemi ai limiti per equazioni a derivate parziali della …sica matematica mediante il metodo di separazione delle variabili, che si collocano proprio all’inizio degli utilizzi delle serie trigonometriche per risolvere problemi di¤erenziali ad opera di Fourier. Di questo metodo metteremo in evidenza alcuni aspetti che hanno un signi…cato più generale. 19.1.1 Di¤usione del calore in una sbarra Consideriamo una , rappresentata dal segmento [0; L], la cui temperatura al punto x e all’istante t è u (x; t). Se la temperatura iniziale ha un pro…lo noto u0 (x), la sbarra è termicamente isolata sulla sua super…cie laterale, non ci sono sorgenti o pozzi di calore interni, e la temperatura agli estremi è tenuta costante uguale a zero, ci aspettiamo che la temperatura nel tempo raggiungerà ovunque la temperatura costante zero. Studiamo come avviene nel tempo questo 182 fenomeno. Si dimostra che u soddisfa l’equazione del calore omogenea 8 < ut = cuxx per 0 < x < L; t > 0 u (0; t) = u (L; t) = 0 : u (x; 0) = u0 (x) che abbiamo accompagnato con le condizioni ai limiti e iniziali (problema di Cauchy-Dirichlet per l’equazione del calore omogenea unidimensionale). Il metodo di separazione delle variabili consiste nel cercare anzitutto soluzioni di forma particolare, ossia appunto a variabili separate: U (x; t) = X (x) T (t) : Sostituendo nell’equazione di¤erenziale si ha: X (x) T 0 (t) = cX 00 (x) T (t) X 00 (x) T 0 (t) = : X (x) cT (t) Questa uguaglianza dev’essere identicamente veri…cata per 0 < x < L; t > 0. D’altro canto il primo membro è una funzione della sola x, il secondo membro è una funzione della sola t, quindi l’unica possibilità perché l’identità sussista è che ciascun membro sia costante. Si ha quindi, per qualche 2 R, X 00 (x) = X (x) T 0 (t) = cT (t) per 0 < x < L per t > 0: (19.1) Ricordiamo ora che devono valere le condizioni ai contorno u (0; t) = u (L; t) = 0 che si traducono in X (0) = X (L) = 0. Dunque l’equazione in X e quella in T assumono un ruolo asimmetrico, perché la prima (e solo la prima) è corredata di condizioni al contorno: X 00 (x) = X (x) per 0 < x < L X (0) = X (L) = 0: (19.2) Con ciò abbiamo ottenuto un problema agli autovalori per l’operatore di¤erend2 ziale dx 2 R (autovalori) e soluzioni X (x) non identica2 : si cercano numeri mente nulle (autofunzioni) del problema (19.2). Si ri‡etta sul fatto che per ogni possiamo scrivere l’integrale generale dell’equazione di¤erenziale, dipendente da due costanti arbitrarie, ma non per ogni è possibile determinare le costanti di integrazione in modo da soddisfare le condizioni nulle agli estremi: se = 0; X (x) = c1 x + c2 si annulla in x = 0; x = L solo per c1 = c2 = 0; se > 0; X (x) = c1 e x + c2 e x si annulla in x = 0; x = L solo per c1 = c2 = 0; p p se < 0; X (x) = c1 cos x + c2 sin x si annulla in x = 0; x = L p 2 2 per c1 = 0 e per qualsiasi c2 purché sia sin L = 0; cioè = nL2 , con n = 1; 2; 3; ::: 183 Abbiamo dunque ricavato autovalori e autofunzioni del problema (19.2): = n2 2 n x ; Xn (x) = cn sin , per n = 1; 2; 3; ::: L2 L (cn costante arbitraria). Possiamo ora risolvere l’equazione (19.1) per questi valori di : n2 2 c T (t) L2 T 0 (t) = Tn (t) = e n2 2 c t L2 e in de…nitiva le soluzioni a variabili separate dell’equazione a derivate parziali e delle condizioni al contorno: un (x; t) = Xn (x) Tn (t) = cn sin n x e L n2 2 c t L2 : Nessuna di queste soluzioni in generale soddisferà anche la condizione iniziale, perché un (x; 0) = cn sin (n x). L’idea allora è la seguente: essendo l’equazione di¤erenziale lineare e omogenea, con condizioni agli estremi omogenee, ogni combinazione lineare …nita delle un soddisferà ancora equazione e condizioni al contorno. Possiamo cercare una serie in…nita di queste soluzioni che per un’opportuna scelta dei coe¢ cienti cn converga ed assuma anche la condizione iniziale. Scriviamo dunque u (x; t) = 1 X cn sin n=1 n x e L n2 2 c t L2 (19.3) e imponiamo la condizione iniziale: u (x; 0) = 1 X cn sin n=1 n x = u0 (x) per 0 < x < L L Si tratta dunque di scegliere i coe¢ cienti cn come i coe¢ cienti di Fourier dello sviluppo di u0 in serie di soli seni in (0; L) (v. [5, Cp.7, §3.8]). Si ha: cn = 2 L Z L u0 (y) sin 0 n y dy L e per questa scelta dei coe¢ cienti cn la serie (19.3) assume anche la condizione iniziale, purché u0 soddis… ipotesi ragionevoli sotto P1 cui la sua serie di Fourier converge. Sia ad esempio f 2 L2 (0; L), perciò n=1 c2n < 1. Si noti che per n2 2 c n2 2 c e L2 t che tende a zero espoqualunque t > 0 si ha sin nLx e L2 t nenzialmente, perciò non solo la serie converge, ma anche la sua serie derivata rispetto a x o t (qualunque numero di volte) continua a convergere. In altre parole, la funzione rappresentata dalla (19.3) è estremamente regolare per t > 0. 184 L’unico punto delicato da veri…care è in quale senso u (x; t) tenda a u0 (x) per t ! 0, cosa che qui non approfondiamo. Si osservi comunque che la possibilità di risolvere il problema di CauchyDirichlet col metodo di separazione delle variabili imponendo una “qualsiasi” condizione iniziale (eventualmente soddisfacente qualche ipotesi di regolarità) si basa sul fatto che le autofunzioni Xn (x) del problema (19.2) costituiscano un sistema ortonormale completo di L2 (0; L). Questo è uno degli aspetti chiave di questo problema, che vedremo avere uno spettro di applicazione molto ampio. Prima di passare a problemi più generali è però utile prendere con…denza col metodo stesso. Lo studente è invitato a sviluppare in dettaglio il seguente esempio, analogo al precedente: Es 19.1 (Corda vibrante …ssata agli estremi) Una corda elastica …ssata ai due estremi, pizzicata in modo da eseguire piccole oscillazioni rispetto all’equilibrio, soddisfa l’equazione di¤ erenziale utt = c2 uxx dove u (x; t) rappresenta l’altezza al tempo t del punto della corda che a riposo si trova nel punto x, e c è una costante positiva con le dimensioni di una velocità. Se la corda è …ssata agli estremi e sono note la sua con…gurazione iniziale u0 (x) e la sua velocità iniziale (che supponiamo nulla, per semplicità) la u (x; t) soddisferà il problema di Cauchy-Dirichlet: 8 per 0 < x < L; t > 0 > > utt = cuxx < u (0; t) = u (L; t) = 0 per t > 0 u (x; 0) = u0 (x) per 0 < x < L > > : ut (x; 0) = 0 per 0 < x < L: Si risolva il problema utilizzando esattamente lo stesso metodo visto prima. Suggerimento. La di¤ erenza riguarda solo l’equazione in T (t). Si trovano le seguenti soluzioni a variabili separate (dell’equazione e condizioni agli estremi): un (x; t) = sin n x L an cos n ct L + bn sin n ct L : Quindi imponendo le condizioni iniziali si trova u (x; t) = 1 X an cos n=1 con an = 2 L Z n ct L L u0 (y) sin 0 sin n x L n y dy: L Questa volta la derivabilità della serie che rappresenta la soluzione non è ovvia, ma va ottenuta richiedendo che i coe¢ cienti an tendano a zero abbastanza velocemente, ossia richiedendo che u0 sia abbastanza regolare. 185 19.1.2 Equazione di Laplace sul cerchio L’equazione di Laplace in due variabili, u = uxx + uyy = 0 può avere vari signi…cati …sici, ad esempio: u potenziale gravitazionale (nel piano) in assenza di massa; u potenziale elettrostatico in assenza di carica; u temperatura di una lamina che non ha pozzi o sorgenti di calore interni e ha raggiunto l’equilibrio termico; u altezza sull’orizzontale di una membrana elastica tesa al contorno e in equilibrio. La risoluzione esplicita di questa equazione sul cerchio è un punto di partenza fondamentale per la teoria del potenziale (in due variabili). Per risolvere l’equazione di Laplace sul cerchio, la prima cosa è riscriverla in coordinate polari ( ; #). Si trova (v. [5, Cap.4, §5.2]), per l’equazione sul cerchio di centro (0; 0) e raggio R; con dato al bordo f assegnato: 8 2 1 @2u < @ u 1 @u + + = 0 per 2 [0; R); # 2 [0; 2 ] 2 @#2 (19.4) @ 2 @ : u (R; #) = f (#) per # 2 [0; 2 ] : Cerchiamo soluzioni a variabili separate, del tipo: u ( ; #) = R ( ) (#) : Sostituendo nell’equazione si ha 1 (#) + R0 ( ) R00 ( ) (#) + 1 2 R( ) 00 (#) = 0 R00 ( ) R0 ( ) + = R( ) R( ) 2 00 (#) (#) identità tra una funzione della sola e una funzione della sola #, che quindi forza ciascun membro ad essere costante. Quindi per qualche 2 R dev’essere: 2 R00 ( ) + R0 ( ) = R ( ) per 2 (0; R) 00 (#) = (#) per # 2 [0; 2 ] : Bisogna anche richiedere che sia 2 periodica: per il signi…cato geometrico delle coordinate polari, se non è così la funzione u ( ; #) = R ( ) (#) risulta discontinua. Questo impone = n2 e n (#) = an cos (n#) + bn sin (n#) per n = 0; 1; 2; 3; ::: Con ciò l’equazione in R diventa 2 R00 ( ) + R0 ( ) n2 R ( ) = 0 per 186 2 [0; R] : Per n 6= 0 è un’equazione di Eulero, si possono cercare soluzioni del tipo R ( ) = ; con da determinarsi: 2 ( 2 1) 1 + ( n2 =0 2 1) + n =0 = n; che dà Rn ( ) = c1 n + c2 n ; ma poiché vogliamo soluzioni regolari in [0; R] dobbiamo escludere le soluzioni c2 n illimitate nell’origine. Per n = 0 l’equazione 2 è di Eulero in R0 ( ) = R00 ( ) + R0 ( ) = 0 ; 2 1 + =0 +1 ( + 1) =0 = 1 1 R0 ( ) = R ( ) = d1 + d2 log : Escludendo ancora le soluzioni d2 log …nitiva Rn ( ) = c R0 ( ) = d n illimitate nell’origine, otteniamo in deper n = 1; 2; 3; ::: Si trovano in de…nitiva le soluzioni a variabili separate: un ( ; #) = n [an cos (n#) + bn sin (n#)] u0 ( ; #) = d: Come nell’esempio precedente, l’idea è scrivere una soluzione che soddis… anche la condizione al contorno sommando le in…nite soluzioni a variabili separate: u ( ; #) = d + 1 X n [an cos (n#) + bn sin (n#)] : n=1 Imporre la condizione al contorno signi…ca quindi scrivere: u (R; #) = d + 1 X Rn [an cos (n#) + bn sin (n#)] = f (#) n=1 187 il che signi…ca che quello scritto dev’essere lo sviluppo di Fourier di f (#) in [0; 2 ], quindi posto 1 A0 X + [An cos (n#) + Bn sin (n#)] , ossia 2 n=1 Z Z 1 2 1 2 An = f (#) cos (n#) d#; Bn = f (#) sin (n#) d# f (#) = 0 (19.5) 0 si ha A0 ; Rn an = An ; Rn bn = Bn . 2 In conclusione la soluzione del problema (19.4) è: d= u ( ; #) = 1 A0 X + 2 R n=1 n [An cos (n#) + Bn sin (n#)] (19.6) con An ; Bn assegnati dalle (19.5). P1 2 2 Osserviamo che se f 2 L2 [0; 2 ], quindi n=1 An + Bn < 1, questo è su¢ ciente a garantire che la serie che assegna u ( ; #), e la serie delle sue derivate di ordine qualunque rispetto a o a #, converga per < R; per via P1 n della serie geometrica n=1 R . Anche in questo caso si vede che la funzione all’interno del cerchio è regolare, sotto ipotesi molto deboli su f (#); più delicato è garantire in che senso viene assunto il dato al bordo, e non entreremo in questa discussione: occorrerà garantire almeno la convergenza puntuale ovunque della serie di Fourier, chiedendo quindi al dato al bordo di essere per esempio continuo (periodico) e regolare a tratti. Di nuovo, osserviamo che uno degli elementi che ha reso praticabile il metodo di risoluzione del problema al contorno per separazione di variabili è il fatto che uno dei due sottoproblemi di¤erenziali consista in un problema agli autovalori le cui soluzioni (autofunzioni) sono un sistema ortonormale completo di L2 [0; 2 ]. La formula integrale di Poisson Ci interessa ora trasformare questa formula risolutiva “per serie” in una formula di rappresentazione “integrale”, da cui si potranno leggere altre informazioni. Sostituendo nella (19.6) le espressioni per i coe¢ cienti (conviene cambiare nome alla variabile di integrazione) Z Z 1 2 1 2 An = f (s) cos (ns) ds; Bn = f (s) sin (ns) ds 0 0 si ha u ( ; #) = + 1 X n=1 1 2 n R Z 2 f (#) ds+ 0 1 Z 2 f (s) cos (ns) ds cos (n#) + 0 1 Z 0 188 2 f (s) sin (ns) ds sin (n#) = Z 2 f (s) 0 ( 1 1 1X + 2 R n=1 ) n [cos (ns) cos (n#) + sin (ns) sin (n#)] ds: Vediamo di sommare esplicitamente il nucleo integrale f:::g. Anzitutto le formule di addizione e quelle di Eulero danno: cos (ns) cos (n#) + sin (ns) sin (n#) = cos n (# s) = ein(# s) +e 2 in(# s) ; quindi ci si può ricondurre a sommare delle serie geometriche: 1 n 1 1X + [cos (ns) cos (n#) + sin (ns) sin (n#)] 2 R n=1 ( ) 1 i n n 1 1 1 Xh in(# s) in(# s) = + e + e 2 2 n=1 R R ( ) 1 1 X X n n 1 i(# s) n(# s) = 1+ e + e 2 2 R R n=0 n=0 = 1 2 1 1 i(# Re s) + 1 e R 1 i(# s) 1 e qualche calcolo coi numeri complessi dà = 1 2 1 = 2 = 1 2 ( R cos (# 2R [R [R R2 cos (# R s) i sin (# cos (# 2 s)] + 2 R2 2R cos (# s) + 2 s) + R s)] sin2 (# 2 s) 1 cos (# ) R s) + i sin (# s) 1 : Abbiamo ottenuto una formula di rappresentazione della soluzione del problema mediante un integrale: Z 2 2 1 R2 u ( ; #) = f (s) ds: (19.7) 2 0 R2 2R cos (# s) + 2 Il nucleo integrale trovato si chiama nucleo di Poisson, e la formula ottenuta, detta formula integrale di Poisson, è molto importante, per vari motivi. 1. Anzitutto, spesso è più comodo calcolare la soluzione a partire dal dato al bordo, in modo esatto o approssimato, direttamente con questo integrale anziché con il doppio passaggio che consiste nel calcolare gli in…niti coe¢ cienti di Fourier di f e poi sommare la serie (19.6). 2. In secondo luogo, formule di rappresentazione mediante operatori integrali sono più adatte a mettere in evidenza le ipotesi minime sul dato f che garantiscono opportune proprietà della soluzione. Noi non faremo qui un’analisi 189 dettagliata, limitandoci ad osservare che per ogni < R e per ogni # il denominatore è discosto da zero, il che signi…ca che stando strettamente all’interno del cerchio < R si può derivare in…nite volte sotto il segno di integrale. Quindi (come già avevamo osservato) la soluzione dell’equazione di Laplace è in…nitamente derivabile all’interno del cerchio. Ma questa formula consentirebbe anche di provare risultati precisi di convergenza di u ( ; #) al dato f (#) avvicindandosi al bordo. 3. La formula mette in evidenza anche altre proprietà delle soluzioni dell’equazione di Laplace (funzioni armoniche): sostituendo = 0 si trova u (0; #) = 1 2 Z 2 f (s) ds; (19.8) 0 formula di valor medio, che dice che il valore di una funzione armonica in un punto è la media integrale dei valori assunti sul contorno del cerchio. Notiamo che se u è armonica in un insieme aperto del piano, per ogni cerchio BR contenuto in si può vedere u come soluzione del problema di Dirichlet avente come dato assegnato sul bordo del cerchio la u stessa. Quindi la precedente si può riscrivere anche così: Z 2 1 u (0; #) = u ( ; s) ds per ogni < R: 2 0 A sua volta questo fatto ha un’importante conseguenza, il principio del massimo delle funzioni armoniche: Teorema 19.2 Se u = 0 in aperto connesso del piano, allora u non può avere in punti di massimo o minimo relativo interni senza essere costante. Dimostrazione. Infatti, se per esempio l’origine (a cui ci si può sempre ricondurre per traslazione) fosse un punto di massimo relativo per u; scegliendo un cerchio B contenuto strettamente nell’insieme in cui 0 è punto di massimo, si avrebbe: Z 2 Z 2 1 1 max u = u (0; #) = u ( ; s) ds max u ds = max u , 2 0 2 0 dove l’uguaglianza può valere solo se su tutta la circonferenza è u = max u. Applicando il ragionamento ad ogni 0 < più piccolo si troverebbe u = max u su tutto il cerchio di raggio : Dunque se una funzione armonica ha un punto di massimo, in tutto un intorno di questo è costante. Per connessione, allora, sarebbe costante in tutto l’aperto connesso : Difatti i più semplici esempi di funzioni armoniche in due variabili sono xy; x2 y 2 ; ex sin y; ex cos y; ::: ed altre funzioni simili i cui gra…ci o non hanno punti stazionari (come le ultime due) o hanno solo punti stazionari di sella (come le prime due). 190 Queste ultime osservazioni fatte riguardo alla formula integrale di Poisson sono solo un assaggio dei metodi della teoria del potenziale, con cui a partire da una formula di rappresentazione semplice ed esplicita si dimostrano proprietà generali delle funzioni armoniche. Alla luce della formula …nale ottenuta, il procedimento di separazione di variabili appare un procedimento elaborato il cui ruolo …nale è quello di permetterci di ottenere una formula di rappresentazione integrale utile. Ogni volta che, con opportuni scambi tra serie numeriche e integrali che assegnano coe¢ cienti di Fourier, è possibile scrivere esplicitamente una formula di rappresentazione integrale, può essere interessante farlo. Non sempre però è agevole. Lo studente è invitato a risolvere in dettaglio il prossimo problema (analogo al precedente dal punto di vista concettuale, ma tecnicamente più semplice). Es 19.3 (Equazione di Laplace sul rettangolo) Si risolva, col metodo di separazione delle variabili, il seguente problema di Dirichlet per l’equazione di Laplace sul rettangolo: 8 < uxx + uyy = 0 per x 2 (0; A) ; y 2 (0; B) u (x; 0) = u (x; B) = u (A; y) = 0 : u (0; y) = f (y) : In altre parole, il dato al contorno assegnato sul bordo del rettangolo è diverso da zero solo su uno dei 4 lati (per semplicità). Esempio 19.4 Suggerimento: cercare soluzioni a variabili separate u (x; y) = X (x) Y (y) coi metodi visti sopra. Il problema agli autovalori è quello nella Y (y) ; che deve annullarsi a entrambi gli estremi. Scrivere la formula risolutiva nel modo più semplice e compatto. Si trova: u (x; y) = 1 X bn n=1 2 bn = B 19.2 Z n y Sh [n (A x)] sin , con Sh (n A) B B f (s) sin 0 n s ds: B Problemi di Sturm-Liouville e polinomi ortogonali Come sottoproblema dei problemi ai limiti risolti per separazione di variabili nel paragrafo precedente, ci siamo trovati in ogni caso di fronte ad un problema agli autovalori del tipo: y 00 (x) + y (x) = 0 per x 2 [0; L] y (0) = 0 = y (L) dove a priori sono incogniti sia la funzione y (x) che il numero . Si trova che necessariamente dev’essere: n2 2 per n = 1; 2; 3; ::: n = L2 n x yn (x) = sin : L 191 Il problema agli autovalori ha quindi: 1 1) una successione di autovalori positivi f n gn=1 che tende a +1; 2) una successione di yn corrispondenti, che risultano formare un sistema ortogonale completo di L2 [0; L]. Quest’a¤ermazione ci è familiare in quanto si tratta del “solito” sistema trigonometrico. Ma ora è interessante vedere questo fenomeno sotto una luce diversa: queste funzioni sono un sistema ortogonale completo proprio perché sono il sistema delle autofunzioni di un problema di¤erenziale ai limiti di un certo tipo. Esiste cioè una teoria generale di problemi agli autovalori per equazioni di¤erenziali ordinarie, di cui l’esempio appena discusso è un caso particolare, che porta a fabbricare sistemi ortonormali completi di L2 [a; b] costituiti da sistemi di autofunzioni. Daremo ora qualche cenno di questa teoria. De…nizione 19.5 (Problema di Sturm-Liouville) Si consideri il problema agli autovalori, detto di Sturm-Liouville: p (x) du q (x) u + dx u (a) = u (b) = 0 d dx (x) u = 0 per x 2 (a; b) (19.9) dove a; b 2 R e le funzioni p; q; sono coe¢ cienti assegnati soddisfacenti le ipotesi: p 2 C 1 (a; b) ; p (x) > 0 in [a; b] ; q 2 C 0 (a; b) ; q (x) 0 in [a; b] ; 2 C 0 (a; b) ; (x) > 0 in [a; b]. Sotto queste ipotesi il problema di Sturm-Liouville si dice regolare. Vale in proposito il seguente Teorema 19.6 Dato un problema di Sturm-Liouville regolare (19.9) esistono: 1 1) una successione di autovalori f n gn=1 tutti positivi, successione crescente e tendente a +1; 1 2) una successione di autofunzioni fun gn=1 corrispondenti, che costituiscono un sistema ortonormale completo dello spazio di Hilbert L2 ((a; b) ; (x) dx). Esplicitamente, questo signi…ca che la misura è la misura pesata d (x) dx; quindi ortogonalità signi…ca che Z b 0 per n 6= m un (x) um (x) (x) dx = 1 per n = m: a = Dimostriamo solo la più semplice delle a¤ermazioni fatte: due autofunzioni relative a due autovalori distinti sono tra loro ortogonali. Supponiamo quindi che (u; ) ; (v; ) siano due coppie autofunzione-autovalore, e proviamo che u; v sono ortogonali in L2 ((a; b) ; (x) dx). Scriviamo perciò: 0 (pu0 ) 0 (pv 0 ) qu + qv + u=0 v = 0: Moltiplichiamo la prima equazione per v, la seconda per u e sottraiamo membro a membro. Otteniamo: 0 (pu0 ) v 0 (pv 0 ) u + ( ) uv = 0 in (a; b) ; 192 da cui ( ) Z b uv dx = a integrando per parti 0 = [pv u Z h b a pu 0 Z b v]a i 0 (pu0 ) v dx = 0 (pv 0 ) u b [pu0 v 0 pv 0 u0 ] dx = 0 a b perché il secondo integrale è nullo e [pv 0 u pu0 v]a per le condizioni agli estremi su u e v. Quindi si ottiene Z b ( ) uv dx = 0; a ed essendo per ipotesi 6= si ha Rb a uv dx = 0; che è l’ortogonalità voluta. Il problema dell’esempio iniziale rientra evidentemente in questo caso, con p = = 1; q = 0. Ci sono altri esempi di problemi di Sturm-Liouville che si incontrano nelle applicazioni (ad esempio, ma non solo, risolvendo per separazione di variabili dei problemi ai limiti per equazioni a derivate parziali). Il Teorema 19.6 descrive in un certo senso la “situazione ideale”. Purtroppo spesso i problemi di Sturm-Liouville che nascono dalle applicazioni per un motivo o per l’altro non soddisfano tutte le ipotesi di quel teorema (e si dicono allora problemi di Sturm-Liouville singolari ); in vari casi signi…cativi, comunque, si riesce ancora a dimostrare, con tecniche ad hoc, che gli stessi risultati valgono ancora. Presentiamo tre problemi di Sturm-Liouville singolari che hanno applicazioni importanti. 1. Equazione di Legendre. 1 x2 y 00 2xy 0 + y = 0 per x 2 ( 1; 1) (19.10) che si può riscrivere nella forma 1 x2 y 0 0 + y = 0. Si tratta di un problema di Sturm-Liouville su [ 1; 1] con p (x) = 1 x2 ; q (x) = 0; (x) = 1. Il problema è reso singolare dal fatto che il coe¢ ciente p (x) si annulla negli estremi del segmento. La funzione peso è 1, quindi lo spazio di Hilbert da considerare è L2 ( 1; 1) (con la misura di Lebesgue dx). Rivisitando la dimostrazione precedente di ortogonalità si osserva che in questo caso non occorre imporre le condizioni y ( 1) = 0 = y (1) per ottenere l’ortogonalità di autofunzioni relative ad autovalori diversi. Infatti il termine di integrazione 1 [pu0 v pv 0 u] 1 è nullo a grazie a p (x). Si dimostra il seguente teorema: Teorema 19.7 L’equazione di Legendre ha soluzioni C 1 [ 1; 1] solo in corrispondenza di una successione di autovalori n = n (n + 1) per n = 0; 1; 2; 3; ::: ; detta Pn (x) l’autofunzione corrispondente a n , si ha che: Pn (x) è un polinomio di grado n; 1 il sistema fPn (x)gn=0 è ortonormale completo in L2 ( 1; 1). 193 Dimostrazione. Cerchiamo soluzioni dell’equazione in forma di serie di potenze (metodo di Frobenius): y (x) = y 0 (x) = y 00 (x) = 1 X n=0 1 X n=1 1 X cn xn ncn xn n (n 1 1) cn xn 2 n=2 e sostituiamo nell’equazione: 0 = 1 x2 y 00 2xy 0 + y 1 1 X X = n (n 1) cn xn 2 n (n = n=2 1 X 1) cn xn n=2 n (n + 2) (n + 1) cn+2 x n=0 2 1 X ncn xn + n=1 1 X n (n n 1) cn x 1 X cn xn n=0 2 n=2 1 X n ncn x + n=1 1 X cn xn : n=0 Uguagliando a zero il coe¢ ciente di xn per ciascun n si ottengono le seguenti (il modo in cui gli indici variano nelle diverse serie costringe a distinguere i casi n = 0, n = 1, n 2): (n + 2) (n + 1) cn+2 ossia cn+2 = n (n 2c2 + c0 = 0 6c3 2c1 + c1 = 0 1) cn 2ncn + cn = 0 [n (n + 1) ] cn per n = 0; 1; 2; ::: (n + 2) (n + 1) (19.11) Questo mostra che possiamo scegliere liberamente i coe¢ cienti c0 ; c1 , dopo di che la soluzione risulta determinata. Dunque per ciascun …ssato si può scrivere l’integrale generale dell’equazione, dipendente da due costanti arbitrarie. Le due soluzioni indipendenti saranno una una serie di potenze dispari, l’altra una serie di potenze pari. Occorre però controllare che le serie di potenze che assegnano la soluzione in e¤etti convergano. Poiché cn+2 [n (n + 1) ] = ! 1; cn (n + 2) (n + 1) leggiamo due cose: le serie di potenze hanno raggio 1, quindi in e¤etti si è scritto l’integrale generale in ( 1; 1); d’altro canto per x ! 1 in generale sarà y (x) illimitata. 194 Il nostro problema agli autovalori, invece, per sua natura ci richiede di determinare soluzioni che siano regolari in tutto [ 1; 1] (come vedremo, è questo quello che serve quando l’equazione di Legendre nasce nel risolvere un problema di¤erenziale più complesso). Osservando ancora la formula (19.11) che assegna i coe¢ cienti si vede che la serie termina se = n (n + 1). In questo caso si trova una sola soluzione limitata, polinomio di grado n: il polinomio di Legendre Pn (x). Abbiamo così determinato autovalori e autosoluzioni; l’ortogonalità segue dalla dimostrazione generale già fatta per un problema di Sturm-Liouville regolare. La completezza segue dal seguente argomento. E’ noto che lo spazio dei polinomi è denso nello spazio C 0 [ 1; 1] (teorema di Stone-Weierstrass); è anche noto che lo spazio C 0 [ 1; 1] è denso in L2 [ 1; 1]; ne segue che lo spazio dei polinomi è denso in L2 [ 1; 1]; dunque ogni funzione L2 [ 1; 1] può essere approssimato bene quanto vogliamo mediante polinomi, e quindi combinazioni lineari di polinomi di Legendre. Perciò il sistema dei polinomi di Legendre è completo. Sappiamo dunque che: 1 0 x2 Pn0 (x) + n (n + 1) Pn (x) = 0. Sapendo che Pn sono polinomi e sono ortonormali in L2 ( 1; 1) possiamo anche determinare esplicitamente questi polinomi, con una procedura iterativa, ortonormalizzando il sistema di polinomi 1; x; x2 ; x3 ; ::: . Si trova: 1 P0 (x) = p ; 2 r 3 P1 (x) = x; 2 r 1 5 P2 (x) = 3x2 1 ; 2 2 r 7 3 5 P3 (x) = x + x3 ; 2 2 2 ::: Si può dimostrare anche la seguente formula generale: q n + 12 dn n Pn (x) = x2 1 : 2n n! dxn I polinomi di Legendre, come molte altre funzioni speciali, si trovano implementati in software di calcolo scienti…co oltre che riportati e tabulati su molti testi. 195 Di seguito i gra…ci dei primi 6 polinomi Pn (x) (n = 0; 1; 2; 3; 4; 5). Si noti che Pn (x) ha n zeri in [ 1; 1]. Il fatto di conoscere un sistema ortonormale completo in L2 [ 1; 1] costituito da polinomi o¤re un metodo per approssimare una generica funzione L2 [ 1; 1] mediante polinomi di grado n. Anche se l’approssimazione è in L2 [ 1; 1], quando la funzione da approssimare è continua o regolare ci aspettiamo una buona approssimazione anche puntuale, che sarà di tipo globale sull’intervallo [ 1; 1], anziché di tipo locale come ad esempio l’approssimazione mediante il polinomio di Taylor. I polinomi di Legendre sono quindi importanti nella teoria dell’approssimazione di funzioni, oltre al fatto che l’equazione di Legendre compare come sottoproblema nella risoluzione di certi problemi ai limiti per equazioni a derivate parziali mediante separazione di variabili. Data una funzione f 2 L2 [ 1; 1] ; i suoi coe¢ cienti di Fourier rispetto al 1 sistema fPn (x)gn=0 sono de…niti da: cn = Z 1 f (y) Pn (y) dy 1 e portano allo sviluppo f (x) = 1 X cn Pn (x) : n=0 196 Esempio 19.8 Sia f (x) = ex sin x: Calcoliamo la somma parziale n = 4 della serie di f (x) in polinomi di Legendre. Si trova: Il ra¤ ronto tra i gra…ci di f e P4 n=0 cn Pn 197 (x) è il seguente: 2. Equazione di Laguerre. xy 00 + (1 x) y 0 + y = 0 per x 2 (0; +1) che si può riscrivere nella forma xe x 0 0 y + e x y = 0 per x 2 (0; +1) : Si tratta di un problema di Sturm-Liouville su (0; +1) con p (x) = (xe x ) ; q (x) = 0; (x) = e x . Il problema è reso singolare dal fatto che l’equazione non è su un segmento ma su una semiretta e il coe¢ ciente p (x) si annulla in 0 e a +1. La funzione peso è e x , quindi lo spazio di Hilbert da considerare è L2 ((0; +1) ; e x dx). Anche in questo caso non occorre imporre condizioni agli estremi per ottenere l’ortogonalità di autofunzioni relative ad autovalori diversi. Si dimostra il seguente teorema: Teorema 19.9 L’equazione di Laguerre ha soluzioni in L2 ((0; +1) ; e x dx) (cioè: che all’in…nito non vanno +1 troppo rapidamente) solo in corrispondenza di una successione di autovalori n = n per n = 0; 1; 2; 3; ::: La soluzione Ln (x) dell’equazione di Laguerre corrispondente a n = n è un polinomio di 1 grado n; il sistema fLn (x)gn=0 è ortonormale completo in L2 ((0; +1) ; e x dx). Dimostrazione (traccia). La tecnica della dimostrazione, nella sua parte costruttiva, è simile a quella vista per l’equazione di Legendre: si cerca una soluzione per serie, si ottiene una legge ricorsiva sui coe¢ cienti, in questo caso: cn+1 = Poiché n 2 cn : (n + 1) cn+1 cn 1 ! 0; n la serie di potenze converge in tutto R, ossia una soluzione regolare su tutto 1 1 (0; +1) si trova per ogni ; però la stima cn+1 cn n porta cn n! e quindi una x 2 soluzione con crescita del tipo e , che pertanto non sarebbe L ((0; +1) ; e x dx); per ottenere l’appartenenza a questo spazio è necessario che la serie termini, il che accade per = n intero non negativo. In questo caso la soluzione è un polinomio di grado n. La dimostrazione già vista prova l’ortogonalità. Non discutiamo del modo in cui si dimostra la completezza. Esplicitamente, il teorema a¤erma che: x xe con Z 0 L0n (x) + ne x Ln (x) = 0 per x 2 (0; +1) +1 Ln (x) Lm (x) e x dx = 0 198 1 se n = m 0 se n 6= m. Anche in questo caso è possibile scrivere i primi polinomi di Laguerre ortonormalizzando le funzioni 1; x; x2 ; x3 ; ::: nello spazio L2 ((0; +1) ; e x dx). Si trova: L0 (x) = 1 L1 (x) = 1 x; x2 ; 2 3 3x + x2 2 L2 (x) = 1 2x + L3 (x) = 1 x3 ; 6 ::: Si dimostra anche la seguente formula esplicita: Ln (x) = ex dn e n! dxn Data una funzione f 2 L2 ((0; +1) ; e 1 al sistema fLn (x)gn=0 sono dati da cn = Z x x n x . dx) ; i suoi coe¢ cienti di Fourier rispetto +1 f (x) Ln (x) e x dx 0 e portano allo sviluppo f (x) = 1 X cn Ln (x) n=0 Si ri‡etta sul fatto che quando una funzione f viene approssimata in L2 ((0; +1) ; e con la somma parziale Sn della sua serie di polinomi di Laguerre, ciò che viene reso piccolo è l’integrale: Z +1 2 jf (x) Sn (x)j e x dx 0 perciò dal punto di vista visivo è meglio confrontare il gra…co di f (x) e x=2 con quello di Sn (x) e x=2 (il quadrato di questa di¤erenza è piccola). Le funzioni (non polinomiali) Ln (x) e x=2 si dicono funzioni di Laguerre. I loro gra…ci per i primi valori di n sono i seguenti. 199 x dx) Si osservi che Ln (x) ha n zeri in (0; +1): Esempio 19.10 Sia f (x) = x sin x: Calcoliamo la somma parziale n = 10 della serie di f in polinomi di Laguerre. Il ra¤ ronto tra il gra…co di f (x) e x=2 P10 e n=0 cn Ln (x) e x=2 è il seguente: 200 3. Equazione di Hermite. E’l’equazione: y 00 2xy 0 + y = 0 per x 2 R che si può riscrivere nella forma e 0 x2 0 y + e x2 y=0 2 Si tratta di un problema di Sturm-Liouville su R con p (x) = e x ; (x) = e reso singolare dal fatto che l’equazione non è sul segmento ma sulla retta. x2 , 2 Teorema 19.11 L’equazione di Hermite ha soluzioni che in L2 R; e x dx (cioè: che all’in…nito non vanno +1 troppo rapidamente) solo in corrispondenza di una successione di autovalori n = 2n per n = 0; 1; 2; 3; ::: La soluzione Hn (x) dell’equazione di Hermite corrispondente a n = 2n è un polinomio di 2 1 grado n; il sistema fHn (x)gn=0 è ortonormale completo in L2 R; e x dx . Dimostrazione (traccia). La tecnica della dimostrazione è ancora simile: si cercano soluzioni per serie di potenze, si arriva alla seguente legge ricorsiva sui coe¢ cienti: (2n ) cn+2 = cn . (n + 2) (n + 1) Poiché cn+2 (2n ) = ! 0; cn (n + 2) (n + 1) per il criterio del rapporto la serie di potenze converge su tutto R. Quindi per ogni esistono due soluzioni linearmente indipendenti de…nite su tutto R. Se = 2n per n intero non negativo, allora la serie termina e diventa un polinomio di grado k. Se la serie non termina, un’analisi dell’ordine di grandezza dei coe¢ cienti mostra che la soluzione all’in…nito crescerebbe più velocemente di 2 2 ex =2 , quindi non apparterrebbe a L2 R; e x dx . Le uniche soluzioni in questo spazio sono quindi quelle polinomiali corrispondenti a = 2n: L’ortogonalità segue come nell’argomento generale, sfruttando il fatto che il coe¢ ciente p (x) si annulla a 1. Non discutiamo la dimostrazione di completezza. Esplicitamente, il teorema a¤erma che: e con Z x2 Hn0 (x) 0 + 2ne +1 Hn (x) Hm (x) e x2 1 201 x2 dx = Hn (x) = 0 1 se n = m 0 se n 6= m. Anche in questo caso è possibile scrivere i primi polinomi di Laguerre ortonor2 malizzando le funzioni 1; x; x2 ; x3 ; ::: nello spazio L2 R; e x dx . Si trova: 1 H0 (x) = H1 (x) = 1=4 p 2 1=4 x; 2 + 4x2 p ; 2 2 1=4 12x + 8x3 p ; H3 (x) = 4 3 1=4 ::: H2 (x) = Si dimostra anche la seguente formula esplicita: n n 2 d ( 1) ex e Hn (x) = pp dxn 2n n! Data una funzione f 2 L2 R; e sistema 1 fHn (x)gn=0 x2 x2 . dx ; i suoi coe¢ cienti di Fourier rispetto al sono dati da Z cn = +1 x2 f (x) Hn (x) e dx 1 e portano allo sviluppo f (x) = 1 X cn Hn (x) n=0 2 Ancora, quando una funzione f viene approssimata in L2 R; e x dx con la somma parziale Sn della sua serie di polinomi di Hermite, ciò che viene reso piccolo è l’integrale: Z +1 1 jf (x) 2 Sn (x)j e x2 dx 2 perciò dal punto di vista visivo è meglio confrontare il gra…co di f (x) e x =2 con 2 quello di Sn (x) e x =2 (il quadrato di questa di¤erenza è piccola). Le funzioni (non polinomiali) 2 Hn (x) e x =2 si dicono funzioni di Hermite. I loro gra…ci per i primi valori di n sono i seguenti. 202 Si osservi che Hn (x) ha n zeri in R. Esempio 19.12 Sia f (x) = ex sin x. Calcoliamo la somma parziale Sn (x) per n = 5 della serie di f (x) in polinomi di Hermite. Il ra¤ ronto tra i gra…ci di 2 2 f (x) e x =2 e Sn (x) e x =2 è il seguente: 203 19.3 19.3.1 Applicazioni dei polinomi ortogonali in problemi ai limiti per equazioni a derivate parziali Laplaciano in coordinate sferiche e polinomi di Legendre Consideriamo il problema di Dirichlet per l’equazione di Laplace su una sfera tridimensionale: u uxx + uyy + uzz = 0 per x2 + y 2 + z 2 < r2 u (x; y; z) = f (x; y; z) per x2 + y 2 + z 2 = r2 : Tra i signi…cati …sici di quest’equazione: u può essere il potenziale (elettrostatico o gravitazionale) all’interno della sfera, …ssato il suo valore sul bordo, in una situazione stazionaria in cui all’interno della sfera non ci sono pozzi o sorgenti del campo (cioè cariche o masse, rispettivamente); oppure u può essere la temperatura, in stato stazionario, all’interno della sfera, nota la temperatura al bordo, in assenza di sorgenti o pozzi di calore interni. Data la geometria sferica, è naturale riscrivere l’operatore di¤erenziale in coordinate sferiche ( ; #; ') e cercare poi soluzioni a variabili separate nelle coordinate sferiche. Il laplaciano in coordinate sferiche assume la forma: 8 per 0 < < r; > > @ 2 u 2 @u 1 @ @u 1 @2u > > 0<#< ; + + sin # + = 0 < 2 sin # @# 2 sin2 # @' @ 2 @ @# 0<'<2 > > per 0 < # < ; > > : u (r; #; ') = f (#; ') 0<'<2 : Consideriamo ora la situazione sempli…cata in cui il dato al bordo f non dipende dalla longitudine ' ma solo dalla colatitudine #. Conseguentemente, ci aspettiamo che la soluzione u sia pure indipendente da '. Il problema precedente si riscrive quindi nella seguente forma sempli…cata: 8 2 1 @ @u < @ u 2 @u + + 2 sin # = 0 per 0 < < r; 0 < # < @ 2 @ sin # @# @# : u (r; #) = f (#) per 0 < # < : (19.12) Ci concentriamo per semplicità sulla risoluzione del problema (19.12). Il problema generale (con dato e soluzione dipendente anche da ') si può trattare con tecniche simili ma più elaborate. Cerchiamo quindi soluzioni a variabili separate u ( ; #) = R ( ) (#) . Sostituendo nell’equazione si ha: R00 2 + R0 + 2 1 @ R (sin # 0 ) = 0 sin # @# 00 R0 2R +2 = R R 204 1 @ (sin # sin # @# 0 ): Il primo membro è funzione della sola ; il secondo della sola #; quindi ciascun membro dev’essere costante e otteniamo, per qualche 2 R da determinarsi, 2R 00 +2 R 1 @ (sin # sin # @# R0 = R 0 )= : La prima equazione si riscrive 2 R00 + 2 R0 R=0 (19.13) ed è un’equazione di Eulero, di cui si può determinare in corrispondenza di ciascun l’integrale generale, cercando soluzioni del tipo R ( ) = con da determinarsi (v. [2, Cap.1, §1.2.D]); lo faremo dopo aver determinato . Invece, l’altra equazione diventa sin # 00 (#) + cos # 0 (#) = sin # (#) per # 2 [0; ] : (19.14) Si ricordi che l’angolo # ha il signi…cato di colatitudine. La (#) non deve soddisfare condizioni di periodicità, ma dev’essere regolare su tutto [0; ] (in particolare, limitata anche agli estremi). L’equazione (19.14) si può riscrivere in una forma più familiare eseguendo il cambio di variabili: (#) = P (cos #) ; cos # = t: Si ha infatti: 0 00 (#) = sin #P 0 (cos #) (#) = sin2 #P 00 (cos #) cos #P 0 (cos #) e sostituendo nella (19.14) sin # sin2 #P 00 (cos #) cos #P 0 (cos #) + cos # [ sin #P 0 (cos #)] + sin #P (cos #) = 0 sin3 #P 00 (cos #) 2 sin # cos #P 0 (cos #) + sin #P (cos #) = 0 sin2 #P 00 (cos #) 1 2 cos #P 0 (cos #) + P (cos #) = 0 t2 P 00 (t) 2tP (t) + P (t) = 0: L’ultima equazione trovata è l’equazione di Legendre su [ 1; 1] (si ricordi che t = cos # 2 [ 1; 1]). Poiché vogliamo soluzioni limitate su tutto [ 1; 1] è necessario che sia: = n (n + 1) ; n = 0; 1; 2; ::: P (t) = Pn (t) ; n-esimo polinomio di Legendre. Quindi le soluzioni della (19.14) sono: n (#) = Pn (cos #) : 205 Risolviamo ora l’equazione di Eulero (19.13) per 2 Cerchiamo R ( ) = 2 ( R00 + 2 R0 = n (n + 1): n (n + 1) R = 0: . 2 1) 1 +2 ( n (n + 1) =0 1) + 2 n (n + 1) = 0 ( + 1) n (n + 1) = 0 = n; = (n + 1) che dà soluzioni R( ) = n ;R( ) = (n+1) per n = 0; 1; 2; 3::: Escludendo le soluzioni R ( ) = (n+1) illimitate nell’origine si ottengono in de…nitiva le seguenti soluzioni regolari a variabili separate dell’equazione di Laplace indipendente dalla longitudine: un ( ; #) = cn n Pn (cos #) ; per n = 0; 1; 2; 3::: Si tratta ora, al solito, di formare una soluzione data da una serie in…nita di queste soluzioni e cercare di imporre il dato al bordo scegliendo opportunamente i coe¢ cienti: 1 X u ( ; #) = cn n Pn (cos #) u (r; #) = n=0 1 X n=0 cn rn Pn (cos #) = f (#) per # 2 [0; ] . Si tratta di sviluppare il dato f (#) in serie di Legendre a questo modo. C’è di mezzo un cambio di variabile. Osserviamo infatti che: Z 1 Z Pn (t) Pm (t) dt = [t = cos #] = Pn (cos #) Pm (cos #) sin #d#; 1 0 da cui leggiamo che: 1 il sistema fPn (cos #)gn=0 è ortonormale completo in L2 ([0; ] ; sin #d#) : Quindi possiamo porre: Z Cn = f (s) Pn (cos s) sin sds per n = 0; 1; 2; 3::: f (#) = 0 1 X Cn Pn (cos #) = n=0 1 X cn rn Pn (cos #) per cn = n=0 (19.15) Cn . rn In de…nitiva, la soluzione del problema (19.12) è data da: u ( ; #) = 1 X n=0 n Cn r Pn (cos #) con Cn dati da (19.15). 206 Esempio 19.13 Risolviamo il problema (19.12) con f (#) = sin2 #. Poiché ponendo t = cos # si ha: r 2 2 2p 2 2P0 (t) P2 (t) ; f (t) = 1 t = 3 3 5 si ha r 2 2 2 2p u ( ; #) = 2P0 P2 (cos #) 3 3 5 r 2 1 3 2 2 = + cos2 # : 3 3 r 2 2 In questo paragrafo abbiamo trattato l’equazione di Laplace in coordinate sferiche supponendo per semplicità che la soluzione non dipenda dalla longitudine. Nel caso generale l’integrazione del problema agli autovalori porta ad un sistema a due indici di autofunzioni, dette funzioni di Legendre, e imparentate con i polinomi di Legendre. 19.3.2 Oscillatore armonico quantistico e polinomi di Hermite In meccanica quantistica una particella di massa m in moto lungo una retta è descritta da una funzione di stato (x; t), nota la quale si può calcolare la probabilità che la particella si trovi all’istante t nell’intervallo (a; b) come l’integrale Z b 2 j (x; t)j dx: a Per il suo signi…cato di probabilità, (x; t) deve soddisfare la condizione di normalizzazione Z 2 j (x; t)j dx = 1: R La funzione (x; t) soddisfa l’equazione di Schrödinger che, nel caso la particella di massa m sia soggetta ad un campo di forze di potenziale V (x), è: i~ @ (x; t) = @t (dove ~ = h=2 separate: ~2 @ 2 (x; t) + V (x) 2m @x2 (x; t) per x 2 R; t 2 R e h è la costante di Planck). Cerchiamo soluzioni a variabili (x; t) = X (x) T (t) i~XT 0 = i~ T0 = T ~2 00 X T + V (x) XT 2m ~2 X 00 + V (x) 2m X 207 da cui dev’essere i~ T0 = E = cost. T ~2 X 00 + V (x) = E = cost. 2m X per qualche costante E 2 R; che dimensionalmente ha il signi…cato di energia. L’equazione in T si risolve direttamente T (t) = ce iE ~ t : Poiché jT (t)j = c, la condizione di normalizzazione si traduce in Z 2 jX (x)j dx = cost. R Ci interessa quindi determinare le autosoluzioni L2 (R) dell’equazione: X 00 + 2m (E ~2 V (x)) X = 0 in R. Sottolineiamo il fatto che l’appartenenza a L2 (R) della soluzione X (x) che stiamo cercando è una condizione necessaria per la sensatezza …sica del problema così impostato. Consideriamo ora il caso particolare dell’oscillatore armonico (quantistico, unidimensionale), per il quale V (x) = 1 m! 2 x2 : 2 Il modello dell’oscillatore oscillatore quantistico si applica ad esempio al moto di agitazione termica degli atomi formanti un reticolo cristallino. L’equazione diventa: 2m m2 ! 2 2 E x X (x) = 0: (19.16) X 00 (x) + ~2 ~2 Per risolverla, l’idea è ricondursi all’equazione di Hermite. Si procede in due passi. 1. Per prima cosa vogliamo fare un cambio di variabile che renda uguale a 1 il coe¢ ciente di x2 . Sia X (x) = Z ( x) con da determinarsi, allora 2 Z 00 ( x) + 2m E ~2 m2 ! 2 2 x Z ( x) = 0: ~2 2m E ~2 m2 ! 2 2 y Z (y) = 0: 2 ~2 Poniamo x = y e abbiamo 2 Z 00 (y) + 208 Ora vogliamo che sia 2 4 m2 ! 2 2 ~2 m2 ! 2 = 2 r~ m! = : ~ = Perciò X (x) = Z r m! x ~ risolve l’equazione (19.16) se e solo se Z (y) risolve l’equazione: m! 00 Z (y) + ~ 2m E ~2 Z 00 (y) + m! 2 y Z (y) = 0 ~ 2 E !~ y 2 Z (y) = 0: (19.17) 2. Ora trasformiamo questa equazione in quella di Hermite ponendo: Z (y) = e Z 0 (y) = e Z 00 (t) = e e y2 2 y2 Y 2yY 0 y2 2 y2 2 y2 2 Y (y) : ( yY + Y 0 ) y2 Y 2 E y2 Y = 0 !~ 2 2yY 0 + E 1 Y = 0: !~ yY 0 Y yY 0 + Y 00 Y + Y 00 + Y 00 (19.18) Dunque Z (y) risolve (19.17) se e solo se Y (y) risolve (19.18). La condizione di normalizzazione su Y si legge al modo seguente: dev’essere …nito l’integrale r r Z Z Z 2 ~ m! 2 2 jZ (y)j dy = jX (x)j dx = Z x dx = m! R ~ R R r Z 2 ~ 2 = e y jY (y)j dy: m! R Quindi siamo interessati a individuare autosoluzioni Y e autovalori di Hermite Y 00 2yY 0 + Y = 0 per cui si abbia Z R e y2 2 jY (y)j dy < 1: 209 dell’equazione Abbiamo visto (Teorema 19.11) che questa condizione può essere soddisfatta solo per = 2n e Y (y) = Hn (y) ; n-esimo polinomio di Hermite. Questo signi…ca che i possibili valori dell’energia sono: 2 E !~ 1 = 2n En = n+ 1 2 !~ con n = 0; 1; 2; 3; ::: e le autosoluzioni corrispondenti sono Yn (y) = Hn (y) ; corrispondenti a Zn (y) = e y2 2 Hn (y) ; e quindi per l’equazione iniziale: Xn (x) = e m!x2 2~ Hn r m! x : ~ Se i polinomi di Hermite Hn sono quelli normalizzati in modo da avere norma 2 1 in L2 R; e y dy , allora l’autofunzione normalizzata sarà: Xn (x) = r m! e ~ m!x2 2~ Hn r m! x ~ per n = 0; 1; 2; ::: Si trova quindi che l’oscillatore possiede una successione di possibili livelli energetici En e corrispondenti stati stazionari Xn (x), che vanno dallo stato fondamentale n = 0; m!x2 !~ 1 E0 = ; X0 (x) = 1=4 e 2~ 2 ai successivi “stati eccitati” per n 1, ad esempio p m!x2 3 2 m! E1 = !~; X1 (x) = 1=4 xe 2~ : 2 ~ 2 2 E’signi…cativo osservare anche i gra…ci delle funzioni jXn (x)j e x , che rappresentano le densità di probabilità del sistema nei vari stati stazionari: 210 L’equazione in t è risolta da 1 T (t) = ce i(n+ 2 )!t : L’equazione di Schrödinger ha quindi soluzioni a variabili separate r r m! m!x2 m! i(n+ 12 )!t e 2~ Hn x n (x; t) = e ~ ~ e la soluzione dell’equazione di Schrödinger con dato iniziale 0 (x) è data allora da una serie: r r 1 X 1 m! m!x2 m! e 2~ Hn x (x; t) = cn e i(n+ 2 )!t ~ ~ n=0 con 0 (x) = cn = 1 X cn n=0 Z +1 1 r r m! m!x2 m! 2~ e Hn x , quindi ~ ~ r r m! m!z2 m! 2~ e Hn z dz: 0 (z) ~ ~ 19.4 Il problema agli autovalori per il laplaciano e le sue applicazioni 19.4.1 Separazione di variabili per le equazioni del calore o delle onde Supponiamo di voler studiare l’equazione della di¤usione del calore, in assenza di sorgenti, in una regione limitata del piano o dello spazio. L’equazione sarà quindi: ut = k u per x 2 ; t > 0: 211 (Indichiamo con x il punto generico del dominio bi o tri dimensionale ad essere nota la condizione iniziale ). Oltre u (x; 0) = u0 (x) in potranno essere imposte delle condizioni al contorno, ad esempio: u (x; t) = 0 per x 2 @ (condizione di temperatura …ssata al bordo), oppure @u (x; t) = 0 per x 2 @ @ (condizione di isolamento termico: la derivata normale è nulla al bordo, ossia il ‡usso di calore è nullo). Complessivamente quindi parliamo di problema di Cauchy-Dirichlet per l’equazione del calore: 8 per x 2 ; t > 0 < ut = k u u (x; t) = 0 per x 2 @ ; t > 0 (19.19) : u (x; 0) = u0 (x) per x 2 oppure di problema di Cauchy-Neumann per l’equazione del calore: 8 per x 2 ; t > 0 < ut = k u @u (x; t) = 0 per x 2 @ ;t > 0 : @ u (x; 0) = u0 (x) per x 2 : (19.20) Problemi analoghi si possono considerare per l’equazione delle onde in due o tre variabili. In due variabili l’equazione rappresenta le vibrazioni di una membrana elastica, mentre in tre variabili potrebbe rappresentare le vibrazioni sonore nell’aria, o simili. Stando, per …ssare le idee, sull’interpretazione bidimensionale come membrana vibrante, se la membrana è …ssata al bordo e sono note posizione e velocità iniziali avremo un problema di Cauchy-Dirichlet per l’equazione delle onde: 8 utt = c2 u per x 2 ; t > 0 > > < per x 2 @ ; t > 0 u (x; t) = 0 (19.21) 0) = u (x) per x 2 u (x; > 0 > : ut (x; 0) = v0 (x) per x 2 : I problemi (19.19), (19.20), (19.21) hanno alcune caratteristiche matematiche comuni: l’equazione di¤erenziale è lineare omogenea e le condizioni al contorno sono omogenee, quindi sovrapposizione di soluzioni di equazione+condizioni al bordo risolve ancora entrambe; inoltre, le variabili spazio e tempo si possono assumere variabili in domini separati: x 2 ; t > 0. Tutto ciò suggerisce che si possono cercare soluzioni a variabili separate in spazio e tempo, cioè del tipo: u (x; t) = X (x) T (t) : 212 Sostituendo ad esempio in (19.19) si trova: XT 0 = kT X T0 X (t) = (x) kT X da cui ogni membro dev’essere costante. Abbiamo allora: T0 = kT per t > 0 X + X = 0 in ; X = 0 su @ : Vediamo cioè che il problema (19.19) si spezza in un problema agli autovalori X (x) + X (x) = 0 X (x) = 0 x2 x2@ (19.22) e un’equazione in T; T 0 (t) = k T (t) , elementarmente integrabile una volta noto (19.20) porta al problema agli autovalori . In modo analogo, il problema X (x) + X (x) = 0 (x) = 0 @X @ x2 x2@ (19.23) e alla stessa equazione in T , e il problema (19.21) porta ancora al problema agli autovalori (19.22), e questa volta all’equazione in T T 00 (t) = c2 T (t) . In conclusione: problemi di Cauchy-Dirichlet o di Cauchy-Neumann per l’equazione del calore o delle onde portano, impostandone la risoluzione per separazione di variabili, a studiare come sottoproblema un problema agli autovalori per l’equazione di Laplace, su un dominio del piano o dello spazio, con condizioni al contorno di tipo Dirichlet o di tipo Neumann, cioè (19.22) o (19.23). Vale la pena quindi dedicare un po’di attenzione a questo problema agli autovalori di per sé, che si può vedere come un analogo in più variabili di quello che in una sola variabile sono i problemi di Sturm-Liouville che abbiamo considerato in precedenza. Si noti che per ora non abbiamo detto niente sul dominio (dimensioni, forma, regolarità...), tuttavia alcune proprietà di base si possono stabilire molto in generale. Teorema 19.14 Sia un dominio limitato del piano o dello spazio, regolare quanto basta perché ci si possa applicare il teorema della divergenza. Supponiamo che (X; ) e (Y; ) siano due coppie autofunzione-autovalore (X; Y ) che risolvono il problema (19.22) oppure il non identicamente nulle e C 2 problema (19.23). Allora: Z 6= =) X (x) Y (x) dx = 0: 213 cioè autofunzioni relative ad autovalori distinti sono tra loro ortogonali in L2 ( ). Inoltre gli autovalori sono positivi. Dimostrazione. Consideriamo le identità X (x) + X (x) = 0 Y (x) + Y (x) = 0: Moltiplichiamo la prima per Y; la seconda per X, sottraiamo e integriamo in Z Z ( ) X (x) Y (x) dx = (Y X X Y ) dx: : Ora trasformiamo l’integranda ricordando che: r (Y rX) = Y X + rX rY r (XrY ) = X Y + rY rX e quindi (Y X X Y ) = r (Y rX XrY ) e per il teorema della divergenza Z Z Z ( ) X (x) Y (x) dx = (Y X X Y ) dx = r (Y rX Z Z @X = (Y rX XrY ) d = Y @ @ @ XrY ) dx X @Y @ d =0 perché, a seconda delle condizioni al contorno che sto considerando, o X e Y @Y sono nulle su @ (problema di Dirichlet) o @X (problema @ ; @ sono nulle su @ di Neumann). Ne segue, essendo 6= ; che Z X (x) Y (x) dx = 0: Proviamo la positività degli autovalori. Moltiplichiamo l’equazione X (x) + X (x) = 0 per X e integriamo in : Z Z Z Z 2 2 X X (x) dx = jrX (x)j dx r (XrX) dx X (x) dx = Z Z Z @X 2 2 = jrX (x)j dx X d = jrX (x)j dx @ @ di nuovo per le condizioni al contorno, che comportano l’annullarsi dell’integrale di bordo. Quindi: R 2 jrX (x)j dx = R > 0: 2 X (x) dx 214 I risultati appena visti e l’analogia con quanto accade per i problemi di Sturm-Liouville suggeriscono che ci si possa aspettare, almeno per domini “buoni”, l’esistenza di una successione di autovalori e una famiglia di autofunzioni corrispondenti, che risultino formare un sistema ortonormale completo di L2 ( ). Se e quando così accade, il problema (19.19), ad esempio, avrà soluzioni a variabili separate del tipo: un (x; t) = Xn (x) e k nt e quindi potremo cercare una soluzione u (x; t) = 1 X cn Xn (x) e k nt (19.24) n=0 imponendo u0 (x) = 1 X cn Xn (x) n=0 ossia pur di saper sviluppare u0 in serie di autofunzioni del laplaciano. Analoghi procedimenti valgono per l’equazione delle onde: il problema (19.21) avrà soluzioni a variabili separate del tipo: h i p p un (x; t) = Xn (x) an cos c (19.25) n t + bn sin c nt e quindi potremo cercare una soluzione u (x; t) = X0 (x) + 1 X n=1 h p Xn (x) an cos c nt p + bn sin c nt i imponendo u0 (x) = X0 (x) + 1 X an Xn (x) n=1 v0 (x) = 1 X n=1 p bn c n Xn (x) ossia pur di saper sviluppare u0 e v0 in serie di autofunzioni del laplaciano. Tutta la discussione precedente mostra quindi che è utile studiare il problema agli autovalori per il laplaciano su vari domini del piano e dello spazio e stabilire se e quando questo possiede un sistema ortonormale completo di autosoluzioni. Quando la geometria di è semplice, il problema agli autovalori può essere a sua volta impostato mediante separazione di variabili. In un piccolo numero di geometrie semplici questi problemi sono stati sviscerati classicamente: se è un rettangolo, un cerchio, una sfera, un cilindro, di questi problemi si sa tutto; le autofunzioni sono scritte esplicitamente in termini di opportune 215 funzioni speciali, gli autovalori sono noti in forma esatta. Per domini più generali ciò che è possibile fare è da una parte dimostrare teoremi di esistenza sotto opportune ipotesi, d’altro canto sviluppare metodi di calcolo numerico approssimato di autofunzioni e autovalori. Nel seguito di questo paragrafo tratteremo le due situazioni geometricamente più semplici: rettangolo e cerchio. Ritorneremo brevemente su questo problema in seguito, dopo che avremo sviluppato il quadro concettuale moderno in cui teoremi di esistenza di questo tipo possono essere enunciati. 19.4.2 L’equazione di Helmholz sul rettangolo L’equazione u+ u=0 è detta anche equazione di Helmholz. Studiamola sul rettangolo, con condizione al contorno di Dirichlet nulla: 8 0 x a; 0 y b < uxx + uyy + u = 0 u (0; y) = u (a; y) = 0 0 y b : u (x; 0) = u (x; b) = 0 0 x a: Impostiamo il problema per separazione delle variabili, cercando u (x; y) = X (x) Y (y) : Si trova: X 00 Y + XY 00 + XY = 0 X 00 = X + Y 00 Y e ciascuno dei due membri dev’essere costante, poiché il primo è funzione di x e il secondo di y. Quindi per qualche reale si ha, tenendo conto anche delle condizioni al contorno: X 00 = X X (0) = X (a) = 0 Y 00 = ( + )Y Y (0) = Y (b) = 0: Si tratta di due problemi agli autovalori, distinti e simili. Il primo, in X; come soluzioni: Xn (x) = sin n x ; a = n a 2 , n = 1; 2; 3; ::: Il secondo, in Y; , ha come soluzioni Ym (x) = sin m y ; b 216 = m b 2 ha il che porta in de…nitiva a una successione a due indici di autovalori e autofunzioni: m y n x sin a b n 2 m 2 = + = a b un;m (x; y) = sin n;m 2 n2 m2 + a2 b2 . Si noti che abbiamo e¤ettivamente ottenuto una successione di autofunzioni che costituisce un sistema ortonormale completo di L2 ([0; a] [0; b]) con una successione di autovalori che tende a +1. Se ad esempio stessimo risolvendo questo problema per risolvere poi il problema di Cauchy-Dirichlet (19.21) per l’equazione delle onde avremmo, in base alla discussione fatta in precedenza e alla (19.25) 1 X n x m y sin a b n;m=1 " ! !# r r m2 m2 n2 n2 an;m cos c + 2 t + bn;m sin c + 2t ; a2 b a2 b u (x; y; t) = sin nella quale potremmo determinare i coe¢ cienti an;m ; bn;m per soddisfare le condizioni iniziali. Si osservi che le frequenze proprie di vibrazione della membrana sono i numeri r m2 c n2 + 2: 2 2 a b Se stessimo risolvendo il problema agli autovalori per risolvere poi il problema di Cauchy-Dirichlet (19.19) per l’equazione del calore avremmo, in base alla discussione fatta in precedenza e alla (19.24) u (x; y; t) = 1 X n;m=1 cn;m sin n x m y sin e a b k 2 n2 a2 2 +m b2 t ; nella quale potremmo determinare i coe¢ cienti cn;m per soddisfare la condizione iniziale. 19.4.3 L’equazione di Helmholz sul cerchio Studiamo ora l’equazione di Helmholz sul cerchio unitario, con condizione al contorno di Dirichlet nulla. Scrivendo il laplaciano in coordinate polari si ha: 8 2 1 @2u < @ u 1 @u + + + u = 0 0 < < 1; 0 # 2 2 @# (19.26) @ 2 @ : u (1; #) = 0 0 # 2 : 217 Separiamo le variabili cercando u ( ; #) = R ( ) R00 1 + R0 + 2 1 2 R 00 + R R0 R00 + + R R (#) : =0 2 00 = che porta a: 00 2 00 0 R + R + 2 = R = 0: La prima equazione, unita alla condizione di periodicità su n ; porta a (#) = an cos (n#) + bn sin (n#) = n2 ; n = 0; 1; 2; ::: e la seconda diventa 2 R00 + R0 + 2 n2 R = 0; problema agli autovalori in da risolversi per dizione al contorno nulla), e R (0) …nita. (19.27) 2 [0; 1], con R (1) = 0 (con- Equazione di Bessel ed autofunzioni sul cerchio Riscrivendo l’equazione (19.27) nella forma n2 R00 + R0 + R=0 e quindi 0 ( R0 ) + n2 R = 0 per 2 (0; 1) , si vede che si tratta di un problema di Sturm-Liouville singolare (il coe¢ ciente p ( ) = si annulla in 0). Da questa forma dell’equazione si legge che per autosoluzioni relative ad autovalori distinti sono ortogonali in L2 ((0; 1) ; d ). Si osservi che in questa equazione l’intero n = 0; 1; 2; ::: è …ssato (cioè: per ogni n stiamo studiando una diversa equazione); il numero che cerchiamo è senz’altro positivo perché per come è stato impostato il problema è un autovalore del Laplaciano. Siamo interessati a determinare le soluzioni R ( ) dell’equazione in (0; 1) che siano limitate in 0 e si annullino in 1. Si procede così: poniamo = ! 2 ed eseguiamo il cambio di variabili ! = x: d si ha: Poiché dd = ! dx 2 ! 2 R00 + !R0 + ! 2 2 x2 R00 + xR0 + x2 n2 R = 0; n2 R = 0 per x 2 (0; !) , con R (!) = 0; R (0) limitata. 218 L’equazione x2 R00 + xR0 + x2 n2 R = 0 per x 2 (0; +1) (19.28) si dice equazione di Bessel di ordine n = 0; 1; 2; 3; ::: A noi interessa risolverla in (0; !) imponendo la condizione R (!) = 0 (e la limitatezza in 0), ma poiché ! è ancora incognita, diciamo che ci interessa risolverla in (0; +1). Enunciamo senza dimostrazione una serie di proprietà che riguardano l’equazione di Bessel. 1. L’integrale generale dell’equazione di Bessel di ordine n ha la forma c1 Jn (x) + c2 Yn (x) dove Jn (x), detta funzione di Bessel di prima specie di ordine n = 0; 1; 2; :::; è regolare in [0; +1), mentre Yn (x), detta funzione di Bessel di seconda specie di ordine n = 0; 1; 2; :::; è regolare in (0; +1) ma illimitata in 0. Quindi la soluzione che ci interessa della (19.28) è R (x) = Jn (x). 2. La funzione Jn (x) ha in…nite oscillazioni in (0; +1) ; in particolare ha 1 una successione di zeri fkn;m gm=1 che tende a in…nito. Gra…ci delle funzioni Jn (x) per n da 0 a 5 219 Jn (x) ; n ! kn;m ; m # 1 2 3 4 0 1 2 3 4 5 2:405 5:520 8:654 11:792 3:832 7:016 10:173 13:324 5:136 8:417 11:620 14:796 6:380 9:761 13:015 16:223 7:588 11:065 14:372 17:616 8:771 12:339 15:700 18:980 Valori di alcuni zeri delle funzioni di Bessel Poiché vogliamo R (!) = 0 dovrà essere ! = kn;m per qualche m; 2 kn;m . ossia = Quindi, per ogni intero n = 0; 1; 2; :::; l’equazione (19.27) ha 1 2 soluzioni solo se è uno dei valori kn;m , e in tal caso la soluzione è m=1 R ( ) = Jn (kn;m ) . Gra…ci di J0 (k0;m x) per m = 1; 2; 3; 4: Gra…ci di J1 (k1;m x) per m = 1; 2; 3; 4: 220 Gra…ci di J2 (k2;m x) per m = 1; 2; 3; 4: 1 Per ciascun n …ssato il sistema (a un solo indice) fJn (kn;m )gm=1 è ortogonale completo in L2 ([0; 1] ; d ). L’ortogonalità è già stata dimostrata. Non dimostriamo la completezza. 3. Si hanno quindi le seguenti autosoluzioni a variabili separate di (19.26): Jn (kn;m ) cos (n#) per n = 1; 2; 3; ::: m = 1; 2; 3; ::: Jn (kn;m ) sin (n#) per n = 1; 2; 3; ::: m = 1; 2; 3; ::: J0 (k0;m ) per n = 1; 2; 3; ::: (19.29) 1 2 corrispondenti alla successione a due indici di autovalori kn;m . n=0;1;2;:::m=1;2;::: Gli autovalori sono i quadrati di tutti gli zeri di tutte le funzioni di Bessel di prima specie. Le autofunzioni (19.29) costituiscono un sistema ortogonale completo in L2 ([0; 1] [0; 2 ] ; d d#) ossia, passando in coordinate cartesiane, in L2 del cerchio unitario. Questo discende dal seguente argomento generale. 1 Sappiamo già che per ogni n …ssato fJn (kn;m )gm=1 è ortogonale completo 2 in L ([0; 1] ; d ); 1 sappiamo che fcos (n#) ; sin (n#) ; 1gn=1 è ortogonale completo in L2 ([0; 2 ] ; d#); 2 allora presa una funzione f 2 L ([0; 1] [0; 2 ] ; d d#) possiamo: 1. per …ssato sviluppare f in serie di Fourier rispetto a #: 1 A0 ( ) X f ( ; #) = + fAn ( ) cos (n#) + Bn ( ) sin (n#)g ; 2 n=1 1 ora per ogni n sviluppiamo An e Bn in serie rispetto al sistema fJn (kn;m )gm=1 , 1 e sviluppiamo A0 in serie rispetto al sistema fJ0 (k0;m )gm=1 . Otteniamo: 1 1 X a0;m J0 (k0;m ) + (19.30) 2 m=1 ( 1 ) 1 1 X X X + an;m Jn (kn;m ) cos (n#) + bn;m Jn (kn;m ) sin (n#) f ( ; #) = n=1 m=1 m=1 221 che è esattamente uno sviluppo rispetto al sistema (19.29), che pertanto risulta completo. Le funzioni (19.29) sono ortogonali complete ma non normalizzate. Per calcolare i coe¢ cienti di normalizzazione occorre sapere che: Z 1 1 2 2 Jn (kn;m ) d = Jn+1 (kn;m ) : 2 0 Tenuto conto di questo, i coe¢ cienti dello sviluppo (19.30) si calcolano così: an;m = 2 2 Jn+1 (kn;m ) Z 2 cos (n#) 0 Z 1 f ( ; #) Jn (kn;m ) d d# 0 per n = 0; 1; 2; :::; m = 1; 2; ::: Z 2 Z 1 2 bn;m = sin (n#) f ( ; #) Jn (kn;m ) d d# 2 Jn+1 (kn;m ) 0 0 per n = 1; 2; :::; m = 1; 2; ::: Si possono ora trarre conseguenze sulla soluzione di un problema di CauchyDirichlet per l’equazione del calore o delle onde sul cerchio. Ad esempio, per la membrana vibrante circolare con velocità iniziale nulla e posizione iniziale f ( ; #) si troverà soluzione: u (t; ; #) = + 1 1 X a0;m J0 (k0;m ) cos (k0;m ct) 2 m=1 1 X n=1 Jn (kn;m ) 1 X [an;m cos (n#) + bn;m sin (n#)] cos (kn;m ct) : m=1 In particolare, le frequenze proprie di vibrazione della membrana circolare …ssata al bordo risultano essere kn;m c : 2 Un caso particolarmente semplice ma interessante è quando la condizione iniziale è di tipo radiale. Si ha in tal caso: 1 1 X u (t; ; #) = a0;m J0 (k0;m ) cos (k0;m ct) 2 m=1 dove f( )= 1 1 X a0;m J0 (k0;m ) : 2 m=1 222 20 Esercizi sulla Parte 4 A. Metodo di separazione delle variabili Es 20.1 Risolvere col metodo di separazione delle variabili il seguente problema di Cauchy-Dirichlet per l’equazione del calore omogenea sul segmento: 8 < ut = 3uxx per 0 < x < 1; t > 0 u (0; t) = u (1; t) = 0 : u (x; 0) = sin3 ( x) Es 20.2 Risolvere col metodo di separazione delle variabili il seguente problema di Cauchy-Dirichlet per l’equazione della corda vibrante: 8 utt = 4uxx per 0 < x < ; t > 0 > > < u (0; t) = u ( ; t) = 0 u (x; 0) = sin 2x cos 3x > > : ut (x; 0) = 0: Es 20.3 Risolvere col metodo di separazione delle variabili il seguente problema di Dirichlet per l’equazione di Laplace sul cerchio: 8 2 1 @2u < @ u 1 @u + + 2 2 = 0 per 2 [0; 1); # 2 [0; 2 ] 2 @ @ @# : u (R; #) = # (2 #) per # 2 [0; 2 ] : Es 20.4 Risolvere col metodo di separazione delle variabili il seguente problema di Dirichlet per l’equazione di Laplace sulla corona circolare: 8 2 @ u 1 @u 1 @2u > > < + + = 0 per 2 (1; 2) ; # 2 [0; 2 ] 2 @#2 @ 2 @ u (1; #) = 1 per # 2 [0; 2 ] > > : u (2; #) = 3 per # 2 [0; 2 ] Es 20.5 Risolvere col metodo di separazione delle variabili il problema di Dirichlet per l’equazione di Laplace sul rettangolo: 8 < uxx + uyy = 0 per x 2 (0; 1) ; y 2 (0; 2) u (x; 0) = u (x; 2) = u (1; y) = 0 : u (0; y) = sin y cos 2 y: Es 20.6 Risolvere col metodo di separazione delle agli autovalori per il Laplaciano sul rettangolo: 8 0 x < uxx + uyy + u = 0 u (0; y) = u (1; y) = 0 0 y : u (x; 0) = u (x; 2) = 0 0 x 223 variabili il seguente problema 1; 0 2 1: y 2 Es 20.7 Risolvere esplicitamente mediante separazione di variabili il seguente problema di Cauchy-Dirichlet per un’equazione di di¤ usione e trasporto sul segmento: 8 < ut = uxx + 2ux per x 2 [0; L] ; t > 0 u (0; t) = u (L; t) = 0 per t > 0 : u (x; 0) = 2e x sin 3Lx per x 2 [0; L] : Es 20.8 Risolvere mediante separazione di variabili il seguente problema di Dirichlet per il laplaciano su una corona circolare (il problema è già scritto in coordinate polari): 8 1 1 < u + u + 2 u## = 0 per 1 < < 2; # 2 [0; 2 ] u (1; #) = 0 : u (2; #) = 1 + sin # + 3 cos 2#: Es 20.9 Risolvere esplicitamente, mediante separazione di variabili il seguente problema di Dirichlet per un’equazione di Laplace con termine di ordine zero, sul quadrato Q = [0; 1] [0; 1]: 8 uxx uyy + u = 0 per (x; y) 2 [0; 1] [0; 1] > > < u (0; y) = u (1; y) = 0 per y 2 [0; 1] u (x; 1) = 0 per x 2 [0; 1] > > : u (x; 0) = sin (5 x) per x 2 [0; 1] : B. Polinomi ortogonali e problemi di Sturm-Liouville Es 20.10 Determinare il polinomio di grado 3 che meglio approssima sin x in L2 ( 1; 1). Suggerimento: usare i polinomi di Legendre, calcolandoli dalla formula q n+ Pn (x) = 2n n! 1 2 dn x2 dxn 1 n : Es 20.11 Dimostrare l’ortogonalità delle autosoluzioni relative ad autovalori distinti per l’equazione di Laguerre: xe x 0 0 y + e x y = 0 per x 2 (0; +1) : Es 20.12 Risolvere il seguente problema di Sturm-Liouville regolare, determinando autovalori e autofunzioni: 0 (xy 0 ) + xy = 0 per x 2 (1; 2) y (1) = y (2) = 0: Suggerimento: per prima cosa scrivere per esteso l’equazione di¤ erenziale e determinare il suo integrale generale in funzione di . (E’un’equazione di Eulero... Ricordare che per reale è xi = ei log x = cos ( log x)+i sin ( log x)). Quindi imporre le condizioni agli estremi. 224 Es 20.13 Nello spazio di Hilbert L2 (0; 1), ortonormalizzare le funzioni x2 ; x; 1 (in quest’ordine). Es 20.14 I primi polinomi di Legendre sono: P0 (x) = P2 (x) = p1 ; 2 q 1 5 2 2 P1 (x) = 3x2 1 ; P3 (x) = q 3 q2 x; 7 2 3 2x + 52 x3 : Tenendo presente questo, determinare il polinomio di grado approssima in L2 [ 1; 1] la funzione f (x) = cos ( x) : 2 che meglio Es 20.15 I primi polinomi di Laguerre sono: L0 (x) = 1; L2 (x) = 1 2x + Calcolare il polinomio di grado ex=4 nello spazio L2 ((0; +1) ; e 20.1 x x2 2 ; L1 (x) = 1 ::: x; 2 che meglio approssima la funzione f (x) = dx). Soluzione di alcuni esercizi sulla Parte 4 A. Metodo di separazione delle variabili Soluzione Es. 20.7. Cerchiamo u (x; t) = X (x) T (t) : L’equazione diventa: T 0 X = T X 00 + 2T X 0 T0 X 00 + 2X 0 (t) = (x) T X da cui per qualche T0 X 00 + 2X 0 = = T X costante. Si deve avere quindi: X 00 (x) + 2X 0 (x) = X (x) per x 2 (0; L) X (0) = X (L) = 0 T 0 (t) = T (t) per t > 0: Risolviamo: X 00 + 2X 0 X = 0 in (0; L) X (0) = X (L) = 0 che porta: + 1 < 0; X (x) = e x sin 225 p j1 + jx con p j1 + jL = n e quindi h 2 ( nL ) un (x; t) = cn e 2 n L = i +1 t 1 x e n x : L sin Cerchiamo ora la soluzione 1 X cn e sin 3 x L u (x; t) = n=1 x che soddis… u (x; 0) = 2e 2e x sin h 2 ( nL ) i +1 t e x n x L sin : A¢ nché sia: 3 x L 1 X = cn e x n x L sin n=1 si dovrà avere: c3 = 2; cn = 0 per n 6= 3; e in de…nitiva la soluzione cercata è: h 2 ( 3L ) u (x; t) = 2e i +1 t e x sin 3 x : L Soluzione Es. 20.9. Cercando u (x; y) = X (x) Y (y) si trova: X 00 =1 X Y 00 = Y = cost. Le condizioni u (0; y) = u (1; y) = 0 portano al problema agli autovalori: X 00 = X X (0) = X (1) = 0 che dà Xn (x) = sin (n x) n = n2 2 ; n = 1; 2; 3; ::: Quindi si ha: Y 00 = 1 + n2 2 Y che ha integrale generale p Yn (y) = an e 1+n2 2y 226 + bn e p 1+n2 2y : Imponendo anche la condizione Yn (1) = 0 si trova (dopo qualche calcolo) p Sh 1 + n2 2 (1 y) p Yn (y) = cn Sh 1 + n2 2 quindi u (x; y) = 1 X cn p 1 + n2 2 (1 y) p sin (n x) Sh 1 + n2 2 Sh n=1 e imponendo u (x; 0) = sin (5 x) si ha c5 = 1; gli altri coe¢ cienti nulli. Perciò: p Sh 1 + 25 2 (1 y) p u (x; y) = sin (5 x) : Sh 1 + 25 2 Soluzione Es. 20.15. Calcoliamo anzitutto: Z +1 f (x) xn e x dx per n = 0; 1; 2: 0 Z Z +1 x=4 e e x dx = 0 +1 Z +1 4 e 3 dx = 0 ex=4 xe x dx = 0 Z +1 3x=4 xe +1 ex=4 x2 e x dx = 0 Z 2 4 3 = dx = 0 8 =0+ 3 Z = 0 4 3 +1 3x=4 + Z 3x=4 0 +1 4 2 x e 3 dx = +1 3x=4 8 16 : 3 9 dx = 4 3 3x=4 xe 3x=4 0 + Z 4 e 3 +1 0 0 dx = xe +1 0 16 9 +1 x2 e +1 3x=4 4 xe 3 0 =0+ Z 3x=4 e 3x=4 4 2xe 3 dx 3x=4 dx Quindi: hf; L0 i = hf; L1 i = hf; L2 i = 4 3 Z +1 e 3x=4 e 3x=4 dx 0 Z 0 Z +1 0 +1 dx 2 Z +1 xe 3x=4 0 227 dx + 1 2 Z 16 = 9 0 4 9 +1 x2 e 3x=4 dx = 4 3 2 16 1 8 16 4 + = 9 2 3 9 27 e la proiezione richiesta è: P f (x) = hf; L0 i L0 + hf; L1 i L1 + hf; L2 i L2 4 4 (1 x) + 1 9 27 4 4 4 4 = + +x 3 9 27 9 4 2 2 28 + x+ x : = 27 27 27 = Gra…co di f (x) e x=2 4 3 e P f (x) e x=2 : 228 2x + x2 2 8 27 + 2 2 x 27 Parte V Formulazione debole dei problemi ai limiti per equazioni ellittiche 21 21.1 Derivate deboli e spazi di Sobolev Il concetto di derivata debole Gli spazi di funzioni …n qui incontrati nel corso sono di due tipi: gli spazi C k di funzioni continue o derivabili, adatti ad esempio allo studio classico delle equazioni di¤erenziali ordinarie, e gli spazi di Lebesgue Lp e in particolare L2 , adatti allo studio dei problemi di analisi di Fourier e approssimazione di funzioni. Nello studio delle equazioni a derivate parziali, l’individuazione degli spazi funzionali opportuni si è rivelato essere un problema tanto cruciale quanto delicato. Gli spazi C k in più variabili, molto usati nel 19 secolo soprattutto nello sviluppo dei metodi di risoluzione esplicita di problemi ai limiti per equazioni a derivate parziali piuttosto semplici e su domini semplici, si sono rivelati inadeguati per il successivo sviluppo della teoria: risultati generali di esistenza e unicità per problemi ai limiti per equazioni a derivate parziali non valgono mai in questi spazi. Ad esempio, …n dagli inizi del 20 secolo è noto che per l’equazione di Poisson u=f esistono funzioni f continue per cui l’equazione non ha soluzione C 2 . Per ottenere la risolubilità in senso classico dell’equazione, il termine noto f dev’essere “un po’più che continuo”, precisamente dev’essere hölderiano, ossia soddisfare una condizione di continuità del tipo: jf (x1 ) f (x2 )j c jx1 x2 j per qualche 2 (0; 1] (se = 1 stiamo parlando delle funzioni lipschitziane che già conosciamo; la condizione di Hölder è in generale più debole). Sotto quest’ipotesi l’equazione ha soluzioni classiche non solo C 2 , ma con derivate seconde a loro volta hölderiane. E’ questo il contenuto della teoria sviluppata da Schauder nel 1934, che rappresenta un quadro concettuale coerente in cui trattare certe classi di equazioni a derivate parziali dal punto di vista classico (ossia richiedendo che la soluzione abbia tutte le derivate che compaiono nell’equazione almeno continue e l’equazione sia soddisfatta in ogni punto del dominio). Questa teoria (di cui nel seguito non diremo nulla) non costituisce però l’ultima parola sull’argomento. In e¤etti lo studio delle equazioni a derivate parziali compiuto nel 20 secolo ha messo in luce come anche in questo contesto l’integrale di Lebesgue abbia un ruolo centrale, e gli spazi di funzioni in cui studiare EDP debbano essere anch’essi in qualche modo modellati sull’integrale. Cerchiamo di motivare questa a¤ermazione con qualche osservazione più speci…ca, mentre per un quadro storico di ampio respiro sull’evoluzione dello studio 229 delle equazioni a derivate parziali nel 20 secolo rimandiamo al saggio [7], in particolare §§11-14. 1. L’equazione di Poisson per il potenziale newtoniano è: u=f dove f ha il signi…cato di densità (di carica o di massa). Ora, dal punto di vista …sico una funzione densità tipicamente può essere discontinua, ed è il suo integrale su un certo dominio ad esprimere una grandezza …sica misurabile (carica o massa totale). Quand’è così, l’equazione di¤erenziale esprime allora un’uguaglianza tra le derivate seconde della soluzione e una funzione integrabile ma generalmente discontinua. Quindi è sensato cercare la soluzione in uno spazio di funzioni le cui derivate di ordine massimo siano integrabili ma generalmente discontinue. 2. Nella deduzione di molte equazioni a derivate parziali della …sica matematica, ad esempio l’equazione di Poisson per il potenziale, l’equazione di di¤usione del calore, l’equazione di continuità, le equazioni di Maxwell, la deduzione matematica dell’equazione di¤erenziale segue uno schema ricorrente: (i) si scrivono opportune equazioni di bilancio che eguagliano tra loro due integrali, esprimenti in modo diverso una stessa quantità …sica (tipicamente tale quantità è la velocità istantanea di incremento di una certa grandezza …sica in una regione …nita dello spazio); (ii) applicando il teorema della divergenza o del rotore (cioè analoghi multidimensionali della “formula di integrazione per parti” tipica degli integrali in una variabile) si riscrive l’equazione come un unico integrale, esteso ad una generica regione dello spazio, uguagliato a zero; (iii) per la genericità di tale regione, se ne deduce che la funzione integranda deve annullarsi, quindi si ottiene un’equazione (di¤erenziale) che dev’essere soddisfatta puntualmente. Vediamo quindi che nella deduzione stessa delle equazioni di¤erenziali, le grandezze dotate di un signi…cato …sico diretto sono spesso integrali di certe espressioni (contenenti le derivate della funzione incognita e termini noti). Ad esempio, l’equazione di di¤usione del calore in condizioni stazionarie si può scrivere nella forma: div (a (x) ru (x)) = f (x) dove u è la funzione incognita (temperatura), a (x) un coe¢ ciente di conducibilità, f (x) un termine di sorgente di calore. In realtà il coe¢ ciente di conducibilità a (x) può realisticamente essere discontinuo, quindi l’epressione div (a (x) ru (x)) ha un signi…cato dubbio, dal punto di vista del concetto classico di derivata. Se si seguono i passi della deduzione di questa equazione, si osserva però che il primo membro nasce dall’applicazione del teorema della divergenza all’integrale di super…cie: Z a (x) ru (x) dS, @ che esprime il ‡usso termico uscente dalla regione . A¢ nché questo abbia signi…cato è su¢ ciente che il prodotto a (x) ru (x) sia una funzione continua 230 (non necessariamente derivabile), il che può accadere anche in casi in cui il coe¢ ciente a (x) e il gradiente ru (x) siano ciascuno discontinuo. Si capisce quindi che per poter considerare situazioni …sicamente interessanti, occorre a volte attenuare le richieste di regolarità sulla soluzione. 3. Ci sono grandezze importanti dal punto di vista sia matematico che …sico, legate a certi problemi ai limiti per EDP, espresse da integrali della soluzione o di sue derivate. Ad esempio abbiamo visto che se u è un’autofunzione del laplaciano u + u = 0 in u = 0 su @ allora è R 2 = R jruj dx 2 juj dx (quoziente di Rayleigh). Gli autovalori sono quantità importanti tanto per lo sviluppo della teoria matematica quanto per il loro signi…cato …sico (frequenze di vibrazione del sistema, livelli energetici...). Il fatto che un autovalore sia il quoziente tra le norme L2 del gradiente della soluzione e della soluzione stessa signi…ca che queste norme integrali hanno un ruolo importante nello studio dell’equazione. La conclusione di queste osservazioni è la seguente: è naturale, nello studio delle equazioni a derivate parziali, introdurre degli spazi di funzioni in cui la norma pesi certi integrali della funzione e certi integrali di sue derivate. Queste norme infatti controllano quantità che sono signi…cative sia nel processo di deduzione dell’equazione, sia in relazione ai termini che compaiono nell’equazione stessa, sia in relazione a certe proprietà matematicamente e …sicamente rilevanti della soluzione. Tuttavia sappiamo già che se gli spazi C k vengono muniti di norme integrali, quelli che si ottengono sono spazi non completi. Questo signi…ca che le norme integrali che dobbiamo de…nire non dovranno pesare le “solite” derivate: se vogliamo sperare di ottenere spazi completi, dovremo anche generalizzare il concetto di derivata, e introdurre norme che pesino l’integrale di queste “derivate generalizzate”. Come per ottenere uno spazio completo di funzioni integrabili è stato necessario de…nire un concetto di integrale più ‡essibile (quello di Lebesgue), grazie a cui più funzioni risultano integrabili, analogamente occorrerà ora de…nire un concetto di derivata più ‡essibile, grazie a cui più funzioni risultino derivabili. E’ questo il concetto di derivata debole, che ora introdurremo. Gli spazi di funzioni derivabili in questo senso debole sono gli spazi di Sobolev, introdotti a metà anni 1930 e a tutt’oggi quadro funzionale standard per molti problemi di equazioni a derivate parziali. I risultati di esistenza per problemi ai limiti che dimostreremo successivamente sono invece degli anni 1950. Per generalizzare il concetto di funzione derivabile in un contesto di funzioni integrabili l’idea, suggerita anche dalle osservazioni fatte in precedenza, è quella di assegnare un ruolo centrale alla formula di integrazione per parti (e analogamente, in più variabili, al teorema della divergenza). Infatti è proprio 231 questa, nella deduzione …sica delle equazioni, a costituire il passaggio chiave che trasforma una quantità sempre dotata di signi…cato …sico in un’altra che solo nei casi regolari lo è. Illustriamo l’idea matematica di derivata debole, prima nel caso unidimensionale e poi in quello n-dimensionale. 21.2 Derivata debole, caso unidimensionale De…nizione 21.1 Sia (a; b) un intervallo aperto in R (può anche essere a = 1; b = +1). Chiamiamo spazio delle “funzioni test” sull’intervallo (a; b) lo spazio C01 (a; b) delle funzioni in…nitamente derivabili in (a; b) e identicamente nulle fuori da un intervallo chiuso e limitato strettamente contenuto in (a; b). De…nizione 21.2 Chiamiamo L1loc (a; b) lo spazio delle funzioni localmente integrabili in (a; b) ; cioè delle funzioni f che appartengono a L1 [ ; ] per ogni intervallo chiuso e limitato [ ; ] strettamente contenuto in (a; b). Si noti che, in particolare, se f 2 L1loc (a; b) e 2 C01 (a; b) allora f 2 L (a; b). Consideriamo ora due funzioni 2 C01 (a; b) e f 2 C 1 (a; b). Allora si ha (formula di integrazione per parti): 1 Z a b Z b f 0 dx = [f ]a e quindi (per l’annullamento di Z b f 0 dx a agli estremi) b f 0 dx = a Z b f 0 dx: (21.1) a Avendo in mente questa uguaglianza quando f 2 C 1 (a; b) ; diamo ora la seguente de…nizione: De…nizione 21.3 (Derivata debole) Sia f 2 L1loc (a; b). Diciamo che f ha derivata debole in (a; b) se esiste una funzione g 2 L1loc (a; b) tale che Z a b f 0 dx = Z b g dx a 8 2 C01 (a; b) : In tal caso si scrive g = f 0 . Nella de…nzione precedente, l’integrale è quello di Lebesgue. E’ chiaro che se f 2 C 1 (a; b) allora la derivata classica di f soddisfa la de…nizione precedente, cioè: se f è derivabile in senso classico in (a; b) ; allora è derivabile anche in senso debole in (a; b), e la derivata debole coincide con quella classica. Si tratta di capire cos’abbiamo guadagnato con questa de…nizione, cioè quali altre funzioni risultano avere derivata debole. 232 Esempio 21.4 Sia f (x) = jxj in ( 1; 1). Proviamo a calcolare la derivata debole di f . Si ha: Z 1 Z 0 Z 1 jxj 0 (x) dx = x 0 (x) dx + x 0 (x) dx = 1 1 0 in ciascun integrale possiamo ora fare le integrazioni per parti standard Z 0 Z 1 1 0 = [ x 0 (x)] 1 + (x) dx + [x 0 (x)]0 (x) dx = 1 poiché 0 ( 1) = 0 = Z 0 (x) dx 1 Z 1 (x) dx = 0 Z 1 g (x) (x) dx 1 con g (x) =sgn(x). Pertanto esiste la derivata debole 0 jxj = sgn (x) . Si potrebbe commentare: sapevamo già che la derivata del modulo è il segno di x! Questa osservazione non coglierebbe il punto, però. Occorre ri‡ettere sul fatto che il concetto di derivata debole è un concetto globale, non puntuale o locale: data una funzione f 2 L1loc (a; b) ; o si può determinare una funzione che abbia il diritto di chiamarsi sua derivata debole sull’intervallo (a; b), oppure diremo che la funzione non ha derivata debole in (a; b). In particolare, non ha senso dire che una funzione è derivabile in senso debole in ( 1; 1) per x 6= 0. Nell’esempio appena visto, la funzione sgn(x) è una funzione L1loc ( 1; 1) (in particolare non dà problema il fatto che sia de…nita solo quasi ovunque), che soddisfa la de…nizione di derivata debole di jxj in ( 1; 1) ; mentre dal punto 0 di vista classico è jxj =sgn(x) solo per x 6= 0. Come mostreranno i prossimi esempi, se f è derivabile in senso classico tranne un numero …nito di punti, questo di per sé non implica che la funzione uguale alla derivata classica quando questa esiste sia una derivata debole. Esempio 21.5 Sia f (x) = sgn (x) in ( 1; 1). Proviamo a calcolare la derivata debole di f . Si ha: Z 1 Z 0 Z 1 0 0 sgn (x) 0 (x) dx = (x) dx + (x) dx = 1 1 = 0 (0) + ( 1) + (1) (0) = 2 (0) poiché ( 1) = 0. A¢ nché esista la derivata debole di f dovrebbe esistere una funzione g 2 L1loc ( 1; 1) tale che Z 1 sgn (x) 1 0 (x) dx = Z 1 g (x) (x) dx 1 233 8 2 C01 ( 1; 1) cioè tale che Z 1 8 2 C01 ( 1; 1) : g (x) (x) dx = 2 (0) 1 E’facile capire che tale g non può esistere: l’integrale di g contro una funzione test non può produrre sempre il valore della test in un punto. Quindi f non ha derivata debole in ( 1; 1). Si osservi che dal punto di vista classico la derivata di f esiste quasi ovunque ed è zero dove esiste. Tuttavia la funzione identicamente nulla non è la derivata debole di f . Esempio 21.6 Sia f (x) = x con 2 R, in (0; 1). Si osservi che qualunque sia (anche negativo) f 2 L1loc (0; 1) (anche se in generale non sarà f 2 L1 (0; 1)). Calcoliamo la derivata debole al modo seguente: Z 1 Z 1 x 0 (x) dx = x 0 (x) dx 0 " C01 (0; 1) l’integrale in realtà è esteso a un intervallo (si noti che per ogni 2 ("; 1) con " > 0; dove " dipende dalla particolare ); nell’integrale scritto così si può integrare per parti Z 1 Z 1 = x 1 (x) dx = x 1 (x) dx: " 0 0 Si ha ovviamente (x ) = x 1 anche nel senso delle derivate deboli. Per 2 (0; 1) questo esempio dà una funzione che nell’origine non è derivabile in senso classico, e la cui derivata debole è comunque integrabile; per < 0 questo esempio dà una funzione la cui derivata debole non è neppure integrabile, ma è comunque localmente integrabile. Il seguente teorema fa un po’ di chiarezza nelle situazioni che si possono veri…care nel caso unidimensionale: Teorema 21.7 Se f 2 L1loc (a; b) ha derivata debole L1loc (a; b), allora esiste una funzione fe uguale quasi ovunque a f tale che fe 2 C (a; b). Più precisamente fe è assolutamente continua: Z x2 fe(x1 ) fe(x2 ) = f 0 (t) dt per ogni x1 ; x2 2 (a; b) . x1 In particolare: se una funzione è discontinua in un punto interno all’intervallo, certamente non ha derivata debole. E’possibile invece che abbia derivata debole pur essendo non derivabile dal punto di vista classico in qualche punto interno all’intervallo. Il teorema non si inverte, cioè non ogni funzione continua ha derivata debole. Infatti, non ogni funzione continua è assolutamente continua: 234 Esempio 21.8 La funzione f (x) = x sin x12 0 per x > 0 per x 0 è continua ma non assolutamente continua in ( 1; 1) ; pertanto non ha derivata debole in ( 1; 1). Omettiamo la dimostrazione di quest’a¤ ermazione. 21.3 Derivata debole, caso multidimensionale Diamo ora la de…nizione analoga ma più generale di derivata debole di ordine qualsiasi e in dimensione qualsiasi. De…nizione 21.9 Sia un aperto in Rn . Chiamiamo spazio delle “funzioni 1 test” su lo spazio C0 ( ) delle funzioni in…nitamente derivabili in e identicamente nulle fuori da un insieme chiuso e limitato strettamente contenuto in . De…nizione 21.10 Chiamiamo L1loc ( ) lo spazio delle funzioni localmente integrabili in ; cioè delle funzioni f che appartengono a L1 (K) per ogni insieme chiuso e limitato K strettamente contenuto in . De…nizione 21.11 (Derivata debole) Sia f 2 L1loc ( ). Fissato un multiindice = ( 1 ; 2 ; :::; n ) con j interi non negativi, posto j j= 1 + 2 + ::: + n; diciamo che f ha derivata debole D f in se esiste una funzione g 2 L1loc ( ) tale che Z Z @j j j j dx = ( 1) g dx 8 2 C01 ( ) : f 1 2 @x1 @x2 :::@xnn In tal caso si scrive g = D f . Nella de…nzione precedente, l’integrale è quello di Lebesgue. E’ chiaro che se f 2 C j j ( ) allora la derivata classica di f soddisfa la de…nizione precedente, cioè: se f è derivabile in senso classico in ; allora è derivabile anche in senso debole in , e la derivata debole coincide con quella classica. Troveremo però anche funzioni derivabili in senso debole senza essere derivabili classicamente. Inoltre, come mostreranno gli esempi, a di¤erenza del caso unidimensionale una funzione che ha tutte le derivate deboli del prim’ordine non è necessariamente continua. 235 2 Esempio 21.12 Sia f (x; y) = jxj y in ( 1; 1) . Proviamo a calcolare la derivata debole di Dx f . Si ha: Z 1Z 1 Z 1 Z 0 Z 1 jxj y x (x; y) dxdy = y x x (x; y) dx + x x (x; y) dx dy 1 1 = Z = 1 1 y 1 Z 1 0 Z 1 1 Z (x; y) dx + 1 Z 0 1 (x; y) dx dy 0 1 sgn (x) y (x; y) dxdy 1 quindi esiste la derivata debole Dx f = sgn (x) y. Esempio 21.13 Sia f (x; y) = x2 + y 2 con 2 R: Calcoliamo la derivata debole Dx f in = fx2 + y 2 < 1g (per simmetria, Dy f esisterà nelle stesse ipotesi). Cominciamo a osservare che f 2 L1loc ( ) quando converge l’integrale Z 1 2 d ; 0 cioè per 2 + 1 > Z Z 1; > 1: Quindi assumiamo Z Z p 2 x 1: Si ha: 1 y 1 x2 + y 2 > (x; y) dxdy = p 1 x2 + y 2 x ! (x; y) dx dy 1 y2 per ogni y …ssato diverso da 0, la funzione x2 + y 2 è limitata e derivabile anche se < 0, quindi nell’integrale interno in dx si può integrare per parti, ottenendo ! Z Z p 2 1 = 1 = Z Z 1 y p 1 x2 + y 2 Basta ora controllare per quali 2x (x; y) dx dy 2x (x; y) dxdy: risulta localmente integrabile la funzione 1 x2 + y 2 Stimiamo l’integrale in polari: Z 1 Z 2( 1) 2 d =2 0 1 x2 + y 2 1 y2 2x: 1 0 2 d < 1 per > 1=2: Quindi la funzione ha derivata debole Dx f (e, per simmetria, Dy f ) per ogni > 1=2: Si osservi che per < 0 in particolare la funzione f è discontinua, e ciò non ostante ha derivate deboli del prim’ordine. 236 2 Esempio 21.14 Sia f (x; y) = x2xy +y 2 in ( 1; 1) . Calcoliamo la derivata debole Dx f (per simmetria, la derivata Dy f si calcolerà in modo analogo). Z 1 Z 1 xy (x; y) dx dy 2 + y2 x x 1 1 per ogni y …ssato diverso da 0 la funzione x2xy +y 2 è derivabile e limitata in x, perciò nell’integrale interno si può integrare per parti e si ha: ! Z 1 Z 1 y x2 + y 2 2x2 y = (x; y) dx dy x2 + y 2 1 1 Z Z y y 2 x2 = (x; y) dxdy: 2 2 2 ( 1;1)2 (x + y ) Controlliamo che la derivata trovata è L1loc : Z Z x2 +y 2 <1 y y2 x2 (x2 + 2 y2 ) dxdy c Z 0 1 3 4 d = c: Quindi esistono le derivate prime deboli. Di nuovo, notare che la f (x; y) è discontinua. Esempio 21.15 Sia f (x; y) =sgn(x). La funzione non ha derivata debole in 2 ( 1; 1) : La dimostrazione è analoga al caso unidimensionale. L’esempio precedente ha un signi…cato generale: una funzione di 2 variabili dotata di derivate deboli prime può essere discontinua in un punto, ma non può avere una discontinuità a gradino lungo un segmento. Non può, ad esempio, essere la funzione caratteristica di un aperto. Più in generale: Esempio 21.16 In Rn , sia contenuto nel primo. un aperto e A f (x) = non ha derivate deboli prime in : un aperto strettamente 1 se x 2 A 0 se x 2 =A Un risultato utile che dà una condizione su¢ ciente per la derivabilità in senso debole è il seguente: Teorema 21.17 (di Rademacher) Sia Rn un aperto e f lipschitziana in : Allora: 1. f ammette derivate parziali prime in senso classico quasi ovunque in ; 2. le derivate parziali prime di f sono funzioni L1 ( ); 3. le derivate parziali prime di f sono anche derivate deboli. Si tratta di un teorema profondo, che unisce idee classiche sulla derivabilità alle idee di teoria della misura. 237 21.4 Spazi di Sobolev Possiamo ora introdurre gli spazi di funzioni derivabili in senso debole: De…nizione 21.18 (Spazi di Sobolev) Sia spazio di Sobolev: Rn un aperto. De…niamo lo H 1 ( ) = f 2 L2 ( ) : f ha derivate deboli prime in L2 ( ) ; munito della norma kf kH 1 ( ) = kf kL2 ( ) + kjrf jkL2 ( ) : Più in generale, per k = 1; 2; 3:::: H k ( ) = f 2 L2 ( ) : f ha derivate deboli di tutti gli ordini …no a k in L2 ( ) ; munito della norma kf kH k ( ) = kf kL2 ( )+ k X X j=1 j j=j kD f kL2 ( ) : Come per gli spazi di Lebesgue, a¢ nché queste siano e¤ettivamente delle norme occorre identi…care tra loro funzioni uguali quasi ovunque. In altre parole, formalmente un elemento di uno spazio di Sobolev non è una funzione ma una classe d’equivalenza di funzioni. Gli spazi di Sobolev che abbiamo appena de…nito sono modellati sullo spazio L2 . In modo analogo si possono de…nire per ogni p 2 [1; 1] spazi di Sobolev di funzioni Lp con derivate deboli in Lp , ed in e¤etti nell’odierna teoria delle equazioni a derivate parziali questi spazi di Sobolev sono fondamentali, ma per le applicazioni che abbiamo in mente il caso p = 2 sarà su¢ ciente. Ciò che rende speciali gli spazi di Sobolev H 1 e H k ; modellati su L2 , è che la loro norma proviene da un prodotto scalare: kf kH 1 ( = hf; f i con Z Z hf; gi = f gdx + rf rgdx ) (se considerassimo funzioni a valori complessi dovremmo de…nire il prodotto scalare con un coniugato sul secondo fattore dell’integranda). Analogamente: kf kH k ( = hf; f i con Z k X Z X (D f ) (D g) dx: hf; gi = f gdx + ) j=1 j j=j Il prossimo risultato è ormai semplice da dimostrare ma fondamentale. In un certo senso è la motivazione della de…nizione di derivata debole che abbiamo dato: 238 Teorema 21.19 Gli spazi H k ( ) (k = 1; 2; 3; :::) sono completi. Dunque sono spazi di Banach e di Hilbert. Dimostrazione. Proviamolo per k = 1, il caso generale si ottiene iterando lo 1 stesso argomento. Sia dunque ffk gk=1 una successione di Cauchy in H 1 ( ). Per come è de…nita la norma H 1 , questo signi…ca che: 1 ffk gk=1 è di Cauchy in L2 ( ) ; 1 (fk )x1 k=1 è di Cauchy in L2 ( ) ; ... 1 (fk )xn k=1 è di Cauchy in L2 ( ) : Poiché L2 ( ) è completo, esisteranno f; g1 ; :::; gn 2 L2 ( ) tali che fk ! f in L2 ( ) ; 2 (fk )xi ! gi in L ( ) ; per i = 1; 2; :::; n: (21.2) (21.3) Proviamo che esiste la derivata debole fxi = gi per i = 1; 2; :::; n. Infatti per de…nizione di derivata debole di fk si ha: Z Z fk xi dx = (fk )xi dx per ogni 2 C01 ( ) ; i = 1; 2; :::; n: Passando al limite per k ! 1, per la continuità del prodotto scalare si ha: Z Z f xi dx = gi dx per ogni 2 C01 ( ) ; i = 1; 2; :::; n; e questo signi…ca appunto che esiste fxi = gi per i = 1; 2; :::; n. Ma allora le (21.3) dicono che (fk )xi ! fxi ; che insieme alla (21.2) dà fk ! f in H 1 ( ), e H 1 ( ) è completo. Osservazione 21.20 (Spazio H 1 e energia …nita) In diverse interpretazioni …siche delle equazioni a derivate parziali che andremo a studiare negli spazi di Sobolev, se u è la soluzione dell’equazione, l’integrale Z 2 jruj dx ha il signi…cato di energia. Per esempio, la densità di energia del campo elettrico è data da 1 D E: 2 Nel vuoto i due campi sono proporzionali e pari al gradiente del potenziale elettrostatico u; perciò Z Z 2 Energia in = cru rudx = c jruj dx: 239 Analoga relazione vale per l’energia del campo magnetico. Se invece u (x; y) rappresenta la con…gurazione di una membrana elastica in equilibrio, la sua energia potenziale elastica è ancora proporzionale a Z 2 jruj dx: Perciò lo spazio H 1 ( ) ha il signi…cato …sico di insieme di stati di un sistema aventi energia …nita. Abbiamo già detto che le funzioni regolari in senso classico hanno anche derivate deboli. Se ad esempio u 2 C 1 con aperto limitato, certamente u 2 H k ( ) per ogni k. E’ interessante chiedersi se, oltre a ciò, ogni funzione in uno spazio di Sobolev può essere approssimata mediante funzioni regolari. Il prossimo teorema raccoglie i risultati fondamentali in questa direzione. (Si tratta in realtà di due diversi teoremi, che abbiamo condensato in un unico enunciato. La dimostrazione di questi fatti è lunga ed elaborata, non la faremo). Teorema 21.21 (Approssimazione con funzioni regolari) 1. Sia Rn k 1 un aperto qualsiasi e u 2 H ( ). Allora esiste una successione fuj g C ( ) tale che uj ! u in H k ( ). In altre parole: C 1 ( ) \ H k ( ) è denso in H k ( ). 2. Se inoltre ha frontiera regolare, allora esiste una successione fuj g C1 (funzioni regolari …no al bordo) tale che uj ! u in H k ( ). Nel caso in cui è illimitato, si possono comunque scegliere le uj aventi ciascuna supporto limitato. In altre parole: C 1 è denso in H k ( ). Si osservi che il secondo risultato di approssimazione è più forte del primo, e vale sotto un’ipotesi di regolarità sulla frontiera di , mentre il primo vale su qualsiasi aperto : Nello studio dei problemi ai limiti per equazioni a derivate parziali sarà importante poter a¤ermare che una certa funzione appartenente ad H 1 ( ) si annulla sul bordo del dominio. Il signi…cato di questa a¤ermazione però non è ovvio, perché le funzioni H 1 ( ) sono de…nite quasi ovunque, e @ in generale ha misura nulla, per cui non è chiaro che si possa dire quanto vale una funzione di H 1 ( ) nei punti del bordo. Il modo in cui diciamo che u si annulla sul bordo di fa intervenire l’approssimazione con funzioni regolari. Si consideri la prossima: De…nizione 21.22 Se Rn è un aperto, de…niamo lo spazio H01 ( ) come la chiusura di C01 ( ) in H 1 ( ). Esplicitamente, H01 ( ) è de…nito come il sottoinsieme di H 1 ( ) costituito da quelle funzioni che sono limite in norma H 1 ( ) di una successione di funzioni C01 ( ): o n 1 H01 ( ) = f 2 H 1 ( ) : 9 f k gk=1 C01 ( ) : k k f kH 1 ( ) ! 0 : 240 Si veri…ca facilmente che H01 ( ) è un sottospazio vettoriale di H 1 ( ), chiuso e quindi completo. In altre parole, anche H01 ( ) è uno spazio di Hilbert. Questo spazio contiene in particolare le funzioni regolari che si annullano puntualmente sul bordo di . Più in generale, i suoi elementi sono le funzioni nulle sul bordo nel senso degli spazi di Sobolev. Si possono de…nire anche spazi di funzioni nulle su parte della frontiera: De…nizione 21.23 Se Rn è un aperto e @ è una parte della frontiera n 1 tale che H ( ) > 0, de…niamo lo spazio H 1 ( ) come la chiusura in H 1 ( ) dello spazio delle funzioni C 1 ( ) che si annullano in un intorno di : H1 ( ) = f 2 H1 ( ) : 9 f k 1 k gk=1 = 0 in un intorno di C1 ( ) ; :k f kH 1 ( k ) o !0 : La de…nizione di derivata debole è modellata sulla formula di integrazione per parti. Ci aspettiamo che la formula di integrazione per parti “funzioni bene” perciò tra due funzioni in spazi di Sobolev. Infatti: Teorema 21.24 (Integrazione per parti) Per ogni f 2 H 1 ( ) ; g 2 H01 ( ) si ha: Z Z f gxi dx = fxi gdx: (21.4) 1 Dimostrazione. Poiché g 2 H01 ( ) esiste f k gk=1 C01 ( ) : k ! g in 1 H ( ). Per queste k possiamo scrivere, per de…nizione di derivata debole di f; Z Z f ( k )xi dx = fxi k dx: Ora passiamo al limite per k ! 1 e per la continuità del prodotto scalare abbiamo (21.4), poiché k ! g in L2 e ( k )xi ! gxi in L2 . Si noti che la precedente formula di integrazione per parti ha bisogno che almeno una delle due funzioni sia nulla al bordo. Altrimenti nel caso classico comparirebbe anche un integrale di super…cie. Dobbiamo capire che cosa diventa questa formula quando entrambe le funzioni sono H 1 ( ) ma non nulle al bordo. Questo coinvolge il concetto di traccia di una funzione H 1 ( ) sul bordo di . La domanda è: è possibile de…nire i valori di u su @ (pur essendo questo un insieme di misura nulla)? La risposta, non scontata, è a¤ermativa: per quanto in generale le funzioni H 1 ( ) siano de…nite quasi ovunque, la loro extra-regolarità dovuta all’esistenza di derivate deboli fa sì che su insiemi di misura nulla ma “abbastanza grandi”come sono gli insiemi di dimensione di Hausdor¤ n 1 (se è un aperto regolare di Rn , il suo bordo è un insieme di dimensione n 1) abbia senso considerare la restrizione di u. Questa restrizione risulta essere una funzione L2 (@ ) ; quindi è anch’essa de…nita quasi ovunque rispetto alla misura H n 1 su @ . 241 Teorema 21.25 Sia un dominio limitato di Rn con frontiera regolare, oppure sia un semispazio di Rn : Esiste un operatore lineare continuo, detto operatore di traccia, 1 2 0 : H ( ) ! L (@ ) è 0 u (x) = u (x) per x 2 @ , e per ogni u 2 H01 ( ) tale che per ogni u 2 C 1 è 0 u 0: La continuità di 0 signi…ca che vale la stima k 0 ukL2 (@ con c dipendente solo da c kukH 1 ( ) (21.5) ) : Dimostrazione. Lo proviamo nel caso del semispazio. Sia quindi = fx = (x0 ; xn ) : xn 0g : Sfrutteremo il Teorema 21.21 di approssimazione con funzioni regolari: ogni aventi supporu 2 H 1 ( ) può essere approssimata mediante funzioni C 1 1 con supporto di u contenuto in to limitato. Sia dunque prima u 2 C fx = (x0 ; xn ) : xn Kg per qualche K 1, e proviamo per queste u una stima di tipo (21.5). Scriviamo: Z xn i d h 2 2 2 u (x0 ; xn ) = u (x0 ; 0) + u (x0 ; t) dt dt 0 Z xn @u 2 2 (x0 ; t) dt u (x0 ; 0) = u (x0 ; xn ) 2u (x0 ; t) @xn 0 Z xn 1=2 1=2 Z xn @u 2 2 2 0 0 u (x ; xn ) + 2 u (x ; t) dt (x0 ; t) dt @xn 0 0 dove si è usata la disuguglianza di Schwarz. Poiché 2ab a2 + b2 si ha allora: Z xn Z xn 2 @u 2 2 2 0 0 0 ju (x ; 0)j ju (x ; xn )j + ju (x ; t)j dt + (x0 ; t) dt @xn 0 0 e integrando in x0 2 Rn 1 e poi in xn 2 (0; K) Z Z KZ 2 2 0 0 K ju (x ; 0)j dx ju (x0 ; xn )j dx0 dxn Rn 1 + Z 0 K Rn Rn 0 Z Z K Z 1 1 Z xn 0 Z 2 ju (x0 ; t)j dtdx0 dxn 2 xn @u (x0 ; t) dtdx0 dxn @x n 1 n 0 R 0 Z K Z 2 2 = kukL2 ( ) + (K t) ju (x0 ; t)j dx0 dt 0 Rn 1 ! Z K Z 2 @u + (K t) (x0 ; t) dx0 dt 0 Rn 1 @xn + 2 kukL2 ( 2 ) + K kukL2 ( 242 )+K @u @xn 2 L2 ( ) e dividendo per K 1 2 ku ( ; 0)kL2 (@ ) 1+ 1 K 2 kukL2 ( 2 @u @xn )+ 2 2 kukH 1 ( L2 ( ) ) : Si noti che la stima …nale ottenuta non contiene K, quindi non dipende dal sup1 porto della particolare funzione u. Sia ora u 2 H 1 ( ) e sia fuk gk=1 C 1 1 una successione uk ! u in H ( ) ; per le uk uh vale la stima precedente, perciò: 2 2 kuk ( ; 0) uh ( ; 0)kL2 (@ ) 2 kuk uh kH 1 ( ) : (21.6) 1 Poiché fuk gk=1 converge in H 1 ( ), è di Cauchy in H 1 ( ), pertanto tende a zero il secondo membro della (21.6), e quindi anche il primo. Perciò la successione 1 fuk ( ; 0)gk=1 è di Cauchy in L2 (@ ), pertanto converge a una certa funzione 2 f 2 L (@ ); porremo 0u = f . Si ha naturalmente 2 k 0 ukL2 (@ 2 2 kukH 1 ( ) ) : Inoltre questa funzione 0 u non dipende dalla particolare successione approssi1 1 mante fuk gk=1 , in quanto se fe uk gk=1 è un’altra successione tendente a u in H 1 ( ) si ha: kuk ( ; 0) 2 u ek ( ; 0)kL2 (@ ) 2 kuk 2 u ek kH 1 ( ) ! 0; quindi le due successioni fuk ( ; 0)g ; fe uk ( ; 0)g individuano lo stesso limite L2 (@ ). La tesi è quindi dimostrata. Il concetto di traccia permette ora di stabilire nel contesto di H 1 ( ) delle formule di integrazione per parti perfettamente analoghe a quelle classiche: Teorema 21.26 (Formule di Green) Sia un dominio regolare di Rn (su cui vale il teorema della divergenza classico). Allora, indicando con il versore normale esterno su @ : 1) Se u; v 2 H 1 ( ) ;vale la: Z Z Z uvxi dx = uxi vdx + ( 0 u) ( 0 v) i dH n 1 : (21.7) @ 2) Se u 2 H 1 ( ) ; v 2 H 2 ( )vale la: Z Z Z n X u vdx = ru rvdx + ( 0 u) ( 0 vxi ) i dH n @ 1 : (21.8) i=1 Le due identità precedenti si possono riscrivere in forma più espressiva così: Z Z Z uvxi dx = uxi vdx + uv i dH n 1 @ Z Z Z @v u vdx = ru rvdx + u dH n 1 @ @ 243 sottointendendo che negli integrali di bordo le integrande vanno intese nel senso delle tracce. Dimostrazione. Siano u; v 2 H 1 ( ), e siano fuk g ; fvk g C1 tali che 1 uk ! u e vk ! v in H ( ) (poiché il dominio è regolare questa approssimazione si può fare, in base al Teorema 21.21). Per il teorema della divergenza classico si ha: Z Z Z uk (vk )xi dx = (uk )xi vk dx + uk vk i dH n 1 : @ Ora passando al limite per k ! 1, poiché uk ! u in L2 ( ) vk ! v in L2 ( ) (uk )xi ! uxi in L2 ( ) (vk )xi ! vxi in L2 ( ) uk ! vk ! 0u in L2 (@ ) 0v in L2 (@ ) per la continuità del prodotto scalare si ha: Z Z Z uvxi dx = uxi vdx + ( 0 u) ( 0 v) i dH n 1 : @ Siano ora u 2 H 1 ( ) ; v 2 H 2 ( ), allora applicando la precedente con v sostituita da vxi e poi sommando in i si ha: Z u vdx = Z ru rvdx + Z @ ( 0 u) n X ( 0 vxi ) i dH n 1 : i=1 L’ultimo risultato che ci occorre riguardo agli spazi di Sobolev è la seguente disuguaglianza che riguarda le funzioni nulle al bordo: Teorema 21.27 (Disuguaglianza di Poincaré) Sia itato. Allora per ogni u 2 H01 ( ) vale la: kukL2 ( ) diam ( ) krukL2 ( ) : Rn un dominio lim(21.9) Lo stesso vale per u 2 H 1 ( ) dove è una porzione di frontiera di avente misura H n 1 positiva (con una costante c ( ) che potrebbe essere diversa dal diametro). In base al teorema precedente, nello spazio H01 ( ) la norma H 1 ( ) è equivalente alla sola norma L2 del gradiente. 244 Dimostrazione. Proviamo solo il risultato per H01 ( ). Poiché particolare è contenuto in una striscia del tipo: x = (x0 ; xn ) : x0 2 Rn S 1 è limitato, in ; a < xn < b con a; b 2 R. Consideriamo prima una funzione u 2 C01 ( ). Allora si ha (essendo u nulla sul bordo di S; quindi u (x0 ; a) = 0): Z xn @u u (x0 ; xn ) = (x0 ; t) dt: @xn a Per la disuguaglianza di Schwarz: 0 ju (x ; xn )j (xn 2 (xn ju (x0 ; xn )j Z 2 xn @u a) (x0 ; t) dt @xn a ! Z xn 2 @u 0 a) (x ; t) dt @xn a ! Z b 2 @u 0 a) (x ; t) dt a @xn 1=2 (b !1=2 e integrando 2 kukL2 ( ) = Z Rn (b 1 Z b a a) Z Rn 2 (b a) 2 ju (x0 ; xn )j dxn dx0 1 Z b Z a a 2 krukL2 ( ) b 2 @u (x0 ; t) dtdx0 dxn @xn 1 da cui la (21.9) per u 2 C01 ( ). Sia ora u 2 H01 ( ) ; sia fuk gk=1 tale che uk ! u in H 1 ( ). Per quanto appena dimostrato è kuk kL2 ( ) (b a) kruk kL2 ( ) C01 ( ) per ogni k: Passando al limite per k ! 1 si ha la (21.9) per u. E’chiaro in…ne che se è limitato, orientando opportunamente gli assi si può sempre scegliere l’insieme S in modo che (b a) uguagli il diametro di : Si noti che la dimostrazione fatta sfrutta l’annullamento delle funzioni solo su una porzione di frontiera di . Si intuisce quindi che il teorema possa valere anche per funzioni H 1 ( ) nulle su una porzione qualunque di @ . Ne omettiamo la dimostrazione. 245 22 Formulazione debole di problemi ellittici 22.1 Operatori uniformemente ellittici Consideriamo ora la seguente classe di equazioni a derivate parziali di tipo stazionario: Lu n X (aij (x) uxi )xj + i;j=1 n X bi (x) uxi + c (x) u = f (x) in Rn : i=1 Si dice che la parte principale (cioè quella contenente le derivate seconde) è scritta in forma di divergenza, in quanto n X (aij (x) uxi )xj = i;j=1 div (A (x) ru (x)) n con A (x) = (aij (x))i;j=1 . Questa classe di operatori di¤erenziali contiene al proprio interno vari casi signi…cativi. Ad esempio, in un’equazione di di¤usione del calore in un mezzo omogeneo e isotropo la parte principale sarà del tipo c u; che corrisponde ad una matrice A costante multipla dell’identità. Se il mezzo è isotropo ma non omogeneo, la matrice A sarà del tipo a (x) I con I matrice identità, e la parte principale sarà div (a (x) ru) : In…ne se il mezzo è anche non isotropo, in generale la A sarà una matrice piena. Questo signi…ca che un gradiente di temperatura ru porta ad un ‡usso di calore q non parallelo a ru, ma ruotato secondo la matrice A; cioè con una legge q= A (x) ru: Il fatto che il calore passi dal corpo più caldo al corpo più freddo signi…ca che q e ru devono sempre formare un angolo acuto, ossia A (x) ru ru > 0. Questa disuguaglianza deve discendere da una proprietà della matrice A (x), in modo che possa valere qualunque sia il vettore ru. Dev’essere cioè A (x) > 0 per ogni 2 Rn ; x 2 : Si suppone anzi, di solito, che questa condizione di positività della matrice sia soddisfatta in modo uniforme rispetto a x, ossia che esista una costante positiva per cui è 2 A (x) j j per ogni 2 Rn ; x 2 ; (22.1) condizione che viene detta di uniforme ellitticità (della matrice o dell’operatore di¤erenziale). 246 La parte principale dell’operatore è detta, per il suo signi…cato …sico, termine di di¤ usione. Veniamo agli altri termini dell’equazione. La parte che coinvolge le derivate prime di u è il termine di trasporto. Ad esempio, è quello che descrive la variazione di temperatura in un mezzo continuo dovuta ad un movimento convettivo nel mezzo stesso (cioè ad uno spostamento di materia calda, anziché alla di¤usione di calore in materia immobile). Un’equazione di di¤usione può descrivere non solo la di¤usione del calore in un corpo, ma anche la di¤usione di un soluto in un solvente. In questo caso la funzione incognita u ha il signi…cato di concentrazione del soluto, anziché di temperatura. In…ne, il termine contenente la u è detto termine di reazione, e compare ad esempio in modelli di di¤usione (di un soluto in un solvente) in cui una certa porzione del soluto viene assorbita o decade. Per il suo signi…cato …sico ed anche per motivi matematici, il coe¢ ciente c (x) di questo termine è generalmente assunto di segno non negativo: questo segno signi…ca che il termine è responsabile di una diminuzione del soluto, nel tempo. Si tenga presente che stiamo studiando un’equazione stazionaria che è pensata come punto d’arrivo, all’equilibrio, dello stato di un sistema che per sua natura evolve nel tempo. In altre parole, il signi…cato …sico dei vari termini dell’equazione si capisce meglio pensando alla corrispondente equazione di evoluzione ut + Lu = 0: Supporremo che tutti i coe¢ cienti dell’equazione, aij ; bj ; c siano misurabili e limitati (ma non necessariamente continui o derivabili, neppure i coe¢ cienti aij che pure compaiono sotto derivata!). Questo corrisponde …sicamente ad ammettere la presenza di discontinuità nella composizione del mezzo. Supporremo sempre che valga la condizione di uniforme ellitticità (22.1). (Quando questa non vale, si dice che l’operatore è degenere, e la teoria corrispondente può essere decisamente più complessa). Il termine noto f sarà supposto in L2 ( ). Per un’equazione di questo tipo si è interessati a studiare vari tipi di problemi al contorno: 1. Problema di Dirichlet: equazione di¤erenziale + condizione u = g su @ : Per esempio, signi…ca che la temperatura al bordo del corpo è mantenuta controllata (termostato). 2. Problema di Neumann: equazione di¤erenziale + condizione @u = h su @ : @ Per esempio, signi…ca che il ‡usso termico al bordo del corpo è mantenuto controllato. In particolare, se h = 0 signi…ca che il corpo è termicamente isolato. La condizione di Neumann ha questa forma quando la matrice dei coe¢ cienti faij g è diagonale (mezzo isotropo); altrimenti va sostituita con una condizione sulla derivata conormale: aij (x) uxi j = h su @ : 247 La derivata conormale di u è la derivata nella direzione A (x) : è questa la direzione del ‡usso di¤usivo legato ad un’equazione di questo tipo. Si può anche scrivere in forma più espressiva: @u = h su @ : @ A 3. Problema misto: equazione di¤erenziale + condizioni u = g su @u = h su @ A 0 1 dove @ = 0 [ 1 . Signi…ca che su parte del bordo è controllata la temperatura mentre su un’altra parte del bordo è controllato il ‡usso termico. 4. Problema di Robin: equazione di¤erenziale + condizioni @u + k (u @ A u0 ) = 0 su @ con k > 0 costante. Signi…ca che sul bordo il ‡usso termico è proporzionale alla di¤erenza tra la temperatura del corpo e la temperatura esterna u0 . Questo è ciò che accade se il corpo scambia liberamente calore con l’ambiente esterno. Abbiamo riportato per completezza questo tipo di problema, di cui però non ci occuperemo in seguito. Vediamo che cosa signi…ca esattamente, dal punto di vista matematico, risolvere uno di questi problemi, ossia: discutiamo cosa si possa intendere per soluzione di un problema di questi tipi. Come vedremo, una buona de…nizione di soluzione in questo contesto non è a¤atto ovvia, ed è un buon punto di partenza per dimostrare un risultato di esistenza della soluzione. 22.2 Problemi ai limiti e de…nizione di soluzione debole 1. Problema di Dirichlet omogeneo, parte principale laplaciano. Consideriamo il problema di Dirichlet per l’equazione Lu = f . Per gradualità, cominciamo dal caso in cui la parte principale è il laplaciano e il dato al bordo è zero: Pn u + i=1 bi uxi + cu = f in (22.2) u=0 su @ : Possiamo pensare di imporre la condizione al contorno u = 0 su @ semplicemente richiedendo che la soluzione appartenga a H01 ( ) (che è stato de…nito appunto come spazio delle funzioni nulle al bordo). In questo modo la condizione al contorno è incorporata nello spazio funzionale. Però l’equazione è del second’ordine, perciò a¢ nché si possa calcolare u la soluzione dovrebbe stare in H 2 ( ) ; non solo in H 1 ( ). Vogliamo trovare una formulazione alternativa dell’equazione di¤erenziale che sia basata sulla de…nizione di derivata debole, 248 cioè sulla formula di integrazione per parti. L’idea è: per cominciare supponiamo che la funzione u sia abbastanza regolare da poter soddisfare l’equazione in senso puntuale quasi ovunque: supponiamo che u 2 H 2 ( ) \ H01 ( ) risolva l’equazione: n X u+ bi uxi + cu = f i=1 che in questo caso può essere interpretata come uguaglianza tra due funzioni L2 ( ), quindi uguaglianza quasi ovunque. Si dice che u è soluzione dell’equazione in senso forte. Adesso moltiplichiamo ambo i membri per una funzione 2 H01 ( ) ed integriamo in : Z udx + n Z X bi uxi dx + i=1 Z cu dx = Z f dx in…ne integriamo per parti nel primo integrale, l’unico che coinvolge derivate seconde della u. In base alle formule di Green (21.8) per u 2 H 2 ( ) e 2 H01 ( ) si ha (avendo la traccia nulla su @ ) Z r rudx + n Z X i=1 bi uxi dx + Z cu dx = Z f dx 8 2 H01 ( ) . (22.3) Quindi se u 2 H 2 ( ) \ H01 ( ) e u risolve l’equazione quasi ovunque, allora è soddisfatta questa identità. D’altro canto questa identità non coinvolge derivate seconde di u; ma ha senso per ogni funzione u 2 H01 ( ). Diremo allora che: De…nizione 22.1 u è soluzione debole del problema (22.2) se u 2 H01 ( ) e vale la (22.3). Il pregio di questa de…nizione è duplice: da una parte è basata su una formulazione integrale che come abbiamo spiegato è naturale da vari punti di vista; dall’altra, richiede una derivata in meno rispetto a quelle che sono scritte nell’equazione. Supponiamo di sapere che u è soluzione debole dell’equazione. In generale, u avrà solo derivate prime, e non potrà soddisfare l’equazione in senso puntuale. Se però sapessimo che u 2 H 2 ( ) ; allora potremmo fare il passaggio di integrazione per parti a ritroso arrivando a Z (Lu f ) = 0 per ogni 2 H01 ( ) : In particolare l’uguaglianza vale per ogni 2 C01 ( ) ; e per noti teoremi di annullamento questo è su¢ ciente per a¤ermare che Lu f = 0 quasi ovunque in : Conclusione: se u è soluzione in senso debole e inoltre u 2 H 2 ( ), allora u è anche soluzione in senso forte. Questo chiarisce che la nozione di soluzione 249 debole è una generalizzazione della nozione di soluzione forte (o classica, quando coe¢ cienti e soluzione sono regolari), consistente con essa. Osserviamo ora che la (22.3) ha la seguente struttura logica: determinare u 2 H01 ( ) tale che a (u; ) = T dove a (u; ) = Z r per ogni rudx + n Z X 2 H01 ( ) ; bi uxi dx + i=1 Z cu dx è una forma bilineare sullo spazio di Hilbert H01 ( ), e Z T = f dx è un funzionale lineare continuo su H01 ( ). Il Teorema di Lax-Milgram sarà quindi lo strumento per provare l’esistenza delle soluzioni. Prima di discutere in dettaglio i risultati di esistenza, però, passiamo in rassegna ad altri problemi ai limiti, per illustrare le corrispondenti de…nizioni di soluzione. 2. Problema di Dirichlet omogeneo, parte principale in forma di divergenza. Consideriamo ora il problema: Pn Pn in i;j=1 (aij (x) uxi )xj + i=1 bi uxi + cu = f (22.4) u=0 su @ : Ragioniamo in modo analogo al caso precedente. Supponiamo in un primo momento che u 2 H 2 ( ) \ H01 ( ) e che i coe¢ cienti aij siano regolari (è su¢ ciente lipschitziani), in modo che l’equazione possa essere soddisfatta in senso forte, cioè sia un’uguaglianza in L2 ( ). Moltiplichiamo ambo i membri dell’equazione per 2 H01 ( ) e integriamo in : n Z X (aij uxi )xj dx + i;j=1 n Z X bi uxi dx + i=1 Z cu dx = Z f dx: Quindi integriamo per parti nel primo integrale (l’unico che coinvolge derivate seconde della soluzione). Poiché 2 H01 ( ) e se u 2 H 2 ( ) e aij 2 Lip ( ) allora aij (x) uxi 2 H 1 ( ), per (21.7) si ha: n Z X i;j=1 aij uxi xj dx + n Z X bi uxi dx + i=1 Z cu dx = Z f dx 8 2 H01 ( ) ; (22.5) identità che ha il pregio di avere senso per ogni u 2 H01 ( ) e inoltre per aij 2 L1 ( ). Diremo quindi che: 250 De…nizione 22.2 u è soluzione debole di (22.4) se u 2 H01 ( ) e vale la (22.5). 3. Problema di Dirichlet non omogeneo, parte principale in forma di divergenza. Consideriamo ora il problema: Pn Pn in i;j=1 (aij (x) uxi )xj + i=1 bi uxi + cu = f (22.6) u=g su @ : Se il dato al bordo non è zero, non possiamo più assumere u 2 H01 ( ). Occorre anche precisare che tipo di funzione è g, e dove risulta de…nita. Supponiamo, per semplicità, che la funzione g non sia de…nita solo su @ , ma sia g 2 H 1 ( ). Sappiamo che in questo caso è ben de…nita la traccia di g su @ ; in altre parole il dato al bordo è ben de…nito. Dire che u = g su @ dovrebbe essere equivalente a dire che u g = 0 su @ ; che a sua volta si può esprimere con la richiesta u g 2 H01 ( ). Chiederemo quindi che il dato al bordo sia soddisfatto in questo senso: si cerca u 2 H 1 ( ) tale che u g 2 H01 ( ). Sia v = u g: Allora se u risolve l’equazione di partenza, formalmente v risolve l’equazione n X (aij vxi )xj + i;j=1 0 =@ =f+ n X bi vxi + cv i=1 n X (aij uxi )xj + i=1 i;j=1 n X n X (aij gxi )xj n X 1 bi uxi + cuA bi gxi 0 @ n X (aij gxi )xj + n X i=1 i;j=1 1 bi gxi + cg A cg: i=1 i;j=1 Si osservi che se g 2 H 1 ( ) allora F f n X bi gxi i=1 mentre n X (aij gxi )xj n X j=1 i;j=1 cg 2 L2 ( ) ; (Fj )xj con Fj 2 L2 ( ) : Quindi: la soluzione che cerchiamo è la funzione u = g + v dove v è de…nita come la soluzione in H01 ( ) dell’equazione n X i;j=1 (aij vxi )xj + n X bi vxi + cv = F + i=1 n X j=1 251 (Fj )xj che andrà interpretata anch’essa in senso debole, così: Z Z n Z n Z X X aij vxi xj dx + bi vxi dx + cv dx = F dx i;j=1 i=1 n Z X Fj xj dx j=1 (22.7) 8 2 H01 ( ). Quindi la risoluzione di un problema di Dirichlet con dato al bordo non zero si trasforma, con il cambio di incognita u = g + v, in un altro problema di Dirichlet con dato al bordo nullo ma termine noto dell’equazione un po’ più complicato. 4. Problema di Neumann omogeneo. Consideriamo ora il problema: Pn Pn (a (x) uxi )xj + i=1 bi uxi + cu = f Pn i;j=1 ij i;j=1 aij uxi j = 0 in su @ : (22.8) dove la condizione al contorno, di tipo Neumann, consiste nel chiedere che la derivata conormale di u, cioè la derivata nella direzione A (x) , sia nulla. E’ questa la direzione del ‡usso di¤usivo legato ad un’equazione di questo tipo. Se la parte principale fosse il laplaciano, o comunque la matrice A (x) fosse del tipo a (x) I (isotropia del mezzo) ritroveremmo la solita derivata normale. La soluzione non sarà in generale una funzione H01 ( ). Supponiamo prima che u 2 H 2 ( ) ; aij siano regolari, e u soddis… l’equazione. Moltiplichiamo per 2 H 1 ( ) e integriamo su : n Z X (aij uxi )xj dx + n Z X bi uxi dx + i=1 i;j=1 Z cu dx = Ora integriamo per parti il primo integrale. Poiché aij uxi e funzioni H 1 ( ) la formula di Green (21.7) dà: n Z X i;j=1 (aij uxi )xj dx = n Z X aij uxi xj dx n Z X i;j=1 i;j=1 ( 0 Z f dx: sono entrambe (aij uxi )) ( 0 ) i dH n @ Pn Ora poiché 2 H 1 ( ) in generale ( 0 ) 6= 0; in compenso i;j=1 ( 0 (aij uxi )) i è proprio la derivata conormale di u; che per ipotesi è nulla. Otteniamo quindi: Z Z n Z n Z X X aij uxi xj dx + bi uxi dx + cu dx = f dx 8 2 H 1 ( ) : i;j=1 i=1 (22.9) Questa formulazione ha senso nelle sole ipotesi aij 2 L1 ( ) e u 2 H 1 ( ), perciò: De…nizione 22.3 Diremo che u è soluzione debole di (22.8) se u 2 H 1 ( ) e vale la (22.9). 252 1 : Si osservi che la formulazione è molto simile a quella del problema di Dirichlet omogeneo, con la di¤erenza che ora sia la u che la stanno in H 1 ( ) anziché in H01 ( ). 5. Problema misto omogeneo. Consideriamo ora il problema misto: Pn 8 Pn < i;j=1 (aij (x) uxi )xj + i=1 bi uxi + cu = f u=0 : Pn i;j=1 aij uxi j = 0 in su su (22.10) 0 1 dove 0 [ 1 = @ ; 0 \ 1 = ;. Cominciamo a imporre la condizione nulla di Dirichlet su 0 chiedendo che u 2 H 10 ( ). Supponendo u anche in H 2 ( ) e i coe¢ cienti aij regolari, moltiplichiamo l’equazione per 2 H 10 ( ) e integriamo in : Z Z n Z n Z X X (aij uxi )xj dx + bi uxi dx + cu dx = f dx: i;j=1 i=1 Ora integriamo per parti il primo integrale. Poiché aij uxi e sono entrambe funzioni H 1 ( ) la formula di Green (21.7) dà: n Z n Z n Z X X X (aij uxi )xj dx = aij uxi xj dx ( 0 (aij uxi )) ( 0 ) i dH n i;j=1 i;j=1 i;j=1 Analizziamo ora l’integrale di bordo n Z X ( 0 (aij uxi )) ( 0 ) i dH n 1 i;j=1 @ n Z X ( = i;j=1 0 (aij uxi )) ( 0 ) i dH n 1 + 0 n Z X i;j=1 ( 0 @ (aij uxi )) ( 0 ) i dH n 1 : 1 Poiché 2 H 10 ( ) nel Pnprimo integrale è ( 0 ) = 0 e il primo integrale si annulla; d’altro canto i;j=1 ( 0 (aij uxi )) i è la derivata conormale di u; che per ipotesi è nulla su 1 , quindi il secondo integrale è pure nullo. Otteniamo quindi: Z Z n Z n Z X X bi uxi dx + cu dx = f dx 8 2 H 10 ( ) ; aij uxi xj dx + i;j=1 i=1 (22.11) formulazione che ha senso nelle sole ipotesi u 2 H 1 ( ) ; aij 2 L1 ( ). De…nizione 22.4 Diremo che u risolve (22.10) se u 2 H 10 ( ) e vale (22.11). La formulazione è ancora analoga a quella del problema di Dirichlet omogeneo e del problema di Neumann omogeneo, soltanto che ora sia u che appartengono allo spazio di Hilbert H 10 ( ). 253 1 : 22.3 Risultati di esistenza Passiamo ora nuovamente in rassegna ai vari problemi che abbiamo impostato nel paragrafo precedente per stabilire dei risultati di esistenza, unicità e dipendenza continua delle soluzioni dai dati, sotto opportune ipotesi. 1.-2. Problema di Dirichlet omogeneo, parte principale in forma di divergenza Consideriamo il problema: Pn Pn in i;j=1 (aij (x) uxi )xj + i=1 bi uxi + cu = f (22.12) u=0 su @ (il caso in cui la parte principale è il Laplaciano è un caso particolare). Supponiamo che sia un dominio limitato di Rn , la matrice aij sia simmetrica, i coe¢ cienti aij 2 L1 ( ) e sia soddisfatta la condizione di uniforme ellitticità: n X 2 j j 2 aij (x) j j per ogni i j i;j=1 2 Rn . (22.13) Delle due disuguaglianze precedenti, l’ellitticità è la prima, cioè la stima dal basso della forma quadratica; la stima dall’alto è un modo di esprimere la limitatezza dei coe¢ cienti aij ; come vedremo, è comodo scrivere la condizione in questa forma. I numeri e esprimono limitazioni dal basso e dall’alto per il minimo e il massimo autovalore della matrice faij (x)g, rispettivamente. Supponiamo anche: n X b2i i=1 !1=2 bi ; c 2 L1 ( ) , con (22.14) B; L1 ( ) kckL1 ( ) C; f 2 L2 ( ) : La formulazione debole del problema è: n Z X aij uxi xj dx + i;j=1 n Z X bi uxi dx + i=1 2 H01 ( ): Poniamo allora, per u; a (u; ) = n Z X aij uxi xj dx + i;j=1 T = Z Z n Z X i=1 f dx 254 cu dx = Z f dx 8 2 H01 ( ) : bi uxi dx + Z cu dx e osserviamo quanto segue: 1. T è un funzionale lineare continuo su H01 ( ). La linearità è ovvia, mentre per Schwarz: Z jT j = f dx kf kL2 ( ) k kL2 ( ) kf kL2 ( ) k kH 1 ( ) : In particolare quindi kT k kf kL2 ( ) : 2. La forma a (u; v) è bilineare e continua su H01 ( ). La bilinearità è ovvia, proviamo la continuità. Osserviamo preliminarmente che la forma bilineare su Rn n X ( ; )= aij i j i;j=1 soddisfa la de…nizione di prodotto scalare (l’uniforme ellitticità della matrice implica la proprietà di positività), per cui la disuguaglianza di Cauchy-Schwarz implica la seguente disuguaglianza algebrica: 0 11=2 0 11=2 n n n X X X @ aij i j aij i j A @ aij i j A i;j=1 i;j=1 2 i;j=1 1=2 2 j j e quindi n Z X aij uxi 1=2 j j Z xj dx i;j=1 = j jj j jruj jr j dx Allora si ha, applicando la disuguaglianza di Schwarz e le ipotesi di limitatezza sui coe¢ cienti: ja (u; )j n Z X aij uxi xj dx + i;j=1 Z n Z X bi uxi dx + i=1 jruj jr j dx + kjrujkL2 ( ) Z kjr jkL2 ( ( + B + C) kukH 1 ( n X b2i i=1 ) !1=2 cu dx jruj j j dx + + B kjrujkL2 ( ) k kH 1 ( Z ) Z k kL2 ( jcu j dx ) + C kukL2 ( ): Perciò la forma bilineare è continua. 3. Studiamo la coercività della forma bilineare su H01 ( ) : a (u; u) = n Z X aij uxi uxj dx + i;j=1 n Z X i=1 255 bi uxi udx + Z cu2 dx: ) k kL2 ( ) Ora per l’ellitticità: n Z X Z aij uxi uxj dx i;j=1 2 jruj dx: (22.15) Supponiamo che valga la condizione di segno c (x) allora Z 0; cu2 dx (22.16) 0: (22.17) In…ne, per il calcolo già visto sopra n Z X bi uxi udx B kjrujkL2 ( i=1 ) kukL2 ( ) : (22.18) Ricordiamo che per la disuguaglianza di Poincaré, essendo u 2 H01 ( ) si ha: kukL2 ( diam ( ) kjrujkL2 ( ) ) : (22.19) Combinando (22.15), (22.17), (22.18), (21.9) si ha: 2 a (u; u) kjrujkL2 ( ( ) Bdiam ( B kjrujkL2 ( 2 )) kjrujkL2 ( ) ) kukL2 ( ) : Se vale la condizione (di piccolezza dei termini del prim’ordine, o di piccolezza del dominio ) B (22.20) 2diam ( ) allora si ha 2 a (u; u) kjrujkL2 ( 2 In…ne, ancora per la disuguaglianza di Poincaré, kukH 1 ( ) = kukL2 ( ) + kjrujkL2 ( ) ) : (diam ( ) + 1) kjrujkL2 ( ) perciò a (u; u) 2 (diam ( ) + 1) kukH 1 ( ) e la forma è coerciva, sotto le ipotesi (22.16) e (22.20). Raccogliamo nel prossimo teorema ciò che si può allora concludere applicando il teorema di Lax-Milgram alla forma bilineare a sullo spazio di Hilbert H01 ( ): 256 Teorema 22.5 Si consideri il problema (22.12) su un dominio Rn . Assumiamo le ipotesi (22.13), (22.14) e inoltre c (x) 0 quasi ovunque in B 2diam ( ) limitato di ;e : Allora per ogni f 2 L2 ( ) esiste una e una sola soluzione u 2 H01 ( ) del problema, e vale la stima di stabilità (dipendenza continua della soluzione dal termine noto f ) kukH 1 ( ) c kf kL2 ( ) ; 0 con c= 2 (diam ( ) + 1) . Osservazione 22.6 La richiesta che i coe¢ cienti del termine del prim’ordine siano piccoli non è del tutto naturale per il problema in esame, a di¤ erenza della condizione sul segno di c. Quest’ipotesi dipende piuttosto dalla tecnica dimostrativa usata. Se, oltre al teorema di Lax-Milgram, si fa uso anche della teoria di Fredholm degli operatori compatti su spazi di Hilbert e di opportuni principi di massimo per l’equazione ellittica, ques’ipotesi si riesce a rimuovere (v. [11, Cap. 8]). Il prezzo da pagare è però lo sviluppo di una corposa teoria di analisi funzionale. In e¤ etti la teoria di esistenza mediante il solo teorema di Lax-Milgram è solo l’inizio della teoria delle soluzioni deboli per le equazioni ellittiche. 3. Problema di Dirichlet non omogeneo, parte principale in forma di divergenza. Consideriamo ora il problema: Pn Pn in i;j=1 (aij (x) uxi )xj + i=1 bi uxi + cu = f (22.21) u=g su @ : Abbiamo visto che la soluzione che cerchiamo è la funzione u = g + v dove v è de…nita come la soluzione in H01 ( ) dell’equazione n X (aij vxi )xj + i;j=1 n X bi vxi + cv = F + i=1 con F f n X n X i;j=1 (aij gxi )xj bi gxi n X j=1 (Fj )xj j=1 i=1 mentre n X cg 2 L2 ( ) ; (Fj )xj con Fj 2 L2 ( ) : 257 E’ cambiato solo il secondo membro dell’equazione. debole, si cerca u 2 H01 ( ) tale che a (u; ) = Z Z X n F dx Fj xj dx Nella formulazione T : j=1 Veri…chiamo che T è ancora un funzionale lineare continuo su H01 ( ): jT j = Z " n X f i=1 kf kL2 ( + bi gxi ) cg # + B kjrgjkL2 ( dx n Z X (aij gxi ) ) + C kgkL2 ( kjrgjkL2 ( ) kjr jkL2 ( ) n k kH 1 ( ) kf kL2 ( ) + (B + ) k kL2 ( + C) kgkH 1 ( ) perciò T è continuo, con kT k kf kL2 ( ) xj dx i;j=1 + (B + + C) kgkH 1 ( ) o ) + ; . La forma bilineare è la stessa che nel caso del problema omogeneo, perciò è continua e coerciva sotto le stesse ipotesi. Concludiamo: Teorema 22.7 Si consideri il problema (22.21) su un dominio Rn . Assumiamo le ipotesi (22.13), (22.14) e inoltre c (x) B 0 quasi ovunque in 2diam ( ) limitato di ;e : Allora per ogni f 2 L2 ( ) ed ogni g 2 H 1 ( ) esiste una e una sola soluzione u 2 H 1 ( ) del problema, e vale la stima di stabilità n o kukH 1 ( ) c kf kL2 ( ) + kgkH 1 ( ) . 4. Problema di Neumann omogeneo. Consideriamo ora il problema: Pn Pn (a (x) uxi )xj + i=1 bi uxi + cu = f Pn i;j=1 ij i;j=1 aij uxi j = 0 in su @ : La formulazione debole consiste nel cercare u 2 H 1 ( ) tale che Z a (u; ) = f dx per ogni 2 H 1 ( ) ; 258 (22.22) dove a è la stessa forma considerata ai punti precedenti. La di¤erenza sta nello spazio di Sobolev che ora è H 1 ( ). Per funzioni H 1 ( ) non vale la disuguaglianza di Poincaré, perciò la stima di coercività va rifatta: Z 2 a (u; u) kjrujkL2 ( ) B kjrujkL2 ( ) kukL2 ( ) + cu2 dx: Ora abbiamo bisogno di una condizione forte sul segno di c (x) se vogliamo controllare dal basso la forma anche mediante la norma kukL2 ( ) . Chiederemo: c (x) c0 > 0: Il termine c (x) dev’essere cioè discosto da zero. Si ha allora: a (u; u) 2 kjrujkL2 ( k kjrujkL2 ( B kjrujkL2 ( ) ) 2 ) + kukL2 ( kukL2 ( 2 ) + c0 kukL2 ( ) ) per qualche k > 0; purché risulti B2 4c0 < 0: Ad esempio, se i termini del prim’ordine sono assenti e c (x) è discosto da zero, la forma è coerciva; più in generale, i termini del prim’ordine devono essere piccoli rispetto alla costante c0 . In compenso non abbiamo avuto bisogno di imporre che sia limitato. Concludiamo: Teorema 22.8 Si consideri il problema (22.22) su un dominio sumiamo le ipotesi (22.13), (22.14) e inoltre c (x) B 2 c0 > 0 quasi ovunque in di Rn . As- ;e 4c0 < 0: Allora per ogni f 2 L2 ( ) esiste una e una sola soluzione u 2 H 1 ( ) del problema, e vale la stima di stabilità kukH 1 ( ) c kf kL2 ( ) . Si ri‡etta sulla condizione c (x) c0 > 0 che è stata richiesta. In particolare signi…ca che il termine di ordine zero non può mancare. Si consideri infatti il problema: Pn Pn (aij (x) uxi )xj + i=1 bi uxi = f in i;j=1 Pn su @ : i;j=1 aij uxi j = 0 Si osserva che la funzione u compare tanto nell’equazione quanto nelle condizioni al contorno solo mediante le sue derivate. Perciò se u è soluzione del problema, anche u+costante è soluzione. Viene a cadere l’unicità, pertanto il teorema non può essere vero sotto queste ipotesi. 259 5. Problema misto omogeneo. Consideriamo ora il problema misto: Pn 8 Pn < i;j=1 (aij (x) uxi )xj + i=1 bi uxi + cu = f u = 0 : Pn i;j=1 aij uxi j = 0 in su su (22.23) 0 1 dove 0 [ 1 = @ ; 0 \ 1 = ; con H n 1 ( 0 ) > 0. La formulazione debole del problema consiste nel cercare u 2 H 10 ( ) tale che Z a (u; ) = f dx per ogni 2 H 10 ( ) dove la forma bilineare è la stessa considerata in precedenza. Cambia ora lo spazio di Hilbert. Su H 10 ( ) vale la disuguaglianza di Poincaré, quindi la coercività si prova come nel caso 1, con la costante diam ( ) sostituita da una più generica costante c ( ). La conclusione quindi è la seguente: Teorema 22.9 Si consideri il problema (22.23) su un dominio di Rn limin 1 ( 0 ) > 0. Assumiamo le ipotesi tato, con @ = 0 [ 1 ; 0 \ 1 = ;; H (22.13), (22.14) e inoltre c (x) B 0 quasi ovunque in c( ) ;e : Allora per ogni f 2 L2 ( ) esiste una e una sola soluzione u 2 H 10 ( ) del problema, e vale la stima di stabilità kukH 1 ( ) c kf kL2 ( ) . Terminiamo questa rassegna di risultati di esistenza citando senza dimostrazione il seguente risultato sul problema agli autovalori per il laplaciano: Teorema 22.10 Sia valori: un dominio limitato e regolare. Il problema agli autou + u = 0 in u 2 H01 ( ) 1 ammette una successione crescente di autovalori positivi f k gk=1 , un sistema di autofunzioni uk 2 H01 ( ) corrispondenti, tali che: 1 2 1) fu n k gk=1 o è un sistema ortonormale completo di L ( ); 2) puk R k 1 k=1 k ! +1 e è un sistema ortonormale completo di H01 ( ) con il prodotto scalare ru rvdx. In particolare ciò signi…ca che k = Z 2 jruk j dx: 260 Questo risultato in particolare ci dice che si può risolvere un problema di Cauchy-Dirichlet per l’equazione del calore o delle onde, con dato al bordo nullo, applicando la separazione di variabili e sviluppando il dato iniziale (supposto in L2 ( )) in serie di autofunzioni uk . 22.4 Risultati di regolarità Una domanda che può venire spontanea a questo punto è: abbiamo provato che certi problemi hanno una soluzione debole in H 1 ( ); a questo modo però non si arriva a provare che la soluzione possieda due derivate e soddis… l’equazione in senso puntuale quasi ovunque (o ovunque). Da una parte, è ragionevole che sia così quando i coe¢ cienti hanno la minima regolarità richiesta, L1 ( ). D’altro canto, però, almeno nel caso in cui i coe¢ cienti siano più regolari, vorremmo poter recuperare una nozione più forte di soluzione. Questo in e¤etti è possibile, e fa parte della cosiddetta teoria della regolarità per le equazioni ellittiche. Si può dire che tutta la …loso…a della teoria delle soluzioni deboli consista appunto nello spezzare il problema della ricerca delle soluzioni in due due sottoproblemi: 1. Provare, sotto ipotesi minime, l’esistenza e unicità di una soluzione debole. Questo, come abbiamo visto, non è di¢ cile, grazie alla teoria degli spazi di Hilbert. 2. Provare che, nel caso i vari ingredienti dell’equazione (coe¢ cienti, termine noto, eventuali dati al bordo, e se richiesto anche il dominio stesso) sono più regolari, anche la soluzione debole è in e¤etti una funzione più regolare, e soddisfa l’equazione in un senso più forte. Enunciamo, in modo schematico e senza dimostrazioni, i risultati che si ottengono, limitandoci per semplicità al caso del problema di Dirichlet omogeneo (a cui comunque si riconduce anche il problema di Dirichlet non omogeneo). Nel prossimo schema riassumiamo solo le ipotesi di regolarità, senza più ripetere le ipotesi di altro tipo che devono comunque essere soddisfatte (uniforme ellitticità, condizione di segno su c (x) ; condizione di piccolezza del coe¢ ciente delle derivate prime): Soluzione u in senso: Ipotesi: minime: ulteriori: ulteriori: ulteriori: 1 coe¢ cienti aij ; bj ; c 2 LP ( ); n termine noto T = f0 + j=1 (fj )xj con fj 2 L2 ( ) coe¢ cienti aij 2 Lip ( ) ; termine noto f 2 L2 ( ) dominio con frontiera C 2 coe¢ cienti aij ; bj ; c regolari (ad es.21 aij 2 C 2 ; bj ; c 2 C 1 ) 1 termine noto f regolare (ad es. f 2 C ) dominio regolare (ad es. con frontiera C 3 ) coe¢ cienti, termine noto e dominio di classe C 1 261 u2 debole H1 ( ) forte (q.o.) H2 ( ) classico C2 classico C1 22.5 Risoluzione numerica di problemi ai limiti in forma debole Se, da una parte, la potenza del metodo basato sugli spazi di Hilbert è quella di permetterci di dimostrare risultati di esistenza, unicità e dipendenza continua della soluzione dai dati in condizioni molto generali (dominio di forma arbitraria, coe¢ cienti molto poco regolari), d’altro canto è facile capire che quando ci si trova e¤ettivamente in una situazione generale (ad esempio siamo in più variabili e il dominio non ha una forma semplice) non sarà possibile determinare la soluzione esatta. In questo caso è utile ricorrere a metodi di calcolo numerico. Un aspetto interessante della teoria in spazi di Hilbert è che si presta in modo naturale allo sviluppo di corrispondenti metodi numerici. Illustriamo l’idea generale del metodo di Galerkin per discretizzare un problema ai limiti dei tipi trattati in precedenza. Sia V uno spazio di Hilbert, a (u; v) una forma bilineare continua e coerciva su V : ja (u; v)j a (u; a) M kukV kvkV 2 kukV ; (22.24) (22.25) e consideriamo il problema: determinare u 2 V tale che a (u; v) = T v per ogni v 2 V; (22.26) dove T 2 V 0 è assegnato. Ricordiamo che i problemi di Dirichlet omogeneo, Neumann omogeneo e misto omogeneo si possono formulare in questo modo, scegliendo rispettivamente V = H01 ( ), V = H 1 ( ), V = H 1 ( ). Supponiamo di avere una famiglia fVh gh>0 di sottospazi di V …nito dimensionali, dimVh = Nh . La famiglia di sottospazi è indiciata su un parametro reale positivo che si farà tendere a zero; il signi…cato di questo parametro potrebbe essere quello di ampiezza della griglia di discretizzazione, come si spiegherà meglio in seguito. Consideriamo il problema discretizzato: determinare uh 2 Vh tale che a (uh ; vh ) = T vh per ogni vh 2 V (22.27) Per questo problema, ovviamente, vale a maggior ragione il risultato di esistenza, unicità e dipendenza continua della soluzione dai dati, in quanto la forma bilineare è continua e coerciva a maggior ragione su uno spazio più piccolo. In particolare varrà una stima di dipendenza continua kuh kV 1 kT kV 0 con la stessa costante 1 che vale su tutto V . Concretamente, il problema discretizzato si può risolvere così. Fissiamo una base in Vh ; 1; 2 ; :::; 262 Nh . La validità della condizione a (uh ; vh ) = T vh per ogni vh 2 Vh è equivalente alla validità delle Nh condizioni a (uh ; j) =T j per j = 1; 2; :::; Nh (22.28) (in quanto ogni vh 2 Vh si può scrivere come combinazione lineare delle funzioni della base). A sua volta, la ricerca di uh equivale alla ricerca dei coe¢ cienti Nh fci gi=1 che permettono di scrivere uh = Nh X ci (22.29) i i=1 e sostituendo questa scrittura nelle Nh equazioni (22.28) si trova il sistema: ! Nh X a ci i ; j = T j e quindi i=1 Nh X a ( i; j ) ci =T j; (22.30) i=1 che è un sistema Nh Nh nelle incognite ci avente per matrice dei coe¢ cienti A = fa ( i ; Nh j )gi;j=1 e per termini noti i numeri T j . Sappiamo già che il problema dev’essere solubile, ma veri…chiamo direttamente che questa matrice è invertibile mostrando che è de…nita positiva: 0 1 2 Nh Nh Nh Nh X X X X A a ( i; j ) i j = a @ i i; j j j j i;j=1 i=1 j=1 j=1 V PNh e questa norma si annulla solo se j=1 j j = 0; il che accade solo se tutti i numeri i sono nulli, poiché i vettori i sono per ipotesi linearmente indipendenti. Dunque A è de…nita positiva e perciò invertibile. Il sistema lineare Nh Nh (22.30) è quindi risolubile e i coe¢ cienti ci una volta determinati ci forniscono mediante (22.29) la soluzione del problema discretizzato (22.27). Si tratta ora di provare che la soluzione del problema discretizzato (22.27) converge alla soluzione del problema originario (22.26). E’questo il contenuto del prossimo teorema: Teorema 22.11 (Convergenza del metodo di Galerkin) Nelle ipotesi precedenti (22.24), (22.25), supponiamo che la famiglia di sottospazi fVh g sia scelta in modo che lim inf kvh vkV = 0 per ogni v 2 V . h!0 vh 2Vh 263 Allora detta uh la soluzione del problema (22.27) e u la soluzione del problema (22.26), si ha lim kuh ukV = 0: h!0 Dimostrazione. Sappiamo che a (uh ; vh ) = T vh 8vh 2 Vh (22.31) e a (u; v) = T v 8v 2 V; quindi in particolare è anche a (u; vh ) = T vh 8vh 2 Vh : (22.32) Sottraendo membro a membro (22.31) e (22.32) otteniamo a (u uh ; vh ) = 0 8vh 2 Vh : (22.33) Ora scriviamo, sfruttando la coercività, bilinearità e continuità della forma a: ku 2 uh k a (u = a (u uh ; u uh ; u uh ) = a (u uh ; u vh ) + a (u vh ) M ku uh k ku vh k ; dove abbiamo sfruttato il fatto che, per (22.33), a (u vh uh 2 Vh . Di conseguenza ku ku uh k 2 uh k u h ; vh u h ; vh uh ) uh ) = 0 perché M ku uh k ku vh k M ku vh k 8vh 2 Vh e quindi passando all’estremo inferiore al variare di vh 2 Vh ; ku uh k M inf ku vh 2Vh vh k : Ora per la nostra ipotesi sulla famiglia di sottospazi fVh g, il 2 membro tende a zero per h ! 0, dunque anche il primo, e la tesi è dimostrata. Il metodo di Galerkin appena descritto è in realtà una famiglia di metodi, o se vogliamo una strategia generale di risoluzione numerica del problema ai limiti considerato. Per applicarlo concretamente occorre de…nire la famiglia di sottospazi …nito dimensionali fVh g di V , e prima ancora naturalmente …ssare l’attenzione su un particolare problema (Dirichlet, Neumann, misto) e quindi …ssare lo spazio di Hilbert V . Poiché qui si entra qui nel calcolo numerico vero e proprio, che esula dal contenuto di questo corso, daremo solo qualche cenno schematico, rimandando al testo [17] per una trattazione approfondita. 264 Consideriamo per …ssare le idee il problema di Dirichlet omogeneo, per cui V = H01 ( ), e supponiamo anche, per semplicità, che l’operatore abbia la forma semplice Lu = r (a (x) ru) + cu; cioè la forma bilineare sia Z Z a (u; v) = a (x) ru (x) rv (x) dx + c (x) u (x) v (x) dx: (22.34) Consideriamo brevemente i due casi: è un intervallo della retta (problema unidimensionale) o è un aperto limitato del piano (problema bidimensionale). Metodo degli elementi …niti nel caso unidimensionale Sia = (a; b), suddividiamo (a; b) in N sottointervalli di ampiezza massima h. De…niamo Vh come lo spazio delle funzioni continue in [a; b] e zero agli estremi, che ristrette a ciascuno degli N intervallini risulti un polinomio di grado r, con r = 1; 2; 3; ::: E’possibile scegliere una base di questo spazio in modo che ogni elemento della base abbia supporto contenuto in non più di 3 intervallini adiacenti. A questo modo, quando si va a calcolare la matrice del sistema lineare che corrisponde al problema discretizzato a ( i; j) ; se la forma bilineare ha la forma (22.34) la matrice risulta tridiagonale, il che ovviamente alleggerisce i calcoli rispetto al caso generale in cui la matrice sia piena. Si dimostra che in questo caso kuh ukV tende a zero dell’ordine di hr dove, ricordiamo, h è l’ampiezza massima degli intervallini e r l’ordine dei polinomi, purché però la soluzione esatta appartenga allo spazio H r+1 (a; b), cosa che si può garantire se i coe¢ cienti a (x) ; c (x) sono su¢ cientemente regolari. Se ad esempio a 2 Lip (a; b) ; c 2 L1 (a; b) si può scegliere solo r = 1. Se a 2 C 2 [a; b] ; c 2 C 1 [a; b] si può scegliere r = 2; e così via. Metodo degli elementi …niti nel caso bidimensionale In questo caso il dominio viene triangolato, ossia suddiviso, seguendo certe avvertenze in cui qui non entriamo, in un certo numero di triangoli ciascuno di diametro h. (Supponiamo per semplicità che sia in partenza un dominio poligonale, altrimenti la sua triangolazione potrà solo approssimare ma non esaurirlo). Analogamente al caso unidimensionale, sceglieremo come Vh lo spazio delle funzioni continue in e zero su @ tali che la loro restrizione a ciascun triangolino sia un polinomio in due variabili di grado r. Si può scegliere una base di Vh costituita da elementi il cui supporto è contenuto in un piccolo numero di triangoli (precisamente, tutti quelli contenenti un nodo …ssato). Questo farà sì che, se la la forma bilineare ha la forma (22.34), la matrice fa ( i ; j )g risulti sparsa. Di nuovo, si dimostra che kuh ukV tende a zero dell’ordine di hr dove h è il diametro massimo dei triangolini e r l’ordine dei polinomi, purché però la soluzione esatta appartenga allo spazio H r+1 ( ) ; il che, come già spiegato, 265 si può garantire a priori sotto opportune ipotesi di regolarità dei coe¢ cienti dell’equazione. Per una trattazione del metodo di Galerkin in generale, ed in particolare del metodo degli elementi …niti, rimandiamo a [17, Cap.3]. In…ne, segnaliamo che gli elementi …niti non sono l’unico metodo per costruire sottospazi …nito dimensionali di H 1 ( ) adatti alla discretizzione dei problemi ai limiti. Si possono utilizzare anche i cosiddetti metodi spettrali, che consistono nel de…nire spazi di polinomi globali su , anziché funzioni aventi restrizione polinomiale su ciascun intervallino o triangolino. Si rimanda per questo a [17, Cap. 4]. 22.6 Alcuni esempi svolti Esempio 22.12 Risolvere il seguente problema ai limiti unidimensionale: 0 (a (x) u0 (x)) = 1 per x 2 ( 1; 1) u ( 1) = u (1) = 0 dove a (x) = 1 per x < 0 2 per x > 0 Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una sbarra che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di sinistra (es.: due metalli diversi saldati insieme); la temperatura ai due estremi è tenuta costante zero; una sorgente di calore riscalda uniformemente la sbarra in tutta la sua lunghezza (il termine noto 1). Si osservi che la discontinuità di a (x) rende impossibile interpretare classicamente l’equazione. Più precisamente, dal punto di vista classico si potrebbe ragionare come segue: per x < 0 la u risolve l’equazione: u00 = 1 in ( 1; 0) u ( 1) = 0 quindi x2 + ax + b 2 e imponendo la condizione nell’estremo sinistro u (x) = u (x) = a (x + 1) + x2 1 2 Per x > 0 la u risolve l’equazione 2u00 = 1 in (0; 1) u (1) = 0 266 : quindi x2 + cx + d 4 e imponendo la condizione nell’estremo destro u (x) = u (x) = c (x Ricapitoliamo: u (x) = ( 1) + x2 1 4 : 2 a (x + 1) + 1 2x per x < 0 2 c (x 1) + 1 4x per x > 0 (22.35) Ci servirà anche tener presente che: u0 (x) = a c x per x < 0 x 2 per x > 0 A questo punto abbiamo ancora due parametri da determinare, e dobbiamo decidere come raccordare le due funzioni in x = 0. Per avere una soluzione C 2 ( 1; 1) dovremmo imporre: il raccordo continuo di u; il raccordo continuo di u0 ; il raccordo continuo di u00 : Non è possibile: sono 3 condizioni, e abbiamo solo due coe¢ cienti. Bisogna rinunciare ad avere una soluzione C 2 e fare qualche compromesso. Qual è il compromesso giusto? La mentalità classica probabilmente suggerirebbe: se non possiamo avere u 2 C 2 ( 1; 1) ; scegliamo almeno u 2 C 1 ( 1; 1). Imponiamo quindi: il raccordo continuo di u; il raccordo continuo di u0 : Facendo così si ha: a + 12 = a=c c+ 1 4 raccordo continuo di u in 0 raccordo continuo di u0 in 0 che dà a=c= 267 1 8 e in de…nitiva u (x) = ( 1 8 1 8 (x + 1) + (x 1) + 1 x2 2 1 x2 4 per x < 0 per x > 0 Vediamo invece che cosa richiede la de…nizione di soluzione debole. La prima parte del discorso, cioè la scrittura di u nella forma (22.35) con i coe¢ cienti a; c da determinarsi, è ancora corretta perché: 1. Se u è soluzione debole del problema su tutto ( 1; 1) ; lo è anche su ( 1; 0) e su (0; 1): per vederlo, basta scegliere come particolari funzioni test H01 ( 1; 1) funzioni che siano identicamente nulle su metà dell’intervallo. 2. D’altro canto su ( 1; 0) e su (0; 1) il coe¢ ciente a (x) è continuo (costante!), perciò la soluzione debole è semplicemente la soluzione classica, che abbiamo appunto determinato. Questo mostra che anche la soluzione debole soddisfa le (22.35). Sappiamo che le funzioni H 1 ( 1; 1) sono continue, quindi il raccordo di continuità in 0 è necessario. Anche in questo caso dovrà valere quindi la condizione: a+ 1 2 = c+ 1 4 raccordo continuo di u in 0. Imponiamo, in…ne, che valga la de…nizione di soluzione debole: Z 1 Z 1 0 0 a (x) u (x) (x) dx = 1 (x) dx 1 cioè Z 1 0 0 u (x) 1 0 (x) dx + 2 Z 1 0 u (x) 0 0 (x) dx = Z 1 (x) dx 1 e quindi usando le espressioni che abbiamo calcolato per u0 nei due sottointervalli: Z 0 Z 1 Z 1 x 0 (a x) 0 (x) dx + 2 c (x) dx = (x) dx: 2 1 0 1 268 Possiamo ora integrare per parti in ciascuno dei due integrali a primo membro. Ricordando che ( 1) = 0 si ha: [(a 0 x) (x)] 1+ Z 0 (x) dx + 2 1 a (0) + Z h x 2 c 0 (x) dx Z i1 (x) + 2 0 1 0 2c (0) + 1 Z 0 1 (x) dx = 2 1 (x) dx = Z Z 1 (x) dx 1 1 (x) dx 1 che dà semplicemente a (0) che dovendo valere per ogni 2c (0) = 0; porta a 2c = 0 una condizione di raccordo diversa da quella classica (a = c); che unita alla condizione di raccordo continuo già imposta porta il sistema a + 21 = c + a 2c = 0 1 4 a= c= 1 6 1 12 e quindi u (x) = ( 1 6 (x + 1 12 (x 2 1) + 1 2x per x < 0 2 1) + 1 4x per x > 0 Si osserva che questa soluzione non è C 1 ( 1; 1). La derivata prima di u è discontinua. In compenso, la funzione a (x) u0 (x) è continua. A questo punto ci si può chiedere: la temperatura della sbarra metallica cosa fa in realtà? E’la soluzione classica di compromesso, C 1 ma non C 2 , o è la soluzione debole, H 1 ma non C 1 ; con u0 discontinua ma au0 continua? Se si ripercorre la deduzione matematica dell’equazione di di¤usione del calore, si vede che la funzione j (x) = a (x) u0 (x) ha il signi…cato …sico di densità di corrente termica (legge di Fourier di di¤usione del calore). In presenza di una discontinuità a salto nel coe¢ ciente di conducibilità, cioè in presenza di una brusca discontinuità nelle proprietà …siche del mezzo, non c’è una ragione 269 …sica per cui la derivata della temperatura debba essere continua. La continuità della densità di corrente termica è invece una condizione più naturale. Inoltre la funzione au0 (e non direttamente la funzione u0 ) viene a sua volta derivata. La de…nizione di soluzione debole porta in questo caso a richiedere la continuità delle due funzioni che vengono derivate: u e au0 . La soluzione …sicamente signi…cativa è quella debole. Esempio 22.13 Determinare la soluzione debole del seguente problema ai limiti: div (a (x; y) ru) = 1 u=0 con a (x; y) = per x2 + y 2 < 4 per x2 + y 2 = 4 1 per x2 + y 2 < 1 2 per 1 < x2 + y 2 < 4 Signi…cato …sico: equazione di di¤ usione del calore (in regime stazionario) in una piastra metallica circolare costituita da due materiali con coe¢ ciente di conducibilità diverso, uno che occupa un disco centrale e l’altro la corona circolare esterna. La temperatura al bordo è …ssata a zero, la piastra è riscaldata uniformemente (il termine di sorgente 1). Ragioniamo così. Anzitutto poiché l’equazione, il dominio, il dato al bordo e il termine noto sono radiali, ci aspettiamo una soluzione radiale, del tipo u (x; y) = u ( ). Sul cerchio interno x2 + y 2 < 1 la u risolve l’equazione u = 1; senza condizioni al contorno. In coordinate polari (supponendo già u radiale) si riscrive così: 1 0 u = 1; u00 che ponendo u0 = v si risolve come equazione lineare del prim’ordine in v e poi per integrazione in u. Si trova: 2 u ( ) = a log 4 + b; ma la parte in logaritmo non è accettabile perché vogliamo una soluzione limitata in 0, quindi a = 0 e 2 u( ) = Sulla corona circolare 4 + b per 2 (0; 1) : 2 (1; 2) la u soddisfa invece l’equazione 2 u = 1; 270 che diventa 1 u00 u0 = 1 ; 2 con integrale generale 2 u ( ) = c log 8 + d per 2 (1; 2) e ora non c’è motivo di scartare la soluzione logaritmica perché siamo su (1; 2). In compenso dobbiamo imporre la condizione al contorno u (2) = 0 che dà c= 1 2 d ; log 2 quindi u( ) = 1 2 d log 2 2 log 8 + d per 2 (1; 2) : Ora dobbiamo ragionare su come raccordare i due pezzi di soluzione per = 1. Una funzione H 1 di due variabili in generale può essere discontinua, ma se è radiale non può avere una discontinuità a salto in , perché questo corrisponderebbe ad una discontinuità a salto della funzione in due variabili lungo una circonferenza, cosa incompatibile con l’esistenza di derivate deboli. Quindi la u ( ) deve raccordarsi con continuità in = 1: Questo porta a: 1 + d; 8 1 b=d+ ; 8 1 +b= 4 quindi u( ) = u0 ( ) = ( ( 2 4 1 d log 2 2 +d+ 1 8 log 8 d log 2 +d per 2 1 2 per 2 1 4 per per 2 (0; 1) 2 (1; 2) 2 (0; 1) 2 (1; 2) Ora imponiamo che sia soddisfatta la de…nizione di soluzione debole, per determinare l’ultimo coe¢ ciente. La condizione Z Z a (x; y) ru r dxdy = dxdy; x2 +y 2 <4 applicata a delle x2 +y 2 <4 radiali e riscrivendo gli integrali in coordinate polari dà Z 2 Z 2 0 0 a( )u ( ) ( ) d = ( ) d 0 0 271 (si faccia attenzione alla comparsa del fattore dovuto al passaggio in coordinate polari) che possiamo ora riscrivere esplicitamente: Z 1 0 2 2 0 ( )d + Z 1 2 2 d log 2 2 1 1 0 4 ( )d = Z 2 ( ) d : 0 Ora integriamo per parti in ciascun integrale a primo membro e ricordiamo che (2) = 0 (attenzione: (0) non è zero in generale, perché = 0 è l’origine, non il bordo del dominio) 1 2 + Z 2 1 ( )d = 2 Z 2 ( ) + 0 Z 1 1 2d log 2 ( )d + 0 ( ) d 0 che porta a 1 (1) 2 ossia 1 2d log 2 1 2d log 2 1 2 = 0; d = (1) = 0 1 2 e in de…nitiva otteniamo la soluzione del problema iniziale: ( 2 5 per 2 (0; 1) 42 + 8 u( ) = 1 + per 2 (1; 2) 8 2 272 2 2 2 ( ) 1 Esempio 22.14 Si risolva il seguente problema di Sturm-Liouville con coe¢ ciente discontinuo, nel senso delle soluzioni deboli. 0 (a (x) u0 ) + u = 0 per x 2 ( 1; 1) u ( 1) = u (1) = 0 con a (x) = 1 per x < 0 2 per x > 0 Si osservi che a (x) per quanto discontinuo è discosto da zero, come nei problemi di Sturm-Liouville regolari. Ci aspettiamo quindi che esista una successione di autovalori e una successione di corrispondenti autofunzioni che siano un sistema ortonormale completo di L2 ( 1; 1). Veri…cheremo questo fatto risolvendo il problema. Per intanto possiamo dire che, grazie alla solita dimostrazione, gli eventuali autovalori sono necessariamente positivi: se u è autofunzione corrispondente a ; Z 1 Z 1 Z 1 2 2 2 0 0 u (x) dx a (x) u (x) dx = u (x) dx; 1 da cui 1 1 > 0: In ( 1; 0) la u risolve u00 + u = 0 per x 2 ( 1; 0) u ( 1) = 0 (senza condizione …ssata in 0), da cui (essendo u (x) = a cos p x + b sin 273 > 0), p x e imponendo la condizione u ( 1) = 0; 0 = a cos p p b sin ; p b = a cot ; h p p u (x) = a cos x + cot sin p x Analogamente, i per x 2 ( 1; 0) : 2u00 + u = 0 per x 2 (0; 1) u (1) = 0 da cui u (x) = c cos r 2 ! x e imponendo la condizione u (1) = 0 r ! r ! 0 = c cos d= c cot " u (x) = c cos + d sin 2 r ! 2 2 ! x ; ; 2 r 2 + d sin r ! x cot r ! 2 sin r 2 !# x per x 2 (0; 1) : Ora dobbiamo imporre delle condizioni di raccordo in x = 0. La u dev’essere continua, quindi imponiamo u (0) = a = c: Poiché il problema è omogeneo, l’unico parametro rimasto si può …ssare uguale a 1. Perciò abbiamo 8 p p p > x + cot sin x per x 2 ( 1; 0) < cos q q q u (x) = > cot sin per x 2 (0; 1) : : cos 2x 2 2x 8 p p p p p > sin x + cot cos x per x 2 ( 1; 0) < q q q q q u0 (x) = > cos per x 2 (0; 1) : : 2 sin 2x 2 cot 2 2x Con identità trigonometriche la u si riscrive in forma più semplice: 8 p sin( (x+1)) > > p per x 2 ( 1; 0) < sin( ) p u (x) = sin 2 (1 x) > > p per x 2 (0; 1) : : sin 2 274 Non abbiamo ancora determinato , e non abbiamo ancora sfruttato la de…nizione di soluzione debole. Imponiamo ora: Z 1 Z 1 a (x) u0 (x) 0 (x) dx = u (x) (x) dx Z 1 0 u0 (x) 0 (x) dx + 2 1 Z u0 (x) 0 1 1 Z 1 (x) dx = 0 u (x) (x) dx 1 e integriamo per parti nei due integrali a primo membro, all’interno dei quali la u0 è continua. Si ha (il calcolo è più chiaro se non scriviamo la forma esplicita di u e u0 ): 0 0 [u (x) (x)] = Z 1 1 Z 0 00 1 (x)]0 0 u (x) (x) dx + [2u (x) 1 Z 1 u00 (x) (x) dx 0 u (x) (x) dx: 1 Ora per come è stata determinata la u, risulta u00 = u in ( 1; 0) e in (0; 1), perciò gli integrali si sempli…cano e, sfruttando ( 1) = 0; si ha u0 0 2u0 0+ (0) = 0 e quindi u0 0 p cot p cot p = 2u0 0+ r = 2 = p 2 cot 2 cot r ! 2 r ! 2 : (22.36) Questa è l’equazione che, risolta in , dà gli autovalori. Ponendo t = tratta di cercare gli zeri della funzione f (t) = cot t + p 2 cot 275 t p 2 : p si Il gra…co è il seguente: 1 e si vede che esiste e¤ettivamente una successione f n gn=1 di autovalori. Determinando numericamente le prime soluzioni approssimate dell’equazione f (t) = 0 e ricordando che gli autovalori sono i quadrati di questi zeri possiamo scrivere i primi autovalori: 1 3:58458 2 12:9095 3 4 31:6026 52:9368 5 85:4482 Tracciamo i gra…ci delle prime autofunzioni corrispondenti 8 p sin( n (x+1)) > > p per x 2 ( 1; 0) < sin( n) p un (x) = n sin 2 (1 x) > > p per x 2 (0; 1) : : n sin 2 276 6 122:133 Le autofunzioni un quindi hanno l’andamento qualitativo di funzioni del tipo sin (n x); in particolare un (x) ha n 1 zeri nell’intervallo ( 1; 1). Si tratta di un sistema ortogonale completo di L2 ( 1; 1). Un’applicazione del problema di Sturm-Liouville precedente potrebbe essere la seguente: Esempio 22.15 Si risolva il seguente problema di Cauchy-Dirichlet per l’equazione del calore con coe¢ ciente di conducibilià discontinuo, nel senso delle soluzioni deboli. 8 per x 2 ( 1; 1) ; t > 0 < ut = (a (x) ux )x u ( 1; t) = u (1; t) = 0 per t > 0 : u (x; 0) = sin x per x 2 ( 1; 1) con a (x) = 1 per x < 0 2 per x > 0 Impostando il problema mediante separazione di variabili, u (x; t) = X (x) T (t) 277 si trova 0 XT 0 = T (a (x) X 0 ) 0 T0 (a (x) X 0 ) (t) = = T X che porta 0 (a (x) X 0 ) + X = 0 per x 2 ( 1; 1) X ( 1) = X (1) = 0 e T0 = T: Dunque si trova il problema di Sturm-Liouville precedente, e le soluzioni a variabili separate sono un (x; t) = e n t Xn (x) dove Xn (x) = e p n 8 > > < p sin( n (x+1)) p sin( n) sin > > : p sin n 2 p per x 2 ( 1; 0) (1 x) per x 2 (0; 1) : n 2 è l’n-esima soluzione positiva dell’equazione cot t + p 2 cot t p 2 = 0. La soluzione del problema sarà del tipo u (x; t) = 1 X cn e nt Xn (x) n=1 con cn scelti in modo che sia 1 X cn Xn (x) = sin x: n=1 Calcoliamo i primi coe¢ cienti. Ci serve anzitutto calcolare i coe¢ cienti di normalizzazione Z 1 2 In = Xn (x) dx: 1 Il calcolo numerico dà i seguenti valori per i primi interi n: In n=1 1:08375 2 4:1915 3 2:23712 4 1:31944 5 23:4058 6 1:00234 Calcoliamo quindi i coe¢ cienti di Fourier di sin x rispetto a questo sistema ortogonale: Z 1 1 cn = (sin x) Xn (x) dx: In 1 278 cn n=1 0:102342 2 0:466046 3 4 0:172129 5 0:0881589 6 0:00230943 0:0333009 A titolo di veri…ca, il gra…co di u0 (x) = sin ( x) ra¤rontato con la somma parziale 6 X S6 (x) = cn Xn (x) n=1 è il seguente: La corrispondente somma parziale della soluzione u (x; t), u6 (x; t) = 6 X cn e nt Xn (x) n=1 ha il seguente gra…co: ed è una buona approssimazione della soluzione del problema iniziale. 279 23 Esercizi sulla Parte 5 A. Derivate deboli e spazi di Sobolev Es 23.1 Calcolare in base alla de…nizione la derivata debole di u (x) = jxj in ( 1; 1) ; stabilendo per quali 2 R: a) la derivata debole esiste (in L1loc ( 1; 1)); b) la funzione u 2 H 1 ( 1; 1). Es 23.2 Stabilire quali delle seguenti funzioni appartengono ad H 1 ( 1; 1): f1 (x) = x log jxj f2 (x) = arctan x1 p x per x > 0 jxj f4 (x) = logjxj f5 (x) = 0 per x < 0 f3 (x) = f5 (x) = 1 x 1 per x 2 Q 0 per x 2 R Es 23.3 Si consideri la funzione u (x; y) = sin (xy) 2 sul quadrato Q = (0; 1) . y Si dimostri che u 2 H 1 (Q) e si determini la traccia di u su @ . A questa funzione è applicabile la disuguaglianza di Poincaré? Es 23.4 Stabilire se le seguenti funzioni appartengono a H 1 (Q) con Q = ( 1; 1) ( 1; 1): p p f1 (x; y) = pjxj + jyj f2 (x; y) = pjxyj f3 (x; y) = x2 + y 2 f4 (x; y) = 4 x2 + y 2 2 2xy x per y > x x2 y 2 per y > x f5 (x; y) = f6 (x; y) = xy per y < x x2 + y 2 per y < x Es 23.5 Dimostrare la Proposizione ?? [Suggerimenti. Primo punto (unicità): supporre che ci siano due funzioni che g1 ; g2 che soddisfano la de…nizione di derivata debole e mostrare che g1 g2 = 0 q.o. per un opportuno teorema di annullamento degli integrali; secondo punto (linearità): basta applicare la de…nizione di derivata debole e la linearità dell’integrale]. B. Formulazione debole di problemi ai limiti per equazioni ellittiche Es 23.6 Determinare la soluzione debole del seguente problema ai limiti unidimensionale: u00 = f (x) per x 2 ( 1; 1) u ( 1) = u (1) = 0 dove f (x) = 0 per x < 0 1 per x > 0 280 Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una sbarra che ha un coe¢ ciente di conducibilità costante; la temperatura ai due estremi è tenuta costante zero; una sorgente di calore (il termine noto f (x)) riscalda uniformemente la metà destra della sbarra, mentre la metà sinistra non ha pozzi o sorgenti di calore. Es 23.7 Determinare la soluzione debole del seguente problema ai limiti unidimensionale: 0 (a (x) u0 (x)) = f (x) per x 2 ( 1; 1) u ( 1) = u (1) = 0 dove a (x) = 1 per x < 0 f (x) = 2 per x > 0 0 per x < 0 1 per x > 0 Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una sbarra che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di sinistra (es.: due metalli diversi saldati insieme); la temperatura ai due estremi è tenuta costante zero; una sorgente di calore (il termine noto f (x)) riscalda uniformemente la metà destra della sbarra, mentre la metà sinistra non ha pozzi o sorgenti di calore. Es 23.8 Determinare la soluzione debole del seguente problema ai limiti unidimensionale: 0 (a (x) u0 (x)) + b (x) u0 (x) = 1 u ( 1) = u (1) = 0 dove a (x) = 1 per x < 0 b (x) = 2 per x > 0 per x 2 ( 1; 1) 1 per x < 0 0 per x > 0 Signi…cato …sico: equazione di di¤ usione e trasporto del calore (in stato stazionario) in un mezzo che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di sinistra (es.: due ‡uidi diversi a contatto in 0); solo nella metà di sinistra c’è anche un fenomeno di trasporto; la temperatura ai due estremi è tenuta costante zero; una sorgente di calore (il termine noto f (x)) riscalda uniformemente il mezzo. Es 23.9 Determinare la soluzione debole del seguente problema ai limiti unidimensionale: 0 (a (x) u0 (x)) + c (x) u (x) = 1 u ( 1) = u (1) = 0 dove a (x) = 1 per x < 0 c (x) = 2 per x > 0 per x 2 ( 1; 1) 2 0 per x < 0 per x > 0 Signi…cato …sico: equazione di di¤ usione e reazione di una certa sostanza (in stato stazionario) in un mezzo che ha un coe¢ ciente di di¤ usione diverso nella metà di destra e di sinistra (es.: due ‡uidi diversi a contatto in 0); solo nella metà di sinistra c’è anche un fenomeno di reazione, che distrugge parte della sostanza; la concentrazione u ai due estremi è tenuta costante zero; una sorgente (il termine noto f (x)) immette sostanza nel mezzo uniformemente. 281 Es 23.10 Determinare la soluzione debole del seguente problema ai limiti unidimensionale: ( 0 1 (a (x) u0 (x)) = p per x 2 ( 1; 1) 3 u ( 1) = u (1) = 0 dove a (x) = jxj 1 per x < 0 2 per x > 0 Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una sbarra che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di sinistra (es.: due metalli diversi saldati insieme); la temperatura ai due estremi è tenuta costante zero; una sorgente di calore (il termine noto f (x)) concentrata vicino all’origine riscalda la sbarra. Es 23.11 Determinare la soluzione debole del seguente problema ai limiti unidimensionale: 0 (a (x) u0 (x)) = f (x) per x 2 ( 1; 1) u ( 1) = u (1) = 0 dove a (x) = 1 2 1 3 per x < 0 f (x) = jxj per x > 0 Signi…cato …sico: equazione di di¤ usione del calore (in stato stazionario) in una sbarra che ha un coe¢ ciente di conducibilità diverso nella metà di destra e di sinistra (es.: due metalli diversi saldati insieme); la temperatura ai due estremi è tenuta costante zero; è presente una sorgente di calore (il termine noto f (x)) che riscalda la sbarra in modo non uniforme. Es 23.12 Si consideri il seguente problema di Dirichlet sul quadrato Q = [ 1; 1] [ 1; 1]: 8 1 +arctan x < exy 1 div ru (x; y) + 2+cos(1=y) u (x; y) = @x p in Q 4 1+y 2 x2 +y 2 : u = 0 su @Q: Scrivere esplicitamente la formulazione debole di questo problema (cioè: “trovare u nello spazio... tale che valga l’equazione integrale... per ogni :::”). Quindi dimostrare, sfruttando opportunamente il Teorema di Lax-Milgram, che il problema ha una e una sola soluzione: Si chiede di veri…care esplicitamente che sono veri…cate le ipotesi richieste, eseguendo esplicitamente le maggiorazioni con le costanti corrette. Es 23.13 Si consideri il seguente problema di Neumann sul quadrato Q = [ 1; 1] [ 1; 1]: ( xy x2 +y 2 u (x; y) = f (x; y) in Q div 1 + x2xy +y 2 ru (x; y) + e @u @ = 0 su @Q: 282 Scrivere esplicitamente la formulazione debole di questo problema (cioè: trovare u nello spazio... tale che valga l’equazione integrale... per ogni :::). Quindi dimostrare, sfruttando opportunamente il Teorema di Lax-Milgram, che il problema ha una e una sola soluzione per ogni f 2 L2 (Q) : Si chiede di veri…care esplicitamente che sono veri…cate le ipotesi richieste, eseguendo esplicitamente le maggiorazioni con le costanti corrette. Es 23.14 Si consideri il seguente problema di Dirichlet sul quadrato Q = [ 1; 1] [ 1; 1]: ( 2 2 y 1 x2xy + xx4 +y 1 + x2xy 4 u = f (x; y) in Q +y 2 ux +y 2 uy x y u = 0 su @Q: Scrivere esplicitamente la formulazione debole di questo problema (cioè: trovare u nello spazio... tale che valga l’equazione integrale... per ogni :::). Quindi dimostrare, sfruttando opportunamente il Teorema di Lax-Milgram, che il problema ha una e una sola soluzione per ogni f 2 L2 (Q) : Si chiede di veri…care esplicitamente che sono veri…cate le ipotesi richieste, eseguendo esplicitamente le maggiorazioni con le costanti corrette. 23.1 Soluzioni di alcuni esercizi della Parte 5 Soluzione Es. 23.6. u (x) = 1 4 (x + 1) x2 1 2 + 4x + per x < 0 per x > 0 1 4 Soluzione Es. 23.7. u (x) = 0 1 4 Soluzione Es. 23.8. 8 5 < x+1 2 3 2e u (x) = : 41 1 x2 + per x < 0 per x > 0 x2 1 ex 1 1 4 e 3 2e e 1 per x < 0 (x 1) per x > 0 1 1 Si noti la di¤erenza tra il ruolo di a (x) u0 e b (x) u0 nell’equazione: imponendo che l’equazione sia soddisfatta in senso debole si trova che dev’essere continua (oltra alla u stessa) la funzione a (x) u0 ; non la funzione b (x) u0 . Soluzione Es. 23.9. 1 u (x) = 2 + cos x 3 4 + x2 4 1 2 3 2 + 23 sin x per x < 0 x + 1 + 12 per x > 0 Anche in questo caso risultano continue u (x) e a (x) uxi ; mentre il termine di ordine zero c (x) u (x) risulta discontinuo. 283 Soluzione Es. 23.10. u (x) = 9 10 9 20 3 10 3 20 x5=3 + 1 1 x5=3 (x + 1) per x < 0 (x 1) per x > 0 Soluzione Es. 23.11. Risolviamo prima separatamente nelle due metà [ 1; 0] ; [0; 1] in cui a e f sono regolari e la soluzione è quella classica. In [ 1; 0]: u00 (x) = 2x per x 2 ( 1; 0) u ( 1) = 0 che dà: x3 + ax + b 3 1 0 = u ( 1) = 3 1 a= : 3 u (x) = b a+b In [0; 1]: u00 (x) = 3x per x 2 (0; 1) u (1) = 0 che dà: x3 + cx + d 2 1 +c+d 0 = u (1) = 2 1 c+d= : 2 u (x) = Imponendo la continuità di u in 0 (necessaria a¢ nché u sia H 1 ( 1; 1)) si trova b = d. Quindi abbiamo: ( 3 x ax + b per x 2 ( 1; 0) 3 + u (x) = x3 2 + cx + b per x 2 (0; 1) con b a= c+b= 1 3 1 2 La terza condizione mancante per determinare i coe¢ cienti si ottiene imponendo che u sia soluzione in senso debole su tutto ( 1; 1): Z 1 Z 1 a (x) u0 (x) 0 (x) dx = f (x) (x) dx 1 1 ossia, calcolando u0 (x) = x2 + a per x 2 ( 1; 0) 3 2 x + c per x 2 (0; 1) 2 284 Z 0 1 1 2 x +a 2 0 Z (x) dx+ 1 0 1 3 3 2 x +c 2 0 (x) dx = Z 0 1 Z x (x) dx+ 1 x (x) dx 0 Integrando per parti a primo membro: Z 1 Z 0 a x2 c x2 0 0 + (x) dx + + (x) dx 2 2 2 3 0 1 Z 0 0 x2 a = + (x) x (x) dx 2 2 1 1 Z 1 1 c x2 + (x) + x (x) dx + 2 3 0 0 Z 0 Z 1 a c = (0) x (x) dx + x (x) dx 2 3 1 0 che uguagliato al secondo membro dà la condizione a 2 c = 0: 3 (Equivalente alla condizione di continuità di a (x) u0 (x) in 0). Si tratta ora di risolvere il sistema 8 8 1 < a = 15 < b a = 13 2 1 b= 5 c+b= che dà: : : a c 2 1 = 0 c = 10 2 3 e quindi la soluzione: u (x) = ( x 2 x3 3 + 15 + 5 x3 x 2 2 + 10 + 5 per x 2 ( 1; 0) per x 2 (0; 1) A titolo illustrativo, scriviamo esplicitamente anche la densità di corrente termica, che risulta continua: ( 2 x 1 per x 2 ( 1; 0) 0 2 + 30 a (x) u (x) = x2 1 + per x 2 (0; 1) 2 30 Soluzione Es. 23.13. Formulazione debole del problema: determinare u 2 H01 (Q) per cui si abbia: Z Z xy xy 1+ 2 ux (x; y) x (x; y) + 1 uy (x; y) 2 2 + y2 x + y x Q 2 2 + x y u (x; y) (x; y) dxdy = + y4 x4 Z Z Q Ipotesi da veri…care: 285 y (x; y) (23.1) f (x; y) (x; y) dxdy 8 2 H01 (Q) : 1. I coe¢ cienti della parte principale devono essere misurabili ed essenzialmente limitati. Sono misurabili perché continui tranne in un punto; sono essenzialmente limitati perché x2 xy = (in polari) + y2 2 cos # sin # 2 = 1 sin 2# 2 1 : 2 2. Coercività: 1+ xy x2 + y 2 2 1 xy x2 + y 2 + 1 2 2 2 1 + 2 2 : (23.2) Vero perché: 1+ 1 xy + y2 xy 2 x + y2 x2 1 1 1 1 = ; 2 2 1 1 = 2 2 (per la maggiorazione precedente), quindi la (23.2) vale con = 1=2: 3. Condizione di segno del coe¢ ciente del termine di ordine zero: x2 y 2 x4 + y 4 0, ovvio. Pertanto il Lemma di Lax Milgram implica che la forma bilineare data dal primo membro della (23.1) è continua e coerciva su H01 (Q), perciò il problema nella sua formulazione debole è ben posto. 286 Riferimenti bibliogra…ci [1] A. Boggess, F. J. Narcowich: A First Course in Wavelets with Fourier Analysis. Jouhn Wiley & Sons, 2009. [2] M. Bramanti: Esercitazioni di Analisi 2. Ed. Esculapio, Bologna, 2012. [3] M. Bramanti: Esercitazioni di Analisi 3. CUSL, 1993. [4] M. Bramanti, C. D. Pagani, S. Salsa: Analisi Matematica 1, Zanichelli 2008. [5] M. Bramanti, C. D. Pagani, S. Salsa: Analisi Matematica 2, Zanichelli 2009. [6] H. Brezis: Analisi Funzionale. Teoria e Applicazioni. Liguori Ed. [7] H. Brezis, F. Browder: Partial Di¤erential Equations in the 20th Century. Advances in Mathematics 135, 76 144 (1998). [8] L. Fanghua, Y. Xiaoping: Geometric measure theory. An introduction. Science Press, 2002. [9] S. Farlow: Partial di¤erential equations for scientists and engineers. Dover, 1982. [10] G. Folland: Real Analysis. Modern applications and techniques. Wiley, 1984. [11] D. Gilbarg, N. S. Trudinger: Elliptic Partial Di¤erential Equations of Second Order. 2nd edition. 1983, Springer. [12] J. H. Hunter, B. Nachtergaele: Applied Analysis. World Scienti…c, 2001. [13] T. Jones: The Legendre and Laguerre polynomials and the elmentary quantum mechanical model of the hydrogen atom. http://www.physics.drexel.edu/~tim/open/hydro…n/hyd.pdf [14] R. Onyshczak, A.Youssef: Fingerprint Image Compression and the Wavelet Scalar Quantization Speci…cation, Chap. 19 in N. Ratha, R. Bolle, Editors: Automatic Fingerprint Recognition System, Springer 2004. [15] C.D. Pagani, S. Salsa: Analisi Matematica vol. 2, Masson, 1991. [16] V. Pata: Analisi reale e funzionale. Dispensa in rete scaricabile dalla pagina (le due righe qui sotto formano un unico link): http://www.mate.polimi.it/viste/studenti/send_new.php?tipo= a&id=121&id_insegnamento=419&id_blob=22627 [17] A. Quarteroni: Modellistica numerica per problemi di¤erenziali. Terza ed. Springer, 2006. 287 [18] S. Salsa, F. Vegni, A. Zaretti, P. Zunino: Invito alle equazioni a derivate parziali. Springer, 2009. [19] S. Salsa, G. Verzini: Equazioni a derivate parziali. Complementi ed esercizi. Springer, 2007. [20] K. Saxe. Beginning functional analysis. Springer 2010. [21] W. Rudin: Real and complex analysis. McGraw-Hill Book Co., New York, 1987. [22] H. Weinberger: A …rst course in partial di¤erential equations. Dover, 1965. 288
© Copyright 2025 ExpyDoc