Struttura e contenuti del corso

Appendice: struttura e contenuti del corso
Luca Mari, versione 15.5.14
Il corso di Analisi dei Dati Sperimentali e Statistica è concettualmente strutturato in tre parti:
A. Introduzione alla statistica descrittiva e alcune sue applicazioni
B. Introduzione alla teoria della probabilità
C. Introduzione alla statistica inferenziale e alcune sue applicazioni
Ogni lezione, di 4 ore, prevede 2 ore “di teoria”, in aula, e 2 ore “di applicazioni”, in laboratorio.
I contenuti delle lezioni sono i seguenti.
1. Introduzione al corso; questionario di ingresso e discussione relativa
Lab. Introduzione ai fogli di calcolo ed esercizi: riferimenti relativi, assoluti, misti; successioni dipendenti dal
valore iniziale e dal delta; tavola moltiplicativa 10x10 in funzione del valore iniziale
2. Insiemi, successioni e variazioni, tasso di crescita; successioni temporali, variazioni
Lab. Generazione di successioni deterministiche, in funzione di una successione indice controllata da valore
iniziale e delta; acquisizione di successioni esistenti (per esempio da pagine web); generazione di successioni
variazione, assoluta, relativa, derivata
3. Popolazioni, campioni e campionamento (schemi di campionamento: con reintroduzione, senza
reintroduzione, di Polya); categorie e distribuzioni, a frequenze assolute e relative: moda su campioni e su
distribuzioni (distribuzioni unimodali e multimodali)
Lab. Generazione di campioni casuali, anche per interi; tecniche di campionamento nei fogli di calcolo;
generazione di distribuzioni, per frequenze, assolute e relative; statistiche su campioni e distribuzioni
4. Distribuzioni cumulate; mediana, quartili e percentili; significatività empirica; media aritmetica, su campioni
e su distribuzioni; confronto tra statistiche in termini di robustezza; media geometrica
Lab. Statistiche su campioni e distribuzioni nel caso ordinale; media aritmetica, su campioni generati e relative
distribuzioni
5. Statistiche di dispersione / scale: range, distanza inter-quartili, deviazione standard; disuguaglianza di
Chebycheff
Lab. Distribuzioni con categorie non unitarie e media e deviazione standard di tali distribuzioni
6. Statistiche per campioni bivariati; distribuzioni congiunte, condizionali e marginali; covarianza e
coefficiente di correlazione campionaria
Lab. Verifica numerica della disuguaglianza di Chebycheff; generazione di campioni bivariati e calcolo del
coefficiente di correlazione campionaria; generazione di diagrammi di dispersione
Prima prova intermedia
7. Serie storiche: statistiche progressive e mobili
Lab. Demo di visualizzazione di serie storiche da GapMinder e quindi scelta di una serie storica su cui
operare; generazione e visualizzazione di statistiche progressive e mobili (con estremo destro al presente)
8. Regressione lineare con i minimi quadrati; analisi dei residui: autocorrelazione e autocorrelogramma
Lab. Generazione di una serie storica con un trend, una periodicità, del rumore; calcolo e visualizzazione di un
autocorrelogramma
9. Correlazione e trend; standardizzazione di campioni; variabili casuali; campioni di statistiche campionarie e
statistiche relative; teorema del limite centrale
Analisi dei Dati Sperimentali e Statistica
1
Lab. Verifica numerica dell’uguaglianza correlazione-trend; generazione di campioni multipli, media delle
medie, deviazione standard delle medie; istogramma dei campioni e delle medie dei campioni
10. Elementi di analisi combinatoria
Lab. Esempi di problemi di analisi combinatoria
11. [no lezione]
Lab. Revisione dei principali concetti di analisi di serie storiche; coefficiente di determinazione; regressioni non
lineari
Seconda prova intermedia
12. Introduzione alla probabilità: algebre booleane e assiomi di Kolmogorov
Lab. A partire da una popolazione di voti, generazione di campioni con criteri dati (maggiore di 24, …), e
generazione dei campioni somma e prodotto e calcolo delle rispettive frequenze relative, in modo diretto e, per
verifica, con le regole corrispondenti; primo cenno al concetto di probabilità condizionata
13. Probabilità condizionate e regola di Bayes (esempio da Hacking)
[no lab]
14. Indipendenza statistica; introduzione alle distribuzioni di probabilità, pmf e pdf: rettangolare e uniforme
Lab. Controllo qualitativo di indipendenza statistica per eventi da un campione bivariato (alta inflazione e alta
disoccupazione); introduzione numerica alla distribuzione gaussiana, pdf e cdf
15. Distribuzioni di probabilità, densità, cumulate e inverse, discrete e continue; momenti (a partire dal calcolo
corrispondente per distribuzioni a frequenze relative); cdf inversa con rand() come generatore di numeri
casuali; distribuzioni bernoulliana e binomiale
Lab. Problemi di calcolo diretto di (misura di) probabilità da distribuzioni: binomiale e gaussiana, a partire da
pdf e cdf
16. Struttura analitica della pdf gaussiana; variabili casuali e distribuzioni di probabilità: esempi
Lab. Variabili casuali e distribuzioni di probabilità: esempi
Terza prova intermedia
17. Dalla statistica descrittiva alla statistica inferenziale; la logica dell’inferenza bayesiana nello schema
bernoulliano
Lab. Inferenza bayesiana computazionale: il caso binomiale
18. Inferenza bayesiana: il caso gaussiano
Lab. Inferenza bayesiana computazionale: il caso gaussiano; introduzione al test di ipotesi
19. Test di ipotesi, fino a goodness of fit incluso
Lab. Esempi di applicazioni di test di ipotesi
20. Test di ipotesi: goodness of fit per distribuzione rettangolare a due categorie (sì / no indifferenti) e per
indipendenza tra due variabili casuali
Lab. Esempi di applicazioni di test di ipotesi; introduzione al problema dell’incertezza nella misurazione
21. Incertezza nella misurazione: incertezza tipo, relativa, estesa; propagazione delle incertezze nel caso 1D
Lab. Esempio di un problema 1D completo: da un campione di lunghezze, a (i) valore misurato, incertezza
tipo, relativa, estesa (con considerazioni sul numero di cifre da riportare); (ii) valore misurato e incertezza tipo
per l’area di un oggetto quadrato; (iii) decisione di conformità a specifiche date
22. Propagazione delle incertezze nel caso nD e propagazione delle distribuzioni con metodo MonteCarlo
Lab. Esempio di un problema nD con soluzione analitica e numerica
Analisi dei Dati Sperimentali e Statistica
2
23. Revisione degli argomenti della quarta parte del corso: inferenza bayesiana; test di ipotesi; propagazione
delle incertezze
Quarta prova intermedia
Analisi dei Dati Sperimentali e Statistica
3