Dipartimento di Economia Corso di Statistica Computazionale

Dipartimento di Economia
Corso di Statistica Computazionale
Esercitazione n. 1
Aprire Stata e svolgere le seguenti analisi, salvando il lavoro svolto in un apposito file .smcl.
• Unire i due dataset efige1.dta e efige2.dta in maniera opportuna, in modo da creare un unico
insieme di dati.
• Con riferimento al dataset efige.dta, procedere con le analisi di seguito elencate.
1. Effettuare uno spoglio delle variabili employees, roe, region, sector e porre a missing le eventuali
osservazioni palesemente errate.
2. Partendo dalla variabile quantitativa employees, creare una variabile qualitativa ordinale (e chiamarla dimensione) per individuare aziende di dimensione piccola (fino a 15 dipendenti), media (tra
16 e 100 dipendenti) e grande (oltre 100 dipendenti).
3. Assegnare alle modalit`
a della suddetta nuova variabile opportune etichette.
4. Partendo dalle variabili binarie north, centre, south isl, creare la variabile qualitativa ordinale
corrispondente (chiamarla areageo) e assegnarle opportune etichette.
5. Costruire le tabelle doppie delle frequenze assolute e percentuali, sia congiunte che condizionate,
per le variabili dimensione e areageo.
6. Con riferimento all’analisi di cui al punto precedente, verificare l’ipotesi di indipendenza statistica
tra dimensione e areageo tramite il test Chi-quadrato e determinare l’indice V di Cramer.
7. Determinare media aritmetica, mediana e deviazione standard della variabile roe.
8. Ripetere l’analisi di cui al punto precedente, distinguendo per dimensione dell’azienda.
9. Determinare il ROE medio in funzione della dimensione dell’azienda e dell’area geografica.
10. Determinare i quartili del ROE, distinguendo per area geografica e in totale.
11. Rappresentare, tramite un box plot, la variabile roe, distinguendo per area geografica.
12. Cercare sull’help di Stata il comando hadimvo e utilizzarlo per individuare dati anomali nella
variabile roe.
1
13. Rappresentare, tramite un diagramma a torta, la distribuzione delle aziende per settore economico,
dopo aver proceduto con le opportune aggregazioni delle modalit`a originarie della variabile sector.
14. Avvalendosi dell’help di Stata, stimare un modello di regressione lineare che spieghi il ROE in
funzione di alcune covariate selezionate in modo opportuno (si scelgano almeno una covariata quantitativa, almeno una qualitativa binaria e almeno una qualitativa ordinale).
2