ISTAT Multiscopo ISTAT – Aspetti della vita quotidiana 2013 Codice SN130 ADPSS-SOCIODATA Archivio Dati e Programmi per le Scienze Sociali www.sociologiadip.unimib.it/sociodata E-mail: [email protected] Tel.: 02 64487513 Fax: 02 64487561 La presente documentazione è distribuita da ADPSS-Sociodata. La sua utilizzazione è consentita esclusivamente per finalità didattiche o di ricerca scientifica. In caso di pubblicazione si richiede sempre di citare sia la fonte originaria di provenienza della documentazione sia l’archivio dati italiano che l’ha resa disponibile. Università degli Studi di Milano-Bicocca Dipartimento di Sociologia e Ricerca Sociale INDICE TABLE OF CONTENTS Note Metodologiche Methodological Notes 1. Aspetti metodologici dell’indagine Survey’s methodological issues ………………….....…. p. 3 2. Descrizione del file File description ……………………….....…………… p. 25 ASPETTI METODOLOGICI DELL’INDAGINE SURVEY’S METHODOLOGICAL ISSUES File ad uso pubblico mIcro.STAT Aspetti della vita quotidiana 2013 Descrizione del file Giugno 2014 INDICE 1. Introduzione .................................................................................................................. 3 2. Descrizione delle variabili ............................................................................................. 4 3. Metodologia statistica per la tutela della riservatezza ................................................... 6 4. Riferimenti bibliografici................................................................................................ 14 5. Autore………………………………………………………………………………………...14 6. Curatori.….……………………………………………………………………………………14 7. Appendice 1..…………………………………………………………………………………15 8. Appendice 2..…………………………………………………………………………………19 2 1. Introduzione I file di microdati ad uso pubblico (mIcro.STAT) sono collezioni campionarie di dati elementari relative ad alcune indagini svolte dall’Istat, per le quali siano già stati sviluppati i corrispondenti file di microdati per la ricerca (MFR1). Grazie ad un’apposita metodologia statistica che garantisce la tutela della riservatezza dei rispondenti, questi possono essere liberamente scaricati direttamente dal sito Istat. Il file ad uso pubblico mIcro.STAT relativo all’indagine multiscopo Aspetti della vita quotidiana, periodo di riferimento 2013, ha le seguenti caratteristiche: a) è prodotto dal corrispondente file della ricerca attraverso tecniche di sottocampionamento; b) la struttura, il livello di dettaglio ed il trattamento delle variabili sono ereditate dal corrispondente file per la ricerca, MFR; c) la precisione e l’accuratezza delle stime che si possono calcolare utilizzando il mIcro.STAT sono inferiori alle corrispondenti stime calcolabili sia a partire dai microdati originali sia a partire dal corrispondente file per la ricerca. Quindi è possibile che alcuni dati ottenuti elaborando il mIcro.STAT non coincidano con quanto già pubblicato dall’Istat. Nella Sezione 2 sono fornite alcune informazioni sintetiche sulle modifiche subite dalle variabili nella predisposizione del mIcro.STAT. La metodologia per la tutela della riservatezza è brevemente descritta nella Sezione 3. 1 MFR è l’acronimo per il file per la ricerca (Microdata File for Research). La documentazione metodologica di tali file è consultabile sul sito Istat (http://www.istat.it/it/archivio/file-per-la-ricerca). 3 2. Descrizione delle variabili In questo paragrafo sono descritte in breve i cambiamenti indotti dal metodo di protezione dei dati adottato per l’indagine multiscopo Aspetti della vita quotidiana, periodo di riferimento 2013. Tali cambiamenti sono stati necessari per proteggere la riservatezza dei rispondenti. La protezione dei dati individuali è stata raggiunta modificando il contenuto informativo di alcune variabili. Il file mIcro.STAT è fornito in formato delimitato da tabulatore. Le unità statistiche del mIcro.STAT sono le famiglie residenti in Italia e i membri che le compongono. Il separatore decimale è “.”. Il file mIcro.STAT contiene 20275 records e 1082 variabili. Tabella 1. Lo status2 delle variabili nel file mIcro.STAT3 modificate per motivi di tutela della riservatezza. Nome Campo prov com Nome Variabile Disponibilità Modifica SDC provincia di rilevazione comune di rilevazione SI SI profam progressivo famiglia univoco a livello indagine SI codril codice della rilevazione SI eta Età in anni compiuti SI stciv Stato civile SI istr Titolo di studio SI cond Condizione professionale SI posiz posizione nella professione SI tipfa2 Tipologia familiare 2 SI peso stat bicbirra validata solo per le persone di 18 anni e più: peso in kg validata solo per le persone di 18 anni e più: statura in cm Soppressa Soppressa Sostituita con un numero fittizio Soppressa Modificata a 18 modalità Modificata a 4 modalità Modificata a 6 modalità Modalità 6, 8 insieme Modificata a 4 modalità Modificata a 33 modalità SI Modificata SI Modificata consumo abituale al giorno di birra, in bicchieri SI Aggregazione per valori maggiori di 5 2 Si fa riferimento esclusivamente alle misure di riduzione del rischio di violazione della riservatezza. Il file mIcro.STAT conserva la struttura ed il livello di dettaglio del corrispondente file per la ricerca, si veda http://www.istat.it/it/archivio/file-per-la-ricerca. 3 4 bicvino consumo abituale al giorno di vino, in bicchieri SI bicfuori complessivamente in una settimana quanti bicchieri di vino o alcolici consuma abitualmente fuori dai pasti? SI bicaltro numero di bicchieri al giorno di aperitivi alcolici, amari o superalcolici SI nbicalc consumo di bevande alcoliche negli ultimi 12 mesi, numero bicchieri SI modco difco colf modalità di compilazione del questionario autocompilato completezza e difficoltà di compilazione del questionario autocompilato la famiglia si avvale di: collaboratore/collaboratrice domestico/a Aggregazione per valori maggiori di 5 Aggregazione per valori maggiori di 20 Aggregazione per valori maggiori di 5 Aggregazione per valori maggiori di 20 SI Soppressa SI Soppressa SI babys la famiglia si avvale di: baby-sitter SI assanz la famiglia si avvale di: persona che assiste un SI anziano o un disabile nmotor numero motorini, scooter SI nmoto numero di motociclette, moto SI nauto numero automobili SI notfam le notizie sulla scheda familiare sono state fornite da uno o da più componenti? SI Modalità 02, 23, 03 insieme Modalità 02, 23, 03 insieme Modalità 02, 23 e 03 insieme Aggregazione per valori maggiori di 3 Aggregazione per valori maggiori di 3 Aggregazione per valori maggiori di 3 Soppressa 5 3. Metodologia statistica per la tutela della riservatezza 3.1. Scenari di violazione della riservatezza La valutazione statistica del rischio di violazione della riservatezza avviene attraverso diverse ipotesi su quali siano le intenzioni di un intruder e su quali informazioni abbia a disposizione. Le unità statistiche a rischio di violazione della riservatezza sono state identificate ipotizzando i seguenti scenari di violazione della riservatezza: • il primo definito dalle informazioni registrate in un archivio esterno pubblico e nominativo disponibile all’intruder, contenente informazioni associabili a quelle contenute nel file rilasciato, che permetterebbe all’intruso di identificare la persona di riferimento della famiglia (pr), la famiglia nel suo insieme e i componenti della famiglia. • il secondo definito da un’identificazione spontanea causata dalla natura o dal dettaglio di registrazione di alcune variabili (valori anomali) presenti nell’archivio indagine. Considerando il fatto che le unità statistiche nel file non sono indipendenti, ma sussistono relazioni di dipendenza fra le unità statistiche, ossia sussiste una relazione gerarchica fra un individuo e la famiglia a cui appartiene, si è ritenuto opportuno valutare il rischio di violazione della riservatezza utilizzando un approccio individuale, proposto da Benedetti e Franconi (1998), basato sul rischio di violazione definito in termini probabilistici per la stima del rischio individuale per tutti gli individui contenuti nel file da rilasciare. 3.2. Modifiche del contenuto informativo delle variabili 3.2.1. Soppressione delle variabili Le variabili soppresse dal file mIcro.STAT per motivi di tutela della riservatezza sono elencate di seguito: Tabella 2. Variabili soppresse per motivi di tutela della riservatezza. Nome Campo Nome Variabile prov provincia di rilevazione com comune di rilevazione Motivazione Nessun valore aggiunto al potenziale di ricerca Nessun valore aggiunto al potenziale di ricerca 6 codril modco difco notfam codice della rilevazione modalità di compilazione del questionario autocompilato completezza e difficoltà di compilazione del questionario autocompilato le notizie sulla scheda familiare sono state fornite da uno o da più componenti? Nessun valore aggiunto potenziale di ricerca Nessun valore aggiunto potenziale di ricerca Nessun valore aggiunto potenziale di ricerca Nessun valore aggiunto potenziale di ricerca al al al al Le variabili inserite in Appendice 1 sono variabili non significative oppure variabili di controllo/lavoro, quindi prive di un contenuto analitico. Di conseguenza, sono state soppresse. La soppressione4 di una variabile equivale alla completa cancellazione del suo contenuto, ossia tutti i suoi valori sono sostituiti con un numero di spazi (carattere “ ”) pari alla lunghezza indicata nel tracciato record. 3.2.2. Ricodifica globale La ricodifica globale è uno dei più semplici e noti metodi di protezione dei dati individuali. Si può applicare solamente alle variabili categoriali. Essa consiste nell’accorpamento di alcune modalità della variabile categoriale. Ovviamente, le nuove modalità non hanno più il significato precedente. Per il rilascio del file ad uso pubblico, mIcro.STAT, Aspetti della vita quotidiana, periodo di riferimento 2013, sono state ricodificate le seguenti variabili: 1. eta – La variabile età è stata rilasciata utilizzando la seguente classificazione: 4 Etichetta Descrizione 1 2 3 4 5 6 7 8 9 10 11 0 – 2 anni 3 – 5 anni 6 – 10 anni 11 – 13 anni 14 – 17 anni 18 – 19 anni 20 – 24 anni 25 - 29 anni 30 – 34 anni 35 – 39 anni 40 – 44 anni Variabili soppresse sia per motivi di tutela della riservatezza e in quanto campi non significativi. 7 12 13 14 15 16 17 18 45 – 49 anni 50 – 54 anni 55 – 59 anni 60 – 64 anni 65 – 74 anni 75 – 84 anni 85 e più anni 2. stciv – La variabile stato civile è stata ricodificata con le seguenti modalità: Etichetta Descrizione 1 celibe/nubile 2 coniugato/a coabitante con il coniuge coniugato/a non coabitante con il coniuge (separato/a di 3 fatto) o separato/a legalmente o divorziato/a 6 vedovo/a 3. tipfa2 – La variabile tipologia familiare è stata ricodificata con le seguenti modalità: Etichetta Descrizione 1 persona sola 10 monogenitore maschio celibe senza isolati monogenitore maschio separato di fatto senza isolati o monogenitore maschio separato legalmente 11 senza isolati o monogenitore maschio divorziato senza isolati 14 monogenitore maschio vedovo senza isolati 15 monogenitore femmina nubile senza isolati monogenitore femmina separata di fatto senza isolati o monogenitore femmina separata legalmente 16 senza isolati o monogenitore femmina divorziata senza isolati 19 monogenitore femmina vedova senza isolati 2 genitore con figli non celibi o nubili 20 coppia coniugata senza figli con isolati 21 coppia non coniugata senza figli con isolati 22 coppia coniugata con figli con isolati 23 coppia non coniugata con figli con isolati 24 monogenitore maschio celibe con isolati monogenitore maschio separato di fatto con isolati o 25 monogenitore maschio separato legalmente con isolati o monogenitore maschio divorziato con isolati 28 monogenitore maschio vedovo con isolati 29 monogenitore femmina nubile con isolati 8 3 30 33 34 35 36 37 38 39 4 40 41 5 6 7 8 9 insieme di parenti monogenitore femmina separata di fatto con isolati o monogenitore femmina separata legalmente con isolati o monogenitore femmina divorziata con isolati monogenitore femmina vedova con isolati a due generazioni senza isolati di tipo fraterno senza isolati di altro tipo senza isolati a due generazioni con isolati di tipo fraterno con isolati di altro tipo con isolati parenti ed altri nuclei senza isolati con isolati persone non parenti coppia coniugata senza figli, senza isolati coppia non coniugata senza figli senza isolati coppia coniugata con figli senza isolati coppia non coniugata con figli senza isolati 4. posiz – La variabile posizione lavorativa è stata ricodificata con le seguenti modalità: Etichetta Descrizione dirigente o autonomo come imprenditore o libero 1 professionista direttivo, quadro o impiegato 2 capo operaio, operaio subalterno e assimilati o 3 apprendista o lavorante a domicilio per conto d'impresa lavoratore in proprio o socio cooperativa Produzione Beni e/o prestazioni di servizio o coadiuvante o collaborazione 4 coordinata e continuativa (con o senza progetto) o prestazione d'opera occasionale 5. istr – La variabile titolo di studio più alto conseguito è stata ricodificata con le seguenti modalità: Etichette Descrizione 1 Dottorato di ricerca 10 Licenza elementare Nessun titolo (sa leggere e scrivere) o Nessun titolo (non sa 11 leggere e/o scrivere) 9 2 7 9 Laurea (di II livello), Master di II livello e Scuola di specializzazione post-laurea o Diploma accademico di Alta Formazione Artistica, Musicale e Coreutica (A.F.A.M) di II livello o Laurea di 3 anni di I livello, compreso Master di I livello 0 Diploma accademico di Alta Formazione Artistica, Musicale e Coreutica (A.F.A.M) di I livello o Diploma universitario di 2- 3 anni Diploma di maturità/Diploma di istruzione secondaria superiore di 4-5 anni o Diploma di qualifica professionale di 2-3 anni Licenza media/Diploma di istruzione secondaria di I grado 6. cond – La variabile condizione professionale è stata ricodificata con le seguenti modalità: Etichette 1 2 3 4 5 7 8 Descrizione occupato in cerca di nuova occupazione in cerca di prima occupazione casalinga studente ritirato dal lavoro altra condizione o inabile al lavoro 7. colf – La variabile la famiglia si avvale di collaboratore/trice domestico/a, baby- la variabile la famiglia si avvale di: baby-sitter, assanz – la variabile la famiglia si avvale di persona che assiste un anziano o disabile, sono state rilasciate utilizzando la seguente classificazione: Etichette Descrizione 1 no sì, italiano o sia italiano che straniero 2 o sì, straniero 8. stat – La variabile statura in cm e peso – la variabile peso in kg, sono state rilasciate utilizzando la seguente classificazione: - valori puntuali in corrispondenza della modalità 2, Normopeso, della variabile BMI (indice di massa corporea per le persone di 18 anni e più); 10 - valori accorpati nella modalità 777 in corrispondenza della modalità 1, Sottopeso, della variabile BMI ; - valori accorpati nella modalità 888 in corrispondenza della modalità 3, Sovrappeso, della variabile BMI ; - valori accorpati nella modalità 999 in corrispondenza della modalità 4, Obeso, della variabile BMI . Variabili relative ai mezzi di trasporto personali Per le seguenti variabili: - nmotor, numero motorini, scooter; - nmoto, numero di motociclette, moto; - nauto, numero automobili; è stato applicato il metodo di top-coding, in particolare i valori uguali e superiori a 4 sono stati ricodificati in 4, con significato “4 e oltre”. Variabili relative al consumo di bevande alcoliche Invece, per le seguenti variabili: - bicbirra, consumo abituale al giorno di birra, in bicchieri; - bicvino, consumo abituale al giorno di vino, in bicchieri; - bicaltro, numero di bicchieri al giorno di aperitivi alcolici, amari o superalcolici; i valori superiori a 5 sono stati ricodificati in 6, con significato “6 e oltre”. Per le variabili: - nbicalc, consumo di bevande alcoliche negli ultimi 12 mesi, numero bicchieri; - bicfuori, complessivamente in una settimana quanti bicchieri di vino o alcolici consuma abitualmente fuori dai pasti? i valori superiori a 20 sono stati ricodificati in 21, con significato “21 e oltre”. 3.2.4 Campionamento effettuato per realizzare il mIcro.STAT Il file mIcro.STAT è stato prodotto a partire dal file MFR eseguendo operazioni di sottocampionamento, al fine di ridurre il rischio di violazione della riservatezza. 11 In particolare, il mIcro.STAT è ottenuto combinando due strumenti metodologici: 1. l’allocazione multivariata-multidominio di Bethel (Falorsi, Ballin, De Vitiis, Scepi, 1998), per determinare l’allocazione del campione; 2. il campionamento bilanciato utilizzando il metodo Cube (Deville e Tillé, 2004, 2005), per estrarre il campione. Le variabili di allocazione sono state le variabili: - 1Y: - 2Y : ncomp, numero dei componenti la famiglia attuale; - 3Y : sesso. il totale di popolazione; La variabile di dominio è stata: - d: reg∩dom. Il campionamento, pertanto, è stato orientato alla minimizzazione del rischio e all’approssimativa riproduzione, nel tipo di dominio d ≡ reg∩dom, degli insiemi di totali 1Y, 2Y e 3Y. Il coefficiente di variazione è stato imposto al 4%. I coefficienti di riporto all’universo (variabile coefin) sono stati aggiornati rispetto a quelli presenti nel relativo file della ricerca, MFR, per le analisi dei dati. A seguito del campionamento per qualche variabile sono assenti alcune modalità presenti, invece, nel corrispondente file per la ricerca. Sono stati definiti gli errori medi assoluti relativi delle stime del totale delle variabili 1Y, 2Y e 3Y ottenute utilizzando lo stimatore di Horvitz Thompson. Le stime ottenibili dal file mIcro.STAT sono confrontate con le stime ottenibili dal corrispondente file di microdati di ricerca (MFR). Di conseguenza, gli errori medi assoluti relativi sono calcolati utilizzando la formula: 1 Jd ∑ ∑ i∈MFR jd yi wi − ∑ j∈mIcro. STAT ∑ i∈MFR y j wj yi wi dove: - y rappresentano i valori della variabile d’interesse; 12 - w rappresentano i coefficienti di riporto all’universo registrati nel file MFR e nel mIcro.STAT; - d rappresenta il tipo di dominio; - jd=1,…,Jd rappresenta il dominio di tipo d; - ∑ i∈MFR yi wi rappresenta il totale pesato del file per la ricerca nel dominio jd, della y variabile; - ∑ j∈mIcro. STAT y j w j rappresenta il totale pesato del file mIcro.STAT nel dominio jd, della y variabile. Ciò precisato, per i totali negli insiemi 1Y, 2Y e 3Y, gli errori medi assoluti relativi5 sono risultati inferiori a 0.02. 5 In Appendice 2 sono indicati gli errori relativi percentuali delle stime dei totali delle variabili 1Y, 2Y e 3Y. 13 4. Riferimenti bibliografici 1. Istat (2004), Metodologie e tecniche di tutela della riservatezza nel rilascio di informazione statistica (Metodi e norme, n. 20, 2004), http://www.istat.it/dati/catalogo/20040706_00/. 2. Willenborg, L. e de Waal, T. (2001). Elements of statistical disclosure control. Lecture Notes in Statistics, 115, New York: Springer-Verlag. 3. Bethel J. (1989), Sample Allocation in Multivariate Surveys, Survey Methodology, 15, pp 47-57. 4. Deville J., Tillé Y. (2004), Efficient Balanced Sampling: The Cube Method, Biometrika, Vol. 91, No. 4 (Dec., 2004) (pp. 893-912). 5. Foschi F. , Casciano C, Franconi L. , Ichim D., Designing Multiple Releases from the Small and Medium Enterprises Survey, J. Domingo-Ferrer and I. Tinnirello (Eds.): Privacy in Statistical Databases, PSD 2012, LNCS 7556, pp. 200–213, 2012, Springer-Verlag Berlin Heidelberg 2012. 6. Ichim D., Franconi L., Strategies to Achieve SDC Harmonisation at European Level: Multiple Countries, Multiple Files, Multiple Surveys J. Domingo-Ferrer and E. Magkos (Eds.): PSD 2010, LNCS 6344, pp. 284–296, 2010 Springer-Verlag Berlin Heidelberg 2010. Numerosi riferimenti bibliografici sul tema della tutela statistica della riservatezza sono reperibili sul sito http://neon.vb.cbs.nl/casc/ nella documentazione prodotta nell’ambito dei diversi progetti europei che si sono occupati del tema: CASC project (2000-2003); CENEX project (2006); ESSnet project (2008-2009), ESSnet on common tools and harmonised methodology for SDC in the ESS, 2010-2012. 5. Contatti Per eventuali informazioni sulla metodologia di tutela della riservatezza, rivolgersi a: [email protected]. 6. Curatori Il documento è stato redatto da Laura Corallo. 14 7. Appendice 1 Le variabili di seguito elencate risultano non validate oppure variabili di controllo/lavoro, quindi prive di un contenuto analitico. Di conseguenza, sono state soppresse. Campi non significativi. Nome Variabile nprog Descrizione Variabile numero progressivo nell'ambito del comune Nome Variabile attività: tutela dell'ambiente chiro attsocc attività: soccorso puntifi6 quanto si fida del presidente della repubblica donsan attività: donare sangue puntifi7 quanto si fida del governo italiano altatt attività: altro puntifi11 quanto si fida delle forze armate noattiv aiueco aiucib noaiueco nomatt codatt2 attività: nessuna aiuto: economico aiuto: cibo aiuto: no descrizione attività gratuita codice cp 2011 (ultimi 3 digit) settore di attività dell'associazione: altro specificare tipo di organizzazione dell'associazione:altro specificare motivo volontariato: altro specificare significato volontariato: altro specificare descrizione attività gratuita codice cp 2011 (ultimi 3 digit) specificare altro destinatario La scorsa settimana ha svolto almeno un'ora di lavoro numero ore di lavoro svolte da lunedì a domenica della scorsa settimana Sempre nella scorsa settimana aveva comunque un lavoro dal quale era assente Nella principale attività lavorativa lei svolge Ha dei dipendenti? Numero dei dipendenti E' iscritto ad un albo o ordine professionale? puntifi13 puntifi14 fi3an fifutu finum duauto quanto si fida delle banche quanto si fida delle assicurazioni intende avere figli nei prossimi 3 anni intende avere figli in futuro numero di figli desiderato durata compilazione questionario pesomin peso minorenni in Kg statmin statura minorenni in Kg cicl pista ciclabile raggiungibile in 5 minuti in bicicletta affaccio abitazione affaccia su una strada a traffico intenso? centrte incene indchi distanza dall'abitazione: centrale termoelettrica distanza dall'abitazione: inceneritore distanza dall'abitazione: industria chimica indpet distanza dall'abitazione: industria petrolifera impind distanza dall'abitazione: altri impianti industriali riprad distanza dall'abitazione: ripetitori radio-tv compost sa che può effettuare il compostaggio? hacomp agecomp la famiglia dispone di compostiera agevolazioni per effettuare il compostaggio reacqsp l'acqua arriva all'abitazione altro (specificare) Si tratta di un lavoro a termine? eracqsp Negli ultimi 12 mesi l'irregolarità nell'erogazione dell'acqua si è verificata: altro specificare nido difficoltà a raggiungere: asilo nido smater difficoltà a raggiungere: scuola materna selem difficoltà a raggiungere: scuola elementare sminf difficoltà a raggiungere: scuola media inferiore segas difficoltà a raggiungere: sportelli azienda gas sluce difficoltà a raggiungere: sportelli dell'Enel o dell'azienda elettrica locale sodrif soddisfazione per la raccolta dei rifiuti ccarta contenitori per la raccolta differenziata di: carta cvetro contenitori per la raccolta differenziata di: vetro cfarm contenitori per la raccolta differenziata di: farmaci contenitori per la raccolta differenziata di: batterie usate contenitori per la raccolta differenziata di: lattine di alluminio contenitori per la raccolta differenziata di: contenitori in plastica per liquidi contenitori per la raccolta differenziata di: rifiuti organici mmcom mese di consegna all'ufficio del comune settvolsp aacom anno di consegna all'ufficio del comune sptiporg relpa2 relpa2 spmot fi20 spazio spsigalt eta2 eta3 eta4 eta2 eta3 eta4 nomattsolo codattsolo2 spaiuchi eta5 eta5 lavoro1 fi3 spazi norelav gnasc giorno di nascita lavoro2 mnasc mese di nascita posi anasc gnasc2 anno di nascita Giorno di nascita (scheda individuale) dipen ndip2 mnasc2 Mese di nascita (scheda individuale) albo anasc2 Anno di nascita (scheda individuale) lavter gnasc3 Giorno di nascita (scheda autocompilata) raplav mnasc3 Mese di nascita (scheda autocompilata) bpasto anasc3 Anno di nascita (scheda autocompilata) nbpasto gnasc4 Giorno di nascita autocompilato aggiuntivo eurobp mnasc4 Mese di nascita autocompilato aggiuntivo usobpb anasc4 Anno di nascita autocompilato aggiuntivo usobpn gnasc5 gnasc5 usobpr mnasc5 mnasc5 posdip anasc5 anasc5 alfapf fi4 spazi codcp sesso2 Sesso (scheda individuale) ateco2 sesso3 Sesso (scheda autocompilata) cerlav1 sesso4 Sesso autocompilato aggiuntivo cerlav2 sesso5 sesso5 motnocer fi5 spazi cenpub stciv2 stato civile precedente colloq fi6 spazi conpub stcap Stato civile anno precedente domcon stcap2 Stato civile anno precedente 2 offgio fi7 spazi inserz stcpm2 Stato civile precedente il matrimonio 2 domcv proind Descrizione Variabile tutamb fi1 numan fi2 period codint ggcom filler Nome Variabile le è capitato nel corso dell'anno di rivolgersi a pagamento ad un astrologo, chiromante, cartomante, guaritore, mago o simile? numero progressivo della famiglia nell'elenco di appartenenza spazi progressivo individuo nell'ambito della famiglia spazi n° dei componenti la famiglia anagrafica spazi periodicità della rilevazione (mese) codice intervistatore giorno di consegna all'ufficio del comune numfam Descrizione Variabile il suo rapporto di lavoro è regolato da un contratto o da un accordo verbale con il datore di lavoro? buoni pasto dal datore di lavoro buoni pasto dal datore di lavoro: numero buoni pasto dal datore di lavoro: valore in euro buoni pasto dal datore di lavoro: uso al bar, rosticceria, tavola calda buoni pasto dal datore di lavoro: uso in negozi, supermercati buoni pasto dal datore di lavoro: uso al ristorante Posizione professionale del lavoratore dipendente descrizione del lavoro, professione o mestiere attuale Codice CP2001 della professione In quale settore di attività economica lavora cerca lavoro azioni di ricerca di lavoro nelle ultime 4 settimane per quale motivo non ha fatto azioni di ricerca nelle ultime 4 settimane ha contattato un centro pubblico per l'impiego (ex uffici di collegamento) ha sostenuto un colloquio di lavoro, una selezione presso privati ha sostenuto le prove scritte e/o orali di un concorso pubblico ha inviato una domanda per partecipare ad un concorso pubblico ha esaminato offerte di lavoro sui giornali ha messo inserzioni sui giornali o ha risposto ad annunci ha fatto una domanda di lavoro o ha inviato/consegnato un curriculum a cbat clatal cplas crorg calt contenitori per la raccolta differenziata di: altro rcarta effettua la raccolta differenziata di: carta rvetro effettua la raccolta differenziata di: vetro rfarm effettua la raccolta differenziata di: farmaci rbat effettua la raccolta differenziata di: batterie usate rlatal rplas effettua la raccolta differenziata di: lattine di alluminio effettua la raccolta differenziata di: contenitori in plastica per liquidi 15 fi8 spazi amipar posind Posizione con riferimento all'indirizzo della famiglia anagrafica intrt privati ha chiesto a parenti, amici, conoscenti ha cercato lavoro su Internet ha contattato un'agenzia privata di collocamento o un'agenzia interinale ha cercato terreni, locali, attrezzature per avviare un attività autonoma ha chiesto permessi, licenze, finanziamenti per avviare un attività autonoma ha fatto altre azioni di ricerca di lavoro, non comprese tra quelle precedenti disponibilità a lavorare entro 2 settimane rrorg effettua la raccolta differenziata di: rifiuti organici ralt effettua la raccolta differenziata di: altro fi9 spazi agpriv gmatr Giorno del matrimonio ceraut mmatr Mese del matrimonio chiaut gmatr2 Giorno del matrimonio 2 altrice mmatr2 Mese del matrimonio 2 displa amatr2 Anno del matrimonio 2 lavpas2 Nel corso della sua vita ha mai svolto un lavoro? spidif6 fi10 spazi pospre Qual era la sua posizione nella professione? spidif7 fi11 spazi dipre Aveva dei dipendenti? spidif8 tipnu1 Tipo nucleo 1 ndipre Quanti dipendenti aveva? poapo numnu1 rpnuc1 Numero progressivo del nucleo nell'ambito della famiglia 1 Relazione di parentela nell'ambito del nucleo 1 podpre atepre Posizione come dipendente in passato In quale settore di attività economica lavorava? spidif1 spidif2 spidif3 spidif4 spidif5 sodpoapo nospo1 tipfa1 Tipologia familiare 1 spaltramb altro ambito specificare nospo2 fi12 spazi spaltnocau motivo non avvio: altro specificare nospo3 strato Strato compn numero d'ordine del componente che da le notizie; 99='esterno alla famiglia' nospo4 fi13 spazi arelpar Stringa della relazione di parentela nospo5 coedir Coefficente diretto dovamic cosumo di 6 bicchieri di alcol: a casa di amici o parenti nosposp coedi2 Coefficente diretto 2 mensa tipo di mensa aziendale nospo6 coedi3 Coefficente diretto 3 dovaltsp consumo di 6 bicchieri di alcol: altro luogo specificare ecostaz coefi2 Coefficente finale 2 frfumo fumo: con quale frequenza fuma usoeco2 coefi3 Coefficente finale 3 giopad Frequenza con cui gioca con il padre ecocar ndip numero di dipendenti gmad reg2 regione con Liguria pari a 25 filmtv claseta classe di età icidsl fi14 spazi icisfwi ni numero invio icisfpal progr1 Progressivo della scheda 1 icisfmod progr2 Progressivo della scheda 2 icimodem progr3 Progressivo della scheda 3 noinpa1 progr4 Progressivo della scheda 4 noinpa2 sezcen Sezione di censimento noinpa7 tsk tipo scheda noinpa8 rilev tipo d'indagine noinpa9 ristat riservato indagine noinpa4 fi15 spazi noinpa5 Frequenza con cui gioca con la madre frequenza con cui guarda film in televisione, vhs, dvd o altri media connessione tramite DSL o altra connessione a banda larga via rete fissa connessione senza fili fissa (satellite, rete pubblica WIFI) connessione a una rete di telefonia mobile tramite cellulare abilitato o smartphone connessione a una rete di telefonia mobile tramite card o chiavetta USB connessione tramite linea telefonica tradizionale o ISDN motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: non ne aveva bisogno motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: il sevizio di cui aveva bisogno non era disponibile via Internet motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: preferisce il contatto di persona motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: mancanza di una risposta immediata motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: maggiore affidabilità dei moduli cartacei motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: mancanza di capacità motivo per cui non ha spedito la famiglia farebbe la raccolta differenziata se: maggiori informazioni su come separare i rifiuti la famiglia farebbe la raccolta differenziata se: maggiori informazioni su dove separare i rifiuti la famiglia farebbe la raccolta differenziata se: raccolta a domicilio la famiglia farebbe la raccolta differenziata se: disponibilità di appositi contenitori nelle vicinanze dell'abitazione la famiglia farebbe la raccolta differenziata se: centri di raccolta migliori e più numerosi la famiglia farebbe la raccolta differenziata se: maggiori garanzie che i rifiuti raccolti vengano effettivamente separati la famiglia farebbe la raccolta differenziata se: obbligo legale/multe per chi non effettua la raccolta differenziata la famiglia farebbe la raccolta differenziata se: detrazioni agevolazioni fiscali o tariffarie per chi effettua regolarmente la raccolta differenziata la zona in cui vive è servita/coinvolta dalla raccolta porta a porta dei rifiuti soddisfazione per il servizio di raccolta dei rifiuti porta a porta nella zona in cui vive famiglia non soddisfatta per il servizio di raccolta dei rifiuti porta a porta per: problemi legati agli orari famiglia non soddisfatta per il servizio di raccolta dei rifiuti porta a porta per: problemi legati ai sacchetti da utilizzare nella raccolta famiglia non soddisfatta per il servizio di raccolta dei rifiuti porta a porta per: odori causati dall'umido non raccolto quotidianamente famiglia non soddisfatta per il servizio di raccolta dei rifiuti porta a porta per: non utile raccogliere rifiuti in modo differenziato famiglia non soddisfatta per il servizio di raccolta dei rifiuti porta a porta per: non crede che i rifiuti raccolti vengano recuperati/riciclati famiglia non soddisfatta per il servizio di raccolta dei rifiuti porta a porta per: altro(specificare) famiglia non soddisfatta per il servizio di raccolta dei rifiuti porta a porta per: altro(codice) nella zona in cui vive la sua famiglia ci sono stazioni ecologiche, cioè centri dove è possibile portare gratuitamente i rifiuti che non possono essere gettati nei cassonetti? la sua famiglia ha mai portato rifiuti in questi centri di raccolta? tipo di rifiuti: carta/cartone di dimensioni ingombranti ecovet tipo di rifiuti: vetro ecopla tipo di rifiuti: plastica di dimensioni ingombranti ecopne tipo di rifiuti: pneumatici ecomet tipo di rifiuti: metalli ecoleg tipo di rifiuti: legno ecofar tipo di rifiuti: farmaci scaduti ecobat tipo di rifiuti: batterie usate ecoing tipo di rifiuti: rifiuti ingombranti ecoine tipo di rifiuti: inerti ecoele tipo di rifiuti: apparecchiature elettriche ed elettroniche ecooli tipo di rifiuti: olio esausto ecoinf tipo di rifiuti: rifiuti tossici e/o infiammabili ecopot tipo di rifiuti: verde e potature ecotess tipo di rifiuti: rifiuti tessili 16 istr2 titolo di studio più alto conseguito alla stessa data dell'anno precedente noinpa10 fi16 spazi noinpa11 comnas Luogo di nascita noinpa12 astato Stato Estero di nascita (specificare) noinpa6 codest Stato Estero di nascita (codice Istat) cenfuo citt Cittadinanza paesaggio acitta Cittadinanza straniera (specificare) ippol codcit Cittadinanza Stato estero (codice Istat) isind itanas Ha la cittadinanza italiana dalla nascita? igrvo itanat itaann tpsc Ha avuto la cittadinanza italiana per naturalizzazione o discendenza? In che anno ha avuto la cittadinanza italiana? l'asilo, la scuola o l'università a cui è iscritto è pubblica o privata iaeco icult asspro aasc a quale classe è attualmente iscritto altpolsp consf negli ultimi 3 mesi ha fatto ricorso a consultorio familiare pwebmsp nconsf quante volte naltposp cim negli ultimi 3 mesi ha fatto ricorso a centri igiene mentale nautoce ncim quante volte bancop stoss negli ultimi 3 mesi ha fatto ricorso a servizio assistenza ai tossicodipendenti tbancop nstoss quante volte votobu ricov nnrica ggrica negli ultimi 3 mesi è stato ricoverato in un ospedale, in un istituto di cura accreditato (convenzionato) o in una casa di cura privata? quante volte è stato ricoverato negli ultimi tre mesi? per quante giornate complessivamente è stato ricoverato negli ultimi tre mesi? moduli compilati alla P.A. o ai gestori dei servizi pubblici: preoccupazione per la privacy o sicurezza dei dati personali motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: è richiesta la documentazione cartacea o il contatto di persona motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: mancanza della firma elettronica o di certificati ID elettronici necessari per l'utilizzo del servizio motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: l'ha fatto un'altra persona al suo posto motivo per cui non ha spedito moduli compilati alla P.A. o ai gestori dei servizi pubblici: altro motivo frequenza con cui va a cena o pranzo fuori secondo lei, il paesaggio del luogo in cui vive è affetto da evidente degrado? iscrizione a: partiti politici iscrizione a: organizzazioni sindacali (sindacati confederali, autonomi, sindacati di tutte le categorie, anche dei pensionati, ecc.) iscrizione a: associazioni o gruppi di volontariato iscrizione a: associazioni ecologiche, per i diritti civili, per la pace iscrizione a: associazioni culturali, ricreative o di altro tipo iscrizione a: associazioni professionali o di categoria si informa di politica attraverso: altro (specificare) in che modo si informa dei fatti della politica attraverso Internet: altro (specificare) non si informa di politica perchè: altro (specificare) n. volte utilizzo autocertificazione negli ultimi 12 mesi frequenza con cui si reca all'ufficio postale per: servizi di bancoposta attesa in fila per servizi di bancoposta giudizio complessivo sul servizio di autobus, filobus, tram ecoaltsp tipo di rifiuti: altro (specificare) ecoalt tipo di rifiuti: altro (codice) noeco motivo per cui la famiglia non ha portato rifiuti nelle stazioni ecologiche noecosp motivo per cui la famiglia non ha portato rifiuti nelle stazioni ecologiche (specificare) nlavst numero lavastoviglie nlavat numero lavatrici box proprietà posto macchina o garage nbox numero di posto macchina o garage posseduti naintern numero accesso ad internet motnoai1 motnoai3 motnoai4 motnoai5 motnoai6 motnoai8 motnoai10 motnoai11 motnoai12 non ha connessione a Internet: altro motivo motnoai9 vototr giudizio complessivo sui treni rispar lricov dove è avvenuto? (con riferimento all'ultimo ricovero) serra conspe contribuzione al pagamento delle spese di ricovero estinz condir contribuzione diretta spese ricovero camcli conass contribuzione spese ricovero con assicurazione privata smarif qassam soddisfazione assistenza medica amrum qassin soddisfazione assistenza infermieristica iaria qvitto soddisfazione vitto inqsu qserig soddisfazione servizi igienici inqfiu incdo negli ultimi 12 mesi ha subito uno o più incidenti in ambiente domestico che hanno compromesso le sue condizioni di salute con ferite, fratture, ustioni, contusioni, lussazioni o altre lesioni? disdr nincdo quante volte? catastr almotsp non andato in vacanza per altri motivi (specificare) fores2 problemi ambientali che la preoccupano maggiormente: rumore problemi ambientali che la preoccupano maggiormente: inquinamento dell'aria problemi ambientali che la preoccupano maggiormente: inquinamento del suolo problemi ambientali che la preoccupano maggiormente: inquinamento di fiumi, mari problemi ambientali che la preoccupano maggiormente: dissesto idrogeologico (terremoti, alluvioni, ecc.) problemi ambientali che la preoccupano maggiormente: catastrofi provocate dall'uomo problemi ambientali che la preoccupano maggiormente: distruzione delle foreste non ha connessione a Internet: motivi di privacy, sicurezza non ha connessione a Internet: connessione a banda larga non disponibile nella nostra zona non ha connessione a Internet: non dispone di una rete telefonica fissa non ha connessione a Internet: non dispone di personal computer non ha connessione a Internet: altro (specificare) giudizio complessivo del servizio di pullman, corriere tra comuni diversi lei utilizza un ciclomotore o un motociclo come conducente problemi ambientali che la preoccupano maggiormente: effetto serra, buco nell'ozono problemi ambientali che la preoccupano maggiormente: estinzione di alcune specie animali/vegetali problemi ambientali che la preoccupano maggiormente: cambiamenti climatici problemi ambientali che la preoccupano maggiormente: produzione e smaltimento rifiuti non ha connessione a Internet: mancanza di capacità motnoasp votopu usocicl non ha connessione a Internet: accede ad Internet da altro luogo non ha connessione a Internet: Internet non è utile, non è interessante non ha connessione a Internet: alto costo degli strumenti per connettersi non ha connessione a Internet: alto costo del collegamento inrisp la sua famiglia negli ultimi 12 mesi è riuscita a risparmiare? pensa che la sua famiglia nei prossimi 12 mesi risparmierà di più, come quest'anno o di meno? ricca livello economico della famiglia redeur reddito netto mensile in EURO complessivo della famiglia cifred a quale cifra si avvicina di più il reddito netto mensile della sua famiglia dispon lei e la sua famiglia sareste disponibili ad una intervista simile a questa, l'anno prossimo? nord numero d'ordine del componente che ha fornito le risposte ai quesiti della scheda familiare; 99='estraneo alla famiglia' notab Note sul tipo di abitazione giorno giorno dell'intervista mese mese dell'intervista hhin ora di inizio dell'intervista mmin minuti di inizio dell'intervista durint Durata dell'intervista 17 aiusan volontariato: prestazioni sanitarie inqelet2 aiuass volontariato: assistenza adulti paesag2 aiuacc volontariato: accudimento bambini esriso2 aiudom volontariato: aiuto in attività domestiche altambsp aiucom volontariato: compagnia altamb2 aiubur volontariato: pratiche burocratiche drogan aiulav volontariato: lavoro extra-domestico spadro aiustu volontariato: studio prost aiuper volontariato: altro aiuto a persone vandal aiuno volontariato: nessun aiuto a persone mendi coogru attività: coordinare un gruppo furauto orgev attività: organizzare eventi furabit rfondi attività: raccogliere fondi furalt formaz attività: fare formazione aggre rcsoc attività: ricoprire una carica violen diram attività: lavorare in segreteria paura curasp attività: curare spazi pubblici altpaura problemi ambientali che la preoccupano maggiormente: inquinamento elettromagnetico problemi ambientali che la preoccupano maggiormente: rovina del paesaggio (eccessiva costruzione di edifici) problemi ambientali che la preoccupano maggiormente: esaurimento risorse naturali (acqua, minerali, petrolio, ecc.) problemi ambientali che la preoccupano maggiormente: altri problemi (specificare) problemi ambientali che la preoccupano maggiormente: altri problemi (codice) nella zona in cui abita con che frequenza le capita di vedere: persone che si drogano nella zona in cui abita con che frequenza le capita di vedere: persone che spacciano droga nella zona in cui abita con che frequenza le capita di vedere: prostitute in cerca di clienti nella zona in cui abita con che frequenza le capita di vedere: atti di vandalismo contro il bene pubblico (cabine rotte, cassonetti bruciati, ecc.) nella zona in cui abita con che frequenza le capita di vedere: vagabondi, persone senza fissa dimora (nomadi) quanto è preoccupato di subire: furto automobile quanto è preoccupato di subire: furto abitazione quanto è preoccupato di subire: altri furti quanto è preoccupato di subire: aggressione quanto è preoccupato di subire: violenza sessuale disp disponibilità familiare verso l'intervista gstrada ambito: incidenti stradali constrada ambito: contravvenzioni al codice stradale volon2f ha dedicato del tempo al volontariato? (dati definizione ILO2011) volorgf organizzazzione volontariato codattsolof codice cp 2011 nvolattsolof numero di volte in cui ha svolto attività gratuite senza organizzazione noreattsolof numero di ore in media ogni volta dell'attività gratuita senza organizzazione aiuchif destinatario principale dell'attività gratuita soloannf da quanto tempo svolge questa attività? solonannf numero di anni altsolof altra attività gratuita svolta altsoloref numero ore totali altre attività BL20 filler fil19 Caratteri di riempimento (scheda familiare) negli ultimi 3 mesi ha avuto paura di stare per subire un reato nell'ultimo anno ha avuto paura di stare per subire un reato 18 8. Appendice 2 Nelle tabelle seguenti sono indicati gli errori relativi percentuali delle stime dei totali delle variabili: - 1Y: - 2Y : ncomp, numero dei componenti la famiglia attuale; - 3Y : sesso. il totale di popolazione; nel dominio reg∩dom ottenute utilizzando lo stimatore di Horvitz Thompson. Le stime ottenibili del file mIcro.STAT sono confrontate con le stime ottenibili dal corrispondente file di microdati di ricerca (MFR). reg∩dom 1Y reg∩dom 1Y reg∩dom 1Y reg∩dom 1Y 010*1 0.02 050*5 0.53 100*6 0.90 160*3 2.68 010*2 2.18 050*6 1.13 110*3 2.27 160*4 0.97 010*3 1.61 060*3 0.23 110*4 0.25 160*5 1.08 010*4 0.15 060*4 0.81 110*5 0.09 160*6 0.73 010*5 0.89 060*5 0.42 110*6 0.92 170*3 1.30 010*6 1.59 060*6 0.31 120*1 0.57 170*4 0.70 020*3 0.26 070*1 0.25 120*2 1.48 170*5 0.37 020*4 0.18 070*2 0.72 120*3 2.02 170*6 1.56 020*5 1.07 070*3 0.02 120*4 0.07 180*3 1.83 030*1 0.57 070*4 0.83 120*5 0.16 180*4 0.32 030*2 0.61 070*5 1.67 120*6 0.35 180*5 0.72 030*3 0.34 070*6 0.04 130*3 0.77 180*6 0.71 030*4 0.59 080*1 3.54 130*4 0.09 190*1 0.50 030*5 0.02 080*2 0.43 130*5 1.99 190*2 0.55 030*6 0.13 080*3 2.62 130*6 0.25 190*3 1.60 041*3 1.41 080*4 1.88 140*3 2.51 190*4 0.21 041*4 0.71 080*5 1.31 140*4 3.22 190*5 0.27 041*5 0.01 080*6 1.66 140*5 0.51 190*6 0.34 041*6 0.53 090*1 0.40 140*6 0.89 200*1 1.08 042*3 0.94 090*2 5.06 150*1 0.59 200*2 2.82 042*4 1.63 090*3 0.13 150*2 1.25 200*3 0.66 042*5 0.36 090*4 1.49 150*3 1.09 200*4 0.04 042*6 0.13 090*5 0.19 150*4 1.02 200*5 0.01 050*1 0.57 090*6 1.29 150*5 1.13 200*6 1.81 050*2 0.47 100*3 0.49 150*6 0.34 050*3 1.72 100*4 2.05 160*1 0.27 050*4 1.18 100*5 1.22 160*2 0.01 19 reg∩dom ncomp reg∩dom ncomp reg∩dom ncomp 010*1 0.00 070*3 2.23 140*4 7.77 010*2 4.66 070*4 1.20 140*5 1.73 010*3 4.42 070*5 2.33 140*6 1.64 010*4 0.37 070*6 0.38 150*1 1.07 010*5 2.15 080*1 9.81 150*2 2.30 010*6 3.09 080*2 1.07 150*3 2.01 020*3 0.41 080*3 4.16 150*4 1.37 020*4 0.57 080*4 3.89 150*5 0.68 020*5 3.29 080*5 2.18 150*6 0.31 030*1 1.14 080*6 3.72 160*1 0.05 030*2 1.30 090*1 0.88 160*2 0.41 030*3 0.81 090*2 8.72 160*3 4.66 030*4 0.59 090*3 1.15 160*4 2.25 030*5 0.10 090*4 1.59 160*5 0.96 030*6 0.86 090*5 0.33 160*6 1.25 041*3 5.34 090*6 3.88 170*3 3.38 041*4 1.52 100*3 2.96 170*4 1.95 041*5 0.11 100*4 3.98 170*5 1.16 041*6 0.82 100*5 3.25 170*6 4.29 042*3 1.92 100*6 1.56 180*3 5.49 042*4 3.89 110*3 4.32 180*4 0.10 042*5 2.11 110*4 1.06 180*5 1.61 042*6 0.14 110*5 1.64 180*6 1.27 050*1 1.58 110*6 2.41 190*1 0.59 050*2 1.40 120*1 1.86 190*2 1.96 050*3 3.41 120*2 2.65 190*3 2.12 050*4 2.17 120*3 2.77 190*4 0.30 050*5 1.54 120*4 0.10 190*5 0.93 050*6 1.60 120*5 0.19 190*6 0.39 060*3 1.55 120*6 0.11 200*1 2.66 060*4 1.75 130*3 1.81 200*2 6.25 060*5 1.12 130*4 0.10 200*3 1.85 060*6 1.09 130*5 4.47 200*4 0.56 070*1 0.00 130*6 1.44 200*5 0.09 070*2 1.91 140*3 7.14 200*6 3.28 20 reg∩dom Sesso=1= M sesso=2= F reg∩dom Sesso=1= M sesso=2= F reg∩dom Sesso=1= M sesso=2= F 010*1 0.29 0.29 070*3 1.47 1.39 140*4 3.70 2.78 010*2 1.33 3.01 070*4 0.03 1.71 140*5 0.98 0.03 2.38 070*5 1.21 140*6 1.02 0.78 1.41 1.26 150*1 0.51 0.67 010*3 0.83 2.20 010*4 0.18 0.12 070*6 010*5 2.10 0.27 080*1 4.99 2.38 150*2 1.50 3.86 010*6 2.82 0.49 080*2 1.91 0.85 150*3 2.22 0.08 020*3 0.16 0.70 080*3 1.62 3.75 150*4 1.40 0.65 0.88 080*4 2.18 150*5 0.14 2.09 1.65 0.98 150*6 0.51 1.09 020*4 1.32 1.58 020*5 1.27 0.88 080*5 030*1 1.26 0.02 080*6 5.22 1.83 160*1 0.63 1.08 030*2 0.09 1.10 090*1 0.43 1.13 160*2 0.48 0.44 030*3 0.93 0.29 090*2 5.37 4.78 160*3 2.08 3.18 0.06 090*3 1.13 160*4 1.11 0.84 1.04 1.95 160*5 1.09 1.07 030*4 1.27 1.45 030*5 0.65 0.60 090*4 030*6 0.72 0.48 090*5 0.28 0.11 160*6 1.46 0.05 041*3 3.03 0.35 090*6 2.14 0.56 170*3 0.72 1.92 041*4 0.42 1.00 100*3 2.03 1.15 170*4 0.09 1.42 041*5 0.16 0.18 100*4 2.79 1.28 170*5 1.07 1.70 0.82 100*5 1.37 170*6 1.29 1.85 0.48 1.26 180*3 6.45 2.45 041*6 0.17 1.06 042*3 1.83 0.00 100*6 042*4 2.84 0.52 110*3 1.48 3.24 180*4 0.86 0.22 042*5 1.68 0.95 110*4 0.38 0.13 180*5 1.08 0.37 042*6 0.90 1.06 110*5 0.01 0.19 180*6 1.80 0.26 0.80 110*6 1.71 190*1 0.61 0.39 1.58 0.31 190*2 1.91 0.65 050*1 0.33 0.00 050*2 1.53 2.52 120*1 050*3 1.86 1.58 120*2 1.83 1.13 190*3 0.17 3.35 050*4 2.19 0.22 120*3 4.90 1.17 190*4 0.74 1.09 050*5 0.14 1.16 120*4 1.86 1.82 190*5 0.13 0.40 1.06 120*5 0.01 190*6 0.04 0.65 1.19 120*6 0.14 200*1 0.57 1.47 1.99 0.40 200*2 3.96 1.71 050*6 060*3 1.20 1.68 0.31 0.57 060*4 0.69 0.93 130*3 060*5 0.39 0.45 130*4 0.78 0.61 200*3 1.67 0.37 060*6 1.07 0.36 130*5 2.48 1.52 200*4 1.57 1.42 070*1 0.07 0.51 130*6 0.10 0.38 200*5 1.31 1.29 0.58 140*3 2.29 200*6 2.86 0.77 070*2 0.86 2.73 21 DESCRIZIONE DEL FILE FILE DESCRIPTION Indagine “Aspetti della vita quotidiana” – Anno 2013 File ad uso pubblico mIcro.STAT Aspetti della vita quotidiana 2013 Descrizione del file Luglio 2014 1 Indagine “Aspetti della vita quotidiana” – Anno 2013 INDICE 1. Introduzione.................................................................................................................. 3 2. La popolazione di riferimento ....................................................................................... 3 3. Il disegno campionario ................................................................................................. 6 4. La rilevazione e il trattamento dei dati ........................................................................ 12 5. La metodologia di calcolo dei pesi campionari ........................................................... 12 6. La diffusione dei dati dell'indagine .............................................................................. 12 7. Glossario .................................................................................................................... 12 8. Riferimenti bibliografici ............................................................................................... 12 9. Appendice…………………………………………………………………………………….13 2 Indagine “Aspetti della vita quotidiana” – Anno 2013 1. Introduzione L'indagine campionaria "Aspetti della vita quotidiana", che fa parte di un sistema integrato di indagini sociali - le Indagini Multiscopo sulle famiglie - rileva le informazioni fondamentali relative alla vita quotidiana degli individui e delle famiglie. A partire dal 1993, l'indagine viene svolta ogni anno e le informazioni raccolte consentono di conoscere le abitudini dei cittadini e i problemi che essi affrontano ogni giorno. Aree tematiche variegate si susseguono nei questionari, permettendo di capire come vivono gli individui e se sono soddisfatti del funzionamento di quei servizi di pubblica utilità che devono contribuire al miglioramento della qualità della vita. Scuola, lavoro, vita familiare e di relazione, abitazione e zona in cui si vive, tempo libero, partecipazione politica e sociale, salute, stili di vita e rapporto con i servizi sono indagati in un'ottica in cui oggettività dei comportamenti e soggettività delle aspettative, delle motivazioni, dei giudizi contribuiscono a definire l'informazione sociale. L'indagine rientra tra quelle comprese nel Programma statistico nazionale, che raccoglie l'insieme delle rilevazioni statistiche necessarie al Paese. 3 Indagine “Aspetti della vita quotidiana” – Anno 2013 2. La popolazione di riferimento La popolazione di interesse dell’indagine multiscopo “Aspetti della vita quotidiana”, ossia l’insieme delle unità statistiche intorno alle quali si intende investigare, è costituita dalle famiglie residenti in Italia e dai membri che le compongono; sono pertanto esclusi i membri permanenti delle convivenze. La famiglia è intesa come famiglia di fatto, ossia un insieme di persone coabitanti e legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o affettivi. Il periodo di riferimento è prevalentemente costituito dai dodici mesi che precedono l’intervista, anche se per alcuni quesiti il riferimento è al momento dell’intervista. I domini di studio, ossia gli ambiti rispetto ai quali sono riferiti i parametri di popolazione oggetto di stima, sono: • l’intero territorio nazionale; • le cinque ripartizioni geografiche (Italia nord-occidentale, Italia nord-orientale, Italia centrale, Italia meridionale, Italia insulare); • le regioni geografiche (a eccezione del Trentino-Alto Adige le cui stime sono prodotte separatamente per le province di Bolzano e Trento); • la tipologia comunale ottenuta suddividendo i comuni italiani in sei classi formate in base a caratteristiche socio-economiche e demografiche: A) comuni appartenenti all’area metropolitana suddivisi in: A1, comuni centro dell’area metropolitana: Torino, Milano, Venezia, Genova, Bologna, Firenze, Roma, Napoli, Bari, Palermo, Catania, Cagliari; A2, comuni che gravitano intorno ai comuni centro dell’area metropolitana; B) comuni non appartenenti all’area metropolitana suddivisi in: B1 comuni aventi fino a 2.000 abitanti; B2 comuni con 2.001-10.000 abitanti; B3 comuni con 10.001-50.000 abitanti; B4 comuni con oltre 50.000 abitanti. 3. Il disegno campionario Il disegno di campionamento è di tipo complesso e si avvale di due differenti schemi di campionamento. Nell’ambito di ognuno dei domini definiti dall’incrocio della regione 4 Indagine “Aspetti della vita quotidiana” – Anno 2013 geografica con le sei aree A1, A2, B1, B2, B3 e B4, i comuni sono suddivisi in due sottoinsiemi sulla base della popolazione residente: • l’insieme dei comuni Auto rappresentativi (che indicheremo d’ora in avanti come comuni Ar) costituito dai comuni di maggiore dimensione demografica; • l’insieme dei comuni Non auto rappresentativi (o Nar) costituito dai rimanenti comuni. Nell’ambito dell’insieme dei comuni Ar, ciascun comune viene considerato come uno strato a se stante e viene adottato un disegno noto con il nome di campionamento a grappoli. Le unità primarie di campionamento sono rappresentate dalle famiglie anagrafiche, estratte in modo sistematico dall’anagrafe del comune stesso; per ogni famiglia anagrafica inclusa nel campione vengono rilevate le caratteristiche oggetto di indagine di tutti i componenti di fatto appartenenti alla famiglia medesima. Nell’ambito dei comuni Nar viene adottato un disegno a due stadi con stratificazione delle unità primarie. Le Unità primarie (Up) sono i comuni, le Unità secondarie sono le famiglie anagrafiche; per ogni famiglia anagrafica inclusa nel campione vengono rilevate le caratteristiche oggetto di indagine di tutti i componenti di fatto appartenenti alla famiglia medesima. I comuni vengono selezionati con probabilità proporzionali alla loro dimensione demografica e senza reimmissione, mentre le famiglie vengono estratte con probabilità uguali e senza reimmissione. 3.1. Definizione della dimensione campionaria Per un’indagine ad obiettivi plurimi, come quella in esame, è poco realistico pensare di poter disegnare una strategia campionaria che assicuri prefissati livelli di precisione di tutte le stime prodotte. La questione è complicata dal fatto che l’indagine ha la finalità di determinare stime per livelli territoriali differenti, il che comporta l’adozione di soluzioni di tipo ottimale diverse e contrastanti. Ad esempio, se l’unico ambito territoriale di pubblicazione delle stime fosse quello nazionale, una soluzione approssimativamente ottimale sarebbe quella di determinare la numerosità nazionale e ripartirla tra le regioni in modo proporzionale alla loro dimensione demografica; viceversa, avendo la finalità di produrre stime con uguale attendibilità a livello regionale, una soluzione approssimativamente ottimale sarebbe quella di selezionare un campione uguale in tutte le regioni. Quest’ultima soluzione, però, è poco efficiente per le stime a livello nazionale. Per affrontare questo problema, conformemente a 5 Indagine “Aspetti della vita quotidiana” – Anno 2013 quanto fatto in altri paesi, si è fatto ricorso ad una strategia che perviene alla definizione della numerosità campionaria attraverso approssimazioni successive. In base alle considerazioni precedenti si è deciso di adottare un’ottica mista basata sia su criteri di costo ed organizzativi, sia su una valutazione degli errori campionari delle principali stime a livello nazionale e con riferimento a ciascuno dei domini territoriali di interesse. I criteri seguiti possono essere sintetizzati nei seguenti punti: • la dimensione del campione teorico in termini di famiglie, prefissata a livello nazionale essenzialmente in base a criteri di costo ed operativi, è pari a circa 24.000 famiglie; • il numero di comuni campione interessati non deve essere superiore a 900 in modo da consentire un buon lavoro di controllo e supervisione. L’allocazione del campione di famiglie e di comuni tra le varie regioni è stata quindi calcolata adottando un criterio di compromesso tale da garantire sia l’affidabilità delle stime a livello nazionale che quella delle stime a livello di ciascuno dei domini territoriali descritti nel precedente paragrafo. 3.2. Stratificazione e selezione delle unità campionarie L’obiettivo della stratificazione è quello di formare gruppi (o strati) di unità caratterizzate, relativamente alle variabili oggetto d’indagine, da massima omogeneità interna agli strati e massima eterogeneità fra gli strati. Il raggiungimento di tale obiettivo si traduce in termini statistici in un guadagno nella precisione delle stime, ossia in una riduzione dell’errore campionario a parità di numerosità campionaria. Nell’indagine in esame, i comuni vengono stratificati in base alla loro dimensione demografica e nel rispetto delle seguenti condizioni: • autoponderazione del campione a livello regionale; • selezione di un comune campione nell’ambito di ciascuno strato definito sui comuni dell’insieme Nar; • scelta di un numero minimo di famiglie da intervistare in ciascun comune campione; tale numero è stato posto pari a 23; • formazione di strati aventi ampiezza approssimativamente costante in termini di popolazione residente. 6 Indagine “Aspetti della vita quotidiana” – Anno 2013 Il procedimento di stratificazione, attuato all’interno di ogni dominio territoriale individuato dalle aree A1, A2, B1, B2, B3 e B4 di ciascuna regione geografica, si articola nelle seguenti fasi: • ordinamento dei comuni del dominio in ordine decrescente secondo la loro dimensione demografica in termini di popolazione residente; • determinazione di una soglia di popolazione per la definizione dei comuni Ar, mediante la relazione: rλ = r m rδ rf in cui per la generica regione geografica r si è indicato con: il numero minimo di famiglie da intervistare in ciascun comune campione; r il numero medio di componenti per famiglia; rf la frazione di campionamento; • suddivisione di tutti i comuni nei due sottoinsiemi Ar e Nar: i comuni di dimensione superiore o uguale a r sono definiti come comuni Ar e i rimanenti come Nar; • suddivisione dei comuni dell’insieme Nar in strati aventi dimensione, in termini di popolazione residente, approssimativamente costante e all’incirca pari alla soglia r. Effettuata la stratificazione, i comuni Ar sono inclusi con certezza nel campione; per quanto riguarda, invece, i comuni Nar, nell’ambito di ogni strato viene estratto un comune campione con probabilità proporzionale alla dimensione demografica, mediante la procedura di selezione sistematica proposta da Madow 1. La selezione delle famiglie da intervistare in ogni comune campione viene effettuata dalla lista anagrafica di ciascun comune senza reimmissione e con probabilità uguali. In particolare, la tecnica di selezione è di tipo sistematico e, nell’ambito di ogni comune viene attuata attraverso le seguenti fasi: • 1 vengono ordinate le famiglie dell’anagrafe del comune; Madow, W.G. “On the theory of systematic sampling II”, Annals of Mathematical Statistics, 20, (1949): 333-354. 7 Indagine “Aspetti della vita quotidiana” – Anno 2013 • si calcola il passo di campionamento ehi , come rapporto tra il numero delle famiglie residenti nel comune i dello strato h e il corrispondente numero di famiglie campione, ehi=Mhi/mhi ; • si selezionano le mhi famiglie che nella sequenza costruita al punto 1) occupano le seguenti posizioni : 1, 1+ehi , 1+2ehi , ......, 1+(mhi-1)ehi. Nel prospetto 1 viene riportata la distribuzione regionale dell’universo e del campione dei comuni, delle famiglie e degli individui. Prospetto 1 – Distribuzione regionale dei comuni, delle famiglie e degli individui nell’universo e nel campione – Anno 2013 Comuni Famiglie Individui REGIONI Piemonte / Valle d'Aosta - Vallée d'Aoste Liguria Lombardia Trentino-Alto Adige Veneto Friuli-Venezia Giulia Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Italia Campione Universo Campione Universo (a) Campione Universo (a) 84 26 83 47 54 32 47 46 22 34 36 37 23 55 50 26 43 50 39 1.280 235 1.544 333 581 218 348 287 92 239 378 305 136 551 258 131 409 390 377 1.837 805 1.657 1.106 1.146 701 1.044 1.014 571 703 1.197 794 601 1.359 1.067 587 946 1.219 797 2.031 775 4.238 426 2.003 538 1.891 1.608 370 610 2.489 537 127 2.082 1.528 231 792 1.972 705 4.043 1.668 3.948 2.720 2.842 1.637 2.426 2.362 1.371 1.795 2.691 1.962 1.491 3.738 2.857 1.485 2.339 3.086 1.854 4.563 1.599 9.984 1.042 4.925 1.223 4.444 3.750 905 1.561 5.791 1.341 317 5.813 4.068 582 1.996 5.019 1.665 834 8.092 19.151 24.952 46.315 60.588 (a) Stima Indagine multiscopo "Aspetti della vita quotidiana", dati in migliaia. 4. La rilevazione e il trattamento dei dati Le informazioni vengono raccolte tramite due questionari: uno ROSA somministrato per intervista e uno VERDE che verrà compilato personalmente da ogni componente della famiglia. Il questionario ROSA, che rappresenta il questionario base della rilevazione, contiene i quesiti familiari e quattro schede individuali, una per ogni componente. Qualora i componenti siano più di quattro sono previste delle schede individuali aggiuntive di colore BIANCO. Occasionalmente sono presenti dei questionari aggiuntivi di approfondimento su temi specifici. 8 Indagine “Aspetti della vita quotidiana” – Anno 2013 Per quanto riguarda, invece, i metadati dell'Indagine, nonché il contenuto informativo, le attività di prevenzione, controllo e valutazione dell'errore e gli indicatori di copertura e mancata risposta, si può consultare SIQual, il sistema di visualizzazione della documentazione delle Indagini Istat presente in SIDI (Sistema Informativo di Documentazione delle Indagini). L'Istat è tenuto per legge a rispettare il segreto statistico (art. 9 del decreto legislativo n. 322/1989). I dati raccolti in occasione dell'indagine possono quindi essere utilizzati, esclusivamente a fini statistici, dall'Istat e dagli altri enti ed uffici di statistica facenti parte del Sistema statistico nazionale. I medesimi dati possono inoltre essere utilizzati, per sole finalità di ricerca scientifica, da soggetti non facenti parte del citato Sistema statistico nazionale nei limiti e secondo le modalità stabilite dall'art. 7 del Codice di deontologia e di buona condotta per i trattamenti di dati personali a scopi statistici e di ricerca scientifica effettuati nell'ambito del Sistema statistico. La diffusione dei dati e la loro comunicazione avviene sotto forma aggregata in modo tale che non sia possibile risalire alle persone che le forniscono, assicurando così la massima riservatezza. Ai sensi della stessa normativa (art.7, comma 2) la persona intervistata potrà decidere se rispondere o meno ad alcuni quesiti di natura "sensibile" contenuti nelle varie sezioni del questionario e indicati sul retro dei questionari. Ai sensi della legge che disciplina la tutela della privacy (D.Lgs.196/2003), titolare delle rilevazioni è l'Istat. Usufruiscono dei dati Istituzioni, Enti di ricerca Nazionali e Internazionali, l'Ufficio di Statistica delle Comunità europee (Eurostat), Università, studenti e tutti i cittadini che ne sono interessati. Titolare del trattamento dei dati personali raccolti con la presente indagine è l'Istat - Istituto nazionale di statistica, Via Cesare Balbo, 16 - 00184 Roma; responsabile del trattamento è il Direttore centrale delle statistiche socio-demografiche e ambientali al quale è possibile rivolgersi per quanto riguarda l'esercizio dei diritti degli interessati. 5. La metodologia di calcolo dei pesi campionari Le stime prodotte dall’indagine sono essenzialmente stime di frequenze assolute e relative, riferite alle famiglie e agli individui. Le stime sono ottenute mediante uno stimatore di ponderazione vincolata, che è il metodo di stima adottato per la maggior parte delle indagini Istat sulle imprese e sulle famiglie. 9 Indagine “Aspetti della vita quotidiana” – Anno 2013 Il principio su cui è basato ogni metodo di stima campionaria è che le unità appartenenti al campione rappresentino anche le unità della popolazione che non sono incluse nel campione. Questo principio viene realizzato attribuendo a ogni unità campionaria un peso che indica il numero di unità della popolazione rappresentata dall’unità medesima. Se, per esempio, a un’unità campionaria viene attribuito un peso pari a 30, allora questa unità rappresenta se stessa e altre 29 unità della popolazione che non sono state incluse nel campione. Al fine di rendere più chiara la successiva esposizione, introduciamo la seguente simbologia: d, indice di livello territoriale di riferimento delle stime; i, indice di comune; j, indice di famiglia; p, indice di componente della famiglia; h, indice di strato di comuni; y, generica variabile oggetto di indagine; Yhijp, valore di y osservato sul componente p della famiglia j del comune i dello strato h; Phij , numero di componenti della famiglia j del comune i dello strato Phij h; Yhij = ∑ Yhijp , totale della variabile y osservato sulla famiglia j del comune i dello strato h; p =1 Mhi, numero di famiglie residenti nel comune i dello strato h; mhi, campione di famiglie nel comune i dello strato h; Nh, totale di comuni nello strato h; nh, numero di comuni campione nello strato h (nell’indagine in oggetto si ha ); Hd, numero totale di strati nel generico dominio territoriale d. Ipotizziamo di voler stimare, con riferimento ad un generico dominio d, il totale della generica variabile y oggetto di indagine, espresso dalla seguente relazione Yd = Hd Nh Mhi ∑∑∑ Y hij . (1) h=1 i=1 j=1 La stima del totale (1) è data da Yˆd = Hd ∑ Yˆh h =1 nh mhi , essendo Yˆh = ∑∑ Whij Yhij , (2) i = 1 j =1 in cui W hij è il peso finale da attribuire a tutti i componenti della famiglia j del comune i dello strato h. Dalla precedente relazione si desume, quindi, che per ottenere la stima del totale (1) occorre moltiplicare il valore della variabile y assunto da ciascuna unità campionaria per il peso di 10 Indagine “Aspetti della vita quotidiana” – Anno 2013 tale unità2 ed effettuare, a livello del dominio di interesse, la somma dei prodotti così ottenuti. Il peso da attribuire alle unità campionarie è ottenuto per mezzo di una procedura complessa che: • corregge l’effetto distorsivo della mancata risposta totale dovuta all’impossibilità di intervistare alcune delle famiglie selezionate per irreperibilità o per rifiuto all’intervista; • tiene conto della conoscenza di totali noti di importanti variabili ausiliarie (disponibili da fonti esterne all’indagine), nel senso che le stime campionarie dei totali noti delle variabili ausiliarie devono coincidere con i valori noti degli stessi. Nell’indagine in oggetto vengono definiti per ciascuna regione geografica 20 totali noti, che si riferiscono alla distribuzione della popolazione regionale per sesso e sei classi di età3, della popolazione regionale nelle sei aree A1, A2, B1, B2, B3 e B4 e della popolazione straniera residente in Italia per regione e sesso. Indicando, quindi, con kX (k=1,…,20) il totale noto della k-esima variabile ausiliaria per la generica regione geografica e con kXhij il valore assunto dalla k-esima variabile ausiliaria per la famiglia rispondente hij, la condizione sopra descritta è espressa dalla seguente uguaglianza ˆ k X =k X = H nh mhi ∑∑∑ Whij k Xhij (k=1,…., 20) h =1 i =1 j =1 in cui H indica il numero complessivo di strati definiti nella regione. Se, ad esempio, 6X indica il numero di maschi di età maggiore o uguale a sessantacinque anni, la variabile ausiliaria 6Xhij rappresenta il numero di maschi di età maggiore o uguale a sessantacinque anni della famiglia hij. La procedura che consente di costruire i pesi finali da attribuire alle unità campionarie rispondenti, è articolata nelle seguenti fasi: 2 Al fine di ottenere stime coerenti per individui e famiglie i pesi finali sono definiti in modo tale che a ciascuna famiglia hij e a tutti i componenti della stessa sia assegnato un medesimo peso finale Whij . 3 Le classi di età considerate sono: 0-5 anni, 6-13 anni, 14-24 anni, 25-44 anni, 45-64 anni, 65 anni e più. 11 Indagine “Aspetti della vita quotidiana” – Anno 2013 1) si calcolano i pesi diretti come reciproco della probabilità di inclusione delle unità; 2) si calcolano i fattori correttivi per mancata risposta totale, come l’inverso del tasso di risposta del comune cui ciascuna unità appartiene; 3) si ottengono i pesi base, o pesi corretti per mancata risposta totale, moltiplicando i pesi diretti per i corrispondenti fattori correttivi per mancata risposta totale; 4) si costruiscono i fattori correttivi che consentono di soddisfare, a livello regionale, la condizione di uguaglianza tra i totali noti delle variabili ausiliarie e le corrispondenti stime campionarie; 5) si calcolano, infine, i pesi finali mediante il prodotto dei pesi base per i fattori correttivi ottenuti al passo 4. I fattori correttivi del passo 4 sono ottenuti dalla risoluzione di un problema di minimo vincolato, in cui la funzione da minimizzare è una funzione di distanza (opportunamente prescelta) tra i pesi base e i pesi finali e i vincoli sono definiti dalla condizione di uguaglianza tra stime campionarie dei totali noti di popolazione e valori noti degli stessi. La funzione di distanza prescelta è la funzione logaritmica troncata; l’adozione di tale funzione garantisce che i pesi finali siano positivi e contenuti in un predeterminato intervallo di valori possibili, eliminando in tal modo i pesi positivi estremi (troppo grandi o troppo piccoli). Tutti i metodi di stima che scaturiscono dalla risoluzione di un problema di minimo vincolato del tipo sopra descritto rientrano in una classe generale di stimatori nota come stimatori di ponderazione vincolata4. Un importante stimatore appartenente a tale classe, che si ottiene utilizzando la funzione di distanza euclidea, è lo stimatore di regressione generalizzata. Come verrà chiarito meglio nel paragrafo 3, tale stimatore riveste un ruolo centrale perché è possibile dimostrare che tutti gli stimatori di ponderazione vincolata convergono asintoticamente, all’aumentare della numerosità campionaria, allo stimatore di regressione generalizzata. 5.2. Metodologia di calcolo degli errori campionari Le principali statistiche di interesse per valutare la variabilità campionaria delle stime prodotte da un’indagine sono l’errore di campionamento assoluto e l’errore di campionamento relativo. Indicando con 4 la stima della varianza della generica stima , la Nella letteratura in lingua anglosassone sull’argomento tali stimatori sono noti come calibration estimators. 12 Indagine “Aspetti della vita quotidiana” – Anno 2013 stima dell’errore di campionamento assoluto di si può ottenere mediante la seguente espressione: σˆ ( Yˆd ) = Vˆar( Yˆd ) ; (3) la stima dell’errore di campionamento relativo di Yˆd è invece definita dall’espressione: σˆ ( Yˆ d ) εˆ( Yˆd ) = Yˆ .. (4) d Come è stato descritto in precedenza, le stime prodotte dall’indagine sono state ottenute mediante uno stimatore di ponderazione vincolata definito in base a una funzione di distanza di tipo logaritmico troncato. Poiché, lo stimatore adottato non è funzione lineare dei dati campionari, per la stima della varianza Vˆar( Yˆd ) si è utilizzato il metodo proposto da Woodruff; in base a tale metodo, che ricorre all’espressione linearizzata in serie di Taylor, è possibile ricavare la varianza di ogni stimatore non lineare (funzione regolare di totali) calcolando la varianza dell’espressione linearizzata ottenuta. In particolare, per la definizione dell’espressione linearizzata dello stimatore ci si è riferiti allo stimatore di regressione generalizzata, sfruttando la convergenza asintotica di tutti gli stimatori di ponderazione vincolata a tale stimatore, poiché nel caso di stimatori di ponderazione vincolata che utilizzano funzioni distanza differenti dalla distanza euclidea (che conduce allo stimatore di regressione generalizzata) non è possibile derivare l’espressione linearizzata dello stimatore. L’espressione linearizzata dello stimatore (2) è data, quindi, da: Yˆd ≅ Zˆ d = Hd ∑ h =1 dove X Zhij ( è hij = 1 X hij ,..., k la Zˆ h )′ (5) i =1 j = 1 variabile X hij ,....K X hij nh mhi , essendo Zˆ h = ∑∑ Z hij Whij linearizzata espressa come Z hij = Yhij − X 'hijβ , essendo il vettore contenente i valori delle K (K=20) variabili ausiliarie, osservati per la generica famiglia hij e , il vettore dei coefficienti di regressione del modello lineare che lega la variabile di interesse y alle K variabili ausiliarie x. In base alla (5), si ha, 13 Indagine “Aspetti della vita quotidiana” – Anno 2013 Yˆd quindi, che la stima della varianza della stima è ottenuta mediante la seguente relazione ( ) ( ) ∑ Vˆar (Zˆ ) . Vˆar Yˆd ≅ Vˆar Zˆ d = Hd (6) h h=1 Yˆd Dalla (6) risulta che la stima della varianza della stima viene calcolata come somma della stima delle varianze dei singoli strati, Ar e Nar, appartenenti al dominio d. La formula di calcolo della varianza, Vˆar (Zˆ h ) , della stima Zˆ h è differente a seconda che lo strato sia Ar oppure Nar. Possiamo, quindi scomporre come segue ( ) ( ) ∑ Vˆ ar(Zˆ ) Vˆar Yˆd ≅ Vˆar Zˆ d = HAR h + h=1 ∑ Vˆ ar(Zˆ h ) HNAR , (7) h =1 in cui HAR e HNAR indicano rispettivamente il numero di strati Ar e Nar appartenenti al dominio d. Negli strati Ar (in cui ciascun comune fa strato a sé e Nh = nh = 1 , l’indice i di comune diviene superfluo e viene omesso) la varianza è stimata mediante la seguente espressione: HAR ∑ h=1 ( ) ∑ ˆ ar Zˆ h = V HAR Mh2 h=1 (Mh − mh ) m (Z − Z ) ∑ hj h m h (m h − 1) j=1 2 h , (8) dove si è posto , Mh = Mhi , mh = mhi , Zhj = Zhij e Z h = 1 mh mh⋅ ∑ Z hj . j=1 Negli strati Nar, in cui viene estratto un solo comune campione da ogni strato, per stimare la varianza di campionamento si ricorre alla tecnica di collassamento degli strati. Questa tecnica consiste nel formare G gruppi contenenti ciascuno L g (L g ≥ 2) viene stimata mediante la formula seguente: HNAR ∑ h=1 G g=1 Vˆar Zˆ g = 2 ˆ Zˆ − Z g (9) hg L − 1 h=1 Lg g=1 g ( ) ∑ ( ) ∑ Vˆar Zˆ h = G Lg Lg ∑ dove le quantità sono espresse come: 14 strati; la varianza Indagine “Aspetti della vita quotidiana” – Anno 2013 Zˆ hg = mhi ∑ Z hij Whij L g mhi ∑∑ Z hij Whij e Zˆ g = j=1 . h=1 j =1 Utilizzando le espressioni (8) e (9) è possibile, infine, calcolare la varianza di campionamento, Vˆar (Yˆd ), in base alla (7) e calcolare, quindi, in base alla (3) ed alla (4) rispettivamente l’errore di campionamento assoluto e l’errore di campionamento relativo. Gli errori campionari espressi dalla (3) e dalla (4) consentono di valutare il grado di precisione delle stime; inoltre, l’errore assoluto permette di costruire un intervallo di confidenza, che, con livello di fiducia P contiene il parametro oggetto di stima, l’intervallo viene espresso come: {Yˆ d } − k p σˆ ( Yˆd ) ≤ Yd ≤ Yˆd + k p σˆ ( Yˆd ) (10) Nella (10) il valore di kP dipende dal valore fissato per la probabilità P; ad esempio, per P=0.95 si ha k=1.96. 5.3. Fondamenti statistici della procedura per il calcolo degli errori campionari Per il calcolo degli errori di campionamento delle indagini condotte dall’Istat sulle famiglie e sulle imprese viene correntemente utilizzata una procedura informatica sviluppata nell’ambito dell’Istituto. Nel paragrafo precedente è stata descritta la metodologia, implementata dalla procedura, per il calcolo degli errori di campionamento delle stime prodotte dall’indagine mentre, nel presente paragrafo, vengono discussi i fondamenti statistici e i limiti della metodologia medesima. Negli strati Ar, nei quali si adotta un disegno di campionamento a grappoli e in cui le unità primarie (le famiglie) vengono selezionate senza reimmissione e probabilità uguali, la procedura consente di ottenere stime della varianza campionaria che risultano corrette. Negli strati Nar, per i quali si adotta un disegno di campionamento a due stadi con selezione delle unità primarie (comuni) senza reimmissione e probabilità variabili, la procedura consente di ottenere stime corrette della varianza campionaria qualora: • in ciascuno strato sono selezionate due o più unità primarie; • le unità primarie sono scelte mediante estrazioni indipendenti. 15 Indagine “Aspetti della vita quotidiana” – Anno 2013 La prima condizione non viene soddisfatta in quanto, nell’indagine in oggetto, da ciascuno strato viene selezionato un solo comune campione e per stimare la varianza di campionamento si ricorre alla tecnica di collassamento degli strati. Questa tecnica, che consiste nel formare superstrati contenenti ciascuno un numero di strati maggiore di uno, conduce in generale ad una sovrastima della varianza di campionamento effettiva. La seconda ipotesi implica che la selezione delle unità primarie venga effettuata con reimmissione. Anche questa assunzione non è soddisfatta per i comuni Nar e ciò comporta una sovrastima della varianza. Si osservi, tuttavia, che tale sovrastima dipende dalla frazione di campionamento di ciascuno strato Nar: è di entità trascurabile negli strati nei quali la frazione di campionamento è piccola, mentre viceversa può risultare di entità più cospicua per quegli strati in cui la frazione di campionamento è maggiore. 5.4. Presentazione sintetica degli errori campionari Ad ogni stima Yˆd corrisponde un errore di campionamento relativo εˆ( Yˆd ) ; ciò significa che per consentire una lettura corretta delle tabelle pubblicate sarebbe necessario presentare per ogni stima pubblicata il corrispondente errore di campionamento relativo. Ciò, tuttavia, non è possibile sia per limiti di tempo e di costi di elaborazione, sia perché le tavole della pubblicazione risulterebbero appesantite e di non facile consultazione per l’utente finale. Inoltre, non sarebbero comunque disponibili gli errori delle stime non pubblicate, che l’utente può ricavare in modo autonomo. Per le ragioni sopra esposte, si ricorre frequentemente a una presentazione sintetica degli errori relativi, basata sul metodo dei modelli regressivi. Questo metodo si basa sulla determinazione di una funzione matematica che mette in relazione ciascuna stima con il proprio errore relativo. Nella presente indagine, il modello utilizzato per le stime di frequenze assolute e relative, è del tipo seguente: ( ) ˆ ) log εˆ 2 ( Yˆd ) = a + b log( Y d (11) dove i parametri a e b vengono stimati utilizzando il metodo dei minimi quadrati. Nel prospetto 2 sono riportati i valori dei coefficienti a e b e dell’indice di determinazione R2 del modello utilizzato per l’interpolazione degli errori campionari di stime di frequenze assolute e relative, per totale Italia, ripartizione geografica, tipologia comunale e regione. 16 Indagine “Aspetti della vita quotidiana” – Anno 2013 Sulla base delle informazioni contenute in tale prospetto, è possibile calcolare la stima dell'errore di campionamento relativo di una determinata stima di frequenza assoluta mediante la formula: ( εˆ( Yˆd ) = exp a + b log( Yˆd ) ) (12) che si ricava facilmente dalla (11). Se, per esempio, la stima Yˆd si riferisce agli individui dell’Italia Nord occidentale, l’errore relativo corrispondente si ottiene introducendo nella (12) i valori dei parametri a e b riportati nella riga del Nord-ovest del prospetto 2 alla voce Persone. I prospetti 3 e 4, presentati in aggiunta, consentono di rendere più agevole il calcolo degli errori campionari. Essi riguardano, rispettivamente, le famiglie e gli individui e hanno la seguente struttura: a) in fiancata sono elencati i valori crescenti di stima (20.000, 30.000, …, 25.000.000); b) le colonne successive contengono gli errori di campionamento relativo, per ciascun dominio territoriale di interesse, calcolati mediante la formula (12), corrispondenti alle stime di frequenze assolute della prima colonna. Le informazioni contenute in tali prospetti permettono di calcolare l'errore relativo di una generica stima di frequenza assoluta (o relativa) mediante due procedimenti che risultano di facile applicazione, anche se conducono a risultati meno precisi di quelli ottenibili mediante l'espressione (12). Il primo metodo consiste nell’individuare, nella prima colonna del prospetto, il livello di stima che più si avvicina alla stima di interesse e nel considerare come errore relativo il valore che si trova sulla stessa riga, nella colonna corrispondente al domino territoriale di riferimento. Con il secondo metodo, l’errore campionario della stima Yˆd si ricava mediante la seguente espressione: εˆ( Yˆdk −1 ) − εˆ( Yˆdk ) ˆ εˆ( Yˆd ) = εˆ( Yˆdk −1 ) − ( Yd − Yˆdk −1 ) k k −1 ˆ ˆ Yd − Yd dove Yˆdk −1 e Yˆdk (13) sono i valori delle stime, riportati nella prima colonna, entro i quali è compresa la stima di interesse Yˆd , ed εˆ( Yˆdk −1 ) e εˆ( Yˆdk ) i corrispondenti errori relativi. 17 Indagine “Aspetti della vita quotidiana” – Anno 2013 2 Prospetto 2 – Valori dei coefficienti a, b e dell’indice di determinazione R (%) delle funzioni utilizzate per le interpolazioni degli errori campionari delle stime riferite alle famiglie e alle persone per totale Italia, ripartizione geografica, tipo di comune e regione – Anno 2013 ZONE TERRITORIALI Famiglie Persone a b R2 (%) a b R2 (%) 8,619935 -1,092956 97,94 9,772668 -1,173521 93,21 8,571595 8,417164 8,291008 8,264812 7,596139 7,782771 7,237644 -1,086003 -1,067315 -1,088563 -1,077350 -1,036655 -1,055857 -1,005704 97,73 97,09 97,60 97,19 97,06 96,69 96,57 9,806589 9,632336 9,680580 9,448337 8,703095 8,695946 8,420116 -1,180028 -1,165067 -1,199780 -1,169685 -1,120613 -1,126234 -1,106125 91,84 91,65 91,01 93,69 93,12 92,57 92,83 8,583659 7,951727 6,523793 7,639370 8,380503 7,945205 -1,095282 -1,037782 -0,951639 -1,033062 -1,083915 -1,066272 97,94 96,09 91,81 96,73 96,61 97,78 9,841875 9,347833 7,995989 9,009392 9,131468 9,556154 -1,202028 -1,157067 -1,085265 -1,141565 -1,137721 -1,200372 94,15 92,68 88,28 92,11 91,93 93,76 6,846503 7,677760 -0,967860 -1,093738 92,90 96,19 8,595813 8,243061 -1,127956 -1,154451 89,64 91,14 Lombardia Trentino-Alto Adige Veneto Friuli-Venezia Giulia Emilia-Romagna 8,929405 6,771715 8,620469 7,766388 8,327705 -1,093692 -1,102723 -1,114841 -1,122430 -1,085842 97,09 96,81 97,15 95,54 97,06 9,648525 7,688005 9,319534 8,148085 9,704986 -1,156504 -1,193572 -1,177175 -1,162100 -1,204340 91,60 90,39 89,81 90,74 90,73 Toscana Umbria Marche Lazio Abruzzo 8,347643 7,227964 7,551462 8,712518 7,056535 -1,103799 -1,094306 -1,090054 -1,102127 -1,062965 96,94 96,60 95,78 97,38 95,42 9,150780 7,835864 8,340402 9,345812 7,713648 -1,172202 -1,158504 -1,164660 -1,152529 -1,128939 92,44 90,40 90,63 92,85 89,97 Molise Campania Puglia Basilicata Calabria 5,740525 7,810608 8,156408 6,925019 7,520907 -1,058036 -1,043447 -1,084143 -1,128378 -1,080597 95,35 96,63 95,21 95,33 95,48 5,863733 8,912957 8,361027 7,893093 8,207732 -1,081385 -1,136039 -1,102227 -1,231230 -1,144496 83,61 91,82 91,12 91,11 91,03 Sicilia Sardegna 8,124780 6,591071 -1,073117 -0,987770 96,23 87,73 8,838950 8,022681 -1,133109 -1,125748 92,32 92,17 ITALIA RIPARTIZIONI GEOGRAFICHE Nord Nord-ovest Nord-est Centro Mezzogiorno Sud Isole TIPI DI COMUNE A1 A2 B1 B2 B3 B4 REGIONI Piemonte - Valle d'Aosta - Vallée d'Aoste Liguria (a) (b) Italia nord-occidentale: Piemonte, Valle d’Aosta, Liguria, Lombardia; Italia nord-orientale: Bolzano, Trento, Veneto, Friuli-Venezia Giulia, Emilia-Romagna; Italia centrale: Toscana, Umbria, Marche, Lazio; Italia meridionale: Abruzzo, Molise, Campania, Puglia, Basilicata, Calabria; Italia insulare: Sicilia, Sardegna. Comuni tipo A1: Area urbana centro; Tipo A2: Area urbana periferia; Tipo B1: comuni fino a 2.000 abitanti; Tipo B2: da 2.001 a 10.000 abitanti; Tipo B3: da 10.001 a 50.000 abitanti; Tipo B4: oltre 50.000 abitanti. 18 Indagine “Aspetti della vita quotidiana” – Anno 2013 Prospetto 3 – Valori interpolati degli errori campionari relativi percentuali delle stime riferite alle famiglie per totale Italia, ripartizione geografica, tipo di comune e regione – Anno 2013 STIME Italia Nord Nordovest Nord-est Centro Mezzogiorno Sud Isole A1 A2 B1 B2 B3 B4 20.000 30.000 40.000 50.000 60.000 70.000 80.000 90.000 100.000 200.000 300.000 400.000 500.000 750.000 1.000.000 2.000.000 3.000.000 4.000.000 5.000.000 7.500.000 10.000.000 15.000.000 20.000.000 25.000.000 33,2 26,6 22,7 20,1 18,2 16,8 15,6 14,6 13,8 9,4 7,6 6,5 5,7 4,6 3,9 2,7 2,1 1,8 1,6 1,3 1,1 0,9 0,8 0,7 33,6 26,9 23,0 20,4 18,5 17,0 15,8 14,8 14,0 9,6 7,7 6,6 5,8 4,7 4,0 2,8 2,2 1,9 1,7 1,3 1,1 0,9 - 34,1 27,4 23,5 20,9 19,0 17,5 16,3 15,3 14,4 10,0 8,0 6,9 6,1 4,9 4,2 2,9 2,4 2,0 1,8 1,4 - 28,8 23,1 19,7 17,5 15,8 14,6 13,5 12,7 12,0 8,2 6,6 5,6 5,0 4,0 3,4 2,3 1,9 1,6 1,4 - 30,0 24,2 20,7 18,3 16,6 15,3 14,2 13,4 12,6 8,7 7,0 6,0 5,3 4,3 3,7 2,5 2,0 1,7 1,5 - 26,3 21,3 18,4 16,4 14,9 13,7 12,8 12,1 11,4 8,0 6,5 5,6 5,0 4,0 3,5 2,4 2,0 1,7 1,5 1,2 - 26,3 21,2 18,2 16,2 14,7 13,6 12,6 11,9 11,2 7,8 6,3 5,4 4,8 3,9 3,3 2,3 1,9 1,6 1,4 1,1 - 25,6 20,9 18,1 16,2 14,8 13,7 12,8 12,0 11,4 8,1 6,6 5,7 5,1 4,1 3,6 2,5 2,1 - 32,2 25,8 22,1 19,5 17,7 16,2 15,1 14,2 13,4 9,1 7,3 6,3 5,5 4,4 3,8 2,6 2,1 1,8 - 31,3 25,3 21,8 19,4 17,7 16,3 15,2 14,3 13,6 9,5 7,7 6,6 5,9 4,8 4,1 2,9 2,3 - 23,4 19,3 16,9 15,2 13,9 12,9 12,1 11,5 10,9 7,8 6,5 5,6 5,1 4,2 3,6 2,6 - 27,4 22,2 19,1 17,0 15,5 14,3 13,4 12,6 11,9 8,3 6,8 5,8 5,2 4,2 3,6 2,5 2,1 1,8 1,6 1,3 - 30,8 24,7 21,2 18,8 17,0 15,6 14,5 13,6 12,9 8,8 7,1 6,1 5,4 4,3 3,7 2,5 2,0 1,7 1,5 1,2 - 27,1 21,8 18,7 16,6 15,1 13,9 12,9 12,1 11,5 7,9 6,4 5,5 4,9 3,9 3,4 2,3 1,9 1,6 1,4 - STIME Piemonte Valle d'Aosta Vallée d'Aoste 20.000 30.000 40.000 50.000 60.000 70.000 80.000 90.000 100.000 200.000 300.000 400.000 500.000 750.000 1.000.000 2.000.000 27,5 22,1 19,0 16,9 15,3 14,1 13,2 12,4 11,7 8,1 6,5 5,6 5,0 4,0 3,4 2,4 6,4 5,1 4,4 3,9 3,5 - Liguria Lombardia 20,7 16,6 14,1 12,5 11,3 10,4 9,7 9,1 8,6 5,9 4,7 4,0 3,6 2,8 2,4 - 38,6 31,0 26,4 23,4 21,2 19,5 18,1 17,0 16,0 11,0 8,8 7,5 6,6 5,3 4,5 3,1 TrentinoAlto Adige Bolzano Trento Veneto 12,6 10,0 8,6 7,6 6,9 6,3 5,8 5,5 5,2 3,5 2,8 2,4 - 11,8 9,4 8,0 7,1 6,4 5,9 5,5 5,1 4,8 3,3 - 12,1 9,7 8,2 7,3 6,6 6,0 5,6 5,2 4,9 3,4 - 29,8 23,8 20,3 17,9 16,2 14,8 13,8 12,9 12,2 8,3 6,6 5,6 5,0 4,0 3,4 2,3 FriuliEmiliaVenezia Romagna Giulia 18,7 14,9 12,7 11,2 10,1 9,3 8,6 8,1 7,6 5,1 4,1 3,5 3,1 2,5 - 29,7 23,9 20,4 18,1 16,4 15,1 14,0 13,1 12,4 8,5 6,8 5,8 5,2 4,2 3,6 2,4 Toscana Umbria 27,5 22,0 18,7 16,6 15,0 13,8 12,8 12,0 11,3 7,7 6,2 5,3 4,6 3,7 3,2 2,2 16,5 13,2 11,3 10,0 9,0 8,3 7,7 7,2 6,8 4,7 3,7 3,2 - STIME Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna 20.000 30.000 40.000 50.000 60.000 70.000 80.000 90.000 100.000 200.000 300.000 400.000 500.000 750.000 1.000.000 2.000.000 19,8 15,8 13,5 12,0 10,9 10,0 9,3 8,7 8,2 5,6 4,5 3,9 3,4 2,7 - 33,2 26,6 22,7 20,1 18,1 16,7 15,5 14,5 13,7 9,3 7,5 6,4 5,6 4,5 3,9 2,6 17,6 14,2 12,2 10,8 9,8 9,1 8,4 7,9 7,5 5,2 4,2 3,6 3,2 2,6 - 9,4 7,6 6,5 5,8 5,2 4,8 4,5 4,2 4,0 2,8 - 28,3 22,9 19,7 17,6 16,0 14,7 13,7 12,9 12,2 8,5 6,9 5,9 5,3 4,3 3,7 2,6 27,5 22,1 18,9 16,7 15,2 14,0 13,0 12,2 11,5 7,9 6,3 5,4 4,8 3,9 3,3 - 11,9 9,5 8,1 7,1 6,4 5,9 5,5 5,1 4,8 3,3 2,6 - 20,4 16,4 14,0 12,4 11,3 10,4 9,6 9,0 8,5 5,9 4,7 4,0 3,6 2,9 - 28,6 23,0 19,7 17,5 15,9 14,6 13,6 12,8 12,1 8,3 6,7 5,7 5,1 4,1 3,5 2,4 20,3 16,6 14,4 12,9 11,8 10,9 10,2 9,6 9,2 6,5 5,3 4,6 4,1 3,4 - 19 Indagine “Aspetti della vita quotidiana” – Anno 2013 Prospetto 4 – Valori interpolati degli errori campionari relativi percentuali delle stime riferite alle persone per totale Italia, ripartizione geografica, tipo di comune e regione – Anno 2013 STIME Italia Nord Nordovest Nord-est Centro Mezzogiorno Sud Isole A1 A2 B1 B2 B3 B4 20.000 30.000 40.000 50.000 60.000 70.000 80.000 90.000 100.000 200.000 300.000 400.000 500.000 750.000 1.000.000 2.000.000 3.000.000 4.000.000 5.000.000 7.500.000 10.000.000 15.000.000 20.000.000 25.000.000 39,7 31,3 26,4 23,2 20,8 19,0 17,6 16,4 15,4 10,3 8,1 6,8 6,0 4,7 4,0 2,7 2,1 1,8 1,6 1,2 1,0 0,8 0,7 0,6 39,1 30,8 26,0 22,8 20,4 18,7 17,2 16,1 15,1 10,0 7,9 6,7 5,8 4,6 3,9 2,6 2,0 1,7 1,5 1,2 1,0 0,8 0,7 0,6 38,6 30,4 25,8 22,6 20,3 18,6 17,2 16,1 15,1 10,1 8,0 6,7 5,9 4,7 3,9 2,6 2,1 1,8 1,5 1,2 1,0 0,8 0,7 - 33,3 26,1 21,9 19,2 17,2 15,7 14,5 13,5 12,7 8,4 6,6 5,5 4,8 3,8 3,2 2,1 1,6 1,4 1,2 1,0 0,8 0,6 - 34,4 27,1 22,9 20,1 18,1 16,5 15,3 14,3 13,4 8,9 7,1 6,0 5,2 4,1 3,5 2,3 1,8 1,6 1,4 1,1 0,9 0,7 - 30,2 24,1 20,5 18,1 16,3 15,0 13,9 13,0 12,3 8,3 6,6 5,6 5,0 4,0 3,4 2,3 1,8 1,6 1,4 1,1 0,9 0,7 0,6 0,6 29,3 23,3 19,8 17,5 15,8 14,5 13,4 12,5 11,8 8,0 6,4 5,4 4,8 3,8 3,2 2,2 1,7 1,5 1,3 1,0 0,9 0,7 - 28,2 22,5 19,2 17,0 15,3 14,1 13,1 12,3 11,6 7,9 6,3 5,4 4,7 3,8 3,2 2,2 1,8 1,5 1,3 1,1 - 35,7 27,9 23,5 20,6 18,4 16,8 15,5 14,4 13,6 8,9 7,0 5,9 5,2 4,0 3,4 2,2 1,8 1,5 1,3 1,0 0,9 - 34,8 27,5 23,3 20,5 18,4 16,9 15,6 14,6 13,7 9,2 7,3 6,2 5,4 4,3 3,6 2,4 1,9 1,6 1,4 1,1 - 25,3 20,3 17,3 15,4 13,9 12,8 11,9 11,2 10,5 7,2 5,8 5,0 4,4 3,5 3,0 2,1 1,7 1,4 - 31,7 25,2 21,4 18,8 16,9 15,5 14,4 13,4 12,7 8,5 6,8 5,7 5,1 4,0 3,4 2,3 1,8 1,5 1,4 1,1 0,9 0,7 - 34,4 27,3 23,2 20,4 18,4 16,9 15,6 14,6 13,8 9,3 7,4 6,3 5,5 4,4 3,7 2,5 2,0 1,7 1,5 1,2 1,0 0,8 - 31,2 24,4 20,6 18,0 16,1 14,7 13,6 12,6 11,9 7,8 6,1 5,2 4,5 3,5 3,0 2,0 1,5 1,3 1,1 0,9 0,7 0,6 - STIME Piemonte Valle d'Aosta Vallée d'Aoste 20.000 30.000 40.000 50.000 60.000 70.000 80.000 90.000 100.000 200.000 300.000 400.000 500.000 750.000 1.000.000 2.000.000 3.000.000 4.000.000 5.000.000 28,9 22,9 19,3 17,0 15,3 14,0 12,9 12,1 11,4 7,6 6,0 5,1 4,5 3,5 3,0 2,0 1,6 1,3 1,2 5,7 4,5 3,8 3,3 3,0 2,7 2,5 2,3 2,2 1,4 - Liguria Lombardia 20,3 16,1 13,6 12,0 10,8 9,8 9,1 8,5 8,0 5,4 4,3 3,6 3,2 2,5 - 40,6 32,1 27,2 23,9 21,5 19,7 18,2 17,0 16,0 10,7 8,5 7,2 6,3 5,0 4,2 2,8 2,2 1,9 1,7 TrentinoAlto Adige Bolzano Trento Veneto 12,7 9,9 8,4 7,3 6,6 6,0 5,5 5,2 4,8 3,2 2,5 2,1 - 11,8 9,3 7,8 6,9 6,2 5,6 5,2 4,8 4,5 3,0 2,4 2,0 1,7 - 11,6 9,1 7,6 6,7 6,0 5,5 5,1 4,7 4,4 2,9 2,3 1,9 1,7 1,3 - 31,1 24,5 20,7 18,1 16,3 14,9 13,7 12,8 12,0 8,0 6,3 5,3 4,7 3,7 3,1 2,1 1,6 1,4 1,2 20 FriuliEmiliaVenezia Romagna Giulia 18,6 14,7 12,5 10,9 9,8 9,0 8,3 7,8 7,3 4,9 3,9 3,3 2,9 2,3 1,9 1,3 - 32,9 25,8 21,7 19,0 17,0 15,5 14,3 13,3 12,5 8,2 6,4 5,4 4,7 3,7 3,1 2,1 1,6 1,4 1,2 Toscana Umbria 29,3 23,1 19,5 17,1 15,4 14,0 13,0 12,1 11,4 7,6 6,0 5,1 4,4 3,5 3,0 2,0 1,6 1,3 - 16,2 12,8 10,9 9,5 8,6 7,9 7,3 6,8 6,4 4,3 3,4 2,9 2,5 2,0 1,7 - Prospetto 4 segue – Valori interpolati degli errori campionari relativi percentuali delle stime riferite alle persone per totale Italia, ripartizione geografica, tipo di comune e regione – Anno 2013 STIME Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna 20.000 30.000 40.000 50.000 60.000 70.000 80.000 90.000 100.000 200.000 300.000 400.000 500.000 750.000 1.000.000 2.000.000 3.000.000 4.000.000 5.000.000 20,3 16,0 13,5 11,9 10,7 9,8 9,0 8,4 7,9 5,3 4,2 3,5 3,1 2,5 2,1 1,4 - 35,6 28,1 23,8 21,0 18,9 17,3 16,0 14,9 14,1 9,4 7,5 6,3 5,6 4,4 3,7 2,5 2,0 1,7 1,5 17,7 14,1 11,9 10,5 9,5 8,7 8,1 7,6 7,1 4,8 3,8 3,3 2,9 2,3 1,9 1,3 - 8,9 7,1 6,1 5,4 4,9 4,5 4,2 3,9 3,7 2,6 2,1 - 31,1 24,7 21,0 18,5 16,6 15,3 14,1 13,2 12,5 8,4 6,7 5,7 5,0 4,0 3,4 2,3 1,8 1,5 1,3 27,9 22,3 19,0 16,8 15,2 14,0 13,0 12,2 11,5 7,8 6,3 5,3 4,7 3,8 3,2 2,2 1,8 1,5 1,3 11,6 9,1 7,6 6,6 5,9 5,4 5,0 4,6 4,3 2,8 2,2 1,8 1,6 1,3 - 20,9 16,6 14,1 12,4 11,2 10,2 9,5 8,9 8,3 5,6 4,4 3,8 3,3 2,6 2,2 1,5 - 30,4 24,1 20,5 18,1 16,3 14,9 13,9 13,0 12,2 8,2 6,6 5,6 4,9 3,9 3,3 2,2 1,8 1,5 1,3 20,9 16,7 14,2 12,5 11,3 10,3 9,6 9,0 8,5 5,7 4,6 3,9 3,4 2,7 2,3 1,6 - 5.5. Esempi di calcolo degli errori campionari 5.5.1 Esempi relativi alle stime delle famiglie Esempio 1 Nel 2013, il numero delle famiglie in Sardegna che considerano la loro situazione economica rispetto all’anno precedente “molto peggiorata” è 146.000. Si cerca il livello di stima che più si avvicina a 146.000 nella colonna corrispondente alla regione Sardegna del prospetto 3. L’errore relativo percentuale della stima considerata, per la Sardegna, è pari al 9,2%. L’errore assoluto sarà: σ (146.000) = 0,092 x 146.000 = 13.432 L’intervallo di confidenza avrà come estremi : 146.000 - (1,96 x 13.432) = 119.673 146.000 + (1,96 x 13.432) = 172.327 Esempio 2 Considerando la stima precedente si possono ottenere valori più precisi dell’errore di campionamento operando mediante interpolazione lineare dei due livelli di stima consecutivi tra i quali è compreso il valore della stessa. Tali livelli sono 100.000 e 200.000 ai quali corrispondono i valori 9,2% e 6,5%. Indagine “Aspetti della vita quotidiana” – Anno 2013 L’errore relativo corrispondente a 127.000 è pari a : σ (146.000) = 0,092 -{[ (0,092 - 0,065)/(200.000 - 100.000)] x (146.000 - 100.000) }= 8,0% Il corrispondente errore assoluto è 0,080x 146.000 = 11.619 e l’intervallo di confidenza avrà come estremi: 146.000 - (1,96 x 9.779) = 123.227 146.000 + (1,96 x 9.779) = 168.773 Esempio 3 Il calcolo dell’errore può essere effettuato direttamente tramite la funzione interpolante: ( εˆ( Yˆ ) = exp a + b log( Yˆ ) ) i cui parametri, riportati nel prospetto 2 alla riga Sardegna, sono i seguenti: a = 6,59107075 b = -0,9877704 Per Yˆ = 146.000 si ha: εˆ (Yˆ ) = exp(6,59107075 - 0,9877704 × log(146000 ) ) = 0,076. L’errore relativo percentuale è quindi pari al 7,60% e il calcolo dell’errore assoluto e dell’intervallo di confidenza è del tutto analogo a quello degli esempi 1 e 2. 5.5.2 Esempi relativi alle stime delle persone Esempio 1 Nel 2013, in Veneto le persone di 14 anni e più che si considerano per niente soddisfatte per la propria salute sono 170.000. Si cerca il livello di stima che più si avvicina a 170.000 nella prima colonna del prospetto 4 per il Veneto. L’errore relativo percentuale della stima considerata è pari a 8,0 %. L’errore assoluto sarà: σ (170.000) = 0,080 x 170.000 = 13.600 L’intervallo di confidenza avrà come estremi : 22 Indagine “Aspetti della vita quotidiana” – Anno 2013 170.000 - (1,96 x 13.600) = 143.344 170.000 + (1,96 x 13.600) = 196.656 Esempio 2 Considerando la stima precedente si possono ottenere valori più precisi dell’errore di campionamento operando mediante interpolazione lineare dei due livelli di stima consecutivi tra i quali è compreso il valore della stessa. Tali livelli sono 100.000 e 200.000 ai quali corrispondono i valori percentuali 12,0 e 8,0. L’errore relativo corrispondente a 170.000 è pari a : σ (170.000) = 12,0 – { [ (12,0 – 8,0) / ( 200.000 - 100.000) ] x (170000 - 100.000) } = 9,20% Il corrispondente errore assoluto è 0,0920 x 170000 = 15.640 e l’intervallo di confidenza avrà come estremi: 170000 - (1,96 x 15.640) = 139.346 170000 +(1,96 x 15.640) = 200.654 Esempio 3 Il calcolo dell’errore può essere effettuato, direttamente, tramite la funzione interpolante: ( εˆ( Yˆ ) = exp a + b log( Yˆ ) ) i cui parametri, riportati nel prospetto 2 alla riga Veneto, sono i seguenti: a = 9,31953354 b = -1,1771746. Per Yˆ = 170.000 si ha: εˆ (Yˆ ) = exp( 9,31953354 - 1,1771746 × log(170.000) ) = 0,0881. L’errore relativo percentuale è quindi pari al 8,81% e il calcolo dell’errore assoluto e dell’intervallo di confidenza è del tutto analogo a quello degli esempi 1 e 2. 23 Indagine “Aspetti della vita quotidiana” – Anno 2013 6. La diffusione dei risultati dell’indagine I principali risultati dell'indagine vengono resi disponibili sul sito dell'Istat attraverso sia il Datawarehouse I.stat sia le statistiche report pubblicate nei settori con argomento: "Opinioni dei cittadini", "Salute e sanità", "Cultura, comunicazione, tempo libero", "Partecipazione sociale". I dati d’indagine vengono resi disponibili mediante il rilascio di file di microdati. Ricercatori e studiosi possono accedere al Laboratorio di Analisi dei Dati Elementari (“ADELE”) per effettuare di persona le proprie analisi statistiche sui microdati dell’indagine, nel rispetto delle norme sulla riservatezza dei dati personali. I principali risultati dell’Indagine vengono anche divulgati nei volumi generali dell’Istat. Ogni anno, inoltre, i dati raccolti vengono analizzati e pubblicati anche su volumi a carattere generale (Rapporto annuale, Annuario statistico italiano, Noi Italia, Italia in cifre). I volumi curati dall'Istat sono consultabili nel Catalogo editoriale. I dati comunicati sono privi degli elementi identificativi del soggetto al quale si riferiscono, nonché di ogni altro elemento che consenta, anche indirettamente, il collegamento con le famiglie o gli individui intervistati. 7. Glossario I dati generali individuali fanno riferimento alle caratteristiche delle persone all’epoca dell’intervista. In particolare: • l’età è espressa in anni compiuti; • il titolo di studio è quello più elevato conseguito; • la condizione è quella dichiarata come unica o prevalente dalle persone di 15 anni e più. Si precisa inoltre che per: occupato si intende chi possiede un’occupazione in proprio o alle dipendenze da cui trae un profitto o una retribuzione (utile, onorario, stipendio, salario) o chi collabora con un familiare che svolge un’attività lavorativa in conto proprio senza avere un regolare contratto di lavoro (coadiuvante); persona in cerca di occupazione si intende chi ha perduto una precedente occupazione alle dipendenze, o chi non ha mai esercitato un’attività lavorativa ed è alla ricerca attiva di un’occupazione che è in grado di accettare se gli viene offerta; casalinga è chi si dedica prevalentemente alle faccende domestiche; studente è chi si dedica prevalentemente allo studio; 24 Indagine “Aspetti della vita quotidiana” – Anno 2013 ritirato dal lavoro è chi ha cessato un’attività lavorativa per raggiunti limiti di età, invalidità o altra causa; la figura del ritirato dal lavoro non coincide necessariamente con quella del pensionato in quanto, non sempre, il ritirato dal lavoro gode di una pensione; in altra condizione è chi si trova in condizione diversa da quelle sopra elencate (militare, inabile al lavoro, benestante, detenuto, eccetera). • la posizione nella professione è quella dichiarata come unica o prevalente dagli occupati di 15 anni e più che viene aggregata nel modo seguente: dirigenti, imprenditori, liberi professionisti; direttivi, quadri, impiegati; capo operai, operai (inclusi apprendisti, lavoratori a domicilio per conto di imprese); lavoratori in proprio, coadiuvanti (inclusi soci di cooperative di produzione di beni e/o prestazioni di servizio). • famiglia e nucleo familiare Si precisa che: la famiglia è costituita dall’insieme delle persone coabitanti legate da vincoli di matrimonio o parentela, affinità, adozione, tutela o affettivi; il nucleo è l’insieme delle persone che formano una coppia con figli celibi o nubili, una coppia senza figli, un genitore solo con figli celibi o nubili; 8. Riferimenti bibliografici Il sistema di indagini sociali multiscopo, Metodi e Norme, n. 31, Anno 2006 9. Contatti Struttura e dinamica sociale Unità operativa Qualità della vita quotidiana e benessere Sante Orsini Tel. +39 06 4673.7256 Email [email protected] Silvia Montecolle Tel. +39 06 4673.7361 Email [email protected] 10. Curatori dei capitoli Il documento è stato redatto da Silvia Montecolle 25
© Copyright 2024 ExpyDoc