Chiorri, C. (2014). Fondamenti di psicometria - Approfondimento 3.2 1 Approfondimento 3.2 Indici di variabilità a livello nominale Gli indici di variabilità a livello nominale sono il Rapporto di Variazione (Variation Ratio), l’Indice di Diversità (Index of Diversity) e l’Indice di Variazione Qualitativa (Index of Qualitative Variation) (Weisberg, 1992). Il Rapporto di Variazione (RV) è la proporzione di casi che non cadono nella categoria che costituisce la moda della distribuzione: RV = 1 − f moda n dove fmoda è la frequenza della categoria o classe modale, e n il numero di osservazioni. Questo valore indica quanto la moda è descrittiva dei dati. Nel caso della distribuzione di frequenza dello stato civile (Tabella 1) Tabella 1 Distribuzione di frequenza dello stato civile in un gruppo di 139 soggetti Stato Civile Frequenza Celibe/nubile 96 Coniugato/a 16 Convivente 10 Divorziato/a 6 Separato/a 6 Vedovo/a 5 Totale 139 essendo la moda Celibe/Nubile, con frequenza 96, il Rapporto di Variazione è uguale a: RV = 1 − f moda 96 =1− = 0,31 n 139 Tale indice risulta uguale a zero quando tutti i casi cadono nella stessa categoria, e il suo valore massimo dipende dal numero di categorie della variabile. Se la variabile ha k categorie e ognuna di queste si verifica con uguale frequenza n/k − distribuzione uniforme e dunque amodale − si ha: n 1 RV = 1 − k = 1 − n k che tenderà a 1 quanto maggiore sarà il numero di categorie k. Il RV è molto semplice da calcolare, ma ha lo svantaggio di essere basato solo sulla proporzione di casi che cadono nella categoria modale. L’Indice di Diversità (ID), è basato sulla proporzione di casi che cadono in ogni categoria. In pratica, si eleva al quadrato la proporzione di casi di ogni categoria della variabile, si sommano i valori ottenuti, e si sottrae la somma da 1: k ID = 1 − ∑ pi2 = 1 − ( p12 + p22 + p32 + ... + pk2 ) i =1 Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia Chiorri, C. (2014). Fondamenti di psicometria - Approfondimento 3.2 2 dove pi è appunto la proporzione di casi in ogni categoria e k è il numero di categorie. Nel caso dello stato civile avremo (Tabella 2). Tabella 2 Calcoli necessari per ottenere l’Indice di Diversità Stato Civile Frequenza p2 i 2 Celibe/nubile 96 (96 / 139) = (,691)2 = ,477 Coniugato/a 16 (16 / 139)2 = (,115)2 = ,013 Convivente 10 (10 / 139)2 = (,072)2 = ,005 Divorziato/a 6 (6 / 139)2 = (,043)2 = ,002 Separato/a 6 (6 / 139)2 = (,043)2 = ,002 Vedovo/a 5 (5 / 139)2 = (,036)2 = ,001 139 ,50 Somma (Σ) da cui: k ID = 1 − ∑ pi2 = 1−,50 =,50 i =1 L’Indice di Diversità si avvicina allo zero quando quasi tutti i casi cadono nella stessa categoria, ed è massimo quando vi è un solo caso per categoria. Come nel caso del Rapporto di Variazione il massimo dipende dal numero di categorie della variabile, per cui ID non può essere confrontato fra distribuzioni con un diverso numero di categorie. Se in ognuna delle k categorie vi è lo stesso 1 numero di casi n/k, si dimostra facilmente che il valore di ID è 1− e dunque coincide con il k Rapporto di Variazione. Se k = 4, avremo che ID = ,75, se k = 8 ID = ,875, se k = 20 ID = ,95, etc., per cui ID tende a 1 per un numero di categorie k che tende a infinito. Nondimeno, il massimo possibile aumenta all’aumentare del numero di categorie. L’Indice di Variazione Qualitativa (IVQ), invece, raggiunge il valore 1 solo quando la variabilità è massima, indipendentemente dal numero di categorie. Di fatto, è uguale all’Indice di Diversità diviso per il massimo Indice di Diversità possibile in base al numero di categorie: k ID = IVQ = 1 1− k 1 − ∑ pi2 i =1 1− 1 k 1 − ( p12 + p 22 + p32 + ... + p k2 ) = 1 1− k Nel caso dello stati civile ID era ,50, e il massimo possibile in base al numero di categorie k (= 6) 1 5 era 1 − = =,83 , per cui: 6 6 IVQ = ID ,50 = =,60 1 ,83 1− k L’IVQ risulta uguale a zero quando tutti i casi cadono entro una singola categoria, mentre è uguale a 1 quando i casi sono equidistribuiti nelle categorie della variabile, ossia ogni categoria ha la stessa frequenza n/k. La scelta dell’indice di dispersione a livello nominale dipende dalla domanda di ricerca. Se nell’alimentari sotto casa ci sono solo due tipi di dentifricio, e le scelte dei clienti sono equidistribuite, ogni marca sarà scelta dal 50% degli avventori. Se all’ipermercato i tipi di dentifricio sono 8 e nuovamente le scelte della clientela sono equidistribuite, ogni tipo di dentifricio Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia Chiorri, C. (2014). Fondamenti di psicometria - Approfondimento 3.2 3 sarà acquistato dal 12,5% dei clienti. Il valore di IVQ nei due casi è sempre uguale 1, poiché la misura di diversità che veicola è massima indipendentemente dal numero di categorie. Nondimeno, questi dati suggeriscono che la dispersione è maggiore nel caso dell’ipermercato, e questo sarebbe provato sia dal numero di categorie come indice di dispersione a livello nominale, sia dall’Indice di Diversità, che è ,50 per l’alimentari e ,875 per l’ipermercato. Ad ogni modo, ci possono essere casi in cui è utile avere un indice di variabilità che vari da 0 a 1 indipendentemente dal numero di categorie. Riferimenti bibliografici Weisberg, H. F. (1992). Central Tendency and Variability. Sage University Paper series on Quantitative Applications in the Social Sciences, 07-083. Newbury Park, CA: Sage. Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
© Copyright 2024 ExpyDoc