Approfondimento 3.2 Indici di variabilità a livello

Chiorri, C. (2014). Fondamenti di psicometria - Approfondimento 3.2
1
Approfondimento 3.2
Indici di variabilità a livello nominale
Gli indici di variabilità a livello nominale sono il Rapporto di Variazione (Variation Ratio), l’Indice
di Diversità (Index of Diversity) e l’Indice di Variazione Qualitativa (Index of Qualitative
Variation) (Weisberg, 1992).
Il Rapporto di Variazione (RV) è la proporzione di casi che non cadono nella categoria che
costituisce la moda della distribuzione:
RV = 1 −
f moda
n
dove fmoda è la frequenza della categoria o classe modale, e n il numero di osservazioni. Questo
valore indica quanto la moda è descrittiva dei dati. Nel caso della distribuzione di frequenza dello
stato civile (Tabella 1)
Tabella 1 Distribuzione di frequenza dello stato civile in un gruppo di 139 soggetti
Stato Civile Frequenza
Celibe/nubile
96
Coniugato/a
16
Convivente
10
Divorziato/a
6
Separato/a
6
Vedovo/a
5
Totale
139
essendo la moda Celibe/Nubile, con frequenza 96, il Rapporto di Variazione è uguale a:
RV = 1 −
f moda
96
=1−
= 0,31
n
139
Tale indice risulta uguale a zero quando tutti i casi cadono nella stessa categoria, e il suo valore
massimo dipende dal numero di categorie della variabile. Se la variabile ha k categorie e ognuna di
queste si verifica con uguale frequenza n/k − distribuzione uniforme e dunque amodale − si ha:
n
1
RV = 1 − k = 1 −
n
k
che tenderà a 1 quanto maggiore sarà il numero di categorie k. Il RV è molto semplice da calcolare,
ma ha lo svantaggio di essere basato solo sulla proporzione di casi che cadono nella categoria
modale.
L’Indice di Diversità (ID), è basato sulla proporzione di casi che cadono in ogni categoria.
In pratica, si eleva al quadrato la proporzione di casi di ogni categoria della variabile, si sommano i
valori ottenuti, e si sottrae la somma da 1:
k
ID = 1 − ∑ pi2 = 1 − ( p12 + p22 + p32 + ... + pk2 )
i =1
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Approfondimento 3.2
2
dove pi è appunto la proporzione di casi in ogni categoria e k è il numero di categorie. Nel caso
dello stato civile avremo (Tabella 2).
Tabella 2 Calcoli necessari per ottenere l’Indice di Diversità
Stato Civile Frequenza
p2 i
2
Celibe/nubile
96
(96 / 139) = (,691)2 = ,477
Coniugato/a
16
(16 / 139)2 = (,115)2 = ,013
Convivente
10
(10 / 139)2 = (,072)2 = ,005
Divorziato/a
6
(6 / 139)2 = (,043)2 = ,002
Separato/a
6
(6 / 139)2 = (,043)2 = ,002
Vedovo/a
5
(5 / 139)2 = (,036)2 = ,001
139
,50
Somma (Σ)
da cui:
k
ID = 1 − ∑ pi2 = 1−,50 =,50
i =1
L’Indice di Diversità si avvicina allo zero quando quasi tutti i casi cadono nella stessa categoria, ed
è massimo quando vi è un solo caso per categoria. Come nel caso del Rapporto di Variazione il
massimo dipende dal numero di categorie della variabile, per cui ID non può essere confrontato fra
distribuzioni con un diverso numero di categorie. Se in ognuna delle k categorie vi è lo stesso
1
numero di casi n/k, si dimostra facilmente che il valore di ID è 1− e dunque coincide con il
k
Rapporto di Variazione. Se k = 4, avremo che ID = ,75, se k = 8 ID = ,875, se k = 20 ID = ,95, etc.,
per cui ID tende a 1 per un numero di categorie k che tende a infinito. Nondimeno, il massimo
possibile aumenta all’aumentare del numero di categorie.
L’Indice di Variazione Qualitativa (IVQ), invece, raggiunge il valore 1 solo quando la
variabilità è massima, indipendentemente dal numero di categorie. Di fatto, è uguale all’Indice di
Diversità diviso per il massimo Indice di Diversità possibile in base al numero di categorie:
k
ID
=
IVQ =
1
1−
k
1 − ∑ pi2
i =1
1−
1
k
1 − ( p12 + p 22 + p32 + ... + p k2 )
=
1
1−
k
Nel caso dello stati civile ID era ,50, e il massimo possibile in base al numero di categorie k (= 6)
1 5
era 1 − = =,83 , per cui:
6 6
IVQ =
ID
,50
=
=,60
1 ,83
1−
k
L’IVQ risulta uguale a zero quando tutti i casi cadono entro una singola categoria, mentre è uguale
a 1 quando i casi sono equidistribuiti nelle categorie della variabile, ossia ogni categoria ha la stessa
frequenza n/k.
La scelta dell’indice di dispersione a livello nominale dipende dalla domanda di ricerca. Se
nell’alimentari sotto casa ci sono solo due tipi di dentifricio, e le scelte dei clienti sono
equidistribuite, ogni marca sarà scelta dal 50% degli avventori. Se all’ipermercato i tipi di
dentifricio sono 8 e nuovamente le scelte della clientela sono equidistribuite, ogni tipo di dentifricio
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Approfondimento 3.2
3
sarà acquistato dal 12,5% dei clienti. Il valore di IVQ nei due casi è sempre uguale 1, poiché la
misura di diversità che veicola è massima indipendentemente dal numero di categorie. Nondimeno,
questi dati suggeriscono che la dispersione è maggiore nel caso dell’ipermercato, e questo sarebbe
provato sia dal numero di categorie come indice di dispersione a livello nominale, sia dall’Indice di
Diversità, che è ,50 per l’alimentari e ,875 per l’ipermercato. Ad ogni modo, ci possono essere casi
in cui è utile avere un indice di variabilità che vari da 0 a 1 indipendentemente dal numero di
categorie.
Riferimenti bibliografici
Weisberg, H. F. (1992). Central Tendency and Variability. Sage University Paper series on
Quantitative Applications in the Social Sciences, 07-083. Newbury Park, CA: Sage.
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia