|
Ricorrendo ai valori caratteristici posizionali si rileva
la dispersione dei dati fra le categorie ordinate individuando specifici
valori (quartili o simili) collocati in punti particolari della distribuzione.
Leti ha proposto un indice di dispersione che tiene
conto di tutta la distribuzione, la cui formula è la seguente:
Con k si intende il numero delle categorie, con
h le categorie, Ph indica la proporzione cumulata
fino a quella data categoria compresa, e con (1 - Ph)
si intende il complemento ad 1 di questa proporzione, cioè la frequenza
relativa retrocumulata fino a quella data categoria esclusa. I prodotti
di queste due proporzioni, categoria per categoria, sono gli addendi della
sommatoria, che va poi divisa per il numero degli addendi (k-1).
Vediamo un esempio di dispersione dei dati in due distribuzioni:
unimodale centrale e bimodale.
| Titolo di studio |
% |
Ph*(1 - Ph) |
| nessuno |
17 |
0.17*0.83=0.141 |
| lic. elementare |
24 |
0.41*0.59=0.242 |
| lic.media |
29 |
0.70*0.30=0.21 |
| diploma |
23 |
0.93*0.07=0.065 |
| laurea |
7 |
- |
|
|
totale=0.658 |
| d*=(4*0,66)/(5-1)=0,66 |
|
| Ambiente di residenza |
Nk |
Ph*(1 - Ph) |
| urbani centr. |
2241 |
0.34*0.66=0.224 |
| urbani perif. |
1208 |
0.52*0.48=0.25 |
| quasi urbani |
647 |
0.62*0.38=0.236 |
| quasi rurali |
1186 |
0.80*0.20=0.16 |
| rurali |
1352 |
totale=0.87 |
| imprecisato |
390 |
|
| d*=(4*0,87)/(5-1)=0,87 |
|
(da Marradi, 1993)
La tabella illustra la logica dell'indice d*
confrontando una distribuzione unimodale
centrale (titolo di studio di cui precedentemente si è mostrata
la rappresentazione grafica) e una distribuzione
bimodale (tipo di ambiente di residenza). Come ci si attendeva il valore
di d* è più alto per la distribuzione bimodale
(frequenze più disperse verso le categorie estreme) che per la distribuzione
unimodale centrale (frequenze più concentrate). Nel secondo caso
infatti avendo le categorie estreme frequenze ridotte, uno dei due moltiplicandi
è più piccolo, cosa che non succede nel caso di una distribuzione
bimodale.
L'indice d* vale 0 quando tutti i casi sono concentrati in una sola categoria (dispersione minima), mentre assume un valore dipendente da k (numero delle categorie) quando è presente il massimo equilibrio (tutte le categorie hanno lo stesso numero di casi) nella distribuzione. La figura seguente illustra l'andamento di d*max al variare di k.
|