Università di Torino
Unità 5

cerca documenti Ritorna a Unità  5 Unità 5

Ricorrendo ai valori caratteristici posizionali si rileva la dispersione dei dati fra le categorie ordinate individuando specifici valori (quartili o simili) collocati in punti particolari della distribuzione.

Leti ha proposto un indice di dispersione che tiene conto di tutta la distribuzione, la cui formula è la seguente:
 
 

Con k si intende il numero delle categorie, con h le categorie, Ph indica la proporzione cumulata fino a quella data categoria compresa, e con (1 - Ph) si intende il complemento ad 1 di questa proporzione, cioè la frequenza relativa retrocumulata fino a quella data categoria esclusa. I prodotti di queste due proporzioni, categoria per categoria, sono gli addendi della sommatoria, che va poi divisa per il numero degli addendi (k-1).

Vediamo un esempio di dispersione dei dati in due distribuzioni: unimodale centrale e bimodale.
 
Titolo di studio % Ph*(1 - Ph)
nessuno 17 0.17*0.83=0.141
lic. elementare 24 0.41*0.59=0.242
lic.media 29 0.70*0.30=0.21
diploma 23 0.93*0.07=0.065
laurea 7 -
totale=0.658
d*=(4*0,66)/(5-1)=0,66 
 
Ambiente di residenza Nk Ph*(1 - Ph) 
urbani centr.  2241 0.34*0.66=0.224
urbani perif.  1208 0.52*0.48=0.25
quasi urbani 647 0.62*0.38=0.236
quasi rurali 1186 0.80*0.20=0.16
rurali 1352 totale=0.87
imprecisato 390
d*=(4*0,87)/(5-1)=0,87
 
(da Marradi, 1993)

La tabella illustra la logica dell'indice d* confrontando una distribuzione unimodale centrale (titolo di studio di cui precedentemente si è mostrata la rappresentazione grafica) e una distribuzione bimodale (tipo di ambiente di residenza). Come ci si attendeva il valore di d* è più alto per la distribuzione bimodale (frequenze più disperse verso le categorie estreme) che per la distribuzione unimodale centrale (frequenze più concentrate). Nel secondo caso infatti avendo le categorie estreme frequenze ridotte, uno dei due moltiplicandi è più piccolo, cosa che non succede nel caso di una distribuzione bimodale.

L'indice d* vale 0 quando tutti i casi sono concentrati in una sola categoria (dispersione minima), mentre assume un valore dipendente da k (numero delle categorie) quando è presente il massimo equilibrio (tutte le categorie hanno lo stesso numero di casi) nella distribuzione. La figura seguente illustra l'andamento di d*max al variare di k.


Last Update 08-Jul-1999 by leda
Page URL = http://hal9000.cisi.unito.it/wfprog/GetURL.exe?ID=20974&type=1
Coordinamento del progetto "www.unito.it" a cura del CISI

ModificaDati