Università di Torino
Unità 11

cerca documenti Ritorna a Unità 11 Unità 11

Supponiamo di avere una popolazione formata da cinque bambini di età diversa:
Soggetto A 1 anno
Soggetto B 2 anni
Soggetto C 3 anni
Soggetto D 4 anni
Soggetto E 5 anni

L'età media nella popolazione è µ = 3 anni, lo scarto tipo = radice di 2 = 1,414 anni. La distribuzione, il cui poligono di frequenza è illustrato in figura 1, è rettangolare, dato che ogni valore di età ha frequenza 1.


Fig. 1 - Esempio di distribuzione rettangolare

Supponiamo di voler estrarre da questa popolazione tutti i possibili campioni di classe n=2. I campioni estraibili sono N2=52=25, e sono elencati nella tabella 2, con accanto la stima della media ricavata dal campione stesso. L' estrazione è stata fatta con reimmissione, cioè lo stesso soggetto viene reimmesso nella popolazione dopo essere stato estratto e può essere estratto una seconda volta.

Campione Media campionaria
11 1
12 1,5
13 2
14 2,5
15 3
21 1,5
22 2
23 2,5
24 3
25 3,5
31 2
32 2,5
33 3
34 3,5
35 4
41 2,5
42 3
43 3,5
44 4
45 4,5
51 3
52 3,5
53 4
54 4,5
55 5

Tabella 1 - Medie campionarie di tutti i possibili campioni di numerosità n=2 (estrazione con reimmissione)

La media delle medie campionarie è 3, ed è quindi pari alla media della popolazione. Quando questa condizione è soddisfatta si dice che lo stimatore è corretto. Lo scarto tipo della distribuzione campionaria è pari ad 1.
Definiamo ora la distribuzione campionaria calcolando la distribuzione di frequenza delle medie campionarie della tabella 2.

Media campionaria Frequenza
1 1
1,5 2
2 3
2,5 4
3 5
3,5 4
4 3
4,5 2
5 1

Tabella 2 - Distribuzione campionaria di tutti i possibili campioni di ampiezza n=2 (estrazione con reimmissione)

Fig. 2 - Distribuzione campionaria di tutti i possibili campioni di ampiezza n=2 (estrazione con reimmissione)

Come si vede la distribuzione campionaria, anche con un numero così limitato di casi approssima la curva normale. L'approssimazione diventa accettabile con numerosità campionarie maggiori di trenta casi. Per numerosità campionarie inferiori si deve ricorrere all'approssimazione della distribuzione campionaria con la funzione t di Student e tale approssimazione è lecita solo se il carattere considerato della popolazione di partenza è normale (vedere Grimaldi, 1996, p. 44). Per il teorema del limite centrale (la cui validità è però tuttora oggetto di controversie, vedere Castellano e Herzel, 1971, p. 141-2), per campioni di ampiezza abbastanza grandi (n>30) la distribuzione campionaria delle medie approssima la distribuzione normale con media uguale alla media della popolazione dalla quale i campioni sono stati estratti (nel nostro caso µ==3) e scarto tipo uguale allo scarto tipo della popolazione diviso per la radice della numerosità campionaria (nel nostro caso ).

L'universo campionario appena definito è quello con reimmissione. Vediamo adesso l'estrazione senza reimmissione. L'insieme di tutti i possibili campioni è elencato in tabella 3.

Campione Media campionaria
12 1,5
13 2
14 2,5
15 3
21 1,5
23 2,5
24 3
25 3,5
31 2
32 2,5
34 3,5
35 4
41 2,5
42 3
43 3,5
45 4,5
51 3
52 3,5
53 4
54 4,5

Tabella 3 - Medie campionarie di tutti i possibili campioni di numerosità n=2 (estrazione senza reimmissione)

Come si vede è possibile estrarre campioni distinti. La media delle medie campionarie è 3, pari alla media della popolazione. Anche in questo caso lo stimatore è corretto. Lo scarto tipo della distribuzione campionaria è pari ad 0,866 ed è inferiore al caso con reimmissione; questo risultato è dovuto al fatto che campionando senza reimmissione si escludono dalla distribuzione campionaria i valori estremi, la stima fatta con il campione senza reimmissione è quindi generalmente più precisa (la distribuzione campionaria è più stretta) ed è sempre da preferire a parità di condizioni. La distribuzione di frequenza delle medie campionarie è illustrata in tabella 4.
Media campionariax- Frequenza
1,5 2
2 2
2,5 4
3 4
3,5 4
4 2
4,5 2

Tabella 4 - Distribuzione campionaria di tutti i possibili campioni di ampiezza n=2 (estrazione senza reimmissione)


Fig. 3 - Distribuzione campionaria di tutti i possibili campioni di ampiezza n=2 (estrazione senza reimmissione)

Definite le distribuzioni campionarie possiamo passare ad illustrare la logica alla base della stima per intervallo.
Quando estraiamo un campione dalla popolazione questo deve ricadere all'interno dell'universo campionario. Se definiamo sulla distribuzione campionaria un intervallo all'interno del quale cade una certa area di tale distribuzione, detto intervallo di fiducia e corrispondente alla probabilità associabile alla stima (intesa come grado di fiducia scelto per la stima stessa), avremo sull'asse delle ascisse un intervallo corrispondente a tale probabilità, come illustrato in figura 4. Come si vede dalla figura lo scostamento massimo tra valore stimato del parametro (il valore calcolato sul singolo campione estratto dalla popolazione) e il valore vero è (se il livello di fiducia scelto è 0,6826), 1,96 (se il livello di fiducia scelto è 0,95), 2 (se il livello di fiducia scelto è 0,9545), 3 (se il livello di fiducia scelto è 0,9974).

Fig. 4 - Stima per intervalli (caso di stima della media con distribuzione campionaria normale)

Per una stima ad intervallo qualsiasi vale quindi la relazione , dove z è il valore della normale standardizzata per il livello di fiducia considerato. Nella stima per intervallo si ha un errore quando il campione estratto cade nelle "code" della distribuzione, ovvero al di fuori dell'intervallo di fiducia. Di tale errore è però possibile calcolare la probabilità che vale il complemento ad 1 del livello di fiducia.

Last Update 15-Jul-1999 by leda
Page URL = http://hal9000.cisi.unito.it/wfprog/GetURL.exe?ID=21266&type=1
Coordinamento del progetto "www.unito.it" a cura del CISI

ModificaDati