|
In questa unità abbiamo spiegato i principi del campionamento e i motivi per cui è preferibile fare ricerca su un campione piuttosto che sull'intera popolazione. E' stata illustrata la divisione dei campioni in probabilistici e non probabilistici, dove per i primi si intendono quei campioni da cui è corretto estendere alla popolazione i risultati della stima statistica e per i secondi quelli da cui non è corretto fare inferenze rispetto alla popolazione.
Gli esempi visti precedentemente, hanno messo in luce i problemi relativi all'operazione di campionamento. Il più importante è che quando campioniamo a dover considerare due incognite: il parametro oggetto di stima e la rappresentatività del campione. Se non conosciamo almeno una delle due non possiamo mai essere certi di conoscere l'altra. Come afferma Marradi (1989, p. 52) tra il concetto di campione casuale e di campione rappresentativo non esiste alcuna relazione logicamente necessaria. Ad sempio, nella stima di una proporzione, se si definisce rappresentativo il campione in cui il parametro stimato coincide con quello vero della popolazione, la probabilità di estrarre un campione rappresentativo, con numerosità campionaria di 100 casi, è di circa 0,08 e, paradossalmente, decresce all'aumentare della numerosità campionaria, come si può notare dalla distribuzione campionaria per la stima di una proporzione (vedere l'unità 10).
Il problema della rappresentatività del campione casuale va quindi affrontato ridefinendo il concetto di rappresentatività, passando da una definizione che tiene conto di un unico punto (la stima puntuale del parametro) ad una definizione che tiene conto di un intervallo. Un campione casuale è quindi rappresentativo nella misura in cui il valore del parametro oggetto di stima cade all'interno dell'intervallo di fiducia considerato.
Se sto lavorando con un intervallo di fiducia del 95 percento, ho una probabilità di 0,95 di estrarre dalla popolazione un campione rappresentativo, cioè un campione che rende vera l'affermazione che faccio durante l'operazione di stima: "il parametro della popolazione è compreso tra i limiti dell'intervallo di fiducia".
Il campione estratto è non rappresentativo se proviene dalla "code" della distribuzione campionaria. Non possiamo mai essere certi che il campione da noi estratto non provenga da tali "code", ma possiamo quantificare questa probabilità, che è poi la probabilità di commettere un'errore nell'operazione di stima per intervallo, e nel nostro esempio vale 0,05.
|