A
una tecnica di analisi si dice bivariata se si occupa della distribuzione di due variabili congiuntamente considerate.(Marradi,1993)
è
una tecnica di misurazione della significatività statistica della differenza
fra medie e pone come ipotesi nulla che le medie dell'universo siano uguali.Può
essere applicata ogni volta che si intende verificare l'esistenza di una
relazione tra due variabili di cui una abbia un livello di misurazione
categoriale e l'altra cardinale.
una
tecnica di analisi si dice monovariata se considera solo una variabile per
volta, studiando la distribuzione dei dati fra le modalità di quella variabile.
analisi
non numerica, in generale limitata a variabili nominali (ad esempio razza,
sesso, religione) e ordinali, oppure concernente dati di natura non statistica
raccolti mediante i metodi etnografici (interpretazione delle note prese sul
campo),l'analisi ermeneutica dei testi, le interviste non strutturate,ecc.
analisi
di dati codificati numericamente, cioè di dati cardinali; spesso comporta il
calcolo di parametri statistici.
valore
caratteristico indicativo della distribuzione dei dati di una variabile
cardinale o quasi cardinale. L'asimmetria si dice "positiva" quando
si hanno molti valori con forti scarti positivi e pochi valori con deboli
scarti negativi; viene, invece, definita "negativa" nel caso opposto,
quando cioè esistono molti valori con forti scarti negativi e pochi valori con
deboli scarti positivi; in questo caso la coda più lunga è collocata a sinistra
della media.
tecniche
che assegnano valori agli stati elaborando in qualche forma vettori o (sotto-)
matrici si dicono tecniche di assegnazione.(Marradi,1997)
l'asserto
(detto anche proposizione o ipotesi) è un affermazione che si riferisce a un
aspetto della realtà e hanno come caratteristica di avere un riscontro empirico
immediato.
è
la stabilità della misura.
si
parla di attrazione fra una modalità di una variabile categoriale e una
modalità di un’altra variabile categoriale quando nella relativa cella di una
tabella di contingenza le frequenze osservate sono apprezzabilmente superiori
alle frequenze attese.(Marradi,1997)
è
una proprietà di una categoria, e consiste nella maggiore o minore possibilità
di interpretarla senza far ricorso all’etichetta della variabile o delle altre categorie
della variabile.(Marradi,1997)
bivariato
significa a due variabili. Una relazione bivariata è l'esplicitazione di una
relazione tra due variabili.
il
box plot (o grafico a scatola) è un grafico che riassume i dati di una
variabile mostrandone la mediana (rappresentata da una riga orizzontale che
taglia la scatola) e il 25° e 75° percentile (rappresentati dai lati inferiore
e superiore della scatola che contiene la mediana).
C
capacità
generativa o produttiva del modello.
campione
non probabilistico in cui sono scelti per l'indagine i casi più comodi (quelli
più facilmente disponibili).
campionamento
effettuato in vari stadi. Nel primo stadio si campiona un grappolo di casi;
poi, a partire da questo grappolo iniziali, si seleziona il campione effettivo
di casi (ad esempio per ottenere un campione di famiglie il ricercatore estrae
un campione casuale di isolati, o di edifici, e poi estrae un campione di famiglie
all'interno degli isolati, o edifici, scelti.
forma
non probabilistica di campionamento in cui le persone scelte inizialmente per
il campione sono utilizzate come informatori per individuare altre persone
dotate delle necessarie caratteristiche che le rendono adatte per il campione.
campionamento
con reimmissione.
campionamento
senza reimmissione.
metodo
di campionamento multidimensionale e non probabilistico in cui il ricercatore
specifica tutte le dimensioni concettuali rispetto alle quali si vuole
effettuare il campionamento e poi seleziona una quota di casi per tutte le
combinazioni di dimensioni.
campionamento
non probabilistico che equivale al campionamento stratificato da cui si
differenzia perchè è generalmente rappresentato nella stessa proporzione,
proporzione che ha nella popolazione complessiva (che deve essere finita).
un
campione è un sottoinsieme di una popolazione. Dal momento che molto spesso è
impossibile o troppo costoso condurre una ricerca sull'intera popolazione,è un
approccio molto usato condurre la ricerca su un campione. I metodi di inferenza
statistica in genere richiedono che il campione sia probabilistico per ridurre
il più possibile le sistematicità ed avere un campione rappresentativo.
campione
probabilistico in cui ciascun elemento (e ciascuna combinazione di elementi) ha
uguale probabilità di essere selezionato.
Campione
casuale stratificato:
procedura
di campionamento probabilistica in cui la popolazione viene prima divisa in
strati (ad esempio studenti del primo, secondo, terzo, quarto anno) e
successivamente si effettua un campionamento casuale all'interno di ciascun
strato.
campione
nel quale non è nota la probabilità di selezione di ciascun caso.
un
campione in cui la probabilità di selezione di ciascun caso (e di ciascuna
combinazione di casi) è nota.
campione
i cui casi estratti dalla popolazione (universo campionario) riproducono
esattamente la popolazione per tutte le proprietà su di essa
misurabili.
campione
in cui viene selezionato un soggetto ogni k soggetti (di solito il primo
soggetto scelto casualmente), dove k è una qualsiasi costante.
misura
di variabilità. E' la differenza tra il valore massimo e il valore minimo di
una variabile in una distribuzione di frequenza (ingl.range).
è
un termine specifico, e individua qualcuno o qualcosa su cui si siano raccolte
informazioni in modo sistematico.(Marradi,1997)
coefficiente
relativo al rapporto fra due variabili categoriali, si basa sul confronto fra
frequenze osservate e frequenze attese.
si
riserva il termine "codice" al documento in cui sono elencati i
valori assegnati alle modalità delle variabili di una ricerca.(Marradi,1997)
assegnazione
di codici sotto forma di simboli (di solito numeri) per ciascuna modalità di
ciascuna variabile, corrispondente ad una domanda di un questionario.
è
una cifra che dà informazioni su alcune caratteristiche di una distribuzione
congiunta, bi o multi-variata.(Marradi,1993)
coefficiente
relativo all'associazione fra due dicotomie.
è
probabilmente il più antico dei coefficienti di associazione fra dicotomie. E'
una versione uni-direzionale del coefficiente Phi.
Coefficiente
di cograduazione:
coefficiente
che quantifica l'associazione fra variabili ordinali.
coefficiente
derivato dal chi quadrato, il cui massimo dipende dal numero di righe e
di colonne della tabella di contingenza,e che comunque non può raggiungere
l'unità.
è
un coefficiente che presuppone una relazione bi-direzionale fra le due
variabili: guardando le formule, X e Y sono perfettamente intercambiabili.
Coefficiente
di determinazione:
quantifica
la distanza fra un'associazione perfettamente lineare e la relazione che
intercorre effettivamente fra due variabili.
ogni
volta che si vogliono confrontare le dispersioni di due variabili aventi medie
molto diverse tra loro, il confronto con il coefficiente divariazione,
che opera una normalizzazione, dividendo lo scarto tipo della variabile per la
sua media, risulta più corretto di quello fatto con le altre misure
di dispersione.
coefficiente
uni-direzionale. E' uno sviluppo del coefficiente Q di Yule.
coefficiente
bi-direzionale che impiega al denominatore, come normalizzatore, la radice
quadrata del prodotto dei quattro marginali.
coefficiente
che considera solo le coppie cograduate e quelle contrograduate, ignorando
tutte quelle legate.
coefficiente
più usato tra quelli che quantificano la concordanza fra due dicotomie.
coefficiente
proposto da Spearman per rilevare la cograduazione fra variabili ordinali cioè
il grado di accordo fra graduatorie compilate da individui diversi (o dallo
stesso individuo applicando criteri diversi).
Questi
coefficienti sono meno numerosi e meno diffusi dei coefficienti bi-direzionali.
è
il numero delle sequenze di segni consecutivi uguali. Il numero massimo di tali
sequenze è r-1 (dove r è il numero di righe della matrice) e potrebbe essere
usato per trasformare V in un indice relativo (cioè variabile 0 e 1) : V/(r-1).
Più V è vicino a 0,
più strettamente le due variabili sono associate, in modo monotonico o non; più
è vicino a 1, meno sono associate.
coefficienti
bi-direzionali. Il Tau q è concepito per tabelle di contingenza quadrate
(le due variabili hanno lo stesso numero di modalità). Il Tau r è
concepito per tabelle rettangolari (una variabile ha più modalità dell'altra).
si
parla di cograduazione per la covariazione fra variabili ordinali.
un
rapporto di associazione fra variabili categoriali non ordinate si dice
concordanza.(Marradi,1997)
due
variabili "contro-variano" quando a valori alti dell'una tendono a
corrispondere valori bassi dell'altra.
termine
tecnico che sta a significare che ulteriori iterazioni (ripetizioni
della stessa procedura) non producono alcuna modifica nei risultati.
coppie
che non è possibile classificare nè come cograduate nè come contrograduate
perchè hanno lo stesso punteggio su una variabile o su entrambe.
si
parla ci correlazione per la covariazione fra cardinali.
due
variabili "covariano" quando a valori alti dell'una tendono a
corrispondere valori alti dell'altra, e analogamente per i valori bassi.
l'indice
di curtosi mira a rilevare quanto una distribuzione è piatta oppure
appuntita. Distribuzioni con picchi piatti e code ampiesono chiamate "platicurtiche",
quelle con picchi alti e code piccole sono chiamate "leptocurtiche".
Una distribuzione con curtosi uguale a quella della distribuzione normale è
chiamata "mesocurtica".(Marradi,1993)
forma
di rappresentazione usata quando si hanno molti valori, dove sull’ascissa si
collocano i valori delle modalità e in ordinata il numero dei dati che hanno
quel valore corrispondente in ascissa.
per
il teorema del limite centrale è il modo con cui si distribuiscono le medie di
tutti i possibili campioni casuali di numerosità superiore a 30, estratti da
una popolazione qualsiasi.
D
permette
la misurazione empirica di un concetto astratto; ad esempio la definizione
operativa di intelligenza nel test per valutare il quoziente di intelligenza.
somma
dei quadrati degli scarti dalla media.(Marradi,1993)
il
teorema fondamentale della devianza scompone la devianza della variabile X in
due parti: una "spiegata" e l'altra "non spiegata" o
residua. La parte non spiegata è detta devianza interna (sottinteso:
alle categorie) o WSS (Within Sum of Squares, somma dei quadrati all'interno
delle categorie).
il
teorema fondamentale della devianza scompone la devianza della variabile X in
due parti: una "spiegata" dall'associazione di X con una variabile
categoriale e l'altra "non spiegata". La parte spiegata è costituita
dall'ultimo termine dell'uguaglianza, cioè dalla somma dei quadrati degli
scarti fra le medie.
Deviazione
standard (o scarto tipo o scarto quadratico medio):
è
la radice quadrata della varianza. E' un valore caratteristico che dà
un'informazione sintetica sulla dispersione dei dati di una variabilecardinale
attorno alla loro media. Si usa se serve una grandezza lineare.(Marradi,1993)
esiste
una vera diagonale solo quando le due variabili hanno lo stesso numero di
modalità.
Diagonale
della cograduazione:
in
una tabella di contingenza, è la linea discendente che congiunge la cella
"basso/basso" con la cella "alto/alto" (non si tratta di
una vera e propria diagonale).
Diagonale
della contro-graduazione:
in
una tabella di contingenza è la linea ascendente che congiunge la cella
"alto in riga/basso in colonna" con la cella "basso in riga/alto
in colonna".
diagramma
a barre ruotato di 90°, composto di fasce orizzontali anzichè di
colonne.(Marradi,1993)
successione
di linee di altezza proporzionale alle frequenze.(Marradi,1993)
questo
genere di figura è usato solo quando entrambe le variabili sono cardinali. Ogni
punto rappresenta la coppia di valori relativi ad un singolo caso, e per
collocarlo sul diagramma si calcolano la posizione sull'ascissa del punteggio
di quel caso sulla variabile X e la posizione sull'ordinata del suo punteggio
sulla variabile Y; il punto sarà collocato all'incrocio fra la verticale di
detta posizione sull'ascissa e il prolungamento orizzontale di detta posizione
sull'ordinata.
variabile
con due sole modalità si tratta di una variabile categoriale di natura speciale
perchè può essere considerata come categoriale oppure come ordinale.
misura
di variabilità. E' la differenza tra il valore del terzo e del primo quartile
di una distribuzione di frequenza di una variabile ordinale.
una
distribuzione asimmetrica vuole vedere se e quando una distribuzione non è
disposta simmetricamente attorno alla media ma ha una coda più lunga
dell'altra.
distribuzione
di valori di una statistica del campione (ad esempio, la media) ottenuta a
partire da tutti i campioni logicamente possibili di una data ampiezza.
si
affianca alla distribuzione di frequenza, se la variabile è almeno ordinale.
l'elenco
ordinato di tutte le modalità di una variabile, ciascuna con la sua frequenza,
si dice distribuzione di frequenza di quella variabile.(Marradi,1993)
le
distribuzioni normali sono una famiglia di distribuzioni che hanno le stesse
caratteristiche e lo stesso andamento. Sono curve simmetriche con valori più
concentrati verso il centro piuttosto che nelle estremità laterali, che
presentano la massima ordinata in corrispondenza della media. In queste
distribuzioni moda, media e mediana coincidono. Le distribuzioni normali sono curve
a campana (ma non tutte le curve a campana sono distribuzioni normali).
Distribuzione
normale standardizzata:
è
una distribuzione normale utile nelle operazioni di stima statistica. Presenta
media uguale a 0 e scarto tipo pari a 1.
Distribuzione
semplice di frequenza:
il
risultato delle operazioni di conteggio delle unità che appartengono a ciascuna
modalità di una variabile qualsiasi. Descrive la composizione di un gruppo
secondo quella variabile.
una
distribuzione è simmetrica se le modalità che sono equidistanti dalla mediana
hanno la stessa frequenza. In una distribuzione simmetrica media e mediana
coincidono.(Marradi,1993,p.114)
Distribuzioni
unimodali, bimodali e trimodali:
parlare
di distribuzioni modali ha senso per variabili cardinali e ordinali, in cui
viene meno l'autonomia semantica e si dà più importanza all'intera
distribuzione delle frequenze. Se in una distribuzione abbiamo solo una classe
che si distingue dalle altre per l'alto numero di casi, quella sarà la moda
della distribuzione, ovvero la categoria che raccoglie il maggior numero di
casi. Nel caso delle distribuzioni bi e trimodali le modalità che si
distinguono dalle altre per le frequenze più alte sono rispettivamente due e
tre.
E
il
caso o l'unità più piccola che può essere inclusa nel campione; ad esempio,
protestanti maschi di età compresa tra i 21 e i 50 anni, le aziende con meno di
15 dipendenti.
si
occupa dei fondamenti, della natura dei limiti e della validità del sapere
scientifico, assumendo come oggetto di indagine i procedimenti effettivi e il
linguaggio della scienza.
consiste
nella somministrazione di uno stimolo e nell'osservazione dei suoi effetti su
un gruppo di soggetti. Il piano di ricerca consiste nella formulazione di una
ipotesi che suppone che i dati raccolti prima e dopo lo stimolo sperimentale
non presentino differenze significative, cioè non dovute al caso, allo scopo di
dimostrare l'eventuale influsso stimolo sperimentale qualora un test statistico
dimostri che l'ipotesi è falsa
l'eta
quadrato è un coefficiente che ci dice di quanto migliora (rispetto alla
situazione in cui conosciamo solo la media generale della variabile X) la
nostra capacità di indovinare i punteggi di un qualsiasi caso sulla X quando
sappiamo a quale modalità appartiene quel caso e conosciamo le medie della
variabile X in ciascuna modalità della variabile categoriale.
letteralmente,
studio di una cultura; termine tradizionalmente utilizzato per indicare
l'osservazione antropologica di culture primitive, ma oggi usato per
l'osservazione in generale.
studio
dei metodi utilizzati nell'attività sociale e quotidiana, comune e di routine
(definiti etnometodi), ad esempio espressioni indicali (che hanno significato
in quel preciso contesto), posture, gestualità, riti quotidiani, ecc.
F
si
hanno false dicotomie quando vengono registrate come dicotomie proprietà che
hanno più di due stati, o che addirittura sono continue.
archivio
computerizzato che contiene la matrice dei dati.
rappresentazione
della teoria sottostante al modello.
il
numero dei dati che presentano una determinata modalità su una variabile si
dice frequenza di quella modalità.(Marradi,1993)
numero
di ripetizioni di una data modalità.
la
frequenza attesa in una cella è uguale al prodotto dei due relativi marginali
(di riga e di colonna) diviso per N.
si
dicono frequenze marginali le cifre ai margini della tabella.
il
numero dei dati in una cella si dice frequenza osservata in quella cella.
Frequenza
relativa retrocumulata:
si
ottiene sottraendo da uno la frequenza relativa cumulata per ciascuna modalità.
G
è
la riflessione sulla conoscenza in generale.(Marradi,1997)
in
una tabella di contingenza fra due dicotomie, se conosciamo i marginali, basta
conoscere la frequenza di una cella per conoscere tutte le altre: gli
statistici intendono questo quando dicono che una relazione fra due dicotomie
(e quindi una tabella 2x2) ha un solo grado di libertà.
è
di solito un gruppo, scelto in modo casuale, al quale non viene somministrato
lo stimolo sperimentale. I dati raccolti dal gruppo di controllo vengono
confrontati con quelli rilevati dal gruppo sperimentale al fine evidenziare se
sussistono differenze significative fra i due.
nell'esperimento
è il gruppo a cui viene somministrato lo stimolo sperimentale, contrapposto al
gruppo di controllo che è un gruppo identico al quale lo stimolo non viene
somministrato.
H
I
tecnica
di raccolta dei dati che consiste nel porre domande ad un campione di soggetti,
in un determinato momento, attraverso un questionario autocompilato o mediante
un intervistatore.
nella
maggior parte dei casi (ma non necessariamente) si avvale dei questionari, e si
distingue dal sondaggio per il fatto di essere collegata a una problematica
teorica.(Marradi,1997)
vengono
usati per quegli asserti che contengono concetti astratti e consentono di
definirne delle operazioni di misura.
ricorrendo
ai valori caratteristici posizionali si rileva la dispersione dei dati fra le
categorie ordinate individuando specifici valori (quartili o simili) collocati
in punti particolari della distribuzione.
Indice di
equilibrio/squilibrio:
si
basa sulla proporzione dei casi che cadono in una modalità, calcolata sul
totale dei casi.
valore
caratteristico tipico della distribuzione in categorie ordinate, determinato
tenendo conto sia delle frequenze sia dell'ordine delle
categorie.(Marradi,1993)
è
un indice relativo che può fra un minimo di 0 ed un massimo di 1.
è
una proprietà di una coppia di proprietà/variabili, e consiste nel fatto che
tra le due proprietà/variabili non intercorrano legami semantici, ma solo
(eventualmente) legami empirici.Ad es. fra il sesso e il voto espresso c’è
piena indipendenza semantica.
le
inferenze statistiche consentono di ottenere informazioni su una popolazione
partendo da un campione.Sono due i metodi principali della statistica
inferenziale (o statistica induttiva):la stima e il test di ipotesi.Nella stima
il campione viene usato per stimare un parametro della popolazione e porta alla
costruzione di un intervallo di fiducia per il suddetto parametro. Nel caso del
test di ipotesi, parametrica o non parametrica, e la si verifica sui dati del
campione.
un
intervallo di fiducia è un intervallo di valori che ha una specifica
probabilità di contenere il parametro oggetto di stima. Gli intervalli di
fiducia del 95% e del 99% sono quelli più comunemente usati.
strumento
di raccolta dati che può essere strutturata oppure può essere condotta in forma
libera, costruendo le domande nel corso della conversazione.
intervista
completamente non strutturata in cui l'intervistatore lascia che il rispondente
approfondisca liberamente un tema di suo interesse: usata soprattutto in
psicoterapia.
intervista
in cui l'intervistatore specifica preventivamente solo l'argomento senza
indicare con precisione alcuna particolare domanda o modalità di risposta
prefissata.
intervista
il cui tema è deciso preventivamente ma in cui l'intervistatore gode di una
certa discrezionalità nel decidere quali domande porre e quale tipo di modalità
di risposta usare.
è
un affermazione, provvisoria e non provata, di quelli che sono i fatti
implicati dalla teoria secondo il ricercatore. Le ipotesi possono essere
monovariate (ad esempio l'età media è maggiore di 20 anni) oppure bivariate (ad
esempio, quanto più alta è l'istruzione, tanto più alto è il reddito).
il
test di ipotesi è un metodo di inferenza statistica. Uno sperimentatore inizia
a formulare un'ipotesi sulla forma o posizione (ipotesi non parametrica) o su
un parametro (ipotesi parametrica) della popolazione. Viene poi raccolto un
campione sul quale viene eseguito il test. In un test parametrico viene
calcolato sul campione il parametro oggetto del test e si vede qual'è la
probabilità che quel dato valore sia dovuto all'effetto del caso. In una
ipotesi non parametrica si calcola la probabilità che quella data disposizione
(forma e posizione) del campione sia dovuta all'effetto del caso. Se tale
probabilità è bassa, minore della significatività del test (in genere
le
cifre ai margini della parte riquadrata di una tabella si dicono
"frequenze marginali" (o marginali).
somma
degli scarti diviso per il loro numero.
valore
caratteristico posizionale che misura la tendenza centrale di una
distribuzione. E' una cifra che bipartisce la serie dei dati a metà.
indica
l’attività critica che si applica ai diversi prodotti della ricerca.
(Boudon,1991,p.279)
analisi
su piccola scala; essa ha un individuo singolo o un piccolo gruppo come unità
di analisi, in contrapposizione con l'analisi "macro" che ha un ampio
aggregato (ad esempio, una nazione) quale unità di analisi.
valore
che rappresenta la caratteristica centrale (posizione) di una distribuzione di
frequenze. Sono tali la moda, la mediana, la media aritmetica.
significa
assegnare dei numeri ad oggetti o eventi in modo sistematico.
Misurazione
ad intervallo (o scala):
permette
di sapere se, sulla base di una variabile, una persona si colloca più in alto
rispetto ad un'altra ed anche quante unità di misura più in alto si colloca.
Non ha uno 0 assoluto.
Misurazione
di rapporto (o scala):
simile
alla scala ad intervalli, ad eccezione che qui lo 0 è assoluto e ciò consente
la moltiplicazione e la divisione sui diversi valori della variabile.
Misurazione
nominale (o scala categoriale non ordinata):
ogni
operazione di classificazione dà origine a una nominale, senza attribuire ad
essi alcun genere di informazione quantitativa e nessun criterio di ordine.
Misurazione
ordinale (o scala categoriale ordinata):
è
analoga alla scala nominale in quanto consiste di categorie reciprocamente
esclusive ed esaustive. Tuttavia le diverse categorie sono ordinate
gerarchicamente a seconda del valore che hanno rispetto alla proprietà
considerata.
indici
che consentono di valutare la dispersione dei dati intorno al valore di
tendenza centrale di una distribuzione. Le principali misure di variabilità
sono: devianza, varianza, scarto tipo.
misura
di tendenza centrale, è la categoria con frequenza più alta o percentuale più
alta.(Marradi,1993)
quando
diamo una definizione operativa di una variabile, redigiamo un insieme di stati
significativamente distinti tra loro. Questo insieme di stati sono le
"modalità" della variabile.
prevedono
un processo interattivo: dalla teoria ai parametri e dal confronto con i dati
alla teoria.
questi
modelli "partono" dalla teoria per "arrivare" ai parametri,
secondo un approccio di tipo top-down.
questi
modelli "partono" dai dati per "arrivare" ai parametri,
secondo un approccio di tipo bottom-down.
nell’ambito
delle discipline empiriche significa rappresentazione astratta e semplificata
di una fenomenologia concreta; nelle discipline formali significa
interpretazione concreta di una rappresentazione astratta.
N
O
gli
"odds" sono le probabilità che avvenga un certo fenomeno rispetto
alla probabilità che questo non avvenga.
tecnica
principale per la raccolta di dati sul comportamento non verbale e si può
accompagnare ad altre tecniche simultanee, come l’esperimento o l’inchiesta
nella sua fase preliminare.
Osservazione
non partecipante:
tecnica
in cui l’osservatore non prende parte alle attività di gruppo.
osservazione
in cui il ricercatore fa parte dell'organizzazione o del gruppo oggetto
d'indagine e partecipa a tutte le attività organizzative; in generale (ma non
sempre) gli altri membri del gruppo non sono consapevoli del fatto che
l'osservatore sta realizzando una ricerca.
P
una
prospettiva di ricerca (una scuola di pensiero) con determinate idee sugli
scopi della ricerca e sui metodi appropriati (come si dovrebbe realizzare la
ricerca) e con i propri valori e assunti.
un
parametro è una quantità numerica che misura un qualche aspetto di una
popolazione. Per esempio la media è una misura di tendenza centrale ed è un
parametro di una popolazione.
seguono
la stessa logica dei quartili, solo che le parti in cui viene divisa la
distribuzione sono 100.
l'uso
delle percentuali è frequente quando si vuole dare un'idea dell'entità relativa
che hanno due o più frequenze rilevate; le si confronta con il numero totale
dei soggetti presenti nel gruppo.
quando
l'autonomia semantica delle singole categorie è bassa (dalle scale ordinali in
su), l'interesse si sposta dalla frequenza nelle singole categorie alla
distribuzione di frequenza nella successione delle categorie. Quindi
accanto alle percentuali di categoria è opportuno specificare delle
"percentuali cumulate", in cui alla percentuale della singola
categoria si sommano tutte quelle che la precedono fino ad arrivare all'ultima
categoria che naturalmente avrà il 100%. Avendo a disposizione tale percentuale
risulterà molto più immediata l'individuazione dei valori caratteristici come
la mediana, i quartili e i percentili.
l'introduzione
nelle tabelle di frequenza delle percentuali retrocumulate è uguale a quella
già descritta per le percentuali cumulate. La differenza con le percentuali
cumulate è che in queste ultime si sommano le percentuali in modo ascendente,
dalla prima all'ultima categoria, mentre qui si parte dal totale delle
percentuali (100) per poi sottrarre per ogni categoria la percentuale della
stessa, fino ad arrivare all'ultima categoria per la quale la percentuale
retrocumulata coinciderà con quella della categoria.
una
popolazione consiste in un insieme di oggetti, osservazioni o valori che hanno
qualcosa in comune. Per esempio, una popolazione potrebbe essere definita come
tutti i maschi di età compresa tra i 15 e i 18 anni. La distribuzione di una
popolazione può essere descritta da numerosi parametri come la media e lo
scarto tipo. Le stime di questi parametri fatte a partire da un campione sono
chiamate "statistiche campionarie".
nell'esperimento
è un test volto a misurare il valore della variabile dipendente dopo aver
applicato lo stimolo sperimentale.
nell'inchiesta
è la somministrazione preliminare di un questionario ad un piccolo campione al
fine di individuare e di correggere i problemi di interpretazione degli items.
Nell'esperimento è un test per misurare il valore della variabile dipendente
prima di applicare lo stimolo sperimentale.
termine
generico per tutti gli asserti riguardanti una variabile o una relazione tra
due o più variabili; ipotesi, assiomi, postulati e teoremi sono tutti tipi di
proposizioni.
le
caratteristiche dell'unità di analisi sulla quale si raccolgono informazioni si
chiamano proprietà.
procedura
di controllo degli errori dopo che i dati sono stati caricati sulla matrice dei
dati.
un
valore di z riflette sempre di quanti scarti al di sotto o al di sopra
della media si trova un numero considerato.
Q
valori
di posizione analoghi alla mediana. Dividono una distribuzione di frequenza in
un certo numero di parti uguali (con lo stesso numero di casi). Se il numero di
parti è quattro, si dicono quartili, se è dieci, si dicono decili, ecc.
valore
caratteristico posizionale che rileva la sua dispersione attorno alla mediana
(che rileva la tendenza centrale di una distribuzione). Per le variabili
categoriali ordinate, il primo quartile è quella modalità per la quale P
strumento
per la raccolta dei dati, costituito da un elenco di domande a cui deve
rispondere il soggetto in un'inchiesta.
R
la
rappresentazione grafica di una distribuzione di frequenza è la
rappresentazione spaziale, e per lo più geometrica dell'andamento dei dati,
fatta per consentire e facilitare rapidi confronti, allo scopo di cogliere
tendenze costanti e anomalie.
Reimbussolamento
(campionamento con):
in
un campionamento con reimbussolamento l'estrazione di n elementi presi a
caso, avviene considerando sempre tutti gli n elementi per ogni
estrazione, anche quelli che sono stati già precedentemente estratti. Viceversa
il campionamento senza reimbussolamento esclude dalle estrazioni successive
tutti gli elementi che sono stati già estratti.Ad esempio, se io estraggo delle
palline da un'urna che contiene 50 palline bianche e 50 palline nere, e dopo
ogni estrazione rimetto dentro la pallina (reimbussolamento) io estraggo sempre
da un universo con 50 palline bianche e 50 palline nere, quindi la probabilità
di estrarre una pallina bianca o nera è la stessa. Se non rimetto dentro la
pallina (campionamento senza reimbussolamento) la probabilità cambia.
è
il termine generale e generico per qualsiasi rapporto fra due o più variabili,
esistente o meno, effettivo o potenziale.(Marradi,1997)
Relazione
bi-direzionale asimmetrica:
riguarda
la relazione fra due variabili, in cui la proprietà A influenza la proprietà B
più di quanto ne è influenzata.
Relazione
bi-direzionale simmetrica:
relazione
fra due variabili in cui le due proprietà si influenzano a vicenda con forza
più o meno pari.
Relazione
diretta (relazione positiva):
relazione
in cui l'incremento del valore di una variabile è accompagnato dall'incremento
(o decremento) del valore dell'altra variabile.
Relazione
inversa (relazione negativa):
relazione
in cui il valore di una variabile aumenta quando il valore della seconda
variabile diminuisce, e diminuisce quando il valore dell'altra variabile
aumenta.
guardando
un diagramma a dispersione fra due variabili cardinali ci può sembrare che la
relazione rappresentata sia approssimativamente lineare; per ottenere dei
coefficienti che sintetizzino alcune caratteristiche di tale relazione si
interpolano i punti del diagramma a dispersione mediante una retta.
si
ha relazione monotonica fra due serie di grandezze ordinate se si realizza una
delle seguenti condizioni:
a.
se l'elemento A è
maggiore dell'elemento B in una serie, lo è anche nell'altra;
b.
se l'elemento A è
maggiore dell'elemento B in una serie, l'elemento A è minore dell'elemento B
nell'altra.
(Marradi,1993)
Relazione non
lineare (curvilinea):
spesso
le relazioni sono monotoniche ma non lineari, cioè il punteggio in ordinata
cresce al crescere del punteggio in ascissa, ma non con tasso costante.
relazione
fra due variabili, in cui la proprietà A influenza la proprietà B senza esserne
influenzata.
si
parla di repulsione quando le frequenze osservate sono apprezzabilmente
inferiori alle frequenze attese.(Marradi,1997)
propone
risultati utilizzabili per risolvere problemi sociali di interesse immediato.
ricerca
che non deve contenere proposizioni di carattere prescrittivo o giudizi di
valore riguardanti la realtà sotto esame.
ricerca
vincolata a conoscenza fattuali acquisite sul campo o in laboratorio, quali
osservazioni, questionari, interviste, esperimenti.(Ricolfi,1994)
ricerca
che ha finalità descrittiva.
ricerca
che ha finalità di spiegazione.
consente
di elaborare e verificare teorie e ipotesi che saranno utili in futuro ma non
direttamente applicabili per risolvere problemi sociali concreti.
si
occupa di raccogliere e interpretare dati allo scopo di rispondere a domande
concernenti i diversi aspetti della società, permettendo così di
comprenderla.(Bailey,1995)
trasferimento
dei dati dai questionari alla matrice dei dati mediante codifica e battitura.
il
concetto chiave nella costruzione del questionario è la "rilevanza"
che si riferisce a tre diverse questioni:
Rilevanza degli scopi:lo scopo dell'indagine deve apparire rilevante
all'intervistato, per questo è necessario chiarire, spiegare e giustificare
metodi e finalità dell'indagine, in modo che l'intervistato trovi un senso
nelle domande alle quali dovrà rispondere.
Rilevanza delle domande per l'indagine:non basta convincere gli
intervistati che l'obiettivo dello studio è rilevante, occorre persuaderli che
tutte le domande del questionario sono rilevanti per gli scopi espliciti dello
studio. E' necessario quindi includere nel questionario solo quelle domande che
effettivamente contribuiscono all'obiettivo della ricerca.
Rilevanza delle domande per gli intervistati:poichè all'interno di una
popolazione esistono sottopopolazioni differenti tra loro, la rilevanza non
avrà senso assoluto.
Le soluzioni possono essere diverse:
1. usare un diverso
questionario per ciascuna sottopopolazione;
2. utilizzare
formulazioni multiple perchè il rispondente trovi quella a lui più congeniale;
3. creare dei
percorsi differenziati all'interno del medesimo questionario, con
"salti" o domande filtro (ad esempio, "Se la risposta è sì,
passare alla domanda 44").
S
item
o serie di items (generalmente più di uno) per misurare una caratteristica e/o
una proprietà, ad esempio un atteggiamento. La caratteristica è generalmente
considerata unidimensionale e se ne ricava solitamente un punteggio
quantitativo.
Vedi
misurazione ad intervallo.
fa
parte, con la scala metrica, delle scale di rapporti. Permette di misurare le
variabili quantitative, dotate di uno zero non arbitrario (e quindi assoluto) e
della trasferibilità della proprietà (ad esempio l'età non è trasferibile, il
reddito sì). Un esempio di variabile misurata su scala di quantità è il
reddito.
Vedi
misurazione di rapporto.
appartiene
alla famiglia della scala di rapporti insieme alla scala di quantità, da cui si
differenzia perchè le proprietà della scala non sono trasferibili. Un esempio è
costituito dall'età.
Vedi
misurazione nominale.
Vedi
misurazione ordinale.
le
tecniche di scaling multidimensionale, elaborano una (sotto-) matrice senza
alcun assunto circa la dimensionalità dello spazio semantico
corrispondente.(Marradi,1997)
le
tecniche di scaling unidimensionale, elaborano una (sotto-) matrice riordinando
vettori-riga e/o vettori-colonna ed eventualmente eliminandone alcuni (es.
scale di Guttman), oppure applicando strumenti matematici (scale di Mokken,
scale di Rasch). In ogni caso, i valori assegnati agli stati sono relativi ad
una sola dimensione.(Marradi,1997)
dicesi
scarto la distanza di un valore dalla media aritmetica della distribuzione.
Caratteristica saliente degli scarti è che la loro somma dà zero.
Scarto
quadratico medio (o scarto tipo o deviazione standard):
Vedi
deviazione standard.
Scarto tipo
(o scarto quadratico medio o deviazione standard):
Vedi
deviazione standard.
è
una forma di conoscenza istituzionalizzata, con regole condivise da una comunità
di specialisti.(Marradi,1997)
sistema
di produzioni, cioè aggregato di regole di produzione, ovvero regole del tipo
"SE X ALLORA Y".
ramo
della linguistica che si occupa delle strutture del significato.
con
l'espressione "significatività statistica" si intende la probabilità
che (supponendo che le due variabili categoriali considerate siano distribuite
nella popolazione come sono distribuite nel campione- cioè proiettando dal
campione alla popolazione le percentuali marginali) la distribuzione delle
frequenze nelle celle non sia un mero effetto del caso.
valore
caratteristico indicativo della distribuzione dei dati di una variabile
cardinale o quasi-cardinale.
programma
che possiede una base di conoscenza su di un dominio ristretto e che aiuta a
risolvere problemi complessi del mondo reale usando un ragionamento
inferenziale.
equivale
a una raccolta di opinioni su temi contingenti, non collegati a problematiche
teoriche e talvolta scollegati anche fra loro.(Marradi,1997)
concepita
per sottolineare la natura cumulativa delle frequenze nelle categorie ordinate.
è
un programma statistico utile per l’elaborazione dei dati, ed anche per tracciare
grafici e costruire tabelle a singola e doppia entrata.
procedura
statistica attraverso la quale è possibile rendere confrontabili variabili
identiche appartenenti a distribuzioni diverse, ma anche variabili diverse, o
variabili espresse in unità di misura diverse. E’ una doppia
normalizzazione.(Marradi,1993)
osserva
i dati, trova la probabilità esatta ad essi associata, controlla l’eventuale
presenza di sistematicità, sulla base di un margine di errore prestabilito,
quindi fornisce modelli per prendere delle decisioni tra ipotesi alternative.
controlla
che un parametro (media, scarto tipo, proporzione di casi) di una popolazione
abbia un dato valore o che misurato in due popolazioni abbia lo stesso valore.
analisi
statistica che si limita a descrivere un campione (ad esempio, calcolando la
media) invece di stimare il grado di accuratezza con cui i dati del campione
rappresentano la popolazione, come accade nella statistica induttiva.
analisi
statistica in cui i dati del campione sono usati per inferire informazioni
sulla popolazione dalla quale è stato estratto il campione.
dicesi
stato ogni particolare modo di presentarsi di una proprietà. Se sui casi della
ricerca raccolgo le informazioni sulla proprietà "sesso", maschio e
femmina sono i due "stati" di tale proprietà.
procedura
che mettiamo in atto quando, definito un modello che ha un parametro libero (ad
esempio la probabilità di fare testa o croce al singolo lancio), stimiamo
questo parametro sulla base delle rilevazioni empiriche.
indagine
condotta sul "campo", ossia nell'ambiente naturale dei soggetti
studiati, contrapposta all'indagine svolta in laboratorio (ambiente
artificiale).
un'indagine
(di solito un'inchiesta) realizzata in un unico momento con un campione che si
suppone costituisca una sezione trasversale rappresentativa della popolazione rispetto
a variabili rilevanti (età, sesso, istruzione, ecc.).
T
tabella
costruita tenendo conto delle modalità di due caratteri. Nella tabella le
frequenze si interpretano leggendo contemporaneamente l'intestazione della riga
e della colonna nelle quali sono iscritte.
tabella
che si riferisce alle modalità di un solo carattere (per esempio il livello
d'istruzione) detta anche semplice. Se i dati sono nominali (il
carattere è qualitativo) le tabelle si dicono di serie. Le tabelle sono
dette invece di seriazione quando si ricollegano a modalità quantitative
(i dati sono su scale ordinali, di rapporto o ad intervallo).
tabella
nella quale si possono presentare frequenze di cella, percentuali di riga,
percentuali di colonna, percentuali di cella. Le cifre ai margini della tabella
(i totali di riga o di colonna) si dicono "marginali". Si chiede al
calcolatore di presentare tabelle con percentuali di riga quando si vuole
riscontrare l'influenza che la variabile posta in riga ha sulla variabile posta
in colonna (e viceversa). Il numero delle celle di una tabella di contingenza
varia in funzione del numero delle categorie delle due variabili che si mettono
in relazione.
questa
espressione si riferisce a un’azione, a una tecnica, non al risultato. Il
risultato si dice "tabella di contingenza".(Marradi,1997)
quando
il campione è piccolo (normalmente inferiore a 30 casi), i possibili
campioni estratti da una popolazione normale non si distribuiscono come una
curva normale ma come una curva più bassa della normale, tanto più bassa e
allargata agli estremi, quanto più piccolo è il campione. Quindi avremo
differenti forme di distribuzione a seconda della numerosità del campione
stesso, o meglio a seconda dei suoi gradi di libertà. Le tavole riportano i
valori della t di Student per i singolo gradi di libertà da 1 a 120. Si
può vedere che a parità di aree di probabilità i valori di t decrescono
al crescere dei gradi di libertà.
Tavole
normali standardizzate:
per
la valutazione delle probabilità associate alla normale standardizzata (z)
sono disponibili apposite tavole. Esse si riferiscono alle aree di probabilità
sottese ad una curva normale con media uguale a zero e scarto quadratico medio
uguale a uno (e ovviamente di area unitaria).
afferma
che estraendo campioni ripetuti, tutti della stessa dimensione (n,
maggiore di 30 casi) dalla medesima popolazione, le medie campionarie si
distribuiscono approssimativamente in modo normale (curva a campana) attorno
alla media della popolazione; ciò significa che la maggior parte delle medie
campionarie avranno valori molto vicini a quello della media della popolazione.
tentativo
di spiegare un particolare fenomeno e che, in ultima istanza, deve essere
controllabile.(Marradi,1993)
insieme
di ipotesi esplicative che valgono a dar conto di leggi sperimentali.
(Statera,1997,p.60)
test
non parametrico che dà la probabilità esatta di un evento che si manifesta con
due modalità. (Trinchero,1997)
affermare
che le ipotesi di partenza sono vere oppure false.
U
Quando
due o più indicatori rilevano la stessa proprietà, si dice che sono
unidimensionali. L’unidimensionalità è quindi una proprietà di un insieme di
indicatori. (Marradi,1997)
è
il termine generico che designa un insieme di elementi che hanno una o più caratteristiche
in comune. Quindi va usato solo al singolare: in una ricerca sugli italiani
adulti, l’unità è l’italiano adulto, non ciascun italiano adulto.
(Marradi,1997)
unità
primaria i cui attributi vengono misurati e analizzati dal ricercatore; il
singolo individuo oppure un aggregato di individui come un gruppo, un club, un
comune, una regione, ecc.
un
singolo elemento del campionamento oppure, come nel campionamento a grappolo,
un aggregato di elementi del campionamento.
V
è
la proprietà per cui una tecnica, un metodo o più semplicemente un indicatore
raggiunge gli obiettivi che si prefigge.
valori
tipici delle variabili cardinali, determinati sulla base delle frequenze di tutte
le modalità.
è
una proprietà di cui sia stata data una definizione operativa, permettendo così
di trasformare una serie di situazioni reali (stati) in una serie di dati su un
vettore (Marradi,1993).
variabile
che può assumere solo valori : vero o falso.
la
variabile cardinale è corrispondente ad un tipo di proprietà con stati
enumerabili e misurabili. Gli stati consistono nel numero di oggetti o eventi
con i quali quel dato caso ha una determinata relazione. Gli stati sulla
proprietà vengono determinati contando tali oggetti o eventi, e per questo si
dicono enumerabili; i valori numerici nelle corrispondenti celle della matrice
hanno tutte le caratteristiche dei numeri interi. Gli stati di una proprietà
sono misurabili se esiste un'unità di misura.
variabile
corrispondente al tipo di proprietà categoriale non ordinata. Di una proprietà
categoriale non ordinata registriamo come diversi un numero finito (e,
piuttosto limitato) di stati che trasformiamo in modalità riteniamo che tali
stati (e quindi le modalità corrispondenti) non siano ordinabili lungo alcuna
dimensione concettuale rilevante per la ricerca. In tal caso, i valori
(numerici e non) vengono assegnati in modo casuale, con l'unica restrizione che
a due modalità diverse non si assegnerà lo stesso valore.(Marradi,1993)
sono
quelle variabili su cui si osservano i cambiamenti, causati dalla manipolazione
delle variabili indipendenti.
variabile
alla quale si ricorre al fine di sottoporre ad analisi con tecniche cardinali
non solo le dicotomie, ma anche le variabili categoriali con più di due
categorie. A parte ogni considerazione sulla natura artificiale del
procedimento, anche il risultato meramente tecnico è condannato ad essere
inattendibile perchè tutte o quasi le dicotomie così create avranno
distribuzioni estremamente squilibrate con negative conseguenze. La variabile
dummy viene ottenuta ricodificando l'appartenenza o meno ad una categoria con
un 1 o uno 0.
variabile
che normalmente lo sperimentatore cambia.
una
variabile si dice ordinale quando le cifre che costituiscono le etichette
numeriche delle sue modalità si possono legittimamente intendere come numeri
ordinali ma non come numeri cardinali.
chiamate
categoriali; hanno livello di scala nominale e ordinale.
sono
chiamate cardinali; hanno livello di scala ad intervallo e di rapporto.
è
la media dei quadrati degli scarti di una distribuzione dalla loro media cioè
lo scarto quadratico (cioè elevato al quadrato) medio. La varianza dà
un'informazione sintetica sulla dispersione dei dati attorno alla
media.(Marradi,1993)
è
una sequenza ordinata di informazioni relative allo stesso referente. Nella
ricerca sociale queste informazioni sono presentate in forma di valori
simbolici (abitualmente cifre). (Marradi,1993)
Z