A


Analisi bivariata:

una tecnica di analisi si dice bivariata se si occupa della distribuzione di due variabili congiuntamente considerate.(Marradi,1993)

Analisi della varianza:

è una tecnica di misurazione della significatività statistica della differenza fra medie e pone come ipotesi nulla che le medie dell'universo siano uguali.Può essere applicata ogni volta che si intende verificare l'esistenza di una relazione tra due variabili di cui una abbia un livello di misurazione categoriale e l'altra cardinale.

Analisi monovariata:

una tecnica di analisi si dice monovariata se considera solo una variabile per volta, studiando la distribuzione dei dati fra le modalità di quella variabile.

Analisi qualitativa:

analisi non numerica, in generale limitata a variabili nominali (ad esempio razza, sesso, religione) e ordinali, oppure concernente dati di natura non statistica raccolti mediante i metodi etnografici (interpretazione delle note prese sul campo),l'analisi ermeneutica dei testi, le interviste non strutturate,ecc.

Analisi quantitativa:

analisi di dati codificati numericamente, cioè di dati cardinali; spesso comporta il calcolo di parametri statistici.

Asimmetria:

valore caratteristico indicativo della distribuzione dei dati di una variabile cardinale o quasi cardinale. L'asimmetria si dice "positiva" quando si hanno molti valori con forti scarti positivi e pochi valori con deboli scarti negativi; viene, invece, definita "negativa" nel caso opposto, quando cioè esistono molti valori con forti scarti negativi e pochi valori con deboli scarti positivi; in questo caso la coda più lunga è collocata a sinistra della media.

Assegnazione:

tecniche che assegnano valori agli stati elaborando in qualche forma vettori o (sotto-) matrici si dicono tecniche di assegnazione.(Marradi,1997)

Asserto:

l'asserto (detto anche proposizione o ipotesi) è un affermazione che si riferisce a un aspetto della realtà e hanno come caratteristica di avere un riscontro empirico immediato.

Attendibilità:

è la stabilità della misura.

Attrazione:

si parla di attrazione fra una modalità di una variabile categoriale e una modalità di un’altra variabile categoriale quando nella relativa cella di una tabella di contingenza le frequenze osservate sono apprezzabilmente superiori alle frequenze attese.(Marradi,1997)

Autonomia semantica:

è una proprietà di una categoria, e consiste nella maggiore o minore possibilità di interpretarla senza far ricorso all’etichetta della variabile o delle altre categorie della variabile.(Marradi,1997)


Bivariato:

bivariato significa a due variabili. Una relazione bivariata è l'esplicitazione di una relazione tra due variabili.

Box plot:

il box plot (o grafico a scatola) è un grafico che riassume i dati di una variabile mostrandone la mediana (rappresentata da una riga orizzontale che taglia la scatola) e il 25° e 75° percentile (rappresentati dai lati inferiore e superiore della scatola che contiene la mediana).


C

Calcolo

capacità generativa o produttiva del modello.

Campionamento accidentale:

campione non probabilistico in cui sono scelti per l'indagine i casi più comodi (quelli più facilmente disponibili).

Campionamento a grappolo:

campionamento effettuato in vari stadi. Nel primo stadio si campiona un grappolo di casi; poi, a partire da questo grappolo iniziali, si seleziona il campione effettivo di casi (ad esempio per ottenere un campione di famiglie il ricercatore estrae un campione casuale di isolati, o di edifici, e poi estrae un campione di famiglie all'interno degli isolati, o edifici, scelti.

Campionamento a valanga:

forma non probabilistica di campionamento in cui le persone scelte inizialmente per il campione sono utilizzate come informatori per individuare altre persone dotate delle necessarie caratteristiche che le rendono adatte per il campione.

Campionamento bernoulliano

campionamento con reimmissione.

Campionamento esaustivo:

campionamento senza reimmissione.

Campionamento per dimensioni:

metodo di campionamento multidimensionale e non probabilistico in cui il ricercatore specifica tutte le dimensioni concettuali rispetto alle quali si vuole effettuare il campionamento e poi seleziona una quota di casi per tutte le combinazioni di dimensioni.

Campionamento per quote:

campionamento non probabilistico che equivale al campionamento stratificato da cui si differenzia perchè è generalmente rappresentato nella stessa proporzione, proporzione che ha nella popolazione complessiva (che deve essere finita).

Campione:

un campione è un sottoinsieme di una popolazione. Dal momento che molto spesso è impossibile o troppo costoso condurre una ricerca sull'intera popolazione,è un approccio molto usato condurre la ricerca su un campione. I metodi di inferenza statistica in genere richiedono che il campione sia probabilistico per ridurre il più possibile le sistematicità ed avere un campione rappresentativo.

Campione casuale:

campione probabilistico in cui ciascun elemento (e ciascuna combinazione di elementi) ha uguale probabilità di essere selezionato.

Campione casuale stratificato:

procedura di campionamento probabilistica in cui la popolazione viene prima divisa in strati (ad esempio studenti del primo, secondo, terzo, quarto anno) e successivamente si effettua un campionamento casuale all'interno di ciascun strato.

Campione non probabilistico

campione nel quale non è nota la probabilità di selezione di ciascun caso.

Campione probabilistico:

un campione in cui la probabilità di selezione di ciascun caso (e di ciascuna combinazione di casi) è nota.

Campione rappresentativo:

campione i cui casi estratti dalla popolazione (universo campionario) riproducono esattamente la popolazione per tutte le propriet&agrave su di essa misurabili.

Campione sistematico:

campione in cui viene selezionato un soggetto ogni k soggetti (di solito il primo soggetto scelto casualmente), dove k è una qualsiasi costante.

Campo di variazione:

misura di variabilità. E' la differenza tra il valore massimo e il valore minimo di una variabile in una distribuzione di frequenza (ingl.range).

Caso:

è un termine specifico, e individua qualcuno o qualcosa su cui si siano raccolte informazioni in modo sistematico.(Marradi,1997)

Chi quadrato:

coefficiente relativo al rapporto fra due variabili categoriali, si basa sul confronto fra frequenze osservate e frequenze attese.

Codice:

si riserva il termine "codice" al documento in cui sono elencati i valori assegnati alle modalità delle variabili di una ricerca.(Marradi,1997)

Codifica:

assegnazione di codici sotto forma di simboli (di solito numeri) per ciascuna modalità di ciascuna variabile, corrispondente ad una domanda di un questionario.

Coefficiente:

è una cifra che dà informazioni su alcune caratteristiche di una distribuzione congiunta, bi o multi-variata.(Marradi,1993)

Coefficiente bi-direzionale:

coefficiente relativo all'associazione fra due dicotomie.

Coefficiente D asimmetrico:

è probabilmente il più antico dei coefficienti di associazione fra dicotomie. E' una versione uni-direzionale del coefficiente Phi.

Coefficiente di cograduazione:

coefficiente che quantifica l'associazione fra variabili ordinali.

Coefficiente di contingenza:

coefficiente derivato dal chi quadrato, il cui massimo dipende dal numero di righe e di colonne della tabella di contingenza,e che comunque non può raggiungere l'unità.

Coefficiente di correlazione:

è un coefficiente che presuppone una relazione bi-direzionale fra le due variabili: guardando le formule, X e Y sono perfettamente intercambiabili.

Coefficiente di determinazione:

quantifica la distanza fra un'associazione perfettamente lineare e la relazione che intercorre effettivamente fra due variabili.

Coefficiente di variazione:

ogni volta che si vogliono confrontare le dispersioni di due variabili aventi medie molto diverse tra loro, il confronto con il coefficiente divariazione, che opera una normalizzazione, dividendo lo scarto tipo della variabile per la sua media, risulta pi&ugrave corretto di quello fatto con le altre misure di dispersione.

Coefficiente D simmetrico:

coefficiente uni-direzionale. E' uno sviluppo del coefficiente Q di Yule.

Coefficiente PHI:

coefficiente bi-direzionale che impiega al denominatore, come normalizzatore, la radice quadrata del prodotto dei quattro marginali.

Coefficiente Gamma:

coefficiente che considera solo le coppie cograduate e quelle contrograduate, ignorando tutte quelle legate.

Coefficiente Q:

coefficiente più usato tra quelli che quantificano la concordanza fra due dicotomie.

Coefficiente Rho:

coefficiente proposto da Spearman per rilevare la cograduazione fra variabili ordinali cioè il grado di accordo fra graduatorie compilate da individui diversi (o dallo stesso individuo applicando criteri diversi).

Coefficiente uni-direzionale:

Questi coefficienti sono meno numerosi e meno diffusi dei coefficienti bi-direzionali.

Coefficiente V di Lieberson:

è il numero delle sequenze di segni consecutivi uguali. Il numero massimo di tali sequenze è r-1 (dove r è il numero di righe della matrice) e potrebbe essere usato per trasformare V in un indice relativo (cioè variabile 0 e 1) : V/(r-1).

Più V è vicino a 0, più strettamente le due variabili sono associate, in modo monotonico o non; più è vicino a 1, meno sono associate.

Coefficienti Tau:

coefficienti bi-direzionali. Il Tau q è concepito per tabelle di contingenza quadrate (le due variabili hanno lo stesso numero di modalità). Il Tau r è concepito per tabelle rettangolari (una variabile ha più modalità dell'altra).

Cograduazione:

si parla di cograduazione per la covariazione fra variabili ordinali.

Concordanza:

un rapporto di associazione fra variabili categoriali non ordinate si dice concordanza.(Marradi,1997)

Contro-variazione:

due variabili "contro-variano" quando a valori alti dell'una tendono a corrispondere valori bassi dell'altra.

Convergenza:

termine tecnico che sta a significare che ulteriori iterazioni (ripetizioni della stessa procedura) non producono alcuna modifica nei risultati.

Coppie legate:

coppie che non è possibile classificare nè come cograduate nè come contrograduate perchè hanno lo stesso punteggio su una variabile o su entrambe.

Correlazione:

si parla ci correlazione per la covariazione fra cardinali.

Covariazione:

due variabili "covariano" quando a valori alti dell'una tendono a corrispondere valori alti dell'altra, e analogamente per i valori bassi.

Curtosi:

l'indice di curtosi mira a rilevare quanto una distribuzione &egrave piatta oppure appuntita. Distribuzioni con picchi piatti e code ampiesono chiamate "platicurtiche", quelle con picchi alti e code piccole sono chiamate "leptocurtiche". Una distribuzione con curtosi uguale a quella della distribuzione normale è chiamata "mesocurtica".(Marradi,1993)

Curva di frequenza:

forma di rappresentazione usata quando si hanno molti valori, dove sull’ascissa si collocano i valori delle modalità e in ordinata il numero dei dati che hanno quel valore corrispondente in ascissa.

Curva normale:

per il teorema del limite centrale è il modo con cui si distribuiscono le medie di tutti i possibili campioni casuali di numerosità superiore a 30, estratti da una popolazione qualsiasi.


D

Definizione operativa:

permette la misurazione empirica di un concetto astratto; ad esempio la definizione operativa di intelligenza nel test per valutare il quoziente di intelligenza.

Devianza:

somma dei quadrati degli scarti dalla media.(Marradi,1993)

Devianza non spiegata:

il teorema fondamentale della devianza scompone la devianza della variabile X in due parti: una "spiegata" e l'altra "non spiegata" o residua. La parte non spiegata è detta devianza interna (sottinteso: alle categorie) o WSS (Within Sum of Squares, somma dei quadrati all'interno delle categorie).

Devianza spiegata:

il teorema fondamentale della devianza scompone la devianza della variabile X in due parti: una "spiegata" dall'associazione di X con una variabile categoriale e l'altra "non spiegata". La parte spiegata è costituita dall'ultimo termine dell'uguaglianza, cioè dalla somma dei quadrati degli scarti fra le medie.

Deviazione standard (o scarto tipo o scarto quadratico medio):

è la radice quadrata della varianza. E' un valore caratteristico che dà un'informazione sintetica sulla dispersione dei dati di una variabilecardinale attorno alla loro media. Si usa se serve una grandezza lineare.(Marradi,1993)

Diagonale:

esiste una vera diagonale solo quando le due variabili hanno lo stesso numero di modalità.

Diagonale della cograduazione:

in una tabella di contingenza, è la linea discendente che congiunge la cella "basso/basso" con la cella "alto/alto" (non si tratta di una vera e propria diagonale).

Diagonale della contro-graduazione:

in una tabella di contingenza è la linea ascendente che congiunge la cella "alto in riga/basso in colonna" con la cella "basso in riga/alto in colonna".

Diagramma a bandiera:

diagramma a barre ruotato di 90°, composto di fasce orizzontali anzichè di colonne.(Marradi,1993)

Diagramma a barre:

successione di linee di altezza proporzionale alle frequenze.(Marradi,1993)

Diagramma a dispersione:

questo genere di figura è usato solo quando entrambe le variabili sono cardinali. Ogni punto rappresenta la coppia di valori relativi ad un singolo caso, e per collocarlo sul diagramma si calcolano la posizione sull'ascissa del punteggio di quel caso sulla variabile X e la posizione sull'ordinata del suo punteggio sulla variabile Y; il punto sarà collocato all'incrocio fra la verticale di detta posizione sull'ascissa e il prolungamento orizzontale di detta posizione sull'ordinata.

Dicotomia:

variabile con due sole modalità si tratta di una variabile categoriale di natura speciale perchè può essere considerata come categoriale oppure come ordinale.

Differenza interquartilica:

misura di variabilità. E' la differenza tra il valore del terzo e del primo quartile di una distribuzione di frequenza di una variabile ordinale.

Distribuzione asimmetrica:

una distribuzione asimmetrica vuole vedere se e quando una distribuzione non è disposta simmetricamente attorno alla media ma ha una coda più lunga dell'altra.

Distribuzione campionaria:

distribuzione di valori di una statistica del campione (ad esempio, la media) ottenuta a partire da tutti i campioni logicamente possibili di una data ampiezza.

Distribuzione cumulativa:

si affianca alla distribuzione di frequenza, se la variabile è almeno ordinale.

Distribuzione di frequenza:

l'elenco ordinato di tutte le modalità di una variabile, ciascuna con la sua frequenza, si dice distribuzione di frequenza di quella variabile.(Marradi,1993)

Distribuzione normale:

le distribuzioni normali sono una famiglia di distribuzioni che hanno le stesse caratteristiche e lo stesso andamento. Sono curve simmetriche con valori più concentrati verso il centro piuttosto che nelle estremità laterali, che presentano la massima ordinata in corrispondenza della media. In queste distribuzioni moda, media e mediana coincidono. Le distribuzioni normali sono curve a campana (ma non tutte le curve a campana sono distribuzioni normali).

Distribuzione normale standardizzata:

è una distribuzione normale utile nelle operazioni di stima statistica. Presenta media uguale a 0 e scarto tipo pari a 1.

Distribuzione semplice di frequenza:

il risultato delle operazioni di conteggio delle unità che appartengono a ciascuna modalità di una variabile qualsiasi. Descrive la composizione di un gruppo secondo quella variabile.

Distribuzione simmetrica:

una distribuzione è simmetrica se le modalità che sono equidistanti dalla mediana hanno la stessa frequenza. In una distribuzione simmetrica media e mediana coincidono.(Marradi,1993,p.114)

Distribuzioni unimodali, bimodali e trimodali:

parlare di distribuzioni modali ha senso per variabili cardinali e ordinali, in cui viene meno l'autonomia semantica e si dà più importanza all'intera distribuzione delle frequenze. Se in una distribuzione abbiamo solo una classe che si distingue dalle altre per l'alto numero di casi, quella sarà la moda della distribuzione, ovvero la categoria che raccoglie il maggior numero di casi. Nel caso delle distribuzioni bi e trimodali le modalità che si distinguono dalle altre per le frequenze più alte sono rispettivamente due e tre.


E

Elemento del campionamento:

il caso o l'unità più piccola che può essere inclusa nel campione; ad esempio, protestanti maschi di età compresa tra i 21 e i 50 anni, le aziende con meno di 15 dipendenti.

Epistemologia:

si occupa dei fondamenti, della natura dei limiti e della validità del sapere scientifico, assumendo come oggetto di indagine i procedimenti effettivi e il linguaggio della scienza.

Esperimento:

consiste nella somministrazione di uno stimolo e nell'osservazione dei suoi effetti su un gruppo di soggetti. Il piano di ricerca consiste nella formulazione di una ipotesi che suppone che i dati raccolti prima e dopo lo stimolo sperimentale non presentino differenze significative, cioè non dovute al caso, allo scopo di dimostrare l'eventuale influsso stimolo sperimentale qualora un test statistico dimostri che l'ipotesi è falsa

Eta quadrato:

l'eta quadrato è un coefficiente che ci dice di quanto migliora (rispetto alla situazione in cui conosciamo solo la media generale della variabile X) la nostra capacità di indovinare i punteggi di un qualsiasi caso sulla X quando sappiamo a quale modalità appartiene quel caso e conosciamo le medie della variabile X in ciascuna modalità della variabile categoriale.

Etnografia:

letteralmente, studio di una cultura; termine tradizionalmente utilizzato per indicare l'osservazione antropologica di culture primitive, ma oggi usato per l'osservazione in generale.

Etnometodologia:

studio dei metodi utilizzati nell'attività sociale e quotidiana, comune e di routine (definiti etnometodi), ad esempio espressioni indicali (che hanno significato in quel preciso contesto), posture, gestualità, riti quotidiani, ecc.


F

False dicotomie:

si hanno false dicotomie quando vengono registrate come dicotomie proprietà che hanno più di due stati, o che addirittura sono continue.

File:

archivio computerizzato che contiene la matrice dei dati.

Formalizzazione:

rappresentazione della teoria sottostante al modello.

Frequenza:

il numero dei dati che presentano una determinata modalità su una variabile si dice frequenza di quella modalità.(Marradi,1993)

Frequenza assoluta:

numero di ripetizioni di una data modalità.

Frequenza attesa:

la frequenza attesa in una cella è uguale al prodotto dei due relativi marginali (di riga e di colonna) diviso per N.

Frequenza marginale:

si dicono frequenze marginali le cifre ai margini della tabella.

Frequenza osservata:

il numero dei dati in una cella si dice frequenza osservata in quella cella.

Frequenza relativa retrocumulata:

si ottiene sottraendo da uno la frequenza relativa cumulata per ciascuna modalità.


G

Gnoseologia:

è la riflessione sulla conoscenza in generale.(Marradi,1997)

Grado di libertà:

in una tabella di contingenza fra due dicotomie, se conosciamo i marginali, basta conoscere la frequenza di una cella per conoscere tutte le altre: gli statistici intendono questo quando dicono che una relazione fra due dicotomie (e quindi una tabella 2x2) ha un solo grado di libertà.

Gruppo di controllo:

è di solito un gruppo, scelto in modo casuale, al quale non viene somministrato lo stimolo sperimentale. I dati raccolti dal gruppo di controllo vengono confrontati con quelli rilevati dal gruppo sperimentale al fine evidenziare se sussistono differenze significative fra i due.

Gruppo sperimentale:

nell'esperimento è il gruppo a cui viene somministrato lo stimolo sperimentale, contrapposto al gruppo di controllo che è un gruppo identico al quale lo stimolo non viene somministrato.


H


I

Inchiesta:

tecnica di raccolta dei dati che consiste nel porre domande ad un campione di soggetti, in un determinato momento, attraverso un questionario autocompilato o mediante un intervistatore.

Indagine:

nella maggior parte dei casi (ma non necessariamente) si avvale dei questionari, e si distingue dal sondaggio per il fatto di essere collegata a una problematica teorica.(Marradi,1997)

Indicatori:

vengono usati per quegli asserti che contengono concetti astratti e consentono di definirne delle operazioni di misura.

Indice di dispersione:

ricorrendo ai valori caratteristici posizionali si rileva la dispersione dei dati fra le categorie ordinate individuando specifici valori (quartili o simili) collocati in punti particolari della distribuzione.

Indice di equilibrio/squilibrio:

si basa sulla proporzione dei casi che cadono in una modalità, calcolata sul totale dei casi.

Indice di posizione:

valore caratteristico tipico della distribuzione in categorie ordinate, determinato tenendo conto sia delle frequenze sia dell'ordine delle categorie.(Marradi,1993)

Indice relativo di Cramer:

è un indice relativo che può fra un minimo di 0 ed un massimo di 1.

Indipendenza semantica:

è una proprietà di una coppia di proprietà/variabili, e consiste nel fatto che tra le due proprietà/variabili non intercorrano legami semantici, ma solo (eventualmente) legami empirici.Ad es. fra il sesso e il voto espresso c’è piena indipendenza semantica.

Inferenza statistica:

le inferenze statistiche consentono di ottenere informazioni su una popolazione partendo da un campione.Sono due i metodi principali della statistica inferenziale (o statistica induttiva):la stima e il test di ipotesi.Nella stima il campione viene usato per stimare un parametro della popolazione e porta alla costruzione di un intervallo di fiducia per il suddetto parametro. Nel caso del test di ipotesi, parametrica o non parametrica, e la si verifica sui dati del campione.

Intervallo di fiducia:

un intervallo di fiducia è un intervallo di valori che ha una specifica probabilità di contenere il parametro oggetto di stima. Gli intervalli di fiducia del 95% e del 99% sono quelli più comunemente usati.

Intervista:

strumento di raccolta dati che può essere strutturata oppure può essere condotta in forma libera, costruendo le domande nel corso della conversazione.

Intervista clinica:

intervista completamente non strutturata in cui l'intervistatore lascia che il rispondente approfondisca liberamente un tema di suo interesse: usata soprattutto in psicoterapia.

Intervista non strutturata:

intervista in cui l'intervistatore specifica preventivamente solo l'argomento senza indicare con precisione alcuna particolare domanda o modalità di risposta prefissata.

Intervista semistrutturata:

intervista il cui tema è deciso preventivamente ma in cui l'intervistatore gode di una certa discrezionalità nel decidere quali domande porre e quale tipo di modalità di risposta usare.

Ipotesi:

è un affermazione, provvisoria e non provata, di quelli che sono i fatti implicati dalla teoria secondo il ricercatore. Le ipotesi possono essere monovariate (ad esempio l'età media è maggiore di 20 anni) oppure bivariate (ad esempio, quanto più alta è l'istruzione, tanto più alto è il reddito).

Ipotesi da testare:

il test di ipotesi è un metodo di inferenza statistica. Uno sperimentatore inizia a formulare un'ipotesi sulla forma o posizione (ipotesi non parametrica) o su un parametro (ipotesi parametrica) della popolazione. Viene poi raccolto un campione sul quale viene eseguito il test. In un test parametrico viene calcolato sul campione il parametro oggetto del test e si vede qual'è la probabilità che quel dato valore sia dovuto all'effetto del caso. In una ipotesi non parametrica si calcola la probabilità che quella data disposizione (forma e posizione) del campione sia dovuta all'effetto del caso. Se tale probabilità è bassa, minore della significatività del test (in genere

Marginali:

le cifre ai margini della parte riquadrata di una tabella si dicono "frequenze marginali" (o marginali).

Media aritmetica:

somma degli scarti diviso per il loro numero.

Mediana:

valore caratteristico posizionale che misura la tendenza centrale di una distribuzione. E' una cifra che bipartisce la serie dei dati a metà.

Metodologia della ricerca:

indica l’attività critica che si applica ai diversi prodotti della ricerca. (Boudon,1991,p.279)

Microanalisi:

analisi su piccola scala; essa ha un individuo singolo o un piccolo gruppo come unità di analisi, in contrapposizione con l'analisi "macro" che ha un ampio aggregato (ad esempio, una nazione) quale unità di analisi.

Misura di tendenza centrale:

valore che rappresenta la caratteristica centrale (posizione) di una distribuzione di frequenze. Sono tali la moda, la mediana, la media aritmetica.

Misurare:

significa assegnare dei numeri ad oggetti o eventi in modo sistematico.

Misurazione ad intervallo (o scala):

permette di sapere se, sulla base di una variabile, una persona si colloca più in alto rispetto ad un'altra ed anche quante unità di misura più in alto si colloca. Non ha uno 0 assoluto.

Misurazione di rapporto (o scala):

simile alla scala ad intervalli, ad eccezione che qui lo 0 è assoluto e ciò consente la moltiplicazione e la divisione sui diversi valori della variabile.

Misurazione nominale (o scala categoriale non ordinata):

ogni operazione di classificazione dà origine a una nominale, senza attribuire ad essi alcun genere di informazione quantitativa e nessun criterio di ordine.

Misurazione ordinale (o scala categoriale ordinata):

è analoga alla scala nominale in quanto consiste di categorie reciprocamente esclusive ed esaustive. Tuttavia le diverse categorie sono ordinate gerarchicamente a seconda del valore che hanno rispetto alla proprietà considerata.

Misure di variabilità:

indici che consentono di valutare la dispersione dei dati intorno al valore di tendenza centrale di una distribuzione. Le principali misure di variabilità sono: devianza, varianza, scarto tipo.

Moda:

misura di tendenza centrale, è la categoria con frequenza più alta o percentuale più alta.(Marradi,1993)

Modalità:

quando diamo una definizione operativa di una variabile, redigiamo un insieme di stati significativamente distinti tra loro. Questo insieme di stati sono le "modalità" della variabile.

Modelli computazionali:

prevedono un processo interattivo: dalla teoria ai parametri e dal confronto con i dati alla teoria.

Modelli logici:

questi modelli "partono" dalla teoria per "arrivare" ai parametri, secondo un approccio di tipo top-down.

Modelli statistici:

questi modelli "partono" dai dati per "arrivare" ai parametri, secondo un approccio di tipo bottom-down.

Modello:

nell’ambito delle discipline empiriche significa rappresentazione astratta e semplificata di una fenomenologia concreta; nelle discipline formali significa interpretazione concreta di una rappresentazione astratta.


N


O

Odd:

gli "odds" sono le probabilità che avvenga un certo fenomeno rispetto alla probabilità che questo non avvenga.

Osservazione:

tecnica principale per la raccolta di dati sul comportamento non verbale e si può accompagnare ad altre tecniche simultanee, come l’esperimento o l’inchiesta nella sua fase preliminare.

Osservazione non partecipante:

tecnica in cui l’osservatore non prende parte alle attivit&agrave di gruppo.

Osservazione partecipante:

osservazione in cui il ricercatore fa parte dell'organizzazione o del gruppo oggetto d'indagine e partecipa a tutte le attività organizzative; in generale (ma non sempre) gli altri membri del gruppo non sono consapevoli del fatto che l'osservatore sta realizzando una ricerca.


P

Paradigma:

una prospettiva di ricerca (una scuola di pensiero) con determinate idee sugli scopi della ricerca e sui metodi appropriati (come si dovrebbe realizzare la ricerca) e con i propri valori e assunti.

Parametro:

un parametro è una quantità numerica che misura un qualche aspetto di una popolazione. Per esempio la media è una misura di tendenza centrale ed è un parametro di una popolazione.

Percentili:

seguono la stessa logica dei quartili, solo che le parti in cui viene divisa la distribuzione sono 100.

Percentuale:

l'uso delle percentuali è frequente quando si vuole dare un'idea dell'entità relativa che hanno due o più frequenze rilevate; le si confronta con il numero totale dei soggetti presenti nel gruppo.

Percentuale cumulata:

quando l'autonomia semantica delle singole categorie è bassa (dalle scale ordinali in su), l'interesse si sposta dalla frequenza nelle singole categorie alla distribuzione di frequenza nella successione delle categorie. Quindi accanto alle percentuali di categoria è opportuno specificare delle "percentuali cumulate", in cui alla percentuale della singola categoria si sommano tutte quelle che la precedono fino ad arrivare all'ultima categoria che naturalmente avrà il 100%. Avendo a disposizione tale percentuale risulterà molto più immediata l'individuazione dei valori caratteristici come la mediana, i quartili e i percentili.

Percentuale retrocumulata:

l'introduzione nelle tabelle di frequenza delle percentuali retrocumulate è uguale a quella già descritta per le percentuali cumulate. La differenza con le percentuali cumulate è che in queste ultime si sommano le percentuali in modo ascendente, dalla prima all'ultima categoria, mentre qui si parte dal totale delle percentuali (100) per poi sottrarre per ogni categoria la percentuale della stessa, fino ad arrivare all'ultima categoria per la quale la percentuale retrocumulata coinciderà con quella della categoria.

Popolazione (universo):

una popolazione consiste in un insieme di oggetti, osservazioni o valori che hanno qualcosa in comune. Per esempio, una popolazione potrebbe essere definita come tutti i maschi di età compresa tra i 15 e i 18 anni. La distribuzione di una popolazione può essere descritta da numerosi parametri come la media e lo scarto tipo. Le stime di questi parametri fatte a partire da un campione sono chiamate "statistiche campionarie".

Post-test:

nell'esperimento è un test volto a misurare il valore della variabile dipendente dopo aver applicato lo stimolo sperimentale.

Pre-test:

nell'inchiesta è la somministrazione preliminare di un questionario ad un piccolo campione al fine di individuare e di correggere i problemi di interpretazione degli items. Nell'esperimento è un test per misurare il valore della variabile dipendente prima di applicare lo stimolo sperimentale.

Proposizione:

termine generico per tutti gli asserti riguardanti una variabile o una relazione tra due o più variabili; ipotesi, assiomi, postulati e teoremi sono tutti tipi di proposizioni.

Proprietà:

le caratteristiche dell'unità di analisi sulla quale si raccolgono informazioni si chiamano proprietà.

Pulizia dei dati:

procedura di controllo degli errori dopo che i dati sono stati caricati sulla matrice dei dati.

Punti Z:

un valore di z riflette sempre di quanti scarti al di sotto o al di sopra della media si trova un numero considerato.


Q

Quantili (o Percentili):

valori di posizione analoghi alla mediana. Dividono una distribuzione di frequenza in un certo numero di parti uguali (con lo stesso numero di casi). Se il numero di parti è quattro, si dicono quartili, se è dieci, si dicono decili, ecc.

Quartili:

valore caratteristico posizionale che rileva la sua dispersione attorno alla mediana (che rileva la tendenza centrale di una distribuzione). Per le variabili categoriali ordinate, il primo quartile è quella modalità per la quale P

Questionario:

strumento per la raccolta dei dati, costituito da un elenco di domande a cui deve rispondere il soggetto in un'inchiesta.


R

Rappresentazione grafica:

la rappresentazione grafica di una distribuzione di frequenza è la rappresentazione spaziale, e per lo più geometrica dell'andamento dei dati, fatta per consentire e facilitare rapidi confronti, allo scopo di cogliere tendenze costanti e anomalie.

Reimbussolamento (campionamento con):

in un campionamento con reimbussolamento l'estrazione di n elementi presi a caso, avviene considerando sempre tutti gli n elementi per ogni estrazione, anche quelli che sono stati già precedentemente estratti. Viceversa il campionamento senza reimbussolamento esclude dalle estrazioni successive tutti gli elementi che sono stati già estratti.Ad esempio, se io estraggo delle palline da un'urna che contiene 50 palline bianche e 50 palline nere, e dopo ogni estrazione rimetto dentro la pallina (reimbussolamento) io estraggo sempre da un universo con 50 palline bianche e 50 palline nere, quindi la probabilità di estrarre una pallina bianca o nera è la stessa. Se non rimetto dentro la pallina (campionamento senza reimbussolamento) la probabilità cambia.

Relazione :

è il termine generale e generico per qualsiasi rapporto fra due o più variabili, esistente o meno, effettivo o potenziale.(Marradi,1997)

Relazione bi-direzionale asimmetrica:

riguarda la relazione fra due variabili, in cui la proprietà A influenza la proprietà B più di quanto ne è influenzata.

Relazione bi-direzionale simmetrica:

relazione fra due variabili in cui le due proprietà si influenzano a vicenda con forza più o meno pari.

Relazione diretta (relazione positiva):

relazione in cui l'incremento del valore di una variabile è accompagnato dall'incremento (o decremento) del valore dell'altra variabile.

Relazione inversa (relazione negativa):

relazione in cui il valore di una variabile aumenta quando il valore della seconda variabile diminuisce, e diminuisce quando il valore dell'altra variabile aumenta.

Relazione lineare:

guardando un diagramma a dispersione fra due variabili cardinali ci può sembrare che la relazione rappresentata sia approssimativamente lineare; per ottenere dei coefficienti che sintetizzino alcune caratteristiche di tale relazione si interpolano i punti del diagramma a dispersione mediante una retta.

Relazione monotonica:

si ha relazione monotonica fra due serie di grandezze ordinate se si realizza una delle seguenti condizioni:

a.       se l'elemento A è maggiore dell'elemento B in una serie, lo è anche nell'altra;

b.      se l'elemento A è maggiore dell'elemento B in una serie, l'elemento A è minore dell'elemento B nell'altra.

(Marradi,1993)

Relazione non lineare (curvilinea):

spesso le relazioni sono monotoniche ma non lineari, cioè il punteggio in ordinata cresce al crescere del punteggio in ascissa, ma non con tasso costante.

Relazione unidirezionale:

relazione fra due variabili, in cui la proprietà A influenza la proprietà B senza esserne influenzata.

Repulsione:

si parla di repulsione quando le frequenze osservate sono apprezzabilmente inferiori alle frequenze attese.(Marradi,1997)

Ricerca applicata:

propone risultati utilizzabili per risolvere problemi sociali di interesse immediato.

Ricerca avalutativa:

ricerca che non deve contenere proposizioni di carattere prescrittivo o giudizi di valore riguardanti la realtà sotto esame.

Ricerca empirica:

ricerca vincolata a conoscenza fattuali acquisite sul campo o in laboratorio, quali osservazioni, questionari, interviste, esperimenti.(Ricolfi,1994)

Ricerca empirica descrittiva:

ricerca che ha finalità descrittiva.

Ricerca empirica esplicativa:

ricerca che ha finalità di spiegazione.

Ricerca pura:

consente di elaborare e verificare teorie e ipotesi che saranno utili in futuro ma non direttamente applicabili per risolvere problemi sociali concreti.

Ricerca sociale:

si occupa di raccogliere e interpretare dati allo scopo di rispondere a domande concernenti i diversi aspetti della società, permettendo così di comprenderla.(Bailey,1995)

Riduzione dei dati:

trasferimento dei dati dai questionari alla matrice dei dati mediante codifica e battitura.

Rilevanza:

il concetto chiave nella costruzione del questionario è la "rilevanza" che si riferisce a tre diverse questioni:
Rilevanza degli scopi:lo scopo dell'indagine deve apparire rilevante all'intervistato, per questo è necessario chiarire, spiegare e giustificare metodi e finalità dell'indagine, in modo che l'intervistato trovi un senso nelle domande alle quali dovrà rispondere.
Rilevanza delle domande per l'indagine:non basta convincere gli intervistati che l'obiettivo dello studio è rilevante, occorre persuaderli che tutte le domande del questionario sono rilevanti per gli scopi espliciti dello studio. E' necessario quindi includere nel questionario solo quelle domande che effettivamente contribuiscono all'obiettivo della ricerca.
Rilevanza delle domande per gli intervistati:poichè all'interno di una popolazione esistono sottopopolazioni differenti tra loro, la rilevanza non avrà senso assoluto.
Le soluzioni possono essere diverse:

1. usare un diverso questionario per ciascuna sottopopolazione;

2. utilizzare formulazioni multiple perchè il rispondente trovi quella a lui più congeniale;

3. creare dei percorsi differenziati all'interno del medesimo questionario, con "salti" o domande filtro (ad esempio, "Se la risposta è sì, passare alla domanda 44").


S

Scala:

item o serie di items (generalmente più di uno) per misurare una caratteristica e/o una proprietà, ad esempio un atteggiamento. La caratteristica è generalmente considerata unidimensionale e se ne ricava solitamente un punteggio quantitativo.

Scala ad intervallo:

Vedi misurazione ad intervallo.

Scala di quantità:

fa parte, con la scala metrica, delle scale di rapporti. Permette di misurare le variabili quantitative, dotate di uno zero non arbitrario (e quindi assoluto) e della trasferibilità della proprietà (ad esempio l'età non è trasferibile, il reddito sì). Un esempio di variabile misurata su scala di quantità è il reddito.

Scala di rapporto:

Vedi misurazione di rapporto.

Scala metrica:

appartiene alla famiglia della scala di rapporti insieme alla scala di quantità, da cui si differenzia perchè le proprietà della scala non sono trasferibili. Un esempio è costituito dall'età.

Scala nominale:

Vedi misurazione nominale.

Scala ordinale:

Vedi misurazione ordinale.

Scaling multidimensionale:

le tecniche di scaling multidimensionale, elaborano una (sotto-) matrice senza alcun assunto circa la dimensionalità dello spazio semantico corrispondente.(Marradi,1997)

Scaling unidimensionale:

le tecniche di scaling unidimensionale, elaborano una (sotto-) matrice riordinando vettori-riga e/o vettori-colonna ed eventualmente eliminandone alcuni (es. scale di Guttman), oppure applicando strumenti matematici (scale di Mokken, scale di Rasch). In ogni caso, i valori assegnati agli stati sono relativi ad una sola dimensione.(Marradi,1997)

Scarto:

dicesi scarto la distanza di un valore dalla media aritmetica della distribuzione. Caratteristica saliente degli scarti è che la loro somma dà zero.

Scarto quadratico medio (o scarto tipo o deviazione standard):

Vedi deviazione standard.

Scarto tipo (o scarto quadratico medio o deviazione standard):

Vedi deviazione standard.

Scienza:

è una forma di conoscenza istituzionalizzata, con regole condivise da una comunità di specialisti.(Marradi,1997)

Sem:

sistema di produzioni, cioè aggregato di regole di produzione, ovvero regole del tipo "SE X ALLORA Y".

Semantica:

ramo della linguistica che si occupa delle strutture del significato.

Significatività statistica:

con l'espressione "significatività statistica" si intende la probabilità che (supponendo che le due variabili categoriali considerate siano distribuite nella popolazione come sono distribuite nel campione- cioè proiettando dal campione alla popolazione le percentuali marginali) la distribuzione delle frequenze nelle celle non sia un mero effetto del caso.

Simmetria:

valore caratteristico indicativo della distribuzione dei dati di una variabile cardinale o quasi-cardinale.

Sistema esperto:

programma che possiede una base di conoscenza su di un dominio ristretto e che aiuta a risolvere problemi complessi del mondo reale usando un ragionamento inferenziale.

Sondaggio:

equivale a una raccolta di opinioni su temi contingenti, non collegati a problematiche teoriche e talvolta scollegati anche fra loro.(Marradi,1997)

Spezzata a gradini:

concepita per sottolineare la natura cumulativa delle frequenze nelle categorie ordinate.

Spss:

è un programma statistico utile per l’elaborazione dei dati, ed anche per tracciare grafici e costruire tabelle a singola e doppia entrata.

Standardizzazione:

procedura statistica attraverso la quale è possibile rendere confrontabili variabili identiche appartenenti a distribuzioni diverse, ma anche variabili diverse, o variabili espresse in unità di misura diverse. E’ una doppia normalizzazione.(Marradi,1993)

Statistica non parametrica:

osserva i dati, trova la probabilità esatta ad essi associata, controlla l’eventuale presenza di sistematicità, sulla base di un margine di errore prestabilito, quindi fornisce modelli per prendere delle decisioni tra ipotesi alternative.

Statistica parametrica:

controlla che un parametro (media, scarto tipo, proporzione di casi) di una popolazione abbia un dato valore o che misurato in due popolazioni abbia lo stesso valore.

Statistiche descrittive:

analisi statistica che si limita a descrivere un campione (ad esempio, calcolando la media) invece di stimare il grado di accuratezza con cui i dati del campione rappresentano la popolazione, come accade nella statistica induttiva.

Statistiche induttive:

analisi statistica in cui i dati del campione sono usati per inferire informazioni sulla popolazione dalla quale è stato estratto il campione.

Stato:

dicesi stato ogni particolare modo di presentarsi di una proprietà. Se sui casi della ricerca raccolgo le informazioni sulla proprietà "sesso", maschio e femmina sono i due "stati" di tale proprietà.

Stima statistica:

procedura che mettiamo in atto quando, definito un modello che ha un parametro libero (ad esempio la probabilità di fare testa o croce al singolo lancio), stimiamo questo parametro sulla base delle rilevazioni empiriche.

Studio sul campo:

indagine condotta sul "campo", ossia nell'ambiente naturale dei soggetti studiati, contrapposta all'indagine svolta in laboratorio (ambiente artificiale).

Studio trasversale:

un'indagine (di solito un'inchiesta) realizzata in un unico momento con un campione che si suppone costituisca una sezione trasversale rappresentativa della popolazione rispetto a variabili rilevanti (età, sesso, istruzione, ecc.).


T

Tabella a doppia entrata:

tabella costruita tenendo conto delle modalità di due caratteri. Nella tabella le frequenze si interpretano leggendo contemporaneamente l'intestazione della riga e della colonna nelle quali sono iscritte.

Tabella a singola entrata:

tabella che si riferisce alle modalità di un solo carattere (per esempio il livello d'istruzione) detta anche semplice. Se i dati sono nominali (il carattere è qualitativo) le tabelle si dicono di serie. Le tabelle sono dette invece di seriazione quando si ricollegano a modalità quantitative (i dati sono su scale ordinali, di rapporto o ad intervallo).

Tabella di contingenza:

tabella nella quale si possono presentare frequenze di cella, percentuali di riga, percentuali di colonna, percentuali di cella. Le cifre ai margini della tabella (i totali di riga o di colonna) si dicono "marginali". Si chiede al calcolatore di presentare tabelle con percentuali di riga quando si vuole riscontrare l'influenza che la variabile posta in riga ha sulla variabile posta in colonna (e viceversa). Il numero delle celle di una tabella di contingenza varia in funzione del numero delle categorie delle due variabili che si mettono in relazione.

Tabulazione incrociata:

questa espressione si riferisce a un’azione, a una tecnica, non al risultato. Il risultato si dice "tabella di contingenza".(Marradi,1997)

Tavole della T di Student:

quando il campione &egrave piccolo (normalmente inferiore a 30 casi), i possibili campioni estratti da una popolazione normale non si distribuiscono come una curva normale ma come una curva più bassa della normale, tanto più bassa e allargata agli estremi, quanto più piccolo è il campione. Quindi avremo differenti forme di distribuzione a seconda della numerosità del campione stesso, o meglio a seconda dei suoi gradi di libertà. Le tavole riportano i valori della t di Student per i singolo gradi di libertà da 1 a 120. Si può vedere che a parità di aree di probabilità i valori di t decrescono al crescere dei gradi di libertà.

Tavole normali standardizzate:

per la valutazione delle probabilità associate alla normale standardizzata (z) sono disponibili apposite tavole. Esse si riferiscono alle aree di probabilità sottese ad una curva normale con media uguale a zero e scarto quadratico medio uguale a uno (e ovviamente di area unitaria).

Teorema del limite centrale:

afferma che estraendo campioni ripetuti, tutti della stessa dimensione (n, maggiore di 30 casi) dalla medesima popolazione, le medie campionarie si distribuiscono approssimativamente in modo normale (curva a campana) attorno alla media della popolazione; ciò significa che la maggior parte delle medie campionarie avranno valori molto vicini a quello della media della popolazione.

Teoria:

tentativo di spiegare un particolare fenomeno e che, in ultima istanza, deve essere controllabile.(Marradi,1993)

Teoria scientifica:

insieme di ipotesi esplicative che valgono a dar conto di leggi sperimentali. (Statera,1997,p.60)

Test binomiale:

test non parametrico che dà la probabilità esatta di un evento che si manifesta con due modalità. (Trinchero,1997)

Test di ipotesi statistica:

affermare che le ipotesi di partenza sono vere oppure false.


U

Unidimensionalità:

Quando due o più indicatori rilevano la stessa proprietà, si dice che sono unidimensionali. L’unidimensionalità è quindi una proprietà di un insieme di indicatori. (Marradi,1997)

Unità:

è il termine generico che designa un insieme di elementi che hanno una o più caratteristiche in comune. Quindi va usato solo al singolare: in una ricerca sugli italiani adulti, l’unità è l’italiano adulto, non ciascun italiano adulto. (Marradi,1997)

Unità di analisi:

unità primaria i cui attributi vengono misurati e analizzati dal ricercatore; il singolo individuo oppure un aggregato di individui come un gruppo, un club, un comune, una regione, ecc.

Unità di campionamento:

un singolo elemento del campionamento oppure, come nel campionamento a grappolo, un aggregato di elementi del campionamento.


V

Validità:

è la proprietà per cui una tecnica, un metodo o più semplicemente un indicatore raggiunge gli obiettivi che si prefigge.

Valori sintetici:

valori tipici delle variabili cardinali, determinati sulla base delle frequenze di tutte le modalità.

Variabile:

è una proprietà di cui sia stata data una definizione operativa, permettendo così di trasformare una serie di situazioni reali (stati) in una serie di dati su un vettore (Marradi,1993).

Variabile booleana:

variabile che può assumere solo valori : vero o falso.

Variabile cardinale:

la variabile cardinale è corrispondente ad un tipo di proprietà con stati enumerabili e misurabili. Gli stati consistono nel numero di oggetti o eventi con i quali quel dato caso ha una determinata relazione. Gli stati sulla proprietà vengono determinati contando tali oggetti o eventi, e per questo si dicono enumerabili; i valori numerici nelle corrispondenti celle della matrice hanno tutte le caratteristiche dei numeri interi. Gli stati di una proprietà sono misurabili se esiste un'unità di misura.

Variabile categoriale:

variabile corrispondente al tipo di proprietà categoriale non ordinata. Di una proprietà categoriale non ordinata registriamo come diversi un numero finito (e, piuttosto limitato) di stati che trasformiamo in modalità riteniamo che tali stati (e quindi le modalità corrispondenti) non siano ordinabili lungo alcuna dimensione concettuale rilevante per la ricerca. In tal caso, i valori (numerici e non) vengono assegnati in modo casuale, con l'unica restrizione che a due modalità diverse non si assegnerà lo stesso valore.(Marradi,1993)

Variabile dipendente:

sono quelle variabili su cui si osservano i cambiamenti, causati dalla manipolazione delle variabili indipendenti.

Variabile dummy:

variabile alla quale si ricorre al fine di sottoporre ad analisi con tecniche cardinali non solo le dicotomie, ma anche le variabili categoriali con più di due categorie. A parte ogni considerazione sulla natura artificiale del procedimento, anche il risultato meramente tecnico è condannato ad essere inattendibile perchè tutte o quasi le dicotomie così create avranno distribuzioni estremamente squilibrate con negative conseguenze. La variabile dummy viene ottenuta ricodificando l'appartenenza o meno ad una categoria con un 1 o uno 0.

Variabile indipendente:

variabile che normalmente lo sperimentatore cambia.

Variabile ordinale:

una variabile si dice ordinale quando le cifre che costituiscono le etichette numeriche delle sue modalità si possono legittimamente intendere come numeri ordinali ma non come numeri cardinali.

Variabile qualitativa:

chiamate categoriali; hanno livello di scala nominale e ordinale.

Variabile quantitativa:

sono chiamate cardinali; hanno livello di scala ad intervallo e di rapporto.

Varianza:

è la media dei quadrati degli scarti di una distribuzione dalla loro media cioè lo scarto quadratico (cioè elevato al quadrato) medio. La varianza dà un'informazione sintetica sulla dispersione dei dati attorno alla media.(Marradi,1993)

Vettore:

è una sequenza ordinata di informazioni relative allo stesso referente. Nella ricerca sociale queste informazioni sono presentate in forma di valori simbolici (abitualmente cifre). (Marradi,1993)


Z