La teoria della probabilit applicabile a tutti quelle situazioni in cui lesito/evento di una prova/esperimento aleatorio non certo o determinabile con sicurezza in anticipo, ma si verifica con una certa probabilit.
Non si sicuri dellesito dellesperimento Levento pu verificarsi con una certa probabilit Incertezza su quale evento si verificher
Esempio LOTTERIA
Se si verifica un evento diverso da quello da noi scelto parliamo di EVENTO CONTRARIO o nonA
Faccia 6 dello stesso dado P(nonA)
ASSIOMI FONDAMENTALI
LA PROBABILITA CHE UN EVENTO CASUALE SI VERIFICHI E SEMPRE COMPRESA TRA 0 E 1 P(A) + P(nonA) = 1: ci significa che i due eventi sono COMPLEMENTARI ed esauriscono lintero spazio campionario
Ipotesi frequentista
Ipotesi classica
Ipotesi soggettiva
IPOTESI CLASSICA
LANCIO MONETA
- Dato un esperimento ben specificato Uscita della TESTA - Dato un evento E, - detto m il numero dei possibili risultati che danno luogo allevento E TESTA o CROCE - Detto n il numero di tutti i possibili risultati dellesperimento, purch tutti gli n risultati siano ugualmente possibili
TESTA o CROCE
IPOTESI CLASSICA
La probabilit che si verifichi un evento data dal rapporto tra i casi favorevoli e quelli ugualmente possibili
La probabilit di ottenere il numero 5 dal lancio di un dado 1 (caso/evento favorevole) 6 (casi/eventi possibili)
Per definire la probabilit necessario presupporre che gli esiti siano tutti UGUALMENTE POSSIBILI!!!!!!!
IPOTESI FREQUENTISTA
La probabilit che si verifichi un certo evento uguale alla frequenza relativa con cui levento si verifica in un numero di prove sufficientemente grande, ripetute nelle medesime condizioni.
Frequenza con cui si verifica levento A nelle n prove prove Numero di prove molto grande
CARATTERISTICA PRINCIPALE
Permette di conoscere la probabilit di un evento solo dopo aver effettuato un numero di prove (A Posteriori)
GLI EVENTI DEVONO ESSERE RIPETIBILI, cio ripetuti nelle stesse condizioni
Un evento favorevole pu essere definito da pi eventi distinti A e B allinterno dello spazio campionario.
EVENTI DISGIUNTI
SIGNIFICA ANDARE A SOMMARE LA PROBABILITA CHE OGNUNO DEI SINGOLI EVENTI DISGIUNTI SI VERIFICHINO
Prova: lanciare due volte una moneta Evento : ottenere TESTA al primo lancio A
Testa Testa
Testa Croce
P(A o B) = + =
1/4
1/4
prova: lanciare due volte una moneta Evento : ottenere almeno una CROCE nei due lanci
A
B
1/4
1/4
C D
1/4 1/4
P(A o B o C o D) =++=
Quando due eventi Indipendente si verificano congiuntamente ed il verificarsi delluno NON MODIFICA la probabilit del verificarsi dellaltro
A B
1/6
1/6
Cosa accade quando gli eventi sono dipendenti? La probabilit del verificarsi di una certa successione di eventi
semplici dipendenti E1, E2, En, data dal prodotto della probabilit del verificarsi di E1, per la probabilit di E2 subordinata al verificarsi di E1 e cos via
prova: gioco del poker con mazzo di 32 carte Evento: fare poker dassi in una mano di cinque carte
E1 E2 E3
1/32 1/31
E4 E5
1/29
28/28
1/30
Esempi
Eventi: somma delle facce di due dadi 2
Eventi indipendenti
E1 E2
1/6 1/6
E1 E2 E3 E4
PERMUTAZIONI Dato un insieme di n oggetti, si dice PERMUTAZIONE ogni serie ordinata/sottoinsieme degli n oggetti presi n a n.
Numero degli elementi che dobbiamo moltiplicare
DISPOSIZIONI
Si dicono DISPOSIZIONI di n oggetti a r a r tutte le possibili rple che si possono formare con gli n oggetti in modo tale che differiscano per lordine in cui sono gli oggetti
Ogni disposizione distinta dalle altre sia per gli elementi presenti sia per lordine degli elementi allinterno
Le distribuzioni di probabilit
E-mail: r.romanelli@unich.it Ricevimento: Luned 11:00 12:00 Materiale didattico su: http://www.psicometria.unich.it
Variabile casuale discreta quella che pu assumere tutti i possibili valori in un dato intervallo di numeri reali, in un insieme finito e numerabile
Variabile casuale continua quella che pu assumere tutti i possibili valori in un dato intervallo di numeri reali
Ad ogni evento possibile associare una probabilit la cui distribuzione definita in base proprio a questo evento. Una distribuzione di probabilit una funzione che sintetizza la relazione tra i valori di una variabile casuale e la probabilit che questi si presentino
la distribuzione di probabilit di una variabile casuale discreta tale che il valore della variabile casuale sia il numero di successi in una serie di esperimenti identici ed indipendenti
ESPERIMENTO EVENTO X
Un tale esperimento denominato una prova di Bernoulli e la variabile casuale che corrisponde al numero di successi denominata una variabile di Bernoulli.
DISTRIBUZIONE BINOMIALE Se l'esperimento (o prova) ripetuto pi volte e le ripetizioni sono indipendenti tra loro, allora la distribuzione di probabilit della variabile casuale X in n prove indipendenti di Bernoulli denominata distribuzione binomiale.
Probabilit che levento desiderato non si verifichi Numero di prove Combinazioni possibili Probabilit che si verifichi levento desiderato
ESEMPIO
Unurna contiene 10 palline di cui 3 bianche. Si eseguono 4 successive estrazioni rimettendo ogni volta la pallina estratta nellurna.
Probabilit di estrarre 1 pallina bianca Probabilit di estrarre 3 palline bianche 1/10
3/10
ESEMPIO
Un soggetto stato sottoposto ad un test di 20 item, in cui doveva scegliere tra 2 risposte (una corretta ed una sbagliata). Alla risposta corretta viene assegnata un punteggio di 1 mentre a quella errata un punteggio di 0. Il soggetto potr rispondere in maniera corretta alle 20 domande (punteggio di 20) oppure in modo errato (punteggio di 0). Vogliamo sapere qual la probabilit che il soggetto ottenga un punteggio di 17.
Probabilit di dare una risposta corretta
= 0,5
= 0,5
Punteggio di 17
Evento X
Il valore medio il risultato pi probabile. Man mano che ci si allontana dalla media il risultato diviene meno probabile fino ad una probabilit tendente allo zero
simmetrica se la probabilit di verificarsi dellevento favorevole p=0,50 asimmetrica positiva se p<0,50 asimmetrica negativa se p>0,50 Lasimmetria diminuisce allaumentare di n per qualunque valore di p0,50
La probabilit di avere un punteggio di 8 sar dato dalla somma di tutte queste probabilit
0,252
Le distribuzioni normali sono una famiglia di curve simmetriche a forma di campana e unimodali (moda ,media e mediana coincidono). Hanno tutte la stessa forma ma sono caratterizzate dai due valori: media e varianza N(,2).
La curva ASINTOTICA rispetto allasse delle ascisse La funzione f(x) tende ad annullarsi senza mai raggiungere lo 0 se non ai valori di ascissa - e +
La Deviazione Standard, indica la quantit di dispersione delle osservazioni intorno alla media
I parametri e definiscono in modo completo la curva
Se invece rimane costante e varia, tutte le infinite curve hanno lo stesso asse di simmetria; ma hanno forma pi o meno appiattita, secondo il valore di .
Se varia e rimane costante, si hanno infinite curve normali con la stessa forma e la stessa dimensione, ma con l'asse di simmetria in un punto diverso. Quando due distribuzioni hanno media differente, possibile ottenere l'una dall'altra mediante traslazione o trasformazione lineare dei dati.
2 distribuzioni normali che differiscono sia per la media sia per la dispersione dei dati
Come per le distribuzioni discrete la somma di tutte le probabilit uguale a 1, anche per la distribuzione normale si applica questo concetto
Rappresenta larea racchiusa dalla curva
La probabilit che un valore estratto a caso da una N(,2) sia compreso nellintervallo ( - , +) pari a 0.683 e che sia compreso tra ( -2 , +2) pari a 0,954
Il 95% dei valori centrali di una distribuzione Normale cadono nellintervallo ( - 1.96 , +1.96) ed il 99% nellintervallo ( 2.58 , +2.58)
Non ci sono tavole di probabilit per tutti i possibili valori di e , esiste una tavola unica che pu essere usata per tutte le variabili Normali.
La distribuzione normale standardizzata o normale ridotta, si ottiene mediante il cambiamento di variabile X in un punto z secondo la formula:
Le tavole di probabilit della distribuzione normale vengono utilizzate per due scopi:
1.
2.
Per calcolare larea compresa tra due determinati valori della variabile oggetto di studio; Per conoscere la quantit dei punteggi compresi tra due valori di una variabile casuale.
49
In termini pratici
Supponiamo di voler conoscere larea compresa tra le ordinate corrispondenti a z=0 e z=1,96.
50
Osservando la colonna dei punti z, si deve scendere fino a trovare z=1,9 e, rimanendo nella stessa riga fino a trovarsi in quella indicata con 6.
Il punteggio che troverete in quel punto indica la porzione di area compresa tra le due ordinate:
Poich larea totale sotto la curva alla destra dellordinata corrispondente a z=0,00 0,5000, larea alla destra dellordinata di z =1,96 sar: 0,5000-0,4750= 0,0250.
52
Supponiamo di voler conoscere la porzione di area sotto la curva tra le ordinate corrispondenti a z=-1,00 e z=+1,00.
Cercando nella tabella troverete che la porzione di area sotto la curva compresa z=0,00 e z=1,00 0,3413. Dalla porzione opposta della curva si trover ovviamente lo stesso valore
Supponiamo ora di voler trovare larea sotto la curva compresa tra z=0,50 e z=2,50.
56
Poich le tavole danno solo le aree a partire dal punto z=0,00, il calcolo richiede il seguente passaggio:
Calcolare larea tra le ordinate corrispondenti a z=0,00 e z=0,50
Sottrarre la porzione,4938 di area che va z=0,00 a z=0,50 a quella - ,1915 = da ,3023 che va da z=0,00 a z=2,50
Esercizio
Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media () =172,5 cm e deviazione standard () = 6,25 cm.
Qual la probabilit di incontrare un individuo estratto da tale popolazione e di altezza superiore a cm 190?
Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media () =172,5 cm e deviazione standard () = 6,25 cm. Qual la probabilit di incontrare un individuo estratto da tale popolazione con unaltezza compresa tra cm 165 e175?
X1 = 165 X2 = 175
=172,5 = 6,25
0,3849
0,1554
un metodo di inferenza statistica che non richiede delle ipotesi a priori sul tipo o sulle caratteristiche della distribuzione.
molto utile nella fase iniziale dellanalisi statistica quando si cercano le variabili pi significative e le relazioni tra esse.
La funzione di densit del 2 determinata solo dal parametro numero di gradi di libert, pertanto viene scritta come 2 ().
La distribuzione 2 parte da GDL=1 e al suo aumentare assume forme sempre diverse, fino ad una forma approssimativamente normale per GDL = 30
Per campioni di dimensioni inferiori a 200 (o 100) ma comunque superiori a 30 si deve apportare la CORREZIONE DI YATES
Considera le relazioni tra media e varianza, in campioni di piccole dimensioni, quando si utilizza la varianza del campione.
Quando non si conosce la varianza della popolazione usiamo la VARIANZA CAMPIONARIA s2
Gdl= N-1
Rispetto alla curva normale pi bassa simmetrica Le frequenze sono maggiori agli e quando il numero dei GDl molto piccolo Quando i Gdl tendono allinfinito la curva si approssima a quella normale
Corrisponde al rapporto di 2 variabili casuali 2 indipendenti, divise per i rispettivi gradi di libert Questo rapporto varia tra 0 e + La curva dipende dai Gdl e dal livello di probabilit