Anda di halaman 1dari 59

Estatstica , Estatstica II (2011/12) Lio 01 A introduo de abstraco matemtica conduz naturalmente a considerar populaes infinitas.

Suponhamos que se lana um dado e se marca 1 se sair s, e 0, se o resultado for distinto. Em cada prova, s h dois valores possveis, e a populao tem cardinal finito. Em 10000 provas independentes do mesmo tipo, h 210000 resultados possveis, mas a populao continua a ter cardinal finito, de qualquer modo. Mas j se considerarmos o nmero de provas a efectuar at sair 1 pela primeira vez, os resultados a considerar so os elementos de = { ,2,...} (outros smbolos que usarei: 0 =+, , , , ,...). 1 Suponhamos fixado um universo , e seja A um seu subconjunto. Se A = (o conjunto vazio), ento diz-se que o seu cardinal 0. Se n e A = a ,..., an , diz-se que A finito, de cardinal n. 1

Se A = a , a ,... = an : n , diz-se que A infinito numervel.

{1

} {

A introduo de cardinais infinitos suscita alguns problemas. Por exemplo, , , , ... so infinitos numerveis, embora no ltimo caso tal no seja bvio. J (ou [0,1]) so conjuntos infinitos no numerveis, o que significa que no possvel definir uma aplicao bijectiva de em (i.e., simultaneamente injectiva tal que a cada n corresponda um real distinto e sobrejectiva tal que cada real seja imagem de algum n ).

Conjuntos deste tipo dizem-se contnuos, enquanto que os finitos e os infinitos numerveis se dizem discretos. Em Teoria das Probabilidades, os universos discretos so tratados de modo similar, mas j h diferenas de tratamento para espaos contnuos.

Da que venha provavelmente a dizer (e escrever): seja A= a :k 1 um conjunto discreto querendo reportar-me quer a

um conjunto infinito numervel, quer a um conjunto finito, qui vazio, caso em que a notao abusiva, claro. Mas creio que se depreender do contexto a que situao me refiro. Sendo () certo universo e

() a famlia dos seus

subconjuntos, recordo estarem definidas, sobre incluso ( A B ( A

P (), a relao de

B) ) e a de igualdade

( A = B (A B e B A ) ), e as operaes de:

- passagem ao complementar (AC= { : A}); tem-se A=(AC)C ;


- unio ( A B = { : A ou B}) ;

- interseco ( A B = { : A e B}) ;
- diferena (A B = A BC) ; - diferena simtrica ( A B = (A B) (B A) ).

Devem recordar-se as propriedades seguintes: - (associatividade) (A B) C = A (B C);

(A B) C = A (B C) ; - (comutatividade) A B = B A ; A B=BA; A=A;

- (existncia de elemento neutro) A = A ;

- (existncia de elemento absorvente) A = ; A = ; - (distributividade) A (B C) = (A B) (A C) ; A (B C) = (A B) (A C) ; - (leis de De Morgan) (A B)C = AC BC ; (A B)C = AC BC. As operaes de unio e interseco so generalizveis a famlias indexadas (Ai : i I), onde I um conjunto de ndices no
iI Ai = : i I : Ai

vazio:

i I Ai = : i I Ai .

Exemplos a) n 0, = {0} ; b) n , 1 = ]0,1[ . n n n

Nota A igualdade em a) intuitiva, mas a sua verificao deve ser

efectuada

em

dois

passos,

saber,

{0} n

0,

1 n

1 n 0, n {0} (algo mais complicado).

claro que, uma vez obtidos certos resultados, no estamos sempre a repetir argumentos. A seguinte cadeia de equivalncias , tambm, uma demonstrao: (A B)C (A B) (A ou B) (AC ou BC) AC BC.

Passando introduo Teoria das Probabilidades, comece-se por dizer que se designar por experincia algo que conduza a um resultado observvel. Sendo que nalguns casos (experincias deterministas) se sabe a priori a que resultado iro conduzir, e noutras tal no sucede. So ditas aleatrias, surgem em domnios variados extraco ao acaso duma carta dum baralho de 52; verificao, em cada dia, se o preo do crude em Nova Iorque subiu ou no; ... e a Teoria das Probabilidades tem por objecto os

mtodos de anlise das mesmas, independentemente do domnio em causa. Suporemos possvel fixar um conjunto , que se designar por espao de resultados, e que inclui todos os resultados que consideramos possveis para a experincia. Exemplos a) No caso do lanamento duma moeda, costuma-se fixar = {F,C}; b) Sendo o espao associado altura dum prdio de Coimbra seleccionado ao acaso, pode-se pr = + . A primeira concepo de probabilidade aparece associada ao caso em que finito e a cada resultado se atribui a mesma probabilidade, sendo estas nmeros no negativos de soma 1. Estando em causa o lanamento de um dado, usa-se tomar = {1,2,3,4,5,6} , P({1}) = P({2}) = P({3}) = P({4}) = P({5}) = P({6}) = = 1/6. Ento, a determinao de probabilidades reconduz-se a

problemas de anlise combinatria (nem sempre simples).

A noo clssica de probabilidade dum acontecimento, associado a um subconjunto de , a do quociente entre o nmero de resultados que consubstanciam o acontecimento, ditos 'casos favorveis', e o nmero de elementos (o 'cardinal') de (os 'casos possveis', por hiptese equiprovveis). Tal concepo clssica de probabilidade no extensiva a situaes em que os resultados no tenham a mesma probabilidade ou sejam em nmero infinito, claro. Da haver-se introduzido uma concepo frequencista de probabilidade, assimilada ao limite em que tende a estabilizar a frequncia relativa de ocorrncia do acontecimento ao longo duma sucesso numerosa de provas efectuadas em condies similares. Tambm as frequncias relativas somam 1. Mas nem sempre se podem efectuar muitas provas em condies similares (lembrem-se do crude!), nem nada garante que a frequncia relativa de ocorrncia do acontecimento ao longo duma sucesso numerosa de provas estabilize em torno de certo valor (caso em que se diz que h regularidade estatstica).

Tal - e razes tcnicas que seria descabido referir agora conduziu formulao duma noo axiomtica de probabilidade, que a que se ir adoptar. Fixado , prossegue-se definindo uma famlia A de subconjuntos de , designados por acontecimentos. Quando discreto, quase sempre A =

P (). J quando

o usual tomar como famlia dos acontecimentos certo conjunto - o dos borelianos -

R-,

que no coincide com

(), mas inclui os

subconjuntos relevantes de . A famlia A dos acontecimentos possui uma estrutura de -lgebra (ou 'tribo') de subconjuntos de , isto : -A; - A A AC A ; sendo

{An : n }

uma

sucesso

de

acontecimentos,

n An A .

Nessas condies, (,A) chama-se um espao probabilizvel, e diz-se que P uma probabilidade sobre (,A) se P: A [0,1] satisfizer: P() = 1 e, para

{An : n }

sucesso

de

acontecimentos dois a dois disjuntos, P( n An ) = (propriedade de -aditividade). Ento, (,A,P) chama-se espao probabilizado.

n P(An )

Exemplos a) (, , , ...) uma sucesso de acontecimentos dois a dois disjuntos, pelo que, com An = (n), P() =P( n An ) =

n P() [0,1], da

decorrendo que P() = 0 ;

b) Se A,BA, ento (A, B, , , , ...) uma sucesso de acontecimentos e A B = A B ... A. c) Na situao citada em b), se A B = , ento P(A B) =

= P(A)+ P(B) + P() + P() + P() + ... = P(A) + P(B). Esta propriedade, que se generaliza por recorrncia unio de qualquer nmero finito de acontecimentos dois a dois disjuntos,

designada por aditividade. Decorre da -aditividade, mas j recproca no verdadeira.

Diz-se que (,A,P) um

espao probabilizado discreto na

situao seguinte: = {i : i 1} discreto (eventualmente finito),

A = P (), e so dados os valores pi = P({i}) (i 1), no negativos


e tais que i1 pi = 1. Confirme-se que se obtm um espao probabilizado: a) i j {i } {j } = , pelo que P() = P( i1 ) = i

{ }

= i1 pi = 1; b) Seja A = {

ik : k 1} um acontecimento. Ento, a A est


k 1 P i . k

associada certa probabilidade: P(A) =

Consideremos, agora, um caso particular de espao probabilizado discreto: = {1,2,... ,n} e P( {i} ) = p (1 i n). Como P()= n P = n p = n p = 1 , p = 1/n = 1/card(). i=1 i i=1

{ }

Se,

com

k n, A

= i1

, , ... , i i 2 k

P(A)

P i = k 1 p = k p = card ( A) : sendo o espao card () k

finito e os resultados equiprovveis, reencontra-se a noo clssica de probabilidade.

Por vezes, em Teoria das Probabilidades usam-se termos algo distintos dos da Teoria dos Conjuntos. S um caso de frisar: quando o resultado da experincia aleatria em anlise A, diz-se que ocorreu o acontecimento A, ou que este se realizou. Outros exemplos so: - como se realiza sempre, chama-se-lhe acontecimento certo; - nunca se realiza, pelo que se diz acontecimento impossvel;

- A B ( A B), pelo que tambm se diz "a realizao de A implica a de B" ; - sendo , {} chama-se acontecimento elementar ;

- AC tambm designado por acontecimento contrrio de A; - dois acontecimentos disjuntos dizem-se incompatveis, ou mutuamente exclusivos. Exemplos

Estatstica , Estatstica II (2011/12)

Lio 02

Recorde-se

definio

axiomtica

dum

espao

probabilizado (, A ,P):

- (), o espao de resultados, agrupa os resultados a que certa experincia aleatria pode conduzir; - A uma famlia de subconjuntos de , designados por acontecimentos (quando discreto, quase sempre

A = P (); j quando = o usual tomar A = R - sendo R a famlia dos borelianos , que inclui os subconjuntos
relevantes de -.

A famlia A dos acontecimentos possui uma estrutura de -lgebra:

A ; A A AC A; sendo (An : n ) uma sucesso de acontecimentos, n An A. - P: A [0,1] satisfaz P() = 1 e, para (An : n ) sucesso de acontecimentos dois a dois disjuntos,

P( n An ) = n P(An ) (propriedade de -aditividade). Se AB = , P(AB) = P(A) + P(B). Esta propriedade designada por aditividade, e decorre da -aditividade.

Nota Sobre um dado espao probabilizvel (, A) nada impede que se definam vrias probabilidades, P, Q, etc. Mas, para j, vamos concentrar-nos num dado espao probabilizado (, A ,P).

As probabilidades dos acontecimentos que no e tm de ser fixadas por consideraes suplementares definio, embora desta decorram certas regras de compatibilidade entre probabilidades de acontecimentos relacionados entre si.

Por exemplo: Propriedade 1 (A, B A , A B) P(A) P(B).

Prova Se A B, ento B = A (B - A), e A (B - A) = . Pela aditividade e porque P () 0, P(B) = P(A) + P(B - A) P(A), q.e.d.

Notas

a) Como A A A , forosamente

0 P(A) 1, para qualquer acontecimento A.

b) P: A [0,1] uma aplicao, que se no deve confundir, para A A, com o real P(A), no obstante se falar em probabilidade num e noutro caso. Propriedade 2 A, B A P(B - A) = P(B) - P(A B ).

Prova Tem-se sempre B = (A B ) (B - A) e (A B) (B - A)= . Pela aditividade, P(B) = P(A B) + + P(B - A), obtendo-se o resultado pretendido. Corolrio A A P(AC) = 1 - P(A).

Prova AC = - A P(AC) = P() - P(A) = 1 - P(A).

Propriedade 3 A, B A P(AB) = P(A) + P(B) - P(AB ).

Prova Tem-se sempre A B = A (B-A) e A (B-A) = . Pela aditividade, P(A B)= P(A) + P(B - A) = P(A) + P(B) - P(A B ).

Notas a) Se A,B A e AB = , vem P(AB)= P(A)+ P(B).

b) Por recorrncia, obtm-se uma expresso para a probabilidade da unio de qualquer nmero finito de acontecimentos. No importante reter a expresso, que complicada. Mas fcil obter a regra de formao. Sejam A, B, C A . Tem-se P(ABC)= P (A (B C )) = P(A) + P (BC) - P(A(BC))= = P(A) + P(B) + P(C) - P(BC)-P( (AB)(A C) ) = = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) +
+ P A C B C = P(A) + P(B) + P(C) - P(AB) - P(AC)-

((

) (

))

- P(BC) + P(ABC) .

J referi que a -aditividade uma propriedade mais forte que a aditividade: equivale a esta acrescida de

continuidade

montona,

propriedade

que

passo

descrever. Os detalhes da prova, que figura no texto terico, so deixados a vosso cargo. Seja (An : n ) uma sucesso de acontecimentos.

Se n

An An+1, diz-se que a sucesso crescente,

de limite A = n An , usando-se a notao An

A.

Se n

An An+1, a sucesso diz-se decrescente, de

limite B= n An , usando-se a notao An

B.

Como C D CC DC, se (An : n ) uma sucesso


c crescente, ento An : n uma sucesso decrescente.

As sucesses crescentes e as decrescentes dizem-se montonas.

Propriedade 4 Seja (An : n ) uma sucesso montona de acontecimentos, de limite C. Ento, P(An)

P(C).

Passemos, agora, a outra noo. Se A, B A e P(B) > 0, chama-se probabilidade condicional de A dado B a P(A | B) = P A B .

P(B)

P(A | B) corresponde a uma reavaliao da probabilidade de A, face ao conhecimento de que B se realizou.

Por exemplo, considere-se a experincia correspondente ao lanamento de 2 moedas: = { (F,F),(F,C),(C,F),(C;C) }, considerando-se acontecimentos elementares com igual probabilidade. Sejam A = 'sada de 2 caras' = {(F,F)} e

B = 'sada de pelo menos 1 cara' = { (F,F), (F,C), (C,F) }. Nada se sabendo a respeito de B, P(A) = 1/4.

A probabilidade condicional de A dado que B ocorreu dada por P(A | B) = P A B = P( { (F , F ) } ) = 1/ 4 = 1/3. 3/ 4 P( B ) P(B)

Tal corresponde a reavaliar a probabilidade de A tendo em conta um espao de resultados restrito * = B = { (F,F),(F,C),(C,F) },

cujos acontecimentos elementares so

equiprovveis

porque, por hiptese, o so os . Sendo P* a probabilidade considerada nesse espao, P*(A) = P*({(F,F)}) = 1/3.

Fixado B A tal que P(B) > 0,

P*: A [0,1]: A

P(A | B) = P*(A)

uma probabilidade sobre (,A), no sentido da definio axiomtica, propriedades automaticamente como podem comprovar. da as Portanto, as so

decorrentes vlidas para

definio

probabilidades

condicionais. Por exemplo, P(AC | B) = 1 - P(A | B).

Se P(B) > 0, P(A B) = P(B) P(A | B).

Estando definidas as probabilidades condicionais que irei indicar, a expresso anterior generaliza-se interseco de qualquer seguinte:
P k A = P A P A | A P A | A A P A | k 1 Ai . k i = 1 i. i=1 1 2 1 3 1 2

famlia

de

acontecimentos,

do

modo

) ( ) (

) ( (

A prova, que efectuada por induo sobre k, figura no texto.

Por exemplo, extraindo 4 cartas de um baralho de 52, ao acaso e sem reposio,a probabilidade de todas serem de paus dada por
13 12 11 10 . 52 51 50 49

Uma famlia de subconjuntos de dois a dois disjuntos e cuja unio seja chama-se uma partio de . Seja B um acontecimento dado e (An : n 1) uma partio discreta de constituda por acontecimentos de

probabilidade positiva (conhecida a de cada An) e tal que se conheam igualmente todos os valores P( B Nesse caso, pode-se determinar P(B). | An).

De facto, como i j (BAi) (BAj) = (B (AiAj)) = B = , P (B (n1 An ))= P (n1(B An )) =

P(B)

P(B)

= n1P(B An ) = n1P(An ) P B | An .
P( A j ) P( B | A j )

Se P(B) > 0, j 1

P( Aj | B) =

n1 P( An ) P( B | An )

pois o numerador P( B Aj ) e o denominador P(B). Tal expresso designada por frmula de BAYES.

Exemplos

Intuitivamente, A e B so acontecimentos independentes se o facto de se saber que um se realizou no conduzir a reavaliar a probabilidade de ocorrncia do outro. Algo

como P(A | B) = P(A) e P(B | A) = P(B). Mas as

probabilidades condicionais s esto definidas quando a probabilidade do acontecimento dado for positiva. Da que se estabelea a seguinte definio:
A e B so acontecimentos independentes se P(AB) = P(A) P(B).

Se P(A) = 0, como AB A, tem-se 0 P(AB) P(A), e P(AB) = 0 = P(A) P(B) (mesmo que B = A). Portanto, um acontecimento de probabilidade nula independente de qualquer outro. Se P(A) 0 e A e B forem independentes,

P(AB) = P(A) P(B)= P(A) P(B | A), e P(B) = P(B | A).

Se P(B ) 0 e A e B forem independentes, pela mesma razo P(A) = P(A | B), recuperando-se a noo intuitiva acima indicada.

Se A e B forem independentes, tambm A e BC so independentes: P(A BC) = P(A - B) = P(A) - P(A B) = = P(A) - P(A) P(B)= P(A) [1 - P(B)] = P(A) P(BC).

Por outro lado, por simetria, B e A sero independentes, o mesmo acontecendo com B e AC. Ainda, porque nesse caso AC e B so independentes, tambm AC e BC so independentes. Nota Se P(A) = 1, ento P(AC) = 0, sendo AC independente de qualquer outro acontecimento. Resulta do anterior que A , ento, independente de qualquer outro acontecimento (A includo).

Por outro lado, se B for um acontecimento independente de qualquer outro (B includo), ento P(B) = P(B B) =

= P(B) P(B). Ora, [P(B)]2 - P(B) = P(B) [ P(B)-1] = 0

P(B) { 0, 1}.

Se, com I , (Ai : i I) uma famlia indexada de acontecimentos, diz-se que tem elementos independentes se k, k card( I ) i1, i2, ..., ikI, i1, i2, ..., ik distintos,
k A )= k P A . P( i j =1 i j j =1 j

Em particular, A, B e C so independentes se P(AB)= P(A)P(B), P(AC)=P(A)P(C), P(BC)=P(B)P(C) e P(ABC) = P(A)P(B)P(C).

Esta ltima relao no decorre das anteriores, nem as implica.

A expresso P(ABC) = P(A) P(B) P(C), que se aplica quando A, B e C so independentes, mais atractiva do que P(ABC) = P(A) P(B|A) P(C| AB), a qual vlida sempre que as probabilidades condicionais intervenientes estejam definidas. Mas no se deve admitir arbitrariamente a independncia de acontecimentos (a no ser em casos triviais, como o lanamento de 2 dados ou 3 moedas, etc.).

Exemplo

Estatstica , Estatstica II (2011/12)

Lio 03

Retome-se um espao probabilizado (,A,P), e seja X: tal que AR X-1(A)={:X()A} ={XA}A.

Ento, diz-se que X uma varivel real (v.a.r.), e comprovem-no - PX : R [0,1]: A P[X-1(A)] , no sentido axiomtico, uma probabilidade sobre (,R). PX chama-se distribuio ou lei de probabilidade de X. Notas a) Deve ter-se PX() = 1 e, para (An : n ) sucesso de borelianos 2 a 2 disjuntos, PX( n An )= n PX (An ) . Para o verificar, atendam a que a imagem recproca por aplicaes preserva as operaes entre conjuntos.

b) A soma, o produto, a composio, ... de v.a.r. uma v.a.r.

c) Duas v.a.r. X e Y dizem-se independentes se A,B R P ( {XA} {YB} ) = P(XA) P(YB).

A generalizao a famlias indexadas de v.a.r. faz-se como no caso dos acontecimentos.

Prova-se

que

probabilidade

PX sobre

(,R)

caracterizada F:[0,1]: x

pela funo de distribuio (f.d.) F de X, F(x)=PX( ] ,x]

)=P(X ] -

,x]

)= P(X x).

Nota a) R a interseco das -lgebras de subconjuntos de que incluem os intervalos, pelo que ]- ,x] R (x).

Mas no evidente que, se se conhecerem todos os valores F(x), se possa determinar PX(A) (A R).

b) A proposio que segue admite uma recproca, mas no o iremos verificar.

Uma f.d. F (de certa v.a.r. X) possui as seguintes propriedades:

- no decrescente;

- F(-

lim F(x) = 0; x

F( ) =1;

- F contnua direita e tem limite esquerda sobre , isto , a F(a+) =


-

F(x) e F(a ) lim xa;x>a

esto

definidos. Tem-se F(a) = F(a+). J F(a ) = F(a) - P(X = a). Assim, F descontnua em a se e s se P(X = a) > 0.

Demonstre-se a primeira propriedade. Sejam a , b , com a b, e mostre-se que F(a) F(b), ou F(b) - F(a) 0.

F(b) - F(a) = P(X b) - P(X a) = PX(]= PX(] ,b])

,b])

- PX(]-

,a])

- PX(]-

,b]

]-

,a])

= PX(]a,b]) = P(X]a,b]) =

= P(a< X b) 0.

Nota importante reter a expresso sublinhada.


0, se x < 0 .Tem-se P(X > 2) = Exemplo Seja F(x)= 1 e2 x , se x 0

= 1 - P(X 2)= 1 - F(2) = 1 - (1 e -4) = e -4; ou P(X > 2) = = P(2 < X <
)

= F( ) - F(2) = 1 - F(2) = e -4.

Passemos ao ltimo ponto. Seja (xn : n ) uma sucesso de reais crescente para a , com xn < a (n ). Porque tem supremo - 1, ou at F(a) - a sucesso no decrescente

(F ( xn ) : n ) converge.

Nota Se yn : n verifica yn < a (n ) e yn a , ento n


inf y : n m m n

lim inf yn = sup (inf ym ) = a, e n n mn

uma

sucesso no decrescente. Logo, para qualquer sucesso convergindo para a por valores inferiores a a existe uma subsucesso crescente (xn : n ) convergente para a tal que (F ( xn ) : n ) converge. Pela definio - HEINE - de limite ( esquerda), (F ( xn ) : n ) converge para F(a ) se o
-

limite superior correspondente o maior limite duma

subsucesso em tais condies - coincidir com F(a ) (e, visto F ser no decrescente, no pode exceder F(a )).
-

Aps este aparte - , normalmente, matria de Anlise -, reparem que a sucesso de acontecimentos decrescente, de limite n xn , a ={a}.
x , a : n n

Pela continuidade montona das probabilidades,


-

PX( ]xn,a] ) = P( X ]xn,a]) = F(a) - F(xn)

F(a) - F(a ) = n

= PX( {a} ) = P( X {a} ) = P( X = a).

Donde registar-se, como indicado, F(a ) = F(a) - P(X = a).

Nota As outras propriedades demonstram-se de forma similar; vejam o texto terico.

Deriva do exposto que o conjunto dos pontos de descontinuidade de F D = { a : P(X = a) > 0}. Se,
1 < P(X = a) 1 }, ento n +1 n

para n , Dn = { a :

D = n1 Dn . Ora, sejam a1, a2, ..., an+1 elementos distintos de Dn. Ento, P( X Dn ) n+1P X = ai > (n+1) 1 = 1, o i=1 n +1 que impossvel. Portanto, card( Dn ) n. Sendo D uma unio numervel de conjuntos finitos, discreto, ou seja, finito - eventualmente, D = - ou infinito numervel.

Se D = { ai : i 1} e P( X D ) = 1, diz-se que X uma v.a. discreta. Nesse caso, a distribuio de X tambm se pode ser caracterizar pela sua funo de probabilidade elementar (f.p.e.) ai D P( X = ai ) = pi. Tais valores so no negativos e de soma 1, j que i1 pi = P( X D) .

Nota Se ai D, P( X = ai ) > 0. Mas, por comodidade de notao, ocorre indicarem-se alguns pi nulos, associados a valores que no so elementos de D.

fcil ver que a f.p.e. duma v.a. discreta X se pode obter a partir da correspondente f.d. F : os ai so os pontos de descontinuidade de F e, para cada ai,
-

pi = P( X = ai ) = F( ai ) - F( ai ).

Por outro lado, tambm se constata que, a partir da f.p.e., se determina F : x F(x) = aD;a x P( X = a) ,

entendendo-se a soma nula se {a D: a x} = . Em suma, se D = {ai : i 1 } com a1 < a2 < ..., ento

0, se x < a 1 p , se a x < a 1 1 2 . F(x)= p + p , se a x < a 2 2 3 1 .........

Se

card(D)

k,

vem

F(x)=

0, se x < a 1 p , se a x < a 1 1 2 p + p , se a x < a . 1 2 2 3 ......... 1, se x a k

Se D = e f : [0, [ tal que A R P(X A) = f ( x)dx , X diz-se uma v.a. contnua com funo A de densidade de probabilidade (d.p.) f. Notas a) Intuitivamente, f(x) = lim P(x x X x + x ) . 2 x x0
b) f ( x)dx = P(X ) = P( ) = 1.

f.d.

determina-se,
,

neste

caso,

partir

de

F(x) = P(X x) = P(X ] -

x x )]) = f (u)du . E resulta

que F uma primitiva de f (a que se anula quando o argumento tende para - ). Donde: F ' (x) = f(x), onde a derivada esteja definida.

Notas a) Em geral, lidaremos com casos em que F ' est definida em praticamente todos os pontos. Onde F ' (x) no esteja definida, pode-se tomar f(x) = 0. b) Sendo X uma v.a. contnua de d.p. f, a
a P(X = a) = a f ( x)dx = 0, e D = { a : P(X = a) > 0} = ,

de facto.

0, se x < 0 Exemplo Seja F(x)= , como acima. Ento, 1 e2 x , se x 0

F ' (0) no est definida, podendo tomar-se, por exemplo, f(x) =


0, se x 0 2 e2 x , se x > 0

ou

g (x) =

0, se x < 0 . Tem-se 2 e2 x , se x 0

0 1 P(1 < X < 1) = 11 f ( x)dx = 1 f ( x)dx + 0 f ( x)d x = 0 0dx + 1 2 e 2 x d x = 0 0dx + 02dx + 1 2 e2 x dx = 1 g ( x)dx = = 1 1 1 0 0 0 1 = e 2 x = 1 e2 = F (1) F (1) . 0

Tal como em relao s distribuices de frequncias, so utilizados certos parmetros para caracterizar aspectos como a localizao, a disperso, a assimetria e o achatamento de distribuies probabilistas.

S referirei os mais usuais. Quase todos so quantis ou momentos. Enquanto em Estatstica Descritiva tais

parmetros so representados por letras latinas, em

Estatstica Matemtica usam-se letras gregas (tm a ver com a populao, , e no com a amostra particular com que se lide). Alm disso, aqui as definies so mais genricas.

Sendo p]0,1[ e F a f.d. de X, chama-se quantil de ordem p da distribuio um valor p tal que F(p ) p e F(p) p. Nem todos os valores de p so empregues com frequncia. Os quantis mais frequentemente referidos so: - a mediana, o.5 , empregue para caracterizar a localizao da distribuio;
-

0.75

0.25

os

terceiro

primeiro

quartis,

respectivamente. = 0.75 - 0.25 designa-se por amplitude inter-quartis, e empregue para caracterizar a disperso.

Corresponde amplitude dum intervalo (fechado) que inclui a mediana e onde X toma valores com probabilidade no inferior a 50% ; - os decis, 0.1 , 0.2 , ..., 0.9 ; os percentis, 0.01 , ..., 0.99 . Diferenas como 0.95 - 0.05 ou 0.9 - 0.1 , etc., podem desempenhar papel anlogo ao da amplitude inter-quartis.

Seja F a f.d. duma v.a. X , D = { descontinuidades de F} quando X for discreta -, A R e g: . Usarei a notao:
a A D g (ai ) P( X = ai ), se X for discreta i e D = a : i 1 g ( x)dF ( x) = i A g ( x ) f(x)dx, se X for contnua, de d.p. f A

Chama-se

esperana

(matemtica)

de

g(X)

real

E[g(X)]= g ( x)dF ( x) ,quando | g ( x) | dF ( x) =E[|g(X)|]<.

A exigncia de convergncia absoluta, relevante s quando se lide com sries e integrais imprprios, naturalmente, visa assegurar por exemplo, pela

comutatividade e associatividade dos termos duma srie - a linearidade do operador esperana: estando ambos os membros definidos,

, E[ f(X) + g(X) ] = E[ f(X) ] + E[ g(X) ].

Notas a) A dF ( x) = A1 dF ( x) = P(X A);

b) No se especificando A, subentende-se que coincide com o espao (para j, );

c) dF (x) = dF (x) = P(X ) = P( ) = 1 = E(1).

Vamos convencionar que E( Y0) = 1, para qualquer v.a. Y.

Chama-se momento (resp. momento absoluto) de ordem k > 0 (da lei) de X em relao a uma constante d a E[ (X d ) k ] (resp. E[ |(X d )| k ] ).

Restringir-me-ei quase sempre a valores inteiros de k.

Se d = 0, fala-se em momentos (em relao origem): E(Xk) = k. Os mais usados so o primeiro momento, E(X), frequentemente representado por e designado por valor esperado ou mdia de X, e o segundo momento E(X2). A mdia o valor a que com mais frequncia se recorre para caracterizar a localizao. Com d = obtm-se os momentos centrais, ou centrados, k = E[ (X - ) k ] .
'

O primeiro nulo:

E( X - ) = E(X) - E(1) = - dF (x) = - = 0.

O segundo momento central designado por varincia, e tambm se representa por V(X), var(X), 2, ... .

usual calcular-se pela frmula de KNIG:

2 = E[ (X - )2 ] = E(X2) - 2 E(X) + 2= E(X2) - 2 2 + 2 =


= E(X2) - [ E(X) ]2 .

E[ (X - )2 ] 0, pelo que = 2 est definido quando a varincia o estiver. chama-se desvio padro, e medida de disperso a que mais usualmente se recorre. a

Estatstica , Estatstica II (2011/12) Lio 04 Nota Para completar o que referi a respeito de independncia de v.a., importa mencionar que, se X e Y forem independentes, e f: e g: , ento f(X) e g(Y) so v.a. independentes.

H certas propriedades que importa reter, porquanto permitem obter conhecimento sobre as distribuies apenas a partir dos momentos. A primeira que indicarei a

Desigualdade de MARKOV Seja : [0,[ tal que E[(X)] esteja definida. Ento, c > 0 P[ (X) c ]

E [( X )] . c

Prova Mostre-se que E[ (X) ] c . P [(X) c ].

E[ (X) ] = (x ) dF (x ) = (x )c (x ) dF (x ) + (x )<c (x ) dF (x ) c (x )c dF (x ) = c . P [(X) c ]. Corolrio 1 Se X 0 e E(X) estiver definida, ento c>0 P [X c ] E( X ) / c.

Corolrio 2 Se E(X) estiver definida, ento c > 0 P [ | X | c ] E( | X | ) / c. Corolrio 3 Se E(X ) estiver definida, ento c > 0 P [ | X | c ] E( | X |k ) / ck. Desigualdade de BIENAYM-TCHEBICHEV Seja X uma v.a. de esperana e desvio padro > 0. Ento, t > 0 P [ |X - | t. ] 1 / t2.
E | X |2

Prova P [ |X - | t ]

t 2 2

2 = 1 . = t 2 2 t 2

3 Observaes a) Se, para > 0, X: 1 18

0 3 16 1 , ento 18 18

9 2 + 9 2 = , e P( | X | 3. ) = E(X) = 0, X= V (X ) = 18 18

= 1 + 1 = 1 , o que mostra que, com toda a generalidade, a 18 18 32 desigualdade no pode ser melhorada. b) A desigualdade s tem interesse se t > 1; se t 1 o resultado trivial: uma probabilidade no pode exceder 1. c) Resulta que a diferena, em valor absoluto, entre qualquer v.a. X e a sua mdia, no pode exceder dois desvios padres com probabilidade superior a 1/4, trs desvios padres com

probabilidade superior a 1/9, etc. Isso justifica que a mdia e o desvio padro sejam, respectivamente, os parmetros a que mais frequentemente se recorre para caracterizar a localizao e a disperso de distribuies. Naturalmente que se deve recorrer a parmetros alternativos quando a mdia no esteja definida (caso em que,

automaticamente, tambm o desvio padro no est definido,

como veremos), ou quando a mdia seja muito influenciada pelos ditos valores aberrantes, excessivamente diminutos ou

excessivamente elevados em relao aos mais frequentes. Ento, costuma-se recorrer a quantis.

Uma v.a. de mdia nula diz-se centrada. Se E(X) = , ento X - uma v.a. centrada. Uma v.a. de desvio padro unitrio diz-se reduzida. Se X tiver desvio padro > 0, ento
2 X 2 ) - [E(X/)]2 = E ( X 2 ) [E ( X )] = 1, V( X/ ) = E ( 2 2 2

e X/ uma v.a. reduzida. Nas condies indicadas, Y =


X

chama-se v.a. centrada e

reduzida (ou padro, ou padronizada) associada a X, j que E(Y)=


2 1 E ( X ) 2 = = 1 . = 1/ E(X - ) = 0 e V(Y) = E(Y ) = 2 2
. 2

Se a localizao se caracterizar pela mdia e a disperso pelo desvio padro, ento por a as v.a. padro no se distinguem. Os seus momentos de ordem superior a 2 podem ser utilizados para analisar outras caracterstica das distribuies.
X k ) ] = 1 E (X )k = k . k k

Ora, E [ (

3 utiliza-se para caracterizar a assimetria. 3

4 utiliza-se para caracterizar o achatamento. 4

NOTA

Deixo ao vosso cuidado a leitura, no texto do curso,

dos resultados seguintes: a) Se 0 < p < q e E( X definida. b) (Desigualdade de CAUCHY-SCHWARZ) Existindo E(X2) e E(Y2), | E(X.Y) | ( E( | X.Y | ) E ( X 2 ) E (Y 2 ) .
q

) estiver definida, ento E( X

) est

d Observao Uma constante d assimilada v.a. discreta d: . 1

Uma propriedade vlida com probabilidade 1 tambm se diz vlida quase-certamente (q.c.). A observao vale por dizer que as v.a. constantes q.c. se designam por constantes, em termos probabilistas.

Resulta do exposto que, entre os momentos, a esperana matemtica e o desvio padro assumem relevo particular, importando sublinhar algumas das suas propriedades.

Propriedades da esperana matemtica Sejam X e Y v.a. com

esperana matemtica e k uma constante. Ento: a) E(X + Y) = E(X) + E(Y); b) Se X e Y forem independentes, E (X.Y) = E(X).E(Y);
NOTA Se E (X.Y) = E(X).E(Y), ento X e Y dizem-se no

correlacionadas. Pode acontecer que X e Y sejam no

correlacionadas

mas

no

sejam

independentes.

v.a.

independentes que possuam esperana so automaticamente no correlacionadas. cov(X,Y) = E{ [X - E(X)]. [Y - E(Y)] } chama-se covarincia entre X e Y. Desenvolvendo o produto e utilizando a linearidade da esperana, cov(X,Y) = E(X.Y) - E(X). E(Y) - E(Y). E(X) + + E(X).E(Y) = E (X.Y) - E(X).E(Y). Assim, X e Y so no correlacionadas se e s se cov(X,Y) = 0. c) E(k) = k ; d) E(X + k) = E(X) + k ; e) E(k X) = k E(X) . A prova das duas primeiras propriedades deve ser precedida de consideraes sobre o comportamento probabilista conjunto de X e Y. J as ltimas so consequncias directas da definio. Por exemplo: E(k X) = k x dF ( x) = k x dF ( x) = k E(X).

Propriedades da varincia (e do desvio padro) Sejam X e Y

v.a. com varincia e k constante. Ento: a) V(X + k) = V(X) ( e X+k = X); b) V(k.X) = k .V(X) ( e k X = | k |.X); c) V(X) = 0 se e s se d : P (X = d) = 1 (e X = 0 X q.c. constante); d) k E[(X - k)2] V(X) (ou: "a varincia o menor dos
2

desvios quadrticos mdios" - pois V(X) = E[ (X - )2 ] um desvio quadrtico mdio particular); e) Sendo X e Y no correlacionadas, V(X+Y) = V(X) + V(Y).

As propriedades do desvio padro decorrem directamente das da varincia.

a) e b) tm a ver directamente com a definio. Por exemplo, V(k.X) = E{ [k X - E (k X)]2} = E{ [k X - k E(X)]2} = = k2 E{ [ X - E(X)]2} = k2 V(X). bvio que se X = k q.c., ento V(X) = E{ [k - E(k)]2} = = E(0) = 0. A recproca no to evidente. Queiram ler a demonstrao, no texto. A prova de d) apenas envolve um artifcio simples: E[(X - k)2] = E{ [ (X - ) +(- k)] 2} = E[ (X - )2] + ( - k)2 + + 2. ( - k). E (X - ) = V(X) + ( - k)2 V(X). e) tem a ver com o facto antes referido de que X e Y so no correlacionadas se e s se cov(X,Y) = 0, onde

cov(X,Y) = E{ [X - E(X)]. [Y - E(Y)] } = E (X.Y) - E(X).E(Y). Vem V(X + Y) = E{ [ (X + Y) - E(X + Y)] 2} = E ({[(X - E(X)] + + [Y - E(Y)] }2) = E{[X - E(X)]2} + E{[Y - E(Y)]2} + + 2E{[X - E(X)]. [Y - E(Y)]} = V(X) + V(Y) + 2cov(X,Y) = =V(X) + V(Y) .

Para os efeitos deste curso, a funo geradora de momentos (f.g.m.) de X X: t E( et X ), sempre que definida numa

vizinhana da origem 0 de . claro que, se FX = FY , ento

X(t) = etx dF (x ) = et y dF ( y ) = Y(t) . Mas prova-se que, X Y


estando definidas X e Y e forem iguais, ento tambm FX = FY , isto , X e Y tm a mesma distribuio.

Podem existir os momentos e no estar definida a f.g.m. Mas, como natural, h certa relao entre os momentos e a f.g.m. Sob condies de regularidade,
d r (t ) = d r etx dF (x ) = d r etx dF (x ) = x r etx dF (x ) , dt r dt r dt r

d r (0) = x r dF (x ) = E ( X r ) = ' . vindo r r dt

Exemplos '(0)= E(X); V(X)= E(X2) - [E(X)]2= ''(0) - ['(0)]2.

Importa reter as propriedades seguintes.

Lema 1 Se a, b e Y = a X+ b, ento Y(t) = e Prova Y(t) = E(e


tY t (a X+ b )

tb

X(a t) .

) = E[e

] = E(e

tb+atX

)=

= E(e

tb

eatX ) = e tb E[ e(at) X ] = e tb X(a t).

Lema 2 Se X e Y forem independentes, X+Y(t) = X(t) Y(t). Prova X+Y(t) = E[ et


(X+Y)

] = E[ e

t X + t Y

] = E(e

t X .

t Y

)=

= E( e t X) .E(e t Y) = X(t). Y(t) .


NOTA Por induo, a expresso generaliza-se a qualquer nmero

finito de parcelas independentes.

Passemos a outro tema: o das transformaes de v.a.r. Seja A . 1A representar a funo indicatriz de A : 1A()=
1, se A . 0, se A

Sendo (,A,P) um espao probabilizado, se A A, ento 1A uma v.a.r. Convencione-se que 0 x (...) = (...) x 0 = 0, mesmo que (...) = . Sejam (,A,P) um espao probabilizado e X uma v.a. definida sobre o mesmo, de f.d. F, : . Podemos querer averiguar qual a relao entre a distribuio de X e a de Y = (X). Seja X discreta e D = ai : i 1 o conjunto discreto dos pontos de descontinuidade de F. Sendo uma aplicao, a cada real ai corresponde um s real (ai), e o conjunto D*= ai : i 1

discreto. Como P(Y D*) = 1, Y uma v.a. discreta, podendo a sua distribuio caracterizar-se pela correspondente f.p.e., y D* P(Y = y) = a D : a = y P( X = a ) . i i i Assim, em termos tericos fcil lidar com transformaes de v.a. discretas.

J se X for uma v.a. contnua com certa d.p., f, no garantido que Y = (X) tambm possua uma d.p. Por exemplo, Y = [ X ] ("parte inteira de X", ou "maior inteiro no excedendo X"), ento Y uma v.a. discreta. Representando G a f.d. de Y, G(y) = P(Y y) = P[(X) y] = P[ X -1( ] -,y]) ], o que pode ou no ser fcil de determinar a partir de F. Se satisfizer certas condies, conclui-se que Y possui uma d.p., g, e podemos analisar a relao entre f e g.

Por exemplo, se x

'(x) > 0, ento estritamente

crescente, logo injectiva, e de contradomnio () = ],[, onde =


lim ( x) = (-) e = (). Encarada como funo com x

valores em ],[, invertvel, e ( -1)' (x) > 0 sobre ],[. Da resulta ser

G( y) = P(Y y) = P[ (X ) y ]

1, se y -1 d 1 Como x = (y), ocorrer pr dx em vez de . dy dy

= P X

0, se y 1( y ) = F 1( y ) = F 1 ( y ), se < y

Pela regra da cadeia da derivao,


1 d ( y ) dy

g ( y) = 1

] , [( y) f

( y ).

Outra situao aquela em que x '(x) < 0. Vejamos o que se alteraria, em relao ao caso anterior. Aqui, injectiva porque estritamente decrescente. Tem-se, com =

= lim ( x) = () e = (-), () = ],[ como x contradomnio. Encarada como funo com valores em ],[, invertvel, e (
-1

)' (x) < 0 sobre ],[. Da resulta ser


= P X

G( y) = P(Y y) = P[ (X ) y ]

0, se y 1( y ) = 1 F 1( y ) = 1 F 1 ( y ), se

1, se y

Pela regra da cadeia da derivao,

g ( y) =1

] , [( y) f

1 ( y )

d 1 ( y ) . dy

1 1 Como, aqui, ( -1)' (x) < 0 sobre ],[, d ( y ) = | d ( y ) | , e dy dy

os dois casos referidos podem, com ],[ = (), sintetizar-se pela expresso
1 ( y )

g ( y) = 1

] , [( y) f

d 1 ( y )| | dy

Se f s se no anular sobre ]a,b[, ento em vez de considera-se a sua restrio a ]a,b[, anterior, com ],[ = ( ]a,b[ ). Se ' apenas variar de sinal um nmero finito de vezes,

| a,b

, e a expresso similar

| a,b

cindimos em ramos de monotonia, acha-se uma expresso como a anterior para cada um deles, e somam-se as expresses obtidas.

Se f tiver expresses distintas sobre subconjuntos de ]a,b[, necessrio preocuparmo-nos com as diferentes expresses de x em termos de y (que intervm em f 1( y ) ).

Exemplos

Anda mungkin juga menyukai