Anda di halaman 1dari 259

Instituto Politcnico de Leiria Escola Superior de Tecnologia e Gesto

Apontamentos Tericos de Estatstica

Rui Filipe Vargas de Sousa Santos Departamento de Matemtica


2004

O presente trabalho um texto provisrio e tem como objectivo auxiliar os alunos na disciplina de Estatstica.

1
1.1

Probabilidades
Introduo

A Teoria das Probabilidades teve origem nos chamados jogos de azar, por volta do sculo XV II, com Chevalier, Fermat e Pascal. Entretanto outros matemticos se interessaram pela Teoria das Probabilidades, tais como Bernoulli (1654 1705), que introduziu a base matemtica da teoria, estabelecendo a relao entre probabilidade e frequncia relativa. Laplace (1749 1827) introduziu o conceito clssico de probabilidade e Gauss (1777 1855) alargou o campo da aplicao do clculo de probabilidades a outras cincias tais como a psicologia, a astronomia, a economia, a administrao de empresas, entre outras. Na segunda metade do sculo XIX a Teoria das Probabilidades atingiu um dos seus momentos mais altos com os trabalhos da escola russa fundada por Tchebyche (1821 1894), que contou com representantes como Markov (1856 1922) e Lyapunov (1857 1918) e teve o principal expoente em Kolmogorov, a quem se deve um estudo indispensvel sobre os fundamentos da Teoria das Probabilidades publicado em 1933 e traduzido em 1950 para ingls sob o ttulo de Foundations of Probability.

Noes bsicas
A Teoria das Probabilidades tem como objectivo formular modelos de fenmenos naturais onde se supe intervir o acaso, ou seja, de fenmenos cujo futuro no pode ser previsto deterministicamente apesar das informaes sobre o seu passado, mas para os quais se podem encontrar, sob certas condies, taxas de realizao constantes que permitem certas previses de ndole geral. Estes fenmenos dizem-se fenmenos aleatrios, isto , so fenmenos sujeitos inuncia do acaso e, como tal, fora do alcance do observador. Exemplos 1.1.1 Ao atirar uma moeda ao ar no se sabe se vai sair cara ou coroa. Ao lanar um dado no se sabe qual das faces car voltada para cima. Ao tirar uma carta de um baralho no se sabe qual a carta que ir sair. 1

Ao jogar no totoloto no se sabe quais os nmeros que iro sair. Em cada um dos exemplos dados no possvel saber a priori o resultado que se ir obter. Os fenmenos aleatrios so caracterizados: pela sua imprevisibilidade (fenmeno no determinstico), pela sua regularidade estatstica (observando o fenmeno um grande nmero de vezes, nas mesmas condies, a frequncia relativa de cada resultado possvel do fenmeno tende a estabilizar, aproximando-se dum valor constante). Sendo assim, num fenmeno aleatrio no se pode prever o resultado da prxima prova, mas pode-se fazer uma previso do resultado em mdia; dene-se, ento, experincia aleatria como sendo todo o procedimento que se pode repetir um grande nmero de vezes nas mesmas condies e cujo resultado imprevisvel. Teoria das Probabilidades no interessa estudar fenmenos cujos resultados podem ser estabelecidos por leis expressas por frmulas matemticas ou da fsica. Exemplos 1.1.2 Deixar cair uma pedra do cimo de uma torre e medir o tempo que demora a atingir o solo. Suspender uma agulha magntica e registar a direco indicada por ela. Friccionar dois vidros e vericar se eles se repelem. Estes fenmenos chamam-se fenmenos deterministas, sendo as experincias deterministas ou causais caracterizadas por produzirem o mesmo resultado, desde que sejam repetidas sob as mesmas condies. Contudo, apesar de no ser possvel prever com exactido o resultado de uma experincia aleatria, podem-se identicar quais so os resultados que podem ocorrer nessa experincia aleatria. Assim, chama-se universo, espao amostral ou espao de resultados, representado-se por = { 1 , 2 , 3 , ..., n }, ao conjunto formado por todos os resultados (i ) que possvel obter quando se efectua uma experincia aleatria. 2

Exemplo 1.1.3 Lanamento de um dado e registo do nmero de pontos que sai, tem-se = {1, 2, 3, 4, 5, 6}. Lanamento de uma moeda e a observao da face que ca voltada para cima tem-se = {F, C}. Lanamento de duas moedas = {F F, F C, CF, CC}. Tempo de trabalho de uma mquina at primeira avaria, vem = R+ . 0 A qualquer subconjunto do espao amostral chama-se acontecimento aleatrio. Note-se que, como qualquer conjunto subconjunto de si prprio, tem-se que tambm um acontecimento. Os acontecimentos podem ser divididos em quatro categorias: i) Acontecimentos elementares - cada um dos resultados possveis da experincia aleatria, ou seja, cada elemento de ; ii) Acontecimentos compostos - acontecimentos formados por dois ou mais elementos do espao amostral; iii) Acontecimento certo - espao de resultados (); iv) Acontecimento impossvel - acontecimento que no contm nenhum elemento do espao amostral, sendo representado por ou {}. Exemplo 1.1.4 No lanamento de duas moedas = {F F, F C, CF, CC} h: 4 acontecimentos elementares {F F }, {F C}, {CF }, {CC}; 11 acontecimentos compostos {F F, F C}, {F F, CF }, {F F, CC}, {F C, CF }, {F C, CC}, {CF, CC}, {F F, F C, CF }, {F F, F C, CC}, {F F, CF, CC}, {F C, CF, CC}, ; 1 acontecimento certo = {F F, F C, CF, CC}; 3

1 acontecimento impossvel ou {}. Diz-se que um acontecimento A, A , se realiza quando o resultado um elemento que pertence a A : A, isto , um acontecimento realiza-se se e s se o resultado da experincia aleatria pertence a esse acontecimento. Exemplo 1.1.5 Seja = {1, 2, 3, 4, 5, 6} o espao amostral associado ao lanamento de um dado e considerem-se os seguintes subconjuntos (acontecimentos): A = {1, 2, 3}; B = {2, 4, 6}; C = {4}

Se no lanamento sair o nmero 4, diz-se que os acontecimentos B e C se realizaram, enquanto que o acontecimento A no se realizou. Se no lanamento do dado sair 5, signica que nenhum dos acontecimentos se realizou. Atravs da denio de acontecimento verica-se que h uma equivalncia entre a noo de acontecimento e a noo de conjunto. Tem-se ento um paralelismo entre as propriedades de conjuntos e as propriedades de acontecimentos. Considerem-se as principais propriedades dos acontecimentos.

Propriedades dos acontecimentos


Denio 1.1.1 (Interseco de acontecimentos) Interseco dos acontecimentos A e B o acontecimento A B que se realiza apenas quando ambos os acontecimentos se realizam e formado pelos elementos comuns a A e a B. Com o intuito de facilitar a exposio, supe-se equivalente a um rectngulo de R2 onde os acontecimentos so representados por subconjuntos convenientes do mesmo rectngulo. Assim, os conhecidos diagramas de Venn, representam-se da seguinte forma:

Figura 1: Interseco de acontecimentos: A B

Propriedades 1.1.1 (Propriedades da interseco) i) ii) Comutatividade Associatividade AB =BA A (B C) = (A B) C A=A AA=A

iii) Elemento neutro iv) v)

Elemento absorvente A = Idempotncia

Denio 1.1.2 (Unio de Acontecimentos) Dados os acontecimentos A e B chama-se unio de A com B ao acontecimento que consiste na realizao de pelo menos um deles, sendo constitudo por todos os elementos de A e todos os de B e representado por A B. Figura 2: Unio de acontecimentos: A B

Propriedades 1.1.2 (Propriedades da unio) i) ii) Comutatividade Associatividade AB =BA A (B C) = (A B) C A=A AA=A

iii) Elemento neutro iv) v)

Elemento absorvente A = Idempotncia

Alm das propriedades da interseco e da unio j referidas, existe ainda a salientar a propriedade distributiva. Propriedade 1.1.3 (Distributividade)

A (B C) = (A B) (A C) A (B C) = (A B) (A C) Denio 1.1.3 (Acontecimento complementar) Dado um acontecimento A, chama-se acontecimento complementar de A ou acontecimento contrrio a A ao conjunto de todos os elementos do espao amostral () que no pertencem a A, representando-se por A ou AC . Ou seja, A e A dizem-se acontecimentos complementares no caso de A se realizar sse (sse l-se se e s se e representa uma equivalncia) A no se realizar. Figura 3: A - acontecimento complementar de A

Propriedades 1.1.4 (Propriedades dos acontecimentos complementares) i) ii) AA= AA= AB =AB iv) Dupla negao A=A

iii) Leis de De Morgan A B = A B

Denio 1.1.4 (Subacontecimento) Diz-se que A um subacontecimento de B e escreve-se A B, quando a realizao de A implica a realizao de B, ou seja, quando todos os elementos de A so elementos de B. Figura 4: A subacontecimento de B, A B

Propriedades 1.1.5 No caso de A B tem-se i) AB =A

ii) A B = B Denio 1.1.5 (Acontecimentos idnticos) A e B so acontecimentos idnticos quando A B e B A, isto , quando a realizao de um implica a realizao do outro e escreve-se A = B.

Denio 1.1.6 (Acontecimentos incompatveis) Os acontecimentos A e B dizem-se incompatveis ou mutuamente exclusivos quando a realizao de um implica a no realizao do outro, isto , quando A B = sendo o acontecimento impossvel (no existe nenhum elemento comum aos acontecimentos A e B). Figura 5: Acontecimentos A e B incompatveis, A B =

Denio 1.1.7 (Diferena de acontecimentos) Chama-se diferena dos acontecimentos A e B ao acontecimento A\B = A B, ou seja, ao acontecimento que se realiza quando A se realiza sem que B se realize. Figura 6: Diferena de acontecimentos: A\B = A B

Exemplo 1.1.6 Seja = {1, 2, 3, 4, 5, 6} o espao amostral associado ao lanamento de um dado e considere-se os seguintes acontecimentos: A = {1, 2, 3} A = {4, 5, 6}; B = {1, 3, 5}; A A = {1, 2, 3} {4, 5, 6} = ; A A = {1, 2, 3} {4, 5, 6} = ; A B = {1, 2, 3} {2, 4, 6} = {1, 2, 3, 4, 6}; A B = {1, 2, 3} {2, 4, 6} = {2}; A\B = {1, 2, 3}\{2, 4, 6} = {1, 3} ou A\B = A B = {1, 2, 3} {1, 3, 5} = {1, 3}; B\A = {2, 4, 6}\{1, 2, 3} = {4, 6} ou B\A = B A = {2, 4, 6} {4, 5, 6} = {4, 6}; A B = {4, 5, 6} {1, 3, 5} = {5} ou A B = A B = {1, 2, 3, 4, 6} = {5}; A B = {4, 5, 6} {1, 3, 5} = {1, 3, 4, 5, 6} ou A B = A B = {2} = {1, 3, 4, 5, 6}. e B = {2, 4, 6}

1.2

Denio de Probabilidade

Intuitivamente, a noo de probabilidade de um acontecimento uma medida da possibilidade de ocorrncia do acontecimento quando se realiza a experincia aleatria qual o acontecimento est ligado. 1.2.1 Denio clssica de probabilidade

A primeira denio de probabilidade conhecida foi sintetizada por Laplace no princpio do sculo XIX, sob as hipteses de casos igualmente provveis ou possveis, tambm conhecido por princpio de simetria, e de existncia de um nmero nito de casos possveis. A denio de Laplace dizia o seguinte: Denio 1.2.1 (Clssica de Probabilidades) A probabilidade de realizao de um dado acontecimento igual ao quociente entre o nmero de casos favorveis realizao desse acontecimento e o nmero total de casos possveis, desde que todos os acontecimentos sejam igualmente provveis e o nmero total de casos possveis seja nito. Representando-se por P(A) a probabilidade de um acontecimento A, ento, na denio clssica de probabilidade, tem-se: nmero de casos favorveis ao acontecimento A . nmero de casos possveis

P(A) = Exemplo 1.2.1

(1)

Voltando ao exemplo do lanamento de um dado, onde = {1, 2, 3, 4, 5, 6} o espao amostral associado que contm 6 resultados possveis, vai-se calcular a probabilidade dos seguintes acontecimentos: P(sada de cinco pontos) = P ({5}) = 1 (pois s tem um caso favorvel); 6

10

P(sada de um nmero par) = P ({2, 4, 6}) =

3 (pois tem trs casos favorveis); 6 5 (pois tem cinco 6

P(sada de um nmero superior a um) = P ({2, 3, 4, 5, 6}) = casos favorveis).

No entanto, nem todas as probabilidades so to fceis de calcular como no exemplo apresentado, tendo-se, em muitos casos, que recorrer analise combinatria.

Revises de anlise combinatria


Denio 1.2.2 (Permutaes sem repetio) Permutaes sem repetio - Nmero de sequncias que possvel formar com n elementos distintos. n! = n (n 1) 2 1, sendo 0! = 1. (2)

Denio 1.2.3 (Permutaes com repetio) Permutaes com repetio - Nmero de sequncias que possvel formar com n elementos, dos quais n1 so do tipo um, n2 so do tipo dois, , e nk so do tipo k, vericando-se n1 + n2 + ... + nk = n. n! . n1 ! n2 ! nk ! (3)

Exemplos 1.2.2 De quantas maneiras diferentes possvel ordenar as letras da palavra permuta? Considerando que a palavra permuta constituda por sete letras diferentes, o nmero de ordenaes das letras desta palavra 7! = 5040.

11

De quantas maneiras diferentes possvel ordenar as letras da palavra caractersticas? Considerando que a palavra caractersticas constituda por quinze letras, entre as quais se tm trs c, trs a, dois r, dois t, um e, dois i e dois s, ento o nmero de ordenaes das letras desta palavra determinado por 15! = 2270268000. 3!3!2!2!1!2!2!

Denio 1.2.4 (Arranjos com repetio) Arranjos com repetio - Nmero de sequncias de k elementos que possvel formar de um grupo de n elementos distintos.
n

A0k = nk .

(4)

Exemplo 1.2.3 Quantos nmeros de vinte algarismos se podem escrever utilizando os dgitos 1 e 0? O que se pretende determinar o nmero de sequncias de vinte algarismos que podem ser formadas utilizando os dgitos 1 e 0 (podendo-se repetir o mesmo dgito). Assim, a resposta determinada por
n

A0k = 2 A020 = 220 = 1 048 576.

Denio 1.2.5 (Arranjos sem repetio) Arranjos sem repetio - Nmero de sequncias de k elementos diferentes que possvel formar de um grupo de n elementos distintos (k n).
n

Ak =

n! . (n k)! 12

(5)

Exemplo 1.2.4 Numa corrida participam dez concorrentes. Considerando que trs vo receber medalhas (ouro, prata e bronze), de quantas maneiras diferentes se podem distribuir pelo pdio os dez concorrentes? O pretendido calcular o nmero de sequncias de trs corredores que podem ser formadas, sem repetir o mesmo corredor, de entre os dez participantes. Assim, a resposta determinada por
n

Ak =

10

A3 =

10! 10 9 8 7! = = 10 9 8 = 720. (10 3)! 7!

Denio 1.2.6 (Combinaes sem repetio) Combinaes sem repetio - Nmero de conjuntos de k elementos diferentes que possvel formar de um grupo de n elementos distintos (k n). n n! n . Ck = = (n k)!k ! k

(6)

Exemplo 1.2.5 Numa reunio foi decidido escolher, de entre os trinta indivduos que nela participavam, um grupo de dez para efectuar determinado trabalho. Quantos grupos diferentes possvel formar? O que pretendido determinar, neste exemplo, o nmero de conjuntos (pois no interessa a ordem com que so escolhidos, mas unicamente quais so os elementos que constituem o grupo de trabalho) de dez indivduos que possvel formar utilizando os trinta indivduos presentes na reunio (sem repetio pois um indivduo no pode ser escolhido duas vezes). Assim, o nmero de grupos diferentes que possvel formar determinado por
30

C10

30 30! = 30 045 015. = = (30 10)!10! 10 13

Saliente-se que, quando so utilizados arranjos, est-se a calcular o nmero de sequncias, onde a ordem dos elementos tem inuncia no agrupamento, e, quando so utilizadas combinaes, est-se a calcular o nmero de conjuntos, onde a ordem dos elementos no tem inuncia. Assim, pode-se resumir o que foi descrito para os arranjos e para as combinaes atravs do seguinte quadro: Quadro 1: Resumo de anlise combinatria Sem repetio (k n) n! n 0 n Ak = nk Ak = (n k)! n+k1 n+k1 n Ck = Ck = n k k Com repetio

Interessa a ordem No interessa a ordem

A interpretao clssica de Laplace manteve-se at ao incio deste sculo quando comearam a surgir crticas, quer no que diz respeito ao clculo de probabilidades onde o princpio da simetria no vericado, quer em situaes em que o nmero de casos possveis no nito nem sequer numervel. Apesar de todas as crticas, so ainda muitos os exemplos em que h simetria e o nmero de casos possveis nito, pelo que continua a ser possvel aplicar esta teoria.

14

1.2.2

Denio frequencista de probabilidade

A regularidade estatstica dos fenmenos aleatrios fez surgir uma outra teoria, a teoria frequencista das probabilidades. Esta teoria surgiu no incio do sculo XX (tendo como autores Venn, Von Mises, Reichenbach, Salmon, entre outros) e, segundo ela, a probabilidade de um acontecimento pode ser determinada observando a frequncia relativa desse acontecimento numa sucesso numervel de experincias aleatrias, idnticas e independentes. Efectuando n repeties de uma experincia aleatria, seja fA a frequncia relativa do acontecimento A. Devido ao princpio da regularidade estatstica de esperar que as frequncias relativas de A numa sucesso de provas com um grande nmero de repeties sejam aproximadamente iguais a um nmero P (com 0 P 1). Exemplo 1.2.6 Para testar a qualidade dos dados produzidos numa fbrica recolheu-se uma amostra e cada um destes dados foi lanado um nmero muito grande de vezes. Se o dado for perfeito, espera-se que cada face saia o mesmo nmero de vezes, ou seja, que os resultados possam ser apresentados num grco com o seguinte aspecto:

Frequncia relativa

20,00% 15,00% 10,00% 5,00% 0,00% 1 2 3 4 5 6

Nmero da face

Os grcos seguintes foram obtidos a partir do lanamento de dois dados (A e B).

15

Dado A Resultado de 100 lanamentos


Frequncia relativa
Frequncia relativa
30,00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% 1 2 3 4 5 6

Dado B Resultado de 100 lanamentos


20,00% 18,00% 16,00% 14,00% 12,00% 10,00% 1 2 3 4 5 6

Nmero da face

Nmero da face

Resultado de 1000 lanamentos


35,00% 30,00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% 1 2 3 4 5 6

Resultado de 1000 lanamentos


20,00%

Frequncia relativa

Frequncia relativa

18,00% 16,00% 14,00% 12,00% 10,00% 1 2 3 4 5 6

Nmero da face

Nmero da face

Resultado de 10000 lanamentos


35,00% 30,00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% 1 2 3 4 5 6

Resultado de 10000 lanamentos


20,00%

Frequncia relativa

Frequncia relativa

18,00% 16,00% 14,00% 12,00% 10,00% 1 2 3 4 5 6

Nmero da face

Nmero da face

Analisando os resultados da experincia, considera-se o dado A como viciado e o dado B como perfeito. Nesta experincia utilizou-se o conhecimento de que, medida que aumenta o nmero de experincias, a frequncia relativa tende a estabilizar volta de um valor. 16

1.2.3

Denio axiomtica de probabilidade

No incio do sculo XX comeou-se a sentir a necessidade de uma axiomatizao da teoria das probabilidades que permitisse ultrapassar a ambiguidade de certos conceitos e interpretaes. A denio de probabilidade que ir ser apresentada foi introduzida por Kolmogorov em 1933. Denio 1.2.7 (Denio axiomtica de probabilidade) Considere-se uma experincia aleatria com espao de resultados e seja A, com A , um acontecimento. Chama-se probabilidade funo P que a cada acontecimento associa um nmero real, representado por P(A) e denominado probabilidade do acontecimento A, que satisfaz as seguintes propriedades (axiomas): (A1 ) (A2 ) (A3 ) Nota: Quando innito, o conjunto de axiomas est incompleto. Ter, ento, que ser considerado a generalizao do terceiro axioma: + ! + [ X (A ) P Ai = P (Ai ) se Ai Aj = , para i 6= j. 3
i=1 i=1

A , P (A) 0; P () = 1; A, B : A B =
1

= P (A B) = P (A) + P (B).

Leis bsicas das probabilidades


Muitas propriedades teis e interessantes podem ser deduzidas dos trs axiomas da denio axiomtica de probabilidade. Vo-se analisar algumas destas propriedades. Teorema 1.2.1 A , P (A) + P (A) = 1, ou seja, P (A) = 1 P (A).
1

A e B so acontecimentos incompatveis ou mutuamente exclusivos.

17

Demonstrao: Pelo segundo axioma (A2 ) tem-se que P () = 1. Considerando que, para qualquer acontecimento A, = A A, obtm-se 1 = P () = P (A A). Tendo em conta que se pretende a probabilidade da unio de dois acontecimentos disjuntos A A = , pelo terceiro axioma (A3 ) vem 1 = P () = P (A A) = P (A) + P (A), donde se conclui que P (A) + P (A) = 1 P (A) = 1 P (A). Teorema 1.2.2 Sendo o acontecimento impossvel, ento P () = 0. Demonstrao: Como = pelo teorema 1.2.1 vem P() = 1 P () = 1 P (), que considerando que P () = 1 (A2 ) vem 1 P () = 1 1 = 0. Teorema 1.2.3 A, B : A B P (A) P (B). Demonstrao: Se A B B = A (B A) e A (B A) = , ento por (A3 ) conclui-se que P (B) = P A (B A) = P (A) + P (B A), P (B) = P (A) + P (B A) P (B) P (A). 18

como P (B A) 0 por (A1 ), vem

Teorema 1.2.4 A , P (A) 1. Demonstrao: Considerando que A e P () = 1 pelo teorema 1.2.3 vem P (A) P () = 1. Teorema 1.2.5 A, B , P (A) = P (A B) + P (A B), ou seja, P (A B) = P (A) P (A B).2 Demonstrao: Como A = (A B) (A B) [ou A = (A B) (A\B)], vem P (A) = P (A B) (A B) , ento, por (A3 ) vem P (A) = P (A B) + P (A B). Teorema 1.2.6 A, B , P (A B) = P (A) + P (B) P (A B). Demonstrao: Como A B = A (B A) e A (B A) = , recorrendo a (A3 ) vem P (A B) = P A (B A) = P (A) + P (B A),

onde AB e AB so acontecimentos incompatveis, ou seja, (AB)(AB) =

utilizando o teorema 1.2.5 que diz que P (B A) = P (B) P (B A) obtm-se P (A B) = P (A) + P (B) P (B A) = P (A) + P (B) P (A B).

A B = A\B

19

Exemplo 1.2.7 Em determinada populao, a revista A adquirida por 9.8 por cento dos seus habitantes [P (A) = 0.098], a revista B por 22.9 por cento [P (B) = 0.229] e 5.1 por cento da populao adquire a revista A e a revista B [P (A B) = 0.051]. Qual a probabilidade de uma pessoa escolhida ao acaso: no adquirir a revista A? [acontecimento A] P (A) = 1 P (A) = 1 0.098 = 0.902. adquirir pelo menos uma revista? [acontecimento A B] P (A B) = P (A) + P (B) P (A B) = = 0.098 + 0.229 0.051 = 0.276. somente adquirir a revista A? [acontecimento A B = A\B] P (A B) = P (A) P (A B) = = 0.098 0.051 = 0.047. somente adquirir a revista B? [acontecimento A B = B\A] P (A B) = P (B) P (A B) = = 0.229 0.051 = 0.178. no adquirir nenhuma revista? [acontecimento A B = A B pelas leis de De Morgan3 ] P (A B) = P (A B) = = 1 P (A B) = 1 0.276 = 0.724.
3

Ver propriedades dos acontecimentos complementares na pgina 7

20

adquirir somente uma revista? [acontecimento (A B) (A B)] P [(A B) (A B)] = P (A B) + P (A B) P (A B) (A B) ,

que, tendo em conta que (AB)(AB) = , vem que P (A B) (A B) = 0, logo P (A B) + P (A B) P (A B) (A B) = = P (A B) + P (A B) = = P (A) P (A B) + P (B) P (A B) = = 0.098 0.051 + 0.229 0.051 = 0.225

21

1.3

Probabilidades condicionadas e acontecimentos independentes

A denio de probabilidade de um acontecimento tem por base um dado conjunto fundamental de condies. Quando calculada P (A) sem restries, alm das condies fundamentais, chama-se a essa probabilidade probabilidade incondicional, absoluta ou a priori. Contudo, em muitos casos, a probabilidade de um acontecimento determinada por hipteses suplementares ou informaes adicionais, isto , a probabilidade de um acontecimento A condicionada pela realizao de um outro acontecimento B com probabilidade no nula. A esta probabilidade d-se o nome de probabilidade condicional e representa-se por P (A|B), que signica a probabilidade de o acontecimento A se realizar sob a condio do acontecimento B se ter realizado e l-se a probabilidade de A condicionada a B. Denio 1.3.1 (Denio de probabilidade condicionada) Sejam A e B dois acontecimentos: A, B . Chama-se probabilidade de A condicionada a B ou probabilidade de A se B e representa-se por P(A|B), com P (B) 6= 0, a P (A|B) = P (A B) , P (B)

isto , a probabilidade de A se realizar sabendo que B se realizou.

A probabilidade de A condicionada pela realizao de B representa a reavaliao da probabilidade de A face informao de que B se realizou. Nota: As probabilidades condicionadas satisfazem os trs axiomas da denio axiomtica de probabilidades.4 Teorema 1.3.1 A, B : P (B) 6= 0 P (A|B) 0.
4

Consultar denio axiomtica de probabilidades na pgina 17

22

Demonstrao: P (A|B) = P (A B) , P (B)

como P (A B) 0 e P (B) > 0, logo P (A B) 0. P (B) Teorema 1.3.2 B : P (B) 6= 0 P (|B) = 1. Demonstrao: P (|B) = P (B) P ( B) = = 1. P (B) P (B)

Teorema 1.3.3 A1 , A2 , B : P (B) 6= 0, A1 A2 = P (A1 A2 |B) = P (A1 |B) + P (A2 |B). Demonstrao: P (A1 A2 |B) = P [(A1 A2 ) B] P [(A1 B) (A2 B)] = , P (B) P (B)

que, considerando que A1 A2 = (A1 B) (A2 B) = , vem P [(A1 B) (A2 B)] P (A1 B) + P (A2 B) = = P (A1 |B) + P (A2 |B). P (B) P (B) Nota: As probabilidades condicionadas obedecem aos teoremas apresentados nas leis bsicas das probabilidades (desde que se mantenha sempre o condicionante)5 .

Teorema 1.3.4 A, B : P (B) 6= 0 P (A|B) + P (A|B) = 1 ou P (A|B) = 1 P (A|B).


5

Rever leis bsicas de probabilidade na pgina 17.

23

Demonstrao: P (A B) , P (A|B) = P (B) utilizando o teorema 1.2.5 no numerador vem P (A B) P (B) P (B A) P (B) P (B A) = = = 1 P (A|B). P (B) P (B) P (B) P (B) Teorema 1.3.5 B : P (B) 6= 0 P (|B) = 0, sendo o acontecimento impossvel. Demonstrao: P (|B) = P ( B) P () = = 0. P (B) P (B)

Teorema 1.3.6 A, B, C : P (C) 6= 0, A B P (A|C) P (B|C). Demonstrao: Se A B (A C) (B C) P (A C) P (B C), logo P (A|C) = P (A C) P (B C) = P (B|C). P (C) P (C)

Teorema 1.3.7 A, B : P (B) 6= 0 P (A|B) 1. Demonstrao: Considerando que A e P (|B) = 1 pelo teorema 1.3.6 vem P (A|B) P (|B) = 1.

24

Teorema 1.3.8 A, B, C : P (C) 6= 0 P (A|C) = P [A B|C] + P [A B|C] ou P [A B|C] = P (A|C) P [A B|C] 6 . Demonstrao: Como A = (A B) (A B) ou A = (A B) (A\B) P (A|C) = P [(A B) (A B)|C], onde (A B) e (A B) so acontecimentos incompatveis, ento pelo teorema 1.3.3 conclui-se que P [(A B) (A B)|C] = P (A B|C) + P (A B|C). Teorema 1.3.9 A, B, C : P (C) 6= 0 P (A B|C) = P (A|C) + P (B|C) P (A B|C). Demonstrao: Como A B = A (B A) e A (B A) = , recorrendo ao teorema 1.3.3 vem P (A B|C) = P A (B A)|C = P (A|C) + P (B A|C), que utilizando o teorema 1.3.8 obtm-se P (A B|C) = P (A|C) + P (B|C) P (A B|C). Exemplo 1.3.1 De um baralho de 52 cartas retira-se uma carta. Qual a probabilidade de ser um rei sabendo que de ouros? Casos possveis: 52 cartas
6

A B = A\B

25

P (ouros) =

1 13 = 52 4 4 1 P (rei) = = 52 13 P (rei ouros) = 1 52

1 1 P (rei ouros) = 52 = . P (rei|ouros) = 1 P (ouros) 13 4 Qual a probabilidade de no ser rei sabendo que a carta de ouros? 12 1 = P (no rei|ouros) = 1 P (rei|ouros) = 1 a 13 13

Por vezes mais fcil determinar o valor da probabilidade condicionada entre dois acontecimentos do que a probabilidade da sua interseco. Assim, a relao entre a probabilidade condicionada e a probabilidade da interseco entre dois acontecimentos patente na denio de probabilidade condicionada pode ser utilizada para calcular a probabilidade da interseco. Este resultado dado pelo teorema da probabilidade composta e pelo teorema da multiplicao.

Teorema 1.3.10 (Teorema da probabilidade composta) Sejam A e B dois acontecimentos quaisquer tais que P (A) 6= 0 e P (B) 6= 0, ento P (A B) = P (A|B) P (B) = P (B|A) P (A). Demonstrao: P (A|B) = P (A B) P (A B) = P (A|B)P (B), P (B) P (B A) P (B A) = P (A B) = P (B|A)P (A). P (A) (7)

P (B|A) =

26

Teorema 1.3.11 (Teorema da multiplicao) Sejam A1 , A2 , A3 , ..., An n acontecimentos quaisquer do espao amostral tais que P (A1 A2 A3 An ) 6= 0, ento P (A1 A2 An ) = = P (A1 ) P (A2 |A1 ) P (A3 |A1 A2 ) P (An |A1 A2 An1 ) Exemplos 1.3.2 Um caixa contm cinco bolas, das quais trs so brancas e duas so pretas. Considerando que so retiradas duas bolas sem reposio, qual a probabilidade de serem retiradas duas bolas brancas? P (B1 B2 ) =? Considerando que a probabilidade de a segunda bola ser branca depende da cor da primeira bola retirada, pode-se utilizar o teorema da probabilidade composta para condicionar a probabilidade de a segunda bola ser branca ao facto de a primeira ter sido branca, ou seja P (B1 B2 ) = P (B2 |B1 )P (B1 ). A probabilidade de a primeira bola ser branca facilmente determinada pela denio clssica (quociente entre o nmero de caso favorveis e o nmero de casos possveis), pois tm-se trs bolas brancas em cinco bolas possveis. Para determinar P (B2 |B1 ) utiliza-se novamente a denio clssica, onde, por j ter sado uma bola, s se tem quatro casos possveis, e, pelo facto de a primeira bola retirada ter sido branca, j s se possui dois casos favorveis; ento, P (B2 |B1 )P (B1 ) = 6 2 3 = = 0.3. 4 5 20 (8)

Um lote de 30 peas contm 10 defeituosas. Tiram-se 3 peas ao acaso (sem reposio). Qual a probabilidade de serem todas no defeituosas? 27

Seja Ai , com i = 1, 2, 3 o acontecimento sada de uma pea no defeituosa na i-sima tiragem. Pretende-se calcular P (A1 A2 A3 ), que, pelo teorema da multiplicao, vem P (A1 A2 A3 ) = P (A1 )P (A2 |A1 )P (A3 |A1 A2 ), 20 19 , P (A2 |A1 ) = (visto que se sair uma pea no defeituosa na 30 29 18 primeira tiragem cam 29 peas das quais somente 19 so boas) e P (A3 |A1 A2 ) = 28 (considerando que nas duas primeiras tiragens saram peas no defeituosas, aquando como P (A1 ) = da terceira tiragem existem 28 peas nas quais 18 so boas), ento, P (A1 A2 A3 ) = P (A1 )P (A2 |A1 )P (A3 |A1 A2 ) = 20 19 18 = 0.28. 30 29 28

Alm das probabilidades condicionadas, outra noo que representa um papel de extrema importncia na teoria das probabilidades a de acontecimentos independentes. Denio 1.3.2 (Denio de dois acontecimentos independentes) Dois acontecimentos A e B dizem-se independentes quando P (A B) = P (A) P (B). Teorema 1.3.12 Se A e B so dois acontecimentos independentes, P (A) 6= 0 e P (B) 6= 0, ento: P (A|B) = P (A) e P (B|A) = P (B), (10) (9)

isto , se A e B so independentes, o conhecimento da realizao de A em nada afecta a probabilidade de realizao de B e vice-versa. Demonstrao:

28

P (A|B) =

P (A B) , P (B)

que tendo em conta que A e B so independentes, vem P (A B) P (A) P (B) = = P (A). P (B) P (B) Como exemplos de acontecimentos independentes podem-se considerar tiragens com reposio, lanamentos de um dado ou de uma moeda, entre muitos outros. Teorema 1.3.13 Se A e B so acontecimentos independentes, tambm o so: i) A e B,

ii) A e B, iii) A e B. Demonstrao: i) de A e B: P (A B) = P (A) P (A B), que considerando a hiptese de que A e B so independentes vem P (A) P (A B) = P (A) P (A) P (B) = P (A) [1 P (B)] = = P (A) P (B). ii) iii) de A e B anlogo ao anterior. de A e B: P (A B) = P (A B) = 1 P (A B) = 1 [P (A) + P (B) P (A B)] = que considerando que A e B so independentes vem = 1 [P (A) + P (B) P (A) P (B)] = 1 P (A) P (B) + P (A) P (B) = = [1 P (A)] P (B) [1 P (A)] = P (A) P (B) P (A) = = P (A) [1 P (B)] = P (A) P (B). 29

Exemplo 1.3.3 Sejam A e B dois acontecimentos independentes tais que P (A B) = 0.7 e P (A) = 0.5. 1. Determine P (B). Atravs do enunciado sabe-se: P (A B) = 0.7, P (A) = 0.5 e P (A B) = P (A) P (B) (pois A e B so independentes) como P (AB) = P (A)+P (B)P (AB) = P (A)+P (B)P (A)P (B) = 0.7, onde substituindo P (A) pelo seu valor obtm-se 0.5 + P (B) 0.5P (B) = 0.7 P (B) 0.5P (B) = 0.7 0.5 0.2 0.5P (B) = 0.2 P (B) = = 0.4. 0.5 2. Determine P (A B). Tendo em conta que A e B so acontecimentos independentes, ento, A e B tambm o so, ou seja, P (A B) = P (A) P (B) = (1 0.5) (1 0.4) = 0.3.7

Denio 1.3.3 (Denio de trs acontecimentos independentes) Trs acontecimentos A, B e C dizem-se independentes quando se vericar simultaneamente: 1. P (A B C) = P (A) P (B) P (C); 2. P (A B) = P (A) P (B); 3. P (A C) = P (A) P (C); 4. P (B C) = P (B) P (C).
7

Note-se que tambm se poderia calcular esta probabilidade utilizando as leis de De Morgan, obtendo-se

P (A B) = P (A B) = 1 P (A B) = 1 0.7 = 0.3

30

Teorema 1.3.14 Sejam A1 , A2 , , An n acontecimentos independentes, ento P (A1 A2 A3 An ) = P (A1 ) P (A2 ) P (A3 ) P (A4 ) P (An ). (11)

Assim, o clculo da probabilidade da interseco de vrios acontecimentos independentes pode ser simplicado para a multiplicao das probabilidades de cada um dos acontecimentos isoladamente. Exemplo 1.3.4 Considere a experincia aleatria que consiste em trs lanamentos de um dado. Qual a probabilidade de sair trs vezes a face seis? P (F6 F6 F6 ) =? Tendo em conta que o resultado de cada lanamento no inuencia o resultado dos restantes lanamentos, ou seja, que os acontecimentos so independentes, pode-se passar da probabilidade da interseco para o produto das probabilidades, ento 3 1 1 P (F6 F6 F6 ) = P (F6 ) P (F6 ) P (F6 ) = . = 6 216

31

1.4

Teorema das probabilidades totais e teorema de Bayes

Denio 1.4.1 (Denio de partio de ) Os acontecimentos A1 , A2 , , An denem uma partio de quando se vericar simultaneamente as seguintes trs condies: i) A1 A2 An = ; ii) i 6= j Ai Aj = ; iii) i = 1, ..., n, P (Ai ) > 0.

Figura 7: Exemplo de uma partio de

Teorema 1.4.1 (Teorema das probabilidades totais) Sejam A1 , A2 , A3 , , An acontecimentos denindo uma partio sobre , ento, para qualquer acontecimento B, tem-se: P (B) =
n X i=1

P (B|Ai ) P (Ai ) .

Figura 8: Teorema das probabilidades totais

32

Demonstrao: Considerando que os acontecimentos A1 , A2 , A3 , , An denem uma partio de tem-se que A1 A2 An = logo B = B = B (A1 A2 A3 An ) que utilizando a propriedade distributiva vem B = (B A1 ) (B A2 ) (B A3 ) (B An ), ento, utilizando probabilidades, vem P (B) = P [(B A1 ) (B A2 ) (B A3 ) (B An )]. Como i 6= j tem-se Ai Aj = , ento i 6= j tambm se tem (BAi )(BAj ) = obtendo-se, ento P (B) = P (B A1 ) + P (B A2 ) + P (B A3 ) + + P (B An ) = considerando que P (B Ai ) = P (B|Ai )P (Ai ) (ver teorema 1.3.10 na pgina 26) vem
n P

P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 ) + ... + P (B|An )P (An ) = P (B|Ai ) P (Ai ) .

i=1

Teorema 1.4.2 (Teorema de Bayes) Sejam A1 , A2 , A3 , , An n acontecimentos que denem uma partio sobre e seja B um qualquer acontecimento de tal que P (B) 6= 0. Nestas condies, para j = 1, 2, ..., n, verica-se: P (B|Aj ) P (Aj ) P (Aj |B) = P . n P (B|Ai ) P (Ai )
i=1

(12)

Demonstrao:

Por denio de probabilidade condicional tem-se P (Ai |B) = P (Ai B) , P (B) 33

que utilizando o teorema da probabilidade composta (ver teorema 1.3.10 na pgina 26) vem que P (Ai B) = P (B|Ai )P (Ai ). Em relao ao denominador basta usar o teorema das probabilidades totais (teorema 1.4.1 na pgina 32) e obtm-se o resultado pretendido, ou seja P (Ai B) P (B|Aj ) P (Aj ) = P . n P (B) P (B|Ai ) P (Ai )
i=1

Exemplos 1.4.1

Uma loja vende trs marcas de determinado produto (M1 , M2 e M3 ), sendo trinta por cento dos produtos vendidos da marca M1 , vinte da marca M2 e os restantes da marca M3 . Sabe-se ainda que alguns produtos possuem defeito de fabrico, correspondendo a dois por cento dos da marca M1 , cinco dos da marca M2 e dez dos da marca M3 . Qual a probabilidade de um produto vendido possuir defeito? [P (D)] Do enunciado pode-se retirar o valor das seguintes probabilidades: P (M1 ) = 0.30 P (D|M1 ) = 0.02 P (M2 ) = 0.20 P (D|M2 ) = 0.05 P (M3 ) = 0.50 P (D|M3 ) = 0.10

Note-se que os acontecimentos M1 , M2 e M3 denem uma partio de , ou seja: i) S so vendidos produtos das marcas M1 , M2 e M3 , ou seja, M1 M2 M3 = ; ii) Se um produto de uma marca no pode ser simultaneamente doutra marca, ou seja, Mi Mj = para i 6= j. iii) Qualquer marca vende produtos, ou seja, P (Mi ) > 0, para i = 1, 2, 3. Assim, esto satisfeitas as condies de utilizao do teorema das probabilidades totais, P (D) = P (D|M1 )P (M1 ) + P (D|M2 )P (M2 ) + P (D|M3 )P (M3 ) = = 0.02 0.3 + 0.05 0.2 + 0.1 0.5 = 0.066 34

Qual a probabilidade de um produto vendido ser da marca M1 sabendo que possui defeito de fabrico? P (M1 |D) =? Recordando que os acontecimentos M1 , M2 e M3 denem uma partio de e que P (D) 6= 0, pode utilizar-se o teorema de Bayes, obtendo-se P (M1 |D) = P (D|M1 ) P (M1 ) = 3 P P (D|Mj ) P (Mj )

j=1

1 0.02 0.3 = 0.02 0.3 + 0.05 0.2 + 0.10 0.5 11

Nos parques industriais A1 , A2 e A3 existem empresas que se dedicam actividade txtil, respectivamente, 10, 40 e 25 por cento das empresas. Escolhido ao acaso um parque e nele, tambm ao acaso, uma empresa: Qual a probabilidade de a empresa ser txtil? 1 1. Escolha do parque P (A1 ) = P (A2 ) = P (A3 ) = ; 3 2. Escolha de uma empresa no parque obtido em 1). Seja B o acontecimento sada de uma empresa txtil. So dados fornecidos pelo enunciado: P (B|A1 ) = 0.1, P (B|A2 ) = 0.4, P (B|A3 ) = 0.25 A probabilidade pedida P (B) que, utilizando o teorema das probabilidades totais, vem: P (B) = P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 ) = = 0.1 1 1 1 + 0.4 + 0.25 = 0.25. 3 3 3

35

Supondo que a empresa escolhida do sector txtil, qual a probabilidade de esta empresa pertencer ao parque A1 ? P (A1 |B) =? Pelo teorema de Bayes P (Aj |B) = P (B|Aj ) P (Aj ) P (B|Aj ) P (Aj ) , ou seja = 3 P P (B) P (B|Ai ) P (Ai )

i=1

0.1 1 P (B|A1 ) P (A1 ) 3 P (A1 |B) = = = 0.13 (3) . P (B) 0.25

36

2
2.1

Distribuies
Denio de varivel aleatria

Como foi visto no captulo anterior, uma experincia aleatria um procedimento que leva obteno de um ou vrios resultados sujeitos ao acaso. Em algumas experincias aleatrias verica-se que os elementos () do espao amostral () so nmeros reais: medio de um comprimento, tempo que um autocarro demora a percorrer um determinado trajecto entre duas cidades, quantidade produzida por uma fbrica, nmero de pessoas que entram diariamente numa loja, lucro de uma empresa, entre outras. Noutras experincias aleatrias o resultado no um nmero real, mas sim uma caracterstica, como por exemplo descrever a produo de baterias em defeituosas e no defeituosas. Contudo, nestas experincias, o interesse recai sobre a mensurao de algumas caractersticas e sobre o seu registo como um nmero. Portanto, quando o espao amostral no um conjunto numrico, a aplicao de procedimentos estatsticos passa pela atribuio de um nmero real (ou conjunto de nmeros reais) a cada elemento pertencente a . No caso referido, poder-se-ia atribuir o nmero 1 s peas defeituosas e o nmero 0 s peas no defeituosas. Estes valores podem ser vistos como valores assumidos por uma varivel no decurso de uma experincia aleatria. A essa varivel chama-se varivel aleatria. Denio 2.1.1 (Denio de varivel aleatria) Chama-se varivel aleatria (representando-se por uma letra maiscula, normalmente X) a uma funo cujo valor um nmero real determinado pelo resultado de uma experincia aleatria, isto , X: R 7 x = X () Assim, uma funo, X, que associa a cada elemento um nmero real, x = X(), denominada varivel aleatria. As variveis aleatrias, consoante o conjunto de valores que podem assumir, so classicadas em variveis aleatrias discretas e variveis aleatrias contnuas. Considerando X uma 37

varivel aleatria, se os valores possveis de X (o contradomnio de X) for nito ou innito numervel, denomina-se X de varivel aleatria discreta. Ou seja, uma varivel diz-se discreta quando pode assumir com probabilidade diferente de zero um nmero nito ou innito numervel de valores. Exemplo 2.1.1 nmero de pontos de um lanamento de um dado; nmero de pessoas em la numa caixa de um supermercado; observao do sexo num conjunto de nascimentos; alunos reprovados e aprovados em determinada disciplina. Se X uma varivel aleatria cujo contradomnio um intervalo real ou uma coleco de intervalos reais, ento X uma varivel aleatria contnua. Exemplo 2.1.2 peso de um indivduo; comprimento de uma rvore; tempo que um corredor demora a percorrer a maratona.

38

2.2

Variveis Aleatrias Discretas

Neste captulo comea-se por denir os principais conceitos para caracterizar e trabalhar com as variveis aleatrias discretas, seguindo-se uma descrio das principais distribuies utilizadas na prtica. 2.2.1 Caso unidimensional

a) Funo de probabilidade Como foi referido, uma varivel aleatria diz-se discreta quando assume um nmero nito ou uma innidade numervel de valores. Considere-se que os valores que a varivel aleatria X pode assumir so x1 , x2 , , xn ocorrendo com probabilidade p1 , p2 , , pn , respectivamente. Nestas condies, a funo que associa a cada valor da varivel (xi ) a sua probabilidade (pi ) chama-se funo de probabilidade da varivel aleatria X. Denio 2.2.1 (Denio de Funo de Probabilidade) Chama-se funo de probabilidade da varivel aleatria X funo que associa a cada valor da varivel (xi ) a sua probabilidade (pi ), ou seja, f (xi ) = P (X = xi ) = pi . Assim, pode-se denir funo de probabilidade da varivel aleatria X como o conjunto de pares (xi , pi ), que podem ser dispostos na forma: X: f (x) x1 p1 x2 p2 xn pn

vericando: pi 0 para i = 1, , n e p1 + p2 + + pn = 1. Nota: No caso de a varivel aleatria assumir um nmero innito numervel de valores, a funo de probabilidade ser f (xi ) = P (X = xi ) vericando-se f (xi ) 0 para + P i = 1, 2, e f (xi ) = 1.
i=1

39

Exemplo 2.2.1 Considere uma varivel aleatria que pode assumir os valores 0, 1, 2, 3, 4, 5 e 6 com funo de probabilidade denida da seguinte forma: X: f (x) : 0 1 2 3 4 5 6

0.05 0.1 0.2 0.3 0.2 0.1 0.05

A interpretao de cada um dos valores que a funo de probabilidade da varivel aleatria X assume : f (0) = P (X = 0) = 0.05; f (1) = P (X = 1) = 0.1; f (2) = P (X = 2) = 0.2; f (3) = P (X = 3) = 0.30; f (4) = P (X = 4) = 0.2; f (5) = P (X = 5) = 0.1; f (6) = P (X = 6) = 0.05. De salientar que, tendo em conta que os valores que uma funo de probabilidade assume so probabilidades, estes valores nunca podem ser negativos [P (X = x) 0] e a soma de todos os valores tem que ser igual probabilidade de , ou seja, P (X = 0) + P (X = 1) + + P (X = 6) = 1. b) Funo de distribuio Em variveis cujo espao amostral constitudo por muitos valores, a utilizao da funo de probabilidade para o clculo da probabilidade da varivel assumir um valor inferior (ou superior) a determinado nmero torna-se muito trabalhoso. Por exemplo, se uma varivel aleatria, X, descrever o nmero de carros que passam diariamente na ponte 25 de Abril, no caso de se pretender calcular a probabilidade de em determinado dia passarem menos de cinco mil carros [P (X < 5000)], ter-se-ia de somar cinco mil probabilidades: a de no passar nenhum carro, a de passar s um carro e assim sucessivamente at de passarem exactamente 4999 carros [P (X = 0) + P (X = 1) + P (X = 2) + + P (X = 4999)]. Para facilitar estes clculos existe a funo de distribuio ou distribuio cumulativa da varivel aleatria X. Para ser denida esta funo, considere-se que X uma varivel aleatria. Assim, a igualdade F (x) = P (X x) dene uma funo real de varivel real denominada funo de distribuio da varivel aleatria 40

X e, como tal, o valor da funo de distribuio no ponto x igual probabilidade de a varivel aleatria X assumir um valor inferior ou igual a esse nmero real x, sendo calculada, no caso de a varivel aleatria X ser discreta, da seguinte forma: F (x) = X f (xi ). (13)

xi x

Propriedades 2.2.1 (Propriedades da funo de distribuio) 1. Para qualquer funo de distribuio F (x) tem-se 0 F (x) 1; 2. F (x) no decrescente (constante ou crescente); 3. lim F (x) = 0 e lim F (x) = 1;
x x+

4. F (x) contnua direita. Teorema 2.2.1 Para qualquer funo de distribuio F (x), dados os nmeros reais x1 e x2 tais que x1 < x2 , tem-se P (x1 < X x2 ) = P (X x2 ) P (X x1 ) = F (x2 ) F (x1 ). Demonstrao: P (X x2 ) = P (X ] , x2 ]) = P (X ] , x1 ]]x1 , x2 ]) como ] , x1 ]]x1 , x2 ] = , tem-se P (X ] , x1 ]]x1 , x2 ]) = = P (X ] , x1 ]) + P (X ]x1 , x2 ]) = = P (X x1 ) + P (x1 < X x2 ) ento, P (X x2 ) = P (X x1 ) + P (x1 < X x2 ) P (x1 < X x2 ) = P (X x2 ) P (X x1 ).

41

Exemplo 2.2.2 Considere a varivel aleatria descrita no exemplo 2.2.1 na pgina 39, cuja funo de probabilidade : X: f (x) : 0 1 2 3 4 5 6

0.05 0.1 0.2 0.3 0.2 0.1 0.05

O clculo da funo de distribuio feito atravs dos valores da funo de probabilidade; por exemplo, quando 4 x < 5 para o clculo da funo de distribuio P (X x) deve-se somar P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4). Utilizando os valores da funo de distribuio torna-se mais fcil calcular as seguintes probabilidades8 : 1. P (X 3) = 0.65; 2. P (X < 3) = P (X 3) P (X = 3) = 0.65 0.3 = 0.35 ou P (X < 3) = P (X 2) = 0.35; 3. P (X 3) = 1 P (X < 3) = 1 P (X 2) = 1 0.35 = 0.65;
8

A respectiva funo de distribuio : 0 se x < 0 0.05 se 0 x < 1 0.15 se 1 x < 2 0.35 se 2 x < 3 . F (x) = P (X x) = 0.65 se 3 x < 4 0.85 se 4 x < 5 0.95 se 5 x < 6 1 se x 6

De notar que, no exemplo dado, tambm se poderiam facilmente efectuar os mesmos clculos utilizando

unicamente a funo de probabilidade; no entanto, compreende-se a importncia da funo de distribuio em variveis que podem assumir um elevado nmero de valores.

42

4. P (X > 3) = 1 P (X 3) = 1 0.65 = 0.35; 5. P (1 < X 4) = P (X 4) P (X 1) = 0.85 0.15 = 0.7; 6. P (1 X 4) = P (X 4) P (X < 1) = P (X 4) P (X 0) = 0.85 0.05 = 0.8; 7. P (1 < X < 4) = P (X < 4) P (X 1) = P (X 3) P (X 1) = 0.65 0.15 = 0.5; 8. P (1 X < 4) = P (X < 4) P (X < 1) = P (X 3) P (X 0) = 0.65 0.05 = 0.6.

c) Valor esperado e varincia de uma varivel aleatria discreta Na prtica, em muitas situaes, est-se interessado em saber apenas algumas caractersticas da varivel aleatria, tais como a sua localizao e a sua disperso. Assim, como medida de localizao mais importante utiliza-se o valor esperado e como medidas de disperso a varincia e o desvio padro.

Medida de localizao
Denio 2.2.2 (Denio de valor esperado de uma varivel aleatria discreta) Dada uma varivel aleatria discreta X, chama-se valor esperado, esperana matemtica ou valor mdio, representando-se por E(X) ou X , quantidade assim denida: E(X) = X =
n X i=1

xi f (xi ),

(14)

onde X uma varivel aleatria discreta que assume os valores xi com probabilidade f (xi ), para i = 1, , n.

43

Nota: No caso de a varivel aleatria assumir um nmero innito numervel de valores dever-se- denir o valor esperado atravs de: E(X) = X =
+ X i=1

xi f (xi ),
+ P i=1

que s existe se a srie for absolutamente convergente, ou seja, se

|xi | f (xi ) < .

Exemplo 2.2.3 Considere uma lotaria com 1000 bilhetes diferentes custando cada um 10 euros. Considere ainda que este sorteio vai distribuir trs prmios monetrios, sendo o primeiro de 3000 euros, o segundo de 2000 euros e o terceiro de 1000 euros. Ento, a varivel aleatria (X) que descreve o que uma pessoa ganha ao comprar um bilhete a seguinte: X: f (x) 0 1000 2000 3000

0.997 0.001 0.001 0.001

As probabilidades so fceis de calcular. Cada um dos prmios s sai num bilhete, ento, a probabilidade ser o nmero de casos favorveis (1) a dividir pelo nmero de casos possveis (1000) sendo o resultado 0.001. Os restantes bilhetes (997 dos 1000) no do direito a prmio. Assim, o valor esperado desta varivel aleatria determinado por E(X) = 0 0.997 + 1000 0.001 + 2000 0.001 + 3000 0.001 = = 0 + 1 + 2 + 3 = 6. .O valor esperado ser igual a 6 euros pode ser interpretado como o valor que cada pessoa espera ganhar ao comprar um bilhete, ou seja, o valor mdio que ganha cada pessoa que comprou um bilhete. Neste caso, como o valor que cada pessoa ganha em mdia por bilhete inferior ao custo de cada bilhete, de um ponto de vista econmico, comprar um bilhete um mau negcio.

44

Considere que, em vez de se desejar calcular o valor esperado da varivel aleatria X, se pretende determinar o valor esperado de uma qualquer funo de uma varivel aleatria X; para tal, utilizar-se-ia a seguinte denio. Denio 2.2.3 Seja g(X) uma funo real de varivel real qualquer, ento, E [g(X)] = Nota: No caso de a varivel aleatria assumir um nmero innito numervel de valores dever-se- denir E [g(X)] =
+ X i=1 n X i=1

g(xi )f (xi ).

(15)

g(xi )f (xi )
+ P i=1

que s existe se a srie for absolutamente convergente, ou seja, se . Exemplo 2.2.4

|g(xi )| f (xi ) <

Considerando a varivel aleatria X do exemplo 2.2.3 da pgina 44 que descreve o que uma pessoa ganha ao comprar um bilhete, no caso de se pretender calcular o valor esperado de g(X) = 10 + 20X, bastar, pela denio apresentada, fazer E [g(X)] =
n X i=1 n X g(xi )f (xi ) = (10 + 20xi )f (xi ) = i=1

= (10 + 20 0) 0.997 + (10 + 20 1000) 0.001+ + (10 + 20 2000) 0.001 + (10 + 20 3000) 0.001 = 130. Propriedades 2.2.2 (Propriedades do valor esperado) Considerando a e b duas constantes e X uma varivel aleatria qualquer, ento 1. E(a) = a; 45

2. E(aX) = aE(X); 3. E(a + X) = a + E(X); 4. E(a + bX) = a + bE(X). Nota: Todas estas propriedades so facilmente demonstradas utilizando a denio 2.2.3. Por exemplo, para demonstrar a quarta propriedade faz-se: Demonstrao: g (x) = a + bX, sendo n n n n n P P P P P E (a + bX) = (a + bxi )f (xi ) = af (xi ) + bxi f (xi ) = a f (xi ) + b xi f (xi )
i=1 i=1 i=1 i=1 i=1

que, como a
n P

i=1

f (xi ) + b

n P

f (xi ) = 1 e
n P

i=1

xi f (xi ) = a + bE (X).

n P

xi f (xi ) = E (X), vem

i=1

i=1

Medida de disperso

Como foi referido anteriormente, as medidas de disperso que so mais utilizadas no estudo das variveis aleatrias so a varincia e o desvio padro, como seguidamente se indica. Denio 2.2.4 (Denio de varincia) A varincia de uma varivel aleatria pode ser representada por 2 , V ar(X) ou V (X) e denida como sendo o valor esperado de (X X )2 , ou seja,

No caso de a varivel aleatria ser discreta, pode-se utilizar a denio, anteriormente apresentada, que fornece o valor esperado de uma funo de uma varivel aleatria, sendo a varincia calculada atravs de V ar(X) =
n X (xi X )2 f (xi ). i=1

2 = V ar(X) = V (X) = E [X E (X)]2 = E (X X )2 . X

(16)

(17)

46

Nota: No caso de a varivel aleatria assumir um nmero innito numervel de valores dever-se- utilizar V ar(X) =
+ X (xi X )2 f (xi ) i=1

Denio 2.2.5 (Denio de desvio padro) O desvio padro denido como sendo a raiz quadrada positiva da varincia, ou seja, representando o desvio padro por , vem p = + V ar(X). (18)

No entanto, tal como na estatstica descritiva, os clculos da varincia no so habitualmente efectuados pela sua denio, mas, sim, pela frmula simplicada de Kning, que, neste contexto, tem a seguinte forma: 2 = V ar(X) = V (X) = E(X 2 ) E 2 (X) = E(X 2 ) 2 . X X Demonstrao: 2 = E[(X X )2 ] = E(X 2 2XX + 2 ) = X X que pelas propriedades do valor esperado obtm-se = E(X 2 ) E(2XX ) + E(2 ) = X que tendo em conta que X uma constante vem = E(X 2 ) 2X E(X) + 2 = X que, como E(X) = X , vem = E(X 2 ) 22 + 2 = E(X 2 ) 2 . X X X (19)

47

Exemplo 2.2.5 Um gestor de uma empresa est indeciso entre dois negcios cujo lucro descrito pelas variveis aleatrias discretas X e Y 9 . X: f (x) : Y : f (y) : 100 0.05 0 100 200 300

0.20 0.50 0.20 0.05 100 0.50 1100 2100 0.20 0.05

1900 900 0.05 0.20

E(X) = 100 0.05 + 0 0.2 + 100 0.5 + 200 0.2 + 300 0.05 = = 5 + 0 + 50 + 40 + 15 = 100; E(Y ) = 1900 0.05 900 0.2 + 100 0.5 + 1100 0.2 + 2100 0.05 = = 95 180 + 50 + 220 + 105 = 100. Ambos os negcios tm o mesmo valor esperado, ou seja, em ambos os negcios ganha-se o mesmo montante em mdia. Para o gestor, o valor esperado de cada negcio leva-o a concluir que estes so rentveis, pois ele espera ter um lucro de 100 unidades monetrias. Compare-se agora o valor das varincias. Para calcular a varincia da varivel aleatria X, utilizando a frmula simplicada de Kning, necessrio antes determinar E(X 2 ). Para o clculo de E(X 2 ) utiliza-se a frmula (15) (ver pgina 45) considerando que g(x) = x2 , de onde se conclui que E(X 2 ) = que aplicando ao exemplo, temos E(X 2 ) = (100)2 0.05 + (0)2 0.2 + (100)2 0.5 + (200)2 0.2 + (300)2 0.05 = = 500 + 0 + 5000 + 8000 + 4500 = 18000, assim, V ar(X) = E(X 2 ) E 2 (X) = 18000 1002 = 8000 e consequentemente X =
9

n X i=1

x2 f (xi ) i

8000 ' 89, 4427.

Em rigor deveriam ser variveis aleatrias continuas; no entanto, considere-se que o lucro proveniente de

cada negcio s assume alguns valores.

48

Para a varincia de Y tem-se E(Y 2 ) = (1900)2 0.05 + (900)2 0.2 + (100)2 0.5 + (1100)2 0.2 + (2100)2 0.05 = = 180500 + 162000 + 5000 + 242000 + 220500 = 810000, V ar(Y ) = E(Y 2 ) E 2 (Y ) = 810000 1002 = 800000 sendo Y = 800000 ' 894, 427.

A varincia (e o desvio padro) da varivel que descreve o lucro do negcio Y superior, logo, a varivel Y mais dispersa (ou menos concentrada) do que a varivel X. Note-se que a varivel Y assume valores mais distantes da mdia. Assim, caso o gestor opte pelo negcio Y , assumir maiores riscos, pois poder perder 1900 unidades monetrias enquanto que no negcio X, no mximo, perde 100 unidade monetrias. Em contrapartida, no negcio Y pode ganhar 2100 unidades monetrias, sendo no negcio X o lucro mximo igual a 300 unidades monetrias. Neste caso, a deciso de qual o negcio que o gestor dever optar feita consoante o risco que este est disposto a assumir. Propriedades 2.2.3 (Propriedades da varincia) Considerando a e b duas constantes e X uma varivel aleatria qualquer, tem-se 1. V ar(X) 0; 2. V ar(a) = 0; 3. V ar(a + X) = V ar(X); 4. V ar(aX) = a2 V ar(X); 5. V ar(a + bX) = b2 V ar(X).

49

Nota: Todas estas propriedades podem ser demonstradas utilizando as propriedades do valor esperado na denio de varincia (frmula (16) na pgina 46). Como exemplo vai-se demonstrar a quinta propriedade. Demonstrao: V ar (a + bX) = E [a + bX E (a + bX)]2

como E (a + bX) = a + bE (X) tem-se E [a + bX E (a + bX)]2 = E [a + bX a bE (X)]2 = E [bX bE (X)]2 = = E b2 [X E (X)]2 = b2 E [X E (X)]2 = b2 V ar (X). 2.2.2 Caso bidimensional

Neste captulo vai-se explicar como analisar duas variveis aleatrias discretas simultaneamente. Assim, considerando duas variveis aleatrias discretas, X e Y , ao par (X, Y ) denomina-se por varivel aleatria bidimensional (discreta). Para trabalhar com variveis aleatrias bidimensionais discretas adopta-se um processo anlogo ao caso unidimensional: vai-se utilizar uma funo cuja imagem a probabilidade de a varivel aleatria X assumir o valor xi e simultaneamente a varivel aleatria Y assumir o valor yj . Esta funo denominada por funo de probabilidade conjunta. a) Funo de probabilidade conjunta Denio 2.2.6 (Denio de funo de probabilidade conjunta) Chama-se funo de probabilidade conjunta da varivel aleatria bidimensional (X, Y ) funo que associa a cada par de valores (xi , yj ) a sua respectiva probabilidade, ou seja f (xi , yj ) = P (X = xi Y = yj ), que satisfaz as seguinte condies: 50

1. f (xi , yj ) 0; 2. PP
i j

f (xi , yj ) = 1.

Exemplo 2.2.6 Considere a seguinte funo de probabilidade conjunta das variveis aleatrias X e Y : Y X 0 1 2 fY 0.05 0.10 0.15 0.10 0.20 0.10 0.15 0.10 0.05 0.30 0.40 0.30 0.30 0.40 0.30 1.00

fX

Os valores centrais do quadro so os valores assumidos pela funo de probabilidade conjunta, ou seja, a P (X = xi Y = yj ). Por exemplo, caso se pretenda saber qual a probabilidade de X = 1 e simultaneamente Y = 1, esta probabilidade encontra-se no quadro na interseco da linha correspondente a X = 1 e da coluna correspondente a Y = 1, sendo P (X = 1 Y = 1) = f (1, 1) = 0.2. Alm dos valores da funo de probabilidade conjunta, o quadro tambm contm a funo de probabilidade da varivel aleatria X (ltima coluna) e da varivel aleatria Y (ltima linha). Note-se que para obter P (X = 0) esta resulta da seguinte soma P (X = 0) = P (X = 0 Y = 0) + P (X = 0 Y = 1) + P (X = 0 Y = 2) = = 0.05 + 0.10 + 0.15 = 0.3. Assim, para se obter a funo de probabilidade da varivel aleatria X bastar somar os valores da funo de probabilidade conjunta da linha correspondente. Utilizando o mesmo raciocnio, conclui-se que, para obter a funo de probabilidade da varivel aleatria Y , bastar somar os valores da funo de probabilidade conjunta da coluna correspondente. 51

b) Covarincia e Correlao Quando se analisam duas variveis aleatrias simultaneamente est-se, muitas vezes, interessado em avaliar se existe alguma relao entre essas variveis (por exemplo, perante o facto de uma varivel aumentar, saber qual vai ser o impacto deste aumento na outra varivel). Para esta anlise existem as medidas de variao conjunta: covarincia e coeciente de correlao. Denio 2.2.7 (Denio de covarincia) A covarincia de duas variveis aleatrias X e Y uma medida de variao conjunta das duas variveis e denida pelo valor esperado de [(X X )(Y Y ], ou seja, Cov(X, Y ) = E[(X X )(Y Y )]. a sua denio, mas, sim, uma frmula simplicada que, neste caso, Cov(X, Y ) = E(XY ) E(X)E(Y ). Demonstrao: Cov(X, Y ) = E [(X X )(Y Y )] = E [XY Y X XY + X Y ] = = E (XY ) E (Y X ) E (XY ) + E (X Y ) = = E (XY ) X E (Y ) Y E (X) + X Y = = E (XY ) E (X) E (Y ) E (Y ) E (X) + E (X) E (Y ) = = E (XY ) E (X) E (Y ). Nota: A covarincia de uma varivel com ela prpria a varincia dessa varivel, ou seja, Cov(X, X) = E(XX) E(X)E(X) = E(X 2 ) E 2 (X) = V ar(X). Apesar de a covarincia ser uma medida de variao conjunta, a interpretao desta no linear, pois esta pode assumir qualquer valor real ( < Cov(X, Y ) < +) e o valor que assume depende das unidades de medida em que as variveis esto expressas. Assim, para corrigir este problema, existe o coeciente de correlao entre duas variveis. 52 (21) (20)

No entanto, tal como a varincia, para calcular a covarincia no habitualmente utilizada

Denio 2.2.8 (Denio de coeciente de correlao entre duas variveis) Sejam X e Y duas variveis aleatrias quaisquer, ento, se representarmos o coeciente de correlao entre estas duas variveis por Corr(X, Y ) este denido por Corr(X, Y ) = Cov(X, Y ) , sendo 1 Corr(X, Y ) 1. X Y (22)

Para fazer a interpretao do valor do coeciente de correlao entre duas variveis necessrio ter em conta dois factores. O primeiro o valor do mdulo do coeciente de correlao. Considerando que o coeciente varia entre 1 e 1, o seu mdulo varia entre zero e a unidade. Assim, se o valor absoluto do coeciente de correlao possuir um valor perto da unidade, signica que existe uma forte dependncia linear entre as variveis, ou seja, possvel traar uma recta com os pares de valores (xi , yj ) a situarem-se perto dessa recta (no caso de ser exactamente igual unidade os valores esto todos sobre a recta). Se, pelo contrrio, o mdulo do coeciente possuir um valor baixo (perto de zero), signica que existe uma fraca dependncia linear entre as variveis (ou seja, os pares de valores (xi , yj ) formam uma nuvem de pontos tal que impossvel traar uma recta que descreva a relao entre as variveis). O segundo factor a ter em conta na interpretao do coeciente de correlao o sinal que o coeciente de correlao possui (note-se que o sinal do coeciente de correlao determinado pelo sinal da covarincia, pois o denominador sempre positivo). Se o sinal positivo, signica que as variveis variam no mesmo sentido, ou seja, se uma varivel aumenta a outra tende a aumentar (a recta que descreve a relao entre as variveis tem declive positivo). No caso de o sinal ser negativo, signica que as variveis variam em sentidos opostos, ou seja, se uma varivel aumenta a outra tende a diminuir (a recta que descreve a relao entre as variveis tem declive negativo). Para o clculo destas medidas, nomeadamente para determinar o valor de E (XY ), necessrio recorrer seguinte denio.

53

Denio 2.2.9 Seja g(X, Y ) uma funo qualquer das variveis aleatrias X e Y , ento, E [g(X, Y )] = Exemplo 2.2.7 Para exemplicar a clculo do coeciente de correlao considere-se a seguinte funo de probabilidade: Y X 0 1 2 fY 0.05 0.10 0.25 0.05 0.20 0.10 0.10 0.10 0.05 0.20 0.40 0.40 Cov(X, Y ) X Y 0.40 0.35 0.25 1 0 1 2 fX XX
i j

g(xi , yj )f (xi , yj ).

(23)

Corr(X, Y ) =

Para calcular o coeciente de correlao necessrio calcular a covarincia entre as duas variveis e a varincia de cada uma das variveis. Considerando que Cov(X, Y ) = E(XY ) E(X)E(Y ), vem E(X) = E(Y ) =
i=1 3 P 3 P

xi fX (xi ) = 0 0.4 + 1 0.35 + 2 0.25 = 0.85; yi fY (yi ) = 0 0.2 + 1 0.4 + 2 0.4 = 1.20.

i=1

Para determinar o valor esperado de XY , ou seja E(XY ), necessrio recorrer frmula (23) (ver pgina 54). Assim, pode-se considerar que XY a funo g(X, Y ) na denio

54

anterior, sendo, ento, o seu valor esperado determinado por E(XY ) =


3 3 XX i=1 j=1

xi yj f (xi , yj ) =

= 0 0 0.05 + 0 1 0.10 + 0 2 0.25 + 1 0 0.05 + 1 1 0.2+ +1 2 0.1 + 2 0 0.1 + 2 1 0.1 + 2 2 0.05 = 0.8; ento, Cov(X, Y ) = E(XY ) E(X)E(Y ) = 0.8 0.85 1.2 = 0.22. Para determinar o valor da varincia das variveis aleatrias X e Y ainda necessrio calcular E(X 2 ) e E(Y 2 ). E(X 2 ) = E(Y 2 ) =
3 X i=1 3 X i=1

x2 fX (xi ) = 02 0.4 + 12 0.35 + 22 0.25 = 1.35; i


2 yi fY (yi ) = 02 0.2 + 12 0.4 + 22 0.4 = 2.00;

assim, as varincias e os desvios padres assumem os seguintes valores V ar(X) = E(X 2 ) E 2 (X) = 1.35 0.852 = 0.6275 X ' 0.79214898; V ar(Y ) = E(Y 2 ) E 2 (Y ) = 2 1.22 = 0.56 Y ' 0.748331477; sendo o coeciente de correlao igual a Corr(X, Y ) = Cov(X, Y ) 0.22 = ' 0.37112636. X Y 0.6275 0.56

Como o coeciente de correlao negativo, pode-se armar que as variveis variam em sentidos opostos, ou seja, se a varivel X aumenta a varivel Y tende a diminuir. Alm de ser negativo, o seu valor absoluto aproximadamente 0.37, o que relativamente baixo; logo, conclui-se que existe uma fraca dependncia linear entre as variveis aleatrias X e Y . c) Variveis aleatrias independentes

55

Denio 2.2.10 (Denio de variveis aleatrias independentes) Duas variveis aleatrias dizem-se independentes quando, para todos os pares de valores (xi , yj ), se vericar f (xi , yj ) = fX (xi ) fY (yj ), ou seja P (X = xi Y = yj ) = P (X = xi ) P (Y = yj ). Nota: Esta denio de independncia semelhante efectuada no segundo captulo, onde dois acontecimentos eram considerados independentes se e s se P (A B) = P (A)P (B). Teorema 2.2.2 Se as variveis aleatrias X e Y so independentes, ento a covarincia (e o coeciente de correlao) entre estas variveis igual a zero. Nota: O recproco no verdadeiro, ou seja, se a covarincia de X e Y for zero, no signica necessariamente que estas duas variveis sejam independentes, mas, se a covarincia for diferente de zero, signica que as variveis no so independentes. Exemplo 2.2.8 1. Considere as variveis aleatrias independentes X e Y com funes de probabilidade, respectivamente, X f (x) Y f (y) 0 1 2 (24)

0.2 0.3 0.5 0 1

0.4 0.6

56

Vai-se determinar a funo de probabilidade conjunta das duas variveis aleatrias X e Y . Para tal essencial a informao de que as duas variveis aleatrias so independentes, ou seja, que para todos os pares de valores (xi , yj ) se tem P (X = xi Y = yj ) = P (X = xi ) P (Y = yj ); ento, a funo de probabilidade conjunta ser: Y X 0 1 2 fY 0.2 0.4 = 0.08 0.2 0.6 = 0.12 0.3 0.4 = 0.12 0.3 0.6 = 0.18 0.5 0.4 = 0.20 0.5 0.6 = 0.30 0.40 0.60 0.20 0.30 0.50 1.00

fX

2. Considere a seguinte funo de probabilidade conjunta das variveis aleatrias X e Y .

Y X 0 1 fY

fX 0.30 0.70 1.00

0.06 0.15 0.09 0.14 0.35 0.21 0.20 0.50 0.30

Conhecendo a funo de probabilidade conjunta, como vericar se as variveis so independentes? Considerando que a denio de variveis independentes P (X = xi Y = yj ) = P (X = xi ) P (Y = yj )

57

para todos os pares de valores (xi , yj ), ento, bastar vericar se tal acontece: (xi , yj ) (0, 0) (0, 1) (0, 2) (1, 0) (1, 1) (1, 2) P (X = xi Y = yj ) P (X = xi ) P (Y = yj ) 0.06 0.15 0.09 0.14 0.35 0.21 0.3 0.2 = 0.06 0.3 0.5 = 0.15 0.3 0.3 = 0.09 0.7 0.2 = 0.14 0.7 0.5 = 0.35 0.7 0.3 = 0.21

Tendo em conta que se vericou a igualdade em todos os pares de valores, conclui-se que as variveis so independentes. Nota: Para concluir que as variveis no so independentes basta haver um par (xi , yj ) em que P (X = xi Y = yj ) 6= P (X = xi ) P (Y = yj ). d) Propriedades do valor esperado e da varincia Sero aqui apresentadas as propriedades, na continuao das anteriormente apresentas no caso unidimensional (consultar pginas 45 e 49), quer para o valor esperado quer para a varincia de funes lineares de duas variveis aleatrias. Propriedades 2.2.4 (Valor esperado e varincia de duas variveis) Considere-se que a, b e c so constantes e que X e Y so duas variveis aleatrias quaisquer, ento 1. E(X + Y ) = E(X) + E(Y ); 2. E(a + bX + cY ) = a + bE(X) + cE(Y );

58

3. V ar(X + Y ) = V ar(X) + V ar(Y ) + 2Cov(X, Y ); 4. V ar(a + bX + cY ) = b2 V ar(X) + c2 V ar(Y ) + 2bc Cov(X, Y ). Nota: No caso de X e Y serem duas variveis aleatrias independentes, tendo em conta que nestes casos Cov(X, Y ) = 0, as duas ltimas frmulas apresentadas reduzem-se a V ar(X + Y ) = V ar(X) + V ar(Y ) e V ar(a + bX + cY ) = b2 V ar(X) + c2 V ar(Y ). Podem-se ainda generalizar estas propriedades para funes lineares com mais de duas variveis aleatrias. Contudo, nesta anlise, vai-se considerar apenas o caso em que todas as variveis so independentes, pois ser o nico que ser utilizado doravante. Propriedades 2.2.5 (Valor esperado e da varincia de mais de duas variveis) Considere-se que a, b1 , b2 , , bn so constantes e que X1 , X2 , , Xn so n variveis aleatrias independentes, ento 1. E(a + b1 X1 + + bn Xn ) = a + b1 E(X1 ) + + bn E(Xn ) = a + 2. V ar(a + b1 X1 + + bn Xn ) = Nota: No caso de as variveis aleatrias no serem independentes, na frmula da varincia, tem-se V ar(a + b1 X1 + + bn Xn ) =
n X i=1 n X i=1

bi E (Xi );

b2 V 1

ar(X1 ) + +

b2 V n

ar(Xn ) =

n X i=1

b2 V ar (Xi ). i

b2 V i

ar (Xi ) + 2

n n1 X X

bi bj Cov (Xi , Xj ) ;

i=1 j=i+1

59

Exemplos 2.2.9 1. Considere as variveis aleatrias X e Y das quais se sabe que E(X) = 10, E(Y ) = 100, V ar(X) = 4, V ar(Y ) = 9 e Cov(X, Y ) = 3. Qual o valor esperado e a varincia da varivel aleatria W , sendo W = 30 + 5X 4Y ? E(W ) = E(30 + 5X 4Y ) = 30 + 5E(X) 4E(Y ) = = 30 + 5 10 4 100 = 320; V ar(W ) = V ar(30 + 5X 4Y ) = V ar(5X 4Y ) = = 52 V ar(X) 2 5 4 Cov(X, Y ) + (4)2 V ar(Y ) = = 25 4 40 (3) + 16 9 = 364. 2. Considere as variveis aleatrias X1 , X2 , X3 e X4 que so independentes, das quais se sabe que: E(X1 ) = 50 E(X2 ) = 10 E(X3 ) = 80 E(X4 ) = 20 V ar(X1 ) = 10 V ar(X2 ) = 2 V ar(X3 ) = 1 V ar(X4 ) = 5

Qual o valor esperado e a varincia da varivel aleatria W , sendo esta varivel denida por W = 25 + X1 3X2 2X3 + 5X4 ? E(W ) = E(25 + X1 3X2 2X3 + 5X4 ) = = 25 + E(X1 ) 3E(X2 ) 2E(X3 ) + 5E(X4 ) = = 25 + 50 3 10 2 80 + 5 20 = 15; V ar(W ) = V ar(25 + X1 3X2 2X3 + 5X4 ) que, tendo em conta que as variveis so independentes, vem = V ar(X1 ) + (3)2 V ar(X2 ) + (2)2 V ar(X3 ) + 52 V ar(X4 ) = = 10 + 9 2 + 4 1 + 25 5 = 157.

60

2.3

Distribuies discretas de probabilidade

Neste captulo vai-se apresentar um conjunto de distribuies conhecidas que se tm imposto como modelos probabilsticos de variveis ou fenmenos aleatrios que surgem correntemente nas cincias empricas. Estas distribuies deram, e continuam a dar, respostas a muitos problemas de aplicao da teoria da probabilidade. Assim, vo ser abordadas cinco distribuies discretas: a de Bernoulli, a Binomial, a Binomial Negativa, a Hipergeomtrica e a de Poisson. 2.3.1 Distribuio de Bernoulli

Considere a realizao de uma experincia aleatria para a qual s esto denidos dois acontecimentos: Sucesso - quando ocorre o acontecimento em anlise; Insucesso - quando no ocorre o acontecimento em anlise. Neste contexto pode ser denida uma varivel aleatria que assume o valor 1 (X = 1), com probabilidade p, quando ocorre um sucesso e assume o valor 0 (X = 0), com probabilidade 1p, quando ocorre um insucesso. Diz-se, ento, que essa varivel tem distribuio de Bernoulli, sendo representada por X Ber(p) e tendo como funo de probabilidade: X: 0 1 p

f (x) : 1 p Exemplo 2.3.1

i) Classicao de uma bateria em defeituosa e no defeituosa; ii) Lanamento de uma moeda. Teorema 2.3.1 Se X uma varivel aleatria com distribuio de Bernoulli com probabilidade de sucesso igual a p, ou seja, X Ber(p), ento, E(X) = p e V ar(X) = p(1 p). 61 (25)

Demonstrao: E (X) =
n P

E (X 2 ) =

V ar (X) = E (X 2 ) E 2 (X) = p p2 = p (1 p). 2.3.2 Distribuio Binomial

i=1 n P

xi f (xi ) = 0 (1 p) + 1 p = p x2 f (xi ) = 02 (1 p) + 12 p = p, logo i

i=1

Suponha que se pretende fazer repeties sucessivas de uma experincia nas condies de Bernoulli. Cada repetio chama-se uma prova. Assim, estas provas vericam as condies seguintes: 1. Cada prova tem apenas denidos dois acontecimentos: sucesso ou insucesso; 2. Em cada prova a probabilidade de sucesso (representada por p) permanece constante, sendo a probabilidade de insucesso (1 p) tambm constante; 3. As provas so independentes. A estas provas d-se o nome de provas de Bernoulli, sendo a varivel aleatria que conta o nmero de sucessos em n provas de Bernoulli designada por varivel aleatria Binomial. Exemplo 2.3.2 Considere uma experincia aleatria que consiste em quatro lanamentos de um dado, onde se pretende calcular a probabilidade de sarem em dois lanamentos faces com valor superior a 4. Assim, o sucesso em cada prova sero os acontecimentos {5, 6} e o insucesso os acontecimentos 2 1 {1, 2, 3, 4}, sendo a probabilidade de sucesso igual a = e a probabilidade de insucesso igual a 6 3 1 2 ou 1 . Se o sucesso for representado por S e o insucesso por I existem seis formas de 3 3 acontecer dois sucessos em quatro lanamentos: SSII, SISI, SIIS, ISIS, ISSI, IISS. Assim, a probabilidade pretendida : P (SSII SISI SIIS ISIS ISSI IISS) = 62

que, tendo em conta que os acontecimentos so disjuntos, ou seja, a sua interseco um conjunto vazio (nunca podem acontecer dois destes acontecimentos ao mesmo tempo), a probabilidade da unio igual soma das probabilidades, = P (SSII) + P (SISI) + P (SIIS) + P (ISIS) + P (ISSI) + P (IISS) = considerando a independncia das provas de Bernoulli, obtm-se: = P (S)P (S)P (I)P (I) + P (S)P (I)P (S)P (I) + P (S)P (I)P (I)P (S)+ + P (I)P (S)P (I)P (S) + P (I)P (S)P (S)P (I) + P (I)P (I)P (S)P (S) = que seis vezes a soma de P (S)P (S)P (I)P (I); ento, a expresso anterior idntica a: 2 2 2 1 2 2 = 6P (S)P (S)P (I)P (I) = 6P (S) P (I) = 6 ; 3 3 que corresponde ao nmero de vezes que possvel obter dois sucessos em quatro provas (6) multiplicado pela probabilidade de haver um sucesso numa prova elevado ao nmero de sucessos pretendido [(1/3)2 ] multiplicado pela probabilidade de haver um insucesso numa prova elevado ao nmero de insucessos [(2/3)2 ] (que pode ser obtido pelo nmero de provas menos o nmero de sucessos). No entanto, o clculo do nmero de vezes que possvel obter k sucessos em n provas trabalhoso (se for efectuado de forma exaustiva como no exemplo). No caso de o nmero de provas ser grande, existem, para tal, as combinaes sem repetio de n elementos k a k. Nota: As combinaes sem repetio de n elementos k a k possuem a mesma frmula que as permutaes com repetio quando s se tem dois tipos de objectos. Em concluso, uma varivel aleatria com distribuio Binomial que seja constituda por n provas de Bernoulli e cuja probabilidade de sucesso em cada prova seja igual a p, habitualmente representada por X B(n, p), tem funo de probabilidade: n x P (X = x) = f (x) = p (1 p)nx , para n N e x = 0, , n. x 63

(26)

Para o clculo proposto no exemplo 2.3.2 (em quatro lanamentos sarem duas faces superiores a quatro) poder-se-ia utilizar a funo de probabilidade. A varivel tem distribuio 1 Binomial com 4 provas (n = 4) cuja probabilidade de sucesso em cada prova ; ento: 3 2 42 4 1 1 8 P (X = 2) = f (2) = 1 = . 2 3 3 27 Teorema 2.3.2 Se X uma varivel aleatria com distribuio Binomial constituda por n provas e com probabilidade de sucesso igual a p, ou seja, X B(n, p), ento E(X) = np e V ar(X) = np(1 p). Exemplo 2.3.3 Considere que a probabilidade de determinada mquina possuir defeito de fabrico 0.05. Se comprar vinte dessas mquinas, qual a probabilidade de pelo menos uma possuir defeito? Tendo em conta que a probabilidade de uma mquina possuir defeito de fabrico (0.05) igual para todas as mquinas, pode-se utilizar a distribuio Binomial. Assim, a varivel aleatria X, que conta o nmero de mquinas com defeito nas vinte mquinas compradas, tem distribuio Binomial com vinte provas de Bernoulli (n = 20) e probabilidade de sucesso em cada prova igual a 0.05 (p = 0.05), ou seja, X B(20, 0.05), sendo a probabilidade de pelo menos uma mquina possuir defeito dada por P (X 1) = 1 P (X < 1) = 1 P (X = 0) = 20 =1 0.050 (1 0.05)200 = 0 ' 1 0.358485922 ' 0.6415. 2.3.3 Distribuio Binomial Negativa (27)

Se, em vez de se desejar contar o nmero de sucessos em n provas de Bernoulli, se pretender calcular o nmero de provas necessrias at obter r sucessos, ento, a distribuio que deve 64

ser utilizada a Binomial Negativa. Assim, a varivel aleatria que conta o nmero de provas de Bernoulli necessrias at obter o sucesso nmero r tem distribuio Binomial Negativa, representando-se por X BN(r, p), sendo a sua funo de probabilidade: x1 r P (X = x) = f (x) = p (1 p)xr , para r N e x = r, r + 1, . r1 Teorema 2.3.3 Se X uma varivel aleatria com distribuio Binomial Negativa constituda por r sucessos e com probabilidade de sucesso igual a p, ou seja, X BN(r, p), ento E(X) = Exemplo 2.3.4 Qual a probabilidade de sair pela segunda vez uma face com valor superior a 4 no quarto lanamento de um dado? A varivel aleatria que conta o nmero de lanamentos necessrios at atingir o segundo sucesso (sair um valor superior a 4) tem distribuio Binomial Negativa com nmero de sucessos 1 (r) igual a 2 e probabilidade de sucesso em cada prova (p) igual a , ou seja, 3 1 , donde vem X BN 2, 3 x1 r P (X = 4) = f (4) = p (1 p)xr = r1 2 42 41 1 1 = 1 = 21 3 3 2 2 3 1 2 4 = = 1 3 3 27 Saliente-se que, quer a distribuio Binomial quer a Binomial Negativa, se baseiam em provas de Bernoulli, ou seja, em provas independentes onde a probabilidade de sucesso em cada prova (p) constante. No entanto, utiliza-se a distribuio Binomial para calcular a probabilidade de se obter x sucessos em n provas, ou seja, os casos favorveis so qualquer combinao de 65 r (1 p) r e V ar(X) = . p p2 (29) (28)

x provas com sucesso em n provas efectuadas, enquanto que a distribuio Binomial Negativa utilizada quando se pretende calcular a probabilidade de que o sucesso nmero r ocorra na prova nmero x (existindo a obrigao de que a ltima prova seja um sucesso). 2.3.4 Distribuio Hipergeomtrica

Considere a experincia aleatria que consiste em retirar uma amostra (sem reposio) constituda por n elementos de uma populao constituda por N elementos dos quais r possuem determinada caracterstica que se pretende analisar (ou seja, N r elementos da populao no possuem a caracterstica em estudo). Nestas condies, a varivel aleatria que conta o nmero de elementos na amostra (recolhida sem reposio) que possuem a caracterstica em estudo tem distribuio Hipergeomtrica, sendo representada por X H(N, n, r) e tendo funo de probabilidade igual a: r N r x nx f (x) = P (X = x) = , max{0, n (N r)} x min{r, n}. N n Teorema 2.3.4 Se X uma varivel aleatria com distribuio hipergeomtrica, ou seja, se X H(N, n, r), ento E(X) = n Exemplos 2.3.5 1. Um armazm contm cem mquinas das quais vinte esto avariadas. Se forem retiradas quinze mquinas do armazm, qual a probabilidade de quatro estarem avariadas? A varivel aleatria (seja X) que conta o nmero de mquinas avariadas na amostra tem distribuio Hipergeomtrica cuja populao tem dimenso 100 (N = 100) das quais vinte esto avariadas (r = 20) e a amostra tem dimenso quinze (n = 15), logo r N e V ar(X) = n r N r N n . N N N 1 (31)

(30)

66

X H(100, 15, 20) e

20 100 20 20 80 4 4 15 4 11 P (X = 4) = = ' 0.200. 100 100 15 15

2. Considere a experincia aleatria que consiste em retirar dez cartas de um baralho de 52 cartas. Qual a probabilidade de, nessas dez cartas, haver trs guras, se as cartas foram retiradas: (a) sem reposio? Este caso corresponde a ter uma populao de dimenso cinquenta e dois (N = 52) [das quais doze possuem a caracterstica ser gura (r = 12)] de onde retirada uma amostra (sem reposio) de dimenso dez (n = 10), logo, a varivel aleatria que conta o nmero de cartas que so guras na amostra tem distribuio Hipergeomtrica, ou seja, X H(52, 10, 12), ento 12 40 12 52 12 3 7 3 10 3 = ' 0.259. P (X = 3) = 52 52 10 10 (b) com reposio? Neste caso, como as cartas so retiradas com reposio, a distribuio hipergeomtrica no pode ser aplicada. No entanto, se as cartas so retiradas com reposio a probabilidade de sair uma gura igual para cada uma das cartas retiradas. Assim, pode ser aplicada a distribuio Binomial com dez provas onde a probabilidade de sucesso em cada prova ser doze (nmero de guras no baralho) a dividir por 12 cinquenta e dois (nmero total de cartas), ou seja p = ; ento, se a varivel 52 aleatria que conta o nmero de guras que saem nas dez cartas retiradas for repre 12 sentada por Y , vem que Y B 10, e a probabilidade pretendida determinada 52 por 67

103 3 10 12 12 P (Y = 3) = 1 ' 0.235. 52 52 3 Nota: Os valores obtidos para as probabilidades calculadas sem reposio atravs da distribuio Hipergeomtrica e com reposio atravs da distribuio Binomial so, no exemplo anterior, prximos um do outro. Em certas condies torna-se mesmo indiferente utilizar a distribuio Hipergeomtrica ou a Binomial como enunciado pelo seguinte teorema. Teorema 2.3.5 (Aproximao da Hipergeomtrica Binomial) A distribuio Hipergeomtrica tende para a distribuio Binomial se a dimenso da populao tende para innito, isto , X H(N, n, r) = X B(n, p) se N +, sendo p = Regra: Este teorema utilizado, na prtica, se a amostra for constituda por menos de cinco por cento da populao, ou seja, se n 0.05. N Exemplo 2.3.6 Considere que, dos dez milhes de portugueses, quatro milhes fumam. Se inquirir trinta, qual a probabilidade de doze fumarem? A varivel que conta o nmero de fumadores na amostra tem distribuio Hipergeomtrica com N = 10000000, n = 30 e r = 4000000, ou seja, X H(10000000, 30, 4000000), ento, para calcular a probabilidade de haver doze indivduos que responderam que fumavam, vir 4000000 10000000 4000000 4000000 6000000 12 30 12 12 18 P (X = 12) = = =? 10000000 10000000 30 30 68

r . N

No entanto, a maioria das mquinas de calcular no tem capacidade para fazer estes clculos, devendo-se ento utilizar o teorema da aproximao da distribuio Hipergeomtrica distribuio Binomial. Primeiro devem-se vericar as condies de aplicabilidade do teorema, ou n seja, se 0.05. Neste caso, vem que N n 30 = = 0.000003 0.05, logo, pode-se aplicar o teorema 2.3.5 e N 10000000 X H(10000000, 30, 4000000) = X B(30, 0.4), pois p = 4000000 r = = 0.4 e a probabilidade pretendida determinada por N 10000000

4000000 6000000 30 12 18 P (X = 12) = ' 0.412 (1 0.4)3012 ' 0.1474. 10000000 12 30

2.3.5

Distribuio de Poisson

Diz-se que uma varivel aleatria tem distribuio de Poisson com parmetro , representando-se por X P(), se a sua funo de probabilidade for dada por: P (X = x) = f (x) = e x com > 0 e x = 0, 1, . x! (32)

69

Caractersticas das variveis com distribuio de Poisson


1. O nmero de sucessos que ocorre num determinado intervalo de tempo independente do nmero de sucessos que ocorre em qualquer outro intervalo de tempo disjunto do primeiro. 2. A probabilidade de um acontecimento se realizar uma vez em qualquer intervalo muito curto proporcional amplitude do intervalo. Teorema 2.3.6 Se a varivel aleatria X tem distribuio de Poisson com parmetro , ou seja, X P (), ento E(X) = e V ar(X) = . (33)

Teorema 2.3.7 (Aditividade da distribuio de Poisson) Sejam Xi , com i = 1, 2, , n, n variveis aleatrias independentes com distribuio de Poisson de parmetro i respectivamente, ou seja, Xi P (i ) para i = 1, , n, ento, ! n n X X Xi P i
i=1 i=1

(34)

Exemplo 2.3.7 Considere que o nmero de telefonemas que determinada empresa recebe tem distribuio de Poisson com mdia trs por hora. Sabendo que o parmetro da Poisson igual sua mdia tem-se que a varivel aleatria X que conta o nmero de telefonemas numa hora tem distribuio de Poisson com parmetro = 3, ou seja, X P (3). 1. Qual a probabilidade de a empresa em uma hora receber (a) dois telefonemas? P (X = 2) = e3 32 ' 0.224. 2!

70

(b) menos de trs telefonemas? P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) = e3 30 e3 31 e3 32 = + + ' 0! 1! 2! ' 0.0498 + 0.1494 + 0.2240 = 0.4232. Tendo em conta que P (X < 3) = P (X 2), este clculo pode ser efectuado recorrendo tabela da funo de distribuio da Poisson (ver tabela no m do captulo na pgina 123). Relembrando que a funo de distribuio, por denio, fornece a probabilidade de a varivel assumir um valor menor ou igual a determinado x, ou seja, F (x) = P (X x), bastaria ir tabela coluna correspondente = 3 e linha x = 2 e obter-se-ia de imediato o valor 0.4232. (c) mais de dez telefonemas? P (X > 10) = 1 P (X 10) = 1 F (10) = 1 0.9997 = 0.0003. 2. Qual a probabilidade de, em seis horas, haver 10 telefonemas? Nesta questo pretende-se analisar o nmero de telefonemas em seis horas (varivel que ser representada por Y ), o que equivale a analisar a soma de seis variveis que contm o nmero de telefonemas em cada uma das horas; ento, pelo teorema da aditividade da distribuio de Poisson, vem que Y Y = X1 + X2 + + X6 , onde Xi P (3) para i = 1, , 6, ento

P (3 + 3 + 3 + 3 + 3 + 3) Y P (6 3) Y P (18) e e18 1810 = 0.0150, ou P (Y = 10) = 10! P (Y = 10) = P (Y 10) P (Y 9), que pela tabela da funo de distribuio vem = F (10) F (9) = 0.0304 0.0154 = 0.0150. 71

3. Qual a probabilidade de em quinze minutos haver um telefonema? Se a varivel que conta o nmero de telefonemas em quinze minutos for representada por Z, esta ter tambm distribuio de Poisson, sendo o parmetro determinado atravs da regra de trs simples, ou seja, se numa hora se espera haver trs telefonemas em mdia, em quinze minutos quantos telefonemas so esperados? Sendo a resposta igual a 0.75, consequentemente Z P (0.75), sendo a probabilidade pedida calculada atravs de P (Z = 1) = e0.75 0.751 ' 0.3543. 1!

Teorema 2.3.8 (Aproximao da Binomial de Poisson) A distribuio Binomial tende para a distribuio de Poisson quando o nmero de provas de Bernoulli tende para innito e a probabilidade de sucesso numa prova tende para zero, mantendo-se constante o produto np = , ou seja, X B(n, p) X P () se n + e p 0 de tal forma que np = . Regra: Na prtica utiliza-se a distribuio de Poisson como aproximao da distribuio Binomial quando simultaneamente n 20 Exemplo 2.3.8 Considerando que determinada fbrica produz um milho de baterias por ms e que a probabilidade de cada bateria estar defeituosa 0.00001, qual a probabilidade de, num ms, haver no mximo doze baterias com defeito? X B(1000000, 0.00001) Para ser calculada a probabilidade de a varivel aleatria X assumir um valor menor ou igual a doze utilizando a distribuio Binomial, tem que se calcular, por exemplo, combinaes de 72 e p 0.05.

um milho doze a doze, o que a maioria das mquinas de calcular no tem capacidade (dando erro); ento, aplicando o teorema da aproximao da distribuio Binomial de Poisson (visto que n 20 e p 0.05) vem que X B(1000000, 0.00001) = X P (1000000 0.00001) = X P (10), ento, P (X 12) = F (12) = 0.7916. (valor obtido utilizando a tabela da funo de distribuio da Poisson com parmetro = 10.)

73

2.4

Variveis aleatrias contnuas

Relembre-se que as variveis aleatrias so consideradas contnuas se o seu contradomnio um intervalo real ou uma coleco de intervalos reais. Tendo em conta que qualquer intervalo real contm um nmero innito (no numervel) de valores, impossvel denir uma funo de probabilidade (funo que associa a cada valor que a varivel pode assumir a sua respectiva probabilidade) para as variveis contnuas. Assim, nas variveis contnuas a probabilidade no estar denida para cada um dos valores que a varivel pode assumir (a probabilidade de uma varivel aleatria contnua ser igual a um determinado valor, qualquer que seja esse valor, sempre nula), mas, sim, em intervalos reais, sendo a probabilidade de uma varivel assumir um valor pertencente a um dado intervalo real determinada pela rea, nesse intervalo, compreendida entre o eixo (y = 0) e uma funo no negativa. Essa funo ser denominada por funo de densidade de probabilidade. 2.4.1 Funo de densidade de probabilidade

Denio 2.4.1 (Denio de funo de densidade de probabilidade) Chama-se funo de densidade de probabilidade, ou simplesmente funo de densidade, de uma varivel aleatria contnua a qualquer funo f (x) que satisfaa simultaneamente: 1. f (x) 0; 2.
+ R

f (x)dx = 1.

Propriedades 2.4.1 (Propriedades da funo de densidade) 1. P (a X b) = Rb


a

f (x)dx para quaisquer constantes a e b tais que a b;

2. P (X = k) = 0 para qualquer constante k.

74

Exemplo 2.4.1 Considere a seguinte funo:

0 0.1

x<0 0x<5 .

f (x) =

1. Verique que f (x) uma funo de densidade. (a) f (x) 0.

0.04x 0.2 5 x < 10 0 x 10

A funo de densidade nunca negativa. O nico problema que poderia surgir seria no intervalo 5 x < 10, mas 0.04x 0.2 0 x 5, logo, mesmo neste intervalo, a funo no assume valores negativos. + R (b) f (x)dx = 1.
+ + Z Z0 Z5 Z10 Z f (x)dx = 0dx + 0.1dx + (0.04x 0.2)dx + 0dx = 0 5 10

10 x2 5 0.2x + 0 = = 0 + [0.1x]0 + 0.04 2 5 102 52 = 0.5 + 0.04 0.2 10 0.04 0.2 5 = 2 2 = 0.5 + 2 2 0.5 + 1 = 1

2. Determine as seguintes probabilidade: (a) P (X < 3). P (X < 3) = P (X 3) = = Z0 0dx + Z3


0

Z3

f (x)dx =

0.1dx = 0 + [0.1x]3 = 0.3 0 = 0.3. 0

75

(b) P (X > 2).


+ + Z Z5 Z10 Z P (X > 2) = f (x)dx = 0.1dx + (0.04x 0.2)dx + 0dx = 2 2 5 10

10 x2 5 = [0.1x] 2 + 0.04 0.2x + 0 = 2 5 2 52 10 0.2 10 0.04 0.2 5 = = 0.5 0.2 + 0.04 2 2 = 0.3 + 2 2 0.5 + 1 = 0.8

(c) P (1 < X < 8). P (1 < X < 8) = Z8


1

f (x)dx =

8 x2 5 = [0.1x] 1 + 0.04 0.2x = 2 5 2 8 52 = 0.5 0.1 + 0.04 0.2 8 0.04 0.2 5 = 2 2 = 0.4 + 1.28 1.6 0.5 + 1 = 0.58. 2.4.2 Funo de distribuio

Z5
1

0.1dx +

Z8
5

(0.04x 0.2)dx =

Tal como nas variveis aleatrias discretas, chama-se funo de distribuio funo real de varivel real F (x) = P (X x), sendo, nas variveis aleatrias contnuas, determinada por F (x) = P (X x) = Exemplo 2.4.2 Em relao funo de densidade utilizada no ltimo exemplo (exemplo2.4.1 na pgina 75), a funo de distribuio correspondente : Para x < 0 F (x) = P (X x) = Zx Zx Zx f (t)dt. (35)

f (t)dt =

0dt = 0.

76

Para 0 x < 5 F (x) = P (X x) = Para 5 x < 10 F (x) = P (X x) = Zx f (t)dt =


2

Zx

f (t)dt =

Z0

0dt +

Zx
0

0.1dt = [0.1t]

x 0

= 0.1x.

x t 5 = 0 + [0.1t] 0 + 0.04 0.2t = 2 5 2 x 52 = 0.5 + 0.04 0.2x 0.04 0.2 5 = 2 2 = 0.5 + 0.02x2 0.2x 0.5 + 1 = 0.02x2 0.2x + 1 Para x 10 F (x) = P (X x) = Zx f (t)dt = Z0 0dx + Z5
0

Z0

0dt +

Z5
0

0.1dt +

Zx
5

(0.04t 0.2)dt =

Z10 Zx 0.1dt + (0.04t 0.2)dt + 0dt = 1.


5 10

Propriedades 2.4.2 (Propriedades da funo de distribuio)

Resumindo, a funo de distribuio igual a 0 x<0 0.1x 0x<5 . F (x) = P (X x) = 0.02x2 0.2x + 1 5 x < 10 1 x 10

1. Para qualquer funo de distribuio F (x), tem-se 0 F (x) 1; 2. F (x) no decrescente (constante ou crescente); 3. lim F (x) = 0 e lim F (x) = 1;
x x+

4. F (x) contnua. 77

Nota: Em relao s propriedades da funo de distribuio apresentadas aquando das variveis aleatrias discretas apenas existe uma diferena, nas variveis aleatrias discretas a funo de distribuio apenas contnua direita, enquanto que nas variveis aleatrias contnuas a funo de distribuio contnua. Teorema 2.4.1 Para qualquer funo de distribuio F (x), dados os nmeros reais x1 e x2 tais que x1 < x2 , tem-se P (x1 < X x2 ) = P (X x2 ) P (X x1 ) = F (x2 ) F (x1 ). Ver demonstrao na pgina 41. Nota: Tendo em conta que, para qualquer varivel aleatria contnua, P (X = k) = 0 para qualquer valor de k, ter P (x1 < X x2 ) o mesmo que ter P (x1 X x2 ), P (x1 X < x2 ) ou P (x1 < X < x2 ). Exemplo 2.4.3 Considerando a funo de distribuio determinada no exemplo anterior (exemplo 2.4.2), 1. P (X < 3) = P (X 3) = F (3) = 3 0.1 = 0.3; 2. P (X > 2) = 1 P (X 2) = 1 F (2) = 1 2 0.1 = 0.8; 3. P (X 8) = F (8) = 0.02 82 0.2 8 + 1 = 1.28 1.6 + 1 = 0.68; 4. P (1 < X < 8) = F (8) F (1) = (0.02 82 0.2 8 + 1) 0.1 1 = 0.68 0.1 = 0.58. 2.4.3 Valor esperado e varincia de uma varivel aleatria contnua

As medidas utilizadas para analisar a localizao e a disperso das variveis aleatrias contnuas so as mesmas que foram utilizadas nas variveis aleatrias discretas, ou seja, o valor esperado 78

ser utilizado como medida de localizao e a varincia e o desvio padro como medidas de disperso. Saliente-se que a interpretao destas medidas feita de forma anloga apresentada aquando da apresentao das variveis aleatrias discretas, sendo a nica alterao a forma como estas medidas so determinadas.

Medida de localizao
Denio 2.4.2 (Denio de valor esperado de uma varivel aleatria contnua) O valor esperado (esperana matemtica ou valor mdio) de uma varivel aleatria contnua representado por E(X) ou X e denido por
+ Z xf (x)dx. E(X) = X = + R

(36)

que s existe se o integral for absolutamente convergente, ou seja, se Nota:

|x| f (x)dx < .

Repare nas semelhanas da frmula apresentada com a frmula (14) na pgina 43. Saliente-se que a nica diferena a utilizao do integral no clculo do valor esperado de uma varivel aleatria contnua em vez do somatrio (ou srie) utilizado no clculo do valor esperado de uma varivel aleatria discreta. Exemplo 2.4.4 Em relao varivel aleatria que tem sido utilizada nos ltimos exemplos (ver funo de densidade de probabilidade no exemplo 2.4.1 na pgina 75), tem-se
+ Z xf (x)dx = E(X) =

79

5 10 x3 x2 x2 + 0.04 +0= 0.2 = 0 + 0.1 2 0 3 2 5 103 102 53 52 52 + 0.04 0.2 0.04 0.2 = = 0.1 2 3 2 3 2 5 5 65 5 40 + 10 + = = 4 3 3 2 12 Denio 2.4.3 Seja g(X) uma funo real de varivel real qualquer, ento,
+ Z g(x)f (x)dx. E [g(X)] =

Z0

(x 0)dx +

Z5
0

(x 0.1)dx +

Z10
5

+ Z [x (0.04x 0.2)] dx + (x 0)dx = 10

(37)
+ R

que s existe se o integral for absolutamente convergente, ou seja, se Nota:

|g(x)| f (x)dx < .

As propriedades do valor esperado das variveis aleatrias discretas apresentadas nas pginas 45 e 58 mantm-se vlidas para os valores esperados das variveis aleatrias contnuas.

Medida de Disperso
A varincia de uma varivel aleatria denida (ver denio 2.2.4) como sendo o valor esperado da expresso [X E(X)]2 , ou seja, 2 = E[(X X )2 ]. X No caso de a varivel aleatria ser contnua a varincia pode ser calculada atravs de:
+ Z 2 = V ar(X) = (x )2 f (x)dx.

(38)

onde = E (X). O desvio padro, tal com nas variveis aleatria discretas, denido como sendo a raiz quadrada positiva da varincia, ou seja, representando o desvio padro por , vem p = + V ar(X). 80

No entanto, tal como nas variveis aleatrias discretas, os clculos da varincia no so usualmente efectuados pela sua denio, mas sim, pela frmula de Kning [ver frmula (19) na pgina 47], que 2 = E(X 2 ) E 2 (X). X Exemplo 2.4.5 Continuando a utilizar a funo de densidade do exemplo 2.4.1 para calcular a varincia 65 necessrio saber E(X) que j foi determinado no exemplo 2.4.4 onde obteve-se E(X) = 12 2 2 e o valor esperado de X . Para determinar E(X ) utiliza-se a frmula (37) da pgina 80 considerando que g(x) = x2 , de onde se obtm:
+ Z x2 f (x)dx = E(X ) = 2

5 10 x4 x3 x3 + 0.04 +0= 0.2 = 0 + 0.1 3 0 4 3 5 104 103 54 53 53 + 0.04 0.2 0.04 0.2 = = 0.1 3 4 3 4 3 200 25 25 475 25 + 100 + = = 6 3 4 3 12 ento, para a varincia de X, vem 2 X 475 = E(X ) E (X) = 12
2 2

Z0

0dx +

Z5
0

+ Z10 Z 2 0.1x dx + (0.04x 0.2)x dx + 0dx = 2 5 10

65 12

1475 ' 10.24305556, 144

e para o desvio padro vem X ' Nota: As propriedades da varincia apresentadas nas pginas 49 e 58 mantm-se vlidas para a varincia das variveis aleatrias contnuas. 10.24305556 ' 3.2005.

81

2.5

Distribuies Contnuas de Probabilidade

Neste captulo vai-se apresentar um conjunto de distribuies que surgem correntemente nas cincias empricas. Assim, vo ser abordadas cinco distribuies contnuas: a Uniforme, a Exponencial, a Normal, a Qui-quadrado e a t-Student. 2.5.1 Distribuio Uniforme

Considera-se que uma varivel aleatria contnua X tem distribuio Uniforme no intervalo [a, b] com a < b, representando-se por X U(a, b), se a sua funo de densidade for: 1 axb ba . f (x) = 0 x<a x>b Teorema 2.5.1

(39)

Se X uma varivel aleatria com distribuio Uniforme no intervalo [a, b], ou seja, X U (a, b), ento E(X) = Demonstrao: a+b (b a)2 e V ar(X) = . 2 12 (40)

+ Z Za Zb xf (x)dx = 0dx + E(X) = a

x dx + ba

+ b Z 1 x2 0dx = 0 + +0= ba 2 a b

1 (b a)(b + a) b+a (b2 a2 ) = = . 2(b a) 2(b a) 2

Para calcular a varincia necessrio determinar antes o E(X 2 ),


+ Z Za Zb x2 f (x)dx = 0dx + E(X 2 ) = a 3 3

1 2 x dx + ba

+ b Z 1 x3 0dx = 0 + +0= ba 3 a b

(b a ) 1 (b3 a3 ) = , 3(b a) 3(b a)

82

logo V ar(X) = = = = 2 b3 a3 b+a E(X ) E (X) = = 3(b a) 2 b2 + 2ba + a2 b3 a3 = 3(b a) 4 4b3 4a3 3b3 6b2 a 3ba2 + 3b2 a + 6ba2 + 3a2 = 12(b a) b3 3b2 a + 3ba2 a3 (b a)3 (b a)2 = = . 12(b a) 12(b a) 12
2 2

obtendo-se, assim, o resultado pretendido. Exemplo 2.5.1 Considere que a varivel aleatria contnua X tem distribuio Uniforme no intervalo [1, 1], ento, a sua funo de densidade 1 1 x 1 2 f (x) = . 0 x < 1 x > 1

1. Qual o valor esperado e a varincia da varivel aleatria X? E(X) = a + b 1 + 1 (b a)2 [1 (1)]2 22 4 1 = = 0 e V ar(X) = = = = = . 2 2 12 12 12 12 3

2. Qual a probabilidade da varivel aleatria X assumir um valor negativo? P (X < 0) = Z0 f (x)dx =


1 Z

0dx +

Z0

0 1 1 1 1 = 0 (1) = = 0.5. dx = 0 + x 2 2 1 2 2

2.5.2

Distribuio Exponencial

Considera-se que uma varivel aleatria contnua X tem distribuio Exponencial com parmetro , representando-se por X Exp(), se a sua funo de densidade for: ex x > 0 f (x) = , para > 0. 0 x0 83

(41)

Teorema 2.5.2 Se a varivel aleatria X tem distribuio Exponencial com parmetro , ou seja, X Exp(), ento E(X) = Demonstrao:
+ + Z Z Za x E(X) = xf (x) dx = xe dx = lim xex dx a 0 0

1 1 e V ar(X) = 2 .

(42)

f (x) = ex e g (x) = x,

que utilizando a primitivao por partes, P (f g) = F g P (F g 0 ), considerando 1 P xex = xex + P ex = xex ex Za


0

logo lim

xe

a 1 x x dx = lim xe e = a 0 1 a 1 0 a = = lim ae e 0 e a 1 1 = 0 0 + 0 + = .

Utilizando, de forma semelhante, a primitivao por partes, obtm-se


+ + Z Z 2 2 x f (x) dx = x2 ex dx = 2 , E(X ) = 2 0

logo 2 V ar (X) = E X 2 E 2 (X) = 2 Exemplo 2.5.2

2 1 1 = 2.

Considere que a varivel aleatria contnua X tem distribuio Exponencial com mdia quatro, 84

ento, o parmetro da distribuio assume o valor varivel aleatria X

1 1 ( = ) e a funo de densidade da 4 4

1. P (X < 12) =

x 1 e 4 x>0 f (x) = . 4 0 x0 Z12 f (x)dx = Z0 0dx + Z12


0

1 4 12 1 0 4 e = e3 + e0 = 1 e3 ' 0.9502. = e 2. " x #+ + + x Z Z 1 e 4 dx = e 4 P (X > 4) = f (x)dx = = 4 4 4 4 x 4 = lim e 4 e 4 ,


x+

h 1 i12 1 1x e 4 dx = 0 e 4 x = 4 0

x como lim e 4 = 0, vem


x+

x 4 lim e 4 e 4 = 0 e1 = e1 ' 0.3679.


x+

Teorema 2.5.3 Seja X uma varivel aleatria discreta com distribuio de Poisson com parmetro . A varivel aleatria que conta o tempo entre dois sucessos consecutivos da varivel aleatria X uma nova varivel aleatria contnua Y que tem distribuio Exponencial com parmetro .

Exemplo 2.5.3 Considere que o nmero de carros que passam em determinada ponte tem distribuio de Poisson com mdia dois por hora. Considerando que acabou de passar um carro: 85

1. qual a probabilidade de ter de esperar mais de uma hora at que passe outro carro? Considerando que o nmero de carros que passam na ponte numa hora descrito por uma varivel aleatria X que tem distribuio de Poisson com parmetro dois (recordando que o parmetro da distribuio de Poisson igual sua mdia), ou seja, X P (2), pelo teorema 2.5.3 o tempo que decorre entre a passagem de dois carros na ponte descrito por uma nova varivel Y que tem distribuio Exponencial com parmetro 2, Y Exp(2), sendo a sua funo de densidade 2e2y y > 0 f (y) = . 0 y0

Assim, a probabilidade pretendida pode ser determinada por


+ + Z Z + f (y) dy = 2e2y dy = e2y 1 = 0 e2 ' 0.1353. P (Y > 1) = 1 1

2. qual a probabilidade ter de esperar menos de trinta minutos at que passe outro carro? Considerando que trinta minutos meia hora (se a varivel aleatria utilizada com distribuio de Poisson referia-se a uma hora, cada unidade da varivel aleatria Y corresponder mesma medida), a probabilidade pretendida :

P (Y < 0.5) =

0.5 = 0 e2y 0 = e1 1 ' 0.6321. 3. qual a probabilidade de ter de esperar entre quinze e quarenta e cinco minutos at que passe outro carro? Considerando que quinze minutos 0.25 de uma hora e quarenta e cinco minutos 0.75

0.5 Z

f (y) dy =

Z0

0.5 Z 0dy + 2e2y dy = 0

86

de uma hora, a probabilidade pretendida :


0.75 0.75 Z Z P (0.25 < Y < 0.75) = f (y) dy = 2e2y dy = 0.25 0.25

0.75 = e2y 0.25 = e1.5 e0.5 ' 0.3834.

2.5.3

Distribuio Normal

A distribuio Normal surgiu no sculo XV III pelos trabalhos realizados por De Moivre, Laplace e Gauss (sendo, por isso, tambm denominada por distribuio de Gauss ou Gaussiana). A distribuio Normal a distribuio com maior importncia em estatstica, pois muitas variveis com distribuio diferente da Normal (como so exemplo as distribuies Binomial, Hipergeomtrica e de Poisson) podem ser aproximadas, sob certas condies, de um modo simples numa outra varivel com distribuio Normal. Diz-se que uma varivel aleatria contnua tem distribuio Normal com parmetros e , representada por X N(, ), se a sua funo de densidade de probabilidade for da seguinte forma:
1 f (x) = e 2

(x )2 2 2 , para > 0 e , x R.

(43)

Propriedades 2.5.1 (Propriedades da distribuio Normal) Considerando uma varivel aleatria X N(, ) tem-se: 1. O valor esperado da varivel aleatria X igual a , ou seja, E(X) = . 2. O desvio padro da varivel aleatria X igual a , sendo a varincia igual a 2 , ou seja, V ar(X) = 2 . 3. A funo de densidade de uma varivel aleatria com distribuio Normal simtrica em relao sua mdia.

87

0.3

0.2

0.1

0 -5 -2.5 0 2.5 x 5

Funo de densidade de uma varivel aleatria com distribuio Normal de mdia nula e desvio padro igual a um.

Tendo em conta que no possvel primitivar a funo de densidade da distribuio Normal pelos mtodos elementares do clculo integral, as probabilidades das variveis aleatrias com distribuio Normal so calculadas recorrendo a uma tabela. Nesta distribuio, pelo facto de ser contnua, utiliza-se a tabela da funo de distribuio F (x) = P (X x). No entanto, s existem tabelados os valores da funo de distribuio para a distribuio Normal com mdia zero e desvio padro igual a 1 (representada por Z e denominada por Normal standard) cuja funo de distribuio representada por P (Z z) = (z) (tabela apresentada no nal do captulo na pgina 126). Assim, o prximo teorema permite a transformao de qualquer varivel aleatria com distribuio Normal noutra varivel com distribuio Normal com mdia zero e desvio padro 1 (Normal standard). Teorema 2.5.4 Se X uma varivel aleatria com distribuio Normal com mdia e desvio padro , ou seja, X N(, ), ento, Z= X N(0, 1). (44)

Outro problema prtico na utilizao das tabelas a existncia da funo de distribuio apenas para valores positivos. Tendo em conta que a distribuio Normal simtrica em torno da sua mdia e, em particular, a varivel Z simtrica em torno do ponto zero, este problema 88

pode ser resolvido utilizando o seguinte teorema. Teorema 2.5.5 Considerando que Z N(0, 1), ento, P (Z z) = P (Z z) = 1 P (Z < z), ou seja, (z) = 1 (z).

Exemplicao da frmula P (Z z) = P (Z z)

Exemplo 2.5.4 Considere que o tempo que determinada tarefa demora na sua realizao uma varivel aleatria com distribuio Normal com mdia igual a 5 ( = 5) e desvio padro igual a 2 ( = 2) [X N(5, 2)]. 1. Pretende-se calcular a probabilidade de: (a) P (X 7).

75 P (X 7) = P Z = P (z 1) = (1) = 0.8413, 2

onde o valor de (1) foi retirado da tabela da funo de distribuio da varivel aleatria Z (Normal standard) apresentada no m do captulo. 89

(b) P (X > 10.04). 10.04 5 P Z> = P (Z > 2.52) = 1 P (Z 2.52) = 2 = 1 (2.52) = 1 0.9941 = 0.0059. (c) P (X < 3). P (X < 3) = (1) = 1 (1) = 1 0.8413 = 0.1587. (d) P (1 < X < 11). P (1 < X < 11) = P (2 < Z < 3) = P (Z < 3) P (Z 2) = = (3) (2) = (3) [1 (2)] = = (3) 1 + (2) = 0.9987 1 + 0.9772 = 0.9759. 2. (a) Determinar a tal que P (X < a) = 0.6915. a5 = 0.6915 P (X < a) = 0.6915 2 a5 = 0.5 a = 6. 2 a5 = 0.6915 foi retirado da tabela da funo de distribuio da onde o valor 2 varivel Z (normal standard) apresentada no nal do captulo. (b) Determinar b tal que P (X < b) = 0.0202. b5 P (X < b) = 0.0202 2 = 0.0202

tendo em conta que este valor no aparece na tabela, tem-se que recorrer probabilidade do seu simtrico, b5 b5 = 0.0202 = 1 0.0202 2 2 b5 b5 = 0.9798 = 2.05 b = 0.9. 2 2 90

Teorema 2.5.6 (Estabilidade da lei Normal) Sejam X1 , X2 , , Xn , n variveis aleatrias independentes com distribuio Normal, ou seja, Xi N(i , i ) para i = 1, 2, , n, ento X = a + b1 X1 + + bn Xn = a + Nota:
n X i=1

bi Xi N a +

n X i=1

v u n uX bi i , t b2 2 . i i
i=1

(45)

Para determinar os valores dos parmetros da distribuio poder-se-ia utilizar as propriedades do valor esperado e da varincia presentes na pgina 59, assim, E (X) = E (a + b1 X1 + + bn Xn ) = = a + b1 E (X1 ) + + bn E (Xn ) = n X bi i = a + b1 1 + + bn 2 = a +
i=1

V ar (X) = V ar (a + b1 X1 + + bn Xn ) =

que pela independencia das variveis, vem = b2 V ar (X1 ) + + b2 V ar (Xn ) = 1 n n X 2 2 2 2 = b1 1 + + bn n = b2 2 i i


i=1

Exemplo 2.5.5 Considere as variveis aleatrias independentes X1 e X2 tais que X1 N(5, 3) e X2 N(10, 4). Determinar a probabilidade da varivel aleatria Y ser inferior a dez sabendo que Y = 10 + 3X1 2X2 . Pelo frmula (2.5.6), como a varivel aleatria Y surge de uma transformao linear de variveis aleatrias independentes com distribuio Normal, a varivel aleatria Y tambm possui distribuio Normal. Para determinar os valores dos parmetros da distribuio podem-se utilizar as propriedades do valor esperado e da varincia (ver propriedades 2.2.4 na pgina 58)

91

em vez das frmulas apresentadas no teorema. Assim, para o primeiro parmetro tem-se E(Y ) = E(10 + 3X1 2X2 ) = = 10 + 3E(X1 ) 2E(X2 ) = = 10 + 3 5 2 10 = 5 e para o segundo parmetro, uma vez que as variveis aleatrias X1 e X2 so independentes, vem a raiz quadrada de V ar(Y ) = V ar(10 + 3X1 2X2 ) = = 32 V ar(X1 ) + (2)2 V ar(X2 ) = = 9 32 + 4 42 = 145 Y = 145, ento Y N(5, 145) e 10 5 ' (0.415227), P (Y < 10) = P Z < 145 que, tendo em conta que a tabela s utiliza duas casas decimais, (0.415227) ' (0.42) = 0.6628. Como foi referido na introduo distribuio Normal, uma das razes pela qual esta distribuio muito importante deve-se ao facto de muitas variveis aleatrias com distribuio diferente da Normal, sob certas condies, poderem ser aproximadas por outra varivel aleatria com distribuio Normal. O seguinte teorema exemplica este facto utilizando a distribuio Binomial. Teorema 2.5.7 (Aproximao da distribuio Binomial pela distribuio Normal) A distribuio Binomial tende para a distribuio Normal se o nmero de provas de Bernoulli tende para innito, isto , X B(n, p) X 0 N(, ) se n +, sendo = np e 2 = n p (1 p). Regra: 92

(46)

Este teorema utilizado, na prtica, se simultaneamente se verica n p 15 e n (1 p) 15.

Saliente-se que neste teorema se aproxima uma varivel aleatria discreta X por uma outra varivel aleatria que contnua X 0 ; como tal, ser incorrecto fazer simplesmente P (X = k) = P (X 0 = k) pois P (X 0 = k) = 0 para todos os valores de k. Para colmatar este problema necessrio utilizar a correco de continuidade que, neste caso, P (X = k) ' P (k 0.5 < X 0 k + 0.5). Exemplos 2.5.6 1. Considere a varivel aleatria X com distribuio Binomial com cem provas de Bernoulli e probabilidade de sucesso em cada prova igual a 0.2, ou seja, X B(100, 0.2). Utilizando a aproximao pela distribuio Normal, determinar: (a) P (X = 22). Tendo em conta que as condies n p = 100 0.2 = 20 15 e n (1 p) = 100 (1 0.2) = 80 15, vericam-se, pode ser utilizada a aproximao pela distribuio Normal, sendo = n p = 20 e =

(47)

ento X 0 N(20, 4) e utilizando a frmula (47) vem 21.5 20 22.5 20 0 P (X = 22) ' P (21.5 < X 22.5) = P <Z 4 4 = P (0.375 < Z 0.625) = (0.625) (0.375) ' ' (0.63) (0.38) = 0.7357 0.6480 = 0.0877. 93

p n p (1 p) = 4,

(b) P (X 28). P (X 28) ' P (X 0 27.5) = P (Z 1.875) = = 1 P (Z < 1.875) = 1 (1.875) ' ' 1 (1.88) = 1 0.9699 = 0.0301. (c) P (X 32). P (X 32) ' P (X 0 32.5) = P (Z 3.125) = = (3.125) ' (3.13) = 0.9991. (d) P (X < 12). P (X < 12) ' P (X 0 < 11.5) = P (Z < 2.125) = (2.125) = = 1 (2.125) ' 1 (2.13) = 1 0.9834 = 0.0166. (e) P (17 X 23). P (17 X 23) ' P (16.5 X 0 23.5) = P (0.875 Z 0.875) = = (0.875) (0.875) = (0.875) 1 + (0.875) = = 2(0.875) 1 ' 2(0.88) 1 = 2 0.8106 1 = 0.6212. (f) P (15 < X 30). P (15 < X 30) ' P (15.5 < X 0 30.5) = P (1.125 < Z 2.625) = = (2.625) (1.125) = (2.625) 1 + (1.125) ' ' (2.63) 1 + (1.13) = 0.9957 1 + 0.8708 = 0.8665. 2. Considere a experincia aleatria que consiste em fazer duzentos lanamentos de um dado em que se deseja saber o valor da probabilidade de sair a face seis em mais de trinta e cinco lanamentos. Tendo em conta que a probabilidade de sair a face seis igual em 94

todos os lanamentos, a varivel aleatria que conta o nmero de vezes que sai a face seis tem distribuio Binomial com duzentas provas e com probabilidade de sucesso em 1 1 cada prova igual a , ou seja, X B 200, sendo a probabilidade pretendida igual 6 6 a P (X > 35). Caso se pretenda utilizar a aproximao distribuio Normal, tendo em conta que 1 1 = 33.(3) 15 e n (1 p) = 200 (1 ) = 166.(6) 15 6 6 p vem X 0 N(, ), onde = n p = 33.(3) e = n p (1 p) ' 5.27046, ento, n p = 200 P (X > 35) ' P (X 0 > 35.5) ' P (Z > 0.4111) = = 1 P (Z 0.4111) ' 1 P (Z 0.41) = = 1 0.6591 = 0.3409. Teorema 2.5.8 (Aproximao da distribuio de Poisson pela distribuio Normal) A distribuio de Poisson tende para a distribuio Normal se o parmetro tender para innito, isto , X P () X 0 N(, ) se +, sendo = e 2 = . Regra: Este teorema utilizado, na prtica, quando se verica > 20. Saliente-se que neste teorema se aproxima uma varivel aleatria discreta X por uma outra varivel aleatria que contnua X 0 (tal como na aproximao da Binomial Normal); como tal, ser necessrio utilizar a correco de continuidade (ver frmula (47) na pgina 93). Exemplos 2.5.7

(48)

95

1. Considere a varivel aleatria X com distribuio de Poisson com mdia 100. Qual a probabilidade de a varivel assumir um valor superior a 110? Tendo em conta que = 100 > 20 pode-se utilizar a aproximao distribuio Normal, obtendo-se X 0 N 100, 100 , ou seja

X 0 N (100, 10) 110.5 100 0 = P (Z > 1.05) = ento P (X > 110) ' P (X > 110.5) = P Z > 10 = 1 (1.05) = 1 0.8531 = 0.1469. 2. Considerando que X P (400), determine P (X < 440). Visto que = 400 > 20, vai-se utilizar a aproximao distribuio Normal, vericando-se X 0 N 400, 400 , ou seja

X 0 N (400, 20) 439.5 400 0 = P (Z < 1.975) ' sendo P (X < 440) ' P (X < 439.5) = P Z < 20 ' P (Z < 1.98) = 0.9761. Teorema 2.5.9 (Teorema do limite central) Sejam X1 , X2 , , Xn , n variveis aleatrias independentes e identicamente distribuidas (i.i.d .) com E(Xi ) = e V ar(Xi ) = 2 , ento, fazendo n tender para innito, a varivel aleatria n P Xi tem disX denida pela soma das variveis anteriores X = X1 + X2 + + Xn =
i=1

tribuio aproximadamente Normal, ou seja, X= Regra:


n X i=1

Xi N n, n quando n +.

(49)

Na prtica utiliza-se o teorema do limite central quando n 30. 96

Nota: Para determinar os valores dos parmetros da distribuio poder-se-a utilizar as propriedades do valor esperado e da varincia presentes na pgina 59, ! n n n X X X Xi = E (Xi ) = = n; E (X) = E
i=1

V ar (X) = V ar

que pela independencia das variveis, vem n n X X = V ar (Xi ) = 2 = n 2 = X = n 2 = n.


i=1 i=1

n X
i=1

Xi

i=1

i=1

Exemplos 2.5.8 1. Considere que o lucro, num dia de trabalho de uma loja da empresa TudoVende, tem valor esperado 10000 euros e desvio padro 1000 euros sendo o lucro de um dia independente do dos restantes dias. Qual a probabilidade de, num ano de trabalho (considere-se 300 dias teis), o lucro desta loja ser superior a 3 050 000 euros? Seja Li , com i = 1, , 300, as variveis aleatrias que representam o lucro em cada dia da loja. Sabe-se que estas variveis so independentes e que E (Li ) = 10000 e V ar (Li ) = 10002 . A probabilidade pedida P 300 X
i=!

Li > 3 050 000

que, tendo em conta que se est a somar trezentas variveis (n 30) independentes e indenticamente distribuidas (i.i.d .), pelo teorema do limite central vem
n X i=1 300 X i=1 300 X i=1

Li N n, n

Li N 300 10 000, 300 1000 Li N (3 000 000, 17320.50808) 97

logo P 300 X
i=1

Li > 3 050 000

3 050 000 3 000 000 ' = P Z> 17320.50808 ' P (Z > 2.886751345) ' 1 P (Z 2.89) = = 1 0.9981 = 0.0019.

2. Somam-se 100 nmeros arredondados ao inteiro mais prximo. Supondo que o erro cometido nos arredondamentos tem distribuio uniforme no intevalo [0.5, 0.5] e que o erros so independentes, calcule a probabilidade de o erro cometido na soma (em valor absoluto) ser inferior a duas unidades. Considere-se que os erros so representados pelas variveis aleatrias Xi com i = 1, , 100. Assim as variveis Xi U (0.5, 0.5) pretendendo-se determinar ! 100 X Xi < 2 . P
i=1

Considerando que as variveis aleatrias Xi so independentes e identicamente distribuidas

(i.i.d.), pode-se recorrer ao teorema do limite central, pois n 30, de onde se conclui que
100 X i=1

sendo = E (Xi ) = 2

Xi N n, n

0.5 + (0.5) =0 2 r 1 3 (0.5 (0.5))2 1 = V ar (Xi ) = = = = 12 12 12 6

onde foram utilizadas as frmulas (40) patentes na pgina 82, ento ! 100 X 3 Xi N 100 0, 100 6 i=1 100 X 5 Xi N 0, 3 . 3 i=1 98

A probabilidade pretendida , ento, obtida por ! ! 100 100 X X = P 2 < Xi < 2 Xi < 2 = P i=1 i=1 ! 2 0 20 < Z < 5 ' = P 5 3 3 3 3 ' P (0.69282 < Z < 0.69282) = = P (Z < 0.69282) P (Z 0.69282) = = P (Z < 0.69282) 1 + P (Z < 0.69282) = = 2 P (Z < 0.69282) 1 ' ' 2 P (Z < 0.69) 1 = 2 0.7549 1 = 0.5098. 2.5.4 Distribuio Qui-Quadrado

Diz-se que uma varivel aleatria contnua tem distribuio Qui-Quadrado com n graus de liberdade (com n N), representada por X 2 , se a sua funo de densidade de (n) probabilidade dada por: x n 1 e 2x2 f (x) = n , x>0 n 22 2 10 onde (.) representa a funo Gama.

Teorema 2.5.10 Se a varivel aleatria X tem distribuio Qui-quadrado com n graus de liberdade, ou seja, X 2 , ento (n) E(X) = n e V ar(X) = 2n. (50)

No clculo de probabilidades utilizando a distribuio Qui-quadrado, tal como acontecia na distribuio Normal, vai-se utilizar tabelas (ver pgina 128) onde esto presentes os valores da
10

A funo Gama denida por (n) =

(n) = (n 1)!.

R +
0

ex xn1 dx. No caso particular em que n N verica-se que

99

funo de distribuio desta varivel, ou seja, recorre-se tabela para determinar probabilidades do tipo P 2 x . (n) Exemplo 2.5.9 Considere uma varivel aleatria X com distribuio Qui-quadrado com 10 graus de liberdade h i X 2 . Determine: (10) 1. P (X 10.473) . para determinar esta probabilidade, tendo em conta que pedida a funo de distribuio [P (X x)] no ponto x = 10.473, vai-se tabela procurar este valor na linha correspondente a n = 10 (graus de liberdade). Assim, este valor corresponde a = 0.6, ou seja, a probabilidade igual a 0.6, P (X 10.473) = 0.6. 2. P (X > 3.247) . P (X > 3.247) = 1 P (X 3.247) = que recorrendo tabela vem = 1 0.025 = 0.975. 3. P (X 5) . Neste caso, o valor 5 no se encontra na tabela. Assim, vai-se tabela procurar os dois valores adjacentes, ou seja, o valor imediatamente inferior e o imediatamente superior, que neste caso corespondem a x = 4.8652 com = 0.1 e a x = 5.5701 com = 0.15. Assim vai-se fazer um interpolao linear para obter uma aproximao do valor de correspondente a x = 5. Seja o valor de correspondente representado por 0 . Assim,

100

tem-se Valores de x Valores de 4.8652 5 5.5701 0.10 0 =? 0.15

Ento, uma das formas de fazer interpolao linear ser resolver 5.5701 4.8652 0.15 0.10 = 5.5701 5 0.15 0 de onde se obtm 0 ' 0.10956, logo P (X 5) ' 0.10956. 4. o valor de a tal que P (X a) = 0.20. Para determinar este valor, tendo em conta que pedida a funo de distribuio [P (X x)] com = 0.2, vai-se tabela procurar este valor na linha correspondente a n = 10 (graus de liberdade) e coluna correspondente a 0.2. Assim, este valor corresponde a 6.1791, ou seja, o valor de a igual a 6.1791. 5. o valor de b tal que P (X > b) = 0.95. P (X > b) = 0.95 1 P (X b) = 0.95 P (X b) = 0.05 b = 3.9403. 6. o valor de c tal que P (X < c) = 0.075. Neste caso, o valor = 0.075 no se encontra na tabela. Assim, vai-se tabela procurar os dois valores adjacentes, ou seja, o valor imediatamente inferior e o imediatamente superior, que neste caso corespondem a = 0.05 com x = 3.9403 e = 0.10 com x = 4.8652. Assim vai-se utilizar a interpolao linear para obter um valor aproximado

101

para x quando = 0.075. Assim, tem-se Valores de x Valores de 3.9403 x0 4.8652 0.05 0.075 0.10

Ento, uma das formas de fazer interpolao linear ser resolver 4.8652 3.9403 0.10 0.05 = 0 3.8652 x 0.10 0.075 de onde se obtm c ' 3.4028. Nota: Considere-se que se tem os seguintes valores: Valores de x Valores de x1 x x2 1 2

onde x1 , x2 , 1 , 2 so valores conhecidos pretendendo-se determinar, atravs de uma interpolao linear, o valor de ou o valor de x (um destes valores supe-se conhecido sendo o outro valor o que se pretende determinar). Uma frmula que poder ser utilizada 2 1 x2 x1 = . x2 x 2 Teorema 2.5.11 Considere-se um conjunto de n variveis aleatrias Zi (i = 1, 2, , n) obedecendo s seguintes condies: i) Cada varivel Zi segue uma distribuio Normal standard [ou seja Zi N(0, 1)]; 102 (51)

ii) As variveis Zi so independentes (os valores que cada varivel assume no so condicionados pelos valores das restantes). A varivel aleatria X, obtida pela soma de n variveis Zi elevadas ao quadrado, segue uma distribuio Qui-quadrado com n graus de liberdade (com n N), representada por X 2 , ou seja, se (n) X= Exemplo 2.5.10 Considere que a empresa DelFonte vende gua em garrafas de 1.5 litros. Para engarrafar a gua utilizada uma mquina que comete um erro de medida (em mililitros) em cada garrafa representado pela varivel aleatria Ei (que so independentes de garrafa para garrafa), que vai aumentando ao longo do tempo de utilizao da maquina sendo necessrio a certa altura consertar a maquina. Para testar se os erros ao engarrafar j so sucientemente elevados para consertar a mquina a empresa testa periodicamente um lote de n garrafas. Se, no lote, se vericar que a soma dos erros ao quadrado so superiores a n a mquina consertada, caso contrrio signica que os erros so insignicantes. Suponha que, em determinada altura o erros seguem uma distribuio Normal standard, qual a probabilidade de, ao testar um lote de 100 garrafas, a mquina ter que ir ser consertada? Tem-se que o erro ao engarrafar a garrafa i, seja Ei , segue uma distribuio Normal standard, ou seja, Ei N (0, 1) e pretende-se determinar ! n X Ei2 > n , P
i=1 n X i=1 2 2 2 Zi2 = Z1 + Z2 + + Zn , ento X 2 . (n)

que tendo em conta que o lote testado constitudo por 100 garrafas, n = 100, vem 100 ! X P Ei2 > 100
i=1

que como

100 X i=1

E 2 a soma de 100 variveis aleatrias independentes com distribuio Normal 103

standard, pelo teorema 2.5.11 conclui-se que


100 X i=1

E 2 2 . (100)

Assim, a probabilidade pretendida 100 ! X 2 P E 2 > 100 = P 2 (100) > 100 = 1 P (100) 100
i=1

que recorrendo tabela, vem Valores de x Valores de 99.334 100 102.95 logo, pela interpolao linear, vem 102.95 99.334 0.60 0.50 0 ' 0.518418. = 102.95 100 0.60 0 logo 1 P 2 (100) 100 ' 1 0.518418 = 0.481582. Teorema 2.5.12 (Aditividade da distribuio Qui-quadrado) A soma de variveis aleatrias independentes com distribuio Qui-quadrado tem ainda uma distribuio Qui-quadrado cujo nmero de graus de liberdade igual soma dos graus de liberdade das componentes, ou seja, se Xi 2 i ) com i = 1, , k, forem variveis aleatrias (n independentes, ento X=
k X i=1

0.50 0 =? 0.60

Xi 2

.
ni

i=1

Exemplo 2.5.11 Considere a empresa V endeT udo tem trs lojas e que o lucro das lojas descritos pelas variveis

104

X1 2 , X2 2 e X3 2 . Considerando que o lucro de cada loja independente do (30) (20) (40) das restantes, qual a probabilidade de o lucro da empresa ser superior a 101.05 euros? Pretende-se determinar P (X1 + X2 + X3 > 101.05) que, como se est a somar trs variveis com distribuio Qui-quadrado independentes, pela aditividade da distribuio Qui-quadrado vem que X1 + X2 + X3 2 (30+20+40) X1 + X2 + X3 2 (90) logo P (X1 + X2 + X3 > 101.05) = P 2 > 101.05 = (90) = 1 P 2 101.05 = 1 0.80 = 0.20. (90)

Teorema 2.5.13 (Aproximao da Qui-quadrado Normal) Se X 2 , ento se n tende para innito (n +) tem-se 2X 2n N (0, 1). (n) Regra: Este teorema utilizado, na prtica, quando se verica n 30. Exemplo 2.5.12 Considere uma varivel aleatria X 2 , que pela tabela da funo de distribuio da Qui(50) -quadrado tem-se P (X 71.42) = 0.97. Um resultado aproximado poder-se-a obter pela aproximao Normal, atravs de P (X 71.42) = P 2X 2 71.42 = P 2X 11.9515689 2X 2 50 11.9515689 2 50 = = P 2X 2 50 1.9515689 = P 105

que atravs do teorema 2.5.13 vem que P

2X 2n = 2X 2 50 = Z N (0, 1), logo

2X 2 50 1.9515689 = P (Z 1.9515689) '

' P (Z 1.95) = 0.9744.

Teorema 2.5.14 (Aproximao da Qui-quadrado Normal) Se X 2 , ento se n tende para innito (n +) tem-se X N n, 2n . (n) Regra: Este teorema utilizado, na prtica, quando se verica n 100. Exemplo 2.5.13 Considere uma varivel aleatria X 2 , que pela tabela da funo de distribuio da (150) Qui-quadrado tem-se P (X 172.58) = 0.90. Um resultado aproximado poder-se-a obter pela aproximao Normal. Assim, pelo teorema 2.5.14, como n 100, tem-se que X N n, 2n , ou seja, X N 150, 2 150 , ento 172.58 150 ' P (Z 1.3036569) ' P (X 172.58) ' P Z 2 150 ' P (Z 1.30) = 0.9032. 2.5.5 Distribuio de t-Student

Diz-se que uma varivel aleatria contnua tem distribuio t-Student11 com n graus de liberdade (com n N), representada por X t(n) , se a sua funo de densidade de probabil11

Student foi o pseudnimo utilizado pelo estaticista ingls W. S. Gosset (1876-1937), que foi quem desenvolveu

esta distribuio.

106

idade dada por:

Teorema 2.5.15

n+1 n+1 2 x 2 1+ , com x R. f (x) = n 2 n 2 n

Se a varivel aleatria X tem distribuio tStudent com n graus de liberdade, ou seja, X t(n) , ento, E(X) = 0 e V ar(X) = n (para n 3). n2 (52)

A funo de densidade de uma varivel aleatria com distribuio t - Student , tal como a da distribuio Normal, simtrica em relao sua mdia (que igual a zero), como tal pode-se utilizar propriedades semelhantes s vericadas no teorema 2.5.5 na pgina 89. Teorema 2.5.16 Seja X uma varivel aleatria com distribuio de t-Student com n graus de liberdade, ou seja, X t(n) , ento P (X k) = P (X k) = 1 P (X < k) . Para o clculo de probabilidades, utilizam-se os valores da sua funo de distribuio tabulados na pgina 127. Exemplo 2.5.14 Considere que a varivel aleatria X tem distribuio t-Student com quarenta graus de liberdade, ou seja, X t(40) . Determine: 1. P (X 2.4233) . Como esta probabilidade j est na forma de funo de distribuio, pode-se ir tabela, procurando-se na linha correspondente a quarenta graus de liberdade, n = 40. Assim, o valor 2.4233 corresponde a = 0.99, logo P (X 2.4233) = 0.99.

107

2. P (X 2.7045) . P (X 2.7045) = 1 P (X < 2.7045) = = 1 0.995 = 0.005. 3. P (X 0.6807) . Como a tabela s apresenta valores positivos, vai-se ter que recorrer ao facto de a funo de densidade ser simtrica, ento, pelo teorema 2.5.16, vem P (X 0.6807) = P (X 0.6807) = = 1 P (X < 0.6807) = = 1 0.75 = 0.25. 4. P (1.05 < X < 1.05) . P (1.05 < X < 1.05) = P (X < 1.05) P (X 1.05) = = P (X < 1.05) P (X 1.05) = = P (X < 1.05) [1 P (X < 1.05)] = = 0.85 1 + 0.85 = 0.70. 5. P (X 1.5) . Neste caso, ao procurar-se o valor 1.5 na tabela, este no aparece na linha n = 40. Assim, vai-se utilizar o mesmo raciocnio que foi apresentado na distribuio Qui-quadrado. Vaise tabela buscar os valores vizinhos do ponto 1.5 que correspondem a Valores de x Valores de 1.3031 1.5 1.6839 108 0.90 0 =? 0.95

sendo o valor de 0 obtido pela frmula da interpolao linear (frmula (51) na pgina 102) que se obtm 1.6839 1.3031 0.95 0.90 = 0 ' 0.935853466, 1.6839 1.5 0.95 0 logo P (X 1.5) ' 0.935853466. 6. o valor de a tal que P (X a) = 0.75. Para determinar este valor, tendo em conta que pedida a funo de distribuio [P (X x)] com = 0.75, vai-se tabela procurar este valor na linha correspondente a n = 40 (graus de liberdade) e coluna correspondente a 0.75. Assim, este valor corresponde a 0.6807, ou seja, o valor de a igual a 0.6807. 7. o valor de b tal que P (X b) = 0.05. Neste caso, no se poder ir directamente tabela pois o valor mnimo para na tabela = 0.6. Assim, vai-se utilizar a simetria da distribuio t-Student, de onde se obtm P (X b) = 0.05 P (X b) = 0.05 1 P (X < b) = 0.05 P (X < b) = 0.95 b = 1.6839 b = 1.6839. 8. o valor de c tal que P (X > c) = 0.65. P (X > c) = 0.65 1 P (X c) = 0.65 P (X c) = 0.35 que como = 0.35 < 0.5 no est na tabela, vai-se utilizar a simetria da distribuio t-Student, de onde se obtm P (X c) = 0.35 P (X c) = 0.35 1 P (X < c) = 0.35 P (X < c) = 0.65 109

Neste caso, o valor = 0.65 no se encontra na tabela. Assim, vai-se tabela procurar os dois valores adjacentes, ou seja, o valor imediatamente inferior e o imediatamente superior, que neste caso corespondem a = 0.60 com x = 0.2550 e = 0.70 com x = 0.5286. Assim vai-se utilizar a interpolao linear para obter um valor aproximado para x quando = 0.65, obtendo-se Valores de x Valores de 0.2550 x0 0.5286 0.60 0.65 0.70

Ento, uma das formas de fazer interpolao linear ser resolver 0.5286 0.2550 0.70 0.60 = 0 0.5286 x 0.70 0.65 c ' 0.3918 c ' 0.3918. Teorema 2.5.17 Sejam Z N(0, 1) e Y 2 duas variveis independentes, ento (n) Z X=r Y n tem distribuio t-Student com n graus de liberdade (com n N), ou seja, X t(n) . Exemplo 2.5.15 Considere as variveis aleatrias X N (0, 1) e Y 2 que so independentes. Determine (25) P 4X Y . X 1 X 1 P 4X Y = P =P 4 = 4 Y Y 25 25 X = P q 1.25
Y 25

de onde se obtm x0 ' 0.3918, logo

110

que, pelo teorema 2.5.17, vem que X q t(25)


Y 25

logo

pois

X P q 1.25 = P t(25) 1.25 ' 0.88714618


Y 25

Valores de x Valores de 1.0584 1.25 1.3163 de onde se obtm 1.3163 1.0584 0.90 0.85 = a ' 0.88714618. 1.3163 1.25 0.90 a Teorema 2.5.18 (Aproximao da t-Student Normal) Se X t(n) , ento se n tende para innito (n +) tem-se X N (0, 1). Regra: Este teorema utilizado, na prtica, quando se verica n 30. Exemplo 2.5.16 1. Considere uma varivel aleatria com distribuio t-Student com 150 graus de liberdade, isto , X t(150) . Determine P (X 1.04). Tendo em conta que n 30, pode-se utilizar a aproximao distribuio Normal patente no teorema 2.5.18, assim vai-se considerar que X N (0, 1). P (X 1.04) = P (Z 1.04) = 0.8508. 111

0.85 a =? 0.90

Note-se que, se fosse utilizada a tabela da distribuio t-Student, o valor obtido seria 0.85 o que prximo do obtido pela aproximao Normal. 2. Considere as variveis aleatrias independentes Zi com i = 0, , 10000 que tm distribuio Normal standard. Calcule P
10000 X i=1

2 10000Z0

Zi2 .
10000 X i=1

Pelo teorema 2.5.11 presente na pgina 102 vem que


10000 X i=1

Zi2 2 (10000) , assim 2 (10000) 10000 !

2 10000Z0

Zi2

2 = P 10000Z0 2 (10000) = P = P s 2 (10000) 10000 Z0


2 (10000) 10000

Z0

2 Z0

2 (10000) 10000

que pelo teorema 2.5.17 presente na pgina 110 vem que s consequentemente P 1 q Z0
2 (10000) 10000

= P 1 q Z0 2 (10000) 10000

t(10000) ,

1 = P 1 t(10000) 1

que tendo em conta que n 30 pode-se utilizar o teorema 2.5.18 e aproximar a t-Student Normal standard, obtendo-se P 1 t(10000) 1 ' P (1 Z 1) = P (Z 1) P (Z < 1) = 112

= 0.8413 [1 P (Z 1)] = 0.8413 1 + 0.8413 = 0.6826.

2.5.6

Distribuio de F - Snedecor

Diz-se que uma varivel aleatria contnua tem distribuio F - Snedecor com m e n graus de liberdade, representada por X F(m,n) [onde m representa os graus de liberdade do numerador e n os graus de liberdade do denominador], se a sua funo de densidade de probabilidade da forma: m m 1 m + n m 0.5 x2 2 n f (x) = m + n , para x > 0. m n (m + nx) 2 2 2

Teorema 2.5.19

Se a varivel aleatria X tem distribuio F-Snedcor com m e n graus de liberdade, ou seja, X F(m,n) , ento E(X) = n 2n2 (n + m 2) e V ar(X) = (para n > 4) . n2 m (n 2)2 (n 4) (53)

No clculo de probabilidades utilizando a distribuio F-Snedcor vai-se utilizar tabelas (ver pgina 130) onde esto presentes os valores da funo de distribuio desta varivel, ou seja, recorre-se tabela para determinar probabilidades do tipo P F(m,n) x . Exemplos 2.5.17 Considere a varivel aleatria X com distribuio F-Snedcor com trinta e quinze graus de liberdade X F(30,15) . Determine: 1. P (X 1.87). Como esta probabilidade j est na forma de funo de distribuio, pode-se ir tabela, procurando-se na coluna correspondente a m = 30 e linha correspondente a n = 15. Assim, o valor 1.87 aparece na tabela onde = 0.90, logo P (X 1.87) = 0.90. 113

2. P (X 3.21). Procurando este valor na coluna correspondente a m = 30 e linha correspondente a n = 15, este aparece na tabela correspondente a = 0.99, logo P (X 3.21) = 0.99. 3. P (X 2.5). Procurando este valor, este no aparece em nenhuma das tabelas, logo vai-se procurar os valores adjacentes para fazer interpolao linear. Assim, tem-se Valores de x Valores de 2.25 2.50 2.64 de onde se obtm 2.64 2.25 0.975 0.95 0 ' 0.96603, = 0 2.64 2.50 0.975 logo P (X 2.5) ' 0.96603. 4. o valor de a tal que P (X < a) = 0.95. Para determinar o valor de a bastar ir tabela correspondente a = 0.95 coluna correspondente a m = 30 e linha correspondente a n = 15, de onde se conclui que a = 2.25. 5. o valor de b tal que P (X b) = 0.02. 0.95 0 =? 0.975

P (X b) = 0.02 1 P (X < b) = 0.02 P (X < b) = 0.98

114

como no h tabela para = 0.98 vai-se recorrer aos valores adjacentes para determinar um valor aproximado atravs da interpolao linear, de onde se obtm Valores de x Valores de 2.64 b =? 3.21 de onde se obtm 0.99 0.975 3.21 2.64 = b ' 2.83. 3.21 b 0.99 0.98 Teorema 2.5.20 Se X F(m,n) , ento 1 F(n,m) X 0.975 0.98 0.99

Exemplos 2.5.18 Exemplo 2.5.19 Considere a varivel aleatria X com distribuio F-Snedcor com trinta e quinze graus de liberdade X F(30,15) . Determine: 1. P (X 0.5). Neste caso, no h tabelas com valores prximos de 0.5 (o menor valor o patente na tabela = 0.9 que corresponde a 1.87), ento vai-se recorrer ao teorema 2.5.20 de onde se obtm 1 1 P (X 0.5) = P = P F(15,30) 2 = X 0.5 = 1 P F(15,30) < 2 Valores de x Valores de 1.72 2.00 2.01 115 0.90 0 =? 0.95

que, recorrendo as tabelas, conclui-se que

de onde se obtm 2.01 1.72 0.95 0.90 = 0 ' 0.94828, 2.01 2.00 0.95 0 logo 1 P F(15,30) < 2 ' 1 0.94828 = 0.05172.

2. o valor de c tal que P (X > c) = 0.95.

P (X > c) = 0.95 1 P (X c) = 0.95 P (X c) = 0.05. Neste caso, no h tabelas para valores de prximos de 0.05, pois s h tabelas para = 0.90, 0.95, 0.975 e 0.99. Assim tem-se que recorrer ao teorema 2.5.20 de onde se conclui que, P (X c) = 0.05 P = 0.05 1 P F(15,30) = 0.05 c 1 = 0.05 1 P F(15,30) c 1 P F(15,30) = 0.95 c 1 1 X c

que, recorrendo tabela, conclui-se que 1 1 = 2.01 c = c = 0.49751. c 2.01 Teorema 2.5.21 Sejam X 2 e Y 2 duas variveis aleatrias independentes, ento (m) (n) X W = m Y n tem distribuio F-Snedecor com m e n graus de liberdade, ou seja, W F(m,n) . 116

Exemplo 2.5.20 Considere a empresa V endeT udo tem trs lojas e que o lucro das lojas descritos pelas variveis X1 2 , X2 2 e X3 2 . Considerando que o lucro de cada loja independente do (30) (30) (40) das restantes, qual a probabilidade de o lucro da terceira loja ser superior ao lucro das restantes duas lojas? Pretende-se determinar P (X3 > X1 + X2 ) que, como X1 + X2 a soma de duas variveis aleatrias com distribuio Qui-quadrado independentes, pela aditividade da distribuio Qui-quadrado (teorema 2.5.12 da pgina 104) vem que X1 + X2 2 (30+30) X1 + X2 2 (60) logo P (X3 > X1 + X2 ) = P 2 > 2 (40) (60) = 2 ! (40) = P >1 = 2 (60) 2 (40) 1 = P 40 > 40 2 1 (60) 60 60 2 (40) 40 F (40,60) 2 (60) 60 logo 2 (40) 1 > 40 = P F(40,60) > 1.5 = 1 60 = 1 P F(40,60) 1.5 117

que pelo teorema 2.5.21 vem que

P 40 2 (60) 60

que recorrendo interpolao vem Valores de x Valores de 1.44 1.50 1.59 de onde se obtm 1.59 1.44 0.95 0.90 0 ' 0.92, = 0 1.59 1.50 0.95 logo 1 P F(40,60) 1.5 ' 1 0.92 = 0.08. Teorema 2.5.22 Seja X uma varivel aleatria com distribuio t-Student com n graus de liberdade, ou seja X t(n) , ento X 2 F(1,n) . Exemplo 2.5.21 Considere uma varivel aleatria com distribuio t-Student com 60 graus de liberdade X t(60) . Tendo em conta que X t(60) , pelo teorema 2.5.22, vem que X 2 F(1,60) , logo P X 2 > 4 = P F(1,60) > 4 = 1 P F(1,60) 4 = 1 0.95 = 0.05. 0.90 0 =? 0.95

Determine P (X 2 > 4).

118

2.6

Desigualdade de Tchebyche

Em muitos casos pretende-se calcular probabilidades quando a varivel aleatria que est a ser analisada tem distribuio desconhecida. Nestes casos no se pode determinar um valor exacto para as probabilidades, mas, se o valor esperado e o desvio padro dessa varivel forem conhecidos, pode-se encontrar um limite inferior (ou um limite superior) para essa probabilidade atravs da desigualdade de Tchebyche (1821-1894), que pode ser enunciada da seguinte forma. Teorema 2.6.1 (Desigualdade de Tchebyche) Seja X uma varivel aleatria com valor esperado e desvio padro , ento, para qualquer constante positiva k, tem-se: P (|X | < k) 1 Nota: A desigualdade de Tchebyche pode ser utilizada quer para variveis aleatrias discretas quer para variveis aleatrias contnuas. Demonstrao: A demonstrao da desigualdade de Tchebyche que vai ser apresentada refere-se unicamente a variveis aleatrias contnuas, no entanto, para variveis aleatrias discretas a demonstrao semelhante. Assim, pela denio de varincia, obtmse
2

1 k2

ou P (|X | k)

1 k2

(54)

= E (X )2 =
|X|k

Z
R 2

(X )2 f (x) dx Z (k)2 f (x) dx =

(X ) f (x) dx Z

|X|k

= (k)2 logo

f (x) dx = (k)2 P (|X | k) ,

|X|k

2 (k)2 P (|X | k) 1 2 P (|X | k) 2 2 = 2 . k k 119

Exemplo 2.6.1 Considerando uma varivel aleatria X cujo valor esperado cem ( = 100) e o desvio padro dez ( = 10), o que que se pode concluir sobre as seguintes probabilidades? 1. P (70 < X < 130). P (70 < X < 130) = P (70 100 < X 100 < 130 100) = = P (30 < X 100 < 30) = P (|X 100| < 30). Comparando com a desigualdade de Tchebyche, conclui-se que k = 30, ento, como = 10, vem que k = 3, logo P (|X 100| < 30) 1 8 1 = , 2 3 9

assim, pela desigualdade de Tchebyche, conclui-se que o valor mnimo para a probabili8 dade de a varivel aleatria X se situar entre setenta e cento e trinta . 9 2. P (X < 120). P (X < 120) = P (X 100 < 20) tendo em conta que, para utilizar a desigualdade de Tchebyche, se pretende obter P (|X 100| < 20), devem-se comparar estas duas probabilidades. Como o intervalo ] , 20[ contm o intervalo ] 20, 20[ a probabilidade da varivel X pertencer ao primeiro intervalo ser superior ou igual probabilidade de pertencer ao segundo, ou seja, P (X 100 < 20) P (|X 100| < 20), que pela desigualdade de Tchebyche, tendo em conta que neste caso k = 2, vem P (|X 100| < 20) 1 120 1 = 0.75, 22

concluindo-se que a probabilidade de a varivel assumir um valor inferior a 120 de, pelo menos, 0.75. 3. P (60 < X < 200). P (60 < X < 200) = P (40 < X 100 < 100) como para utilizar mdulos o intervalo tem que ser simtrico, ento, vai-se passar do intervalo ] 40, 100[ para o intervalo ] 40, 40[, pois este est contido no anterior. Desta anlise conclui-se que P (40 < X 100 < 100) P (40 < X 100 < 40) = = P (|X 100| < 40) 1

1 15 = , 42 16

ou seja, a probabilidade de a varivel assumir um valor entre sessenta e duzentos , no 15 mnimo, . 16 4. P (X > 200). P (X > 200) = P (X 100 > 100). Tendo em conta que o intervalo ]100, +[ no contm nenhum intervalo simtrico (todos os valores deste intervalo so positivos), vai ser utilizado o acontecimento complementar, obtendo-se P (X 100 > 100) = 1 P (X 100 100). Assim, para ser possvel utilizar a desigualdade de Tchebyche, do intervalo ] , 100] opta-se pelo intervalo simtrico com maior amplitude. Neste caso o intervalo correspondente ] 100, 100[ e, tendo em conta que P (X 100 100) P (|X 100| < 100), conclui-se que 1 P (X 100 100) 1 P (|X 100| < 100) 1 1 1 1 2 = = 0.01, 10 100 121

ou seja, a probabilidade de a varivel aleatria X assumir um valor superior a duzentos , no mximo, 0.01. 5. P (300 < X < 400). P (300 < X < 400) = P (200 < X 100 < 300) como o intervalo ]200, 300[ no contm nenhum intervalo simtrico, passa-se deste intervalo para o seu complementar, obtendo-se P (200 < X 100 < 300) = 1 P (X 100 200 X 100 300). Assim, no intervalo ] , 200] [300, +[ escolhe-se o intervalo simtrico de maior amplitude, que corresponde a ] 200, 200[, ento, 1 P (X 100 200 X 100 300) 1 P (|X 100| < 200) 1 1 1 2 = 20 1 = = 0.0025. 400 O valor mximo para a probabilidade de a varivel aleatria X se situar entre duzentos e quatrocentos 0.0025. Nota: Nem sempre possvel tirar concluses atravs da desigualdade de Tchebyche, como ilustra o seguinte exemplo: Considere as condies apresentadas no exemplo anterior, ou seja = 100 e = 10. P (90 < X < 110) = P (10 < X 100 < 10) = P (|X 100| < 10) 1 1 =0 12

Neste caso, atravs da desigualdade de Tchebyche, conclui-se que a probabilidade de a varivel assumir valores entre noventa e cento e dez no mnimo igual a zero; no entanto, todas as probabilidades satisfazem esta desigualdade, logo, este clculo de nada serviu. 122

2.7
2.7.1

Tabelas
Funo de distribuio da Poisson - P () P (X x) =
x X e k k=0

k!

x 0 1 2 3 4 5 6 7 x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

0.1 0.9048 0.9953 0.9998 1.0000

0.2 0.8187 0.9825 0.9989 0.9999 1.0000

0.3 0.7408 0.9631 0.9964 0.9997 1.0000

0.4 0.6703 0.9384 0.9921 0.9992 0.9999 1.0000

0.5 0.6065 0.9098 0.9856 0.9982 0.9998 1.0000

0.6 0.5488 0.8781 0.9769 0.9966 0.9996 1.0000

0.7 0.4966 0.8442 0.9659 0.9942 0.9992 0.9999 1.0000

0.8 0.4493 0.8088 0.9526 0.9909 0.9986 0.9998 1.0000

0.9 0.4066 0.7725 0.9371 0.9865 0.9977 0.9997 1.0000

1 0.3679 0.7358 0.9197 0.9810 0.9963 0.9994 0.9999 1.0000 6 0.0025 0.0174 0.0620 0.1512 0.2851 0.4457 0.6063 0.7440 0.8472 0.9161 0.9574 0.9799 0.9912 0.9964 0.9986 0.9995 0.9998 0.9999 1.0000

1.5 0.2231 0.5578 0.8088 0.9344 0.9814 0.9955 0.9991 0.9998 1.0000

2 0.1353 0.4060 0.6767 0.8571 0.9473 0.9834 0.9955 0.9989 0.9998 1.0000

2.5 0.0821 0.2873 0.5438 0.7576 0.8912 0.9580 0.9858 0.9958 0.9989 0.9997 0.9999 1.0000

3 0.0498 0.1991 0.4232 0.6472 0.8153 0.9161 0.9665 0.9881 0.9962 0.9989 0.9997 0.9999 1.0000

3.5 0.0302 0.1359 0.3208 0.5366 0.7254 0.8576 0.9347 0.9733 0.9901 0.9967 0.9990 0.9997 0.9999 1.0000

4 0.0183 0.0916 0.2381 0.4335 0.6288 0.7851 0.8893 0.9489 0.9786 0.9919 0.9972 0.9991 0.9997 0.9999 1.0000

4.5 0.0111 0.0611 0.1736 0.3423 0.5321 0.7029 0.8311 0.9134 0.9597 0.9829 0.9933 0.9976 0.9992 0.9997 0.9999 1.0000

5 0.0067 0.0404 0.1247 0.2650 0.4405 0.6160 0.7622 0.8666 0.9319 0.9682 0.9863 0.9945 0.9980 0.9993 0.9998 0.9999 1.0000

5.5 0.0041 0.0266 0.0884 0.2017 0.3575 0.5289 0.6860 0.8095 0.8944 0.9462 0.9747 0.9890 0.9955 0.9983 0.9994 0.9998 0.9999 1.0000

As tabelas apresentam o valor de P (X x) onde X P (). 123

Funo de distribuio da Poisson - P ()


x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 6.5 0.0015 0.0113 0.0430 0.1118 0.2237 0.3690 0.5265 0.6728 0.7916 0.8774 0.9332 0.9661 0.9840 0.9929 0.9970 0.9988 0.9996 0.9998 0.9999 1.0000 7 0.0009 0.0073 0.0296 0.0818 0.1730 0.3007 0.4497 0.5987 0.7291 0.8305 0.9015 0.9467 0.9730 0.9872 0.9943 0.9976 0.9990 0.9996 0.9999 1.0000 7.5 0.0006 0.0047 0.0203 0.0591 0.1321 0.2414 0.3782 0.5246 0.6620 0.7764 0.8622 0.9208 0.9573 0.9784 0.9897 0.9954 0.9980 0.9992 0.9997 0.9999 1.0000 8 0.0003 0.0030 0.0138 0.0424 0.0996 0.1912 0.3134 0.4530 0.5925 0.7166 0.8159 0.8881 0.9362 0.9658 0.9827 0.9918 0.9963 0.9984 0.9993 0.9997 0.9999 1.0000 8.5 0.0002 0.0019 0.0093 0.0301 0.0744 0.1496 0.2562 0.3856 0.5231 0.6530 0.7634 0.8487 0.9091 0.9486 0.9726 0.9862 0.9934 0.9970 0.9987 0.9995 0.9998 0.9999 1.0000 9 0.0001 0.0012 0.0062 0.0212 0.0550 0.1157 0.2068 0.3239 0.4557 0.5874 0.7060 0.8030 0.8758 0.9261 0.9585 0.9780 0.9889 0.9947 0.9976 0.9989 0.9996 0.9998 0.9999 1.0000 9.5 0.0001 0.0008 0.0042 0.0149 0.0403 0.0885 0.1649 0.2687 0.3918 0.5218 0.6453 0.7520 0.8364 0.8981 0.9400 0.9665 0.9823 0.9911 0.9957 0.9980 0.9991 0.9996 0.9999 0.9999 1.0000 10 0.0000 0.0005 0.0028 0.0103 0.0293 0.0671 0.1301 0.2202 0.3328 0.4579 0.5830 0.6968 0.7916 0.8645 0.9165 0.9513 0.9730 0.9857 0.9928 0.9965 0.9984 0.9993 0.9997 0.9999 1.0000 10.5 0.0000 0.0003 0.0018 0.0071 0.0211 0.0504 0.1016 0.1785 0.2794 0.3971 0.5207 0.6387 0.7420 0.8254 0.8879 0.9317 0.9604 0.9781 0.9885 0.9942 0.9972 0.9987 0.9994 0.9998 0.9999 1.0000 11 0.0000 0.0002 0.0012 0.0049 0.0151 0.0375 0.0786 0.1432 0.2320 0.3405 0.4599 0.5793 0.6887 0.7813 0.8540 0.9074 0.9441 0.9678 0.9823 0.9907 0.9953 0.9977 0.9990 0.9995 0.9998 0.9999 1.0000

As tabelas apresentam o valor de P (X x) onde X P ().

124

Funo de distribuio da Poisson - P ()


x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 11.5 0.0000 0.0001 0.0008 0.0034 0.0107 0.0277 0.0603 0.1137 0.1906 0.2888 0.4017 0.5198 0.6330 0.7330 0.8153 0.8783 0.9236 0.9543 0.9738 0.9857 0.9925 0.9962 0.9982 0.9992 0.9996 0.9998 0.9999 1.0000 12 0.0000 0.0001 0.0005 0.0023 0.0076 0.0203 0.0458 0.0895 0.1550 0.2424 0.3472 0.4616 0.5760 0.6815 0.7720 0.8444 0.8987 0.9370 0.9626 0.9787 0.9884 0.9939 0.9970 0.9985 0.9993 0.9997 0.9999 0.9999 1.0000 13 0.0000 0.0000 0.0002 0.0011 0.0037 0.0107 0.0259 0.0540 0.0998 0.1658 0.2517 0.3532 0.4631 0.5730 0.6751 0.7636 0.8355 0.8905 0.9302 0.9573 0.9750 0.9859 0.9924 0.9960 0.9980 0.9990 0.9995 0.9998 0.9999 1.0000 1.0000 14 0.0000 0.0000 0.0001 0.0005 0.0018 0.0055 0.0142 0.0316 0.0621 0.1094 0.1757 0.2600 0.3585 0.4644 0.5704 0.6694 0.7559 0.8272 0.8826 0.9235 0.9521 0.9712 0.9833 0.9907 0.9950 0.9974 0.9987 0.9994 0.9997 0.9999 0.9999 1.0000 15 0.0000 0.0000 0.0000 0.0002 0.0009 0.0028 0.0076 0.0180 0.0374 0.0699 0.1185 0.1848 0.2676 0.3632 0.4657 0.5681 0.6641 0.7489 0.8195 0.8752 0.9170 0.9469 0.9673 0.9805 0.9888 0.9938 0.9967 0.9983 0.9991 0.9996 0.9998 0.9999 1.0000 16 0.0000 0.0000 0.0000 0.0001 0.0004 0.0014 0.0040 0.0100 0.0220 0.0433 0.0774 0.1270 0.1931 0.2745 0.3675 0.4667 0.5660 0.6593 0.7423 0.8122 0.8682 0.9108 0.9418 0.9633 0.9777 0.9869 0.9925 0.9959 0.9978 0.9989 0.9994 0.9997 0.9999 0.9999 1.0000 17 0.0000 0.0000 0.0000 0.0000 0.0002 0.0007 0.0021 0.0054 0.0126 0.0261 0.0491 0.0847 0.1350 0.2009 0.2808 0.3715 0.4677 0.5640 0.6550 0.7363 0.8055 0.8615 0.9047 0.9367 0.9594 0.9748 0.9848 0.9912 0.9950 0.9973 0.9986 0.9993 0.9996 0.9998 0.9999 1.0000 18 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.0029 0.0071 0.0154 0.0304 0.0549 0.0917 0.1426 0.2081 0.2867 0.3751 0.4686 0.5622 0.6509 0.7307 0.7991 0.8551 0.8989 0.9317 0.9554 0.9718 0.9827 0.9897 0.9941 0.9967 0.9982 0.9990 0.9995 0.9998 0.9999 0.9999 1.0000 19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0005 0.0015 0.0039 0.0089 0.0183 0.0347 0.0606 0.0984 0.1496 0.2148 0.2920 0.3784 0.4695 0.5606 0.6472 0.7255 0.7931 0.8490 0.8933 0.9269 0.9514 0.9687 0.9805 0.9882 0.9930 0.9960 0.9978 0.9988 0.9994 0.9997 0.9998 0.9999 1.0000 20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0008 0.0021 0.0050 0.0108 0.0214 0.0390 0.0661 0.1049 0.1565 0.2211 0.2970 0.3814 0.4703 0.5591 0.6437 0.7206 0.7875 0.8432 0.8878 0.9221 0.9475 0.9657 0.9782 0.9865 0.9919 0.9953 0.9973 0.9985 0.9992 0.9996 0.9998 0.9999 1.0000

A tabela apresenta o valor de P (X x) onde X P (). 125

2.7.2 z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9

Funo de distribuio da Normal Standard - Z 0.00 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000 z F(z) 0.01 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000 0.02 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 0.03 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 0.05 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 0.06 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 0.9999 1.0000

1.282 1.645 1.96 2.326 2.576 3.09 3.291 3.891 4.417 0.90 0.95 0.975 0.99 0.995 0.999 0.9995 0.99995 0.999995

A tabela apresenta o valor de P (Z z) onde Z N (0, 1). 126

2.7.3
n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 45 50 60 70 80 90 100 120 150

Valores percentuais da t-Student com n graus de liberdade - t

(n)

0.6 0.3249 0.2887 0.2767 0.2707 0.2672 0.2648 0.2632 0.2619 0.2610 0.2602 0.2596 0.2590 0.2586 0.2582 0.2579 0.2576 0.2573 0.2571 0.2569 0.2567 0.2566 0.2564 0.2563 0.2562 0.2561 0.2560 0.2559 0.2558 0.2557 0.2556 0.2555 0.2555 0.2554 0.2553 0.2553 0.2552 0.2552 0.2551 0.2551 0.2550 0.2549 0.2547 0.2545 0.2543 0.2542 0.2541 0.2540 0.2539 0.2538

0.7 0.7265 0.6172 0.5844 0.5686 0.5594 0.5534 0.5491 0.5459 0.5435 0.5415 0.5399 0.5386 0.5375 0.5366 0.5357 0.5350 0.5344 0.5338 0.5333 0.5329 0.5325 0.5321 0.5317 0.5314 0.5312 0.5309 0.5306 0.5304 0.5302 0.5300 0.5298 0.5297 0.5295 0.5294 0.5292 0.5291 0.5289 0.5288 0.5287 0.5286 0.5281 0.5278 0.5272 0.5268 0.5265 0.5263 0.5261 0.5258 0.5255

0.75 1.0000 0.8165 0.7649 0.7407 0.7267 0.7176 0.7111 0.7064 0.7027 0.6998 0.6974 0.6955 0.6938 0.6924 0.6912 0.6901 0.6892 0.6884 0.6876 0.6870 0.6864 0.6858 0.6853 0.6848 0.6844 0.6840 0.6837 0.6834 0.6830 0.6828 0.6825 0.6822 0.6820 0.6818 0.6816 0.6814 0.6812 0.6810 0.6808 0.6807 0.6800 0.6794 0.6786 0.6780 0.6776 0.6772 0.6770 0.6765 0.6761

0.8 1.3764 1.0607 0.9785 0.9410 0.9195 0.9057 0.8960 0.8889 0.8834 0.8791 0.8755 0.8726 0.8702 0.8681 0.8662 0.8647 0.8633 0.8620 0.8610 0.8600 0.8591 0.8583 0.8575 0.8569 0.8562 0.8557 0.8551 0.8546 0.8542 0.8538 0.8534 0.8530 0.8526 0.8523 0.8520 0.8517 0.8514 0.8512 0.8509 0.8507 0.8497 0.8489 0.8477 0.8468 0.8461 0.8456 0.8452 0.8446 0.8440

0.85 1.9626 1.3862 1.2498 1.1896 1.1558 1.1342 1.1192 1.1081 1.0997 1.0931 1.0877 1.0832 1.0795 1.0763 1.0735 1.0711 1.0690 1.0672 1.0655 1.0640 1.0627 1.0614 1.0603 1.0593 1.0584 1.0575 1.0567 1.0560 1.0553 1.0547 1.0541 1.0535 1.0530 1.0525 1.0520 1.0516 1.0512 1.0508 1.0504 1.0500 1.0485 1.0473 1.0455 1.0442 1.0432 1.0424 1.0418 1.0409 1.0400

0.9 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722 1.3634 1.3562 1.3502 1.3450 1.3406 1.3368 1.3334 1.3304 1.3277 1.3253 1.3232 1.3212 1.3195 1.3178 1.3163 1.3150 1.3137 1.3125 1.3114 1.3104 1.3095 1.3086 1.3077 1.3070 1.3062 1.3055 1.3049 1.3042 1.3036 1.3031 1.3006 1.2987 1.2958 1.2938 1.2922 1.2910 1.2901 1.2886 1.2872

0.95 6.3138 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 1.7247 1.7207 1.7171 1.7139 1.7109 1.7081 1.7056 1.7033 1.7011 1.6991 1.6973 1.6955 1.6939 1.6924 1.6909 1.6896 1.6883 1.6871 1.6860 1.6849 1.6839 1.6794 1.6759 1.6706 1.6669 1.6641 1.6620 1.6602 1.6577 1.6551

0.975 12.706 4.3027 3.1824 2.7764 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281 2.2010 2.1788 2.1604 2.1448 2.1314 2.1199 2.1098 2.1009 2.0930 2.0860 2.0796 2.0739 2.0687 2.0639 2.0595 2.0555 2.0518 2.0484 2.0452 2.0423 2.0395 2.0369 2.0345 2.0322 2.0301 2.0281 2.0262 2.0244 2.0227 2.0211 2.0141 2.0086 2.0003 1.9944 1.9901 1.9867 1.9840 1.9799 1.9759

0.99 31.821 6.9646 4.5407 3.7469 3.3649 3.1427 2.9980 2.8965 2.8214 2.7638 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280 2.5176 2.5083 2.4999 2.4922 2.4851 2.4786 2.4727 2.4671 2.4620 2.4573 2.4528 2.4487 2.4448 2.4411 2.4377 2.4345 2.4314 2.4286 2.4258 2.4233 2.4121 2.4033 2.3901 2.3808 2.3739 2.3685 2.3642 2.3578 2.3515

0.995 63.657 9.9248 5.8409 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453 2.8314 2.8188 2.8073 2.7969 2.7874 2.7787 2.7707 2.7633 2.7564 2.7500 2.7440 2.7385 2.7333 2.7284 2.7238 2.7195 2.7154 2.7116 2.7079 2.7045 2.6896 2.6778 2.6603 2.6479 2.6387 2.6316 2.6259 2.6174 2.6090

0.999 318.31 22.327 10.215 7.1732 5.8934 5.2076 4.7853 4.5008 4.2968 4.1437 4.0247 3.9296 3.8520 3.7874 3.7328 3.6862 3.6458 3.6105 3.5794 3.5518 3.5272 3.5050 3.4850 3.4668 3.4502 3.4350 3.4210 3.4082 3.3962 3.3852 3.3749 3.3653 3.3563 3.3479 3.3400 3.3326 3.3256 3.3190 3.3128 3.3069 3.2815 3.2614 3.2317 3.2108 3.1953 3.1833 3.1737 3.1595 3.1455

0.9995 636.62 31.599 12.924 8.6103 6.8688 5.9588 5.4079 5.0413 4.7809 4.5869 4.4370 4.3178 4.2208 4.1405 4.0728 4.0150 3.9651 3.9216 3.8834 3.8495 3.8193 3.7921 3.7676 3.7454 3.7251 3.7066 3.6896 3.6739 3.6594 3.6460 3.6335 3.6218 3.6109 3.6007 3.5911 3.5821 3.5737 3.5657 3.5581 3.5510 3.5203 3.4960 3.4602 3.4350 3.4163 3.4019 3.3905 3.3735 3.3566

A tabela apresenta os pontos x tais que P t(n) x = . 127

2.7.4

Valores percentuais da Quiquadrado com n graus de liberdade - 2 (n)


n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 45 50 60 70 80 90 100 120 150

0.005 0.0000 0.0100 0.0717 0.2070 0.4117 0.6757 0.9893 1.3444 1.7349 2.1559 2.6032 3.0738 3.5650 4.0747 4.6009 5.1422 5.6972 6.2648 6.8440 7.4338 8.0337 8.6427 9.2604 9.8620 10.520 11.160 11.808 12.461 13.121 13.787 14.458 15.134 15.815 16.501 17.192 17.887 18.586 19.289 19.996 20.707 24.311 27.991 35.534 43.275 51.172 59.196 67.328 83.852 109.14

0.01 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 2.5582 3.0535 3.5706 4.1069 4.6604 5.2293 5.8122 6.4078 7.0149 7.6327 8.2604 8.8972 9.5425 10.196 10.856 11.524 12.198 12.879 13.565 14.256 14.953 15.655 16.362 17.074 17.789 18.509 19.233 19.960 20.691 21.426 22.164 25.901 29.707 37.485 45.442 53.540 61.754 70.065 86.923 112.67

0.025 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 3.2470 3.8157 4.4038 5.0088 5.6287 6.2621 6.9077 7.5642 8.2307 8.9065 9.5908 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791 17.539 18.291 19.047 19.806 20.569 21.336 22.106 22.878 23.654 24.433 28.366 32.357 40.482 48.758 57.153 65.647 74.222 91.573 117.98

0.05 0.0039 0.1026 0.3519 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 3.9403 4.5748 5.2260 5.8919 6.5706 7.2609 7.9616 8.6718 9.3905 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493 19.281 20.072 20.867 21.664 22.465 23.269 24.075 24.884 25.695 26.509 30.612 34.764 43.188 51.739 60.391 69.126 77.929 95.705 122.69

0.10 0.0158 0.2107 0.5844 1.0636 1.6103 2.2041 2.8331 3.4895 4.1682 4.8652 5.5778 6.3038 7.0415 7.7895 8.5468 9.3122 10.085 10.865 11.651 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599 21.434 22.271 23.110 23.952 24.797 25.643 26.492 27.343 28.196 29.051 33.350 37.689 46.459 55.329 64.278 73.291 82.358 100.62 128.28

0.15 0.0358 0.3250 0.7978 1.3665 1.9938 2.6613 3.3583 4.0782 4.8165 5.5701 6.3364 7.1138 7.9008 8.6963 9.4993 10.309 11.125 11.946 12.773 13.604 14.439 15.279 16.122 16.969 17.818 18.671 19.527 20.386 21.247 22.110 22.976 23.844 24.714 25.586 26.460 27.336 28.214 29.093 29.974 30.856 35.290 39.754 48.759 57.844 66.994 76.195 85.441 104.04 132.14

0.20 0.0642 0.4463 1.0052 1.6488 2.3425 3.0701 3.8223 4.5936 5.3801 6.1791 6.9887 7.8073 8.6339 9.4673 10.307 11.152 12.002 12.857 13.716 14.578 15.445 16.314 17.187 18.062 18.940 19.820 20.703 21.588 22.475 23.364 24.255 25.148 26.042 26.938 27.836 28.735 29.635 30.537 31.441 32.345 36.884 41.449 50.641 59.898 69.207 78.558 87.945 106.81 135.26

0.25 0.1015 0.5754 1.2125 1.9226 2.6746 3.4546 4.2549 5.0706 5.8988 6.7372 7.5841 8.4384 9.2991 10.165 11.037 11.912 12.792 13.675 14.562 15.452 16.344 17.240 18.137 19.037 19.939 20.843 21.749 22.657 23.567 24.478 25.390 26.304 27.219 28.136 29.054 29.973 30.893 31.815 32.737 33.660 38.291 42.942 52.294 61.698 71.145 80.625 90.133 109.22 137.98

0.30 0.1485 0.7134 1.4237 2.1947 2.9999 3.8276 4.6713 5.5274 6.3933 7.2672 8.1479 9.0343 9.9257 10.821 11.721 12.624 13.531 14.440 15.352 16.266 17.182 18.101 19.021 19.943 20.867 21.792 22.719 23.647 24.577 25.508 26.440 27.373 28.307 29.242 30.178 31.115 32.053 32.992 33.932 34.872 39.585 44.313 53.809 63.346 72.915 82.511 92.129 111.42 140.46

0.40 0.2750 1.0217 1.8692 2.7528 3.6555 4.5702 5.4932 6.4226 7.3570 8.2955 9.2373 10.182 11.129 12.078 13.030 13.983 14.937 15.893 16.850 17.809 18.768 19.729 20.690 21.652 22.616 23.579 24.544 25.509 26.475 27.442 28.409 29.376 30.344 31.313 32.282 33.252 34.222 35.192 36.163 37.134 41.995 46.864 56.620 66.396 76.188 85.993 95.808 115.46 145.00

2 A tabela apresenta os pontos x tais que P (n) x = . 128

Valores percentuais da Quiquadrado com n graus de liberdade - 2 (n)


n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 45 50 60 70 80 90 100 120 150 0.50 0.4549 1.3863 2.3660 3.3567 4.3515 5.3481 6.3458 7.3441 8.3428 9.3418 10.341 11.340 12.340 13.339 14.339 15.338 16.338 17.338 18.338 19.337 20.337 21.337 22.337 23.337 24.337 25.336 26.336 27.336 28.336 29.336 30.336 31.336 32.336 33.336 34.336 35.336 36.336 37.335 38.335 39.335 44.335 49.335 59.335 69.334 79.334 89.334 99.334 119.33 149.33 0.60 0.7083 1.8326 2.9462 4.0446 5.1319 6.2108 7.2832 8.3505 9.4136 10.473 11.530 12.584 13.636 14.685 15.733 16.780 17.824 18.868 19.910 20.951 21.991 23.031 24.069 25.106 26.143 27.179 28.214 29.249 30.283 31.316 32.349 33.381 34.413 35.444 36.475 37.505 38.535 39.564 40.593 41.622 46.761 51.892 62.135 72.358 82.566 92.761 102.95 123.29 153.75 0.70 1.0742 2.4079 3.6649 4.8784 6.0644 7.2311 8.3834 9.5245 10.656 11.781 12.899 14.011 15.119 16.222 17.322 18.418 19.511 20.601 21.689 22.775 23.858 24.939 26.018 27.096 28.172 29.246 30.319 31.391 32.461 33.530 34.598 35.665 36.731 37.795 38.859 39.922 40.984 42.045 43.105 44.165 49.452 54.723 65.227 75.689 86.120 96.524 106.91 127.62 158.58 0.75 1.3233 2.7726 4.1083 5.3853 6.6257 7.8408 9.0371 10.219 11.389 12.549 13.701 14.845 15.984 17.117 18.245 19.369 20.489 21.605 22.718 23.828 24.935 26.039 27.141 28.241 29.339 30.435 31.528 32.620 33.711 34.800 35.887 36.973 38.058 39.141 40.223 41.304 42.383 43.462 44.539 45.616 50.985 56.334 66.981 77.577 88.130 98.650 109.14 130.05 161.29 0.80 1.6424 3.2189 4.6416 5.9886 7.2893 8.5581 9.8032 11.030 12.242 13.442 14.631 15.812 16.985 18.151 19.311 20.465 21.615 22.760 23.900 25.038 26.171 27.301 28.429 29.553 30.675 31.795 32.912 34.027 35.139 36.250 37.359 38.466 39.572 40.676 41.778 42.879 43.978 45.076 46.173 47.269 52.729 58.164 68.972 79.715 90.405 101.05 111.67 132.81 164.35 0.85 2.0723 3.7942 5.3170 6.7449 8.1152 9.4461 10.748 12.027 13.288 14.534 15.767 16.989 18.202 19.406 20.603 21.793 22.977 24.155 25.329 26.498 27.662 28.822 29.979 31.132 32.282 33.429 34.574 35.715 36.854 37.990 39.124 40.256 41.386 42.514 43.640 44.764 45.886 47.007 48.126 49.244 54.810 60.346 71.341 82.255 93.106 103.90 114.66 136.06 167.96 0.90 2.7055 4.6052 6.2514 7.7794 9.2364 10.645 12.017 13.362 14.684 15.987 17.275 18.549 19.812 21.064 22.307 23.542 24.769 25.989 27.204 28.412 29.615 30.813 32.007 33.196 34.382 35.563 36.741 37.916 39.087 40.256 41.422 42.585 43.745 44.903 46.059 47.212 48.363 49.513 50.660 51.805 57.505 63.167 74.397 85.527 96.578 107.57 118.50 140.23 172.58 0.95 3.8415 5.9915 7.8147 9.4877 11.070 12.592 14.067 15.507 16.919 18.307 19.675 21.026 22.362 23.685 24.996 26.296 27.587 28.869 30.144 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 43.773 44.985 46.194 47.400 48.602 49.802 50.998 52.192 53.384 54.572 55.758 61.656 67.505 79.082 90.531 101.88 113.15 124.34 146.57 179.58 0.975 5.0239 7.3778 9.3484 11.143 12.833 14.449 16.013 17.535 19.023 20.483 21.920 23.337 24.736 26.119 27.488 28.845 30.191 31.526 32.852 34.170 35.479 36.781 38.076 39.364 40.646 41.923 43.195 44.461 45.722 46.979 48.232 49.480 50.725 51.966 53.203 54.437 55.668 56.896 58.120 59.342 65.410 71.420 83.298 95.023 106.63 118.14 129.56 152.21 185.80 0.99 6.6349 9.2103 11.345 13.277 15.086 16.812 18.475 20.090 21.666 23.209 24.725 26.217 27.688 29.141 30.578 32.000 33.409 34.805 36.191 37.566 38.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 49.588 50.892 52.191 53.486 54.776 56.061 57.342 58.619 59.893 61.162 62.428 63.691 69.957 76.154 88.379 100.43 112.33 124.12 135.81 158.95 193.21 0.995 7.8794 10.597 12.838 14.860 16.750 18.548 20.278 21.955 23.589 25.188 26.757 28.300 29.819 31.319 32.801 34.267 35.718 37.156 38.582 39.997 41.401 42.796 44.181 45.559 46.928 48.290 49.645 50.993 52.336 53.672 55.003 56.328 57.648 58.964 60.275 61.581 62.883 64.181 65.476 66.766 73.166 79.490 91.952 104.21 116.32 128.30 140.17 163.65 198.36

A tabela apresenta os pontos x tais que P 2 x = . (n) 129

2.7.5

Valores percentuais da FSnedcor com m e n graus de liberdade - F(m,n) Valores percentuais da distribuio F-Snedcor - = 0.90

m n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1000

1 39.9 8.53 5.54 4.54 4.06 3.78 3.59 3.46 3.36 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99 2.97 2.96 2.95 2.94 2.93 2.92 2.91 2.90 2.89 2.89 2.88 2.84 2.79 2.75 2.71

2 49.5 9.00 5.46 4.32 3.78 3.46 3.26 3.11 3.01 2.92 2.86 2.81 2.76 2.73 2.70 2.67 2.64 2.62 2.61 2.59 2.57 2.56 2.55 2.54 2.53 2.52 2.51 2.50 2.50 2.49 2.44 2.39 2.35 2.31

3 53.6 9.16 5.39 4.19 3.62 3.29 3.07 2.92 2.81 2.73 2.66 2.61 2.56 2.52 2.49 2.46 2.44 2.42 2.40 2.38 2.36 2.35 2.34 2.33 2.32 2.31 2.30 2.29 2.28 2.28 2.23 2.18 2.13 2.09

4 55.8 9.24 5.34 4.11 3.52 3.18 2.96 2.81 2.69 2.61 2.54 2.48 2.43 2.39 2.36 2.33 2.31 2.29 2.27 2.25 2.23 2.22 2.21 2.19 2.18 2.17 2.16 2.16 2.15 2.14 2.09 2.04 1.99 1.95

5 57.2 9.29 5.31 4.05 3.45 3.11 2.88 2.73 2.61 2.52 2.45 2.39 2.35 2.31 2.27 2.24 2.22 2.20 2.18 2.16 2.14 2.13 2.11 2.10 2.09 2.08 2.07 2.06 2.06 2.05 2.00 1.95 1.90 1.85

6 58.2 9.33 5.28 4.01 3.40 3.05 2.83 2.67 2.55 2.46 2.39 2.33 2.28 2.24 2.21 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05 2.04 2.02 2.01 2.00 2.00 1.99 1.98 1.93 1.87 1.82 1.78

7 58.9 9.35 5.27 3.98 3.37 3.01 2.78 2.62 2.51 2.41 2.34 2.28 2.23 2.19 2.16 2.13 2.10 2.08 2.06 2.04 2.02 2.01 1.99 1.98 1.97 1.96 1.95 1.94 1.93 1.93 1.87 1.82 1.77 1.72

8 59.4 9.37 5.25 3.95 3.34 2.98 2.75 2.59 2.47 2.38 2.30 2.24 2.20 2.15 2.12 2.08 2.06 2.04 2.02 2.00 1.98 1.97 1.95 1.94 1.93 1.92 1.91 1.90 1.89 1.88 1.83 1.77 1.72 1.68

9 59.9 9.38 5.24 3.94 3.32 2.96 2.72 2.56 2.44 2.35 2.27 2.21 2.16 2.12 2.09 2.06 2.03 2.00 1.98 1.96 1.95 1.93 1.92 1.91 1.89 1.88 1.87 1.87 1.86 1.85 1.79 1.74 1.68 1.64

10 60.2 9.39 5.23 3.92 3.30 2.94 2.70 2.54 2.42 2.32 2.25 2.19 2.14 3.92 2.06 2.03 2.00 1.98 1.96 1.94 1.92 1.90 1.89 1.88 1.87 1.86 1.85 1.84 1.83 1.82 1.76 1.71 1.65 1.61

15 61.2 9.42 5.20 3.87 3.24 2.87 2.63 2.46 2.34 2.24 2.17 2.10 2.05 2.01 1.97 1.94 1.91 1.89 1.86 1.84 1.83 1.81 1.80 1.78 1.77 1.76 1.75 1.74 1.73 1.72 1.66 1.60 1.55 1.49

20 61.7 9.44 5.18 3.84 3.21 2.87 2.59 2.42 2.30 2.20 2.12 2.06 2.01 1.96 1.92 1.89 1.86 1.84 1.81 1.79 1.78 1.76 1.74 1.73 1.72 1.71 1.70 1.69 1.68 1.67 1.61 1.54 1.48 1.43

30 62.3 9.46 5.17 3.82 3.17 2.80 2.56 2.38 2.25 2.16 2.08 2.01 1.96 1.91 1.87 1.84 1.81 1.78 1.76 1.74 1.72 1.70 1.69 1.67 1.66 1.65 1.64 1.63 1.62 1.61 1.54 1.48 1.41 1.35

40 62.5 9.47 5.16 3.80 3.16 2.78 2.54 2.36 2.23 2.13 2.05 1.99 1.93 1.89 1.85 1.81 1.78 1.75 1.73 1.71 1.69 1.67 1.66 1.64 1.63 1.61 1.60 1.59 1.58 1.58 1.51 1.44 1.37 1.30

60 62.8 9.47 5.15 3.79 3.14 2.76 2.51 2.34 2.21 2.11 2.03 1.96 1.90 1.86 1.82 1.78 1.75 1.72 1.70 1.68 1.66 1.64 1.62 1.61 1.59 1.58 1.57 1.56 1.55 1.54 1.47 1.40 1.32 1.25

120 63.1 9.48 5.14 3.78 3.12 2.74 2.49 2.32 2.18 2.08 2.00 1.93 1.88 1.83 1.79 1.75 1.72 1.69 1.67 1.64 1.62 1.60 1.59 1.57 1.56 1.54 1.53 1.52 1.51 1.50 1.42 1.35 1.26 1.18

1000

63.3 9.49 5.13 3.76 3.11 2.72 2.47 2.30 2.16 2.06 1.98 1.91 1.85 1.80 1.76 1.72 1.69 1.66 1.64 1.61 1.59 1.57 1.55 1.54 1.52 1.51 1.50 1.48 1.47 1.46 1.38 1.30 1.20 1.08

A tabela apresenta o pontos x tais que P F(m,n) x = 0.90. 130

Valores percentuais da FSnedcor com m e n graus de liberdade - F(m,n)


Valores percentuais da distribuio F-Snedcor - = 0.95
m n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1000 161 18.5 10.1 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 4.35 4.32 4.30 4.28 4.26 4.24 4.23 4.21 4.20 4.18 4.17 4.08 4.00 3.92 3.85 200 19.0 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68 3.63 3.59 3.55 3.52 3.49 3.47 3.44 3.42 3.40 3.39 3.37 3.35 3.34 3.33 3.32 3.23 3.15 3.07 3.00 216 19.2 9.28 6.59 5.41 4.76 4.35 4.07 3.86 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 3.10 3.07 3.05 3.03 3.01 2.99 2.98 2.96 2.95 2.93 2.92 2.84 2.76 2.68 2.61 225 19.2 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.73 2.71 2.70 2.69 2.601 2.53 2.45 2.38 230 19.3 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.03 2.96 2.90 2.85 2.81 2.77 2.74 2.71 2.68 2.66 2.64 2.62 2.60 2.59 2.57 2.56 2.55 2.53 2.45 2.37 2.29 2.22 234 19.3 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.53 2.51 2.49 2.47 2.46 2.45 2.43 2.42 2.34 2.25 2.18 2.11 237 19.4 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71 2.66 2.61 2.58 2.54 2.51 2.49 2.46 2.44 2.42 2.40 2.39 2.37 2.36 2.35 2.33 2.25 2.17 2.09 2.02 239 19.4 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.40 2.37 2.36 2.34 2.32 2.31 2.29 2.28 2.27 2.18 2.10 2.02 1.95 241 19.4 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59 2.54 2.49 2.46 2.42 2.39 2.37 2.34 2.32 2.30 2.28 2.27 2.25 2.24 2.22 2.21 2.12 2.04 1.96 1.89 242 19.4 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54 2.49 2.45 2.41 2.38 2.35 2.32 2.30 2.27 2.25 2.24 2.22 2.20 2.19 2.18 2.16 2.08 1.99 1.91 1.84 246 19.4 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.18 2.15 2.13 2.11 2.09 2.07 2.06 2.04 2.03 2.01 1.92 1.84 1.75 1.68 248 19.4 8.66 5.80 4.56 3.87 3.44 3.15 2.94 2.77 2.65 2.54 2.46 2.39 2.33 2.28 2.23 2.19 2.16 2.12 2.10 2.07 2.05 2.03 2.01 1.99 1.97 1.96 1.94 1.93 1.84 1.75 1.66 1.58 250 19.5 8.62 5.75 4.50 3.81 3.38 3.08 2.86 2.70 2.57 2.47 2.38 2.31 2.25 2.19 2.15 2.11 2.07 2.04 2.01 1.98 1.96 1.94 1.92 1.90 1.88 1.87 1.85 1.84 1.74 1.65 1.55 1.47 251 19.5 8.59 5.72 4.46 3.77 3.34 3.04 2.83 2.66 2.53 2.43 2.34 2.27 2.20 2.15 2.10 2.06 2.03 1.99 1.96 1.94 1.91 1.89 1.87 1.85 1.84 1.82 1.81 1.79 1.69 1.59 1.50 1.41 252 19.5 8.57 5.69 4.43 3.74 3.30 3.01 2.79 2.62 2.49 2.38 2.30 2.22 2.16 2.11 2.06 2.02 1.98 1.95 1.92 1.89 1.86 1.84 1.82 1.80 1.79 1.77 1.75 1.74 1.64 1.53 1.43 1.33 253 19.5 8.55 5.66 4.40 3.70 3.27 2.97 2.75 2.58 2.45 2.34 2.25 2.18 2.11 2.06 2.01 1.97 1.93 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.73 1.71 1.70 1.68 1.58 1.47 1.35 1.24 254 19.5 8.53 5.63 4.37 3.67 3.23 2.93 2.71 2.54 2.41 2.30 2.21 2.14 2.07 2.01 1.97 1.92 1.88 1.85 1.82 1.79 1.76 1.74 1.72 1.70 1.68 1.66 1.65 1.63 1.52 1.40 1.27 1.11 1 2 3 4 5 6 7 8 9 10 15 20 30 40 60 120
1000

A tabela apresenta o pontos x tais que P F(m,n) x = 0.95. 131

Valores percentuais da FSnedcor com m e n graus de liberdade - F(m,n)


Valores percentuais da distribuio F-Snedcor - = 0.975
m n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1000 648 38.5 17.4 12.2 10.0 8.81 8.07 7.57 7.21 6.94 6.72 6.55 6.41 6.30 6.20 6.12 6.04 5.98 5.92 5.87 5.83 5.79 5.75 5.72 5.69 5.66 5.63 5.61 5.59 5.57 5.42 5.29 5.15 5.04 800 39.0 16.0 10.6 8.43 7.26 6.54 6.06 5.71 5.46 5.26 5.10 4.97 4.86 4.77 4.69 4.62 4.56 4.51 4.46 4.42 4.38 4.35 4.32 4.29 4.27 4.24 4.22 4.20 4.18 4.05 3.93 3.80 3.70 864 39.2 15.4 9.98 7.76 6.60 5.89 5.42 5.08 4.83 4.63 4.47 4.35 4.24 4.15 4.08 4.01 3.95 3.90 3.86 3.82 3.78 3.75 3.72 3.69 3.67 3.65 3.63 3.61 3.59 3.46 3.34 3.23 3.13 900 39.2 15.1 9.60 7.39 6.23 5.52 5.05 4.72 4.47 4.28 4.12 4.00 3.89 3.80 3.73 3.66 3.61 3.56 3.51 3.48 3.44 3.41 3.38 3.35 3.33 3.31 3.29 3.27 3.25 3.13 3.01 2.89 2.80 922 39.3 14.9 9.36 7.15 5.99 5.29 4.82 4.48 4.24 4.04 3.89 3.77 3.66 3.58 3.50 3.44 3.38 3.33 3.29 3.25 3.22 3.18 3.15 3.13 3.10 3.08 3.06 3.04 3.03 2.90 2.79 2.67 2.58 937 39.3 14.7 9.20 6.98 5.82 5.12 4.65 4.32 4.07 3.88 3.73 3.60 3.50 3.41 3.34 3.28 3.22 3.17 3.13 3.09 3.05 3.02 2.99 2.97 2.94 2.92 2.90 2.88 2.87 2.74 2.63 2.52 2.42 948 39.4 14.6 9.07 6.85 5.70 4.99 4.53 4.20 3.95 3.76 3.61 3.48 3.38 3.29 3.22 3.16 3.10 3.05 3.01 2.97 2.93 2.90 2.87 2.85 2.82 2.80 2.78 2.76 2.75 2.62 2.51 2.39 2.30 957 39.4 14.5 8.98 6.76 5.60 4.90 4.43 4.10 3.85 3.66 3.51 3.39 3.29 3.20 3.12 3.06 3.01 2.96 2.91 2.87 2.84 2.81 2.78 2.75 2.73 2.71 2.69 2.67 2.65 2.53 2.41 2.30 2.20 963 39.4 14.5 8.90 6.68 5.52 4.82 4.36 4.03 3.78 3.59 3.44 3.31 3.21 3.12 3.05 2.98 2.93 2.88 2.84 2.80 2.76 2.73 2.70 2.68 2.65 2.63 2.61 2.59 2.57 2.45 2.33 2.22 2.13 969 39.4 14.4 8.84 6.62 5.46 4.76 4.30 3.96 3.72 3.53 3.37 3.25 3.15 3.06 2.99 2.92 2.87 2.82 2.77 2.73 2.70 2.67 2.64 2.61 2.59 2.57 2.55 2.53 2.51 2.39 2.27 2.16 2.03 985 39.4 14.3 8.66 6.43 5.27 4.57 4.10 3.77 3.52 3.33 3.18 3.05 2.95 2.86 2.79 2.72 2.67 2.62 2.57 2.53 2.50 2.47 2.44 2.41 2.39 2.36 2.34 2.32 2.31 2.18 2.06 1.95 1.85 993 39.4 14.2 8.56 6.33 5.17 4.47 4.00 3.67 3.42 3.23 3.07 2.95 2.84 2.76 2.68 2.62 2.56 2.51 2.46 2.42 2.39 2.36 2.33 2.30 2.28 2.25 2.23 2.21 2.20 2.07 1.94 1.82 1.72
1001 1006 1010 1014 1018

10

15

20

30

40

60

120

1000

39.5 14.1 8.46 6.23 5.07 4.36 3.89 3.56 3.31 3.12 2.96 2.84 2.73 2.64 2.57 2.50 2.44 2.39 2.35 2.31 2.27 2.24 2.21 2.18 2.16 2.13 2.11 2.09 2.07 1.94 1.82 1.69 1.58

39.5 14.0 8.41 6.18 5.01 4.31 3.84 3.51 3.26 3.06 2.91 2.78 2.67 2.59 2.51 2.44 2.38 2.33 2.29 2.25 2.21 2.18 2.15 2.12 2.09 2.07 2.05 2.03 2.01 1.88 1.74 1.61 1.50

39.5 14.0 8.36 6.12 4.96 4.25 3.78 3.45 3.20 3.00 2.85 2.72 2.61 2.52 2.45 2.38 2.32 2.27 2.22 2.18 2.14 2.11 2.08 2.05 2.03 2.00 1.98 1.96 1.94 1.80 1.67 1.53 1.41

39.5 13.9 8.31 6.07 4.90 4.20 3.73 3.39 3.14 2.94 2.79 2.66 2.55 2.46 2.38 2.32 2.26 2.20 2.16 2.11 2.08 2.04 2.01 1.98 1.95 1.93 1.91 1.89 1.87 1.72 1.58 1.43 1.29

39.5 13.9 8.26 6.02 4.86 4.15 3.68 3.34 3.09 2.89 2.73 2.60 2.50 2.40 2.32 2.26 2.20 2.14 2.09 2.05 2.01 1.98 1.94 1.91 1.86 1.86 1.84 1.82 1.80 1.65 1.50 1.33 1.13

A tabela apresenta o pontos x tais que P F(m,n) x = 0.975. 132

Valores percentuais da FSnedcor com m e n graus de liberdade - F(m,n)


Valores percentuais da distribuio F-Snedcor - = 0.99
m n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1000
4052 5000 5403 5625 5764 5859 5928 5981 6023 6056 6157 6209 6261 6287 6313 6339 6363

10

15

20

30

40

60

120

1000

98.5 34.1 21.2 16.3 13.7 12.2 11.3 10.6 10.0 9.65 9.33 9.07 8.86 8.68 8.53 8.40 8.29 8.18 8.10 8.02 7.95 7.88 7.82 7.77 7.72 7.68 7.64 7.60 7.56 7.31 7.08 6.85 6.66

99.0 30.8 18.0 13.3 10.9 9.55 8.65 8.02 7.56 7.21 6.93 6.70 6.51 6.36 6.23 6.11 6.01 5.93 5.85 5.78 5.72 5.66 5.61 5.57 5.53 5.49 5.45 5.42 5.39 5.18 4.98 4.79 4.63

99.2 29.5 16.7 12.1 9.78 8.45 7.59 6.99 6.55 6.22 5.95 5.74 5.56 5.42 5.29 5.19 5.09 5.01 4.94 4.87 4.82 4.76 4.72 4.68 4.64 4.60 4.57 4.54 4.51 4.31 4.13 3.95 3.80

99.2 28.7 16.0 11.4 9.12 7.85 7.01 6.42 5.99 5.67 5.41 5.21 5.04 4.89 4.77 4.67 4.58 4.50 4.43 4.37 4.31 4.26 4.22 4.18 4.14 4.11 4.07 4.04 4.02 3.83 3.65 3.48 3.34

99.3 28.2 15.5 11.0 8.75 7.46 6.63 6.06 5.64 5.32 5.06 4.86 4.70 4.56 4.44 4.34 4.25 4.17 4.10 4.04 3.99 3.94 3.90 3.86 3.82 3.78 3.75 3.73 3.70 3.51 3.34 3.17 3.03

99.3 27.9 15.2 10.7 8.47 7.19 6.37 5.80 5.39 5.07 4.82 4.62 4.46 4.32 4.20 4.10 4.01 3.94 3.87 3.81 3.76 3.71 3.67 3.63 3.59 3.56 3.53 3.50 3.47 3.29 3.12 2.96 2.82

99.4 27.7 15.0 10.5 8.26 6.99 6.18 5.61 5.20 4.89 4.64 4.44 4.28 4.14 4.03 3.93 3.84 3.77 3.70 3.64 3.59 3.54 3.50 3.46 3.42 3.39 3.36 3.33 3.30 3.12 2.95 2.79 2.66

99.4 27.5 14.8 10.3 8.10 6.84 6.03 5.47 5.06 4.74 4.50 4.30 4.14 4.00 3.89 3.79 3.71 3.63 3.56 3.51 3.45 3.41 3.36 3.32 3.29 3.26 3.23 3.20 3.17 2.99 2.82 2.66 2.53

99.4 27.3 14.7 10.2 7.98 6.72 5.91 5.35 4.94 4.63 4.39 4.19 4.03 3.89 3.78 3.68 3.60 3.52 3.46 3.40 3.35 3.30 3.26 3.22 3.18 3.15 3.12 3.09 3.07 2.89 2.72 2.56 2.43

99.4 27.2 14.5 10.1 7.87 6.62 5.81 5.26 4.85 4.54 4.30 4.10 3.94 3.80 3.69 3.59 3.51 3.43 3.37 3.31 3.26 3.21 3.17 3.13 3.09 3.06 3.03 3.00 2.98 2.80 2.63 2.47 2.34

99.4 26.9 14.2 9.72 7.56 6.31 5.52 4.96 4.56 4.25 4.01 3.82 3.66 3.52 3.41 3.31 3.23 3.15 3.09 3.03 2.98 2.93 2.89 2.85 2.82 2.78 2.75 2.73 2.70 2.52 2.35 2.19 2.06

99.4 26.7 14.0 9.55 7.40 6.16 5.36 4.81 4.41 4.10 3.86 3.66 3.51 3.37 3.26 3.16 3.08 3.00 2.94 2.88 2.83 2.78 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.37 2.20 2.03 1.90

99.5 26.5 13.8 9.38 7.23 5.99 5.20 4.65 4.25 3.94 3.70 3.51 3.35 3.21 3.10 3.00 2.92 2.84 2.78 2.72 2.67 2.62 2.58 2.54 2.50 2.47 2.44 2.41 2.39 2.20 2.03 1.86 1.71

99.5 26.4 13.7 9.29 7.14 5.91 5.12 4.57 4.17 3.86 3.62 3.43 3.27 3.13 3.02 2.92 2.84 2.76 2.69 2.64 2.58 2.54 2.49 2.45 2.42 2.38 2.35 2.33 2.30 2.11 1.94 1.76 1.61

99.5 26.3 13.7 9.20 7.06 5.82 5.03 4.48 4.08 3.78 3.54 3.34 3.18 3.05 2.93 2.83 2.75 2.67 2.61 2.55 2.50 2.45 2.40 2.36 2.33 2.29 2.26 2.23 2.21 2.02 1.84 1.66 1.50

99.5 26.2 13.6 9.11 6.97 5.74 4.95 4.40 4.00 3.69 3.45 3.25 3.09 2.96 2.84 2.75 2.66 2.58 2.52 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.17 2.14 2.11 1.92 1.73 1.53 1.35

99.5 26.1 13.5 9.03 6.89 5.66 4.87 4.32 3.92 3.61 3.37 3.18 3.02 2.88 2.76 2.66 2.58 2.50 2.43 2.37 2.32 2.27 2.22 2.18 2.14 2.11 2.08 2.05 2.02 1.82 1.62 1.40 1.16

A tabela apresenta o pontos x tais que P F(m,n) x = 0.99. 133

Inferncia Estatstica

Este captulo tem como objectivo fazer uma pequena abordagem a algumas tcnicas estatsticas que permitem tirar concluses sobre as caractersticas da populao com base na informao contida numa amostra.

3.1

Noes bsicas

Regra geral, num estudo estatstico, so raras as situaes onde se pode obter informao sobre todos os indivduos que o estudo pretende analisar, ou seja, sobre todos os elementos da populao (considere que esta constituda por N indivduos se for nita). Como tal, obtm-se informao sobre um subconjunto da populao denominado por amostra (considere-se que constituda por n indivduos, com n < N). Ao conjunto de operaes que tm por objectivo a escolha, numa populao, dos indivduos que devem constituir a amostra designa-se por amostragem. A denio deste processo importante, pois o processo de escolha dos elementos que devero estar na amostra ir condicionar as possveis concluses sobre a populao. Assim sendo, ao longo deste captulo, com o objectivo de facilitar a exposio das tcnicas que aqui vo ser apresentadas, considera-se que a amostra com que se est a trabalhar uma amostra aleatria simples. Denio 3.1.1 (Amostra aleatria simples) Uma amostra aleatria se todos os elementos da populao tm igual probabilidade de pertencerem amostra. Este processo pode ser efectuado com reposio ou sem reposio12 . Uma amostra diz-se simples se todos os elementos da amostra forem recolhidos de forma independente uns dos outros. Assim, uma amostra aleatria simples (X1 , X2 , , Xn ) constituda por n variveis aleatrias independentes e identicamente distribuidas (populao).
No entanto, no caso das amostras recolhidas sem reposio, ao longo deste captulo abordar-se- somente n os casos em que 0.05. N 13 Ao longo deste captulo, representar-se- por i. i. d. a idependentes e identicamente distribuidas.
12

13

varivel aleatria X

134

Exemplo 3.1.1 Considere que se pretende analisar uma populao com determinada funo de densidade (ou funo de probabilidade) com valor esperado e varincia 2 . Ento, se for recolhida uma amostra aleatria de dimenso n, representada por (X1 , X2 , , Xn ), esta constituda por n variveis aleatrias independentes com a mesma funo de densidade (ou funo de probabilidade) que a populao e, consequentemente, com o mesmo valor esperado [E(Xi ) = ] e a mesma varincia [V ar(Xi ) = 2 ]. Nota: Uma amostra aleatria representada por (X1 , X2 , , Xn ) onde cada Xi representa uma varivel aleatria e uma amostra concreta ser representada por (x1 , x2 , , xn ) onde xi j no so variveis aleatrias mas sim valores concretos (constantes). Assim, sempre que, neste captulo, for referida uma amostra aleatria (X1 , X2 , , Xn ) est-se a referir a um conjunto de n variveis aleatrias independentes com o mesmo valor esperado e com a mesma varincia, isto , E(Xi ) = e V ar(Xi ) = 2 para i = 1, , n, ou seja, n variveis aleatria i. i. d.. Este resultado vital para se compreender as concluses que neste captulo sero analisadas. Exemplo 3.1.2 A varivel aleatria X, que conta o tempo em que os iogurtes Boa Vida se encontram em bom estado de conservao, tem distribuio Normal com mdia igual a 270 horas e desvio padro igual a 20 horas. Considerando que o prazo de validade utilizado pela empresa de 200 horas, qual a probabilidade de, ao recolher uma amostra aleatria de dimenso 20, seja (X1 , X2 , , X20 ), todos os iogurtes estarem bons no m do prazo de validade? Em relao populao (tempo em que os iogurtes Boa Vida se encontram em bom estado de conservao) sabe-se que X N (270, 20), logo a amostra aleatria (X1 , X2 , , X20 ) constituda por n variveis aleatrias independentes, onde Xi N (270, 20) para i = 1, , 20. A probabilidade pedida a de todos os iogurtes estarem bons no m do prazo de validade (200 horas), ou seja, considerando que Xi o tempo em que o iogurte i se encontra em bom 135

estado de conservao, pretende-se determinar P (X1 > 200 X2 > 200 Xn > 200) = que tendo em conta que as variveis so independentes, vem = P (X1 > 200) P (X2 > 200) P (Xn > 200) = que, como as variveis so identicamente distribuidas, ou seja, todas tm a mesma distribuio que X, vem que = P (X > 200) P (X > 200) P (X > 200) = = [P (X > 200)]20 = [P (Z > 3.5)]20 = = [P (Z < 3.5)]20 = (0.9998)20 = 0.99601 A inferncia estatstica ser, ento, a parte da estatstica que desenvolve tcnicas que permitem, a partir da informao contida na amostra, tirar concluses sobre as caractersticas da populao que so desconhecidas. s caractersticas da populao que iro ser analisadas denominam-se por parmetros e so considerados xos. Exemplos 3.1.3 mdia da populao; 2 varincia da populao; p proporo de sucessos na populao (populaes de Bernoulli). Com o objectivo de analisar os parmetros utilizam-se estatsticas, que so variveis aleatrias obtidas atravs da informao contida na amostra, no dependendo de parmetros desconhecidos, ou seja, so funes das observaes da amostra, T (X1 , X2 , , Xn ). Exemplos 3.1.4 1X X = Xi mdia da amostra; n i=1
n n n

2 1 X 2 1 X 2 = Xi X varincia da amostra. Xi X = n i=1 n i=1 136

Nota: A frmula da mdia amostral (da amostra), X= 1X Xi n i=1


n

muitas vezes apresentada em estatstica descritiva (onde estamos a trabalhar com quadros de frequncias) atravs de
p p X 1X X= ni Xi onde ni = n. n i=1 i=1

No entanto, se considerarmos que todas as observaes so diferentes (numa amostra aleatria ainda no se conhece o valor das observaes, como tal, estas sero analisadas separadamente) tem-se que ni = 1 para i = 1, , p (ni - frequncias absolutas ordinrias - nmero de observaes na modalidade i), e, consequentemente n = p. Assim, as duas frmulas para a mdia amostral que foram apresentadas so exactamente iguais, a primeira s difere da segunda por supor que todas as observaes so diferentes. O mesmo raciocnio pode ser aplicado frmula da varincia apresentada, pois esta tambm difere da frmula habitualmente utilizada em estatstica descritiva pelas mesmas razes. Nota: Uma estatstica uma varivel aleatria que uma funo das observaes da amostra aleatria, como tal, pode ser representada por T (X1 , X2 , , Xn ) que assume valores particulares T (x1 , x2 , , xn ). Por exemplo X uma estatstica pelo facto de ser uma funo das variveis aleatrias X1 , X2 , , Xn e, como tal, tambm uma varivel aleatria (para amostras diferentes assume valores diferentes). Numa amostra concreta x um valor xo.

137

3.2

Estimadores Pontuais

Este sub-captulo tem como objectivo estudar o problema da estimao pontual. Assim, vai-se supor que uma populao tem uma determinada distribuio que depende de um parmetro desconhecido (que pode representar qualquer parmetro tal como , 2 , p ou outro). O objectivo da estimao pontual consiste em obter uma estatstica [funo da amostra T (X1 , X2 , , Xn )] que melhor aproxima o valor do parmetro desconhecido . Assim, a estatstica que vai ser usada para aproximar o valor de um parmetro denomina-se por estimador, sendo o seu valor numa amostra concreta denominado por estimativa. Denio 3.2.1 (Estimador) Um estimador de , representado por (X1 , X2 , , Xn ) ou simplesmente por uma estats , tica que usa o informao contida na amostra com o objectivo de estimar o valor de parmetros desconhecidos da populao. Denio 3.2.2 (Estimativa) Uma estimativa (x1 , x2 , , xn ), ou simplesmente o valor assumido por um estimador , numa amostra concreta. Nota: Um estimador uma estatstica, como tal, uma funo de uma amostra aleatria sendo, por esta razo, tambm uma varivel aleatria. Uma estimativa, pelo contrrio, uma constante, pois igual ao valor assumido pela funo (estimador) numa amostra concreta.

Existem duas formas tradicionais de obter estimadores para os parmetros da populao, pelo mtodo dos momentos e pelo mtodo da mxima verosimilhana. No entanto, estes mtodos no sero desenvolvidos nesta disciplina. Assim, apenas sero analisadas as propriedades dos estimadores. Estas propriedades tm como objectivo averiguar a qualidade de um estimador.

138

3.2.1

Mtodo dos momentos

Este mtodo de determinao de estimadores foi desenvolvido por Karl Pearson e denominado por mtodo dos momentos pois, a obteno de estimadores para os parmetros, consiste em igualar os momentos amostrais aos momentos da populao. Assim, os momentos da amostra e da populao podem ser denidos da seguinte forma. Denio 3.2.3 (Momentos da amostra) Seja (X1 , X2 , , Xn ) uma amostra aleatria de uma varivel aleatria X. O valor mdio das potncia de ordem k de (X1 , X2 , , Xn ), 1X k X Mk = n i=1 i
n

(55)

designa-se por momento amostral de ordem k, para k = 1, 2, 3, . Nota: O primeiro momento amostral a mdia da amostra, 1X Xi = X, M1 = n i=1
n

sendo o segundo momento denido por M2 = 1X 2 X n i=1


n

que utilizado na frmula simplicada de Kning para o clculo da varincia amostral, S2 = 1X 2 2 2 X X = M2 M1 . n i=1 i
n

Denio 3.2.4 (Momentos da Populao) Seja X uma varivel aleatria qualquer, ento, o momento de ordem k de X denido por k = E(X k ) para k = 1, 2, 3, . 139 (56)

Nota: O primeiro momento da populao representa o valor esperado 1 = E(X) = . O segundo momento da populao utilizado para determinar a varincia, pois este denido por 2 = E(X 2 ) que aparece na frmula simplicada do clculo da varincia que V ar (X) = E X 2 E 2 (X) = 2 2 . 1 Denio 3.2.5 (Mtodo dos momentos) Suponhamos que a distribuio de X caracterizada custa de um parmetro que se pode exprimir atravs da relao = h (1 , 2 , 3 , ) , ento o estimador construido pelo mtodo dos momentos dado por = h (M1 , M2 , M3 , ) , ou seja, expresso atravs de = h E (X) , E X 2 , E X 3 , , X 1X 3 = h X, 1 Xi2 , X , n i=1 n i=1 i
n n

(57)

sendo o estimador dado por

(58)

140

Exemplo 3.2.1 Considere que o nmero de telefonemas recebidos por hora pela ESTG tem distribuio de Poisson. Com base numa amostra aleatria com n = 100, x = 15 e s2 = 220 pretende-se encontrar uma estimativa para pelo mtodo dos momentos. Tendo em conta que, na distribuio de Poisson, tem-se E(X) = que corresponde funo (57) ( = 1 = ), ento, utilizando o mtodo dos momentos, o estimador obtido substituindo os momentos da populao () pelos respectivos momentos amostrais (M1 ) de onde se obtm 1X Xi = X = M1 = n i=1
n

que corresponde funo (58). A estimativa obtida calculando o valor que o estimador assume numa amostra particular, ou seja, neste exemplo ser igual a X 1 X 1 xi = xi = x = 15. = n i=1 100 i=1
n 100

Exemplo 3.2.2 Considere que o tempo entre dois telefonemas tem distribuio exponencial. Calcule uma estimativa para o utilizando uma amostra aleatria onde n = 50, x = 2 e s2 = 4. 1 1 Considerando que na distribuio exponencial tem-se E(X) = , ou seja, = , ento E(X) o estimador obtido pelo mtodo dos momentos 1 1 1 = = = n M1 X 1X Xi n i=1 e a estimativa 1 1 = = = 0.5. x 2 Exemplo 3.2.3 Considere que o tempo que determinada pessoa demora de casa ao seu posto de trabalho tem distribuio Normal. Utilizando uma amostra onde n = 40, x = 50 e s2 = 100. Calcule estimativas para e para utilizando o mtodo dos momentos.

141

Considerando que = E(X), tem-se como estimador para = M1 = Em relao varincia sabe-se que 2 = E(X 2 ) E(X)2 , logo, para obter o estimador substitui-se os momentos da populao pelos da amostra, resultando
2 b 2 = M2 M1 =

1X Xi = X. n i=1
n

1X 2 2 = Xi X = S 2 , n i=1
n

1X 2 = X n i=1 i
n

1X Xi n i=1
n

!2

que em relao ao desvio padro tem-se = p b 2 = 2 = S 2 = S,

logo, as estimativas para os parmetros so = x = 50 e = s = Exemplo 3.2.4

100 = 10.

Considere uma determinada populao com distribuio Uniforme no intervalo [0, ]. Determine uma estimativa pelo mtodo dos momentos para o parmetro utilizando uma amostra onde foram observados os seguintes valores (10, 22, 35, 7, 28, 42, 23, 14, 3, 34, 12, 23, 27, 34, 5, 22, 25, 17, 4, 13) . Considerando que se X U (a, b) tem-se E (X) = ento, como X U(0, ), tem-se a+b , 2

E (X) = , 2 142

ou seja, = 2E (X) sendo o estimador pelo mtodo dos momentos = 21 n e a estimativa = 2x = 2 20 = 40, pois a mdia da amostra apresentada igual a vinte. Note-se que o valor obtido no uma boa estimativa para pois, como X U(0, ) e = 40, ento o valor mximo que X poder assumir quarenta e na amostra obtida existe uma observao que ultrapassa este valor. Exemplo 3.2.5 Considere que determinada populao descrita por uma v. a. X com funo de probabilidade px (1 p)1x x = 0, 1 f (x) = , onde 0 < p < 1. 0 Caso contrrio para determinar uma estimativa para p. Note-se que trata-se de uma varivel aleatria com distribuio de Bernoulli (como tal, nestes caso, denominamos a populao de Bernoulli), pois a varivel s assume o valor 0 e o valor 1, com funo de probabilidade X: 0 1
n X i=1

Xi = 2X

Utilizando uma amostra onde n = 200, x = 0.25 e s2 = 0.19, utilize o mtodo dos momentos

f (x) : 1 p p sendo E (X) = 0 (1 p) + 1 p = p, logo o estimador 1X p= Xi = X n i=1


n

143

e a estimativa

1 X p= xi = x = 0.25. 200 i=1


200

Exemplo 3.2.6 Considere uma populao descrita por uma v. a. X com funo de densidade de probabilidade igual a x 0 x 2 22 f (x) = , onde > 0. 0 Caso contrrio (4, 15, 11, 12, 6, 20, 12, 14, 10, 16) . Vai-se comear por calcular o valor esperado da varivel aleatria X.
+ + Z Z0 Z2 2 Z x E (X) = xf (x) dx = 0dx + dx + 0dx = 22 0 2 3 2 3 3 (2) 8 4 x = = 2 2 = 2 = , 3 6 0 6 6

Utilizando o mtodo dos momentos, determine uma estimativa para com base na amostra

que resolvendo-se em ordem ao parmetro , vem 4 3 E (X) = = E (X) , 3 4 logo o estimador igual a X 3 = 3 M1 = 3 1 Xi = X 4 4 n i=1 4
n

e a estimativa

= 3 x = 3 12 = 9. 4 4 3.2.2 Mtodo da mxima verosimilhana

Este mtodo foi desenvolvido por Fisher e consiste em procurar os valores de com maior probabilidade de terem produzido as observaes da amostra (x1 , x2 , , xn ).

144

Denio 3.2.6 (Funo de verosimilhana) Seja (X1 , X2 , , Xn ) uma amostra aleatria de uma varivel aleatria X, cuja distribuio depende de m parmetros desconhecidos 1 , 2 , , m . Designa-se por funo de verosimilhana a seguinte funo: L (x1 , x2 , , xn , 1 , 2 , , m ) = P (X1 = x1 ) P (X2 = x2 ) P (Xn = xn ) no caso de X ser uma varivel aleatria discreta e L (x1 , x2 , , xn , 1 , 2 , , m ) = f (x1 ) f (x2 ) f (xn ) (60) (59)

no caso de X ser uma varivel aleatria contnua. Em ambas as equaes, (x1 , x2 , , xn ) representa os valores observados para uma amostra aleatria. Denio 3.2.7 (Mtodo da mxima verosimilhana) b b O estimador da mxima verosimilhana para os parmetros 1 , 2 , , m so os valores 1 , 2 , c , m que maximizam a funo de verosimilhana L (x1 , x2 , , xn , 1 , 2 , , m ). Nota:

Apesar da funo L (x1 , x2 , , xn , 1 , 2 , , m ) ter como variveis os parmetros desconhecidos e as observaes da amostra, usual representar apenas por L (1 , 2 , , m ) pois em funo destas variveis (parmetros desconhecidos) que se maximiza a funo. Nota: Para maximizar a funo de verosimilhana muitas vezes utilizado o logaritmo da funo de verosimilhana. Isto porque os valores de 1 , 2 , , m que maximizam a funo de verosimilhana so os mesmos que maximizam o logaritmo da funo (pois a funo logaritmo sempre crescente) e no o valor da funo que pretende-se saber mas somente os valores que a maximizam. Note-se ainda que a funo de verosimilhana nunca negativa (pois resulta do produto de funes de probabilidade ou de densidade), portanto, ao nvel do domnio do logaritmo o nico cuidado que se deve ter quando a funo de verosimilhana se anula. 145

Exemplo 3.2.7 Considere que o nmero de telefonemas recebidos por hora pela ESTG tem distribuio de Poisson. Considerando uma amostra onde n = 100, x = 15 e s2 = 220 , estime pelo mtodo da mxima verosimilhana. Tendo em conta que, na distribuio de Poisson, tem-se e x P (X = x) = x! a funo de verosimilhana , segundo a frmula (59) na pgina 145, denida por L () = P (X1 = x1 ) P (X2 = x2 ) P (Xn = xn ) =
n

e = x1 !

x1

e x2 !

x2

e xn !

xn

e i=1 = x1 ! x2 ! xn !

xi

Assim, o estimador de mxima verosimilhana o valor de que maximiza a funo L (). Recordando que o valor que maximiza L () o mesmo que maximiza ln [L ()] (ver nota presente na pgina 145), vem ln [L ()] = ln
n

en i=1 = x1 ! x2 ! xn !
n

xi

= ln e

i=1

xi

n ! n xi ln (x1 ! x2 ! xn !) = + ln i=1 = ln e = n +
n X i=1

ln (x1 ! x2 ! xn !) =

xi ln () ln (x1 ! x2 ! xn !) =
n X i=1

= n + ln ()

xi ln (x1 ! x2 ! xn !) =

Para maximizar vai-se calcular a primeira derivada da funo ln [L ()] em ordem a e igualar

146

a zero, de onde se obtm ln [L ()] =0 n P n + ln () xi ln (x1 ! x2 ! xn !)


i=1

n +
n X i=1

n 1X xi = n = xi = x. n i=1

1X xi = 0 i=1
n

n 1X
i=1

=0

xi = n

Para conrmar se, de facto, x um maximizante da funo, calcula-se a segunda derivada n P 1 xi n + 2 ln [L ()] i=1 = = 2 n 1 X = 2 xi < 0. i=1 Como a segunda derivada negativa (note-se que sendo xi valores de uma amostra cuja populao tem distribuio de Poisson, estes no podem assumir valores negativos) pode-se concluir que x o valor que maximiza a funo de verosimilhana, logo o estimador = X, sendo a estimativa = x = 15. Nota: Tendo em conta as caractersticas da funo de verosimilhana, sob determinadas condies de regularidade, que normalmente se vericam14 , bastar determinar a primeira derivada e igualar a zero. Exemplo 3.2.8 Considere que o tempo entre dois telefonemas tem distribuio exponencial. Calcule uma estimativa pelo mtodo da mxima verosimilhana para o parmetro utilizando uma amostra onde n = 50, x = 2 e s2 = 4.
14

As condies no sero aqui apresentadas pelo facto de a sua anlise matemtica no ser imediata, como

tal, para mais detalhes, consultar Murteira, Bento, Probabilidade e Estatstica, volume II.

147

ento a funo de verosimilhana, utilizando a frmula (60) patente na pgina 145, L () = f (x1 ) f (x2 ) f (xn ) = = ex1 ex2 exn = = n ex1 x2 ...xn =
n

Considerando que na distribuio exponencial tem-se como funo de densidade ex x > 0 , com > 0, f (x) = 0 x0

= e

xi
i=1

sendo o logaritmo da funo de verosimilhana denida por # " n ln [L ()] = ln n e


xi
i=1

= ln [n ] + ln e

"

xi
i=1

= n ln ()

n X i=1

xi = n ln ()

n X i=1

xi

que derivando e igualando a zero, obtm-se ln [L ()] =0 n P n ln () xi


i=1

1 X n = xi i=1
n

n X 1 n xi = 0 i=1

=0

1 1 nP = P = n 1 n xi xi n i=1 i=1 1 = , x

1 1 1 e a estimativa = = = 0.5. logo o estimador de mxima verosimilhana = x 2 X 148

Exemplo 3.2.9 Considere que o tempo que determinada pessoa demora de casa ao seu posto de trabalho tem distribuio Normal. Com base numa amostra onde n = 40, x = 50 e s2 = 100, calcule estimativas para e para utilizando o mtodo da mxima verosimilhana. Considerando que a funo de densidade da distribuio Normal 1 f (x) = 2 (x )2 2 2 , R, > 0, e

a funo de verosimilhana, utilizando a frmula (60) presente na pgina 145, L (, ) = f (x1 ) f (x2 ) f (xn ) = (x1 )2 (xn )2 1 1 2 2 2 2 e e = = 2 2 2 n (xi ) n 1 e i=1 2 2 = = 2 2 n n (xi ) e i=1 2 2 = 2 e o logaritmo da funo de densidade 2 n (xi ) n e i=1 2 2 = ln [L (, )] = ln 2

n X (x )2 i = n ln 2 = 2 2 i=1 1 n 1 X = n ln () + ln (2) 2 2 (xi )2 = 2 i=1 n 1 X n (xi )2 = n ln () ln (2) 2 2 2 i=1

2 n (xi ) n = ln 2 + ln e i=1 2 2 =

149

que calculando as derivadas em ordem aos parmetros a estimar e igualando-as a zero, tem-se ln[L(,)] = 0 ln[L(,)] =0 n P 12 (xi ) = 0 i=1 n n + 2 P (x )2 = 0 i 3 2 i=1 n n P 1 P 2 xi =0 i=1 i=1 n 1 P (x )2 = n 3 i n i=1 P x n = 0 i i=1 3 n P (x )2 = n i i=1 P n xi = n i=1 n 1 P (x )2 = 2 i n i=1 n P = 1 xi = X n i=1 n 2 = 1 P (x )2 = S 2 i n i=1 Assim, os estimadores da mxima verosimilhana so =X =S

Exemplo 3.2.10

sendo as estimativas para os parmetros iguais a = x = 50 = s = 100 = 10.

Considere uma determinada populao com distribuio Uniforme no intervalo [0, ]. Determine uma estimativa, pelo mtodo da mxima verosimilhana, para o parmetro utilizando uma amostra onde foram observados os seguintes valores (10, 22, 35, 7, 28, 42, 23, 14, 3, 34, 12, 23, 27, 34, 5, 22, 25, 17, 4, 13) . 150

ento se X U (0, ) tem-se

Considerando que X U (a, b) tem-se 1 axb ba , f (x) = 0 x<ax>b f (x) =


1

sendo a funo de verosimilhana,

0 x<0x>

0x

Como

que i, xi [0, ], como tal, analisa-se apenas este ramo, sendo o logaritmo da funo de verosimilhana deste ramo n 1 ln [L ()] = ln = ln n = n ln () ,

1 n

sempre positivo (pois positivo) o mximo desta funo ser no ramo em

L () = f (x1 ) f (x2 ) f (xn ) = 1 1 1 se i, x [0, ] i = = 0 se i, xi [0, ] / 1 n se i, x [0, ] i = 0 se i, x [0, ] /


i

que derivando e igualando a zero vem

[n ln ()] ln [L ()] =0 =0 n = 0, que impossvel. No entanto como a derivada n sempre negativa (pois n e so positivos)

a funo de verosimilhana decrescente o que signica que a funo assume um valor maior quanto menor for o valor de . Como tal vai-se escolher para valor de o seu valor mnimo

admissvel. Como todas as observaes tm que estar contidas no intervalo [0, ] (pois, como foi visto, caso contrrio a sua funo de verosimilhana seria zero) o valor admissvel mnimo de o valor mximo de xi (pois o menor valor de que garante que i, xi [0, ]). Assim, 151

o estimador de mxima verosimilhana para = max Xi , sendo a estimativa a observao da amostra com maior valor, ou seja = max xi , que na amostra obtida corresponde a 42. Note-se que o estimador da mxima verosimilhana para a distribuio Uniforme distinto do obtido pelo mtodo dos momentos (ver exemplo 3.2.4 na pgina 142). Exemplo 3.2.11 Considere uma populao descrita por uma varivel aleatria X com funo de probabilidade px (1 p)1x x = 0, 1 , onde 0 < p < 1. f (x) = 0 Caso contrrio verosimilhana para determinar uma estimativa para p. Como a funo de probabilidade P (X = x) = px (1 p)1x , tem-se como funo de verosimilhana L (p) = P (X = x1 ) P (X = x2 ) P (X = xn ) = = px1 (1 p)1x1 px2 (1 p)1x2 pxn (1 p)1xn =
n n n n n

Com base numa amostra onde n = 200, x = 0.25 e s2 = 0.19, utilize o mtodo da mxima

= pi=1 (1 p)i=1
n

xi xi

(1xi )
n

= pi=1 (1 p)i=1

xi

1
i=1

xi

= pi=1 (1 p)

n
i=1

xi

sendo o logaritmo da funo de verosimilhana, " n


xi

ln [L (p)] = ln pi=1 (1 p) = ln pi=1 =


n X i=1

n
i=1

xi

"

xi

+ ln (1 p)
n X i=1

"

=
n

n
i=1

xi

xi ln (p) + n

xi ln (1 p)

152

que derivando e igualando a zero, vem [ln L (p)] =0 p n n P P xi ln (p) + n xi ln (1 p)


i=1 i=1

=0

=0 p (1 p) ! n n n X X X xi p xi p n xi = 0
i=1

=0 n n P P xi (1 p) xi p n p 1p
i=1 i=1

i=1

n P

xi

i=1

n P

xi

p n pn =

n X i=1

i=1 n X i=1

xi +

n X i=1

xi

!
n

xi p =

1X xi = x n i=1

i=1 n X i=1

xi

O estimador da mxima verosimilhana para p p = X, sendo a estimativa igual a p = x = 0.25. Exemplo 3.2.12 Considere uma populao com distribuio Uniforme no intervalo [, ]. Determine uma estimativa pelo mtodo da mxima verosimilhana para os parmetros e utilizando uma amostra aleatria de dimenso 12 onde se obteve os seguinte resultados (12, 45, 23, 53, 35, 43, 23, 55, 23, 43, 10, 35) . Considerando que X U (, ), ento 1 x f (x) = 0 x<x> 153

sendo a funo de verosimilhana igual a L (, ) = f (x1 ) f (x2 ) f (xn ) = 1 1 1 se i, xi [, ] = = / 0 se i, xi [, ] n 1 se i, xi [, ] = = 0 se i, xi [, ] / ( )n se i, x [, ] i = 0 se i, x [, ] /


i

Como ( )n sempre positivo (pois > ), o mximo desta funo ser no ramo em que i, xi [, ]. Assim, analisa-se unicamente este ramo, sendo o logaritmo da funo de verosimilhana deste ramo igual a ln [L (, )] = ln ( )n = n ln ( )
n n

onde ambas as equaes so impossveis. No entanto, como a derivada em ordem a , que


n ,

que derivando e igualando a zero vem ln[L(,)] = 0 ln[L(,)] = 0

=0 =0

sempre positiva (pois n e ( ) so positivos) a funo de verosimilhana crescente.

Isto signica que a funo assume um valor maior quanto maior for o valor de . Como tal, escolhe-se como valor para o seu valor mximo admissvel. Em relao derivada em ordem a
n , que , sempre negativa, logo a funo de verosimilhana decrescente o que signica

que a funo assume um valor maior quanto menor for o valor de . Assim, vai-se escolher como valor para o seu valor mnimo admissvel. Como todas as observaes tm que estar contidas no intervalo [, ] (pois, como foi visto, caso contrrio a sua funo de verosimilhana seria zero) o valor admissvel mximo para o menor valor observado na amostra, ou seja, o valor mnimo de xi (pois o maior valor que verica i, xi [, ]) e, pelas mesmas razes, o valor admissvel mnimo para o valor mximo xi . Resumindo, os estimadores de mxima 154

verosimilhana para e so = min Xi e = max Xi , sendo as estimativas = min xi = 10 e = max xi = 55. Exemplo 3.2.13 Considere que determinada populao descrita por uma v. a. X com funo de densidade de probabilidade x 0 x 2 22 , onde > 0. f (x) = 0 Caso contrrio (4, 15, 11, 12, 6, 20, 12, 14, 10, 16) . No caso de todas as observaes pertencerem ao intervalo [0, 2], a funo de verosimilhana L () = f (x1 ) f (x2 ) f (xn ) = x2 xn x1 = = 2 2 2 2 22 n 1 = x1 x2 xn = 22 n x1 x2 xn = = 22 = 2n 2n x1 x2 xn ento, a funo de verosimilhana igual a 2n 2n x1 x2 xn se i, xi [0, 2] , L () = 0 se i, xi [0, 2] /

Utilizando o mtodo da mxima verosimilhana, determine uma estimativa para , com base na amostra

que, de forma semelhante realizada nos exemplos da distribuio Uniforme, como no primeiro ramo a funo sempre positiva, o mximo desta funo ser obrigatoriamente neste ramo. Assim, vai-se considerar que i, xi [0, 2], sendo o logaritmo da funo de verosimilhana igual a ln [L ()] = ln 2n 2n x1 x2 xn = = ln 2n + ln 2n + ln (x1 x2 xn ) = = n ln 2 2n ln + ln (x1 x2 xn ) 155

que derivando e igualando a zero, vem ln [L ()] =0 [n ln 2 2n ln + ln (x1 x2 xn )] =0 2n =0 o que impossvel. Porm, como a derivada sempre negativa 2n < 0 pode-se concluir que

esta funo decrescente, ou seja, quanto maior o valor de menor ser o valor da funo

de verosimilhana. Assim, como o objectivo maximizar a funo de verosimilhana, deve ser escolhido o menor valor de que satisfaz a restrio i, xi [0, 2], concluindo-se que o menor valor que satisfaz esta restrio fazer 2 ser igual ao valor mximo observado, ou seja, 2 = max Xi que, resolvendo em ordem a obtm-se = = 1 max xi = 2
1 2 1 2

max Xi . A estimativa ser

20 = 10.

156

3.2.3

Propriedades dos estimadores pontuais

Para estimar um parmetro desconhecido da populao () podem existir vrios estimadores, como tal, necessrio saber por qual deles optar. Assim, para distinguir a qualidade de um estimador, estudam-se trs caractersticas que servem para analisar ou comparar estimadores. A primeira anlise sobre a qualidade de um estimador vericar se ele centrado. Denio 3.2.8 (Estimador Centrado) Um estimador diz-se centrado se o seu valor esperado for igual ao valor do parmetro a estimar. E( = ) (61)

Um estimador centrado fornece, em mdia, estimativas correctas, isto , coincidentes com o verdadeiro valor do parmetro. Exemplo 3.2.14 Ser que a mdia da amostra um estimador centrado para a mdia da populao? O que pretendido vericar se E X = . ! ! n n X 1 1X Xi = E Xi = E X = E n i=1 n i=1 = 1X 1X 1 E (Xi ) = = n = . n i=1 n i=1 n
n n

lao ().

Assim, conclui-se que mdia da amostra X um estimador centrado para a mdia da popu-

Exemplo 3.2.15 Ser que a varincia da amostra um estimador centrado para a varincia da populao? O que pretendido vericar se E (S 2 ) = 2 ? ! n ! n 2 1X 2 1X 2 2 2 =E X X X E X = E(S ) = E n i=1 i n i=1 i n 2 1 X 2 E Xi E X . = n i=1 157

(62)

Para simplicar esta frmula utilizam-se os seguintes resultados: V ar(Xi ) = E(Xi2 ) E 2 (Xi ) 2 = E(Xi2 ) 2 E(Xi2 ) = 2 + 2 e, considerando que V ar(X) = apresentada), conclui-se que V ar(X) = E(X ) E 2 (X) 2 2 = E(X ) 2 n 2 2 + 2 . E(X ) = n Clculo da varincia da mdia da amostra: 1X Xi n i=1
n 2 2 n

(63)

(ver clculo da varincia da mdia da amostra a seguir

(64)

V ar(X) = V ar

que, como as variveis Xi so independentes, tem-se ! n n X 1 1 X V ar Xi = 2 V ar (Xi ) , n2 n i=1 i=1

! n X 1 = 2 V ar Xi , n i=1

que subtitundo V ar (Xi ) por 2 (pois como as variveis Xi so as observaes de uma amostra aleatria, todas elas tm a mesma varincia) vem
n n 1 X 1 X 2 1 2 V ar (Xi ) = 2 = 2 n 2 = n2 i=1 n i=1 n n

logo conclui-se que V ar(X) =

2 . n

Assim, utilizando os resultados obtidos em (63) e (64), ou seja E(Xi2 ) = 2 + 2 e E(X ) =


2

2 + 2 , n

158

na frmula (62), obtm-se 2 1 X 2 E Xi E X = n i=1 2 n 1 X 2 2 2 + = = + n i=1 n


n

2 1 2 n + 2 2 = n n 2 n1 2 2 = = 2 + 2 n n =

Assim, conclui-se que a varincia da amostra no um estimador centrado para 2 , ou seja, para varincia da populao. Para tornear este problema, tendo como objectivo utilizar um estimador centrado para a varincia da populao, foi criada a varincia amostral corrigida, que denida por
2 SC

pois

2 1 X n S2 = Xi X = n 1 i=1 n1
n

(65)

2 E SC = E Exemplo 3.2.16

n n 2 S = E S2 = n1 n1 n1 2 n = 2 . = n1 n

Considere uma populao onde foi recolhida uma amostra aleatria de dimenso 11, onde se obteve x = 300 e s2 = 100. Indique estimativas centradas para a mdia e para a varincia desta populao. Um estimador centrado para a mdia da populao () a mdia da amostra X (ver

exemplo 3.2.14) e um estimador centrado para a varincia da populao ( 2 ) a varincia


2 corrigida da amostra (SC ) (ver exemplo 3.2.15). Assim, a estimativa centrada para a mdia da

populao = x = 300 e a estimativa centrada para a varincia da populao b 2 = s2 = C n 2 11 s = 100 = 110. n1 11 1 159

Exemplo 3.2.17 Ser que X 2 = kXk n (n + 1) k=1


n

um estimador centrado para ?

Para que seja um estimador centrado para o seu valor esperado tem que ser igual a , ou seja, E ( ) = . E ( ) = E = X 2 kXk n (n + 1) k=1
n n X k=1

2 = E n (n + 1) 2 n (n + 1)
n X k=1

2 n (n + 1)

n X
k=1

kXk

E (kXk ) =

kE (Xk )

que, como X1 , X2 , , Xn so observaes de uma amostra aleatria e consequentemente so independentes e identicamente distribuidas (como tal tm todas o mesmo valor esperado), vem X X X 2 2 2 kE (Xk ) = k = k n (n + 1) k=1 n (n + 1) k=1 n (n + 1) k=1
n n n

que como

metade da soma do primeiro termo com o ltimo vezes o nmero de termos, tem-se X 1+n 2 2 n= k= n (n + 1) k=1 n (n + 1) 2
n

n X k=1

k um somatrio cujo termo geral uma progresso aritmtica, este igual a

logo, pode-se concluir que um estimador centrado para . Por vezes, para um parmetro, existem vrios estimadores centrados, ento, como decidir qual dos estimadores deve ser utilizado? Neste casos deve-se optar, de entre os estimadores centrados, pelo estimador que for mais eciente. Denio 3.2.9 (Ecincia relativa) b b b Sejam 1 e 2 dois estimadores centrados para , ento diz-se que o estimador 1 mais eciente b que o estimador 2 se tiver menor varincia, ou seja, 160 b b < V ar 2 . V ar 1 (66)

Exemplo 3.2.18 Considere os seguintes estimadores para com base numa amostra aleatria de dimenso n, com n 30, 1 b 3 b 1X = X= Xi ; n i=1
n

2 = b 4 b

X1 + Xn ; 2 X1 + 2X2 + 3X3 + 4X4 ; = 10 n 1 X = Xi . n 1 i=1

1. Vericar se os estimadores so centrados. Em relao ao primeiro estimador tem-se E (1 ) = E(X) = b

centrado para . Em relao ao segundo estimador tem-se 1 X1 + Xn = E (X1 + Xn ) = E (2 ) = E b 2 2 1 1 1 [E (X1 ) + E (Xn )] = ( + ) = 2 = = 2 2 2

como j foi demonstrado no exemplo 3.2.14 na pgina 157. Assim, o estimador 1 b

logo, o estimador 2 tambm centrado para . Em relao ao estimador 3 tem-se b b X1 + 2X2 + 3X3 + 4X4 = E (3 ) = E b 10 1 E (X1 + 2X2 + 3X3 + 4X4 ) = = 10 1 [E (X1 ) + E (2X2 ) + E (3X3 ) + E (4X4 )] = = 10 1 = [E (X1 ) + 2E (X2 ) + 3E (X3 ) + 4E (X4 )] = 10 1 1 = [ + 2 + 3 + 4] = 10 = 10 10 b assim, tambm o estimador 3 centrado para . Finalmente, em relao a 4 , o seu b 161

valor esperado E (4 ) = E b = = 1 X Xi n 1 i=1


n n

1 X 1 X E (Xi ) = = n 1 i=1 n 1 i=1


n

1 = E n1

n X
i=1

Xi

n 1 n = 6= , n1 n1

2. Calcule a varincia de cada um dos estimadores. Em relao ao estimador 1 tem-se b

de onde se conclui que o estimador 4 no centrado para . b ! ! n X 1 = 2 V ar Xi n i=1

que, tendo em conta que (X1 , X2 , , Xn ) uma amostra aleatria e, como tal, constituda por variveis aleatrias independentes e identicamente distribuidas, conclui-se que, pela independncia, a varincia da soma igual soma das varincias e, pelo facto de as variveis serem identicamente distribuidas, a varincia igual em todas as variveis, ou seja, V ar(Xi ) = 2 . Assim, ! n n X 1 1 X = 2 V ar Xi V ar (Xi ) = n2 n i=1 i=1

V ar(1 ) = V ar(X) = V ar b

1X Xi n i=1
n

n 1 X 2 1 2 = 2 = 2 n 2 = , n i=1 n n

logo a varincia de 1 b Em relao ao estimador 2 tem-se b

V ar (1 ) = b

2 . n

= V ar(2 ) = V ar b 2 1 = V ar (X1 + Xn ) 2 162

X1 + Xn 2

que, como X1 e Xn so i. i. d., ento 2 1 V ar (X1 + Xn ) = 2 1 = [V ar (X1 ) + V ar (Xn )] = 4 2 1 2 + 2 = = 0.52 . = 4 2 Assim, a varincia deste estimador

Em relao ao estimador 3 tem-se b

V ar(2 ) = 0.52 . b X1 + 2X2 + 3X3 + 4X4 10

V ar (3 ) = V ar b = 2 1 = V ar (X1 + 2X2 + 3X3 + 4X4 ) 10

que, tendo em conta que X1 , X2 , X3 , X4 so i. i. d., tem-se 2 1 V ar (X1 + 2X2 + 3X3 + 4X4 ) = 10 1 [V ar (X1 ) + V ar (2X2 ) + V ar (3X3 ) + V ar (4X4 )] = = 100 1 = V ar (X1 ) + 22 V ar (X2 ) + 32 V ar (X3 ) + 42 V ar (X4 ) = 100 1 2 30 2 + 4 2 + 9 2 + 16 2 = = 0.32 , = 100 100 concluindo-se que a varincia do terceiro estimador V ar(3 ) = 0.32 . b

Finalmente, em relao ao estimador 4 tem-se b ! ! n n X 1 1 X Xi = V ar Xi V ar (4 ) = V ar b n 1 i=1 (n 1)2 i=1

163

que, tendo em conta que X1 , X2 , , Xn uma amostra aleatria, tem-se ! n X 1 V ar Xi = (n 1)2 i=1 n n X X 1 1 = V ar (Xi ) = 2 = 2 2 (n 1) i=1 (n 1) i=1 n 1 2 2. = 2n = (n 1) (n 1)2 A varincia do estimador 4 igual a b n 2. (n 1)2

3. Qual dos estimadores apresentados mais eciente? Em primeiro lugar, s faz sentido comparar a ecincia de um conjunto de estimadores centrados, como tal, o estimador 4 (por no ser centrado) no ir ser analisado. Assim, b dos restantes trs estimadores pretende-se determinar aquele que possui menor varincia. Considerando que a varincia de cada um dos estimadores : 2 ; n V ar (2 ) = 0.5 2 ; b V ar (1 ) = b

V ar(4 ) = b

estimador 1 o mais eciente dos trs estimadores analisados, sendo 3 mais eciente b b do que 2 . b

b b Tendo em conta que n 30 tem-se V ar (1 ) < V ar (3 ) < V ar (2 ), concluindo-se que o b

V ar (3 ) = 0.3 2 . b

Uma outra anlise qualidade de um estimador averiguar se este melhora com o aumento da dimenso da amostra. Este tipo de anlise importante no caso de utilizao de amostras com grandes dimenses. Uma das formas usuais de analisar se um estimador vai melhorando as suas qualidades quando a dimenso da amostra vai aumentando averiguar se o estimador consistente.

164

Denio 3.2.10 (Estimador consistente) O estimador de diz-se consistente se > 0 : lim P < = 1
n+

(67)

Para demonstrar que um estimador consistente atravs da denio , normalmente, bastante complicado, assim, na prtica, utilizado o seguinte teorema que fornece condies sucientes para garantir que um estimador seja consistente. Teorema 3.2.1 (Condies suciente para que um estimador seja consistente) lim E = n+ lim V ar = 0
n+

(68)

Nota:

O teorema anterior apresenta apenas as condies sucientes para que um estimador seja consistente. Isto signica que, se estas condies se vericarem, conclui-se que o estimador consistente, mas, caso contrrio, nada se pode concluir sobre a consistncia do estimador. Exemplo 3.2.19 Considere os estimadores para apresentados no exemplo 3.2.18 na pgina 161 e analise-os em relao consistncia. O que se pretende ver quais, dos quatro estimadores apresentados, que satisfazem lim E ( ) = bi n+ , para i = 1, 2, 3, 4. lim V ar ( ) = 0 bi
n+

Em relao a 1 tem-se b

lim E ( ) = lim = b1
n+ n+

2 lim V ar ( ) = lim = 0 b1 n+ n+ n

165

logo o estimador 1 consistente para . Em relao a 2 tem-se b b lim E ( ) = lim = b2


n+ n+ n+ n+

assim, como uma das condies no se vericou, nada se pode concluir sobre a consistncia de 2 . Em relao a 3 tem-se b b lim E ( ) = lim = b3
n+ n+ n+ n+

lim V ar ( ) = lim 0.52 = 0.5 2 6= 0 b2

logo, tambm em relao ao estimador 3 nada se pode concluir. Finalmente, em relao a 4 b b tem-se i) lim E ( ) = lim b4 n = n+ n+ n 1 n ii) lim V ar (4 ) = lim b 2 = 0 n+ n+ (n 1)2

lim V ar ( ) = lim 0.32 = 0.3 2 6= 0 b3

consistente.

logo o estimador 4 consistente para . Note-se que este estimador no centrado, mas b

166

3.3

Distribuies amostrais

Ao longo do estudo da estimao pontual utilizaram-se estimadores para calcular estimativas de parmetros desconhecidos da populao. At agora apenas foi referido que um estimador uma varivel aleatria, mas, se uma varivel aleatria, qual ser a sua distribuio? Neste captulo responder-se- a esta pergunta, sob determinadas condies, em relao aos estimadores mais utilizados para a mdia da populao, para a proporo de uma populao e para a varincia da populao. 3.3.1 Distribuio da mdia amostral - conhecido e populao com distribuio Normal Teorema 3.3.1 Considere uma populao que segue distribuio Normal com E (Xi ) = e V ar (Xi ) = 2 . Seja X1 , X2 , , Xn uma amostra aleatria desta populao, ento . X N , n Demonstrao: Considere-se uma populao que segue uma distribuio normal com conhecido [X N (, )]. Assim, tendo em conta que uma amostra aleatria (X1 , X2 , , Xn ) constituda por n variveis aleatrias i. i. d. (independentes e identicamente distribuidas) a X, pode-se concluir que Xi N(, ) para i = 1, , n. Finalmente, recordando que 1X X= Xi , n i=1
n

(69)

ou seja, que X obtido por uma combinao linear de variveis aleatrias independentes com distribuio Normal, pode-se utilizar o teorema da estabilidade da distribuio Normal (rever teorema 2.5.6 na pgina 91) para concluir que X tem 167

distribuio Normal. Como E(X) = e V ar(X) = . X N , n

2 tem-se n

Exemplo 3.3.1 O tempo de produo de cada pea de cermica da empresas BoaLoia uma varivel aleatria com distribuio Normal com mdia 1000 segundos e desvio padro 80 segundos. 1. Qual a probabilidade de, ao ser recolhida uma amostra aleatria, a mdia amostral situar-se entre 980 e 1020 segundos? (a) Considere uma amostra aleatria de dimenso 25. Como X N (1000, 80), ou seja = 1000 e = 80 e a amostra constituda por vinte e cinco observaes (n = 25) tem-se , X N , n ou seja, 80 , X N 1000, 25 X N (1000, 16) logo P 980 X 1020 = P 1020 1000 980 1000 Z = 16 16 = P (1.25 Z 1.25) = P (Z 1.25) P (Z 1.25) = = P (Z 1.25) [1 P (Z 1.25)] = 2P (Z 1.25) 1 = = 2 0.8944 1 = 0.7888.

168

(b) Considere uma amostra aleatria de dimenso 100. Como X N (1000, 80), onde = 1000 e = 80, e a amostra constituda por cem observaes (n = 100) tem-se , X N , n ou seja, 80 X N 100, 100 X N (100, 8) logo P 980 X 1020 = P 980 1000 1020 1000 Z = 8 8 = P (2.5 Z 2.5) = P (Z 2.5) P (Z 2.5) = = P (Z 2.5) [1 P (Z 2.5)] = 2P (Z 2.5) 1 = = 2 0.9938 1 = 0.9876. 2. Qual a dimenso da amostra a recolher de forma a que a mdia amostral seja inferior a 1020 com probabilidade superior a 0.975. Considerando que a populao tem distribuio Normal e conhecido, pela frmula (69) na pgina 167 conclui-se que , X N , n 80 X N 1000, n

ou seja,

169

pretendendose determinar o valor de n tal que P X < 1020 > 0.975

1020 1000 > 0.975 P Z < 80 n 20 P Z< n > 0.975 80 P Z < 0.25 n > 0.975 0.25 n > 1.96 n > 61.4656 que, como n N, considera-se n 62. Nota: Na frmula da distribuio da mdia amostral, , X N , n verica-se que o desvio padro de X igual a , isto n X = , n logo este depende da dimenso da amostra (n). Assim, conclui-se que quanto maior for a dimenso da amostra (valor de n) menor ser a disperso de X em torno de . 3.3.2 Distribuio da mdia amostral - conhecido e populao com distribuio no Normal (ou desconhecida) Quando a distribuio da populao no a distribuio Normal (ou no conhecida) tem-se que recorrer ao teorema do limite central (teorema 2.5.9 apresentado na pgina 96) que um dos teoremas com maior importncia na Estatstica. Deste teorema retira-se que X=
n X i=1

que, como corolrio, pode-se deduzir a distribuio da mdia amostral. 170

Xi N n, n

Corolrio 3.3.1 Sejam X1 , X2 , , Xn , n variveis aleatrias independentes e identicamente distribuidas (i.i.d.)

com E(X) = e V ar(X) = 2 , ento, fazendo n tender para innito, a varivel aleatria n 1P X= Xi tem distribuio aproximadamente Normal, ou seja, n i=1 (70) X N , n Regra: Na prtica utiliza-se o teorema do limite central e, como tal, tambm este corolrio, quando n 30. Demonstrao: Considerando que X=
n X i=1

pelo teorema do limite central (as condies do teorema e do corolrio so as mesmas), ento, pelo teorema da estabilidade da Lei Normal (ver teorema 2.5.6 na pgina 91) X tambm tem distribuio (aproximadamente) Normal. Exemplo 3.3.2 O nmero de produtos vendidos diariamente na loja BoaVida uma varivel aleatria com valor esperado 200 e desvio padro igual a 30. 1. Se for recolhida uma amostra aleatria de dimenso 100 (observados cem dias), qual a probabilidade de a mdia diria de vendas na amostra ser superior a 205? Tendo em conta que numa amostra aleatria as variveis X1 , X2 , , Xn so i. i. d., ento pode-se utilizar o teorema do limite central e respectivo corolrio pois n 30. Assim, pela frmula (70), obtm-se , X N , n

Xi N n, n

1X Xi e n i=1
n

171

que substituindo pelos valores do problema, = 200, = 30 e n = 100, tem-se 30 , X N 200, 100 que simplicando obtm-se X N (200, 3) , logo P X > 205 ' P 205 200 Z> = P (Z > 1.6667) ' 3 ' 1 (1.67) = 1 0.9525 = 0.0475.

2. Se for recolhida uma amostra aleatria de dimenso 400, qual a probabilidade de a mdia amostral ser superior a 205? Utilizando a mesma frmula que na alnea anterior tem-se 30 , X N 200, 400 que simplicando vem X N (200, 1.5) , logo P X > 205 ' P Exemplo 3.3.3 Na loja BoaVida o tempo que um cliente tem de esperar at ser atendido uma varivel aleatria com mdia segundos e desvio padro cinquenta ( = 50). Qual a dimenso da amostra a recolher de forma que a distncia da mdia amostral mdia da populao seja inferior a 10 com probabilidade superior a 0.99? (considere n 30) Como n 30 tem-se , X N , n

205 200 Z> = P (Z > 3.3333) ' 1.5 ' 1 (3.33) = 1 0.9996 = 0.0004.

172

pela frmula (70), onde substituindo pelo seu valor tem-se 50 , X N , n ento, pretende-se determinar o valor de n tal que P X < 10 > 0.99

10 10 > 0.99 <Z< P 50 50 n n 10 10 P n<Z< n > 0.99 50 50 P 0.2 n < Z < 0.2 n > 0.99 P Z < 0.2 n P Z 0.2 n > 0.99 P Z < 0.2 n 1 P Z 0.2 n > 0.99 2P Z 0.2 n 1 > 0.99 P Z 0.2 n > 0.995 0.2 n > 2.576 n > 165.89 que, como n N, considera-se n 166. 3.3.3 Distribuio da proporo amostral - Populao de Bernoulli

P (10 < X < 10) > 0.99

Um caso particular de aplicao do teorema do limite central surge para as populaes de Bernoulli (rever provas de Bernoulli presentes na pgina 61). Nas populaes de Bernoulli as observaes s assumem dois valores, o valor um, no caso de sucesso, e o valor zero, no caso de insucesso. Assim, nestas populaes, a mdia no mais do que a proporo de sucessos (nmero de sucessos a dividir pelo nmero total de elementos). Por esta razo representa-se por p a proporo de sucesso da populao (que no mais do que a mdia da populao, ou seja, o parmetro ) e por p a proporo de sucessos na amostra (que a mdia da amostra, ou seja, o estimador X). Se recordarmos que, na distribuio de Bernoulli a varincia da varivel 173

dada por p (1 p) (ou seja, =

3.3.1 da pgina 171 obtendo-se assim o teorema de De Moivre-Laplace. Teorema 3.3.2 (Teorema de De Moivre - Laplace)

p p (1 p)), ento pode-se utilizar estes resultados no corolrio

Sejam X1 , , Xn , n variveis i. i. d. com distribuio de Bernoulli, onde E(X) = p e V ar(X) = p (1 p), ento, fazendo n tender para innito, a varivel aleatria p tem dis tribuio aproximadamente Normal, ou seja, r ! p (1 p) pp N (0, 1) , ou seja, r p N p, n p (1 p) n Regra: Na prtica utiliza-se o teorema de De Moivre - Laplace quando n 30. Exemplo 3.3.4 Considere que se pretende fazer uma sondagem para saber qual a opinio dos portugueses sobre a aco do governo. 1. Considerando que cinquenta por cento dos portugueses favorvel s polticas do governo (p = 0.5), qual a probabilidade de, numa amostra aleatria de dimenso 100, haver uma proporo superior a cinquenta e um por cento de indivduos favorveis s polticas do governo ( > 0.51)? p Considerando que n 30, pode-se utilizar a frmula (71), que substitudo os valores conhecidos vem pN ou seja, p N (0.5, 0.05) , ento 0.51 0.5 P ( > 0.51) ' P Z > p = 0.05 = P (Z > 0.2) = 1 P (Z 0.2) = = 1 0.5793 = 0.4207. 174

(71)

0.5,

0.5 (1 0.5) 100

2. Qual dever ser a dimenso da amostra aleatria a recolher de forma a que a distncia entre a proporo de indivduos favorveis aco do governo na populao (p) e na amostra () seja inferior a 0.02 com probabilidade superior a 0.9? p Pretende-se determinar o valor de n tal que P (| p| < 0.02) > 0.9, ento, sob a hiptese p de n 30, pode-se utilizar o resultado da frmula (71), ou seja ! r p (1 p) , ou p N p, n Z = r p (1 p) n pp N(0, 1)

ento

considerando que para obter a varivel aleatria Z basta dividir tudo por que

P (| p| < 0.02) > 0.9 P (0.02 < p p < 0.02) > 0.9, p r P (0.02 < p p < 0.02) > 0.9

p (1 p) , vem n

que simplicando vem

0.02 0.02 <Z< p P p > 0.9 p (1 p) p (1 p) n n

0.02 pp 0.02 > 0.9 P r <r <r p (1 p) p (1 p) p (1 p) n n n

! 0.02 n 0.02 n P p <Z< p > 0.9 p (1 p) p (1 p) ! ! 0.02 n 0.02 n P Z p > 0.9 P Z<p p (1 p) p (1 p) !# ! " 0.02 n 0.02 n 1P Z < p > 0.9 P Z<p p (1 p) p (1 p) ! ! 0.02 n 0.02 n 1 > 0.9 P Z < p > 0.95 2P Z < p p (1 p) p (1 p) 175

que recorrendo tabela da distribuio Normal vem 0.02 n p > 1.645 p (1 p) 1.645 p n> p (1 p) 0.02 2 1.645 n> p (1 p) n > 6765.0625 p (1 p) 0.02 assim o valor de n depende do valor de p, no entanto, para garantir o pretendido, para qualquer que seja o valor de p, deve-se maximizar esta funo, pois assim vai-se garantir para o pior valor de p e, consequentemente, para qualquer outro valor de p. Para maximizar a funo calculam-se as suas derivadas. [6765.0625 p (1 p)] =0 p [6765.0625 (p p2 )] =0 p 1 6765.0625 (1 2p) = 0 p = 2 para que o ponto encontrado seja, de facto, um mximo, a segunda derivada tem que ser negativa, ento 2 [6765.0625 p (1 p)] [6765.0625 (1 2p)] = = 2 p p = 6765.0625 2 < 0 logo p =
1 2

o valor de p que maximiza a funo. Substituindo obtm-se 1 1 1 n > 1691.3 n > 6765.0625 2 2

que, como n N, considera-se n 1692. Assim, com uma amostra com dimenso de pelo menos 1692 observaes garante-se, com probabilidade superior a 0.9, que a distncia entre a proporo na populao (p) e a proporo na amostra () seja inferior a 0.02, seja p qual for o valor de p.

176

3.3.4

Distribuio da varincia amostral - Populao com distribuio Normal

Teorema 3.3.3 Considere uma populao que segue distribuio Normal com E (Xi ) = e V ar (Xi ) = 2 . Seja X1 , X2 , , Xn uma amostra aleatria desta populao, ento
2 (n 1) SC 2 (n1) . 2 2 onde SC representa a varincia corrigida da amostra.

(72)

Demonstrao: Considere-se uma populao que tem distribuio normal [X N(, )]. Assim, tendo em conta que uma amostra aleatria (X1 , X2 , , Xn ) constituda por n variveis aleatrias i. i. d. a X, pode-se concluir que Xi N(, ) para i = 1, , n, logo Zi = Xi N (0, 1)

que pela relao da distribuio Normal com a Qui-quadrado (ver teorema 2.5.11 na pgina 102) vem que Zi2 = Xi 2 = (Xi )2 2 . (1) 2

Como as variveis aleatrias Xi so independentes, ento as variveis Zi2 = (Xi )2 2 (1) 2

tambm o so. Assim, pelo teorema da aditividade da distribuio Qui-quadrado (teorema 2.5.12 presente na pgina 104) conclui-se que
n X i=1

n X i=1

Zi =

Xi

n X i=1

(Xi )2 2

2 . (n)

(73)

177

Note-se que, se desenvolvermos o numerador desta expresso, somando e subtraindo X, obtm-se


n X i=1 n n X 2 X 2 = = Xi X + X = Xi X + X

(Xi )

n n n X 2 X X 2 = 2 Xi X X + X = Xi X +

i=1 n Xh i=1

i=1

2 2 i Xi X + 2 Xi X X + X =
i=1 i=1

pois

n X 2 2 = Xi X + n X i=1

i=1 n X i=1

2 Xi X + 2 X

n X i=1

2 Xi X + n X =

" n # n n X X X 2 X Xi X = Xi X = 2 X
i=1 i=1 " i=1 # n X = 2 X Xi nX i=1 n

que como X= conclui-se que

X 1X Xi Xi = nX n i=1 i=1
n

logo

" n # X 2 X Xi nX = 2 X nX nX = 0,
i=1 n X 2 X Xi X = 0. i=1 n X 2 2 Xi X + n X i=1 n X Xi X i=1

Como tal, tem-se


n X i=1

(Xi ) 2

2 2

(74)

2 n X + . 2

(75)

178

Note-se que

2 n X 2 (1) 2 pois, como (X1 , X2 , , Xn ) constituda por n variveis aleatrias i. i. d. a X e X N(, ), pode-se utilizar a frmula (69) presente na pgina 167, , X N , n ou seja, Z= como tal 2 X N (0, 1) , n

2 2 n X X X = 2 Z2 = = (1) 2 2 n n Assim, se na expresso (74) substituir-se os resultados (73) e (76) obtm-se


n X 2 Xi X i=1

(76)

2 = (n) logo conclui-se que

+ 2 , (1)

2 (n1) 2 Esta frmula pode ser desenvolvida atravs de


n X 2 Xi X i=1 n 2 1 X Xi X 2 i=1

n X 2 Xi X i=1

(77)

2 Recordando a frmula da varincia corrigida - SC (ver frmula (65) na pgina 159)

que, multiplicando e dividindo tudo por n 1, vem 2 n n 2 n 1 X Xi X 1 X . Xi X = 2 i=1 2 i=1 n1 2 n n 1 X Xi X n1 2 S = 2 i=1 n1 2 C 179

vem que

Assim conclui-se que


2 (n 1) SC 2 (n1) . 2

Nota: Note-se que na frmula (73) tinha-se deduzido que


n X i=1

(Xi )2 2

2 (n)

e na frmula (77) concluiu-se que


n X 2 Xi X i=1

2 (n1) ,

onde se verica que se perde um grau de liberdade quando numa substitui-se um dos parmetros ( - mdia da populao) pelo seu estimador (X - mdia da amostra). Isto verica-se pelo facto que no primeiro caso tem-se a soma de n variveis aleatrias independentes enquanto que, no segundo caso, uma das variveis dependente das restantes, pois se o valor de X e de n 1 variveis Xi so conhecidas, a outra varivel Xi pode ser determinada. Exemplo 3.3.5 O Departamento de Pessoal da empresa BoaVida fez um levantamento dos salrios dos seus funcionrios do sector administrativo. Considere que os salrios seguem uma distribuio Normal com valor esperado 1000 euros e desvio padro 10 euros. 1. Qual a probabilidade de a varincia amostral corrigida ser inferior a 120 considerando uma amostra aleatria de dimenso 25? Considerando que a populao tem distribuio Normal ento pode-se utilizar
2 (n 1) SC 2 (n1) 2

180

que como = 10 e n = 25 tem-se


2 (25 1) SC 2 = 0.24SC 2 (24) 102

logo 2 2 P SC < 120 = P 0.24SC < 0.24 120 = P 2 < 28.8 (24) Valores de x Valores de 28.241 28.8 29.553 logo, pela interpolao linear, vem 29.553 28.241 29.553 28.8 logo P 2 < 28.8 ' 0.7713. (24) 0.80 0.75 0.80 0 0 ' 0.7713. = 0.75 0 =? 0.80

que recorrendo s tabelas da distribuio Qui-quadrado vem

2. Qual a probabilidade de o desvio padro amostral corrigido ser superior a 9 considerando uma amostra aleatria de dimenso 101? Considerando que a populao tem distribuio Normal ento pode-se utilizar
2 (n 1) SC 2 (n1) 2

que como = 10 e n = 101 tem-se


2 (101 1) SC 2 = SC 2 (100) 2 10

logo 2 2 P (SC > 9) = P SC > 81 = P 2 (100) > 81 = 1 P (100) 81 181

que recorrendo s tabelas da distribuio Qui-quadrado vem Valores de x Valores de 77.929 81 82.358 logo, pela interpolao linear, vem 82.358 77.929 82.358 81 concluindo-se que 81 ' 1 0.08467 = 0.91533. 1 P 2 (100) 3.3.5 Distribuio da mdia amostral - desconhecido e populao com distribuio Normal Teorema 3.3.4 Considere uma populao que segue distribuio Normal com E (Xi ) = e V ar (Xi ) = 2 . Seja X1 , X2 , , Xn uma amostra aleatria desta populao, ento X t(n1) SC n onde SC representa o desvio padro corrigido da amostra. Demonstrao: Em relao a uma populao com distribuio Normal, quando foi analisada a distribuio da mdia amostral, supondo conhecido, deduziu-se que , X N , n 182 (78) 0.10 0.05 0.10 0 0 ' 0.08467. = 0.05 0 =? 0.10

ou seja, X N (0, 1) . n Na distribuio da varincia amostral concluiu-se que X0 = Y0 =


2 (n 1) SC 2 (n1) . 2

Supondo a independncia entre estes dois resultados e utilizando o teorema 2.5.17 da pgina 110, conclui-se que r logo X n X0 t(n1) , Y0 n1

v u (n 1) S 2 u C t 2 n1 que, simplicando a frmula, vem X n

t(n1)

que, como > 0 e SC > 0, tem-se X X X X n n r = = = 2 SC SC S SC C n n 2 logo X t(n1) SC n

v u (n 1) S 2 u C t 2 n1

X n = r =s , 2 2 SC (n 1) SC 2 2 (n 1)

X n

183

Exemplo 3.3.6 O lucro obtido por cada produto vendido na loja BoaVida tem distribuio Normal com mdia e desvio padro . 1. Supondo que o lucro mdio duzentos euros ( = 200), determine a probabilidade de a mdia amostral ser superior a 205 com base numa amostra aleatria de dimenso 11 onde se obteve uma varincia igual a 110. Considerando que a populao tem distribuio Normal com desconhecido, utiliza-se X t(n1) . SC n Tendo em conta que = 200, n = 11, s2 = 4 e que
2 SC =

s2 C obtm-se

n S 2 , logo n1 11 = 110 = 121 = sC = 121 = 11 10 X 200 X 200 = t(10) . 11 11 11

Assim, P X > 205 = P X 200 205 200 > 11 11 = P t(10) > 1.5076 = = 1 P t(10) 1.5076 =

que recorrendo s tabelas da distribuio t-Student vem

Valores de x Valores de 1.3722 1.5076 1.8125 184 0.90 0 =? 0.95

logo, pela interpolao linear, vem 1.8125 1.3722 1.8125 1.5076 logo 1 P t(10) 1.5076 ' 1 0.91538 = 0.08462. 0.95 0.90 0.95 0 0 ' 0.91538. =

2. Com base numa amostra aleatria de dimenso 25 onde s2 = 864, qual a probabilidade de a mdia do lucro obtido em cada produto numa amostra afastar-se menos de dez euros da mdia da populao? P X < 10 =? lizar X t(n1) SC n Primeiro vai-se calcular a varincia corrigida
2 SC =

Considerando que a populao tem distribuio Normal com desconhecido, vai-se uti-

s2 C Assim,

n S 2 , logo n1 25 864 = 900 = sC = 900 = 30. = 24 X X t(24) , = 30 6 25

logo, P X < 10 = P 10 < X < 10 = X 10 10 < = = P < 6 6 6 = P 1.6667 < t(24) < 1.6667 = = P t(24) < 1.6667 P t(24) < 1.6667 = = P t(24) < 1.6667 P t(24) > 1.6667 = = P t(24) < 1.6667 1 P t(24) < 1.6667 = = 2P t(24) < 1.6667 1. 185

Recorrendo s tabelas da distribuio t-Student vem Valores de x Valores de 1.3178 1.6667 1.7109 que, pela interpolao linear, conclui-se que 1.7109 1.3178 1.7109 1.6667 Substituindo o valor obtido obtm-se 2P t(24) < 1.6667 1 ' 2 0.94438 1 = 0.88876. Nota: Quando a dimenso da amostra superior a trinta elementos (n > 30), os graus de liberdade da t-Student so maiores ou iguais a 30 (n 1 30), logo pode-se aplicar o teorema 2.5.18 presente na pgina 111 que aproxima a distribuio t-Student distribuio Normal. Desta forma conclui-se que: X N (0, 1) SC n Exemplo 3.3.7 O tempo (em minutos) que uma perfuradora Perfurix do modelo SP-2000 demora a perfurar vinte polegadas uma varivel aleatria X com distribuio Normal. Com base numa amostra aleatria de dimenso 400 onde s2 = 39900, qual a probabilidade de a mdia amostral afastar-se menos de vinte minutos da mdia da populao? P X < 20 =? Considerando que a populao tem distribuio Normal com desconhecido, utiliza-se X t(n1). S C n 186 ou SC X N , n

0.90 0 =? 0.95

0.95 0.90 0.95 0 0 ' 0.94438. =

(79)

Primeiro calcula-se a varincia corrigida


2 SC =

s2 C Assim,

n S 2 , logo n1 400 39900 = 40000 = sC = 40000 = 200. = 399

X X = t(399) , 200 10 400 mas, como os graus de liberdade da t-Student so superiores a 30, pode-se aproximar Normal, concluindo-se que X N (0, 1) . 10 Aplicando este resultado ao problema obtm-se P X < 20 = P 20 < X < 20 = 20 20 X < = = P < 10 10 10 = P (2 < Z < 2) = = P (Z < 2) P (Z < 2) = = (2) [1 (2)] = = 0.9772 1 + 0.9772 = 0.9544. Exemplo 3.3.8 Considere que, para analisar o tempo que uma mquina demora a produzir determinado produto, foi recolhida uma amostra aleatria de dimenso 36 onde foi obtido x = 1200 segundos e s2 = 21875. Considerando que o tempo tem distribuio Normal, determine a probabilidade de a mdia da amostra afastar-se menos de sessenta segundos da mdia da populao. Como no conhecido e a populao possui distribuio Normal, vai-se recorrer frmula (78). A varincia corrigida obtida atravs de
2 SC =

s2 C

n S 2 , logo n1 36 = 21875 = 22500 = sC = 22500 = 150. 35 187

A distribuio a utilizar X X = t(35) , 150 25 36 mas, como os graus de liberdade da t-Student so superiores a 30, o clculo da probabilidade pretendida pode ser simplicado utilizando a aproximao distribuio Normal. Assim, podese utilizar X N (0, 1) . 25 Pretende-se, ento, calcular P X < 60 = P 60 < X < 60 = P 60 60 <Z< = 25 25 = P (2.4 < z < 2.4) = P (Z < 2.4) P (Z < 2.4) = = P (Z < 2.4) [1 P (Z < 2.4)] = 2P (Z < 2.4) 1 = = 2 0.9918 1 = 0.9826.

188

3.3.6

Quadro resumo das distribuies amostrais Condies conhecido e populao Normal conhecido e n 30 desconhecido e populao Normal Distribuio X N , n X N , n X t(n1) SC n X N (0, 1) SC n ! r p (1 p) p N p, b n Z=
2 (n 1) SC 2

Parmetro Estimador X X X

desconhecido, populao Normal e n > 30

p 2

2 SC

p b

Populao Bernoulli e n 30 Populao Normal

2 (n1)

189

3.4

Intervalos de conana

Na teoria da estimao pontual foram utilizados estimadores para fornecer um valor (estimativa) para um parmetro desconhecido . No entanto, no foi avaliada a preciso da estimativa. Esta preciso pode ser avaliada utilizando a teoria da estimao por intervalos, pois, neste caso, em vez de se indicar um valor concreto para o parmetro desconhecido , constri-se um intervalo que, com determinada probabilidade previamente denida, contm o verdadeiro valor do parmetro . Assim, estes intervalos, ao contrrio da estimao pontual, permitem denir a preciso da estimao (pois a probabilidade escolhida previamente). Para a construo deste intervalo, determina-se um intervalo aleatrio para o parmetro e, depois, com base numa amostra particular, calcula-se o intervalo de conana. Denio 3.4.1 (Intervalo aleatrio para ) Sejam T1 (X1 , X2 , , Xn ) e T2 (X1 , X2 , , Xn ) duas estatsticas (funes da amostra), ento diz-se que ]T1 , T2 [ um intervalo aleatrio para com probabilidade 1 se P [T1 (X1 , X2 , , Xn ) < < T2 (X1 , X2 , , Xn )] = 1 (80)

ou seja, ]T1 (X1 , X2 , , Xn ) , T2 (X1 , X2 , , Xn ) [ um intervalo aleatrio para com probabilidade igual a 1 . Denio 3.4.2 (Intervalo de conana para ) Se num intervalo aleatrio para , seja ]T1 (X1 , X2 , , Xn ) , T2 (X1 , X2 , , Xn ) [, com probabilidade 1 , substituir-se nas funes T1 (X1 , X2 , , Xn ) e T2 (X1 , X2 , , Xn ) as variveis aleatrias por valores de uma amostra concreta, obtm-se o intervalo ]T1 (x1 , x2 , , xn ) , T2 (x1 , x2 , , xn ) [ que denominado por intervalo com (1 ) 100 por cento de conana para . Para a construo dos intervalos de conana utiliza-se um estimador, com distribuio conhecida, para o parmetro. Assim, para construir intervalos de conana para deve-se utilizar o estimador X, pois, como foi analisado no captulo 3.3, este estimador (sob determinadas 190 (81)

condies) tem distribuio conhecida. Seguindo o mesmo raciocnio, para construir intervalos
2 de conana para ou 2 deve-se utilizar o estimador SC . Com o objectivo de facilitar a

apresentao da construo dos intervalos de conana analisa-se cada um dos casos analisados no captulo 3.3 em particular. Note-se que o raciocnio inerente construo de um intervalo de conana muito semelhante de caso para caso. 3.4.1 Intervalos de conana para a mdia - conhecido e populao com distribuio Normal Considere-se uma populao com distribuio Normal com mdia igual a e desvio padro igual a , isto , X N (, ). Se for recolhida uma amostra de dimenso n, como que se pode construir um intervalo com (1 ) 100 por cento de conana para ? Em primeiro lugar, como estimador de tem-se a mdia da amostra X , que, como a populao tem distribuio Normal e conhecido, utiliza-se , X N , n ou seja, X N (0, 1) . n

Z=

(82)

Denio 3.4.3 (Varivel fulcral) A varivel aleatria X n que vai ser utilizada como base para a construo do intervalo de conana denominada por Z= varivel aleatria fulcral. Esta varivel tem funo de distribuio conhecida e depende unicamente de um parmetro desconhecido (sendo este o parmetro para o qual se vai determinar o intervalo de conana). Para determinar o intervalo aleatrio para comea-se por denir um intervalo em que P (linf < Z < lsup ) = 1 , 191

ou seja, determinar um intervalo ]linf , lsup [ onde a varivel Z pertena com probabilidade igual a 1. Com o objectivo de o intervalo nal possuir a menor amplitude possvel, deve-se procurar os valores de linf e lsup que minimizem a amplitude do intervalo ]linf , lsup [, concluindo-se que linf e lsup so simtricos devido s caractersticas da distribuio Normal. Considerando que a probabilidade de Z estar contido no intervalo ]linf , lsup [ igual a 1 , ento a probabilidade de no pertencer a este intervalo , sendo a probabilidade de ser inferior a linf igual a e a 2 probabilidade de ser superior a lsup tambm igual a . 2

Interpretao grca de z1 . 2

Assim, vai-se representar o ponto limite superior deste intervalo (lsup ) por z1 , sendo z o
2

ponto cuja probabilidade de a varivel Z ser inferior (ou igual) igual a , ou seja, z pode ser denido por P (Z z ) = . Exemplo 3.4.1 Qual o valor de z0.95 ? Pela denio apresentada na frmula (83), z0.95 pode ser denido por P (Z z0.95 ) = 0.95, que, recorrendo tabela da funo de distribuio da Normal, vem P (Z z0.95 ) = 0.95 z0.95 = 1.645 192 (83)

Assim, z0.95 representa o ponto em que a probabilidade de a varivel aleatria Z ser inferior (ou igual) a esse ponto igual a 0.95, sendo o seu valor 1.645, ou seja, z0.95 = 1.645. Considerando que lsup igual a z1 ento linf , como foi referido, simtrico a lsup sendo
2

igual a z1 . Substituindo estes resultados no intervalo inicialmente proposto vem


2

P (linf

< Z < z = 1 . < Z < lsup ) = 1 P z1 1


2 2

Resolvendo em ordem ao parmetro , conclui-se que

Substituindo a varivel Z pela sua expresso (ver frmula (82) na pgina 191) obtm-se X P z1 < Z < z1 = 1 P z1 < < z1 = 1 . 2 2 2 2 n

X P z1 < < z1 = 1 2 2 n P z1 < X < z1 =1 2 2 n n P z1 X < < z1 X = 1 2 2 n n P X z1 < < X + z1 =1 2 2 n n

que corresponde denio de intervalo aleatrio (ver frmula (80) na pgina 190), logo o intervalo aleatrio para com probabilidade 1 X z1 , X + z1 2 2 n n sendo o intervalo com (1 ) 100 por cento de conana para denido por x z1 , x + z1 2 2 n n que resulta em substituir no intervalo aleatrio o estimador pela estimativa (por valores obtidos atravs de uma amostra particular).

193

Exemplo 3.4.2 A durao dos computadores da marca WorkFast tem distribuio Normal com valor mdio igual a dias e desvio padro igual a 80 dias, isto , X N (, 80). Considere que foi recolhida uma amostra de 64 computadores onde se vericou uma mdia de 1000 dias e uma varincia igual a 6500. Construa um intervalo, com noventa e cinco por cento de conana, para o tempo mdio de durao de um computador WorkFast. Em primeiro lugar, considerando que a populao tem distribuio Normal e conhecido, pode-se concluir que X N , n

que, substituindo pelos valores conhecidos, obtm-se 80 , ou seja, X N (, 10) . X N , 64 Assim, a varivel fulcral a utilizar Z= X N (0, 1) . 10

Para determinar o intervalo inicial, vem que 1 = 0.95 (pois pretende-se um intervalo com 95 por cento de conana) ento z1 = z0.975 , que pode ser determinado atravs de
2

P (Z z0.975 ) = 0.975 z0.975 = 1.96

Interpretao grca de z0.975 .

194

Assim, o intervalo inicial ser X P 1.96 < < 1.96 = 0.95 10 que resolvendo em ordem ao parmetro vem P 19.6 < X < 19.6 = 0.95 P 19.6 X < < 19.6 X = 0.95 P X 19.6 < < X + 19.6 = 0.95. X 19.6, X + 19.6

O intervalo aleatrio para , com probabilidade 0.95,

e o intervalo com noventa e cinco por cento de conana para ]1000 19.6, 1000 + 19.6[ , ou seja, ]980.4, 1019.6[ . Assim, o tempo mdio de durao de um computador WorkFast pertence ao intervalo ]980.4, 1019.6[ com noventa e cinco por cento de conana.

195

Nota: Em relao ao exemplo analisado anteriormente, tem-se que P X 19.6 < < X + 19.6 = 0.95

um intervalo aleatrio para com probabilidade 0.95. Todavia, qual ser a probabilidade de pertencer ao intervalo de conana? P (980.4 < < 1019.6) = ?

devido s caractersticas da varivel aleatria X. Como tal, X 19.6, X + 19.6

(84)

Saliente-se que representa a mdia da populao que desconhecida mas xa. Note-se, ento, que na expresso anterior no existe nenhuma varivel aleatria, consequentemente a desigualdade 980.4 < < 1019.6 ou verdadeira (sendo a sua probabilidade igual a um) ou falsa (sendo a sua probabilidade igual a zero). Por exemplo, se o verdadeiro valor de for 975, este no pertence ao intervalo de conana, logo a probabilidade presente em (84) igual a zero. Se, pelo contrrio, assume o valor 1010, este pertence ao intervalo de conana, logo, a probabilidade patente em (84) igual a um. Assim, quando se diz que pertence a um intervalo com noventa e cinco por cento de conana, signica que, para noventa e cinco por cento das amostras aleatrias, o intervalo de conana contm o verdadeiro valor de . 3.4.2 Intervalos de conana para a mdia - conhecido e populao com distribuio no Normal (ou desconhecida) Considere-se uma populao com distribuio desconhecida (ou outra que no seja a distribuio Normal) com mdia igual a e desvio padro igual a , isto , E (X) = e V ar (X) = 2 . Se for recolhida uma amostra de dimenso n (com n 30), como que se pode construir um intervalo com (1 ) 100 por cento de conana para ?

196

Como estimador de tem-se X que nestas condies pode-se utilizar a frmula (70), ou seja, . X N , n

Assim, a varivel fulcral a utilizar neste caso Z=

X N (0, 1) . n

Para construir o intervalo aleatrio para , determina-se um intervalo que contenha a varivel aleatria Z com probabilidade igual a 1 , ou seja, P (linf < Z < lsup ) = 1 , que, como a varivel tem distribuio Normal Standard, utiliza-se os pontos z1 (ver frmula
2

e resolve-se em ordem a , de onde se obtm < Z < z P z1 =1 1 2 2

(83) na pgina 192) que satisfazem P z1 < Z < z1 = 1


2 2

X P z1 < < z1 = 1 2 2 n P z1 < X < z1 =1 2 2 n n P X z1 < < X + z1 = 1 . 2 2 n n

O intervalo aleatrio para com probabilidade 1 X z1 , X + z1 2 2 n n sendo o intervalo com (1 ) 100 por cento de conana para denido por x z1 , x + z1 . 2 2 n n

197

Exemplo 3.4.3 Em Alfalndia, o nmero de computadores vendidos diariamente tem mdia desconhecida e desvio padro igual a 30. Considere que foram observados o nmero de computadores vendidos em cem dias onde se obteve um mdia igual a 250. Com base nesta amostra aleatria, construa um intervalo, com noventa por cento de conana, para a mdia de computadores vendidos diariamente em Alfalndia. Tendo em conta que no se conhece a distribuio da populao e que n 30 utiliza-se , X N , n sendo a varivel fulcral Z= X N (0, 1) . n

Substituindo = 30 e n = 100 na varivel fulcral obtm-se Z= X X = N (0, 1) . 30 3 100

Primeiro determina-se o intervalo para a varivel aleatria Z com probabilidade 0.9 (1 = 0.90, pois pretende-se um intervalo com 90 por cento de conana) P (linf < Z < lsup ) = 0.90 como, de fora do intervalo ca 0.1, esta probabilidade ser dividida, sendo 0.05 inferior a linf e 0.05 superior a lsup . Assim sendo o intervalo pretendido P (z0.95 < Z < z0.95 ) = 0.90 onde z0.05 pode ser determinado atravs de P (Z z0.95 ) = 0.95 z0.95 = 1.645,

198

logo P (z0.95 < Z < z0.95 ) = 0.90 X < 1.645 = 0.90 P 1.645 < 3 P 1.645 3 < X < 1.645 3 = 0.90 P 4.935 < X < 4.935 = 0.90 P X 4.935 < < X + 4.935 = 0.90 X 4.935, X + 4.935

O intervalo aleatrio para , com probabilidade 0.90,

e o intervalo com noventa por cento de conana para

]250 4.935, 250 + 4.935[ , ou seja, ]245.065, 254.935[ . Pode-se, ento, concluir que a mdia do nmero de computadores vendidos diariamente em Alfalndia pertence ao intervalo ]245.065, 254.935[ com noventa por cento de conana. Exemplo 3.4.4 O nmero de telemveis vendidos diariamente numa das loja da marca FalaBarato tem varincia igual a 225. Com o objectivo de analisar o nmero mdio de telemveis vendidos diariamente nessa loja foi recolhida amostra aleatria de dimenso 100 com mdia 50 telemveis. Com base nesta amostra, construa um intervalo, com noventa por cento de conana, para o nmero mdio de telemveis vendidos diariamente na loja. Tendo em conta que nada referido em relao populao (populao desconhecida), sendo conhecido e n 30, utiliza-se o resultado (70) presente na pgina 171, ou seja, . X N , n 199

portanto 15 , X N , 100 X N (, 1.5) ,

sendo a varivel fulcral Z= X N (0, 1) . 1.5

Comeando a construir o intervalo de conana, vem P z1 < Z < z1 = 1


2 2

que, como 1 = 0.9,

P Z z1 = P (Z z0.95 ) = 0.95 z0.95 = 1.645.


2

Substituindo este valores no intervalo inicial, obtm-se P (z0.95 < Z < z0.95 ) = 0.90 X < 1.645 = 0.90 P 1.645 < 1.5 P 1.645 1.5 < X < 1.645 1.5 = 0.90 P 2.4675 X < < 2.4675 X = 0.90 P X 2.4675 < < X + 2.4675 = 0.90. X 2.4675, X + 2.4675

O intervalo aleatrio para , com probabilidade 0.90,

e o intervalo com noventa por cento de conana para

]50 2.4675, 50 + 2.4675[ , ]47.5325, 52.4675[ . O nmero mdio de telemveis vendidos diariamente na loja da marca FalaBarato pertence ao intervalo ]47.5325, 52.4675[ com noventa por cento de conana. 200

3.4.3

Intervalos de conana para a proporo - Populao de Bernoulli

Considere-se uma populao com distribuio de Bernoulli com valor esperado igual a p, isto , E (X) = p. Se for recolhida uma amostra de dimenso n, como que se pode construir um intervalo com (1 ) 100 por cento de conana para p? Como estimador de p tem-se p que, se n 30, pode-se utilizar a frmula (71) presente na pgina 174, ou seja, pN

r p,

p (1 p) n

Assim, a varivel aleatria fulcral a utilizar ser Z=r pp N (0, 1) .

p (1 p) n

Em primeiro lugar determina-se um intervalo onde a varivel aleatria Z pertena com probabilidade 1 , sendo este intervalo representado por
2

P z1 < Z < z1 = 1
2

que, resolvendo em ordem a p, obtm-se pp < z1 = 1 P z1 < Z < z1 = 1 P z1 < r 2 2 2 2 p (1 p) n cuja resoluo no muito simples. Assim, tendo em conta que a causa desta diculdade a raiz que contm o parmetro p no denominador, substitui-se o parmetro pelo seu estimador (). Com esta substituio o parmetro s aparece no numerador o que j no traz nenhum p problema para a resoluo desta dupla inequao. Fazendo a substituio do parmetro pelo

201

seu estimador dentro da raiz obtm-se

pp < z1 = 1 P z1 < r 2 2 p (1 p) n ! r r p (1 p) p (1 p) P z1 < p p < z1 =1 2 2 n n ! r r p (1 p) p (1 p) < p < p + z1 = 1 . P p z1 2 2 n n

O intervalo aleatrio para p, com probabilidade 1 , # " r r p (1 p) p (1 p) p z1 , p + z1 2 2 n n e o intervalo com (1 ) 100 por cento de conana para p dado por # " r r p (1 p) p (1 p) p z1 , p + z1 . 2 2 n n Exemplo 3.4.5 Com o objectivo de analisar a proporo de habitantes que so favorveis construo de um novo estdio municipal, foi recolhida uma amostra aleatria com n = 100 e p = 0.8. Com base nesta amostra, construa um intervalo com noventa e cinco por cento de conana para a proporo de habitantes favorveis construo em toda a populao. Considerando que estamos perante uma populao de Bernoulli (pois estamos a trabalhar com propores) utiliza-se a equao (71) presente na pgina 174, ou seja, ! r p (1 p) p N p, , n ento, a varivel fulcral Z pode ser descrita por Z=r pp N (0, 1) .

p (1 p) n

Assim, o intervalo aleatrio para p pode ser determinado atravs de P z1 < Z < z1 = 1
2 2

202

que, como = 0.025 1 = 0.975, vem 2 2 P (Z z0.975 ) = 0.975 z0.975 = 1.96 1 = 0.95 vem pp < 1.96 = 0.95. P (z0.975 < Z < z0.975 ) = 0.95 P 1.96 < r p (1 p) n Aps ter substitudo o parmetro p que aparece dentro da raiz do denominador pelo seu estimador p, vem

pp P 1.96 < r < 1.96 = 0.95 p (1 p) n ! r r p (1 p) p (1 p) P 1.96 < p p < 1.96 = 0.95 n n ! r r p (1 p) p (1 p) < p < + 1.96 p = 0.95 P 1.96 p n n ! r r p (1 p) p (1 p) < p < p + 1.96 = 0.95 P p 1.96 n n O intervalo aleatrio para p, com probabilidade igual 0.95, # " r r p (1 p) p (1 p) p 1.96 , p + 1.96 n n e o intervalo com noventa e cinco por cento de conana para p " # r r 0.8 (1 0.8) 0.8 (1 0.8) , 0.8 + 1.96 , 0.8 1.96 100 100 ]0.8 0.0784, 0.8 + 0.0784[ , ]0.7216, 0.8784[ . Conclui-se, ento, que a proporo de habitantes que so favorveis construo de um novo estdio municipal pertence ao intervalo ]0.7216, 0.8784[ com noventa e cinco por cento de conana. 203

3.4.4

Intervalos de conana para a varincia - Populao com distribuio Normal

Considere-se uma populao com distribuio Normal com mdia igual a e desvio padro igual a . Se for recolhida uma amostra de dimenso n, como que se pode construir um intervalo com (1 ) 100 por cento de conana para 2 ? na pgina 177, ou seja, 2 =
2 (n 1) SC 2 (n1) . 2

2 Como estimador de 2 tem-se SC e, nestas condies, pode-se utilizar a frmula (72) presente

Note-se que esta varivel uma varivel fulcral. Para encontrar o intervalo que contm a varivel 2 com probabilidade (1 ), isto P linf < 2 < lsup = 1 ,

tem-se que denir o ponto 2 como sendo o ponto cuja probabilidade de uma varivel aleatria com distribuio Qui-quadrado ser menor (ou igual) igual a , ou seja, 2 pode ser denido por P 2 2 = . (85)

Note-se que a distribuio Qui-quadrado no simtrica (esta s assume valores positivos), como tal, sero necessrios dois pontos no simtricos, o 2 e 2 . 1
2 2

Interpretao grca de 2 e 2 . 1 2 2 204

Assim, o intervalo encontrado para 2 2 2 2 P < < 1 = 1


2 2

que resolvendo a dupla inequao em ordem a 2 , obtm-se 2 2 2 P < < 1 = 1 2 2 2 (n 1) SC 2 2 < 1 = 1 P < 2 2 2 2 2 1 1 2 2 =1 < 2 < P 2 2 (n 1) SC (n 1) SC 2 2 (n 1) SC (n 1) SC < 2 < = 1 . P 2 1 2
2 2

O intervalo aleatrio para 2 , com probabilidade 1 , igual a 2 2 (n 1) SC , (n 1) SC 2 2 1


2 2

No caso de se pretender um intervalo de conana para o desvio padro (), o intervalo com (1 ) 100 por cento de conana dado por v v u 2 u 2 u (n 1) sC , u (n 1) sC . t t 2 2 1
2 2

e o intervalo com (1 ) 100 por cento de conana para 2 denido por 2 2 (n 1) sC , (n 1) sC . 2 2 1


2 2

Exemplo 3.4.6

Os salrios da empresa BoaVida seguem uma distribuio Normal. Com base numa amostra aleatria de dimenso 101 com mdia igual a 750 euros e varincia igual a 10100, construa um intervalo de conana para a varincia dos salrios da empresa BoaVida com noventa e cinco por cento de conana. 205

Como o parmetro em anlise 2 e a populao tem distribuio Normal, utiliza-se a varivel fulcral 2 = que como n = 101, 2 =
2 100SC 2 . (100) 2 2 (n 1) SC 2 (n1) , 2

Primeiro determina-se o intervalo aleatrio para a varivel aleatria 2 com probabilidade 0.95 (1 = 0.95) P (linf < Z < lsup ) = 0.95 como fora deste intervalo ca 0.05 de probabilidade, esta ser dividida, sendo 0.025 inferior a linf e 0.025 superior a lsup . Assim sendo, o intervalo pretendido 2 2 P 2 0.025 < < 0.975 = 0.95

2 onde 2 0.975 e 0.025 podem ser determinados recorrendo s tabelas.

2 P Z 2 0.025 = 0.025 0.025 = 74.222 2 P Z 2 0.975 = 0.975 0.975 = 129.56

2 Interpretao grca de 2 0.025 e de 0.975 .

206

Assim 2 2 P 2 0.025 < < 0.975 = 0.95 2 100SC < 129.56 = 0.95 P 74.222 < 2 1 129.56 74.222 = 0.95 < 2 < P 2 2 100SC 100SC 100 2 100 2 2 P = 0.95 S < < S 129.56 C 74.222 C 2 2 P 0.77184SC < 2 < 1.3473SC = 0.95. 2 2 0.77184SC , 1.3473SC

O intervalo aleatrio para 2 , com probabilidade 0.95,

e o intervalo, com noventa e cinco por cento de conana, para 2 ]0.77184 10201, 1.3473 10201[ , ou seja, ]7873.5, 13744[ pois
2 SC =

A varincia dos salrios da empresa BoaVida pertence ao intervalo ]7873.5, 13744[ com noventa e cinco por cento de conana. Exemplo 3.4.7 O tempo que uma mquina, da empresa BigBaloones, demora a encher cem bales segue uma distribuio Normal. Com base numa amostra aleatria de dimenso 25 com mdia igual a 500 segundos e varincia igual a 216, construa um intervalo, com noventa por cento de conana, para o desvio padro do tempo que a mquina demora a encher cem bales. Como o parmetro em anlise 2 e a populao tem distribuio Normal, utiliza-se a seguinte varivel fulcral 2 =
2 (n 1) SC 2 (n1) , 2

n 2 101 s = 10100 = 10201. n1 100

207

como n = 25, vem 2 =


2 24 SC 2 . (24) 2

Assim, determina-se o intervalo para a varivel aleatria 2 com probabilidade 0.90, sendo o intervalo pretendido P 2 < 2 < 2 0.05 0.95 = 0.90, P 13.848 < 2 < 36.415 = 0.90 2 24 SC P 13.848 < < 36.415 = 0.90 2 2 2 24 SC 24 SC 2 < < = 0.90 P 36.415 13.848 r ! r 2 2 24 SC 24 SC P << = 0.90 36.415 13.848 ! r r 24 24 SC < < SC = 0.90. P 36.415 13.848

que recorrendo tabela

O intervalo aleatrio para , com probabilidade 0.90, #r " r 24 24 SC , SC 36.415 13.848 e como s2 = C n 2 25 s = 216 = 225 sC = 225 = 15 n1 24

o intervalo com noventa por cento de conana para #r " r 24 24 15, 15 , 36.415 13.848 ]12.177, 19.747[ .

O desvio padro do tempo que a mquina demora a encher cem bales pertence ao intervalo ]12.177, 19.747[ com noventa por cento de conana.

208

3.4.5

Intervalos de conana para a mdia - desconhecido e populao com distribuio Normal

Considere-se uma populao com distribuio Normal com mdia igual a e desvio padro igual a (desconhecido). Se for recolhida uma amostra de dimenso n, como que se pode construir um intervalo com (1 ) 100 por cento de conana para ? Como estimador de tem-se X e, nestas condies, utiliza-se a frmula (78) presente na pgina 182, ou seja, X t(n1) SC n que uma varivel fulcral. Para encontrar o intervalo que contm a varivel T , com probabiT = lidade 1 , dene-se o ponto t como sendo o ponto cuja probabilidade de a varivel T ser inferior (ou igual) igual a , ou seja, P (T t ) = . (86)

Note-se que a distribuio t-Student, tal como a distribuio Normal, simtrica, como tal utilizam-se dois pontos simtricos, o t1 e t1 .
2 2

Interpretao grca de t . 1 2 Assim, determina-se o intervalo P t1 T t1 = 1


2 2

209

e resolve-se a dupla inequao em ordem a , obtendo-se T t P t1 =1 1 2 2

X P t1 < < t1 = 1 S 2 2 C n SC SC =1 P t1 < X < t1 2 2 n n SC SC P X t1 < < X + t1 = 1 . 2 2 n n O intervalo aleatrio para , com probabilidade 1 , SC SC X t1 , X + t1 2 2 n n e o intervalo com (1 ) 100 por cento de conana para dado por SC SC x t1 , x + t1 . 2 2 n n Exemplo 3.4.8 O tempo que um carro demora a passar determinada ponte tem distribuio Normal. Com base numa amostra aleatria de dimenso 11 onde se obteve uma varincia igual a 110 e uma mdia igual a 80 segundos, construa um intervalo, com noventa e cinco por cento de conana, para o tempo mdio que um carro demora a passar a ponte. Como o parmetro em anlise , a populao possui distribuio Normal e desconhecido, utiliza-se a varivel fulcral T = que, como n = 11 e s2 = C vem T = X X t(10) . = 11 11 11 210 n 2 11 s = 110 = 121 sC = 121 = 11, n1 10 X t(n1), SC n

O intervalo, com probabilidade 0.95, para a varivel T P (t0.975 < T < t0.975 ) = 0.95 que recorrendo s tabelas obtm-se

Interpretao grca de t0.975 e de t0.975 .

O intervalo aleatrio para , com probabilidade 0.95,

P (2.2281 < T < 2.2281) = 0.95 X P 2.2281 < < 2.2281 = 0.95 11 P X 2.2281 11 < < X + 2.2281 11 = 0.95 P X 7.3898 < < X + 7.3898 = 0.95. X 7.3898, X + 7.3898

e o intervalo, com noventa e cinco por cento, de conana para ]80 7.3898, 80 + 7.3898[ , ]72.6102, 87.3898[ . O tempo mdio que um carro demora a passar a ponte pertence ao intervalo ]72.6102, 87.3898[ com noventa e cinco por cento de conana. 211

Exemplo 3.4.9 O tempo que um estudante demora a resolver um determinado exerccio de estatstica possui distribuio normal. Com base numa amostra aleatria de dimenso 400 onde se obteve uma varincia igual a 39900 e uma mdia igual a 1000 segundos, construa um intervalo, com noventa e nove por cento de conana, para o tempo mdio que um estudante demora a resolver o exerccio. Como o parmetro em anlise e a populao tem distribuio Normal sendo desconhecido, utiliza-se a varivel fulcral T = Substituindo n = 400 e s2 = C vem X X t(399) . = 200 10 400 Como a distribuio tem pelo menos trinta graus de liberdade, pode-se aproximar distribuio T = Normal, obtendo-se Z= X N (0, 1) . 10 n 2 400 s = 39900 = 40000 sC = 40000 = 200 n1 399 X t(n1) . SC n

O intervalo, com probabilidade 0.99, para a varivel Z P (z0.995 < Z < z0.995 ) = 0.99 que recorrendo s tabelas vem P (2.576 < Z < 2.576) = 0.99 X < 2.576 = 0.99 P 2.576 < 10 P X 25.76 < < X + 25.76 = 0.99. X 25.76, X + 25.76 212

O intervalo aleatrio para , com probabilidade 0.99,

e o intervalo com noventa e nove por cento de conana para ]1000 25.76, 1000 + 25.76[ , ]9974.24, 1025.76[ . O tempo mdio que um estudante demora a resolver o exerccio de estatstica pertence ao intervalo ]9974.24, 1025.76[ com noventa e nove por cento de conana. Exemplo 3.4.10 A durao dos telemveis da marca FalaBarato possui distribuio Normal. Para analisar a durao destes telemveis foi recolhida uma amostra aleatria de dimenso 400 com mdia igual a 1000 horas e varincia 1596. Construa um intervalo, com noventa e nove por cento de conana, para a durao mdia dos telemveis. Como o desconhecido e a populao possui distribuio Normal a varivel que vai ser utilizada T = X t(n1) . SC n

A varincia amostral corrigida igual a s2 = C n 2 400 s = 1596 = 1600 sC = 1600 = 40 n1 399 X X = t(399) . 40 2 400

que substituindo na varivel obtm-se T =

mas, como os graus de liberdade da t-Student so superiores a 30, para a determinao do intervalo de o conana pretendido utiliza-se a aproximao distribuio Normal. Assim, a varivel fulcral a utilizar ser Z= X N (0, 1) . 2

O intervalo aleatrio para vai ser determinado atravs de P z1 < Z < z1 = 1


2 2

213

que, como 1 = 0.99 conclui-se que P (Z z0.995 ) = 0.995 z0.995 = 2.576. Substitundo estes valores no intervalo, obtm-se P (z0.995 < Z < z0.995 ) = 0.99 X < 2.576 = 0.99 P 2.576 < 2 P 2.576 2 < X < 2.576 2 = 0.99 P 5.152 X < < 5.152 X = 0.99 P X 5.152 < < X + 5.152 = 0.99. X 5.152, X + 5.152 = 0.005 1 = 0.995, 2 2

O intervalo aleatrio para com probabilidade 0.99

e o intervalo com noventa e nove por cento de conana para ]1000 5.152, 1000 + 5.152[ , ]994.848, 1005.152[ , concluindo-se que a durao mdia dos telemveis da marca FalaBarato pertence ao intervalo ]994.848, 1005.152[ com noventa e nove por cento de conana.

214

3.4.6

Procedimento geral para a construo de um intervalo de conana

1. Identicar o parmetro em anlise e, com base nos conhecimentos de distribuies amostrais, denir a varivel aleatria fulcral a utilizar. 2. Escolher o nvel de conana (1 ). 3. Determinar um intervalo aleatrio para a varivel fulcral com probabilidade 1 . 4. Determinar um intervalo aleatrio para o parmetro com probabilidade 1 . 5. Com base numa amostra concreta, determinar o intervalo com (1 ) 100 por cento de conana para o parmetro. 3.4.7 Quadro resumo dos intervalos de conana Intervalo de Conana conhecido e populao Normal x z1 , x + z1 2 2 n n conhecido e n 30 x z1 , x + z1 2 2 n n sC sC desconhecido e populao Normal x t1 , x + t1 2 2 n n sC sC desc., populao Normal e n > 30 x z1 , x + z1 2 2 n n # " r r p (1 p) p (1 p) p z1 Populao Bernoulli e n 30 , p + z1 2 2 n n 2 2 (n 1) sC , (n 1) sC Populao Normal 2 2 1 2 2 v v u u u (n 1) s2 u (n 1) s2 C C Populao Normal ,t t 2 2 1
2 2

Parmetro p

Condies

215

3.5

Testes de hiptese

Neste captulo foi analisado o problema de como estimar o valor de um parmetro desconhecido (mdia, proporo, varincia ou desvio padro da populao) a partir da informao contida numa amostra, quer seja atravs das estimativas pontuais, quer atravs dos intervalos de conana. Porm, muitas situaes prticas tm objectivos diferentes, pretendendo-se tomar decises atravs da informao amostral. Assim, muitos estudos estatsticos tm como objectivo averiguar, com base na informao contida numa amostra, se determinada hiptese sobre a populao verdadeira ou no. Para determinar se a mdia de determinada populao superior a cem, ser suciente a mdia de uma amostra aleatria ser igual a 101? E se a mdia da amostra for igual a 200, ser agora suciente? A partir de que valor da mdia da amostra poder-se- armar que a mdia da populao superior a cem com alguma certeza? com o objectivo de responder a este tipo de perguntas que existem os testes de hipteses. Assim, os testes de hipteses consistem na formulao de uma hiptese sobre um parmetro desconhecido da populao (testes paramtricos) ou sobre a distribuio da populao (testes no paramtricos) e na denio de um critrio que permita rejeitar ou no rejeitar essa hiptese. Em relao aos testes paramtricos existem, por exemplo, testes em relao ao valor da mdia, em relao ao valor da varincia (ou desvio padro), em relao ao valor de uma proporo, entre outros. Em relao aos testes no paramtricos, existem os testes que pretendem averiguar se a populao tem uma determinada distribuio (de onde se salientam os testes de Normalidade que consistem em testar se a populao tem distribuio Normal), os testes de independncia entre duas amostras, entre outros. Neste captulo iro ser apenas abordados os testes paramtricos. 3.5.1 Noes bsicas

Quando se faz um teste paramtrico a analisa-se a hiptese de um parmetro da populao assumir um determinado valor. A esta hiptese denomina-se por hiptese nula e representada por H0 . Esta hiptese uma hiptese simples, ou seja, nela especicado apenas um valor para o parmetro, normalmente do tipo H0 : = 0 onde representa o parmetro em anlise e 0 um valor particular desse parmetro. Este valor (0 ) o valor que se pretende testar se

216

plausvel o parmetro assumir, no tendo nenhuma relao com os valores observados numa amostra. Para contrapor com a hiptese nula existe a hiptese alternativa que representada por H1 . Esta hiptese uma hiptese composta, ou seja, nela especicado mais de que um valor para o parmetro. Assim, normalmente, a hiptese alternativa representada de uma das seguintes formas: H1 : 6= 0 H1 : > 0 H1 : < 0 hiptese alternativa bilateral hiptese alternativa unilateral (superior) hiptese alternativa unilateral (inferior)

Exemplos 3.5.1 A empresa DelFonte comercializa garrafas de gua de 1500 mililitros. As garrafas so enchidas, atravs de um processo automtico, com uma quantidade de gua que tem distribuio Normal com valor mdio igual a mililitros e desvio padro igual a 100 mililitros. Observem-se trs situaes distintas para as hipteses a testar. 1. Considere-se que a empresa pretende testar se o processo de enchimento das garrafas est a funcionar devidamente, ou seja, se de facto o processo enche as garrafas, em mdia, com 1500 mililitros. Neste caso as hipteses a testar seriam: H0 : = 1500 versos H1 : 6= 1500. 2. Considere-se que a empresa pretende controlar os custos do processo produtivo. Assim, para averiguar se o processo de enchimento est a encher as garrafas com uma quantidade superior devida, dever-se-a testar: H0 : = 1500 versos H1 : > 1500. 3. Considere-se que um conjunto de consumidores armam que as garrafas de gua DelFonte possuem menos quantidade de gua que a devida. Neste caso, as hipteses a testar seriam: H0 : = 1500 versos H1 : < 1500. 217

Aps a denio das hipteses a testar dene-se um processo de deciso para, com base numa amostra, rejeitar-se ou no H0 . Este procedimento que, com base na informao contida numa amostra, conduz a uma deciso acerca das hiptese o principal objectivo dos teste de hipteses. Assim, em primeiro lugar, atravs dos conhecimentos apreendidos no captulo nas distribuies amostrais, dene-se qual a estatstica de teste a utilizar, ou seja, atravs do parmetro que se est a analisar e atravs do contexto do problema, dene-se qual o estimador a usar e qual a sua distribuio. Para se poder tomar uma deciso sobre o teste que se est a efectuar, dene-se uma regio na qual, se a estatstica utilizada se situar nela, deve-se rejeitar H0 . Esta regio denominada por regio crtica. Denio 3.5.1 (Regio crtica e valores crticos) A regio na qual a deciso rejeitar H0 denomina-se por regio crtica, sendo os valores limites da regio crtica denominados por valores crticos. A regio crtica denida pela hiptese alternativa. Se se pretender testar se a mdia de uma populao igual a 0 (H0 : = 0 ), como o parmetro em anlise a mdia da populao, o estimador que ser utilizado no teste ser a mdia da amostra. No caso de a hiptese alternativa consistir na mdia da populao ser diferente de 0 (H1 : 6= 0 ), deve-se rejeitar H0 se o valor da mdia amostral for sucientemente distante de 0 (quer seja inferior ou superior). No caso de a hiptese alternativa ser a mdia superior a 0 (H1 : > 0 ) s se deve rejeitar H0 se o valor da mdia amostral for sucientemente distante e superior a 0 . Pelo mesmo raciocnio, se a hiptese alternativa for a mdia ser inferior a 0 (H1 : < 0 ) deve-se rejeitar H0 nos casos em que o valor da mdia amostral seja sucientemente inferior a 0 . Exemplos 3.5.2 No contexto do exemplo anterior (3.5.1), como se poderia denir um processo para decidir por uma das hipteses. Em primeiro lugar, como o parmetro em anlise deveria-se utilizar o estimador X. 1. No primeiro caso em que as hiptese so H0 : = 1500 versos H1 : 6= 1500, 218

como a hiptese alternativa bilateral, deve-se rejeitar H0 se o valor da mdia da amostra for sucientemente distante de 1500 mililitros. Assim poder-se-a denir a regio crtica por Regio crtica: X < 1500 1 ou X > 1500 + 1 2. No segundo caso as hiptese em anlise so H0 : = 1500 versos H1 : > 1500, ento, como a hiptese alternativa unilateral superior, deve-se rejeitar H0 se a mdia amostral for sucientemente superior a 1500 mililitros. Assim poder-se-a denir a regio crtica por Regio crtica: X > 1500 + 2 3. No terceiro caso as hiptese em anlise so H0 : = 1500 versos H1 : < 1500, ento, como a hiptese alternativa unilateral inferior, deve-se rejeitar H0 se a mdia amostral for sucientemente inferior a 1500 mililitros. Assim poder-se-a denir a regio crtica por Regio crtica: X < 1500 3 . No entanto, apesar de se conhecer como dever ser a regio crtica, falta denir o que signica sucientemente distante de H0 para a poder rejeitar, ou seja, quais os valores que 1 , 2 e 3 assumem. Para denir estes valores deve-se ter em conta os possveis erros que se pode cometer quando se efectua um teste de hipteses. Estes erros podem ser esquematizados atravs do seguinte quadro.

219

Quadro 2: Erros de um teste de hipteses Situao Deciso Rejeitar H0 H0 verdadeira Erro do tipo I P (Erro do tipo I) = No Rejeitar H0 Deciso correcta H0 falsa Deciso correcta Erro do tipo II P (Erro do tipo II) =

Assim, quando se toma uma deciso num teste de hiptese existem dois tipos de erros que podem ser cometidos. O erro do tipo I comete-se quando se rejeita a hiptese nula e esta verdadeira, sendo a sua probabilidade representada por e denominada por nvel de signicncia. Denio 3.5.2 (Erro do tipo I) O erro do tipo I ou erro de primeira espcie o erro que se comete quando se rejeita a hiptese nula (H0 ) e esta verdadeira. Denio 3.5.3 (Nivel de signicncia) Denomina-se por nvel de signicncia probabilidade de se cometer um erro do tipo I sendo representada por , ou seja, = P (rejeitar H0 |H0 verdadeira) . (87)

O segundo erro possvel de se cometer o erro do tipo II, quando no se rejeita a hiptese nula e esta falsa, sendo a sua probabilidade representada por . probabilidade de no se cometer um erro do tipo II (1 ) denomina-se por potncia do teste. Denio 3.5.4 (Erro do tipo II) O erro do tipo II ou erro de segunda espcie o erro que se comete quando no se rejeita a hiptese nula (H0 ) e esta falsa. 220

Denio 3.5.5 (Potncia do teste) Denomina-se por potncia do teste probabilidade de no se cometer um erro do tipo II. Representando por a probabilidade de se cometer um erro do tipo II, ou seja, = P (no rejeitar H0 |H0 falsa) , ento a potncia do teste igual a 1 . Nota: A probabilidade de se cometer um erro, quando se faz um teste de hipteses, no a soma dos dois tipos de erros indicados, pois o erro do tipo I s cometido quando a hiptese nula verdadeira e o erro do tipo II s cometido quando a hiptese nula falsa. Assim, consoante a hiptese nula seja verdadeira ou no, a probabilidade de, no teste de hiptese, se cometer um erro ser apenas uma destas probabilidades e no a soma das duas. Naturalmente, quando se faz um teste de hiptese, no se sabe se a hiptese nula verdadeira (caso contrrio no se iria efectuar o teste pois j se saberia a verdade) ento no se sabe qual ser a probabilidade de se cometer um erro, pois se H0 for verdadeira comete-se um erro com probabilidade e se H0 for falsa comete-se um erro com probabilidade . Exemplos 3.5.3 Na continuao dos exemplo 3.5.1 e 3.5.2 das garrafas de gua DelFonte, se 1 = 10, 2 = 7 e 3 = 6, como se poderia calcular a probabilidade de cada um dos erros? Considere-se que para efectuar este teste de hiptese foi recolhida uma amostra de dimenso 400, n = 400. Em primeiro lugar, como a populao tem distribuio Normal com conhecido ( = 100) e o parmetro em anlise utiliza-se o estimador X, que, nestas condies, , X N , n ou seja, 100 , X N , 400 X N (, 5) . 221 (88)

1. Considerando o teste H0 : = 1500 versos H1 : 6= 1500, com regio crtica Regio crtica: X < 1500 1 ou onde 1 = 10, ou seja, Regio crtica: X < 1490 ou X > 1510, X > 1500 + 1

a probabilidade de se cometer um erro de primeira espcie (nvel de signicncia do teste) dada por = P (rejeitar H0 |H0 verdadeiro) = = P X < 1490 X > 1510| = 1500 = = 1 P 1490 X 1510| = 1500 = X 1500 1510 1500 1490 1500 | = 1500 = 1P 5 5 5 que, como nesta probabilidade H0 verdadeira ( = 1500), tem-se que X N (1500, 5) , ou seja Z = logo X 1500 1490 1500 1510 1500 = 1P | = 1500 = 5 5 5 = 1 P (2 Z 2) = 1 [ (2) (2)] = 1 (2) + 1 (2) = = 1 0.9772 + 1 0.9772 = 0.0456. A probabilidade de se cometer um erro de segunda espcie dada por = P (no rejeitar H0 |H0 falsa) = P 1490 X 1510| 6= 1500 . 222 X 1500 5

Note-se que, se H0 falsa, considera-se que a hiptese alternativa verdadeira. Contudo, esta hiptese composta, ou seja, existe a possibilidade de o parmetro assumir mais do que um valor. Assim, no sabendo qual o verdadeiro valor do parmetro, impossvel determinar a sua probabilidade. Para exemplicar a dependncia desta probabilidade do verdadeiro valor do parmetro, considerando que H1 verdadeira, vo ser utilizados dois valores para , sejam = 1510 e = 1520. Para = 1510 tem-se = P 1490 X 1510| = 1510 = X 1510 1510 1510 1490 1510 | = 1510 = = P 5 5 5 1490 1510 1510 1510 = P Z = P (4 Z 0) = 5 5 = (0) (4) = (0) 1 + (4) = 0.5 1 + 1 = 0.5, sendo a potncia do teste igual a 1 = 1 0.5 = 0.5. Para = 1520 tem-se = P 1490 X 1510| = 1520 = X 1520 1510 1520 1490 1520 | = 1520 = = P 5 5 5 1510 1520 1490 1520 Z = P (6 Z 2) = = P 5 5 = (2) (6) = 1 (2) 1 + (6) = 1 0.9772 1 + 1 = 0.0228, sendo a potncia do teste igual a 1 = 1 0.0228 = 0.9772. Note-se que, se fosse considerado = 1490, o valor obtido seria o mesmo que para = 1510, sendo o valor obtido para = 1480 igual ao valor obtido para = 1520 pois a distribuio simtrica. Naturalmente, quanto mais afastado de 1500 estiver o verdadeiro 223

valor de , maior a potncia do teste, ou seja, menor ser a probabilidade de se cometer um erro do tipo II. 2. No segundo caso as hiptese em anlise so H0 : = 1500 versos H1 : > 1500, sendo a regio crtica Regio crtica : Regio crtica : X > 1500 + 2 que, como 2 = 7, vem X > 1507.

A probabilidade de se cometer um erro de primeira espcie (nvel de signicncia do teste) dada por = P (rejeitar H0 |H0 verdadeiro) = X 1500 1507 1500 > | = 1500 = = P X > 1507| = 1500 = P 5 5 1507 1500 = 1 (1.4) = 1 0.9192 = 0.0808. = P Z> 5 A probabilidade de se cometer um erro da segunda espcie dada por = P (no rejeitar H0 |H0 falsa) = P X 1507| > 1500

no entanto, como a hiptese alternativa uma hiptese composta, para exemplicar, determina-se o valor de supondo que = 1525. X 1525 1507 1525 = P X 1507| = 1525 = P | = 1525 = 5 5 1507 1525 = P (Z 3.6) = 1 (3.6) = = P Z 5 = 1 0.9998 = 0.0002, sendo a potncia do teste igual a 1 = 1 0.002 = 0.9998. 224

3. Considerando que pretende-se testar H0 : = 1500 versos H1 : < 1500. sendo a regio crtica Regio crtica : Regio crtica : X < 1500 3 que, como 3 = 6, tem-se X < 1494,

a probabilidade de se cometer um erro do tipo I (nvel de signicncia do teste) dada por = P (rejeitar H0 |H0 verdadeiro) = X 1500 1494 1500 < | = 1500 = = P X < 1494| = 1500 = P 5 5 1494 1500 = (1.2) = 1 (1.2) = = P Z< 5 = 1 0.8849 = 0.1151. A probabilidade de se cometer um erro do tipo II dada por = P (no rejeitar H0 |H0 falsa) = P X 1494| < 1500 no entanto, como a hiptese alternativa uma hiptese composta, para exemplicar, determina-se o valor de supondo que = 1480 (note-se que < 1500). X 1480 1494 1480 = P X 1494| = 1480 = P | = 1480 = 5 5 1494 1480 = P (Z 2.8) = 1 (2.8) = = P Z 5 = 1 0.9974 = 0.0026, sendo a potncia do teste igual a 1 = 1 0.0026 = 0.9974.

225

Nota: Nestes exemplos poder-se-am mudar as probabilidades de se cometer um erro do tipo I e do tipo II alterando a regio crtica. Assim, neste ltimo exemplo, o que que iria acontecer se o valor de 3 fosse aumentado para 10? Como as hipteses a testar so H0 : = 1500 versos H1 : < 1500, sendo, neste caso, a regio crtica Regio crtica : Regio crtica : X < 1500 3 que, como 3 = 10, tem-se X < 1490,

a probabilidade de se cometer um erro do tipo I dada por = P (rejeitar H0 |H0 verdadeiro) = X 1500 1490 1500 < | = 1500 = = P X < 1490| = 1500 = P 5 5 1490 1500 = (2) = 1 (2) = = P Z< 5 = 1 0.9772 = 0.0228. A probabilidade de se cometer um erro do tipo II dada por = P (no rejeitar H0 |H0 falsa) = P X 1490| < 1500

considerando que = 1480 (o mesmo valor utilizado anteriormente), X 1480 1490 1480 = P X 1490| = 1480 = P | = 1480 = 5 5 1490 1480 = P Z = P (Z 2) = 1 (2) = 5 = 1 0.9772 = 0.0228, sendo a potncia do teste igual a 1 = 1 0.0228 = 0.9772. 226

Desta anlise comparativa pode-se concluir que quando se diminui a regio de rejeio, o nvel de signicncia diminuiu e a potncia do teste tambm diminuiu, ou seja, quando se diminui a probabilidade de um tipo de erro a probabilidade do outro tipo de erro aumenta. Do estudo do exemplo anterior salientem-se duas ideias. A primeira que, se a regio crtica for alterada, o nvel de signicncia e a potncia do teste tambm sero alterados. Se a regio crtica for diminuda, o nvel de signicncia diminui, ou seja, a probabilidade de se cometer um erro do tipo I diminui. No entanto, a potncia do teste tambm diminui, ou seja, a probabilidade de se cometer um erro do tipo II aumenta. Portanto, se num teste o nvel de signicncia diminui a potncia do teste tambm diminui, ou seja, se diminuirmos a probabilidade de se cometer um erro de um tipo estamos a aumentar a probabilidade de ocorrncia de um erro do outro tipo. Na realizao de um teste de hiptese, o objectivo tentar diminuir ambas as probabilidades de ocorrncia de erros, no entanto, como foi referido, impossvel minimizar ambas as probabilidades em simultneo, pois quando uma aumenta a outra diminui. A segunda ideia a salientar a facilidade de controlar (ou determinar) a probabilidade de ocorrncia de um erro do tipo I (), sendo, pelo contrrio, impossvel controlar a probabilidade de ocorrncia de um erro do tipo II. Esta probabilidade depende do valor que o parmetro assume e como, neste erro, considera-se que a hiptese alternativa verdadeira, existem ento innitos valores para o valor do parmetro, dependendo o valor da probabilidade de ocorrncia de um erro do tipo II do valor que for considerado para o parmetro. Concluso 1. Se diminuirmos a probabilidade de um tipo de erro a probabilidade do outro tipo de erro aumenta; 2. Pode-se controlar a probabilidade de ocorrncia de um erro da primeira espcie (controlar - nvel de signicncia) mas no se consegue controlar a probabilidade de ocorrncia de um erro da segunda espcie ().

227

Por consequncia destas duas concluses, os teste de hipteses so efectuados xando a priori o nvel de signicncia, ou seja, xando previamente a probabilidade de ocorrncia de um erro do tipo I. Assim, tem-se como objectivo controlar o erro do tipo I (pelo facto de este ser facilmente controlado) deixando o erro do tipo II variar livremente. Como tal, a possibilidade de se rejeitar a hiptese nula (H0 ) sendo esta verdadeira controlada pois a sua probabilidade xada, sendo a possibilidade de no se rejeitar a hiptese nula (H0 ) sendo esta falsa no controlada. Por esta razo, a hiptese nula s rejeitada se a informao contida na amostra apresentar fortes indcios contra a hiptese nula. Saliente-se, ento, que ao efectuar um teste de hiptese onde a deciso for no rejeitar H0 no signica necessariamente que esta seja verdadeira. Signica sim que no existem provas sucientes para rejeitar a hiptese nula, sendo esta a razo que, normalmente na teoria dos testes de hipteses utiliza-se no rejeitar H0 em vez de aceitar H0 pois apenas signica que a amostra no apresenta evidncia suciente para rejeitar H0 . Exemplos 3.5.4 Considere-se o exemplo 3.5.1 das garrafas de gua DelFonte. Com base numa amostra aleatria de dimenso 400 com mdia igual a 1509 (x = 1509), efectue os trs testes propostos considerando um nvel de signicncia igual a cinco por cento ( = 0.05). Tendo em conta que j se conhecem as hipteses a testar e o nvel de signicncia, deve-se determinar qual a estatstica de teste a utilizar. Nesta condies, populao com distribuio Normal e conhecido ( = 100), utiliza-se , X N , n sendo a estatstica de teste Z= que, como = 100 e n = 400, vem Z= X X = N (0, 1) . 100 5 400 228 X N (0, 1) , n

1. Pretende-se testar H0 : = 1500 versos H1 : 6= 1500. A hiptese alternativa bilateral, como tal, a regio crtica tambm deve ser bilateral. Como o valor do nvel de signicncia 0.05, determina-se uma regio de rejeio tal que a probabilidade de rejeitar H0 , sendo esta verdadeira, seja igual a 0.05. Assim, como a estatstica do teste tem distribuio Normal e a regio de teste bilateral (rejeita-se H0 para valores muito altos e para valores muito baixos), a regio crtica ser da forma ilustrada nos seguintes grcos.

Interpretao grca da regio crtica de um teste bilateral Como = 0.05, recorrendo tabela, concluem-se os valores pretendidos.

Interpretao grca da regio crtica de um teste bilateral com = 0.05. Assim, representado por Zobs. o valor observado pela estatstica de teste, rejeita-se H0 se: 229

Zobs. < 1.96 Zobs. > 1.96. O valor de Zobs. obtido atravs da estatstica de teste considerando que H0 verdadeira, logo = 1500, ento Zobs. = que como x = 1509, obtm-se zobs. = x 1500 1509 1500 = = 1.8. 5 5 X 0 X 1500 = 5 5

Assim, como zobs. no pertence regio crtica, no se rejeita H0 . A regio de rejeio tambm pode ser expressa em termos de X, pois Zobs. < 1.96 Zobs. > 1.96 X 1500 X 1500 < 1.96 > 1.96 5 5 X < 1500 1.96 5 X > 1500 + 1.96 5 X < 1490.2 X > 1509.8 Como na amostra foi obtido x = 1509 que no pertence regio de rejeio ento no se rejeita H0 . Assim, no existe evidncia estatstica para armar que a mdia da populao seja diferente de 1500 mililitros. 2. Pretende-se testar H0 : = 1500 versos H1 : > 1500. Como o teste unilateral superior a regio crtica tambm deve ser unilateral, devendo-se rejeitar H0 se o valor observado na estatstica for muito elevado. Como o valor do nvel de signicncia 0.05 determina-se uma regio de rejeio tal que a probabilidade de rejeitar H0 , sendo esta verdadeira, seja igual a 0.05. Assim, como a estatstica do teste tem distribuio Normal e a regio de teste unilateral superior (rejeita-se H0 unicamente para valores muito altos), a regio crtica ser da forma ilustrada nos seguintes grcos.

230

Interpretao grca da regio crtica de um teste unilateral superior Aplicando = 0.05 deduzem-se os valores crticos recorrendo tabela.

Interpretao grca da regio crtica de um teste unilateral superior com = 0.05. A regio crtica ser: rejeitar H0 se Zobs. > 1.645 ou, em termos de X, rejeitar H0 se X > 1508.225, pois Zobs. > 1.645 Determinando zobs. , zobs. = x 1500 1509 1500 = = 1.8, 5 5 X 1500 > 1.645 X > 1508.225. 5

verica-se que zobs. > 1.645 (ou x = 1509 > 1508.225), logo rejeita-se H0 , ou seja, conclui-se que existe evidncia estatstica para armar que a mdia da populao superior a 1500 mililitros. 231

Figura 9: Interpretao grca da regio crtica de um teste unilateral inferior. 3. No terceiro exemplo as hipteses em anlise so H0 : = 1500 versos H1 : < 1500. Como o teste unilateral inferior a regio crtica tambm deve ser unilateral, devendo-se rejeitar H0 se o valor observado na estatstica for muito baixo. Assim, a regio crtica ser da forma apresentada no seguinte grco.Utilizando o nvel de signicncia pretendido ( = 0.05), recorre-se tabela para determinar o seu valor.

Interpretao grca da regio crtica de um teste unilateral inferior com = 0.05. A regio crtica deste teste : rejeitar H0 se Zobs. < 1.645 ou, para obter em termos X, Zobs. < 1.645 X 1500 < 1.645 X < 1491.775 5 232

sendo rejeitar H0 se X < 1491.775. Determinando zobs. , zobs. = x 1500 1509 1500 = = 1.8, 5 5

verica-se que zobs. > 1.645 (ou x = 1509 > 1491.775), concluindo-se que no se deve rejeitar H0 , ou seja, que no existe evidncia estatstica para armar que a mdia da populao inferior a 1500 mililitros. Uma outra forma de efectuar um teste de hiptese, chegando naturalmente mesma concluso, calculando o seu p-value e comparando o valor obtido com o nvel de signicncia do teste. Denio 3.5.6 (p-value) O p-value a probabilidade de observar uma amostra mais desfavorvel para a hiptese nula (H0 ) do que aquela que foi observada, considerando que a hiptese nula verdadeira. Nos caso em que o p-value assume um valor pequeno signica que a probabilidade de haver uma amostra mais desfavorvel que a observada, sob a hiptese de que H0 ser verdadeira, pequena, logo deve-se rejeitar H0 . A denio de uma probabilidade pequena para rejeitar H0 feita pelo nvel de signicncia. Desta forma, se o valor de p-value for inferior ao nvel de signicncia deve-se rejeitar H0 , portanto, conhecendo o valor do p-value torna-se fcil tomar a deciso de rejeitar ou no H0 . O p-value tem assumido uma maior importncia nos ltimas dcadas com a evoluo dos computadores, pois os softwares da rea da estatstica fazem testes de hipteses indicando, ao utilizador, o valor do p-value. Assim, este s tem de comparar o valor obtido com o nvel de signicncia que escolheu. Mas, como calcular o valor de p-value? O clculo do valor de p-value depende da hiptese alternativa do teste de hipteses. Para melhor se perceber o clculo do p-value considere-se que a estatstica de teste tm distribuio Normal. Assim, no caso de a hiptese alternativa ser bilateral (H0 : = 0 versos H1 : 6= 0 ) o p-value determinado por p-value = 2P (Z > |zobs |) , (89)

233

no caso de a hiptese alternativa ser unilateral superior (H0 : = 0 versos H1 : > 0 ) o p-value determinado por p-value = P (Z > zobs ) , (90)

e no caso em que a hiptese alternativa unilateral inferior (H0 : = 0 versos H1 : < 0 ) o p-value determinado por p-value = P (Z < zobs ) . Exemplos 3.5.5 Vai-se efectuar os mesmos teste que no exemplo 3.5.4 utilizando o p-value. Tal como no exemplo 3.5.4, a estatstica de teste a utilizar, considerando que H0 verdadeira, Z= X 1500 N (0, 1) 5 (91)

que, como o valor da mdia da amostra 1509 (x = 1509), o valor observado da estatstica de teste zobs. = x 1500 1509 1500 = = 1.8. 5 5

1. No primeiro caso vai-se testar H0 : = 1500 versos H1 : 6= 1500. Tendo em conta que a hiptese alternativa bilateral, vai-se utilizar a frmula (89) . p-value = 2P (Z > |zobs |) = 2P (Z > |1.8|) = 2P (Z > 1.8) = = 2 [1 (1.8)] = 2 [1 0.9641] = 0.0718. O valor do p-value superior ao nvel de signicncia (0.0718 > 0.05 = ), como tal, no se rejeita H0 . 2. No segundo caso vai-se testar H0 : = 1500 versos H1 : > 1500. 234

A hiptese alternativa unilateral superior, portanto utiliza-se a frmula (90) para determinar o valor do p-value. p-value = P (Z > zobs ) = P (Z > 1.8) = 1 (1.8) = = 1 0.9641 = 0.0359. Assim, como o p-value inferior ao nvel de signicncia (0.0359 < = 0.05) deve-se rejeitar H0 . 3. No terceiro caso as hipteses em anlise so H0 : = 1500 versos H1 : < 1500. Como o teste unilateral inferior, a frmula que vai ser utilizada ser a (91). Assim, o p-value p-value = P (Z < zobs ) = P (Z < 1.8) = (1.8) = 0.9641. Considerando que o valor de p-value superior ao nvel de signicncia (0.9641 > = 0.05) no se rejeita H0 . 3.5.2 Testes de hipteses para a mdia - conhecido e populao com distribuio Normal Exemplo 3.5.6 A durao dos computadores da marca WorkFast tem distribuio Normal com valor mdio igual a dias e desvio padro igual a 80 dias, isto , X N (, 80). Considere que foi recolhida uma amostra de 64 computadores onde se vericou uma mdia de 1000 dias e uma varincia igual a 6500. 1. Teste, com um nvel de signicncia igual a cinco por cento, se os computadores WorkFast tm uma durao, em mdia, superior a 980 dias. As hipteses a testar so H0 : = 980 versos H1 : > 980. 235

Tendo em considerao que a populao tem distribuio Normal e conhecido, utiliza -se como estatstica de teste X N , n

que, substituindo pelos valores conhecidos, vem 80 , X N , 64 ou seja, X N (, 10), de onde se obtm Z= X . 10

A regio crtica do teste, tendo em conta que este teste unilateral superior, da forma Zobs. > z1 . Como o nvel de signicncia igual a cinco por cento ( = 0.05) tem-se z1 = z0.95 = 1.645, logo rejeita-se H0 se Zobs. > 1.645. O valor de zobs. obtido atravs da estatstica de teste considerando que H0 verdadeira, logo, como = 980, tem-se Zobs. = que, como x = 200 obtm-se zobs. = x 980 1000 980 = = 2. 10 10 X 0 X 980 = 10 10

Assim, como zobs. = 2 > 1.645, rejeita-se H0 , o que signica que existe evidncia estatstica para armar que os computadores WorkFast tm uma durao mdia superior a 980 dias. 2. Considerando que os computadores duram, em mdia, 1010 dias, qual a potncia do teste? A probabilidade de ocorrncia de um erro do tipo II dada por = P (no rejeitar H0 |H0 falsa) = = P (Zobs. 1.645| = 1010) X 980 1.645| = 1010 = P 10 236

Neste caso, pelo facto do verdadeiro valor para ser 1010, a distribuio a utilizar ser Z= logo X 980 P 1.645| = 1010 = 10 P X 980 16.45| = 1010 = P X 996.45| = 1010 = P X 1010 13.55| = 1010 = X 1010 1.355| = 1010 = P 10 P (Z 1.355) = X X 1010 = 10 10

= = = = =

= 1 (1.355) ' 1 (1.36) = = 1 0.9131 = 0.0869. Assim, a potncia do teste 1 = 1 0.0869 = 0.9131. 3. Determine o p-value do teste efectuado na primeira alnea. Utilize-o para concluir qual seria a deciso do teste no caso de o nvel de signicncia fosse igual a um por cento. O teste efectuado um teste unilateral superior, como tal, o p-value determinado atravs de p-value = P (Z > zobs ) = P (Z > 2) = 1 (2) = 1 0.9772 = 0.0228. Como o valor do p-value superior ao nvel de signicncia ( = 0.01), neste caso no se rejeitaria H0 .

237

3.5.3

Testes de hipteses para a mdia - conhecido e populao com distribuio no Normal (ou desconhecida)

Exemplo 3.5.7 O nmero de computadores vendidos diariamente em Alfalndia tem desvio padro igual a 30. Considere que foi observado o nmero de computadores vendidos em cem dias, obtendo-se um mdia igual a 250. 1. Teste, com um nvel de signicncia igual a dois por cento, se a mdia do nmero de computadores vendidos diariamente em Alfalndia igual a 245. As hipteses a testar so H0 : = 245 versos H1 : 6= 245. Tendo em considerao que conhecido e n 30, utilizase a estatstica X N , n que, substituindo pelos valores conhecidos, vem 30 , X N , 100 que simplicando obtm-se X N (, 3), ou seja, Z= X . 3

A regio crtica do teste, pelo facto de este teste ser bilateral, ser rejeitar H0 se Zobs. < z1 Zobs. > z1 .
2 2

Como = 0.02, vem z1 = z1 0.02 = z0.99 = 2.326.


2 2

logo rejeita-se H0 se Zobs. < 2.326 Zobs. > 2.326. O valor observado da estatstica igual a Zobs. = X 0 X 245 = 3 3 238

que, como x = 250, obtm-se zobs. = 250 245 x 245 = ' 1.6667. 3 3

Assim, como o valor observado no pertence regio crtica, no se rejeita H0 , logo no existe evidncia estatstica para armar que a mdia do nmero de computadores vendidos diariamente em Alfalndia seja diferente de 245. 2. Considerando que os computadores duram, em mdia, 255 dias, qual a probabilidade de ocorrncia de um erro do tipo II? A probabilidade de ocorrncia de um erro do tipo II dada por = P (no rejeitar H0 |H0 falsa) = = P (2.326 Zobs. 2.326| = 255) X 245 2.326| = 255 . = P 2.326 3 Neste caso, pelo facto do verdadeiro valor para ser 255, a distribuio a utilizar Z= assim X X 255 = , 3 3

= = = = =

X 245 P 2.326 2.326| = 255 = 3 P 6.978 X 245 6.978| = 255 = P 238.002 X 251.978| = 255 = P 16.978 X 255 3.022| = 255 = X 255 1.0073| = 255 = P 5.6593 3 P (5.6593 Z 1.0073) =

= P (Z 1.0073) P (Z < 5.6593) = = 1 P (Z 1.0073) [1 P (Z 5.6593)] ' ' 1 P (Z 1.01) 1 + P (Z 5.66) = = 1 0.8438 1 + 1 = 0.1562. 239

A probabilidade de ocorrncia de um erro do tipo II, quando = 255, igual a 0.1562 ( = 0.1562). 3. Determine o p-value do teste efectuado na primeira alnea. Utilize-o para concluir qual seria a deciso do teste no caso de o nvel de signicncia fosse igual a cinco por cento. O teste efectuado um teste bilateral, como tal, o p-value determinado atravs de p-value = 2P (Z > |zobs |) = 2P (Z > |1.6667|) = = 2P (Z > 1.6667) = 2 [1 (1.6667)] ' ' 2 [1 (1.67)] = 2 [1 0.9525] = 0.095. Como o valor do p-value superior ao nvel de signicncia ( = 0.05) a deciso seria no mesmo sentido, ou seja, no rejeitar H0 .

240

3.5.4

Testes de hipteses para a proporo - Populao de Bernoulli

Exemplo 3.5.8 Com o objectivo de analisar a proporo de habitantes favorveis construo de um novo estdio municipal, foi recolhida uma amostra aleatria onde dos cem inquiridos oitenta responderam serem favorveis. 1. Teste, com um nvel de signicncia igual a dez por cento, se a proporo de habitantes favorveis construo de um novo estdio municipal inferior oitenta e cinco por cento. As hipteses a testar so H0 : p = 0.85 versos H1 : p < 0.85. Pelo facto de se estar a analisar uma proporo (populao de Bernoulli) sendo n 30, utilizase a estatstica pN b

r p,

p (1 p) n

ou seja,

. p (1 p) n Como o teste unilateral inferior, a regio crtica do teste ser rejeitar H0 se Zobs. < z1 . Como = 0.10, vem z1 = z0.90 = 1.282. logo rejeita-se H0 se Zobs. < 1.282. O valor observado da estatstica igual a Zobs. = r p0 (1 p0 ) n p p0 b =r 0.85 (1 0.85) 100 p 0.85 b

Z=r

pp b

que, como p = 0.8, obtm-se b zobs. = r

0.85 (1 0.85) 100

p 0.85 b

=r

0.85 (1 0.85) 100

0.8 0.85

' 1.4003.

241

O valor observado pertence regio crtica, logo rejeita-se H0 . Existe evidncia estatstica para armar que a proporo de habitantes favorveis construo de um novo estdio municipal inferior oitenta e cinco por cento. 2. Considerando que setenta e cinco por cento dos habitantes so favorveis construo de um novo estdio municipal, qual a potncia do teste? A probabilidade de ocorrncia de um erro do tipo II dada por = P (no rejeitar H0 |H0 falsa) = P (Zobs. |p = 0.75) 100 onde, pelo facto do verdadeiro valor para p ser 0.75, a distribuio a utilizar ser Z=r p (1 p) n pp b =r 0.75 (1 0.75) 100 p 0.75 b p 0.85 b = P r 1.282|p = 0.75 , 0.85 (1 0.85)

logo

p 0.85 b P r 1.282|p = 0.75 = 0.85 (1 0.85) 100 = P (b 0.85 0.0458|p = 0.75) = p = P (b 0.8042|p = 0.75) = p = P (b 0.75 0.0542|p = 0.75) = p

100 = P (Z 1.2522) = 1 (1.2522) '

p 0.75 b 1.2522|p = 0.75 = = P r 0.75 (1 0.75)

' 1 (1.25) = 1 0.8944 = 0.1056. A potncia do teste dada por 1 = 1 0.1056 = 0.8944. 242

3. Determine o p-value do teste efectuado na primeira alnea. Utilize-o para concluir qual seria a deciso do teste no caso de o nvel de signicncia fosse igual a cinco por cento. O teste efectuado um teste unilateral inferior, como tal, o p-value determinado atravs de p-value = P (Z < zobs ) = P (Z < 1.4003) = 1 (1.4003) ' ' 1 (1.40) = 1 0.9192 = 0.0808. Como o valor do p-value superior ao nvel de signicncia ( = 0.05), neste caso no se rejeitaria H0 . 3.5.5 Testes de hipteses para a varincia - Populao com distribuio Normal

Exemplo 3.5.9 Os salrios da empresa BoaVida seguem uma distribuio Normal. Com base numa amostra aleatria de dimenso 101 com mdia igual a 750 euros e varincia igual a 10100. 1. Teste, com um nvel de signicncia igual a cinco por cento, se os salrios da empresa BoaVida tm uma varincia igual a 13000. As hipteses a testar so H0 : 2 = 13000 versos H1 : 2 6= 13000. Pelo facto de se estar a analisar a varincia tendo a populao distribuio Normal, utilizase como estatstica de teste
2 (n 1) SC 2 (n1) 2

que, como n = 101, tem-se que


2 100SC 2 . (100) 2

Como o teste bilateral, a regio crtica do teste ser rejeitar H0 se 2 < 2 2 > 2 . obs obs 1
2 2

243

Como = 0.05, vem 2 = 2 = 2 0.05 0.025 = 74.222 e =


2 2 0.05 1 2

2 2 1 2

= 2 0.975 = 129.56.

Assim, rejeita-se H0 se 2 < 74.222 2 > 129.56. O valor observado da estatstica obs obs igual a 2 = obs.
2 2 100SC 100SC = 2 13000

que, como s2 = 10100 e consequentemente s2 = C obtm-se 2 = obs. 100 10201 100s2 C = ' 78.4692. 13000 13000 n 2 101 s = 10100 = 10201, n1 100

O valor observado no pertence regio crtica, logo no se rejeita H0 . Assim, no existe evidncia estatstica para armar que a os varincia dos salrios da empresa BoaVida sejam diferentes de 13000. 2. Considerando que os salrios da empresa BoaVida tm uma varincia igual a 10000, qual a probabilidade de ocorrncia de um erro de segunda espcie? A probabilidade de ocorrncia de um erro do tipo II dada por = P (no rejeitar H0 |H0 falsa) = = P 74.222 2 129.56| 2 = 10000 = obs. 2 100SC 2 129.56| = 10000 . = P 74.222 13000 Devido ao facto de o verdadeiro valor para 2 ser 10000, a distribuio a utilizar neste clculo ser
2 2 100SC 100SC = 2 (100) 2 10000

244

logo 2 100SC 2 P 74.222 129.56| = 10000 = 13000 2 P 964886 100SC 1684280| 2 = 10000 = 2 100SC 2 168.428| = 10000 = P 96.4886 10000 168.428 = P 96.4886 2 (100) 2 P (100) 168.428 P 2 (100) 96.4886

= = = =

que recorrendo s tabelas da distribuio Qui-quadrado vem Valores de x Valores de 95.808 96.4886 99.334 que, pela interpolao linear, obtm-se 99.334 95.808 99.334 96.4886 0.50 0.40 0.50 0 0 ' 0.4193. = 0.40 0 =? 0.50

Assim, conclui-se que 2 P 2 (100) 168.428 P (100) 96.4886 = 1 0.4193 = 0.5807. A probabilidade de ocorrncia de um erro do tipo II, quando = 10000, igual a 0.5807 ( = 0.5807). 3. Determine o p-value do teste efectuado na primeira alnea. Utilize-o para concluir qual seria a deciso do teste no caso de o nvel de signicncia fosse igual a dez por cento. O teste efectuado um teste bilateral, como tal, o p-value determinado atravs de p-value = 2 min P 2 < 2 , P 2 > 2 . obs obs 245

Para determinar este valor, comea-se por calcular as duas probabilidades. P 2 < 2 = P 2 < 78.4692 = obs

que recorrendo s tabelas da distribuio Qui-quadrado vem Valores de x Valores de 77.929 78.4692 82.358 logo, pela interpolao linear, conclui-se que 82.358 77.929 82.358 78.4692 0.05 0 =? 0.10

0.10 0.05 0.10 0 0 ' 0.0561. =

portanto P 2 < 78.4692 ' 0.0561 P 2 > 2 = 1 P 2 < 2 = 1 0.0561 = 0.9439. obs obs p-value = 2 min {0.0561, 0.9439} = 2 0.0561 = 0.1122. Como o valor do p-value superior ao nvel de signicncia ( = 0.10), a deciso seria no mesmo sentido, ou seja, no rejeitar H0 . 3.5.6 Testes de hipteses para a mdia - desconhecido e Populao com distribuio Normal Exemplo 3.5.10 O tempo que um carro demora a passar determinada ponte tem distribuio Normal. Considere 246

O valor do p-value obtido por

uma amostra aleatria de dimenso 11 onde foi obtida uma varincia igual a 110 e uma mdia igual a 80 segundos. 1. Teste, com um nvel de signicncia igual a dez por cento, se o tempo que um carro demora a passar a ponte , em mdia, inferior a 90 segundos. As hipteses a testar so H0 : = 90 versos H1 : < 90. Tendo em considerao que a populao tem distribuio Normal e desconhecido, utilizase como estatstica de teste X t(n1) SC n que, como n = 11, vem X t(10). S C 10 A regio crtica do teste, tendo em conta que este unilateral inferior, da forma Tobs. < t1 . Como o nvel de signicncia igual a dez por cento ( = 0.10) tem-se t1 = t0.90 = 1.3722, logo rejeita-se H0 se Tobs. < 1.3722. O valor de tobs. obtido atravs da estatstica de teste considerando que H0 verdadeira, logo, como = 90 e s2 = C ou seja sC = tem-se Tobs. = X 0 X 90 sC = 11 10 10 247 121 = 11, n 2 11 s = 110 = 121 n1 10

que, como x = 80, obtm-se x 90 80 90 = = 2.8748. 11 11 10 10 = 2.8748 < 1.3722, vai-se rejeitar H0 o que signica que existe tobs. =

Assim, como tobs.

evidncia estatstica para armar que o tempo mdio que um carro demora a passar a ponte inferior a 90 segundos. 2. Considerando que o tempo mdio que um carro demora a passar a ponte igual a 75 segundos, qual a potncia do teste? A probabilidade de ocorrncia de um erro do tipo II dada por = P (no rejeitar H0 |H0 falsa) = = P (Tobs. 1.3722| = 75) =

X 90 1.3722| = 75 = P 11 10 Neste caso, pelo facto do verdadeiro valor para ser 75, a distribuio a utilizar ser T = logo X X 75 = t(10) 11 11 10 10

X 75 = P 2.94| = 75 = 11 10 = P t(10) 2.94 = 1 P t(10) < 2.94 248

X 90 P 1.3722| = 75 = 11 10 = P X 90 4.7732| = 75 = = P X 85.2268| = 75 = = P X 75 10.2268| = 75 =

que recorrendo s tabelas da distribuio t-Student vem Valores de x Valores de 2.7638 2.94 3.1693 que, pela interpolao linear, obtm-se 3.1693 2.7638 3.1693 2.94 0.995 0.99 0.995 0 0 ' 0.9922. = 0.99 0 =? 0.995

Assim, conclui-se que 1 P t(10) < 2.94 ' 1 0.9922 = 0.0078. A potncia do teste igual a 1 = 1 0.0078 = 0.9922. 3. Determine o p-value do teste efectuado na primeira alnea. Utilize-o para concluir qual seria a deciso do teste no caso de o nvel de signicncia fosse igual a cinco por cento. O teste efectuado um teste unilateral inferior, como tal, o p-value determinado atravs de p-value = P (T < tobs ) = P (T < 2.8748) = 1 P (T < 2.8748) que recorrendo s tabelas da distribuio t-Student vem Valores de x Valores de 2.7638 2.8748 3.1693 249 0.99 0 =? 0.995

Pela interpolao linear, conclui-se que 3.1693 2.7638 3.1693 2.8748 0.995 0.99 0.995 0 0 ' 0.9914. =

que substituindo obtem-se 1 P (T < 2.8748) = 1 0.9914 = 0.0086. Como o valor do p-value inferior ao nvel de signicncia ( = 0.05) a deciso seria no mesmo sentido, ou seja, rejeitar H0 . Exemplo 3.5.11 O nmero de telemveis vendidos diariamente numa das loja da marca FalaBarato descrito, aproximadamente, por uma distribuio Normal. Com o objectivo de analisar o nmero de telemveis vendidos diariamente nessa loja, foi recolhida amostra aleatria de dimenso 100 com mdia 50 telemveis e varincia 222.75. 1. Teste, com um nvel de signicncia igual a um por cento, se o nmero mdio de telemveis vendidos diariamente na loja superior a 45. As hipteses a testar so H0 : = 45 versos H1 : > 45. Tendo em considerao que desconhecido e a populao possui distribuio Normal utiliza-se, como estatstica de teste, T = X t(n1) SC n

que, como n = 100, vem T = X X = t(99). S SC C 10 100 250

mas, como os graus de liberdade da t-Student so superiores a 30, a estatstica de teste pode ser aproximada distribuio Normal, obtendo-se Z= X . SC 10

A regio crtica do teste, pelo facto de este ser unilateral superior, ser rejeitar H0 se Zobs. > z1 . Como = 0.01, vem z1 = z0.99 = 2.326, logo rejeita-se H0 se Zobs. > 2.326. O valor de zobs. obtido atravs da estatstica utilizada no teste considerando que H0 verdadeira, assim, como = 45 e s2 = C tem-se Zobs. = sendo o valor observado igual a zobs. = x 45 50 45 = ' 3.3333. 1.5 1.5 X 0 X 45 X 45 sC = 15 = 1.5 , 10 10 n 2 100 s = 222.75 = 225 sC = 225 = 15, n1 99

O valor observado pertence regio crtica, logo deve-se rejeitar H0 . Assim, existe evidncia estatstica para armar que o nmero mdio de telemveis vendidos diariamente na loja superior a 45. 2. Considerando que o nmero mdio de telemveis vendidos diariamente na loja igual a 52, qual a probabilidade de ocorrncia de um erro do tipo II? A probabilidade de ocorrncia de um erro do tipo II dada por = P (no rejeitar H0 |H0 falsa) = = P (Zobs. 2.326| = 52) X 45 2.326| = 52 = P 1.5 251

Neste caso, pelo facto do verdadeiro valor para ser 52, a distribuio a utilizar ser Z= logo X 45 P 2.326| = 52 = 1.5 P X 45 3.489| = 52 = P X 48.489| = 52 = P X 52 3.511| = 52 = X 52 2.3407| = 52 = P 1.5 P (Z 2.3407) = 1 (2.3407) ' X X 52 = 1.5 1.5

= = = = =

' 1 (2.34) = 1 0.9904 = 0.0096. Assim, a probabilidade de ocorrncia de um erro do tipo II, quando = 52, igual a 0.0096 ( = 0.0096). 3. Determine o p-value do teste efectuado na primeira alnea. Utilize-o para concluir qual seria a deciso do teste no caso de o nvel de signicncia fosse igual a 0.1 por cento. O teste efectuado um teste unilateral superior, como tal, o p-value determinado atravs de p-value = P (Z > zobs ) = P (Z > 3.3333) = 1 (3.3333) ' ' 1 (3.33) = 1 0.9996 = 0.0004. Como o valor do p-value inferior ao nvel de signicncia ( = 0.001), neste caso tambm se rejeitaria H0 .

252

3.5.7

Procedimento geral para a construo de um teste de hipteses

1. Identicar o parmetro em anlise e especicar a hiptese nula e a hiptese alternativa. 2. Escolher o nvel de signicncia. 3. Com base no conhecimentos de distribuies amostrais, escolher uma estatstica de teste adequada. 4. Determinar a regio crtica do teste. 5. Com base na informao de uma amostra determinar o valor observado da estatstica e decidir sobre a rejeio ou no da hiptese nula.

253

3.5.8

Quadro resumo dos testes de hipteses Condies conhecido e Populao Normal conhecido e n 30 desconhecido e Populao Normal desconhecido Populao Normal e n > 30 Populao Bernoulli p e n 30 H1 6= 0 > 0 < 0 6= 0 > 0 < 0 6= 0 > 0 < 0 6= 0 > 0 < 0 p 6= p0 p < p0 p > p0 Regio Crtica Zobs. < z1 Zobs. > z1
2 2

Parmetro

p-value15 2P (Z > |zobs |) P (Z > zobs ) P (Z < zobs )


2

Zobs. > z1 Zobs. < z1 Zobs. < z1 Zobs. > z1


2

2P (Z > |zobs |) P (Z > zobs ) P (Z < zobs )

Zobs. > z1 Zobs. < z1 Tobs. < t1 Tobs. > t1


2 2

2P (T > |tobs |) P (T > tobs ) P (T < tobs )

Tobs. > t1 Tobs. < t1 Zobs. < z1 Zobs. > z1


2 2

2P (Z > |zobs |) P (Z > zobs ) P (Z < zobs )

Zobs. > z1 Zobs. < z1 Zobs. < z1 Zobs. > z1


2 2

2P (Z > |zobs |) P (Z > zobs ) P (Z < zobs ) 2 min {p1 , p2 }

Zobs. > z1 Zobs. < z1 2 < 2 2 > 2 obs obs 1


2 2

2 6= 2 0
2

p1 = P (2 > 2 ) obs p2 = P (2 < 2 ) obs

Populao Normal 2 > 2 0 2 < 2 0 2 > 2 1 obs 2 < 2 obs

P (2 > 2 ) obs P (2 < 2 ) obs

15

No clculo do p-value considera-se que a hiptese nula verdadeira.

254

ndice
1 Probabilidades 1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1

1.2 Denio de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2.1 1.2.2 1.2.3 Denio clssica de probabilidade . . . . . . . . . . . . . . . . . . . . . 10 Denio frequencista de probabilidade . . . . . . . . . . . . . . . . . . . 15 Denio axiomtica de probabilidade . . . . . . . . . . . . . . . . . . . 17

1.3 Probabilidades condicionadas e acontecimentos independentes . . . . . . . . . . 22 1.4 Teorema das probabilidades totais e teorema de Bayes . . . . . . . . . . . . . . . 32 2 Distribuies 37

2.1 Denio de varivel aleatria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2 Variveis Aleatrias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.2.1 2.2.2 Caso unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Caso bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.3 Distribuies discretas de probabilidade . . . . . . . . . . . . . . . . . . . . . . . 61 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 Distribuio de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 61

Distribuio Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Distribuio Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . 64 Distribuio Hipergeomtrica . . . . . . . . . . . . . . . . . . . . . . . . 66 Distribuio de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

2.4 Variveis aleatrias contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 2.4.1 2.4.2 2.4.3 Funo de densidade de probabilidade . . . . . . . . . . . . . . . . . . . 74 Funo de distribuio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Valor esperado e varincia de uma varivel aleatria contnua . . . . . . 78

2.5 Distribuies Contnuas de Probabilidade . . . . . . . . . . . . . . . . . . . . . . 82 2.5.1 2.5.2 Distribuio Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Distribuio Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

2.5.3 2.5.4 2.5.5 2.5.6

Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Distribuio Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . 99 Distribuio de t-Student . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 Distribuio de F - Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . 113

2.6 Desigualdade de Tchebyche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 2.7 Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 2.7.1 2.7.2 2.7.3 2.7.4 2.7.5 Funo de distribuio da Poisson - P () . . . . . . . . . . . . . . . . . . 123 Funo de distribuio da Normal Standard - Z . . . . . . . . . . . . . . 126 Valores percentuais da t-Student com n graus de liberdade - t
(n)

. . . . . 127

Valores percentuais da Quiquadrado com n graus de liberdade - 2 . . 128 (n) Valores percentuais da FSnedcor com m e n graus de liberdade - F(m,n) 130 134

3 Inferncia Estatstica

3.1 Noes bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 3.2 Estimadores Pontuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 3.2.1 3.2.2 3.2.3 Mtodo dos momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 Mtodo da mxima verosimilhana . . . . . . . . . . . . . . . . . . . . . 144 Propriedades dos estimadores pontuais . . . . . . . . . . . . . . . . . . . 157

3.3 Distribuies amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 3.3.1 Distribuio da mdia amostral - conhecido e populao com distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 3.3.2 Distribuio da mdia amostral - conhecido e populao com distribuio no Normal (ou desconhecida) . . . . . . . . . . . . . . . . . . 170 3.3.3 3.3.4 3.3.5 Distribuio da proporo amostral - Populao de Bernoulli . . . . . . . 173 Distribuio da varincia amostral - Populao com distribuio Normal 177 Distribuio da mdia amostral - desconhecido e populao com distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 3.3.6 Quadro resumo das distribuies amostrais . . . . . . . . . . . . . . . . . 189

3.4 Intervalos de conana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

ii

3.4.1

Intervalos de conana para a mdia - conhecido e populao com distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

3.4.2

Intervalos de conana para a mdia - conhecido e populao com distribuio no Normal (ou desconhecida) . . . . . . . . . . . . . . . . . 196

3.4.3 3.4.4

Intervalos de conana para a proporo - Populao de Bernoulli . . . . 201 Intervalos de conana para a varincia - Populao com distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

3.4.5

Intervalos de conana para a mdia - desconhecido e populao com distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

3.4.6 3.4.7

Procedimento geral para a construo de um intervalo de conana . . . 215 Quadro resumo dos intervalos de conana . . . . . . . . . . . . . . . . . 215

3.5 Testes de hiptese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 3.5.1 3.5.2 Noes bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 Testes de hipteses para a mdia - conhecido e populao com distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 3.5.3 Testes de hipteses para a mdia - conhecido e populao com distribuio no Normal (ou desconhecida) . . . . . . . . . . . . . . . . . . 238 3.5.4 3.5.5 3.5.6 Testes de hipteses para a proporo - Populao de Bernoulli . . . . . . 241 Testes de hipteses para a varincia - Populao com distribuio Normal 243 Testes de hipteses para a mdia - desconhecido e Populao com distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 3.5.7 3.5.8 Procedimento geral para a construo de um teste de hipteses . . . . . . 253 Quadro resumo dos testes de hipteses . . . . . . . . . . . . . . . . . . . 254

iii