Anda di halaman 1dari 100

i

Notas de
M
etodos Estatsticos

Mestrado Integrado em Engenharia Civil


2009 2010

Maria da Graca Santos Temido Neves Mendes

ii

Ja Galileu afirmava que Deus escreveu o mundo em


linguagem matematica e que competia ao homem
decifrar essa linguagem.

Todos devem aprender a ler, escrever e contar.

Todos devem aprender a pensar, a ler, escrever .... e a decifrar n


umeros!

O que e a Estatstica ? O que e uma populacao? O que e uma amostra?


Uma populac
ao e um conjunto de indivduos com caractersticas comuns
que interessa estudar. Uma amostra e um subconjunto de elementos
extrados da populacao com metodologia estatstica apropriada.
E a Estatstica, o que
e?
A Estatstica ocupa-se das metodologias de planeamentro de experiencias,
obtenc
ao de dados, sua organizacao para posteriormente
interpretar e tirar conclusoes com base nos dados disponveis.
A Estatstica ocupa-se das propriedades das populacoes, principalmente
as que sao susceptveis de representacao numerica como resultado de
medic
oes ou contagens.
A Estatstica e a tomada de decisoes num contexto de incerteza.
Ent
ao
a estatstica
e a arte de tirar conclus
oes
a partir de um conjunto de dados!!

Conte
udo
1 Teoria das Probabilidades
1.1 Diferentes conceitos de Probabilidade . . . . . . . . . . . . . . . .
1.2 Condicionamento e independencia estocastica de acontecimentos
1.3 Vari
aveis aleatorias e distribuicoes . . . . . . . . . . . . . . . . .
1.3.1 Vari
aveis aleatorias . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Distribuic
oes discretas e distribuicoes contnuas . . . . . .
1.3.3 Momentos simples e centrados de variaveis aleatorias . .
1.3.4 Distribuic
oes mais usadas em Estatstica . . . . . . . . . .
1.4 Teorema Limite Central . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

3
3
8
13
13
15
19
26
42

2 Estatstica Descritiva
2.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Vari
aveis estatsticas discretas . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Vari
aveis estatsticas contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . .

49
49
50
54

Estatstica Inferencial
3.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Distribuic
oes amostrais . . . . . . . . . . . . . . . . . . . .
3.3 Estimac
ao parametrica pontual . . . . . . . . . . . . . . . .
3.4 Testes de ajustamento . . . . . . . . . . . . . . . . . . . . .
3.4.1 Generalidades sobre testes . . . . . . . . . . . . . . .
3.4.2 Teste do Qui-Quadrado como teste de ajustamento
3.4.3 Teste de Kolmogorov-Smirnov . . . . . . . . . . . . .
3.4.4 Papel de probabilidade . . . . . . . . . . . . . . . . .
3.5 Inferencia para a media de uma variavel aleatoria . . . . .
3.5.1 Intervalos de confianca . . . . . . . . . . . . . . . . .
3.5.2 Testes parametricos . . . . . . . . . . . . . . . . . .
3.6 Inferencia para a vari
ancia de uma variavel aleatoria normal
3.6.1 Intervalos de confianca . . . . . . . . . . . . . . . . .
3.6.2 Testes parametricos . . . . . . . . . . . . . . . . . .
3.7 Inferencia para proporc
oes . . . . . . . . . . . . . . . . . .
3.7.1 Intervalos de confianca . . . . . . . . . . . . . . . . .
3.7.2 Testes parametricos . . . . . . . . . . . . . . . . . .
3.8 Regressao linear simples . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

61
61
63
65
70
70
71
76
77
79
79
86
92
92
94
98
98
101
105

Captulo 1:Teoria das Probabilidades

Captulo 1

Teoria das Probabilidades


Ensinar e acreditar no futuro dos jovens
mesmo quando estes nos desiludem no presente!

1.1

Diferentes conceitos de Probabilidade

De um modo geral, a teoria das probabilidades tem como objectivo encontrar modelos matematicos que descrevam certos fenomenos naturais em que se supoe intervir o acaso, isto e,
fenomenos para os quais nao e possvel, a partir do passado, prever deterministicamente o
futuro. A estes fenomenos chamamos fenomenos aleatorios.
Neste contexto surge tambem a nocao de experiencia aleatoria que aqui definimos como
um processo ou conjunto de circunstancias sujeitos a factores casuais capaz de produzir efeitos
observaveis mas incertos.
Exemplo 1.1.1 Lancamento de um dado; lancamento de uma moeda; lancamento de
tres dados; observac
ao e registo de temperatura; avaliac
ao e registo de um caudal; contagem
do n
umero de veculos que passam numa portagem de auto-estrada; contagem do n
umero de
lancamentos de um dado ate obter pela terceira vez a face 2; contagem do n
umero de alunos
que chegam atrasados a uma aula.

Dada uma experiencia aleatoria chamamos:


espaco fundamental, que representamos por , ao conjunto de todos os resultados possveis
de obter ao realizar a experiencia
acontecimento a qualquer subconjunto de
acontecimento elementar a qualquer subconjunto de que contenha apenas um elemento
de
acontecimento certo a
acontecimento impossvel ao conjunto vazio
acontecimento contr
ario de A, que representamos por A, ao complementar de A (em )
acontecimento uniao de A com B ao conjunto A B
acontecimento intersecc
ao de A com B ao conjunto A B
3

Captulo 1: Teoria das Probabilidades

acontecimento diferenca entre A e B a A B = A B.


acontecimento uniao numer
avel dos acontecimentos A1 , A2 , A3 , ..., An , ... a

+
[

An

n=1

acontecimento intersecc
ao numeravel dos acontecimentos A1 , A2 , A3 , ..., An , ... a

+
\

An

n=1

Mais, dizemos que:


o acontecimento A se realiza ou ocorre se ao realizar a experiencia o resultado obtido
pertencer a A ( realiza-se sempre e nunca se realiza);
dois acontecimentos A e B s
ao incompatveis, disjuntos ou mutuamente exclusivos se
A B = .
Exemplo 1.1.2 Consideremos a experiencia aleat
oria que consiste na contagem do n
umero
de pecas defeituosas fabricadas por uma m
aquina no perodo de uma hora, sendo n 10 o
n
umero m
aximo de pecas que a m
aquina e capaz de produzir durante esse perodo.
Tem-se = {0, 1, ..., n}. Os acontecimentos A = {0, 1, 2} e B = {4, 5} s
ao incompatveis e
C = {3, 4, ..., n} e o complementar de A.
A questao que se coloca agora e a de saber como calcular as probabilidades de acontecimentos e como evoluiu o conceito de probabilidade.
As experiencias aleatorias que estiveram na origem da teoria das Probabilidades apresentavam um n
umero finito de resultados e a equipossibilidade de todos os resultados.

Defini
c
ao 1.1.1 Definic
ao cl
assica ou de Laplace de probabilidade.
Dada uma experiencia aleat
oria, se e finito e todos os seus elementos s
ao equipossveis,
ent
ao a probabilidade de A e o quociente entre o n
umero de casos favor
aveis `
a ocorrencia de
A e o n
umero de casos possveis de obter ao realizar a experiencia, isto e
P (A) =

#A
.
#

Exemplo 1.1.3 Ao lancarmos um dado equilibrado duas vezes consideremos os acontecimentos A=sada de um n
umero par e de um n
umero mpare B= sada de um n
umero
par seguida de um n
umero mpar, ou seja, B = {(i, j) : i {2, 4, 6}, j {1, 3, 5}} e
A = B {(i, j) : i {1, 3, 5}, j {2, 4, 6}}.
Sabemos que # = 6 6 = 36 e que todos os acontecimentos elementares tem a mesma
ent
possibilidade de ocorrencia. E
ao v
alido o conceito cl
assico de Laplace de probabilidade,
#B
#A
233
1
33
tendo-se P (A) = # = 66 = 2 e P (B) = # = 66 = 14 .
Exemplo 1.1.4 Consideremos a experiencia aleat
oria associada ao Totoloto, isto e, a
experiencia que consiste na extraca
o aleat
oria de 6 bolas de uma urna que contem 49 bolas
numeradas de 1 a 49. Consideremos os acontecimentos A= sada de uma determinada chave
fixae B= sada de uma chave com seis n
umeros pares. Podemos, mais uma vez, usar o
C 24
conceito cl
assico de Laplace para obter P (A) = C149 e P (B) = C649 .
6

1.1 - Diferentes conceitos de Probabilidade

Suponhamos agora que lancamos uma moeda equilibrada com as faces representadas por C
e K. Sendo a moeda equilibrada, sabemos que P (C) = P (K) = 1/2. No entanto se lancarmos
a moeda um n
umero reduzido de vezes, a frequencia relativa de C dificilmente sera igual a 1/2.
Mas, sabemos tambem que se prolongarmos a realizacao da experiencia indefinidamente, a
frequencia relativa de C vai estabilizando em torno de 1/2. Este exemplo, aqui apresentado
com um ponto de vista meramente academico, motiva uma outra definicao de probabilidade
que assenta essencialmente na regularidade estatstica associada a certos fenomenos aleatorios
e que permite definir a probabilidade como limite de uma frequencia relativa.
Defini
c
ao 1.1.2 Definic
ao frequencista de probabilidade (Bernoulli). Consideremos uma
experiencia aleat
oria e um acontecimento A que lhe est
a associado. Representemos por fn (A)
a frequencia relativa do acontecimento A em n realizac
oes da experiencia, sempre nas mesmas
circunst
ancias. Tem-se
P (A) = lim fn (A).
n+

Devemos observar que, mesmo realizando um n


umero grande de vezes a experiencia aleatoria,
a atribuicao de probabilidade a um acontecimento que advem da definicao frequencista nao e
mais do que tomar a frequencia relativa desse acontecimento como aproximacao da sua verdadeira probabilidade.
Perante a indecisao de saber qual das duas definicoes deveremos usar e em que circunstancias,
coloca-se a questao de saber se nao se podera definir a probabilidade de uma forma unificadora
e que, portanto, abranja as duas anteriores. Ora, a resposta a esta questao e dada pela definicao de probabilidade que se deve a um trabalho publicado em 1933 pelo matematico russo
Kolmogorov. Antes porem ha que apresentar a definicao de tribo sobre .
Defini
c
ao 1.1.3 Seja o espaco fundamental associado a uma experiencia aleat
oria. Uma
tribo sobre e um conjunto de subconjuntos de , que representamos por T , tal que
pertence a T ;
se A pertence a T , ent
ao A tambem lhe pertence,
S
se A1 , A2 , . . . , An , . . . pertencem a T , ent
ao +
em lhe pertence.
i=1 Ai tamb

Defini
c
ao 1.1.4 Definic
ao axiom
atica de probabilidade. Seja o espaco fundamental associado a uma experiencia aleat
oria e T uma tribo sobre . Uma probabilidade e uma aplicac
ao
P : T [0, 1], que verifica
i) P () = 1
ii) Para qualquer sucess
ao de acontecimentos A1 , A2 , ..., An , ..., dois a dois incompatveis,
+
+
X
[
P (Ai ).
Ai ) =
tem-se P (
i=1

i=1

Proposi
c
ao 1.1.1 Propriedades da probabilidade.
1. P () = 0.
2. (Aditividade) Se A e B s
ao acontecimentos incompatveis ent
ao P (AB) = P (A)+P (B).

Captulo 1: Teoria das Probabilidades

3. Se A e B s
ao dois acontecimentos tais que A B, ent
ao P (A) P (B).

Prova. Se A B, ent
ao B e igual `
a uni
ao disjunta entre A e B A. Assim P (B) =
P (A) + P (B A), pelo que se tem P (A) P (B).

4. Se A e B s
ao dois acontecimentos quaisquer ent
ao
(a) P (A) = 1 P (A);

(b) P (A B) = P (A) P (A B);

(c) P (A B) = P (A) + P (B) P (A B).


Provas.
(a) Como = A A o resultado decorre imediatamente.
(b) Sendo A = (A B) (A B) e (A B) (A B) = , pela propriedade 2.
obtemos
P (A) = P (A B) + P (A B)
do que resulta o pretendido.
Notemos que se B A, ent
ao tem-se P (A B) = P (A) P (B).
(c) Ora, uma vez que A B = (A B) (A B) (A B) e A B, A B e A B
s
ao disjuntos dois a dois, obtemos
P (A B) = P (A B) + P (A B) + P (A B)
= P (A) P (A B) + P (B) P (A B) + P (A B)
= P (A) + P (B) P (A B).

5. Desigualdade de Boole: Se A1 , A2 , ..., An s


ao acontecimentos quaisquer ent
ao
P(

n
[

i=1

Ai )

n
X

P (Ai )

i=1

Exerccio 1.1.1 Num lancamento de um dado viciado, a probabilidade de ocorrer cada


n
umero mpar e o dobro da probabilidade de ocorrer cada n
umero par.
1. Indique o espaco fundamental associado a esta experiencia aleat
oria e calcule a probabilidade de cada acontecimento elementar.
2. Calcule a probabilidade de que o n
umero de pontos obtido no lancamento do dado seja
superior a 3.
3. Calcule a probabilidade de que o n
umero de pontos obtidos no lancamento do dado seja
um quadrado perfeito.
Exerccio 1.1.2 Uma roleta tem 20 sectores equiprov
aveis numerados de 1 a 20. Roda-se
e regista-se o n
umero em que esta se imobilizou. Considere os acontecimentos : A=Sai um
n
umero menor ou igual que 10e B=Sai um n
umero superior a k. Sabendo que P (AB) = 1
e que P (A B) = 0.1, determine o valor de k.

1.1 - Diferentes conceitos de Probabilidade

Exerccio 1.1.3 No quadro abaixo v


ao ser colocadas, ao acaso, seis pecas iguais, n
ao mais
do que uma por quadrcula. Calcule a probabilidade de que qualquer uma das filas horizontais
fique preenchida.
.................................
............................
............................
.......................
Exerccio 1.1.4 Numa prateleira colocam-se, ao acaso, 5 livros dos quais 3 s
ao de autores
portugueses A, B e C e 2 dos autores ingleses D e E. Calcule a probabilidade de, ao observar
a prateleira da esquerda para a direita,
1. o livro do autor B ser colocado depois do livro do autor A;
2. os livros dos dois autores ingleses ficarem juntos na prateleira;
3. a obra do autor D ser a u
ltima da prateleira.
Exerccio 1.1.5 A Isabel gosta muito de jogar as cartas e ainda mais de fazer apostas
com os colegas de turma. Costumam tirar duas cartas de um baralho com 52 cartas, tendo
anteriormente cada um dos jogadores apostado em determinado tipo de resultados. Nos u
ltimos
dias descobriu que estava a ficar sem dinheiro e resolveu fazer tudo o que lhe fosse possvel para
recuperar o dinheiro perdido. Para isso decidiu preparar-se em casa e calcular a probabilidade
que tinha de ganhar se apostasse em:
1. Sair a dama de copas e um rei;
2. Sair um rei e um
as;
3. Apenas uma das cartas ser de copas;
4. Sair uma carta vermelha e outra preta;
5. N
ao sarem ases nem figuras.
De entre estas hip
oteses, qual deve ser a aposta da Isabel?
Exerccio 1.1.6 Sejam A e B acontecimentos tais que P (A) + P (B) = x e P (A B) = y.
Determine, em func
ao de x e de y, a probabilidade de
1. se realizar pelo menos um dos dois acontecimentos;
2. n
ao se realizar nenhum dos dois acontecimentos;
3. se realizar um e um s
o dos dois acontecimentos;
4. se realizar quando muito um u
nico acontecimento.
Exerccio 1.1.7 Considere os tres acontecimentos A, B e C tais que A B C = ,
P( A)=0.3, P (B) = 0.7, P(C)=0.5 e A B = C B = . Calcule P (A C).

Captulo 1: Teoria das Probabilidades

Exerccio 1.1.8 Uma colecc


ao de 100 programas de computador foi examinada para detectar erros de sintaxe, input/outpute de outro tipodiferente dos anteriores. Desses 100
programas, 20 tinham erros de sintaxe, 10 tinham erros de input/outpute 5 tinham erros
de outro tipo, 6 tinham erros de sintaxe e de input/output, 3 tinham erros de sintaxe
e de outro tipo, 3 tinham erros de input/output e de outro tipo e 2 tinham os tres tipos
de erros considerados. Um programa e seleccionado ao acaso desta colecc
ao. Determine a
probabilidade de que o programa seleccionado tenha
1. exclusivamente erros de sintaxe;
2. pelo menos um dos tres tipos de erros.

1.2

Condicionamento e independ
encia estoc
astica de acontecimentos

Suponhamos que para uma experiencia aleatoria conhecemos o espaco fundamental e que temos
definida uma probabilidade P .
Sejam A e B dois acontecimentos tais que P (B) 6= 0. Se depois de realizada a experiencia
soubermos que se realizou B, de que modo essa informacao parcial sobre o resultado da ex o caso, por exemplo, em que ao realizarmos uma
periencia ira modificar a probabilidade de A? E
experiencia para determinar o tempo de vida de uma lampada e sabendo, num determinado
instante, que a lampada ja durou pelo menos 100 horas, querermos saber qual a probabilidade de a lampada durar pelo menos mais 50 horas. Surge assim o conceito de probabilidade
condicionada.
Defini
c
ao 1.2.1 Dado um acontecimento B tal que P (B) 6= 0, chamamos probabilidade
condicional de A dado B, ou probabilidade de A condicionada por B a
P (A|B) =

P (A B)
.
P (B)

Observa
c
ao 1.2.1 Notamos que, para qualquer acontecimento B tal que P (B) 6= 0, a
aplicac
ao P (|B) ( tambem denotada por PB ()) que a um acontecimento A faz corresponder
P (A|B) e uma probabilidade.
Exemplo 1.2.1 Um dado perfeito, com as faces numeradas de 1 a 6, foi lancado duas
vezes. Sabendo que a soma das duas faces foi 6 qual e agora a probabilidade de que no primeiro
lancamento tenha sado a face 1?
Se definirmos B = soma dos resultados ser 6 e A = no primeiro lancamento sair 1
teremos P (A|B) = 1/5. Com efeito, B = {(1, 5), (2, 4), (4, 2), (3, 3), (5, 1)} e A B = {(1, 5)} e
1
portanto P (A|B) = P P(AB)
(B) = 5 .
Exemplo 1.2.2 Consideremos a experiencia aleat
oria que consiste na extracc
ao de uma
carta de um baralho, n
ao viciado, com 52 cartas. Consideremos os acontecimentos A=sada

1.2 - Condicionamento e independencia estocastica de acontecimentos

de
as, B=sada de damae C=sada de espada. Uma vez que se pode aplicar o conceito
4
4
, P (B) = 52
e P (C) = 13
cl
assico de Laplace, tem-se P (A) = 52
52 . Supondo agora que se
observou o acontecimento D=sada de uma figuraa probabilidade dos acontecimentos A, B e
4
3
C ser
a condicionada. De facto, tem-se P (A|D) = 0, P (B|D) = 12
= 13 e P (C|D) = 12
= 41 .
Proposi
c
ao 1.2.1 (Teorema da Probabilidade Total) Sejam B1 , B2 , ..., Bn acontecimentos
do mesmo espaco, disjuntos dois a dois e com probabilidade n
ao nula. Para qualquer outro
n
acontecimento A contido em i=1 Bi , tem-se
P (A) =

n
X

P (A|Bi )P (Bi ).

i=1

Exemplo 1.2.3 Dos tres fornecedores de um produto para um armazem (em partes de
30%, 50% e 20% respectivamente) todos fornecem o produto em lotes que por vezes est
ao em
condic
oes indesejadas (atraso, peso insuficiente, impurezas, falta de especificidade, etc), sendo
a percentagem de lotes em condico
es indesejadas sobre o total fornecido por cada um dos
fornecedores de 0.7%, 0.5% e 0.4%, respectivamente.
Ao escolher aleatoriamente um lote desse produto e verificado que se encontrava em condic
oes
indesejadas, qual o seu fornecedor mais prov
avel?
Consideremos os acontecimentos A= o lote e fornecido pelo fornecedor A, B= o lote e
fornecido pelo fornecedor Be C= o lote e fornecido pelo fornecedor Ce I= o lote e fornecido
em condico
es indevidas.
Tem-se P (A) = 0.3, P (B) = 0.5, P (C) = 0.2, P (I|A) = 0.007, P (I|B) = 0.005 e P (I|C) =
0.004.
P (I|A)P (A)
P (I A)
=
onde
Por outro lado P (A|I) =
P (I)
P (I)
P (I) = P (I|A)P (A) + P (I|B)P (B) + P (I|C)P (C)
= 0.007 0.3 + 0.005 0.5 + 0.004 0.2

= 0.0054.
0.007 0.3
0.389.
Ent
ao P (A|I) =
0.0054
Tambem se tem
P (B|I) =

P (I B)
P (I|B)P (B)
0.005 0.50
=
=
0.463
P (I)
P (I)
0.0054

e
P (C|I) = 1 P (A|I) P (B|I) = 1 0.389 0.463 = 0.148.
Conclumos que o fornecedor mais prov
avel e B.
Calculemos tambem a probabilidade de um determinado lote, escolhido ao acaso, ter vindo
do primeiro fornecedor e se apresentar em condic
oes indesejadas. Esta probabilidade e P (A
I) = P (A|I)P (I) = 0.389 0.0054 0.0021.
Exemplo 1.2.4 Num determinado material podem encontrar-se impurezas de v
arios tipos.
Em ensaios laboratoriais e possvel identificar impurezas de tipo A usando um produto que

10

Captulo 1: Teoria das Probabilidades

infelizmente n
ao e totalmente eficaz. Com efeito, se as impurezas s
ao de tipo A o material
adquire um tom azulado de certeza e, em caso contr
ario, a probabilidade de o material ficar
azulado e de 5%. A realizac
ao de v
arios ensaios permitiu concluir que a probabilidade de o
material adquirir o tom azul e de 35%.
Vamos calcular a probabilidade de haver impurezas de tipo A neste material.
Consideremos os acontecimentos A=As impurezas s
ao de tipo Ae B=O material adquire
um tom azulado.
= 0.05. Alem disso A B = A, pois A B,
Sabemos que P (B) = 0.35 e que P (B|A)
donde P (A B) = P (A) e P (B|A) = 1.
(A)
e equivalente a 0.35 = 1P (A) +
Uma vez que P (B) = P (B|A) P (A) + P (B|A)P
0.05(1 P (A)), conclumos que P (A) = 0.3/0.95 0.316.
Exemplo 1.2.5 Um grupo de alunos por vezes, em vez de ir `
as aulas, fica na residencial
a jogar dois jogos, sendo igualmente prov
avel optarem por um ou por outro. Os jogos consistem
em adivinhar o n
umero de pintas obtidas no lancamento de dados. No primeiro jogo joga-se
apenas com um dado e no segundo com dois dados. Sabendo que o resultado foi 2 qual a
probabilidade de estarem a jogar o primeiro jogo?
Sejam A=Os alunos jogam o primeiro jogoe B =O resultado foi 2. Tem-se
P (A|B) =

P (B|A)P (A)
6
P (A B)
=
= .
P (B)
7
P (B|A)P (A) + P (B|A)P (A)

Pode acontecer que a informac


ao sobre a ocorrencia de um certo acontecimento B nao
modifique a probabilidade inicial de um outro acontecimento A. Basta pensar, por exemplo,
na experiencia aleatoria que consiste em lancar um dado e uma moeda ao mesmo tempo: a
ocorrencia de um certo n
umero no dado em nada altera a sada de cara ou de coroa na moeda.
Assim, surge a definic
ao seguinte.
Defini
c
ao 1.2.2 Dizemos que dois acontecimentos do mesmo espaco, A e B, s
ao independentes se P (A B) = P (A)P (B).
Note-se que, na definic
ao anterior, no caso em que A e B tem probabilidade nao nula, a
igualdade P (AB) = P (A)P (B) e equivalente a P (A|B) = P (A) bem como a P (B|A) = P (B).
Observamos ainda que qualquer acontecimento com probabilidade nula e independente de
qualquer outro do mesmo espaco e que qualquer acontecimento e independente do acontecimento certo e do acontecimento impossvel. Mais ainda, dois acontecimentos disjuntos so sao
independentes se pelo menos um deles tiver probabilidade nula.
Exemplo 1.2.6 Suponhamos que dispomos de um saco com 20 bolas de tamanho e textura
iguais, numeradas de 1 a 20, sendo as primeiras 10 azuis e as restantes amarelas. Consideremos
a experiencia aleat
oria que consiste na extracc
ao ao acaso de uma bola do saco e registo do
n
umero que lhe foi atribudo. Representemos por A o acontecimento sada de bola azule por
B o acontecimento sada de bola com m
ultiplo de 4. Por extenso temos = {1, 2, . . . , 20},
A = {1, 2, . . . , 10} e B = {4, 8, . . . 20}.
Usando a definic
ao cl
assica de probabilidade, obtemos P (A) = 1/2 e P (B) = 1/4.

1.2 - Condicionamento e independencia estocastica de acontecimentos

11

Suponhamos agora que dispomos da informac


ao de que se realizou o acontecimento C=
sada de bola com n
umero par. Nestas circunst
ancias, temos P (A|C) = 21 = P (A) e
5
1
P (B|C) = 10 = 2 6= P (B). Conclumos assim que A e C s
ao independentes mas que B e
C s
ao dependentes.
Proposi
c
ao 1.2.2 Se A e B s
ao independentes tambem o s
ao A e B, A e B, bem como
A e B.
Prova. Ora, se A e B s
ao independentes tem-se P (A B) = P (A)P (B). Assim
P (A B) = P (A B) = P (A) P (A B)
= P (A) P (A)P (B) = P (A)(1 P (B)) = P (A)P (B).
ao independentes. Por outro lado, tambem se tem
Similarmente se prova que A e B s
P (A B) = P (A B) = 1 P (A B) = 1 P (A) P (B) + P (A B)
= P (A) P (B) + P (A)P (B) = P (A) P (B)(1 P (A))
= P (A)(1 P (B)) = P (A)P (B).
Genericamente, dado um conjunto de acontecimentos A1 , A2 , ..., An , dizemos que sao mutuamente independentes se, para qualquer conjunto de ndices {i, j, ..., k} {1, 2, ..., n} se
tem P (Ai Aj ... Ak ) = P (Ai )P (Aj )...P (Ak ). Evidentemente que se A1 , A2 , ..., An s
ao
mutuamente independentes ent
ao sao dois a dois independentes, tres a tres independentes etc.
Exerccio 1.2.1 Sabe-se que existe petr
oleo numa certa regi
ao com probabilidade 0.8 e
que, caso haja petr
oleo, a probabilidade de sair petr
oleo na primeira perfurac
ao e de 0.5. Qual
e a probabilidade de sair petr
oleo na primeira perfurac
ao?
Exerccio 1.2.2 Uma empresa produz pecas de determinado tipo para o mercado nacional e para exportac
ao, sendo a produc
ao para o mercado nacional metade da que se destina `
a
exportac
ao. Um controlo de qualidade permitiu afirmar que 5% das pecas lancadas no mercado interno apresentam deficiencias, sendo essa percentagem de 2% na produca
o destinada ao
mercado externo. Qual a percentagem de pecas defeituosas na produc
ao total da empresa?
Exerccio 1.2.3 Um fornecedor de aparelhos para detecc
ao de
agua no subsolo argumenta
que estes s
ao de elevada confianca uma vez que P (A|B) = P (A|B) = 0.95, onde os acontecimentos A e B s
ao definidos da forma seguinte: A = o aparelho indica a existencia de
aguae
B = existe
agua na regi
ao do subsolo analisada. Pretende-se utilizar o aparelho para construir um dep
osito de
agua num lote de terreno onde a probabilidade de existir
agua e igual a
0.05. Determine
1. P(A);
2. a probabilidade de existir
agua no lote, sabendo que o aparelho indica a existencia de
agua
nesse lote.

12

Captulo 1: Teoria das Probabilidades

Exerccio 1.2.4 Numa experiencia laboratorial pretende-se ensinar um rato a virar `


a direita num labirinto. Para tal, coloca-se o rato num compartimento com duas sadas `
a escolha:
uma `
a direita e outra `
a esquerda. Em cada tentativa, se o rato sai pela direita e recompensado
com um cubo de queijo e se sai pela esquerda e castigado com um leve choque electrico. Admita
que o rato se move de acordo com o seguinte:
na primeira tentativa escolhe aleatoriamente a sada;
se em determinada tentativa foi recompensado, sai pela direita na tentativa seguinte com
probabilidade 0.6;
se em determinada tentativa foi castigado, sai pela direita na tentativa seguinte com
probabilidade 0.8.
1. Qual a probabilidade de o rato sair pela direita na 2a tentativa?
2. Sabendo que na 2a tentativa o rato saiu pela direita, qual a probabilidade de ter sado pela
esquerda na 1a ?
Exerccio 1.2.5 Para saber se uma porta est
a aberta, um robot emite um feixe radiante
na sua direcc
ao e mede a intensidade I do feixe reflectido, embora se saiba que I e tambem
afectada por outros factores. Concretamente, o robot e programado para considerar a porta
aberta quando I < I0 , tendo-se apurado, na fase de treino do robot, que P(I < I0 /Porta
aberta)=0.6 e P(I < I0 /Porta fechada)=0.3. Suponha que, na fase de trabalho aut
onomo do
robot, este se encontra diante de uma porta e obtem uma medic
ao I inferior a I0 . Sabendo
que a probabilidade de a porta estar aberta e 0.5, determine a probabilidade do robot embater
contra uma porta fechada.
conhecido que os motoristas que circulam em determinada estrada poExerccio 1.2.6 E
dem cometer dois e s
o dois tipos de transgress
oes ditas do tipo I e do tipo II. N
ao se registou
nenhum caso em que o motorista tenha cometido ambas as transgress
oes. Sabe-se que
20% dos motoristas multados cometem transgress
oes do tipo I;
10% dos motoristas que cometem transgress
oes do tipo I s
ao multados;
1% dos motoristas cometem transgress
oes do tipo I;
2% dos motoristas cometem transgress
oes do tipo II.
Calcule a probabilidade de que um motorista que circule nessa estrada e cometa uma transgress
ao do tipo II seja multado.
Exerccio 1.2.7 O Ant
onio escolhe, ao acaso, uma p
agina de um jornal com oito p
aginas.
A Ana escolhe, ao acaso, uma p
agina de uma revista com quarenta p
aginas. Qual a probabilidade de que ambos escolham a p
agina 5?
Exerccio 1.2.8 Sejam A e B dois acontecimentos do mesmo espaco.
1. Mostre que, se A e B s
ao independentes, ent
ao P (A) P (B) = P (A B) P (A).
2. Sabendo que A e B s
ao independentes, P (A) = 1/3 e P (B) = 2/5, determine P (A B).
Exerccio 1.2.9 Sejam A e B acontecimentos com probabilidade n
ao nula. Mostre que
se P (B|A) = P (B|A), ent
ao A e B s
ao independentes.

1.3 - Variaveis aleatorias e distribuicoes

13

Exerccio 1.2.10 Um sistema electrico e constitudo por dois circuitos C1 e C2 que funcionam em paralelo. O circuito C1 e composto por uma s
o componente, enquanto que o circuito
C2 e constitudo por duas componentes que funcionam em serie. Suponha que as tres componentes falham independentemente umas das outras e que a probabilidade de cada componente
falhar e igual a 0.05.
1. Determine a probabilidade do sistema funcionar.
2. Determine a probabilidade de apenas o circuito C1 funcionar.
Exerccio 1.2.11 A execuc
ao de um projecto de construc
ao de um edifcio no tempo programado est
a relacionada com os seguintes acontecimentos:
E=escavac
ao executada a tempo
F=fundac
oes executadas a tempo
S=superestrutura executada a tempo
que se sup
oem mutuamente independentes. Sabendo que P (E) = 0.8, P (F ) = 0.7 e P (S) = 0.9,
calcule a probabilidade de
1. o edifcio ser terminado no tempo previsto, devido ao cumprimento dos prazos nas tres
actividades referidas.
2. o prazo de execuc
ao ser cumprido para a escavac
ao e n
ao ser cumprido em pelo menos
uma das outras actividades.

1.3

1.3.1

Vari
aveis aleat
orias e distribuic
oes

Vari
aveis aleat
orias

Em muitas das aplicac


oes probabilsticas os elementos de um espaco fundamental, , sao,
logo `a partida, n
umeros reais ou vectores de n
umeros reais, como a medida de determinado
comprimento ou o n
umero de lancamentos de um dado necessarios ate obter a face 2 pela
primeira vez. Contudo, quando cada elemento do espaco fundamental nao e um n
umero real
ou um vector real, podendo ser, por exemplo, uma molecula de um gas ou um ser humano, so
podemos proceder a tais aplicac
oes atribuindo um valor real ou um vector de valores reais a
cada elemento de .
Grosso modo, em geral, nao sao os proprios elementos do espaco fundamental que sao alvo
de estudo mas sim valores numericos que lhes estao associados. Mais concretamente, e de todo
o interesse trabalhar com func
oes que associem a cada resultado de uma experiencia aleatoria
um valor numerico e posteriormente avaliar a probabilidade de tais valores pertencerem a
determinados conjuntos de n
umeros reais ou de vectores reais.
Por exemplo, ao pretendermos estudar a obesidade de uma certa populacao de indivduos, ,
definimos o coeficiente de obesidade de cada elemento pertencente a , que representamos por
X(), como sendo o quociente entre o peso de e o quadrado da altura de (ndice de massa
corporal). Posteriormente sera de todo o interesse saber, por exemplo, qual a probabilidade
deste coeficiente ser superior a 25.

14

Captulo 1: Teoria das Probabilidades

Defini
c
ao 1.3.1 Seja o espaco fundamental associado a uma experiencia aleat
oria. Damos o nome de vari
avel aleat
oria real a uma func
ao
X : IR
X()
para a qual e sempre possvel calcular P (X x) = P ({ : X() x}), para qualquer x real.
A palavra vari
avel e utilizada para enfatizar o facto de se tratar de uma funcao que tem
como domnio o espaco fundamental de uma experiencia aleatoria.
Refira-se que habitualmente se designa a variavel aleatoria por letra mai
uscula enquanto que
os valores particulares que esta assume sao representados pela letra min
uscula correspondente.
Se X1 , X2 , ..., Xn sao vari
aveis aleatorias e f e uma funcao real de n variaveis reais contnua,
entao f (X1 , X2 , ..., Xn ) e uma vari
avel aleatoria. Um caso particular muito importante e o da
variavel aleatoria
X n : IR

1X
X n () =
Xi ()
n
i=1

que sera abreviadamente representada por X.


Realcamos agora o facto de que, em muitas aplicacoes, e necessario associar a cada elemento
de varios valores numericos. Um exemplo consiste em associar a cada elemento de uma
populacao de pessoas a idade, o peso, um determinado indice serico e o tempo relacionado com
o desenvolvimento de certa patologia. Surge entao o conceito de vector aleatorio.
Defini
c
ao 1.3.2 Chamamos vector aleat
orio a qualquer func
ao
X : IRn
(X1 (), X2 (), ..., Xn ()) para a qual e possvel calcular P (X1 x1 , X2
x2 , ..., Xn xn ), para qualquer x = (x1 , x2 , ..., xn ) em IRn .
A definic
ao de vari
avel aleatoria e de vector aleatorio que acabamos de apresentar conduz
imediatamente `a definic
ao da func
ao de distribuicao de uma variavel aleatoria e de um vector
aleatorio.
Defini
c
ao 1.3.3 1. Damos o nome de funca
o de distribuic
ao da vari
avel aleat
oria X `
a
funca
o
F : IR [0, 1]
x P (X x).
2. Damos o nome de func
ao de distribuic
ao do vector aleat
orio X `
a func
ao
F : IRn [0, 1]
(x1 , x2 , ..., xn ) P (X1 x1 , X2 x2 , ..., Xn xn ).
A grande importancia da func
ao de distribuicao de uma variavel aleatoria X advem do facto
de que esta resume toda a informac
ao relevante do ponto de vista do calculo das probabilidades

1.3 - Variaveis aleatorias e distribuicoes

15

relativa a uma vari


avel aleatoria. Isto e, a partir da funcao de distribuicao de X podemos
calcular as probabilidades de qualquer tipo de conjuntos, por exemplo P (a < X b) =
F (b) F (a) ou P (X > a) = 1 F (a).
Por outro lado, em presenca de uma variavel aleatoria, como um ndice serico relevante para
um determinado estudo, o que de facto e importante e a forma como se distribuem os valores
deste ndice ao longo de um intervalo de n
umeros e nao quais sao os indivduos da populac
ao
que os geraram. Doutro modo, interessa-nos saber como se distribuem os valores de X() para
todos os , sem que nos interesse identificar cada . Evidentemente que a associacao de
cada indivduo ao valor correspondente da variavel aleatoria (por exemplo um ndice serico) e
uma questao de relevo do ponto de vista clnico, mas nao neste contexto.
Proposi
c
ao 1.3.1 Propriedades da func
ao de distribuic
ao de uma vari
avel aleat
oria real.
1. F e crescente.
Prova. Sejam x e y n
umeros reais tais que x y. Basta observar que F (x) = P (X
x) = P (X ] , x]) P (X ] , y]) = F (y).
2. F e limitada.
Prova. Tratando-se de uma probabilidade tem-se F (x) = P (X x) [0, 1], sendo
portanto uma func
ao limitada.
3. F e contnua `
a direita;
4.

lim F (x) = 0 e lim F (x) = 1;

x+

5. P (a < X b) = F (b) F (a).

Prova. Atendendo a que ] , b] =] , a] ]a, b], tem-se


P (a < X b) = P (X ]a, b]) = P (X ] , b]) P (X ] , a] = F (b) F (a).

6. P (X = a) e a medida da amplitude do salto de F no ponto a;.


7. F e contnua no ponto a se e s
o se P (X = a) = 0.

1.3.2

Distribuic
oes discretas e distribuic
oes contnuas

Ao estudarmos uma vari


avel aleatoria a primeira questao que se coloca e a de saber quais os
valores que esta assume, para que, posteriormente possamos estudar a forma como estes se
distribuem. Esta questao da lugar `a definicao de suporte de uma variavel aleatoria, que, em
muitos casos, coincide exactamente com o conjunto dos valores que a variavel pode assumir.
Observemos que a vari
avel aleatoria que representa o n
umero de clientes que, diariamente,
entram num armazem entre as 9 e as 10 horas e a variavel aleatoria que representa o tempo
que cada cliente espera ate ser atendido sao duas variaveis que assumem valores em conjuntos
com caractersticas diferentes. Na verdade, a primeira toma valores num conjunto de n
umeros
naturais e a segunda toma valores num intervalo real. Esta diferenca condiciona o tipo de
distribuicao (ou lei) das vari
aveis aleatorias, as quais, do ponto de vista das aplicacoes relevantes
em Estatstica, se dividem em discretas e contnuas.

16

Captulo 1: Teoria das Probabilidades

Defini
c
ao 1.3.4 Uma vari
avel aleat
oria X diz-se discreta (ou que tem distribuic
ao discreta) se assume valores num conjunto finito ou infinito numer
avel S, tendo-se portanto P (X
S) = 1.
Defini
c
ao 1.3.5 Dada uma vari
avel aleat
oria real discreta X, chamamos suporte de X
(ou da distribuic
ao de X) ao menor dos conjuntos S que verificam P (X S) = 1.
O suporte da vari
avel aleatoria X sera denotado por SX . De acordo com as definicoes
anteriores, uma vari
avel aleatoria real X diz-se discreta se e so se assume valores num conjunto finito ou infinito numer
avel. Devemos notar que o conjunto de valores que uma variavel
aleatoria discreta assume pode nao ser exactamente igual ao seu suporte. Contudo, este conjunto contem sempre SX . Mais concretamente, tem-se sempre P (X = a) > 0, para qualquer a
pertencente a SX . Esta afirmac
ao sugere a nocao de funcao de probabilidade de uma variavel
aleatoria discreta.
Defini
c
ao 1.3.6 Dada uma vari
avel aleat
oria real discreta X, damos o nome de funca
o de
probabilidade `
a aplicaca
o
f : R [0, 1]
x P (X = x)

Para uma vari


avel aleatoria discreta de suporte SX = {..., xi , xi+1 , ...}, a funcao de distribuicao e dada por
X
F (x) P (X x) =
P (X = xi )
xi x

sendo consequentemente uma func


ao constante em cada intervalo [xi , xi+1 [, apresentando descontinuidades (saltos) apenas nos pontos do suporte. Podemos mesmo afirmar que o suporte
de uma vari
avel aleatoria discreta coincide com o conjunto dos pontos de descontinuidade da
sua funcao de distribuic
ao. Em conclusao, uma variavel aleatoria real tem distribuicao (ou lei)
discreta se e so se a sua func
ao de distribuicao e uma funcao em escada com um n
umero finito
ou infinito numer
avel de pontos de descontinuidade.
Sao exemplos de vari
aveis aleatorias discretas: o n
umero de caras obtidas ao lancar tres
moedas equilibradas ou nao, o n
umero de embalagens que e preciso retirar de um lote ate
encontrar duas em condic
oes indevidas, o n
umero de acidentes graves por mes em determinado
troco de estrada, o n
umero de dias por ano em que a temperatura de determinado local excede
um valor previamenmte fixado, etc.
Exemplo 1.3.1 Seja X a vari
avel aleat
oria real que representa o n
umero de caras obtidas
ao efectuar dois lancamentos sucessivos de uma moeda equilibrada.
Temos = {(c, c), (c, k), (k, c), (k, k)}, SX = {0, 1, 2} e a func
ao de distribuica
o e definida
por

0
se x < 0

0.25 se 0 x < 1
F (x) = P (X x) =
,
0.75 se 1 x < 2

1
se x 2

17

1.3 - Variaveis aleatorias e distribuicoes

cujo esboco do gr
afico e apresentado na figura seguinte:
..
..
..
...........................
..............................................F
1 ...
.
.........................
0.75 ..
..
..
0.25 ...........................
..................................................................................................................................................................................
0
1
2
Partindo do exemplo anterior, podemos agora ilustrar as propriedades 6 e 7 da funcao de
distribuicao. Com efeito, a func
ao de distribuicao apresenta descontinuidades apenas nos pontos
do conjunto {0, 1, 2} e as amplitudes de salto 0.25, 0.5 e 0.25 correspondem `as probabilidades
P (X = 0), P (X = 1) e P (X = 2), respectivamente.
Passemos agora ao segundo tipo de variaveis aleatorias.
Defini
c
ao 1.3.7 Uma vari
avel aleat
oria real X diz-se contnua se P (X = x) = 0, para
qualquer n
umero real x.
Do ponto de vista das aplicac
oes estatsticas, no conjunto das variaveis contnuas interessanos um subconjunto especial que designamos variaveis aleatorias absolutamente contnuas ou
variaveis aleatorias com distribuicao absolutamente contnua. Devemos mesmo afirmar que,
no contexto de tais aplicac
oes e no ambito em que se insere este texto, as variaveis que sao
contnuas mas nao absolutamente contnuas perdem a sua importancia teorica.
Sao exemplos de vari
aveis aleatorias absolutamente contnuas a velocidade do vento, a
temperatura, as medidas de capacidade, o comprimento e massa (peso), as medidas de areas e
volumes, as resistencias, os caudais, as tensoes de rotura, etc.
No sentido de definir vari
avel aleatoria absolutamente contnua e necessario definir func
ao
densidade.
Defini
c
ao 1.3.8 Damos o nome de func
ao densidade sobre R a uma funca
o real de vari
avel
real f que seja n
ao negativa e que verifique
Z +
f (t)dt = 1.

Depois disto definimos uma variavel aleatoria X como absolutamente contnua como se
segue.
Defini
c
ao 1.3.9 Uma vari
avel aleat
oria real X diz-se absolutamente contnua se existe
uma densidade sobre R tal que a func
ao de distribuic
ao de X se escreve na forma
Z x
F (x) =
f (t)dt, x IR.

Da definic
ao de vari
avel aleatoria absolutamente contnua decorre que a funcao de distribuicao e contnua e verifica
i) f (x) = F (x) nos pontos onde a derivada existe;

18

Captulo 1: Teoria das Probabilidades

ii) P (X [a, b]) = P (X ]a, b]) = P (X [a, b[) = P (X ]a, b[) =


Z b
= F (b) F (a) =
f (t)dt.
a

Em consequencia desta u
ltima propriedade podemos afirmar que, se X for uma variavel
aleatoria absolutamente contnua, a probabilidade de X pertencer ao intervalo [a, b] e a medida
da area limitada inferiormente pela recta de equacao y = 0, superiormente pelo grafico de f e
lateralmente pelas rectas de equac
ao x = a e x = b. Este facto e ilustrado na figura seguinte,
onde a medida da area a tracejado representa a referida probabilidade.

Observa
c
ao 1.3.1 Uma vez que, no
ambito das aplicac
oes estatsticas, as vari
aveis que
s
ao contnuas mas n
ao absolutamente contnuas n
ao tem relev
ancia, no que se segue usamos
a designac
ao contnua para significar absolutamente contnua.
Exemplo 1.3.2 Seja X uma vari
avel aleat
oria contnua com densidade definida pela express
ao analtica

f (x) =

1
ba

se
se
se

Provamos facilmente que a func


ao de distribuic
ao

se
0
xa
se
F (x) =
ba
1
se

x<a
axb .
x>b
de X e dada por
x<a
axb .
x > b.

Apresentamos de seguida o esboco dos gr


aficos de f e de F , respectivamente.
..
.
1 ......
.................................................
ba ..
..
..
f
..
.....................................................................................................................
.
a
b

..
..
...........................
.......................F
1 .......
......
.
.
.
.
..
.
.....
..
......
.
.
.
.
.
..
....
.................................................................................................................................................
.
a
b

Neste caso dizemos que X segue a lei uniforme no intervalo [a, b] e escrevemos
X U ([a, b]).

19

1.3 - Variaveis aleatorias e distribuicoes

A independencia de vari
aveis aleatorias e um conceito de importancia primordial em muitas
das aplicac
oes mais usuais da teoria das probabilidades.
Defini
c
ao 1.3.10 Duas vari
aveis aleat
orias reais X e Y dizem-se independentes se
P (X x, Y y) = P (X x)P (Y y),
para quaisquer x e y reais. De igual modo, as vari
aveis aleat
orias reais X1 , X2 , ..., Xn definemse como independentes se
P (X1 x1 , X2 x2 , , Xn xn ) = P (X1 x1 )P (X2 x2 ) P (Xn xn ),
para quaisquer x1 , x2 , , xn reais .
Notamos que no caso em que as variaveis aleatorias X1 , X2 , ..., Xn sao discretas, uma
condicao necessaria e suficiente para que sejam independentes e que se verifique
P (X1 = x1 , X2 = x2 , , Xn = xn ) = P (X1 = x1 )P (X2 = x2 ) P (Xn = xn ),
para x1 SX1 , x2 SX2 , , xn SXn .

1.3.3

Momentos simples e centrados de vari


aveis aleat
orias

Como veremos adiante, quando se pretende conhecer a distribuicao de uma variavel aleatoria
associada a um fenomeno aleatorio, ha que encontrar inicialmente o tipo de distribuicao entre
todas as contnuas e discretas de que dispomos. A tarefa seguinte sera a de conhecer os seus
parametros desconhecidos, os quais nos permitem especificar caractersticas tao importantes
como a localizac
ao e a dispersao dos valores que tal variavel assume.
Neste contexto, surgem as nocoes de media e de variancia de uma variavel que sao particularizacoes dos momentos simples e centrados de uma variavel aleatoria, nocao com a qual nos
ocupamos de seguida.
Defini
c
ao 1.3.11
1. Seja X uma vari
avel aleat
oria real discreta. Se

xSX

|x|P (X = x) < +, ent


ao existe

esperanca matem
atica ou media de X que e definida por
X
E(X) =
xP (X = x).
xSX

2. Seja X uma vari


avel aleat
oria contnua. Se

|x|f (x)dx for convergente, ent


ao existe

a esperanca matem
atica ou media de X que e dada por
Z +
E(X) =
xf (x)dx.

20

Captulo 1: Teoria das Probabilidades

A esperanca matematica ou media de uma variavel aleatoria e um parametro de localizacao,


tendo o papel de ponto de equilbrio da sua distribuicao.
Notamos tambem que a esperanca matematica de uma variavel aleatoria nao e necessariamente um dos valores que esta assume. Basta considerar a variavel X que representa um
n
umero escolhido ao acaso no conjunto {1, 2, 3, 4} para a qual se tem E(X) = 2.5.
Exemplo 1.3.3 Consideremos a vari
avel aleat
oria X discreta com suporte SX = {0, 1, 2, 3}
e tal que P (X = 0) = P (X X
= 1) = 1/8 e P (X = 2) = 2P (X = 3). Calculemos E(X).
Ora, atendendo a que
P (X = k) = 1 obtemos P (X = 2) = 1/2 e P (X = 3) = 1/4.
kSX

Assim E(X) = 0 1/8 + 1 1/8 + 2 1/2 + 3 1/4 = 15/8.

Exemplo 1.3.4 Seja X uma vari


avel aleat
oria contnua com func
ao densidade definida
por
f (x) =

ex se
0
se

onde e um n
umero real positivo. Tem-se
Z
Z +
|x|f (x) dx =

x0
,
x<0

xex dx.

Ora, integrando por partes, obtemos


Z
Z
1
x
x
xe
dx = e
x ex dx = ex x ex + C

e ent
ao

t
Z +
1
1
xex = lim ex x ex = .
t+

0
0
Conclumos assim que o integral impr
oprio e convergente e portanto E(X) existe, tendo-se
Z +
Z 0
Z +
1
E(X) =
xf (x) dx =
0 dx +
xex dx = .

0
Exemplo 1.3.5 Seja X uma vari
avel aleat
oria seguindo a distribuic
ao de Cauchy redu1 1
, x R.
zida, isto e, a lei de densidade f (x) =
1 + x2
A esperanca matem
atica de X n
ao existe porque
Z +
Z 0
Z +
|x|f (x) dx =
x f (x) dx +
x f (x)dx

=
=

x
dx +
(1 + x2 )

x
dx
(1 + x2 )

1
1
lim log(1 + a2 ) +
lim log(1 + b2 ) = +.
2 a
2 b+

Proposi
c
ao 1.3.2 (Propriedades da esperanca matem
atica) Sejam X e Y duas vari
aveis
aleat
orias definidas sobre o mesmo espaco e tais que E(X) e E(Y ) existem. Tem-se

21

1.3 - Variaveis aleatorias e distribuicoes

i) se P (X 0) = 1 ent
ao E(X) 0;
ii) E(X + Y ) = E(X) + E(Y );
iii) E(aX + bY ) = aE(X) + bE(Y ),

a, b IR;

iv) se X e Y s
ao independentes, ent
ao E(XY ) = E(X)E(Y );
v) |E(X)| E(|X|).
As propriedades ii), iii) e iv) sao facilmente generalizaveis a um n
umero finito de variaveis
aleatorias. Concretamente, tem-se
E(a1 X1 + a2 X2 + ... + an Xn ) = a1 E(X1 ) + a2 E(X2 ) + ... + an E(Xn ),

a1 , ..., an IR;

se X1 , X2 , ..., Xn sao independentes, entao E(X1 X2 Xn ) = E(X1 )E(X2 ) E(Xn ).

Apresentamos de seguida a nocao de esperanca matematica de uma funcao real de uma


variavel aleatoria.
Defini
c
ao 1.3.12 Seja h : IR IR uma func
ao tal que h(X) e ainda uma vari
avel
aleat
oria real.
X
|h(x)|P (X = x) e convergente, ent
ao
1. Se X e uma vari
avel aleat
oria discreta tal que
xSX

existe esperanca matem


atica de h(X), tendo-se
X
E(h(X)) =
h(x)P (X = x).
xSX

2. Se X e uma vari
avel aleat
oria contnua tal que o integral
gente, ent
ao existe esperanca matem
atica de h(X) tendo-se
Z +
E(h(X)) =
h(x)f (x)dx.

|h(x)|f (x)dx e conver-

Exemplo 1.3.6 Seja h uma func


ao de domnio IR e de express
ao analtica h(x) = x2 e
consideremos a vari
avel aleat
oria do exemplo 1.3.2, isto e X U [a, b]. Ent
ao
Z b
1
b3 a 3
E(h(X)) = E(X 2 ) =
x2
dx =
.
ba
3(b a)
a
Damos o nome de momento simples de ordem k de X a mk (X) = E(X k ) e de momento
centrado de ordem k de X a k (X) = E((X E(X))k ) (no caso de existirem). A 2 (X) da-se
o nome de vari
ancia de X e representa-se por V ar(X). Por outras palavras tem-se
V ar(X) = E((X E(X))2 ).
p
O desvio padrao de X e definido por V ar(X).
Devemos observar que quando nao ha d
uvidas relativamente a que variavel aleatoria nos
referimos, tambem denotamos a sua media por m e a variancia e o desvio padrao por 2 e ,
respectivamente.

22

Captulo 1: Teoria das Probabilidades

Proposi
c
ao 1.3.3 A vari
ancia de uma v.a. X verifica as seguintes propriedades:
i) Var(aX + b) = a2 Var(X), a, b R;
ii) Se X e Y s
ao independentes, ent
ao Var(X + Y ) =Var(X)+Var(Y );
iii) Var(X) = E(X 2 ) (E(X))2 (F
ormula de Koenig);
iv) Var(X) = 0 a R : P (X = a) = 1.
Notamos que da primeira propriedade se conclui que
V ar(aX) = a2 V ar(X), a R
V ar(X) = V ar(X)
V ar(X + b) = V ar(X), b R.
Alem disso a propriedade ii) e generalizavel a qualquer n
umero finito de variaveis aleatorias.
Os quantis de uma distribuic
ao, que passamos a definir, sao parametros que permitem
estudar em simult
aneo a localizac
ao e a concentracao dos valores assumidos por uma variavel
aleatoria.
Defini
c
ao 1.3.13 Seja p ]0, 1[. Dada uma vari
avel aleat
oria X, chamamos quantil de
probabilidade p da distribuic
ao de X a um n
umero Q(p) que verifica
lim F (x) p e
xQ(p)

lim

xQ(p)+

F (x) F (Q(p)) p .

Observamos que no caso em que existe um intervalo de valores x que verificam F (x) = p
qualquer um dos valores deste intervalo satisfaz a definicao anterior. Existem na literatura
varias convenc
oes adoptadas por diferentes autores no sentido de determinar Q(p) de forma
u
nica. Neste curso consideramos Q(p) igual ao ponto medio de tal intervalo. Um caso particular
interessante e o dos tres quartis da distribuicao de X e que correspondem aos casos em que
p toma os valores 1/4, 1/2 e 3/4. Os tres quartis sao denotados por Q1 , Q2 e Q3 e verificam
lim F (x) i/4 e F (Qi ) i/4, para i {1, 2, 3}.
xQ
i

Exemplo 1.3.7 Retomemos a vari


avel aleat
oria do exemplo 1.3.1. Neste caso como
F (0) = lim F (x) = 0.25
x1

qualquer valor do intervalo [0, 1[ serve para primeiro quartil. Assim, de acordo com a convenc
ao
referida acima consideramos Q1 = 0.5.
Similarmente, como
F (1) = lim F (x) = 0.75,
x2

qualquer valor do intervalo [1, 2[ serve para terceiro quartil pelo que consideramos Q3 = 1.5.
Mais, uma vez que lim F (x) = 0.25 < 0.5 e lim F (x) = F (1) = 0.75 > 0.5, conclumos que
x1

x1+

o segundo quartil da distribuic


ao de X e igual a 1.

23

1.3 - Variaveis aleatorias e distribuicoes

O segundo quartil e usualmente designado mediana de X ou da distribuicao de X, sendo


tambem denotado por M ed. A mediana de uma distribuicao e assim uma medida de localizac
ao
que, ao contr
ario da esperanca matematica, existe sempre.
Observamos o facto, inconveniente para o leitor, dos tres quartis possuirem duas notacoes,
nomeadamente Q(1/4), Q(1/2), Q(3/4) e Q1 , Q2 , Q3 , respectivamente. Acrescenta-se ainda que
a mediana e denotada por Q(1/2), Q2 e M ed.
Exerccio 1.3.1 Considere a func
ao

1/4
3/4
F (x) =

k/8

se
se
se
se
se

x<1
x [1, 2)
x [2, 3) .
x [3, 4)
x4

1. Determine k por forma que F seja a func


ao de distribuic
ao de uma vari
avel aleat
oria
discreta X de suporte:
i) {1, 2, 3, 4};

ii) {1, 2, 4}

iii) {1, 2, 3}.

2. Calcule P (2 < X 4) e P (2 X 4).


Exerccio 1.3.2 A func
ao de distribuic
ao de uma vari
avel aleat
oria X e

0 se x < 0

0.5 se 0 x < 1

0.6 se 1 x < 2
F (x) =
0.8 se 2 x < 3

0.9 se 3 x < 3.5

1 se x 3.5

Justifique que a vari


avel aleat
oria X e discreta e construa a sua func
ao de probabilidade.
Exerccio 1.3.3 Na figura seguinte est
ao representados os gr
aficos das func
oes de distribuic
ao das vari
aveis aleat
orias X e Y , respectivamente.
1

0.5
0.3

-1

0.1

0.2

-1

1. Justifique que ambas as v.a.s tem distribuic


oes discretas. Indique SX e SY .
2. Calcule P (X < 2) e P (Y < 2).

24

Captulo 1: Teoria das Probabilidades

3. Calcule E(X) e V ar(X).


Exerccio 1.3.4 Considere o seguinte esboco do gr
afico de uma func
ao de distribuic
ao.
1
0.8

6
q
b

0.4
0.25 q
c

q
b

b
-

1 1.5 2

1. Justifique que se trata de uma func


ao de distribuic
ao correspondente a uma vari
avel
aleat
oria X discreta.
2. Determine P (X > 2), P (1 < X 3) e P (1 < X 3|X 2).
3. Calcule E(X), V ar(X), E(2 + X) e V ar(3 X).
Exerccio 1.3.5 Considere a vari
avel aleat
oria discreta X para a qual se tem

x, x = 1, 2, 3
P (X = x) =
,
0,
caso contr
ario
sendo a uma constante real.
1. Determine .
2. Determine a func
ao de distribuic
ao de X.
3. Calcule o valor esperado e a vari
ancia de X.
Exerccio 1.3.6 Considere as vari
aveis aleat
orias discretas X e Y , com suportes SX =
{1, 0, 1} e SY = {1, 0, 1, 2}. Considere a tabela seguinte onde se apresentam as probabilidades do tipo P (X = a, Y = b), para a SX e b SY .
Y

-1
0
1

-1
0.1
0.15
0.05

0
0.15
0
0.05

1
0
0.1
0

2
0.1
0.2
0.1

Calcule P (Y = k|X = 1), P (Y = k|X = 0) e P (Y = k|X = 1), para todos os valores de k


em SY .
Exerccio 1.3.7 O n
umero de acidentes de trabalho por semana numa obra e representado
por uma vari
avel aleat
oria X com distribuic
ao caracterizada por P (X = 0) = 0.97, P (X = 1) =
0.02, P (X = 2) = 0.01. A vari
avel aleat
oria que representa o n
umero de acidentes de trabalho
durante uma quinzena e Y = X1 + X2 , onde as vari
aveis X1 e X2 tem a mesma distribuica
o
que X e s
ao independentes. Qual a distribuic
ao de Y ?

1.3 - Variaveis aleatorias e distribuicoes

25

Exerccio 1.3.8 Um indivduo disp


oe de determinada quantia, C > 0, para investir num
neg
ocio especulativo que lhe permite, em cada ano, duplicar a sua fortuna (o que ocorre com
probabilidade p > 0.5) ou perde-la na totalidade (o que ocorre com probabilidade 1p). Suponha
que o sucesso de cada investimento e independente do sucesso de todos os outros investimentos.
Seja Xn a vari
avel aleat
oria que representa a fortuna que o indivduo acumulou com este
neg
ocio, ao fim de n anos, incluindo o valor inicial C. Prove que P (Xn = 2n C) = pn , n IN.
Exerccio 1.3.9 O n
umero de horas de funcionamento de certo tipo de componente electr
onica
e descrito por uma vari
avel aleat
oria X, contnua, com densidade

x 100

0
f (x) =

100
x > 100
x2
1. Construa a func
ao de distribuic
ao de X.

2. Qual a probabilidade de a componente n


ao funcionar mais do que 200 horas?
3. Mostre que X n
ao admite esperanca matem
atica.
Exerccio 1.3.10 Uma vari
avel aleat
oria X tem densidade f (x) = c(2x x2 )1I[0,2] (x).
Calcule o valor de c e P (0.5 < X < 1.5).
Exerccio 1.3.11 Uma certa liga met
alica contem uma percentagem de chumbo X, que
pode ser considerada como uma vari
avel aleat
oria com func
ao de densidade de probabilidade
dada por
3 5
5 10 x(100 x), 0 x 100;
fX (x) =

0,
caso contr
ario.

Suponha que L, o lucro obtido na venda desta liga (por unidade de peso), depende da percentagem de chumbo, atraves da relac
ao: L = C1 + C2 X. Calcule o valor esperado do lucro por
unidade de peso.

Exerccio 1.3.12 O peso, em Kg, de uma peca e descrito por uma vari
avel aleat
oria com
densidade

x8
se 8 x 9

10 x
se 9 < x 10
f (x) =
.

0
se x < 8 ou se x > 10
1. Calcule o peso medio das pecas e o desvio padr
ao que lhe est
a associado.

2. Cada peca e vendida por 1.7 euros. A todos os compradores que adquiram um peca
pesando menos do que 8.25 Kg e devolvido o seu dinheiro. Alem disso, o custo de produca
o
de cada peca e dado por 0.3 + x/11, onde x e o peso da peca produzida. Qual o lucro
medio por peca?

26

Captulo 1: Teoria das Probabilidades

Exerccio 1.3.13 A fracc


ao de pessoas abordadas que responde a uma sondagem telef
onica
e uma vari
avel aleat
oria X com a seguinte func
ao densidade:

k e|x0.5| x [0, 1]
f (x) =
.

0
x 6 [0, 1]
1. Determine o valor de k.

2. Mostre que a func


ao de distribuic
ao de X e dada por

0
x<0

k e(1 ex )
0 x 21
.
F (x) =
1
12 + k(ex 2 1) 21 < x < 1

1
x1

3. Calcule P (2 < X < 0.4), P (0.4 X 0.9) e P (0.4 X 0.9|X 0.4).


4. Quanto e que a empresa que realiza as sondagens espera pagar aos seus funcion
arios por
cada 100 telefonemas efectuados, se eles receberem 0.50 euros por cada resposta obtida?
5. Determine o desvio padr
ao do valor a receber por um funcion
ario que realize 100 telefonemas.
Exerccio 1.3.14 Num armazem encontra-se um lote de 10000 latas de um certo produto
alimentar que est
a a ser preparado para ser distribudo. Dessas latas 500 j
a ultrapassaram o
efectuada uma inspecc
prazo de validade. E
ao sobre uma amostra de 15 embalagens escolhidas
ao acaso sem reposic
ao. A inspecc
ao rejeita o lote se forem encontradas mais do que duas latas
fora do prazo de validade nessa amostra. Qual a probabilidade de rejeica
o do lote?
Exerccio 1.3.15 Num lote de 500 pecas existem 50 defeituosas. Desse lote retira-se ao
acaso e sem reposic
ao uma amostra. O lote e rejeitado se tal amostra incluir mais do que duas
pecas defeituosas. Calcule
1. A probabilidade de rejeic
ao do lote se a amostra tiver dimens
ao 10;
2. A dimens
ao que a amostra deve ter para que a probabilidade de rejeic
ao seja inferior a
0.05;
3. Se existirem 100 lotes nas condic
oes indicadas na alnea 1., qual o n
umero esperado de
lotes rejeitados?

1.3.4

Distribuic
oes mais usadas em Estatstica

I- Distribui
c
ao de Bernoulli
As variaveis aleatorias com distribuicao ou lei de Bernoulli estao quase sempre relacionadas com experiencias dicotomicas, sendo por isso variaveis que assumem apenas dois valores.
Formalmente convencionamos que tais valores sao 0 e 1.

27

1.3 - Variaveis aleatorias e distribuicoes

Concretamente, dizemos que uma variavel aleatoria X tem distribuicao de Bernoulli ou que
segue a lei de Bernoulli de parametro p , e escreve-se X B(p), se X assume apenas os dois
valores 0 e 1, com P (X = 1) = p. Tem-se E(X) = p e V ar(X) = p(1 p).
Nas aplicac
oes mais comuns, dada uma experiencia aleatoria e um acontecimento A cuja
probabilidade p = P (A) conhecemos, definimos a variavel aleatoria X que assume o valor 1 se,
ao realizar a experiencia, A ocorre e que assume o valor 0 em caso contrario.
Exemplo 1.3.8 Consideremos a experiencia aleat
oria que consiste no lancamento de um
dado equilibrado, com as faces numeradas de 1 a 6, e A o acontecimento sada de face 2. A
vari
avel aleat
oria que assume o valor 1 se A ocorre e 0 se A n
ao ocorre tem distribuic
ao de
Bernoulli. Uma vez que P (X = 1) = P (A) = 1/6, obtemos E(X) = 1/6 e V ar(X) = 5/36.
` experiencias que apresentam apenas dois resultados possveis damos o nome de exAs
periencias de Bernoulli.
II- Distribui
c
ao Binomial
Consideremos de novo uma experiencia aleatoria e um acontecimento A que lhe esta associado, com p = P (A) conhecido.
Suponhamos que realizamos a experiencia r vezes e que estas realizacoes diferentes sao
independentes umas das outras.
Denotemos por X a vari
avel aleatoria que representa o n
umero de vezes que o acontecimento
A ocorre nas r realizac
oes da experiencia. Nestas condicoes, dizemos que X tem distribuic
ao
Binomial de parametros r e p, escreve-se X B(r, p) e tem-se SX = {0, 1, 2, ..., r} e P (X =
k) = Ckr pk (1 p)rk , para k SX .
Proposi
c
ao 1.3.4 Se X1 , X2 , ..., Xr s
ao vari
aveis aleat
orias independentes com distribuic
ao
de Bernoulli de par
ametro p, ent
ao X1 + X2 + ... + Xr B(r, p).
As propriedades da esperanca matematica e da variancia ja apresentadas e esta u
ltima
proposicao, permitem-nos concluir que E(X) = rp e que V ar(X) = rp(1 p).
Exemplo 1.3.9 O n
umero de caras obtidas ao lancar uma moeda equilibrada dez vezes e
uma vari
avel aleat
oria com distribuica
o B(10, 1/2).
Exemplo 1.3.10 Uma companhia aerea observou que a probabilidade de um passageiro
com bilhete n
ao comparecer ao v
oo e igual a 0.05. Consequentemente decidiu passar a vender
52 bilhetes para cada avi
ao com 50 lugares. Qual a probabilidade de, num dado avi
ao, haver
lugar para todos os passageiros que se apresentarem ao v
oo?
Seja X a vari
avel aleat
oria que representa o n
umero de passageiros que n
ao comparecem
ao v
oo de entre os 52 que possuem bilhete. Nestas condic
oes X B(52, 0.05) e SX =
{0, 1, 2, ..., 52}.
Atendendo a que haver lugar para todos significa que no mnimo n
ao comparecerem
duas pessoas, vamos calcular P (X 2). Ora
P (X 2) = 1 P (X < 2) = 1 (P (X = 0) + P (X = 1))

= 1 C052 0.050 0.9552 + C152 0.051 0.9551


1 (0.069 + 0.190) = 0.741.

28

Captulo 1: Teoria das Probabilidades

III- Distribui
c
ao Geom
etrica
Seja A um acontecimento associado a uma experiencia aleatoria, com p = P (A) conhecido.
Suponhamos que e possvel realizar a experiencia indefinidamente sendo estas realizacoes
independentes umas das outras.
A variavel aleatoria X que representa o n
umero de vezes que e preciso realizar a experiencia
ate que o acontecimento A ocorra pela primeira vez tem distribuicao Geometrica de parametro
p. Escreve-se X G(p).
Neste caso, tem-se SX = IN e P (X = k) = (1 p)k1 p, para k IN.
.
Tem-se ainda E(X) = 1/p e V ar(X) = 1p
p2
Exemplo 1.3.11 Num armazem s
ao vendidas torneiras de v
arias marcas incluindo a sua
pr
opria marca A. Seja Y a vari
avel aleat
oria que representa o n
umero de clientes que compram
torneiras ate surgir o primeiro (inclusive) que opte por uma torneira da marca A. Sabendo que
a probabilidade de um cliente que compra torneiras escolher a marca A e 0.05, calculemos
P (Y 3).
A vari
avel aleat
oria Y tem distribuic
ao geometrica de par
ametro p = 0.05. Assim
P (Y 3) = 1 P (Y 2)
= 1 (P (Y = 1) + P (Y = 2))
= 1 (0.05 + 0.95 0.05) = 0.9025.
Exemplo 1.3.12 Uma m
aquina produz pecas que s
ao defeituosas com probabilidade 0.02.
Qual o n
umero medio de pecas sem defeito que ser
ao produzidas consecutivamente?
Seja X a vari
avel aleat
oria que representa o n
umero de pecas que a m
aquina produz consecutivamente sem defeito. A vari
avel X + 1 tem distribuic
ao (ou lei) Geometrica de par
ametro
0.02, tendo-se, consequentemente, E(X + 1) = 1/0.02 = 50. Assim E(X) = 49.

IV- Distribui
c
ao uniforme discreta
Uma vari
avel aleatoria X tem distribuicao ou lei uniforme sobre {x1 , x2 , ..., xn } se SX =
{x1 , x2 , ..., xn } e P (X = xi ) = n1 , xi SX . Esta lei e denotada por U ({x1 , , xn }).
Tem-se
n
n
1X
1X 2
E(X) =
xi e V ar(X) =
xi (E(X))2 .
n
n
i=1

i=1

Exemplo 1.3.13 Consideremos a experiencia aleat


oria que consiste no lancamento de um
dado equilibrado, com as faces numeradas de 1 a 6. Seja X a vari
avel aleat
oria que representa
o valor da face que fica voltada para cima. Nestas circunst
ancias X tem distribuic
ao uniforme
discreta sobre {1, 2, , 6} com P (X = k) = 1/6, para k {1, 2, , 6}.
V- Distribui
c
ao de Poisson
As vari
aveis aleatorias com distribuicao de Poisson (ou variaveis aleatorias de Poisson)
surgem em muitas aplicac
oes como, por exemplo, nos estudos de filas de espera quando se
pretende modelar o n
umero de chegadas num dado intervalo de tempo, previamente fixado. Este
tipo de variaveis aleatorias surge tambem nas situacoes em que se pretende estudar o n
umero

29

1.3 - Variaveis aleatorias e distribuicoes

de ocorrencias de um acontecimento raro, quando nao limitamos o n


umero de realizacoes da
experiencia.
Assim, com alguma regularidade, encontramos variaveis aleatorias com distribuicao de Poisson em estudos sobre a emissao de partculas por um corpo radioactivo num dado perodo de
tempo, em estatsticas de acidentes ou mesmo quando se estuda o n
umero de errus de dactilugrafiapor pagina de um texto.
Podemos tambem afirmar que o n
umero de bacterias encontradas numa dada cultura, o
n
umero de leituras erradas da pluviosidade, o n
umero de clientes de um armazem que se mostram insatisfeitos com determinado produto sao, em muitas circunstancias, variaveis aleatorias
com distribuic
ao ou lei de Poisson.
Dizemos que uma vari
avel aleatoria X tem distribuicao ou lei de Poisson de parametro ,
com > 0, e escreve-se X P(), se SX = IN0 e
P (X = k) = e

k
,
k!

para k IN0 . Prova-se que E(X) = V ar(X) = .


Exemplo 1.3.14 O n
umero de partculas emitidas, num perodo de 20 segundos, por determinada fonte radioactiva e uma vari
avel aleat
oria real X com lei de Poisson. Sabendo que
E(X 2 ) = 6 determinemos P (1 < X 3).
Ora, como para qualquer vari
avel se tem V ar(X) = E(X 2 ) (E(X))2 e para uma vari
avel
aleat
oria de Poisson V ar(X) = E(X) = , obtemos
V ar(X) = E(X 2 ) (E(X))2 = 6 2 = 2 = 3.
Como > 0 conclumos que = 2. Ent
ao
23
22
+ e2 = 0.4511.
2!
3!
Suponhamos agora que a emiss
ao de partculas em diferentes perodos de 20 segundos ocorre
de forma independente. Sabendo que foi observada a emiss
ao de partculas durante 5 perodos
de 20 segundos, calculemos a probabilidade de em pelo menos um desses 5 perodos serem
emitidas exactamente duas partculas.
Neste caso, temos 5 experiencias de Bernoulli onde o sucesso corresponde ao acontecimento
que ocorre quando, num perodo de 20 segundos, s
ao emitidas exactamente duas partculas. O
2
sucesso associado a estas experiencias tem probabilidade p = P (X = 2) = e2 22! = 0.2706.
Mais, atendendo `
a independencia referida acima, a vari
avel aleat
oria Y que conta o n
umero
de perodos de 20 segundos, nestes 5, em que s
ao emitidas exactamente 2 partculas (em que
ocorre sucesso), tem distribuic
ao B(5, 0.2706). Ent
ao h
a que calcular
P (1 < X 3) = P (X = 2) + P (X = 3) = e2

P (Y 1) = 1 P (Y = 0) = 1 C05 0.27060 (1 0.2706)5


= 1 (1 0.2706)5 = 0.7935

Consideremos ainda neste exemplo a vari


avel aleat
oria W que representa o n
umero de
perodos consecutivos de 20 segundos ate que ocorra um em que sejam emitidas exactamente
2 partculas (ate que ocorra sucesso). Calculemos P (W 3). Atendendo a que W tem distribuic
ao geometrica de par
ametro 0.2706, tem-se
P (W 3) = 1 P (W 2) = 1 (P (W = 1) + P (W = 2))
= 1 0.2706 0.7294 0.2706 = 0.5320.

30

Captulo 1: Teoria das Probabilidades

Proposi
c
ao 1.3.5 (Estabilidade da distribuic
ao de Poisson) Se X1 , X2 , , Xn s
ao vari
aveis
aleat
orias de Poisson, independentes, de par
ametros 1 , 2 , , n , respectivamente, ent
ao
X1 + X2 + + Xn P(1 + 2 + + n ).
Exemplo 1.3.15 Seja X a vari
avel aleat
oria que representa o n
umero de bacterias Es3
cherichia Coli existentes num cm de
agua. Suponha que X tem distribuic
ao de Poisson e que
a probabilidade de n
ao haver bacterias num cm3 de
agua e igual a 0.05.
Calculemos a probabilidade de existirem pelo menos duas bacterias num cm3 de
agua.
Uma vez que X P() e P (X = 0) = 0.05 = e conclumos que = ln 0.05 o que
equivale a dizer que = ln 0.051 3. Assim
P (X 2) = 1 P (X< 2) = 1 
P (X = 0) P (X = 1)
1
0
3
3
= 1 0.2 = 0.8.
+
= 1 0.05
0!
1!
Calculemos agora a probabilidade de que numa amostra de dois cm3 de
agua existam quando
muito 3 bacterias.
Sejam X1 e X2 as vari
aveis aleat
orias que representam o n
umero de bacterias em cada um
dos cm3 de
agua e Y = X1 + X2 a vari
avel aleat
oria que representa, obviamente, o n
umero de
3
bacterias em dois cm de
agua.
Supondo X1 e X2 independentes, podemos afirmar que Y P(3 + 3). Ent
ao
P (Y 3) = P (Y = 0) + P (Y = 1) + P (Y = 2) + P (Y = 3) = e6 61 0.151.
VI - Distribui
c
ao uniforme contnua
Como ja foi dito no exemplo 1.3.2 uma variavel aleatoria tem distribuicao ou lei uniforme
sobre [a, b], escrevendo-se X U ([a, b]), se tem densidade dada por

se x < a
0
1
se a x b
f (x) =
ba
0
se x > b
e, consequentemente, func
ao de distribuicao com expressao analtica

se x < a
0
xa
se a x b .
F (x) =
ba
1
se x > b.
Prova-se que E(X) =

a+b
2

e V ar(X) =

(ba)2
12 .

Notemos que a intervalos contidos em [a, b] com amplitudes iguais correspondem probabilidades iguais.
Um exemplo de uma vari
avel aleatoria com distribuicao uniforme e a que representa um
n
umero real escolhido ao acaso num intervalo limitado [a, b].

31

1.3 - Variaveis aleatorias e distribuicoes

VII - Distribui
c
ao exponencial
Em estudos de filas de espera surge a necessidade de considerar a variavel aleatoria que
representa a amplitude do intervalo de tempo que decorre entre duas chegadas consecutivas.
Em muitas das aplicac
oes mais comuns, sob algumas restricoes, esta variavel aleatoria segue
uma distribuic
ao ou lei exponencial.
Nos estudos de fiabilidade de maquinas, quando se avalia o tempo de funcionamento sem
falhas, ou em analise de sobrevivencia, quando se pretende avaliar o tempo de sobrevivencia
de um doente sujeito a determinado tratamento, com alguma regularidade e sob circunstancias
muito especiais, surgem tambem variaveis aleatorias com lei exponencial.
Uma vari
avel aleatoria X tem distribuicao ou lei exponencial de parametros > 0 e IR,
e escreve-se X E(, ), se a sua densidade e dada por

e(x) se x
f (x) =
.
0
se x <
O esboco do grafico de f e apresentado de seguida.

A func
ao de distribuic
ao de X e definida por

se
0
F (x) =

1 e(x) se

x<
x

cujo esboco do grafico apresentamos de seguida.


1

Observemos que se X E(, ) entao X E(, 0). Por outro lado no exemplo 1.3.4
provamos que uma vari
avel aleatoria com distribuicao E(, 0) tem media igual a 1 . Assim,
para X E(, ), tem-se
E(X) = E(X) + = E(X ) + =
Mais, prova-se que V ar(X) = 1/2 .

1
+ .

32

Captulo 1: Teoria das Probabilidades

Exemplo 1.3.16 Seja X uma vari


avel aleat
oria com distribuic
ao E(2, 0). Vamos calcular
P (X > 3.5). Tem-se
Z +

t
P (X > 3.5) =
2e2x dx = lim e2x 3.5 = e7 .
3.5

t+

VIII - Distribui
c
ao normal
A distribuic
ao normal, de Gauss ou gaussiana, e talvez a mais importante distribuicao
contnua. De facto, in
umeras sao as variaveis aleatorias que obedecem a esta lei e que sao
usadas na criac
ao de modelos que descrevem exacta ou aproximadamente fenomenos fsicos e
biometricos.
Do ponto de vista das aplicac
oes, tem-se provado que muitos atributos observaveis de certas
populacoes podem ser bem representados por variaveis com distribuicao de Gauss. Por exemplo,
esta distribuic
ao pode constituir uma boa aproximacao para as distribuicoes das alturas e dos
pesos de populac
oes razoavelmente homogeneas, bem como para a distribuicao dos erros de
medida de determinadas grandezas fsicas.
Do ponto de vista teorico, justifica-se a importancia da distribuicao normal pelo facto de
ser uma boa aproximac
ao para a lei da soma de variaveis independentes e ainda pelas suas
excelentes propriedades que lhe conferem uma enorme tratabilidade matematica.
Uma vari
avel aleatoria X tem distribuicao ou lei normal de parametros m e 2 , escreve-se
X N (m, 2 ), se a sua densidade e da forma
f (x) =

1
1 xm 2
e 2 ( ) , x IR.
2

Apresentamos de seguida o esboco do grafico da densidade de uma lei N (0, 1).

-3

Proposi
c
ao 1.3.6 Propriedades da distribuica
o normal.
1. Se X N (m, 2 ) ent
ao Z =

Xm

N (0, 1).

2. Se Z N (0, 1) ent
ao X = Z + m N (m, 2 ).
3. Se Z N (0, 1) ent
ao

33

1.3 - Variaveis aleatorias e distribuicoes

(a) FZ (x) = 1 FZ (x), x IR,


(b) P (x Z 0) = P (0 Z x), x IR,
4. (Estabilidade da lei normal) Se X1 , X2 , , Xn s
ao vari
aveis aleat
orias independentes
com distribuic
ao normal de medias m1 , m2 , , mn e vari
ancias 12 , 22 , , n2 , respectivamente, ent
ao X1 + X2 + + Xn tambem tem uma distribuic
ao normal com media
igual `
a soma das medias e vari
ancia igual `
a soma das vari
ancias.

Da estabilidade da lei normal e das propriedades da media e da variancia decorre imediatamente que se X1 , X2 , , Xn sao variaveis aleatorias independentes com distribuicao normal
de medias m1 , m2 , , mn e vari
ancias 12 , 22 , , n2 , respectivamente, entao, para quaisquer
reais b, a1 , a2 , ..., an , a vari
avel aleatoria
b + a1 X1 + a2 X2 + + an Xn
tambem tem uma distribuic
ao normal com media b + a1 m1 + a2 m2 + + an mn e variancia
2
2
2
2
igual a a1 1 + a2 2 + + a2n n2 . Na notacao usual escrevemos
n
X
i=1

a i Xi N

n
X
i=1

a i mi ,

n
X

a2i i2

i=1

"

Observa
c
ao 1.3.2 Denotando por FX e por FZ as func
oes de distribuic
ao de X e de Z,
respectivamente, observamos que da primeira propriedade decorre

FX (x) = P (X x) = P

X m
xm

= FZ

xm

As propriedades que acabamos de apresentar, para alem de tornarem a lei normal bastante
atraente para estudos teoricos, como ja dissemos e confirmamos adiante, sao obviamente u
teis
em qualquer aplicac
ao pratica. Com efeito, sempre que dispomos de uma variavel aleatoria com
distribuicao simetrica ou aproximadamente simetrica, devido `a simplicidade deste modelo, e
usual comecar por ajustar uma distribuicao normal. No caso da media nao ser 0 ou da variancia
nao ser igual a 1 podemos sempre usar a transformacao apresentada na observacao 1.3.2 e
determinar probabilidades ou quantis usando sempre uma tabela de probabilidades associadas
`a lei N (0, 1). Apresentamos seguidamente uma das versoes possveis para a referida tabela.
Trata-se da tabela da func
ao de distribuicao da lei N (0, 1).

34

Captulo 1: Teoria das Probabilidades

Tabela da func
ao de distribuicao da lei N (0, 1)

P (Z z(p)) = p
z(p)

z(p) = a + b
a b
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0

0,0
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594
0,84134
0,86433
0,88493
0,90320
0,91924
0,93319
0,94520
0,95543
0,96407
0,97128
0,97725
0,98214
0,98610
0,98928
0,99180
0,99379
0,99534
0,99653
0,99744
0,99813
0,99865

0,01

0,02

0,03

0,04

0,05

0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859
0,84375
0,86650
0,88686
0,90490
0,92073
0,93448
0,94630
0,95637
0,96485
0,97193
0,97778
0,98257
0,98645
0,98956
0,99202
0,99396
0,99547
0,99664
0,99752
0,99819
0,99869

0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121
0,84614
0,86864
0,88877
0,90658
0,92220
0,93574
0,94738
0,95728
0,96562
0,97257
0,97831
0,98300
0,98679
0,98983
0,99224
0,99413
0,99560
0,99674
0,99760
0,99825
0,99874

0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381
0,84849
0,87076
0,89065
0,90824
0,92364
0,93699
0,94845
0,95818
0,96638
0,97320
0,97882
0,98341
0,98713
0,99010
0,99245
0,99430
0,99573
0,99683
0,99767
0,99831
0,99878

0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639
0,85083
0,87286
0,89251
0,90988
0,92507
0,93822
0,94950
0,95907
0,96712
0,97381
0,97932
0,98382
0,98745
0,99036
0,99266
0,99446
0,99585
0,99693
0,99774
0,99836
0,99882

0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894
0,85314
0,87493
0,89435
0,91149
0,92647
0,93943
0,95053
0,95994
0,96784
0,97441
0,97982
0,98422
0,98778
0,99061
0,99286
0,99461
0,99598
0,99702
0,99781
0,99841
0,99886

0,06

0,07

0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147
0,85543
0,87698
0,89617
0,91309
0,92785
0,94062
0,95154
0,96080
0,96856
0,97500
0,98030
0,98461
0,98809
0,99086
0,99305
0,99477
0,99609
0,99711
0,99788
0,99846
0,99889

0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398
0,85769
0,87900
0,89796
0,91466
0,92922
0,94179
0,95254
0,96164
0,96926
0,97558
0,98077
0,98500
0,98840
0,99111
0,99324
0,99492
0,99621
0,99720
0,99795
0,99851
0,99893

0,08

0,09

0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646
0,85993
0,88100
0,89973
0,91621
0,93056
0,94295
0,95352
0,96246
0,96995
0,97615
0,98124
0,98537
0,98870
0,99134
0,99343
0,99506
0,99632
0,99728
0,99801
0,99856
0,99896

0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891
0,86214
0,88298
0,90147
0,91774
0,93189
0,94408
0,95449
0,96327
0,97062
0,97670
0,98169
0,98574
0,98899
0,99158
0,99361
0,99520
0,99643
0,99736
0,99807
0,99861
0,99900

35

1.3 - Variaveis aleatorias e distribuicoes

Exemplo 1.3.17 Uma ponte foi projectada para suportar uma sobrecarga total de 1530
KN. Estudos estatsticos permitiram concluir que a vari
avel aleat
oria que representa o peso
de autom
oveis ligeiros tem distribuic
ao normal de media 15 KN e desvio padr
ao 1.5 KN.
Se, em determinado momento, est
ao sobre a ponte 100 autom
oveis ligeiros, determinemos a
probabilidade de serem causados danos na sua estrutura, isto e, do peso total dos autom
oveis
exceder a sobrecarga de 1530 KN.
Denotemos por Xi a vari
avel aleat
oria que representa o peso do autom
ovel i, para i =
100
X
Xi representa o peso total dos 100 autom
oveis, ser
ao
1, ..., 100. Como a vari
avel aleat
oria
i=1

100
X
Xi > 1530}. Ora, usando
causados danos na estrutura da ponte se ocorrer o acontecimento {
i=1

a estabilidade da lei normal, sabemos que


100
X
i=1

ou seja

100
X
i=1

Xi N 100 15, 100 1.52

Xi N (1500, 225) o que equivale a Z =

Ent
ao

! 100
X
i=1

"

Xi > 1530

= P

1
15

! 100
X
i=1

1
15

! 100
X
i=1

"

Xi 1500

>

Xi 1500

15301500
15

"

N (0, 1).

"

= P (Z > 2) = 1 P (Z 2) = 1 0.97725 = 0.02275.

No que se segue denotamos por z(p) o quantil de probabilidade p da lei N (0, 1). Por outras
palavras, denotamos por z(p) o n
umero real que verifica P (Z z(p)) = p, onde Z N (0, 1).
Devemos observar que a func
ao INV.NORM do EXCEL(1 ) permite determinar o inverso
da funcao de distribuic
ao de uma variavel aleatoria com lei N (m, 2 ), para quaisquer m e 2 .
Concretamente, o valor real x onde a funcao de distribuicao assume o valor p e determinado
por x=INV.NORM(p; m; ).(2 ) Por exemplo, para X N (3, 4) o valor de x onde a funcao de
distribuicao e igual a 0.7 e determinado por x=INV.NORM(0.7;3;2)=4.0488.
Deste modo, o valor de z(p), para qualquer valor de p, pode ser encontrado usando a func
ao
INV.NORM do Excel, pois z(p) e o n
umero real para o qual a funcao de distribuicao da lei
N (0, 1) e igual a p. Concretamente, tem-se z(p) =INV.NORM(p; 0; 1). Por exemplo z0.975 =
INV.NORM(0.975; 0; 1) = 1.959.
Exerccio 1.3.16 A informaca
o obtida em experiencias anteriores diz-nos que a probabilidade de um certo pluvi
ometro fornecer uma leitura errada e de 0.006. Suponha que em
determinado perodo de tempo a partir deste pluvi
ometro podemos obter 48 leituras. Calcule a
probabilidade de se obter, nesse perodo de tempo,
1. exactamente tres leituras erradas;
1

Ou NORM.INV em algumas vers


oes do EXCEL.
E de notar que se colocam media seguida do desvio padr
ao e n
ao vari
ancia como na notac
ao usual da lei
normal.
2

36

Captulo 1: Teoria das Probabilidades

2. pelo menos uma leitura errada;


3. mais de duas leituras erradas.
Exerccio 1.3.17 Uma determinada praga atacou uma unidade agrcola tendo contaminado tres quartos da sua produc
ao de mac
a. Considere 4 mac
as escolhidas ao acaso. Determine:
1. a probabilidade de todas elas terem sido contaminadas;
2. a probabilidade de nenhuma delas ter sido contaminada;
3. a probabilidade de terem sido contaminadas menos de 3 mac
as.
Exerccio 1.3.18 Denote por X a v.a. que representa o n
umero de dias por ano em que
ocorrem caudais elevados (acima de um certo nvel elevado) numa secc
ao do rio Mondego. A
informaca
o obtida a partir de estudos anteriores permitiu-nos considerar que X segue uma
distribuica
o de Poisson de media 2.
1. Calcule a probabilidade de no pr
oximo ano ocorrerem caudais elevados naquela secca
o em
pelo menos tres dias.
2. Calcule a probabilidade de no pr
oximo ano n
ao ocorrerem caudais elevados naquela secca
o
do rio Mondego.
Exerccio 1.3.19 Num armazem, sabe-se que o n
umero de clientes atendidos em determinado intervalo de tempo e uma v.a. X `
a qual se pode ajustar uma distribuic
ao de Poisson
de par
ametro . Sabendo que P (X 1) = 0.3, determine e calcule P (X 2).
Exerccio 1.3.20 Numa empresa sabe-se que o n
umero de pecas com defeito produzidas
diariamente e uma vari
avel aleat
oria X com distribuic
ao de Poisson. Sabendo que P (X =
2) = 2P (X = 0), determine P (X 3).
Exerccio 1.3.21 Num armazem, sabe-se que o n
umero de clientes atendidos em determinado intervalo de tempo e uma vari
avel aleat
oria X `
a qual se pode ajustar uma distribuic
ao de
Poisson. Sabe-se tambem que a probabilidade de ser atendido pelo menos um cliente, naquele
intervalo de tempo, e o triplo da probabilidade de n
ao ser atendido qualquer cliente. Determine
E(X) e P (X 2).
Exerccio 1.3.22 Verifica-se que o n
umero de defeitos de um certo tipo, por m2 , na
pintura da chapa exterior de um autom
ovel, e bem descrito por uma vari
avel aleat
oria de
2
Poisson com par
ametro 0.5. A medida da
area total da chapa do autom
ovel e 8m . Admita
que os defeitos ocorrem independentemente uns dos outros.
1. Qual a probabilidade de um autom
ovel deste tipo n
ao conter qualquer defeito?
2. Qual a probabilidade de a
area total da chapa conter mais de 2 defeitos?
3. Se inspeccionar a chapa de 100 autom
oveis deste tipo, qual a probabilidade de quando
muito 3 destes n
ao apresentarem qualquer defeito?

1.3 - Variaveis aleatorias e distribuicoes

37

Exerccio 1.3.23 Se chegar `


a paragem do autocarro `
as 10.00 horas e souber que a v.a.
que descreve a hora de chegada deste e uniforme entre as 10.00 horas e as 10.30 horas, qual a
probabilidade de ter de esperar mais do que 12 minutos?
Exerccio 1.3.24 O n
umero de milhares de quil
ometros que um autom
ovel de determinado modelo percorre antes de ser retirado da circulaca
o pode ser representado por uma
vari
avel aleat
oria com distribuic
ao exponencial com par
ametro = 0.002, isto e, com densidade f (x) = 0.002 e0.002x 1I[0,+) (x), x IR.
Se adquirir um autom
ovel daquele modelo em segunda m
ao com pelo menos 50 000 quil
ometros,
qual a probabilidade de poder utiliz
a-lo durante pelo menos mais 100 000 quil
ometros?
Exerccio 1.3.25
1. Seja Z uma vari
avel aleat
oria com distribuic
ao N (0, 1). Sabendo
que P (0 Z 2.5) = 0.4938 e P (0 Z 0.8) = 0.2881 calcule i)P (2.5 Z 0),
ii)P (0.8 Z 0.8), iii)P (0.8 Z 2.5) e iv) P (0.8 Z 2.5).
2. Sendo X uma vari
avel aleat
oria com distribuic
ao N (5, 4), calcule i)P (0 X 5),
ii)P (1 X 9) e iii)P (9 X 10);
3. Sendo X uma vari
avel aleat
oria com distribuic
ao N (4, 9), calcule o valor de t tal que
i)P (X t) = 0.2033, ii)P (X > t) = 0.648, iii)P (X t) = 0.0025, e iv)P (|X 4|
3t) = 0.27366.
Exerccio 1.3.26 Seja X uma vari
avel aleat
oria com distribuic
ao normal de valor esperado 10 e vari
ancia 4, que representa o comprimento de uma barra de ferro. Suponha que a
barra e considerada n
ao defeituosa se X assumir valores no intervalo [8,12] e defeituosa caso
contr
ario. Qual a probabilidade de que uma barra n
ao seja defeituosa?
Exerccio 1.3.27 O comprimento das pecas produzidas por uma m
aquina e uma vari
avel
aleat
oria normal com valor esperado m (em mm) e vari
ancia 2 (em mm2 ). Uma peca e
defeituosa se o seu comprimento diferir do valor esperado mais do que . Sabe-se que 50%
das pecas produzidas tem comprimento inferior a 2.5 mm e 47.5% das pecas produzidas tem
comprimento entre 2.5 mm e 3.42 mm.
Determine m e e determine a probabilidade de que uma peca seja n
ao defeituosa.
Exerccio 1.3.28 O enchimento de sacos de cimento e efectuado de forma automatizada,
fazendo com que o peso efectivo de cada saco varie um pouco. Assim, para sacos com peso
anunciado 50 Kg verificou-se que o peso efectivo e descrito por uma vari
avel aleat
oria com
distribuic
ao normal de media 50.2 e vari
ancia 0.24.
1. Qual a probabilidade de um saco de cimento pesar menos do que 51 Kg?
2. Uma determinada empresa de construc
ao civil, ao receber uma encomenda daqueles sacos
de cimento, por uma quest
ao de controlo, efectua uma pesagem em grupos de 5 sacos.
(a) Qual a probabilidade de, num grupo de 5 sacos, haver pelo menos 3 pesando mais
do que 51 Kg?
(b) Qual a distribuic
ao da vari
avel aleat
oria que representa o peso de um grupo de 5
sacos?

38

Captulo 1: Teoria das Probabilidades

(c) Se se recusar um grupo de 5 sacos caso o seu peso seja inferior a 248 Kg, qual a
probabilidade de este ser recusado?
Exerccio 1.3.29 Um grupo de adolescentes, constitudo por 12 raparigas e 6 rapazes,
entra num elevador com uma carga m
axima de 900 kg. Suponha que os pesos (expressos em
quilogramas, kg) dos adolescentes podem ser representados por vari
aveis aleat
orias reais independentes e gaussianas, de media 50 kg e de desvio padr
ao 5 kg no caso das raparigas, e de
media 60 kg e de desvio padr
ao 10 kg no caso dos rapazes.
1. Mostre que o peso total do referido grupo e uma vari
avel aleat
oria real gaussiana de media
960 kg e de desvio padr
ao 30 kg.
2. Calcule a probabilidade de, nestas condic
oes, ser excedida a carga m
axima do elevador.
Exerccio 1.3.30 Uma empresa comercializa tintas, vernizes, colas e produtos afins. Sabese que as vari
aveis aleat
orias que representam o lucro mensal da venda de tintas, vernizes e
colas possuem leis N (10, 16), N (8, 8) e N (3, 1), respectivamente. Calcule a probabildade de o
lucro mensal em colas e vernizes exceder o de tintas.

IX - Distribui
c
ao do qui-quadrado
Consideremos n vari
aveis aleatorias independentes X1 ,..., Xn , todas com lei N (0, 1).
A variavel aleatoria
n
X
Xi2
Un =
i=1

segue a distribuic
ao ou lei do qui-quadrado com n graus de liberdade, denotada por Xn2 . Nestas
condicoes escrevemos Un Xn2 .
A distribuic
ao Xn2 e contnua e uma variavel aleatoria com distribuicao Xn2 assume apenas
valores positivos. Para esta vari
avel aleatoria tem-se
E(Un ) = n

Var(Un ) = 2n.

Na figura seguinte apresentamos alguns esbocos de graficos da funcao densidade da lei do


qui-quadrado para diferentes graus de liberdade.

10

15

20

O quantil de probabilidade p da lei 2m sera denotado por m (p) e, para alguns valores
particulares de p e de m pode ser consultado na tabela que apresentamos de seguida.
O valor do quantil m (p), para qualquer valor de m e de p, pode ser encontrado usando
a funcao INV.CHI do Excel(3 ). Concretamente, tem-se m (p) = IN V.CHI(1 p; m). Por
exemplo 9 (0, 97) = IN V.CHI(0, 03; 9) = 18.4796.
3

Ou CHI.INV em algumas vers


oes do EXCEL.

39

1.3 - Variaveis aleatorias e distribuicoes


Tabela de quantis da lei 2m

m (p)
V 2m

m
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

P (V m (p)) = p

0,999

0,995

0,99

0,98

p
0,975

0,95

0,05

0,025

0,02

0,01

10,82756
13,81551
16,26623
18,46682
20,51500
22,45774
24,32188
26,12448
27,87716
29,58829
31,26413
32,90949
34,52817
36,12327
37,69729
39,25235
40,79022
42,31239
43,82019
45,31474
46,79704
48,26794
49,72823
51,17859
52,61965
54,05196
55,47602
56,89228
58,30117
59,70306
61,09831
62,48722
63,87009
65,24722
66,61883

7,87944
10,59663
12,83815
14,86025
16,74960
18,54758
20,27774
21,95495
23,58935
25,18818
26,75685
28,29951
29,81947
31,31935
32,80132
34,26719
35,71847
37,15645
38,58226
39,99685
41,40106
42,79565
44,18127
45,55851
46,92789
48,28988
49,64491
50,99337
52,33562
53,67196
55,00270
56,32811
57,64844
58,96392
60,27477

6,63489
9,21034
11,34486
13,27670
15,08627
16,81189
18,47531
20,09023
21,66599
23,20925
24,72497
26,21696
27,68824
29,14124
30,57791
31,99992
33,40866
34,80531
36,19087
37,56625
38,93217
40,28936
41,63839
42,97982
44,31410
45,64168
46,96294
48,27823
49,58788
50,89218
52,19139
53,48577
54,77553
56,06090
57,34207

5,41189
7,82404
9,83741
11,66784
13,38822
15,03321
16,62242
18,16823
19,67902
21,16076
22,61794
24,05395
25,47150
26,87276
28,25949
29,63317
30,99505
32,34616
33,68742
35,01963
36,34344
37,65949
38,96831
40,27036
41,56607
42,85583
44,13999
45,41884
46,69269
47,96180
49,22639
50,48670
51,74292
52,99524
54,24383

5,02388
7,37776
9,34840
11,14328
12,83250
14,44937
16,01276
17,53455
19,02276
20,48317
21,92004
23,33666
24,73560
26,11895
27,48839
28,84535
30,19101
31,52638
32,85232
34,16961
35,47887
36,78071
38,07563
39,36407
40,64647
41,92317
43,19451
44,46079
45,72228
46,97924
48,23188
49,48043
50,72508
51,96599
53,20335

3,84146
5,99146
7,81472
9,48773
11,07049
12,59158
14,06714
15,50731
16,91897
18,30703
19,67513
21,02607
22,36203
23,68479
24,99579
26,29622
27,58711
28,86929
30,14352
31,41043
32,67057
33,92444
35,17246
36,41503
37,65249
38,88513
40,11327
41,33713
42,55697
43,77297
44,98534
46,19425
47,39988
48,60236
49,80185

0,00393
0,10258
0,35184
0,71072
1,14548
1,63538
2,16735
2,73264
3,32511
3,94029
4,57481
5,22602
5,89186
6,57063
7,26094
7,96164
8,67176
9,39045
10,11701
10,85081
11,59131
12,33801
13,09051
13,84842
14,61140
15,37915
16,15139
16,92787
17,70836
18,49266
19,28056
20,07191
20,86653
21,66428
22,46502

0,000982
0,05063
0,21579
0,48441
0,83121
1,23734
1,68987
2,17973
2,70038
3,24697
3,81575
4,40379
5,00875
5,62873
6,26214
6,90766
7,56418
8,23075
8,90652
9,59077
10,28289
10,98232
11,68855
12,40115
13,11972
13,84391
14,57338
15,30786
16,04707
16,79077
17,53873
18,29076
19,04666
19,80625
20,56938

0,00062
0,04041
0,18483
0,42939
0,75188
1,13442
1,56429
2,03247
2,53237
3,05905
3,60868
4,17828
4,76545
5,36819
5,98492
6,61424
7,25500
7,90622
8,56703
9,23669
9,91456
10,60003
11,29260
11,99182
12,69727
13,40858
14,12542
14,84748
15,57448
16,30617
17,04232
17,78271
18,52714
19,27543
20,02743

0,00016
0,02010
0,11483
0,29711
0,55429
0,87209
1,23904
1,64649
2,08790
2,55821
3,05348
3,57057
4,10692
4,66043
5,22935
5,81221
6,40776
7,01491
7,63272
8,26039
8,89719
9,54249
10,19571
10,85636
11,52397
12,19814
12,87850
13,56470
14,25645
14,95345
15,65545
16,36221
17,07351
17,78915
18,50893

40

Captulo 1: Teoria das Probabilidades

0,999

0,995

0,99

0,98

p
0,975

0,95

0,05

0,025

0,02

0,01

36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
55
60
65
70
75
80
85
90
95
100

67,98517
69,34645
70,70289
72,05466
73,40196
74,74494
76,08376
77,41858
78,74952
80,07673
81,40033
82,72042
84,03713
85,35056
86,66082
93,16753
99,60723
105,98814
112,31693
118,59909
124,83922
131,04120
137,20835
143,34354
149,44925

61,58118
62,88334
64,18141
65,47557
66,76596
68,05273
69,33600
70,61590
71,89255
73,16606
74,43654
75,70407
76,96877
78,23071
79,48998
85,74895
91,95170
98,10514
104,21490
110,28558
116,32106
122,32458
128,29894
134,24655
140,16949

58,61921
59,89250
61,16209
62,42812
63,69074
64,95007
66,20624
67,45935
68,70951
69,95683
71,20140
72,44331
73,68264
74,91947
76,15389
82,29212
88,37942
94,42208
100,42518
106,39292
112,32879
118,23575
124,11632
129,97268
135,80672

55,48886
56,73047
57,96880
59,20398
60,43613
61,66538
62,89181
64,11554
65,33667
66,55527
67,77143
68,98524
70,19676
71,40608
72,61325
78,61914
84,57995
90,50124
96,38754
102,24253
108,06934
113,87057
119,64846
125,40493
131,14168

54,43729
55,66797
56,89552
58,12006
59,34171
60,56057
61,77676
62,99036
64,20146
65,41016
66,61653
67,82065
69,02259
70,22241
71,42020
77,38047
83,29768
89,17715
95,02318
100,83934
106,62857
112,39337
118,13589
123,85797
129,56120

50,99846
52,19232
53,38354
54,57223
55,75848
56,94239
58,12404
59,30351
60,48089
61,65623
62,82962
64,00111
65,17077
66,33865
67,50481
73,31149
79,08194
84,82065
90,53123
96,21667
101,87947
107,52174
113,14527
118,75161
124,34211

23,26861
24,07494
24,88390
25,69539
26,50930
27,32555
28,14405
28,96472
29,78748
30,61226
31,43900
32,26762
33,09808
33,93031
34,76425
38,95803
43,18796
47,44958
51,73928
56,05407
60,39148
64,74940
69,12603
73,51984
77,92947

21,33588
22,10563
22,87848
23,65432
24,43304
25,21452
25,99866
26,78537
27,57457
28,36615
29,16005
29,95620
30,75451
31,55492
32,35736
36,39811
40,48175
44,60299
48,75757
52,94194
57,15317
61,38878
65,64662
69,92487
74,22193

20,78295
21,54185
22,30401
23,06929
23,83757
24,60875
25,38271
26,15935
26,93859
27,72034
28,50450
29,29101
30,07979
30,87076
31,66386
35,65921
39,69942
43,77900
47,89345
52,03909
56,21285
60,41211
64,63466
68,87857
73,14218

19,23268
19,96023
20,69144
21,42616
22,16426
22,90561
23,65009
24,39760
25,14803
25,90127
26,65724
27,41585
28,17701
28,94065
29,70668
33,57048
37,48485
41,44361
45,44172
49,47503
53,54008
57,63393
61,75408
65,89836
70,06490

X - Distribui
c
ao de Student
2.
Sejam U e V duas vari
aveis aleatorias independentes tais que U N (0, 1) e V Xm
U
A variavel aleatoria T = p
segue uma lei ou distribuicao de Student com m graus
V /m
de liberdade que se denota por tm . Escreve-se T tm . A lei tm e contnua e simetrica
em relacao `a origem, para qualquer valor de m N. Na figura seguinte apresentamos o
esboco do grafico da densidade de uma distribuicao de Student com 30 graus de liberdade.
O quantil de probabilidade p da lei tm sera denotado por tm (p) e, para alguns valores parti-

-2

-1

culares de p e de m pode ser consultado na tabela que apresentamos de seguida. O valor do


quantil tm (p), para qualquer valor de m e de p, pode ser encontrado usando a funcao INVT
do Excel. Concretamente, tem-se tm (p) = IN V T (2(1 p); m). Por exemplo, t52 (0, 975) =
IN V T (0, 05; 52) = 2.0066.

41

1.3 - Variaveis aleatorias e distribuicoes

Tabela de quantis da lei tm

tm (p)

T tm

m
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

P (T tm (p)) = p

0,75

0,80

0,85

0,90

p
0,95

0,975

0,99

0,995

0,999

1,00000
0,81649
0,76489
0,74069
0,72668
0,71755
0,71114
0,70638
0,70272
0,69981
0,69744
0,69548
0,69382
0,69241
0,69119
0,69013
0,68919
0,68836
0,68762
0,68699
0,68637
0,68580
0,68530
0,68483
0,68443
0,68404
0,68368
0,68335
0,68304
0,68275

1,37638
1,06065
0,97847
0,94096
0,91954
0,90570
0,89602
0,88889
0,88340
0,87905
0,87557
0,87260
0,87015
0,86805
0,86624
0,86466
0,86327
0,86204
0,86095
0,85996
0,85907
0,85826
0,85752
0,85685
0,85623
0,85566
0,85513
0,85464
0,8541
0,85376

1,96261
1,38620
1,24977
1,18956
1,15576
1,13415
1,11915
1,10814
1,09971
1,09305
1,08766
1,08321
1,07946
1,07628
1,07353
1,07113
1,06903
1,06716
1,06550
1,06401
1,06266
1,06144
1,06033
1,05931
1,05838
1,05752
1,05672
1,05598
1,05530
1,05466

3,07768
1,88561
1,63774
1,53320
1,47588
1,43975
1,41492
1,39681
1,38302
1,37218
1,36343
1,35621
1,35017
1,34503
1,34060
1,33675
1,33337
1,33038
1,32772
1,32534
1,32318
1,32123
1,31946
1,31783
1,31634
1,31497
1,31370
1,31255
1,31143
1,31041

6,31374
2,91998
2,35333
2,13184
2,01504
1,94318
1,89457
1,85955
1,83311
1,81246
1,79588
1,78228
1,77093
1,76130
1,75305
1,74588
1,73960
1,73406
1,72913
1,72471
1,72074
1,71714
1,71387
1,71088
1,70814
1,70561
1,70328
1,70113
1,69912
1,69726

12,70615
4,30265
3,18244
2,77645
2,57057
2,44691
2,36464
2,30600
2,26215
2,22813
2,20098
2,17881
2,16036
2,14478
2,13145
2,11990
2,10981
2,10092
2,09302
2,08596
2,07961
2,07387
2,06865
2,06389
2,05953
2,05553
2,05182
2,04840
2,04523
2,04227

31,82096
6,96454
4,54070
3,74693
3,36493
3,14266
2,99796
2,89646
2,82143
2,76377
2,71807
2,68099
2,65030
2,62449
2,60248
2,58349
2,56693
2,55237
2,53948
2,52797
2,51764
2,50832
2,49987
2,49216
2,48510
2,47862
2,47266
2,46714
2,46202
2,45726

63,65589
9,92498
5,84084
4,60408
4,03211
3,70742
3,49948
3,35538
3,24984
3,16926
3,10581
3,05453
3,01228
2,97684
2,94672
2,92078
2,89823
2,87844
2,86094
2,84533
2,83136
2,81876
2,80733
2,79695
2,78743
2,77872
2,77068
2,76326
2,75638
2,74998

318,2888
22,32845
10,21428
7,17293
5,89352
5,20754
4,78525
4,50076
4,29688
4,14365
4,02476
3,92959
3,85203
3,78742
3,73285
3,68614
3,64576
3,61047
3,57933
3,55183
3,52709
3,50497
3,48496
3,46677
3,45018
3,43497
3,42100
3,40820
3,39627
3,38521

42

1.4

Captulo 1: Teoria das Probabilidades

0,75

0,80

0,85

0,90

p
0,95

0,975

0,99

0,995

0,999

31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
55
60
65
70
75
80
85
90
95
100

0,68248
0,68223
0,68199
0,68177
0,68156
0,68136
0,68117
0,68100
0,68083
0,68067
0,68052
0,68037
0,68023
0,68010
0,67998
0,67986
0,67974
0,67963
0,67953
0,67942
0,67897
0,67860
0,67828
0,67801
0,67777
0,67756
0,67738
0,67722
0,67708
0,67695

0,85336
0,85299
0,85264
0,85232
0,85201
0,85172
0,85144
0,85118
0,85093
0,85067
0,85047
0,85024
0,85006
0,84986
0,84968
0,84950
0,84933
0,84917
0,84907
0,84886
0,84820
0,84765
0,84718
0,84678
0,84644
0,84613
0,84587
0,84563
0,84542
0,84523

1,05406
1,05350
1,05297
1,05248
1,05201
1,05158
1,05116
1,05077
1,05039
1,05004
1,04970
1,04938
1,04908
1,04879
1,04851
1,04824
1,04799
1,04775
1,04751
1,04729
1,04629
1,04546
1,04476
1,04416
1,04364
1,04319
1,04279
1,04244
1,04212
1,04183

1,30946
1,30857
1,30773
1,30695
1,30621
1,30551
1,30485
1,30423
1,30363
1,30307
1,30254
1,30203
1,30155
1,30109
1,30065
1,30022
1,29982
1,29943
1,29906
1,29872
1,29713
1,29582
1,29471
1,29376
1,29294
1,29225
1,29159
1,29102
1,29052
1,29007

1,69551
1,69388
1,69236
1,69092
1,68957
1,68829
1,68709
1,68595
1,68487
1,68385
1,68287
1,68195
1,68107
1,68023
1,67942
1,67865
1,67792
1,67722
1,67655
1,67590
1,67303
1,67064
1,66863
1,66691
1,66542
1,66412
1,66297
1,66196
1,66105
1,66023

2,03951
2,03693
2,03451
2,03224
2,03011
2,02809
2,02619
2,02439
2,02268
2,02107
2,01957
2,01808
2,01669
2,01536
2,01410
2,01289
2,01173
2,01063
2,00957
2,00855
2,00404
2,00029
1,99713
1,99443
1,99210
1,99006
1,98826
1,98667
1,98524
1,98397

2,45282
2,44867
2,44479
2,44114
2,43771
2,43449
2,43144
2,42856
2,42584
2,42325
2,42080
2,41847
2,41625
2,41413
2,41211
2,41018
2,40834
2,40657
2,40488
2,40323
2,39608
2,39011
2,38509
2,38080
2,37710
2,37387
2,37101
2,36849
2,36624
2,36421

2,74403
2,73848
2,73328
2,72839
2,72380
2,71948
2,71540
2,71156
2,70791
2,70445
2,70118
2,69807
2,69510
2,69228
2,68959
2,68701
2,68455
2,68220
2,67995
2,67778
2,66822
2,66027
2,65361
2,64790
2,64299
2,63869
2,63491
2,63158
2,62858
2,62589

3,37488
3,36527
3,35632
3,34795
3,34002
3,33260
3,32562
3,31900
3,31274
3,30692
3,30124
3,29593
3,29091
3,28611
3,28145
3,27709
3,27287
3,26894
3,26508
3,26137
3,24514
3,23168
3,22041
3,21080
3,20243
3,19523
3,18890
3,18323
3,17828
3,17377

Teorema Limite Central

Considere a vari
avel aleatoria que representa o intervalo de tempo entre duas excedencias de
um caudal elevado q (previamente fixado) de uma seccao de determinado curso de agua. A
distribuicao desta vari
avel aleatoria pode ser conhecida ou nao. Suponha agora que, para um
grupo de 50 excedencias consecutivas, estamos interessados em conhecer a probabilidade de
que o tempo total que decorre entre a primeira e a quinquagesima seja superior a determinado
valor t0 (valor de referencia para o problema em estudo). Para abordar este problema ha que
considerar as vari
aveis aleatorias X1 , X2 , , X49 sendo Xi a variavel aleatoria que representa
a amplitude de tempo que decorre entre a i-esima excedencia P
de q e a i+1-esima, para i
{1, 2, , 49}. Uma vez que o referido tempo total e definido por 49
i=1 Xi pretendemos calcular
P

49
X
i=1

X i > t0

"

43

1.4 - Teorema Limite Central

No caso em que aquelas vari


aveis aleatorias seguem uma lei normal e sao independentes, a
estabilidade da lei normal da resposta a esta questao. Por outro lado, nao tendo as variaveis
X1 , X2 , , X49 distribuic
ao normal, ou no caso em que tal distribuicao e desconhecida, um
resultado teorico que nos permita obter uma distribuicao aproximada para a soma de variaveis
aleatorias sera bastante u
til.
Consideremos agora um exemplo mais academico. Se realizarmos 100 lancamentos de um
dado equilibrado com as faces numeradas de 1 a 6, qual a probabilidade de que a proporcao de
faces 2 seja superior a 0.3? Para responder a esta pergunta consideramos, para cada lancamento,
uma vari
avel aleatoria de Bernoulli de parametro 1/6. Temos assim 100 variaveis aleatorias
independentes e estamos interessados em calcular
!
"
"
! 100
100
X
1 X
P
Xi > 30 .
Xi > 0.3 = P
100
i=1

i=1

Mais uma vez teremos de conhecer


soma de variaveis aleatorias independentes.
P100a distribuicao da
1
mais
Embora neste caso particular i=1 Xi B(100, 6 ) os calculos sao bastante extensos. E
uma vez desejavel obter uma aproximacao para a distribuicao da soma de variaveis aleatorias
independentes.
O Teorema Limite Central, que expomos de seguida, da resposta a esta questao desde que
as variaveis intervenientes na soma, para alem de independentes, tenham a mesma distribuic
ao
de variancia finita, seja tal distribuic
ao conhecida ou nao.
Teorema 1.4.1 ( Teorema Limite Central ) Sejam X1 , X2 , ..., Xn vari
aveis aleat
orias
independentes e todas com a mesma distribuic
ao. Se E(X1 ) = m e V ar(X1 ) = 2 ent
ao

 Pn
Xi nm
i=1
x = P (Z x), x IR,
lim P
n+
n
onde Z N (0, 1).

Pn

Xi nm
i=1
N (0, 1) ou,
Observa
c
ao 1.4.1 Nas condic
oes do teorema escrevemos
n
Pn

equivalentemente, i=1 Xi N (nm, n 2 ), onde o smbolo se le segue assintoticamente a


distribuic
ao.
De acordo com o teorema anterior, podemos concluir que a soma de variaveis aleatorias
independentes e igualmente distribudas admitindo variancia finita 2 e media m tem uma
funcao de distribuic
ao que, para um n
umero de parcelas suficientemente grande, pode ser
aproximada pela func
ao de distribuicao da lei N (nm, n 2 ).
Exemplo 1.4.1 Uma ponte foi projectada para suportar uma sobrecarga total de 1500 KN.
Suponhamos que a vari
avel aleat
oria que representa o peso de um autom
ovel tem media 15 KN
e desvio padr
ao 1.5 KN. Pretendemos determinar o n
umero m
aximo de autom
oveis que a ponte
poder
a suportar de modo que a probabilidade de serem causados danos na sua estrutura n
ao
exceda 0.01.
Ora, considerando as vari
aveis X1 , X2 , , Xn que representam o peso dos diferentes n
autom
oveis que a ponte pode suportar naquelas condic
oes, e admitindo que estas podem ser

44

Captulo 1: Teoria das Probabilidades

consideradas independentes, pelo Teorema Limite Central, podemos afirmar que


Pn
i 15n
i=1 X
N (0, 1).
1.5 n
De acordo
Pn com o que foi exposto pretendemos determinar o maior valor de n para o qual se
tem P ( i=1 Xi > 1500) 0.01.
Uma vez que
! n
"

 Pn
X
1500 15n
i 15n
i=1 X

,
>
P
Xi > 1500 = P
1.5 n
1.5 n
i=1

usando a aproximac
ao decorrente do
 Teorema Limite Central, vamos determinar o maior valor
150015n
de n que verifica P Z > 1.5n
0, 01, onde Z N (0, 1). Consultando a tabela da lei

normal apresentada acima conclumos que 150015n


2.33 o que equivale a n 97. Assim, para
1.5 n
um n
umero de autom
oveis sobre a ponte superior a 97, o risco desta sofrer danos estruturais e
superior a 1%.

Exemplo 1.4.2 Numa praca de determinada cidade est


ao habitualmente estacionados autom
oveis em transgress
ao. Todos os dias a polcia multa autom
oveis estacionados em transgress
ao, deixando uma notificac
ao no p
ara-brisas. A probabilidade de um autom
ovel estacionado
em trangress
ao ser multado e de 0.9. O n
umero de pessoas que, por dia, se apresenta na esquadra para pagar a multa e uma vari
avel aleat
oria de media e vari
ancia iguais a 10. Se cada
multa for de 20 euros e a esquadra estiver aberta 225 dias por ano, qual a probabilidade de a
receita anual com multas daquele tipo ultrapassar 47 mil euros?
Para responder a esta quest
ao h
a que calcular a probabilidade de que o n
umero total de
multas pagas em 225 dias seja superior a 2350. Para tal, consideremos as v.as
Xi = n
umero de multas pagas no dia i
para i {1, 2, ..., 225}. Sabemos que E(Xi ) = 10, V ar(Xi ) = 10 e obviamente, que a v.a. T =
225
X
Xi representa o total de multas pagas em 225 dias. Admitindo a independencia daquelas
i=1

225 v.as, podemos afirmar, usando o Teorema Limite Central, que


P225
i=1Xi 2250
N (0, 1).(4 )
2250
Assim
P (T > 2350) = P

! 225
X

Xi > 2350

i=1

onde Z N (0, 1).


4


P Z>

100
2250

"

=P

!P

225
i=1Xi

2250
2350 2250

>
2250
2250

"

P (Z > 2.11) = 1 FZ (2.11) = 0.01743,

Depois de fixar o valor de n, como acontece neste exemplo, o smbolo n


ao se le segue assintoticamente
a distribuic
ao, mas sim segue aproximadamente a distribuic
ao. Entendemos que, neste contexto, n
ao se
justifica o uso de dois smbolos distintos.

45

1.4 - Teorema Limite Central

Relativamente `a soma de vari


aveis aleatorias independentes ja estudamos quatro casos
distintos. A saber:
a soma de n vari
aveis aleatorias independentes com distribuicao B(p) tem distribuic
ao
B(n, p);
a soma de n vari
aveis aleatorias independentes com distribuicao de Poisson tem tambem
distribuicao de Poisson com media igual `a soma das medias (estabilidade da distribuicao de
Poisson);
a soma de n vari
aveis aleatorias normais independentes tem distribuicao normal com
media igual `a soma das medias e variancia igual `a soma das variancias (estabilidade da distribuicao normal);
a soma de n vari
aveis aleatorias independentes com a mesma distribuicao, de variancia
finita 2 e media m, tem distribuicao aproximadamente normal com media igual a nm e
variancia igual a n 2 (Teorema Limite Central).
Observemos agora que, conciliando a primeira e a quarta destas conclusoes podemos afirmar
que
a func
ao de distribuic
ao da lei B(r, p), para r suficientemente grande, pode ser aproximada pela func
ao de distribuic
ao da lei N (rp, rp(1 p)).
Muitos autores afirmam que esta aproximacao deve ser considerada apenas para p pertencente ao intervalo ]0.1, 0.9[.
Analogamente, uma vez que a soma de n variaveis aleatorias independentes com distribuic
ao
P() segue a lei P(n), conclumos, usando de novo o Teorema Limite Central, que
a func
ao de distribuic
ao da lei P(n) pode ser aproximada, para n suficientemente
grande, pela func
ao de distribuic
ao da lei N (n, n).
Exemplo 1.4.3 O n
umero de acessos, por dia, a um determinado site de internet e uma
v.a. real N com distribuic
ao de Poisson de media 9.5. Suponha que os acessos ao site se
processam de forma independente. Comecemos por calcular a probabilidade de o n
umero total
de acessos em 950 dias ser superior a 8900.
Consideremos 950 replicas de N , ou seja, para i {1, 2, ..., 950}, consideremos a v.a Ni
que representa o n
umero de acessos ao site no dia i. Sabemos que Ni P(9.5). Ora, a
950
X
Ni representa o n
umero total de acessos ao site em 950 dias. Uma vez que as v.as
v.a.
i=1

N1 , N2 , ..., N950 s
ao independentes e identicamente distribudas, pelo Teorema Limite Central,
podemos concluir que
950
X
Ni 950 9.5
i=1

ou, escrito de outra forma,

! 950
X
i=1

950
X
i=1

N (0, 1),

950 9.5

Ni N (9025, 9025). Ent


ao

Ni > 8900

"

= P

1
95

! 950
X
i=1

Ni 9025

"

>

89009025
95

"

P (Z > 1.32) = P (Z 1.32) = 0.90658,

46

Captulo 1: Teoria das Probabilidades

onde Z N (0, 1).


Sabendo que P (N > 12) = 0.164, calculemos agora a probabilidade de, em 320 dias, se
observarem pelo menos 85 dias com mais de 12 acessos. Denotemos por Y a v.a. que representa
o n
umero de dias, em 320, em que se registaram mais de 12 acessos ao site. Uma vez que os
acessos se processam de forma independente, temos 320 experiencias de Bernoulli em que
o sucesso e o acontecimento {N > 12}. Como se tem P (N > 12) = 0.164, conclumos que
320
X
Yi , onde Yi segue uma lei de Bernoulli de par
ametro
Y B(320, 0.164). Por outro lado, Y =
i=1

0.164. Ent
ao, pelo Teorema Limite Central, podemos afirmar que
320
X
i=1

onde Z N (0, 1). Assim

Yi 320 0.164

320 0.164 0.836

N (0, 1),

320
X
Yi 320 0.164

i=1
P (Y 85) = P
3200.1640.836

853200.164
3200.1640.836

P (Z 2.2) = 1 P (Z < 2.2) = 1 0.9861 = 0.0139.

Exerccio 1.4.1 Os registos dos jogos do campeonato europeu de futebol, desde 1984,
permitiram concluir que a vari
avel aleat
oria que representa o n
umero de golos por jogo (em
tempo regulamentar) tem media 1.8 e desvio padr
ao 1.1. Admitindo a independencia entre o
n
umero de golos em jogos diferentes, determine a probabilidade de se marcarem pelo menos 50
golos em 31 jogos do Euro 2012.
Exerccio 1.4.2 Uma refinaria de petr
oleo possui, num dos parques de abastecimento, um
equipamento recentemente renovado que lhe permite encher, por mes, uma media de 280 tanques
com um desvio padr
ao de 18 tanques. Admitindo a independ
encia entre os abastecimentos
mensais, calcule uma aproximac
ao para a probabilidade de, em tres anos, este equipamento
encher menos de 10400 tanques.
Exerccio 1.4.3 Uma empresa distribuiu, para uso profissional, um telem
ovel a cada um
dos seus 36 funcion
arios. A despesa mensal, em euros, da empresa com cada um desses telem
oveis e representada por uma vari
avel aleat
oria de media 53 euros e desvio padr
ao 15 euros.
Admitindo a independencia das despesas dos diferentes telem
oveis, determine uma aproximaca
o
para a probabilidade de a despesa mensal da empresa com os 36 telem
oveis ser superior a 2000
euros.
Exerccio 1.4.4 Num determinado troco de estrada bastante perigoso ocorrem frequentemente acidentes por excesso de velocidade. O n
umero de feridos graves num acidente devido a
excesso de velocidade no referido troco de estrada, e uma v.a. X com lei de Poisson de media
0.2.

1.4 - Teorema Limite Central

47

1. Determine uma aproximaca


o para a probabilidade de que o n
umero total de feridos graves
em 125 acidentes seja superior a 20.
2. Determine uma aproximaca
o para a probabilidade de que o n
umero total de feridos graves
em 1250 acidentes seja superior a 230.
Exerccio 1.4.5 O servico de manutenc
ao de um predio e obrigado a substituir uma
l
ampada num dispositivo de iluminac
ao. O tempo que dura cada l
ampada e em media de 2
semanas apresentando um desvio padr
ao de 3 dias. Se se adquirirem 40 l
ampadas, qual a
probabilidade de esse stock durar mais de 2 anos?
Exerccio 1.4.6 Num viveiro temos 50 trutas de entre as quais 5 s
ao machos. Suponha
que cada truta femea produz descendencia em n
umero que pode ser descrito por uma v.a. de
Poisson com par
ametro 1.8. Qual a probabilidade de a pr
oxima gerac
ao de trutas ter mais do
que 108 elementos?
Exerccio 1.4.7 Um posto de transformac
ao permite uma carga total de 2800 KW. Sabese que este posto de transformac
ao alimenta uma f
abrica com um consumo permanente de 2500
KW. Por outro lado, alimenta 100 consumidores domesticos. Em electrodomesticos, cada um
gasta em media 2KW com desvio padr
ao de 0.5KW e, em iluminac
ao, gasta em media 0.5KW
com desvio padr
ao de 0.25KW. Admitindo a independencia destes dois tipos de consumo, calcule
a probabilidade de o transformador disparar por excesso de carga.
Exerccio 1.4.8 As variac
oes de temperatura provocam contracco
es ou expans
oes nos gasodutos. As variac
oes de comprimento devidas `
a temperatura s
ao, para cada troco com comprimento 30.480 metros, em media iguais a 2.54 centmetros com desvio padr
ao 1.27 centmetros.
Sabendo que uma linha de gasoduto e concebida para ter comprimento igual a 1 524 metros, que
pode dizer acerca da lei da v.a. que descreve a variac
ao do comprimento dessa linha? Qual a
probabilidade de se verificar um aumento superior a 139.7 centmetros no comprimento total
duma linha de gasoduto?
Exerccio 1.4.9 A acidez do solo de uma regi
ao e descrita por uma v.a. com media 48.75
e vari
ancia 65.21. Se fizermos 40 medic
oes, qual a probabilidade de a media das observac
oes
ser superior a 50? O que dizer desta probabilidade se fizermos 60 medic
oes?
Exerccio 1.4.10 A quantidade de oxigenio na
agua deve exceder 6 partes por milh
ao
(ppm) para que esta possa ser considerada adequada a suportar a existencia de vida. Os registos
efectuados sugerem que o valor medio da concentrac
ao de oxigenio num lago e de 6.8 ppm com
desvio padr
ao 0.7 ppm. Se recolhermos 40 amostras de
agua, qual a probabilidade de a media
das concentrac
oes exceder 8 ppm?
Exerccio 1.4.11 Suponha que o di
ametro de um certo tipo de tubo tem uma distribuic
ao
normal de media m e desvio padr
ao 0.01 cm.
1. Qual a probabilidade de um tubo ter um di
ametro que se desvie pelo menos 0.02 cm da
sua media?
2. Suponha que m = 2.79 cm e que os limites de especificac
ao s
ao 2.77 0.03 cm.

48

Captulo 2: Estatstica Descritiva

(a) Em 1000 tubos, quantos espera rejeitar?


(b) Qual a probabilidade de, em 500 tubos, serem rejeitados menos de 85?
3. Qual o n
umero de tubos a considerar, para que n
ao seja superior a 0.05 a probabilidade
de a media dos di
ametros desses tubos diferir de m mais de 0.01 cm?

Captulo 2

Estatstica Descritiva
Se temos tudo sob controlo,
significa que n
ao estamos a caminhar suficientemente r
apido.

2.1

Introduc
ao

Perante uma amostra como a que apresentamos a seguir:


0.367, 2.169, 2.268, 1.649, 2.347, 2.335, 1.546, 0.378, 1.608, 0.121, 1.875, 0.212, 0.367, 1.162,
1.328, 1.053, 1.578, 0.613, 2.340, 2.119, 0.928, 1.750, 1.266, 1.799, 0.710, 0.354, 1.459, 2.224,
2.036, 1.333, 2.197, 2.293, 0.601, 0.522, 2.167, 1.874, 2.042, 0.677, 0.448, 0.073, 0.969, 0.840,
0.615, 0.579, 0.135, 1.389, 1.621, 0.413, 1.857, 2.075,
podemos colocar as questoes seguintes.
Como tratar um conjunto de dados como estes?
O que confessam estes dados?
Qual a distribuic
ao da variavel aleatoria que lhes esta subjacente?

Ao longo deste captulo apresentamos os conceitos fundamentais da Estatstica Descritiva.


Ja definimos atras populac
ao como um conjunto de indivduos com caractersticas comuns
que interessa estudar e amostra como um subconjunto de elementos extrados da populac
ao.
Por outro lado, tambem sabemos que qualquer estudo estatstico envolve a analise de um
conjunto de dados, a que chamamos amostra, usando para tal metodologias matematicas adequadas a cada tipo de vari
avel e (em muitos casos) `a dimensao da amostra. O que designamos
por indivduo de uma populac
ao pode ser uma pessoa, um objecto, um animal, um edifcio, uma
49

50

Captulo 2: Estatstica Descritiva

empresa, um valor da temperatura em determinado local, um agregado familiar, etc. Sobre os


indivduos de uma dada populac
ao podemos observar um ou mais atributos ou caractersticas
os quais, por sua vez, apresentam varias modalidades mutuamente exclusivas. Por exemplo,
se considerarmos a populac
ao dos estudantes da Universidade de Coimbra sao atributos com
interesse para certos estudos estatsticos, a idade, o estado civil, o sexo, o n
umero de irmaos, o
n
umero de disciplinas em que ja obtiveram aprovacao, a media das classificacoes obtidas em tais
disciplinas, o gasto medio mensal com os estudos, etc. Enquanto as modalidades do atributo
idade sao os n
umeros reais de um certo intervalo, as modalidades do atributo sexo sao apenas
masculino e feminino. A mensurabilidade associada ou nao a um dado atributo conduz `a sua
classificacao em quantitativos e qualitativos, respectivamente. Na verdade, sao atributos quantitativos aqueles que assumem valores numericos com os quais faz sentido efectuar operacoes
aritmeticas. Em contrapartida, sao atributos qualitativos aqueles cujas modalidades sao categorias nao mensuraveis. No exemplo acima, sao atributos quantitativos a idade, o n
umero de
irmaos, o n
umero de disciplinas em que ja obtiveram aprovacao, a media de tais disciplinas, o
gasto medio mensal com os estudos e sao atributos qualitativos o estado civil e o sexo.
Neste curso analisamos apenas atributos populacionais quantitativos unidimensionais. Uma
observacao mais cuidada dos exemplos acima permite-nos concluir que os atributos quantitativos nao sao todos do mesmo tipo. Por exemplo, a idade de um aluno assume valores num
` semelhanca da distincao
intervalo e o n
umero de irmaos assume valores num conjunto finito. A
que apresent
amos entre vari
avel aleatoria discreta e variavel aleatoria contnua, tambem definimos como atributo discreto aquele cujas modalidades pertencem a um conjunto finito ou infinito
numeravel e como atributo contnuo aquele cujas modalidades pertencem a um intervalo.
Damos o nome de vari
avel estatstica, que denotamos por X , `a funcao que a cada elemento
da amostra faz corresponder a modalidade do atributo que estamos a estudar. Naturalmente,
uma variavel estatstica diz-se discreta ou contnua se o atributo que lhe esta associado e
discreto ou contnuo, respectivamente.

2.2

Vari
aveis estatsticas discretas

Dada uma amostra de dimensao n extrada de uma populacao representemos por x1 , x2 , ..., xn
os valores correspondentes assumidos pela variavel estatstica X em estudo.
Observa
c
ao 2.2.1 No contexto em que estes textos se inserem passaremos a chamar
amostra observada (ou apenas amostra) ao vector (x1 , x2 , ..., xn ).
Atendendo a que uma vari
avel estatstica X tem associada uma variavel aleatoria X,
uma amostra observada (x1 , x2 , ..., xn ) nao e mais que um valor observado de um vector
(X1 , X2 , ..., Xn ), constitudo por vari
aveis independentes e todas com a lei de X, a que chamaremos adiante amostra aleatoria de X.
Suponhamos que x1 , x2 , ..., xk s
ao os k elementos distintos da amostra observada inicial
(x1 , x2 , ..., xn ), com k n, tendo-se
x1 < x2 < < xk .

51

2.2 - Variaveis estatsticas discretas

Representemos por ni a frequencia absoluta do valor xi , para a qual se tem


representemos por fi =

ni
n

a frequencia relativa simples de xi , para o que se tem

k
X

i=1
k
X

ni = n, e
fi = 1.

i=1

Na presenca de uma vari


avel estatstica discreta comecamos o seu tratamento estatstico
pela construc
ao de um grafico a que damos o nome de diagrama de barras. Trata-se de um
grafico de barras verticais que unem os pontos de coordenadas (xi , 0) e (xi , fi ), para i =
1, , k, como o que apresentamos a seguir.
..
f3 ....
...
..
..
..
..
..
..
..
..
fk ....
..
.
..
..
.
.
.
f2 .
..
..
..
..
...
..
..
..
..
f1 ..
...
..
..
..
..
..
..
...........................................................................................................................................
x1 x2 x3
xk1 xk
Damos o nome de func
ao cumulativa ou funcao de frequencias acumuladas `a funcao

F : IR X
[0, 1]
fi
x
F (xj )

xi x

A
= f1 + f2 + + fj , que tambem denotamos por Fj , chamamos frequencia relativa
acumulada de xj .
Passamos a apresentar o esboco do grafico da funcao cumulativa.
..
F
...........................................
1 ....
..
......................
..

..
..
......................
..
..
..
......................
..
...................................0....................................................................................................................................................................................................
xk1 xk
x1 x2 x3

Com o objectivo de proceder `a inferencia dos parametros desconhecidos da distribuicao da


variavel aleatoria em estudo vamos estudar as caractersticas numericas relativas `a variavel estatstica associada. Neste contexto podemos falar genericamente de caractersticas ou medidas
de localizac
ao e de dispersao.
A media da amostra que se denota por x e define por
k
n
X
1X
fi xi
xi =
x=
n
i=1

i=1

e uma medida de localizac


ao e de tendencia central da amostra observada.
A moda da amostra e outra caracterstica de localizacao dos dados que se define como sendo
um valor da vari
avel estatstica onde a frequencia (relativa ou absoluta) atinge um maximo

52

Captulo 2: Estatstica Descritiva

local. Doutro modo, o valor xi e uma moda da amostra se fi fi1 e fi fi+1 , onde
se considera f0 = 0 e fk+1 = 0. As variaveis estatsticas podem ser unimodais, bimodais,
trimodais, etc. Sempre que apresentem mais que duas modas sao designadas multimodais.
A outra medida de localizac
ao que, `a semelhanca da media, e uma medida de tendencia
central e a mediana. A mediana de uma variavel estatstica (ou da amostra) e o valor real (nao
necessariamente um dos elementos da amostra) que divide a amostra em duas partes iguais.
Concretamente, a mediana e um valor real que denotamos por med e que verifica
lim

xmed

F (x)

1
e
2

lim

xmed+

F (x) F (med)

1
.
2

Retomemos a amostra inicial e denotemos por xi:n o i-esimo elemento da amostra ordenada,
tendo-se assim
x1:n xi:n xn:n
No caso em que a dimensao da amostra e par, qualquer elemento do intervalo [x n2 :n , x n2 +1:n ]
verifica as desigualdades anteriores que definem a mediana. Assim sendo, neste caso, considerase que a mediana da amostra e o ponto medio entre os dois extremos deste intervalo. Em resumo
n
x :n + x n2 +1:n

se n par
2
2
.
med =

x n+1
se n mpar
2

:n

A media, a moda e a mediana sao medidas de localizacao.


Mais, na presenca de apenas uma moda, dizemos que
uma amostra apresenta assimetria negativa se x < moda;

uma amostra apresenta assimetria positiva se x > moda;

uma amostra apresenta simetria se moda = med = x.

Notemos que a simetria estrita e uma caracterstica rara de obter numa amostra, podendo
acontecer, contudo, que a moda, a media e a mediana apresentem valores muito proximos.
A media de uma amostra, apesar de ser quase sempre o primeiro valor a determinar, e muito
sensvel `a presenca de valores muito elevados ou de valores muito reduzidos em relacao aos
valores tpicos dessa amostra. Por exemplo, a amostra
(1, 2, 2, 2, 3, 3, 4, 4, 4, 5, 6, 18)
tem media igual a 4.5 enquanto a media dos valores 1, 2, 2, 2, 3, 3, 4, 4, 4, 5, 6 e exactamente
3.2727(27). Esta falta de robustez da media amostral e de certa forma contornada com o
calculo da mediana que e, de acordo com a sua definicao, um parametro amostral de tendencia
central bastante robusto `a existencia de valores muito distintos dos restantes.
Outras medidas de localizac
ao da amostra que nos interessa estudar sao os quantis de ordem
p da amostra, com p ]0, 1[. Perante uma amostra, damos o nome de quantil de ordem p,

53

2.2 - Variaveis estatsticas discretas

com p ]0, 1[, ao valor real, nao necessariamente pertencente `a amostra, que denotamos por
q(p) e que verifica
lim

xq(p)

F (x) p

lim

xq(p)+

F (x) = F (q(p)) p.

Em particular obtemos os tres quartis da amostra, que denotamos por q1 , q2 e q3 , fazendo


p = 1/4, p = 1/2 e p = 3/4. Assim, os tres quartis dividem a amostra em quatro partes
iguais, ou seja, sao n
umeros reais caracterizados pelo facto de 25%, 50% e 75% das observacoes,
respectivamente, serem menores ou iguais a eles. De acordo com definicao que ja conhecemos
para a mediana conclumos imediatamente que a mediana coincide com o segundo quartil.
Na pratica, atendendo a que o primeiro e o terceiro quartil sao, grosso modo, a mediana da
primeirae da segundametadeda amostra, respectivamente, para determinar estes quartis
ha que considerar isoladamente a primeira e a segunda metadeda amostra ordenada e calcular
a mediana de cada uma delas. Concretamente, se a dimensao da amostra inicial e par esta
divisao e trivial e no caso em que tal dimensao e mpar inclumos a mediana (mais precisamente
a observac
ao x n+1 :n ) em cada uma das sub-amostras consideradas.
2

Exemplo 2.2.1 Relativamente `


a amostra observada (2, 2, 3, 4, 5, 5, 5, 5, 6) tem-se q1 = 3,
med = 5 e q3 = 5. Relativamente `
a amostra (1, 2, 2, 3, 4, 4, 5, 6, 6, 6, 7, 7) tem-se q1 = 2.5, med
= 4.5 e q3 = 6.
Observa
c
ao 2.2.2 Realcamos aqui o facto, de certa forma inc
omodo para o leitor, de que
estamos a usar v
arias notac
oes diferentes para a mesma entidade. Por exemplo a mediana da
amostra e denotada por q(1/2), med e q2 .
Seguindo outros autores, apresentamos a seguir uma formula de calculo simples e alternativa
ao que expusemos acima para q1 e q3 :

q1 =

x n4 :n

x[ n4 +1]:n

se n/4 inteiro
q3 =
se nao

:n
x 3n
4

x 3n
[ +1]:n
4

se 3n/4 inteiro
.
se nao

` semelhanca do que foi exposto para as variaveis aleatorias, iremos apresentar algumas
A
medidas de dispersao dos dados que constituem a amostra. Na verdade, a moda, a media e a
mediana, quando observadas isoladamente, nao nos permitem tirar conclusoes precisas acerca
da concentrac
ao dos valores que constituem a amostra. Todavia, a posicao dos tres quartis
em relacao ao maximo e ao mnimo amostrais e a amplitude entre o primeiro e o terceiro
quartis, onde se concentram 50% dos dados, fornecem-nos indicacao bastante completa sobre
a dispersao dos valores amostrais.
As medidas de dispersao que consideramos sao a amplitude amostral An = xn:n x1:n ,
a amplitude interquartis q3 q1 e a variancia e o desvio padrao amostrais que definiremos
adiante.
O diagrama de extremos e quartis (ou caixa com bigodes) e um grafico com o qual se
pretende ilustrar a variabilidade dos elementos da amostra em torno da mediana. Este diagrama
e naturalmente utilizado para evidenciar tendencias assimetricas na distribuicao dos dados. Por
exemplo, se a mediana, o terceiro quartil e o maximo estao relativamente proximos, quando

54

Captulo 2: Estatstica Descritiva

comparados com as amplitudes entre a mediana e o primeiro quartil e entre este e o mnimo
amostral, teremos uma amostra que evidencia assimetria negativa.
Na figura seguinte apresentamos um esboco de um grafico de extremos e quartis.
..........................................................................
max
..
..
q3
.................................... ......................................
..........................................................................
med
..
..
..
..
.
..
..........................................................................
q1
..
..
..
..
.........................................................................
min
Uma outra forma de estudar a variabilidade dos elementos amostrais consiste em avaliar a
dispersao com que estes se situam em relacao `a media da amostra. Este proposito consegue-se
considerando inicialmente o quadrado dos desvios entre a media e cada um dos valores da
amostra e calculando posteriormente a media de tais quadrados. A variancia da amostra e
uma versao modificada de tal media de quadrados que se define por
n

n
1 X 2
1 X
(xi x)2 =
xi
(x)2 .
n1
n1
n1
i=1
i=1
p
Chamamos desvio padrao da amostra a sn = s2n .
Em algumas aplicac
oes poderemos usar as seguintes aproximacoes para o desvio padrao:
s2n =

sn

2.3

xn:n x1:n
4

sn

q3 q1
1.349

Vari
aveis estatsticas contnuas

Suponhamos que a vari


avel estatstica X assume valores no intervalo [a0 , ak ], isto e, todos os
elementos da amostra estao compreendidos entre a0 e ak , e admitamos que
A1 := [a0 , a1 ], A2 :=]a1 , a2 ], , Ak :=]ak1 , ak ]
e uma partic
ao adequada daquele intervalo. Devemos observar que a escolha desta particao,
incluindo a amplitude de cada uma destas classes, esta muitas vezes relacionada com a natureza
do fenomeno que se esta a estudar. Por exemplo, e comum considerar classes de amplitudes
diferentes em estudos de hierarquias profissionais, rendimentos percapita ou mesmo distribuicoes
de idades.
Para cada uma das classes A1 , , Ak tambem se definem as frequencias relativa e absoluta,
similarmente ao que foi exposto para variaveis estatsticas discretas. Concretamente, damos
o nome de frequencia absoluta da classe Ai , que denotamos por ni , ao n
umero de elementos
k
X
ni = n, onde n
da amostra que pertencem a Ai , para i = 1, , k. Tem-se obviamente
i=1

55

2.2 - Variaveis estatsticas contnuas

representa mais uma vez a dimensao da amostra. A frequencia relativa simples da classe Ai e
i
X
fj .
definida por fi = nni e a frequencia relativa acumulada por Fi =
j=1

Depois de conhecermos os valores das frequencias de cada uma das classes, ha que obter representacoes graficas que nos permitam inferir sobre a distribuicao de probabilidade da vari
avel
aleatoria subjacente aos dados de que dispomos. As representacoes graficas a que nos referimos
sao usualmente designadas em Estatstica histograma e polgono de frequencias.
Para construir um histograma respeitante a uma determinada amostra de dimensao n,
comecamos por dividir os elementos desta amostra em classes (intervalos reais) disjuntas e
que constituam uma partic
ao do intervalo inicial onde se situa a amostra. Este procedimento
permite gerar uma vari
avel estatstica contnua.
No presente curso consideramos apenas classes de igual amplitude dada por
hn

3.5 sn
.
n1/3

Esta restric
ao conduz quase sempre a um n
umero de classes cuja uniao tem uma amplitude
superior `a amplitude total da amostra, o que significa que o extremo inferior da primeira classe
pode nao ser o mnimo amostral, assim como o extremo superior da u
ltima classe pode ser ou
nao o maximo amostral. Representemos tais classes por
A1 := [a0 , a1 ], A2 :=]a1 , a2 ], , Ak :=]ak1 , ak ].
Seguidamente marcamos os valores a0 , a1 , a2 , ak1 , ak no eixo das abcissas de um sistema
de eixos coordenados e marcamos os valores hfni (ou apenas fi ) no eixo das ordenadas, para
i = 1, 2, , k. O histograma consiste no conjunto dos k rectangulos justapostos de base hn e
alturas hfn1 , , hfkn .
O polgono de frequencias e uma linha poligonal que se constroi unindo os pontos de coordenadas ( ai +a2 i1 , hfni ), para i = 1, , k. Podemos acrescentar o segmento que une os pontos
(a0 h2n , 0) e (a0 + h2n , f1 ) e o segmento que une os pontos (ak h2n , fk ) e (ak + h2n , 0).
Apresentamos de seguida um exemplo de um histograma associado ao respectivo polgono
de frequencias.
9.
...............................
40..
.................................... ..... ....
..
.
..
....
7.
...............................
....
..
40..
.
... ...
.
.
.
..
..
..
....
..........................
.
.
.
..
.
.
.
..
... ..................
..
.. ..
.
4.
.
........ ................
..
.
..
..
...........................
40..
..
..
.... ..........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..
..
......
.
.
.
2 ..........................
...
..
..
..
... ....
...
...
40.........
.
.
.
.
.............................
..
..
..
..
..
..
.....
.
.
.
.
.
.
.
...........................................................................................................................................................................................................................................................
0
1
2
3
4
5
6
7
8
De acordo com a definic
ao que apresentamos de funcao densidade de probabilidade e atendendo `a definic
ao de integral definido, podemos concluir que, quando a a dimensao da amostra
tende para a dimensao da populac
aoe, concomitantemente, a amplitude de cada classe tende
para zero, o polgono de frequencias da lugarao grafico de uma densidade. Por outras palavras, podemos afirmar que quando a dimensao da amostra e suficientemente grande o polgono

56

Captulo 2: Estatstica Descritiva

de frequencias e uma boa aproximacaoda densidade de probabilidade da variavel aleatoria


contnua subjacente `a referida amostra.
Nos casos em que temos histogramas como o apresentado acima evidenciando simetria e
com um polgono de frequencias associado com uma configuracao relativamente proxima
da densidade da lei normal, podemos comecar por ajustar uma distribuicao normal `a variavel
aleatoria em estudo. Ainda assim, podemos vir a rejeitar tal hipotese como veremos no captulo
tres.
Se, por outro lado, a amostra da variavel aleatoria em estudo gerar um histograma como o
que apresentamos a seguir, sera razoavel comecar por ajustar uma distribuicao uniforme sobre
um certo intervalo a tal vari
avel aleatoria.
..
..........................
.............................
...
...
..
.
..............................
..............................
..
..
...
...
..
..
...........................
...
...
.
..
.
.
...
..
..
..
...
..
...
..
..
..
...
..
...
..
..
..
...
..
..
..
..
..
..
...
..
.
.
.
...............................................................................................................................................
Nas circunstancias em que dispomos de uma amostra a partir da qual construmos um
histograma como o que apresentamos seguidamente, deveremos comecar por ajustar uma distribuicao exponencial `a vari
avel aleatoria subjacente a esses dados.
................................
...
..
...
..
...
..
...
..
...
..
...
..
...
..
..................................
..
...
...
..
...
...
..
...
...
..
...
...................................
..
...
...
...
..
...
...
..................................
..
.....................................................................................................................................................................................................................................................
2
4
6
8
10
14
Um outro exemplo que apresentamos e o do histograma seguinte.
...
..............................
..
...
..
..
...
..
..
...
..
..
...
..
..
...
..
..
...
..
..
...
.
..
...
...........................
..
...
...
..
...
..
...
..
...
.
..
...
.
...
.
..
.
.
.
...
...
..
............................
...
...
...
..
..
...
...
...
...........................
..
.
.
...............................................................................................................................
0
1

57

2.2 - Variaveis estatsticas contnuas

Face a um conjunto de dados a partir do qual foi possvel construir o histograma acima
podemos comecar por admitir que a funcao densidade da variavel aleatoria em estudo e da
forma:
 1
t
se t [0, 1]
f (t) =
,
0
se t 6 [0, 1]
onde e um parametro real superior a 1, desconhecido.
A func
ao cumulativa associada a uma variavel estatstica contnua e uma funcao real de
variavel real F : IR [0, 1] com expressao analtica:

F (x) =

f1 axa

1 a0

xa1

F1 + f2 a2 a1

...

xa

Fk1 + fk ak ak1

k1

se x < a0
se a0 x < a1
se a1 x < a2
...
se ak1 x < ak
se x ak

Ao seu grafico damos o nome de curva cumulativa. Apresentamos seguidamente um exemplo


de uma curva cumulativa.

...

F
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.............................................
.
.
.
.
.
.
.
.
.
.
.
.
.
1 ....
.
.
.
.
.
.
.
..........
.
.
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7/8 ......
.......
...
.....
.
.
.
...
..
.....
.
.
.
.
.
.
.
.
.
.
5/8 .
.....
..
......
.
.
.
.
.
.
7/16 ......
............
.......
................
.
.
.
3/8 . .....
.. ....
.. ......
..
.
.
.
1/8
.
.
.
..... ...
.
.
.
.
.
........................................................................................................................................................................................................................................................................
1
0
1
2
3
4
5
6
O papelque a func
ao cumulativa desempenha perante os dados, em relacao `a funcao de
distribuicao da vari
avel aleatoria subjacente, e exactamente o mesmo papelque desempenha
o polgono de frequencias relativamente `a funcao densidade.
Nas circunstancias em que estamos na presenca de uma variavel estatstica contnua, definimos quantil de ordem p, para p ]0, 1[, `a custa da funcao cumulativa, como alias fizemos no
caso em que a vari
avel era discreta. Concretamente, o quantil de ordem p e o n
umero real q(p)

58

Captulo 2: Estatstica Descritiva

que verifica
F (q(p)) = p, p ]0, 1[.
Relativamente `a questao da presenca de assimetrias sao validas as desigualdades que as
tambem valida a
definem no caso em que dispomos de uma variavel estatstica discreta. E
interpretacao que fazemos do grafico de extremos e quartis.
Na situac
ao particular em que dispomos de uma variavel contnua, tendo sido ja perdidaa
amostra inicial (so dispomos das classes e das respectivas frequencias), para determinar aproximacoes para a media e para a variancia, entre outros parametros, usamos a variavel das
marcas que denotamos por X . Esta variavel estatstica e discreta e assume exactamente os
valores correspondentes aos pontos medios das classes. Seguidamente consideram-se as aproximacoes
x x e sn sn
Para finalizar este captulo, observamos que no caso do histograma dar alguma evidencia `a
normalidade da distribuic
ao da vari
avel aleatoria em estudo, podemos afirmar que:

O intervalo (x sn , x + sn ) contem aproximadamente 68% dos valores amostrais;

O intervalo (x 2sn , x + 2sn ) contem aproximadamente 95% dos valores amostrais;

O intervalo (x 3sn , x + 3sn ) contem aproximadamente 100% dos valores amostrais.

Exerccio 2.3.1 Fez-se um estudo acerca da idade em que e diagnosticada uma certa
doenca, obtendo-se os seguintes registos: 18, 18, 25, 19, 23, 20, 42, 18, 21, 18, 18, 20, 18, 18,
20, 18, 19, 28, 17, 18. Calcule a media, o desvio padr
ao e os quartis da amostra. Construa o
diagrama de extremos e quartis. Nota-se alguma concentraca
o especial dos valores?
Exerccio 2.3.2 As notas de 50 alunos num exame foram
8.6
10.6
11.4
11.6
12.2

12.1
12.6
13.0
13.2
13.4

13.6
13.8
13.8
14.0
14.2

14.4
14.6
14.8
15.2
15.4

15.8
16.1
16.4
17.4
18.2

10.2
11.0
11.6
11.8
12.2

12.4
12.8
13.0
13.2
13.6

13.8
13.8
14.0
14.0
14.2

14.6
14.8
15.0
15.2
15.6

15.8
16.4
17.0
17.8
19.2

1. Determine a media, a vari


ancia e os quartis desta amostra.
2. Construa um histograma de frequencias relativas e o gr
afico de extremos e quartis.
3. Por que motivo podemos comecar por ajustar uma distribuica
o normal `
a vari
avel X?
Exerccio 2.3.3 Considere a seguinte amostra observada de uma vari
avel aleat
oria X.

59

2.2 - Variaveis estatsticas contnuas

-17,53
-4,73
1,13
3,87
7,68
13,54

-12,07
-3,92
1,14
3,97
8,32
13,68

-9,72
-3,85
1,15
4,13
9,26
14,24

-8,46
-3,02
1,17
4,24
10,26
14,33

-7,00
-2,06
1,48
4,54
10,62
16,19

-6,74
-1,98
1,60
4,59
11,15
16,27

-6,44
-,37
2,07
5,14
11,44
16,85

-6,25
-,05
2,32
6,77
12,72
17,65

-6,03
-,03
3,00
7,60
13,12
19,85

-4,83
,94
3,70
7,66
13,52
25,1

1. Determine estimativas para a media e para a vari


ancia de X.
2. Determine os quartis desta amostra.
3. Construa um histograma e o gr
afico de extremos e quartis.
4. Por que motivo podemos comecar por ajustar uma distribuic
ao normal `
a vari
avel X?
Exerccio 2.3.4 Considere a seguinte amostra observada de uma vari
avel aleat
oria Y .
0,02
0,30
0,60
1,08
2,04
2,81

0,03
0,33
0,81
1,09
2,19
3,34

0,05
0,34
0,84
1,19
2,20
3,44

0,07
0,35
0,87
1,26
2,21
3,82

0,08
0,35
0,90
1,29
2,27
3,96

0,21
0,43
0,92
1,54
2,30
4,39

0,23
0,47
0,96
1,65
2,32
4,45

0,26
0,49
0,98
1,76
2,38
4,88

0,26
0,49
0,99
1,84
2,43
5,63

0,29
0,52
1,05
1,84
2,50
6,01

1. Determine a media, a vari


ancia e os quartis desta amostra.
2. Construa um histograma e o gr
afico de extremos e quartis. Qual a distribuic
ao que se
pode comecar por ajustar `
a v.a. Y ?
Exerccio 2.3.5 Considere a seguinte amostra observada de uma vari
avel aleat
oria W .
4,02
4,23
4,46
4,78
5,74
6,33

4,04
4,23
4,47
4,78
5,78
6,36

4,10
4,24
4,48
5,11
5,79
6,41

4,10
4,26
4,59
5,14
5,88
6,44

4,12
4,28
4,59
5,30
5,92
6,55

4,12
4,34
4,60
5,41
6,06
6,70

4,14
4,35
4,68
5,45
6,10
6,80

4,16
4,38
4,72
5,46
6,17
8,36

4,19
4,38
4,73
5,49
6,24
9,44

4,21
4,41
4,75
5,58
6,30
9,73

1. Determine a media, a vari


ancia e os quartis desta amostra.
2. Construa um histograma e o gr
afico de extremos e quartis. Qual a distribuic
ao que se
pode comecar por ajustar `
a v.a. W ?

Exerccio 2.3.6 Considere a seguinte amostra observada de uma vari


avel aleat
oria U .
0,11
0,36
0,71
1,22
1,83
2,20

0,13
0,38
0,79
1,29
1,84
2,22

0,16
0,42
0,85
1,34
1,87
2,30

0,16
0,42
0,87
1,49
1,99
2,32

0,18
0,46
0,95
1,52
2,03
2,60

0,20
0,47
0,98
1,57
2,08
2,76

0,29
0,56
1,02
1,58
2,10
2,78

0,30
0,62
1,04
1,61
2,11
2,81

0,30
0,66
1,04
1,68
2,15
2,86

0,31
0,68
1,05
1,73
2,17
2,95

60

Captulo 2: Estatstica Descritiva

1. Determine a media, a vari


ancia e os quartis desta amostra.
2. Construa um histograma e o gr
afico de extremos e quartis. Qual a distribuic
ao que se
pode comecar por ajustar `
a v.a. U ?
Exerccio 2.3.7 Considere a seguinte amostra observada de uma vari
avel aleat
oria V .
-1,99
-1,33
-0,64
-0,08
0,61
1,40

-1,98
-1,25
-0,50
0,07
0,70
1,46

-1,96
-1,23
-0,41
0,08
0,82
1,49

-1,94
-1,14
-0,33
0,12
0,92
1,71

-1,89
-1,12
-0,30
0,14
1,01
1,72

-1,86
-1,06
-0,25
0,16
1,07
1,74

-1,78
-1,02
-0,23
0,23
1,11
1,76

-1,61
-00,98
-0,21
0,29
1,26
1,79

-1,45
-0,96
-0,13
0,41
1,30
1,80

-1,42
-0,93
-0,09
0,51
1,31
1,89

1. Determine estimativas para a media e para a vari


ancia de V .
2. Determine os quartis desta amostra.
3. Construa um histograma e o gr
afico de extremos e quartis. Qual a distribuic
ao que se
pode comecar por ajustar `
a v.a. V ?
Exerccio 2.3.8 Considere a seguinte amostra observada de uma vari
avel aleat
oria discreta T .
0
2
4

0
2
4

1
3
4

1
3
4

1
3
4

1
3
4

1
3
4

2
3
4

2
3
5

2
3
5

2
3
5

2
3
5

2
3
6

2
3
6

2
3
6

2
3
6

2
3
6

2
4
8

2
4
8

2
4
8

A partir dos valores da media e da vari


ancia desta amostra poderemos negar que T tem uma
distribuica
o de Poisson?
Exerccio 2.3.9 O histograma seguinte foi construdo a partir de uma amostra de nveis
obtidos num teste classificado de 0 a 100.
0.5
0.4
0.3
0.2
0.1
0

20 40 60 80 100

1. Entre os nveis 20 e 40 houve 10% dos alunos. Determine uma aproximac


ao para a
percentagem de alunos que obteve nvel entre 60 e 80. Determine uma aproximac
ao para
a percentagem de alunos com nvel pelo menos 60.
2. Calcule aproximac
oes para a media, para a mediana e para os quartis da referida amostra.

Captulo 3

Estatstica Inferencial
Ninguem melhor se engana quando consente que o enganem os outros...
Jose Saramago

3.1

Introduc
ao

No estudo de um fenomeno ao qual esta associada uma variavel aleatoria temos por objectivo
legtimo conhecer a distribuic
ao dessa mesma variavel. Por exemplo, para a variavel aleatoria X
que representa a amplitude de tempo que decorre entre duas falhas consecutivas de determinado
tipo de bombas instaladas em estac
oes de aguas residuais, estamos interessados em aproximar
a probabilidade de X assumir valores que nao excedam um valor de referencia t0 , isto e,
P (X t0 ). No mesmo contexto, podemos estar interessados em estudar a probabilidade
de que o n
umero de falhas do mesmo tipo de bombas, registados num ano, seja superior a
2. Concretamente, considerando a variavel aleatoria Y que representa tal n
umero de falhas,
pretendemos uma aproximac
ao para P (Y > 2). Ha assim que conhecer a forma da distribuic
ao
de tais vari
aveis aleatorias, aproximar os seus parametros desconhecidos, avaliar a precisao de
tais aproximac
oes, validar a distribuicao que se comecou por ajustar e, por fim, aproximar tais
probabilidades. Esta e uma entre as m
ultiplas abordagens que se podem fazer a um problema
concreto de Engenharia, usando a Estatstica Inferencial.
Suponhamos agora que estudamos o caudal maximo anual de uma seccao de determinado
curso de agua e que estamos interessados em aproximar o n
umero medio de anos hidrologicos
que decorrem entre duas excedencias de um valor elevado u, previamente fixado. Neste caso,
pretendemos aproximar a media de uma variavel aleatoria com distribuicao geometrica, ficando no ambito da Estatstica Inferencial todas as questoes relacionadas com a obtencao de
aproximac
oes para o parametro p de tal distribuicao. Por outro lado, um assunto com igual
relevancia em estudos hidrologicos diz respeito `a determinacao do valor u que tem probabilidade, por exemplo 0.05, de ser excedido pelo caudal de uma seccao de determinado curso
de agua. Denotando por Q a vari
avel aleatoria que representa o referido caudal, pretendemos
determinar, pelo menos de forma aproximada, o quantil de probabilidade 0.95 da distribuic
ao
de Q. Por outras palavras, e nosso objectivo obter um valor de caudal elevado u que tem uma
probabilidade de ser excedida aproximadamente igual a 0.05.
61

62

Captulo 3: Estatstica Inferencial

Dada a forma como se entrelacam a Teoria das Probabilidades e a Estatstica Inferencial (Estatstica Indutiva ou Inferencia Estatstica) nao e facil estabelecer uma fronteira entre
estas duas disciplinas. Na verdade, ainda que a Teoria das Probabilidades possa existir e
evoluir de forma independente, a Estatstica Inferencial gera-se e desenvolve-se sempre acompanhada por conceitos de natureza probabilstica. Nos exemplos concretos de fenomenos aos
quais estao associadas uma ou mais variaveis aleatorias reais, podemos afirmar, grosso modo,
que os propositos da Teoria das Probabilidades e da Estatstica Inferencial sao de certo modo
inversos. No ambito da Teoria das Probabilidades, partindo de modelos matematicos envolvendo variaveis aleatorias e as suas distribuicoes, determinamos parametros, probabilidades,
distribuicoes relacionadas com estas, etc. Do ponto de vista da Estatstica Inferencial faz-se
um estudo percorrendo uma trajectoria que se inicia a partir da Estatstica Descritiva e que
se encerra com o conhecimento da distribuicao de uma ou varias variaveis aleatorias ou com
a construcao de modelos matematicos, envolvendo varias variaveis aleatorias, que se ajustem
convenientemente aos dados observados.
Assim, a Estatstica Inferencial tem por objectivo a construcao de metodologias que permitam estabelecer modelos envolvendo variaveis aleatorias que descrevam, com o maior rigor
possvel, fenomenos aleatorios observaveis, partindo de observacoes recolhidas por amostragem.
No contexto em que se insere este curso a trajectoria de estudo a que nos referimos acima
comeca com o tratamento de dados (que constituem a amostra da variavel aleatoria em estudo)
do ponto de vista restrito da Estatstica Descritiva, ao que se segue o enquadramento da distribuicao da vari
avel aleatoria subjacente numa famlia de distribuicoes (normal, exponencial,
Poisson, etc). Devemos observar que este enquadramento e, numa primeira analise, efectuado
de forma meramente visual, comparando, por exemplo para variaveis aleatorias contnuas, a
forma generica do histograma (ou do polgono de frequencias associado) com a forma generica
da densidade de cada famlia de leis. No entanto, esta comparacao pouco decisiva, pode nao ser
simples, tendo que contar muitas vezes com o conhecimento que o Estatstico tem do fenomeno.
Seguidamente, sera nosso objectivo especificar a distribuicao da variavel aleatoria em estudo,
estimando os seus parametros desconhecidos com metodos de estimacao pontual e intervalar,
ao que se seguira a validac
ao da referida distribuicao. Tal validacao e levada a cabo usando
os chamados testes de ajustamento ou de adequacao de uma lei. A questao de, por exemplo,
decidir se, face a uma determinada amostra observada, um determinado valor concreto para
um parametro e aceitavel, coloca-nos perante a construcao de um teste estatstico parametrico.
Numa segunda parte deste captulo estudamos modelos de regressao linear simples que nao
sao mais do que modelos matematicos com os quais se pretende descrever uma relacao linear
existente entre uma vari
avel aleatoria, que se supoe normal, e uma variavel nao aleatoria sujeita
`a influencia de uma perturbac
ao aleatoria.

Uma amostra observada de dimensao n que e constituda por valores assumidos por uma
variavel aleatoria X pode ser entendida como um valor assumido por um vector de variaveis
aleatorias, todas com a distribuic
ao de X. Surge assim o conceito de amostra aleatoria da
variavel X como vector de vari
aveis aleatorias independentes e todas com a distribuicao de
X. Alguns dos valores numericos associados a uma amostra observada, como a media e a
variancia, possuem caractersticas, respeitantes quase sempre `a sua legitimidade para aproximar
os correspondentes parametros da vari
avel aleatoria subjacente `a amostra, que nao sao mais do

63

3.2 - Distribuic
oes amostrais

que consequencias das propriedades da amostra aleatoria. Algumas dessas propriedades serao
apresentadas numa secc
ao inicial sobre distribuicoes amostrais.

3.2

Distribuic
oes amostrais

Uma amostra aleatoria de uma vari


avel aleatoria X e um vector (X1 , X2 , ..., Xn ) com n variaveis
aleatorias independentes e todas com a distribuicao de X.
Dada uma amostra aleatoria chamamos media amostral `a variavel aleatoria
n

1X
Xi
n

Xn =

i=1

e chamamos vari
ancia amostral `a variavel aleatoria
Sn2 =

i=1

i=1

1 X 2
1 X
n
2
X n.
(Xi X n )2 =
Xi
n1
n1
n1

Observa
c
ao 3.2.1 A media amostral tambem se denota por X e a vari
ancia amostral
2
por S .
Proposi
c
ao 3.2.1 Seja X uma vari
avel aleat
oria que admite vari
ancia e (X1 , X2 , ..., Xn )
uma amostra aleat
oria de X. Tem-se E(X n ) = E(X), V ar(X n ) = V ar(X)/n e E(S 2 ) =
V ar(X).
Prova. Com efeito,
E(X) = E(

i=1

i=1

1X
1X
Xi ) =
E(Xi )
n
n

e, atendendo a que todas as vari


aveis X1 , , Xn tem a mesma media, vem
n

E(X) =

1X
E(X) = E(X).
n
i=1

Por outro lado, atendendo a que a soma de variaveis aleatorias independentes tem variancia
igual `a soma das vari
ancias das variaveis envolvidas nessa soma, temos
n

i=1

i=1

i=1

X
1X
1
n
1X
V ar(X) = V ar(
Xi ) = 2 V ar(
V ar(Xi ) = 2 V ar(X).
Xi ) = 2
n
n
n
n
Para provar que E(S 2 ) = V ar(X) notemos que
n

i=1

i=1

n
1 X 2
1 X
2
(Xi X)2 =
Xi
X
S =
n1
n1
n1
2

e recordemos que E(X 2 ) = V ar(X) + (E(X))2 . Assim

64

Captulo 3: Estatstica Inferencial

E(S 2 )

1
n1

n
X
i=1

E(Xi2 )

n
2
E(X )
n1
2)
ar(X) + (E(X))

n
n1 (V

ar(X) + (E(X))2 )

n
n1 (V

n
n1 (V

ar(X) + (E(X))2 )

V ar(X)
n
n1 (
n

n
n1 V

1
n1 V

ar(X)

+ (E(X))2 )

ar(X) = V ar(X).

O resultado que apresentamos de seguida da legitimidade `a media da amostra como aproximacao da media ou esperanca matematica da variavel aleatoria que descreve os resultados de
um fenomeno que se pretende estudar. Devemos notar que, como se espera, tal aproximacao
melhora com o aumento da dimensao da amostra.
Proposi
c
ao 3.2.2 (Lei dos grandes n
umeros) Sejam X1 , X2 , , Xn , vari
aveis aleat
orias
independentes e todas com a mesma distribuic
ao de esperanca matem
atica m. Ent
ao, para todo
o > 0, tem-se
P (|X n m| ) 1, n +.
A normalidade assint
otica da vari
avel aleatoria media amostral decorre imediatamente como
corolario do Teorema Limite Central.
Proposi
c
ao 3.2.3 (Corol
ario do Teorema Limite Central) Sejam X1 , X2 , ..., Xn vari
aveis
aleat
orias independentes e todas com a mesma distribuic
ao. Se E(X1 ) = m e V ar(X1 ) = 2 ,
ent
ao


Xn m
x = P (Z x), x IR,
lim P
n+
/ n
onde Z N (0, 1).

Observac
ao: Nas condic
oes da proposicao 3.2.3 usamos a notacao X N (m, n ) ou equi
N (0, 1).
valentemente Xm
/ n
No caso particular em que X tem distribuicao normal a estabilidade da lei normal permite2
nos concluir que X N (m, n ). Alem disso, a normalidade da distribuicao de X permite-nos
estabelecer a distribuic
ao exacta de S 2 . Estes resultados encontram-se na proposicao que
apresentamos de seguida.

Proposi
c
ao 3.2.4 Se X N (m, 2 ) e (X1 , X2 , ..., Xn ) e uma amostra aleat
oria de X,
ent
ao
ao independentes;
1. X e S 2 s
2

2. X N (m, n );
3.

n1 2
S
2

2n1 .

65

3.3 - Estimac
ao parametrica pontual

Em resumo, relativamente `a distribuicao da media amostral podemos afirmar o seguinte:


2

se X N (m, 2 ), ent
ao X N (m, n );
se X nao tem lei normal (ou no caso em que tal distribuicao e desconhecida) usamos
2

o facto de se ter X N (m, n ).


Relativamente `a distribuic
ao da variancia amostral podemos afirmar que:
S 2 2n1 ;
se X N (m, 2 ), ent
ao n1
2
se X n
ao tem lei normal nao ha resultados a registar para a lei de S 2 .

3.3

Estimac
ao param
etrica pontual

Seja X uma vari


avel aleatoria para a qual se postulou uma lei com funcao de distribuicao F que
depende de um parametro IRk , desconhecido. No ambito da estimacao parametrica pontual,
supondo F conhecida (a menos do parametro ) e nosso objectivo estudar algumas metodologias
que permitam determinar boas aproximacoes para , usando obviamente a amostra observada
de X.
Defini
c
ao 3.3.1 Dada uma amostra aleat
oria (X1 , X2 , ..., Xn ) de X, damos o nome de
estimador ou estimatriz de a uma vari
avel aleat
oria que seja func
ao de (X1 , X2 , ..., Xn ) e que
n
ao dependa de .
Uma primeira propriedade que podemos avaliar num estimador diz respeito ao facto de este
ter por media ou esperanca matematica o verdadeiro valor do parametro . Concretamente,
 um

estimador do parametro , que representamos por n , diz-se centrico ou centrado se E n =


 
. Em caso contr
ario diz-se enviesado ou com vies. Se lim E n = dizemos que n e
n+

assintoticamente centrico.

Exemplo 3.3.1 Dada uma amostra aleat


oria (X1 , , Xn ) da vari
avel aleat
oria X de
media m e vari
ancia 2 , os estimadores X e S 2 s
ao centricos para m e 2 , respectivamente,
como podemos comprovar usando a proposic
ao 3.2.1.
Na presenca de uma amostra observada damos o nome de estimativa ao valor concreto
comum denotar a estimativa usando as letras min
do estimador. E
uscula correspondente `a
mai
uscula com que se denota o estimador. Por exemplo x e X, s2 e S 2 , etc. Para a amostra
1
2
1

2
0
2

2
3
3

0
2
3

0
3
1

1
2
3

1
2
7

3
2
1

1
2
1

0
2
4

2
0
1

3
1
4

0
1
3

1
4
2

0
1
2

1
2
3

4
3

as estimativas para a media e para a variancia da variavel aleatoria subjacente a estes dados
sao x = 1.9 e s2 = 1.8877.

66

Captulo 3: Estatstica Inferencial

Neste curso apresentamos apenas um metodo para obtencao de estimadores. O metodo dos
momentos que passamos a expor.
Suponhamos que a func
ao de distribuicao da variavel aleatoria X depende do parametro
k
= (1 , 2 , , k ) IR e seja (X1 , , Xn ) uma amostra aleatoria de X. Suponhamos que
existe o momento simples de ordem k de X (o que implica a existencia de todos os momentos
de ordem inferior a k), ou seja E(X k ), e consideremos o momento emprico de ordem k de X
n
1X k
Xi .
definido por
n
i=1

Defini
c
ao 3.3.2 Se existir uma func
ao g com valores em IRk , para a qual se tem
= g(E(X), E(X 2 ), , E(X k )),
ent
ao o estimador de obtido pelo metodo dos momentos, que representamos por n , e definido
por
n
n
1X k
1X 2
n = g(X n ,
Xi , ,
Xi ).
n
n
i=1

i=1

Exemplo 3.3.2 Seja X uma vari


avel aleat
oria com distribuic
ao B(r, p) com r conhecido
e p desconhecido. Uma vez que E(X) = rp, obtemos trivialmente X = rpn . Assim o estimador
de p, obtido pelo metodo dos momentos, e pn = Xrn .
Exemplo 3.3.3 Suponhamos que a vari
avel aleat
oria X possui distribuic
ao E(a, b), isto
e, com densidade
f (x) = aea(xb) I[b,+[ (x), x R.
Atendendo a que E(X) = b +

E(X) = b + a1

V ar(X) =

1
a2

1
a

e que V ar(X) = a12 vem

E(X) = b + a1

1
2
2
E(X ) (E(X)) = a2

b = E(X) E(X 2 ) (E(X))2

a=
2
2
E(X )(E(X))

Consequentemente o estimador de (a,b), gerado pelo metodo dos momentos, e

v
r
u n

u X 2

1
1
n 1 2
2
t1
v
r
,
X
, Xn
(
an , bn ) =
Xi X
Sn
=
u n

n
n
n

1
u 1 X

i=1
2
2
S
2
t

Xi X
n
n
i=1

Observa
c
ao 3.3.1 1. Usaremos, indistintamente, as designac
oes estimador de (a,b)e
estimadores de a e de b.
n1 2
2. Para grandes valores de n podemos substituir S 2 por
S .
n

67

3.3 - Estimac
ao parametrica pontual


Exemplo 3.3.4 Seja X uma vari
avel aleat
oria que possui uma lei N m, 2 . Atendendo
a que E(X) = m e V ar(X) = E(X 2 ) (E(X))2 , conclumos que os estimadores de m e 2 , gen
1X 2
n1 2
2
2
rados pelo metodo dos momentos, s
ao m
n = Xn e
Xi X =
n =
Sn . Verificamos
n
n
i=1

que o estimador de m e centrico para m e que o estimador de 2 e apenas assintoticamente


centrico para 2 .

Exemplo 3.3.5 Seja X uma vari


avel aleat
oria com distribuic
ao U ([a, b]). Neste caso
(ba)2
a+b
tem-se E(X) = 2 e V ar(X) = 12 . Para encontrar o estimador de (a, b) gerado pelo
metodo dos momentos, h
a que considerar o sistema
(
a + b = 2E(X)
(ba)2
= E(X 2 ) (E(X))2
12
que e equivalente a

a = E(X) 3(E(X 2 ) (E(X))2 )

b = E(X) +

3(E(X 2 ) (E(X))2 )

pois b a > 0. Assim, o estimador de (a, b), gerado pelo metodo dos momentos, e definido por

q
2

n = X n 3 n1

a
n S
.
q

n1 2
b
3
S
n = Xn +
n

Exemplo 3.3.6 Suponhamos que a vari


avel aleat
oria X tem distribuic
ao U ([, ]), com
2
> 0. Atendendo a que se tem E(X) = 0 e V ar(X) = E(X 2 ) = 3 o estimador de , obtido
pelo metodo dos momentos, verifica a equac
ao
n
1 X 2 bn2
Xi =
n
3
i=1

da qual resulta

v
u n
u3 X 2
b
n = t
Xi ,
n
i=1

pois > 0.

Exerccio 3.3.1 O ponto de fus


ao de 24 pecas de chumbo e medido, obtendo-se os registos
seguintes (em graus centgrados):
330.0, 328.6, 342.4, 334.0, 337.5, 341.0, 343.3, 329.5, 322.0, 331.0, 340.4, 326.5
327.3, 340.0, 331.0, 332.3, 345.0, 342.0, 329.7, 325.8, 322.6, 333.0, 341.0, 340.0.
Determine uma aproximac
ao para a probabilidade de uma porc
ao de chumbo apresentar um
o
ponto de fus
ao inferior a 335 C, supondo que a distribuic
ao destas temperaturas e N (m, 2 ).

68

Captulo 3: Estatstica Inferencial

Exerccio 3.3.2 Seja (X1 , . . . , Xn ) uma amostra aleat


oria de uma vari
avel contnua de
densidade f (x) = e(x) 1I[,+) (x), x IR. Determine um estimador para .
Exerccio 3.3.3 Resolva a quest
ao anterior, supondo agora que a densidade e f (x) =
e(x1) 1I[1,+) (x), x IR.
Exerccio 3.3.4 Considere a seguinte amostra: 0.892, 0.249, 0.410, 0.017, 0.908, 0.008,
0.389, 0.032, 0.001, 0.001, 0.210, 0.678, 0.036, 0.006, 0.374, 0.001, 0.012, 0.253, 0.084, 0.001.
O seu histograma sugere que e razo
avel admitir que a densidade da vari
avel aleat
oria subja
cente, X, e da forma f (x) = ( +1) x 1I[0,1] (x), x IR, onde > 1. Calcule uma aproximaca
o
para P (X > 0.5).
Exerccio 3.3.5 Seja X a v.a. que representa o n
umero de problemas resolvidos por um
estudante ate que acerte o primeiro.
1. Qual e a distribuic
ao de X?
2. Ao consultar 20 estudantes obtivemos a seguinte amostra de X:
2, 3, 1, 5, 6, 3, 4, 6, 3, 2, 10, 9, 2, 1, 1, 2, 4, 5, 2, 1.
(a) Estime o(s) par
ametro(s) desconhecido(s) da distribuic
ao de X.
(b) Determine uma aproximac
ao para a probabilidade de, ao resolver um problema, um
estudante o acertar.
Exerccio 3.3.6 A partir do instante de abertura de um guichet registam-se os momentos
de chegada de novos clientes (em minutos): 10, 20, 25, 27, 33, 40, 50, 68, 72, 80, 100, 102,
115, 120, 126, 150, 180, 182, 189, 250, 288.
1. A vari
avel aleat
oria que descreve o intervalo de tempo entre duas chegadas consecutivas e
suposta seguir uma distribuic
ao exponencial com densidade f (x) = ex 1I[0,+) (x), x
IR. Calcule uma aproximac
ao para .
2. A vari
avel aleat
oria que conta o n
umero de clientes por cada intervalo de 20 minutos
e suposta seguir uma distribuic
ao de Poisson de par
ametro . Qual a probabilidade de,
num intervalo de 20 minutos, chegarem pelo menos 3 novos clientes?
Exerccio 3.3.7 Uma associac
ao de pasteleiros de Soure confecciona p
ao-de-l
o que vende
directamente a uma cadeia de hipermercados. Com o objectivo de estudar o tempo, expresso
em horas, necess
ario `
a confecca
o de uma remessa di
aria recolheu-se uma amostra de dimens
ao
100, (t1 , . . . t100 ), que deu origem ao seguinte histograma:
..
................
56.....
..
.. ...
..
.. ....
..
.. ...
..
. ..
................. .....
28.....
..
.. ... ...
. ... ..
..
................. .... .....
12.....
. . .
3 ........................................................................................
0.2
1

69

3.4 - Testes de ajustamento

Seja T a vari
avel aleat
oria que representa o tempo necess
ario `
a confecc
ao de cada uma das
remessas.
1. Justifique por que motivo se pode ajustar a T uma distribuic
ao com func
ao densidade:
 1
t
se t [0, 1]
f (t) =
,
0
se t 6 [0, 1]
onde e um par
ametro real superior a 1, desconhecido. Esboce o gr
afico de f .
2. Mostre que E(T ) =

+1 .

3. Considere que (T1 , T2 , ..., Tn ) e uma amostra aleat


oria de T . Determine o estimador para
obtido pelo metodo dos momentos.
4. Determine uma estimativa para , usando a amostra referida para a qual se tem

100
X

ti = 77.55.

i=1

5. Determine uma aproximac


ao para E(T ).
Exerccio 3.3.8 Represente por X uma vari
avel aleat
oria com distribuic
ao U ([, + ]),
isto e, com densidade
 1
se x [, + ] ,
f (x) =
0 se x
/ [, + ]

onde e um par
ametro real desconhecido. Determine um estimador centrico de .

Exerccio 3.3.9 O aumento de caudal de uma secc


ao de um rio durante o mes de Janeiro
e representado por uma vari
avel aleat
oria X de media E(X) = e+0.5 , onde e um par
ametro
desconhecido. Determine um estimador de , usando o metodo dos momentos.
Exerccio 3.3.10 O desconto (expresso em unidades de cinco mil euros) que um concession
ario autom
ovel faz na venda de autom
oveis ligeiros de determinada gama e representado
por uma vari
avel aleat
oria contnua X. A partir de uma amostra de X foi construdo um
histograma que permitiu concluir que X possui densidade da forma

( + 1)(x 51 ) se x [ 15 , 65 ]
f (x) =
,

0
se x
/ [ 51 , 65 ]

onde > 1 e um par


ametro desconhecido. Dispomos de uma amostra de X que apresenta
media x = 0.8.
1. Sabendo que E(X) =
tiva de .

+1
+2

+ 51 , use o metodo dos momentos para determinar uma estima-

2. Determine uma aproximac


ao para P (X 35 ).

70

Captulo 3: Estatstica Inferencial

3.4
3.4.1

Testes de ajustamento
Generalidades sobre testes

Retomemos o contexto do exemplo 1.4.1 e denotemos por X a variavel aleatoria que representa
o peso de determinado tipo de automoveis. Na presenca de um histograma associado a uma
amostra desta vari
avel aleatoria que de alguma evidencia `a normalidade de X podemos colocar
varias questoes. Por exemplo, podemos considerar que a distribuicao de X e de facto normal?
Para responder a questoes deste tipo, pretendemos gerar um procedimento estatstico que,
colocando em confronto os dados disponveis e a hipotese de normalidade da distribuicao de
X, permita decidir acerca da veracidade desta hipotese. No mesmo estudo podera tambem ser
nosso objectivo averiguar se a esperanca matematica de X pode ser considerada igual a 15KN
ou se, em contrapartida, dever
a ser considerada superior a tal valor. Questoes similares podem
em contextos desta natureza que surgem os testes
ser formuladas sobre a vari
ancia de X. E
estatsticos ou ensaios de significancia que sao, como ja dissemos, procedimentos estatsticos que
permitem, a partir da amostra observada, tomar uma decisao sobre a veracidade de uma entre
duas hipoteses antag
onicas, acerca da forma da distribuicao ou de parametros da distribuic
ao
de variaveis ou de vectores aleatorios. Notamos que nos estudos mais complexos, em que os
modelos matematicos, construdos para descrever fenomenos de interesse, envolvem um grande
n
umero de vari
aveis e consequentemente (ou nao) tambem um grande n
umero de parametros, os
testes estatsticos, ainda que menos simples, tem sempre por base estabelecer um contraponto
entre duas hipoteses alternativas, usando para tal a amostra observada.
Suponhamos ent
ao que pretendemos testar uma hipotese H0 - hipotese nula ou privilegiada
- contra uma hipotese alternativa H1 , ambas relacionadas com a distribuicao de uma variavel
nosso objectivo tomar uma
aleatoria X (com a forma ou com parametros da distribuicao). E
decisao, a que chamaremos decisao estatstica, acerca da veracidade de uma destas hipoteses,
usando para tal uma amostra observada (x1 , ..., xn ) da variavel aleatoria X.
Atendendo a que neste contexto H0 e verdadeira ou falsa, podemos cometer dois erros
distintos:
Erro de tipo I - erro que se comete ao rejeitar H0 , quando H0 e verdadeira.
Erro de tipo II - erro que se comete ao nao rejeitar H0 , quando H0 e falsa.
Defini
c
ao 3.4.1 Chamamos nvel de signific
ancia de um teste estatstico `
a probabilidade
de rejeitar H0 quando H0 e verdadeira.
O nvel de significancia e usualmente denotado por .
Defini
c
ao 3.4.2 Uma estatstica de teste e uma vari
avel aleat
oria, func
ao da amostra, que
estabelece o confronto entre os dados e a hip
otese H0 e sobre a qual baseamos a nossa decis
ao
estatstica (conclus
ao final).
Defini
c
ao 3.4.3 Damos o nome de regi
ao crtica de um teste, que se representa por C, ao
conjunto dos valores que a estatstica de teste pode assumir e que conduzem `
a rejeic
ao de H0 .
Observemos que tendo em conta a definicao de nvel de significancia de um teste estatstico,
tem-se
= P (C/H0 verdadeira).

71

3.4 - Testes de ajustamento

3.4.2

Teste do Qui-Quadrado como teste de ajustamento

Ao construir um teste estatstico para validar uma determinada distribuicao, a que chamaremos teste de ajustamento, podemos colocar na hipotese H0 a distribuicao completamente
especificada ou nao. Concretamente, podemos formular hipoteses do tipo
H0 : X segue uma lei normal
que diz respeito apenas `a forma generica da distribuicao ou
H0 : X segue a lei N (2, 5)
em que se especifica completamente a lei concretizando os seus parametros. Analogamente
podemos colocar, por exemplo, como hipotese nula
H0 : X segue uma lei de Poisson
ou
H0 : X segue a lei P(3).
O teste do qui-quadrado de ajustamento adapta-se a ambos os casos. Todavia, no presente curso apresentamos apenas o caso em que H0 diz respeito a uma lei com parametros
especificados (assumem-se conhecidos depois de estimados).
Seja X uma vari
avel aleatoria para a qual se postulou uma lei L, com parametros especificados, e (X1 , ..., Xn ) uma amostra aleatoria da variavel aleatoria X.
Vamos construir um teste estatstico de hipoteses
H0 : X segue a lei L versus H1 : X nao segue a lei L
Consideremos inicialmente uma particao do suporte da lei L : A1 , A2 , . . . , Am .
Sejam
Nj = {i : Xi Aj } a frequencia absoluta da classe Aj , j = 1, . . . , m,
ej = nP (X Aj ) a frequencia esperada da classe Aj , j = 1, . . . , m, sob a validade de
H0 .
A estatstica do teste e

m
X
(Nj ej )2
Qn =
ej
j=1

a qual, quando H0 e verdadeira, segue assintoticamente a distribuicao 2m1 .


Representando por o nvel de significancia assintotico do teste, a regiao crtica considerada
e
C = [m1 (1 ), +[ ,
onde m1 (1 ) representa o quantil de probabilidade 1 da lei 2m1 , isto e, o valor tal
que
P (Q m1 (1 )) = 1 ,

com Q 2m1 .
Assim a decisao estatstica final e

72

Captulo 3: Estatstica Inferencial

rejeitar H0 se qn m1 (1 )
nao rejeitar H0 se qn < m1 (1 ),
onde qn representa o valor observado da estatstica de teste.
Observa
c
ao 3.4.1 Atendendo a que a lei do qui-quadrado e apenas uma lei aproximada
para a estatstica de teste, devemos usar tal aproximac
ao somente nos casos em que esta e
considerado pela generalidade dos autores de Estatstica
considerada razoavelmente boa. E
que a referida aproximac
ao deve ser usada para valores de frequencias esperadas superiores ou
iguais a 5. Assim, nos exemplos em que se obtem frequencias esperadas inferiores a 5, devemos
proceder ao reagrupamento das classes que constituem a partic
ao inicial do suporte da lei L. Tal
reagrupamento pode ser conseguido, por exemplo, juntando classes adjacentes ou aumentando
as amplitudes das classes com frequencia esperada inferior a 5 e diminuindo consequentemente
as amplitudes das que lhes s
ao contguas.
Exemplo 3.4.1 O tempo (em minutos) que cada pessoa leva a percorrer um determinado trajecto duma cidade, em autom
ovel pr
oprio e em horas de elevado congestionamento
de tr
ansito, e representado por uma vari
avel aleat
oria T . Dispomos de uma amostra de T ,
de dimens
ao 60, que apresenta media igual a 26.024 e vari
ancia igual a 191.619. Sabendo
que a construc
ao do histograma tornou plausvel a hip
otese de normalidade de T , vamos realizar um teste do qui-quadrado, tendo por objectivo validar de forma mais robusta tal hip
otese.
2 = 188.426. Pretendemos ent
s
a
o
testar
Recorde-se que
b2 = 59
60
H0 : T segue a lei N (26.024, 188.426)

contra
H1 : T n
ao segue a lei N (26.024, 188.426).
Consideremos a seguinte partic
ao do suporte da distribuic
ao N (26.024, 191.6192)(que como
sabemos e o conjunto R):
] , 8], ]8, 14], ]14, 20], ]20, 24], ]24, 28], ]28, 32], ]32, 38], ]38, 44], ]44, +[.
No quadro seguinte apresentamos as frequencias observadas associadas a esta partic
ao:

ni

] , 8]
5

]8, 14]
7

]14, 20]
8

]20, 24]
8

]24, 28]
4

]28, 32]
9

]32, 38]
6

]38, 44]
7

]44, +[
6

Sob a validade da hip


otese H0 , obtem-se as seguintes frequencias:
e1
e3
e5
e7
e9

= 60P (T 8) = 5.67496
= 60P (14 < T 20) = 8.39141
= 60P (24 < T 28) = 6.95051
= 60P (32 < T 38) = 8.41037
= 60P (T > 44) = 5.71039.

e2
e4
e6
e8

= 60P (8 < T 14) = 5.75674


= 60P (20 < T 24) = 6.66022
= 60P (28 < T 32) = 6.66696
= 60P (38 < T 44) = 5.77843

Os valores das frequencias esperadas e das frequencias observadas encontram-se no quadro que
apresentamos de seguida.

73

3.4 - Testes de ajustamento

ni
ei

] , 8]
5
5.67496

]8, 14]
7
5.75674

]14, 20]
8
8.39141

]20, 24]
8
6.66022

A estatstica de teste e
Qn =

]24, 28]
4
6.95051

]28, 32]
9
6.66696

]32, 38]
6
8.41037

]38, 44]
7
5.77843

]44, +[
6
5.71039

9
X
(Ni ei )2
i=1

ei

a qual, quando H0 e verdadeira, segue assintoticamente a lei 291 . Considerando um nvel


de signific
ancia assint
otico igual a 0.05 e atendendo a que 8 (0.95) 15.507, a regi
ao crtica
considerada e
C = [15.507, +[.
Como o valor observado da estatstica de teste e
q60 =

9
X
(ni ei )2
i=1

ei

= 3.6692,

o qual n
ao pertence `
a regi
ao crtica, usando tal nvel de signific
ancia, n
ao rejeitamos a hip
otese
H0 . Assim, conclumos que estes dados n
ao s
ao incompatveis com o facto de T possuir uma
distribuic
ao normal.
Exemplo 3.4.2 Considere a vari
avel aleat
oria X que representa o tempo que cada doente
deve esperar para ser atendido num servico de urgencias de um hospital pedi
atrico. Os tempos
de espera (em minutos) relativos a 50 pacientes desse hospital constituem a seguinte amostra:
35
47
22

22
64
10

63
8
25

6
23
27

94
47
37

19
21
58

15
51
39

83
7
10

11
12
13

19
19
28

16
14
72

31
16
13

24
32
51

29
108
45

36
33
77

68
55
16

42
9

a qual apresenta media x = 34.44.


Com base nesta amostra construmos o histograma seguinte com hn = 23.
..
..
.. .........................
...
.. ..
...
.. ..
...
.. ..
...
.. ..
........................
.. ..
...
...
.. ..
..
..
.. ..
..........................
....
.. ..
........................
..
..
.. ..
.
.
.
.
..................................................................................................................................................................................
6
29
75
121
Vamos agora realizar um teste do qui-quadrado para averiguar se X segue de facto uma
distribuic
ao exponencial.
Consideremos inicialmente a mudanca de vari
avel Y = X 6, sendo 6 o mnimo amostral, e apliquemos o teste do qui-quadrado de ajustamento para averiguar se Y segue uma lei
exponencial com par
ametro de localizac
ao = 0. Recordamos que para esta distribuica
o o

74

Captulo 3: Estatstica Inferencial

estimador de , gerado pelo metodo dos momentos e


b = 1/Y . Com esta amostra obtemos a
estimativa
1
= 0.035.

b50 = (y)1 = (x 6)1 =


28.44
Devemos observar que a mudanca de vari
avel Y = X 6, considerada neste exemplo, tem a
vantagem de reduzir para um o n
umero de par
ametros a estimar. Esta mudanca de vari
avel e
fundamentada na propriedade que estabelece a equivalencia entre X E(, ) e X E(, 0)
para quaisquer > 0 e real.
Vamos ent
ao testar H0 : Y segue a lei E(0.035, 0) versus H1 : Y n
ao segue a lei
E(0.035, 0).
Neste exemplo consideramos a partic
ao do suporte da distribuic
ao em teste ([0, +[) construda de modo a que todas as classes tenham frequencia esperada (admitindo H0 verdadeira)
igual a 6.25. Concretamente, tais classes (intervalos) s
ao divididos pelos pontos F 1 (0.125),
1
1
F (0.25), ..., F (0.875) e s
ao neste caso:
[0, 3.8[, [3.8, 8.2[, [8.2, 13.4[, [13.4, 19.8[, [19.8, 28[, [28, 39.6[, [39.6, 59.4[, [59.4, +[.
A amostra acima d
a lugar a uma amostra de Y para a qual se tem a distribuic
ao de
frequencias absolutas que se encontra na tabela seguinte.

ni

[0, 3.8[
4

[3.8, 8.2[
7

[8.2, 13.4[
7

[13.4, 19.8[
6

[19.8, 28[
6

[28, 39.6[
6

[39.6, 59.4[
8

[59.4, +[
6

A estatstica de teste e ent


ao
Qn =

8
X
(Ni ei )2

ei

i=1

8
X
(Ni 6.25)2

6.25

i=1

a qual, quando H0 e verdadeira, segue assintoticamente a lei 281 . Adoptando um nvel


de signific
ancia assint
otico igual a 0.05 e atendendo a que 7 (0.95) 14.07 a regi
ao crtica
considerada e
C = [14.07, +[.
Como o valor observado da estatstica de teste e 1.52, o qual n
ao pertence `
a regi
ao crtica,
usando um nvel de signific
ancia assint
otico igual a 0.05, mantemos a hip
otese H0 . Finalmente
podemos admitir que, para o referido nvel de signific
ancia, X segue a lei E(0.035, 6).
Exemplo 3.4.3 Considere a amostra seguinte de uma vari
avel aleat
oria discreta.
1
2
1

2
0
2

2
3
3

0
2
3

0
3
1

1
2
3

1
2
7

3
2
1

1
2
1

0
2
4

2
0
1

3
1
4

0
1
3

1
4
2

0
1
2

1
2
3.

4
3

A media desta amostra e x = 1.9.


Consideremos o teste do qui-quadrado para testar, ao nvel de signific
ancia assint
otico 0.01,
a hip
otese

75

3.4 - Testes de ajustamento

H0 : X P(1.9)
contra a hip
otese contr
aria. Como o suporte de X e o conjunto
N0 , a partic
ao considerada e
T
{0}, {1}, {2},{3},{4},{5} {6}, [7, +[ N.
Relativamente `
a amostra apresentada podemos construir a tabela seguinte de frequencias
absolutas observadas.
T
0 1
2
3 4 5 6 [7, +[ N
ni 7 14 14 10 4 0 0
1
Sob a validade de H0 , as seguintes frequencias esperadas s
ao:
e1
e3
e5
e7

= 50P (X
= 50P (X
= 50P (X
= 50P (X

= 0) = 7.47843
= 2) = 13.49857
= 4) = 4.06082 < 5
= 6) = 0.488652 < 5

e2
e4
e6
e8

= 50P (X
= 50P (X
= 50P (X
= 50P (X

= 1) = 14.20902
= 3) = 8.54909
= 5) = 1.54311 < 5
7) = 0.172307 < 5.

A existencia de frequencias esperadas inferiores a 5 leva-nos a considerar a seguinte partic


ao
do suporte da lei de Poisson
T
{0}, {1}, {2},{3}, [4, +[ N.
Assim, as frequencias esperadas, obtidas sob a validade de H0 , e as frequencias observadas
s
ao apresentadas na tabela seguinte:
T
0
1
2
3
[4, +[ N
ni
7
14
14
10
5
ei 7.47843 14.20902 13.49857 8.54909
6.09258
A estatstica de teste e ent
ao
Qn =

5
X
(Ni ei )2
i=1

ei

a qual, quando H0 e verdadeira, segue assintoticamente a lei 251 . Para um nvel de signific
ancia assint
otico igual a 0.01, como 4 (0.99) 13.277, a regi
ao crtica considerada e
C = [13.277, +[.
Como o valor observado da estatstica de teste e 0.49448, o qual n
ao pertence `
a regi
ao
crtica, n
ao rejeitamos a hip
otese H0 , usando um nvel de signific
ancia assint
otico igual a
0.01. Ou seja, para o referido nvel de signific
ancia, podemos admitir que X segue uma lei de
Poisson.
Devemos observar que esta seria a conclus
ao final, mesmo para outros nveis de signific
ancia
mais elevados, por exemplo 0.05.

Exerccio 3.4.1 Retome os dados do exerccio 2.3.3. Realize um teste do qui-quadrado,com


um nvel de signific
ancia igual a 0.05, para averiguar se os dados s
ao compatveis com a hip
otese
de X seguir uma distribuic
ao normal.

76

Captulo 3: Estatstica Inferencial

Exerccio 3.4.2 Seja X a v.a. que representa o tempo de funcionamento entre duas
conhecida uma amostra de X, de dimens
falhas de um termo-higr
ografo. E
ao 41, a qual
apresenta media igual a 10.3245 e desvio padr
ao igual a 8.6474. Com o objectivo de averiguar
se X segue uma lei exponencial de densidade f (x) = ex 1I[0,+[ (x), x IR, realize um teste
de ajustamento do qui-quadrado, com nvel de signific
ancia 0.05. As frequencias observadas
encontram-se na tabela seguinte:
ni

]0, 8]
23

]8, 16]
9

]16, 24]
4

]24, 32]
3

]32, 40]
1

]40, 48]
0

]48, +[
1

Exerccio 3.4.3 Retome os dados do exerccio 2.3.5.


1. Estime os par
ametros desconhecidos da distribuic
ao que achou razo
avel ajustar.
2. Realize um teste do qui-quadrado de ajustamento, com um nvel de signific
ancia 0.05,
com o objectivo de averiguar se os dados s
ao compatveis com a referida distribuic
ao.
3. Determine uma aproximac
ao para P (W > 5).
Exerccio 3.4.4 Retome os dados do exerccio 2.3.6.
1. Realize um teste de ajustamento do qui-quadrado, com nvel de signific
ancia 0.05, para
averiguar se estes dados s
ao compatveis com a hip
otese de U seguir a distribuica
o
U ([0, 3]).
2. Determine uma aproximac
ao para P (U > 1).
Exerccio 3.4.5 Retome os dados do exerccio 2.3.7.
1. Admitindo que a vari
avel aleat
oria que gerou a amostra tem distribuic
ao uniforme num
intervalo da forma [, ], construa uma aproximac
ao para .
2. Realize um teste de ajustamento do qui-quadrado, com um nvel de signific
ancia de 0.025,
para averiguar se estes dados d
ao evidencia estatstica `
a referida distribuic
ao.
Exerccio 3.4.6 Retome os dados do exerccio 2.3.8.
1. Realize um teste de ajustamento do qui-quadrado, com nvel de signific
ancia 0.05, que lhe
permita averiguar se estes dados s
ao compatveis com a hip
otese de T seguir a distribuica
o
de Poisson.
2. Determine uma aproximac
ao para P (T > 1).

3.4.3

Teste de Kolmogorov-Smirnov

Seja X uma vari


avel aleatoria contnua e seja (X1 , ..., Xn ) uma amostra aleatoria de X. Consideremos a func
ao de distribuic
ao emprica dada por
Fn (x) =

1
{Xi : Xi x, i = 1, . . . , n} .
n

77

3.4 - Testes de ajustamento

agora nosso objectivo saber se, face a uma amostra observada, podemos admitir que X
E
tem uma determinada func
ao de distribuicao F .
Para testar
H0 : A funcao de distribuicao de X e F
versus
H1 : A funcao de distribuicao de X nao e F
consideramos a estatstica de teste
En =

n sup |Fn (x) F (x)| .


xR

Quando H0 e verdadeira, En segue assintoticamente a lei com funcao de distribuicao


+
X

2 2

(1)k e2k x , x 0

k=
G(x) =
.

0,
x<0

Consequentemente, consideramos a regiao crtica C = [g1 , +[ onde g1 representa o quantil de probabilidade 1 de G, tendo-se assim G(g1 ) = 1 . A funcao de distribuicao G
encontra-se tabelada e tem-se, por exemplo, g0.95 1.36 e g0.99 1.64.

3.4.4

Papel de probabilidade

Seja X uma vari


avel aleatoria contnua. Suponhamos que e nosso objectivo averiguar se podemos comecar por considerar uma determinada funcao de distribuicao F para a variavel aleatoria
X. O papel de probabilidade, que e essencialmente um metodo grafico, constitui um teste de
ajustamento que deve ser usado numa fase inicial a par com o histograma ou em alternativa a
este.
Consideremos x R e p ]0, 1[ tais que
F (x) = p

(3.1)

e a amostra observada ordenada ascendentemente


x1:n x2:n . . . xn:n .
Consideremos as concretizac
oes de x fornecidas pelos valores da amostra x1:n , x2:n , . . . , xn:n
e tomemos as correspondentes n concretizacoes n1 , n2 , , nn para a probabilidade p. Se existir
uma funcao real de vari
avel real h e duas constantes a e b tais que se verifique
h(p) = ax + b,
entao podemos afirmar que h(p) e x estao relacionados linearmente. Assim, de acordo com
(3.1), se ao diagrama de dispersao



i
xi:n , h( ) , i = 1, 2, ..., n ,
n

78

Captulo 3: Estatstica Inferencial

se puder ajustar convenientemente uma recta, podemos validar, ainda que informalmente, a
funcao de distribuic
ao F .
Chamamos papel de probabilidade a este diagrama de dispersao. Observamos que no caso
em que a func
ao h envolve termos do tipo ln(1 p), para contornar o problema que surge com
ln(1 nn ) considera-se o diagrama de dispersao constitudo pelos pontos de coordenadas


i
xi:n , h(
) , i = 1, 2, ..., n.
n+1
Devemos ainda observar que a construcao do papel de probabilidade nao exige a estimacao
previa dos parametros desconhecidos da lei de X.
Exemplo 3.4.4 A vari
avel aleat
oria X tem funca
o de distribuic
ao
F (x) =

0,

1 e(x) ,

x<
,
x

isto e X E(, ). Ora, para p > 0, tem-se


F (x) = p 1 e(x) = p
(x ) = ln(1 p)
ln(1 p) = x
Assim ln(1 p) = ax + b, com a = e b= . 
Um diagrama de dispers
ao dos pontos xi:n , ln 1


i
, i = 1, . . . , n, como o que
n+1
apresentamos de seguida, d
a-nos uma validac
ao informal da hip
otese de exponencialidade da
distribuica
o de X.
ln(1

i ....
41 )...

...


...

...

...
...
..
......................................................................................................................................................................................................................................................................................
xi:40

Exemplo 3.4.5 Suponhamos que pretendemos usar o papel de probabilidade para validar
de forma previa uma distribuic
ao N (m, 2 ) para a vari
avel aleat
oria X.
Admitindo tal hip
otese de normalidade e atendendo a que P (X x) = p e equivalente a
P (Z xm
mos que
) = p, conclu
x = m + FZ1 (p),
onde FZ representa a func
ao de distribuica
o da lei N (0, 1).

79

3.5 - Inferencia para a media de uma variavel aleatoria

 
i
para i {1, . . . , n}.
Constr
oi-se um diagrama de dispers
ao dos pontos
n
Um papel de probabilidade, como o que apresentamos a seguir, torna plausvel a normalidade
da distribuic
ao da vari
avel aleat
oria subjacente `
a amostra observada.


xi:n , FZ1

...

.
i ...
FZ1 ( 50
)..
.


...

...

...

...

...

...

.

......................................................................................................................................................................................................................................................................................................................
xi:50

Por outro lado, um papel de probabilidade como o que ilustramos de seguida, n


ao d
a
evidencia `
a hip
otese de que a vari
avel aleat
oria subjacente aos dados segue uma lei normal.

i
FZ1 ( 44
)

3.5
3.5.1

...

...

...

...


...

...


...
...
.........................................................................................................................................................................................................................................
xi:44

Infer
encia para a m
edia de uma vari
avel aleat
oria
Intervalos de confianca

O metodo dos momentos apresentado na seccao 3.1, assim como todos os outros metodos de
estimacao pontual, permite associar estimadores aos parametros desconhecidos da distribuic
ao
de uma dada vari
avel aleatoria. Por sua vez, a cada estimador podemos associar tantas estimativas quantas as amostras usadas para o seu calculo. Sabemos tambem que, na generalidade
dos casos, nenhuma destas estimativas sera coincidente com o verdadeiro valor do parametro,
que continua desconhecido, embora aproximado.
Na verdade, mesmo dispondo de varias estimativas para um dado parametro, nao dispomos
de qualquer informac
ao relativamente `a sua precisao ou `a confianca que nelas podemos depositar. Esta contingencia da estimac
ao pontual e ultrapassada se implementarmos metodos de
estimacao intervalar (ou de estimac
ao por intervalos).
Concretamente, depois de obtida uma estimativa pontual para um determinado parametro, a precisao desta estimativa sera naturalmente evidenciada atraves de um intervalo que a
contenha e cuja amplitude e uma medida dessa mesma precisao. Por outro lado, a confianca que
temos na estimativa que obtivemos nao e mais senao a contrapartida emprica da probabilidade
de o parametro a estimar pertencer a um determinado intervalo aleatorio.
Comecemos ent
ao por apresentar algumas generalidades sobre intervalos de confianca.
Seja X uma vari
avel aleatoria com funcao de distribuicao dependente de um parametro
real, desconhecido, e seja (X1 , ..., Xn ) uma amostra aleatoria de X.

80

Captulo 3: Estatstica Inferencial

Se existirem duas func


oes f (X1 , ..., Xn ) e g(X1 , ..., Xn ) tais que
P (f (X1 , ..., Xn ) g(X1 , ..., Xn )) = 1 , ]0, 1[,
dizemos que [f (X1 , ..., Xn ), g(X1 , ..., Xn )] e um intervalo aleatorio que contem com probabilidade 1 .
Dada uma amostra observada (x1 , ..., xn ) de X, damos o nome de intervalo de confianca
(1 ) 100% ao intervalo de n
umeros reais [f (x1 , ..., xn ), g(x1 , ..., xn )]. Ao valor 1
chamamos grau, ou grau de confianca, do intervalo.
Em geral, na construc
ao de intervalos de confianca usamos o metodo da variavel fulcral.
Comecemos por apresentar a definicao de variavel fulcral.
Defini
c
ao 3.5.1 Dada uma vari
avel aleat
oria X, cuja distribuic
ao depende do par
ametro
desconhecido, e uma amostra aleat
oria (X1 , ..., Xn ) de X, chamamos vari
avel fulcral para ,
que representamos por V (X1 , ..., Xn ), a toda a vari
avel aleat
oria que seja func
ao da amostra
aleat
oria e de , cuja distribuic
ao n
ao dependa de .
Exemplo 3.5.1 Para a vari
avel aleat
oria X com lei N (m, 2 ) tem-se

Xn m
N (0, 1)
/ n

(n 1)S 2
m
2 . Assim X
e uma vari
avel fulcral para m (quando e
Xn1
2
/ n
(n 1)S 2
e uma vari
avel fulcral para 2 .
conhecido) e
2
bem como

O metodo da vari
avel fulcral consiste resumidamente no seguinte: supondo que a variavel
fulcral tem distribuic
ao contnua (exacta ou aproximada), procuramos dois valores reais q1 e
q2 tais que
P (q1 V (X1 , ..., Xn ) q2 ) = 1 , ]0, 1[.
Se for possvel desenvolver esta dupla desigualdade ate isolarmos na forma
P (f (X1 , ..., Xn ) g(X1 , ..., Xn )) = 1 ,
fica assim determinado o intervalo aleatorio [f (X1 , ..., Xn ), g(X1 , ..., Xn )] que contem com
probabilidade 1 .
No caso em que para a vari
avel fulcral so se conhece uma distribuicao aproximada diremos,
obviamente, que o intervalo aleatorio [f (X1 , ..., Xn ), g(X1 , ..., Xn )] contem com probabilidade
aproximadamente 1 .
Neste curso damos especial relevo `a construcao de intervalos de confianca para medias,
variancias e para o parametro da distribuicao de Bernoulli o qual, apesar de ser tambem
uma media, necessita de um enquadramento teorico particular. Contudo, antes de iniciar a
construcao de intervalos de confianca para a media de variaveis aleatorias apresentamos um
exemplo onde se ilustra o metodo da variavel fulcral.
Exemplo 3.5.2 Seja X a vari
avel aleat
oria que representa a quantidade de chuva que
cai no espaco de uma hora em determinado lugar. Observou-se que num perodo de dois dias
consecutivos choveu ininterruptamente, registando-se uma quantidade total de precipitac
ao de
145.3 litros por metro quadrado. Suponha que a distribuic
ao de X e contnua admitindo den2x
3x
sidade da forma f (x) = 3
e um par
ametro desconhecido.
2 I[0,] (x) + 3 2 I(,3] (x), onde > 0

81

3.5 - Inferencia para a media de uma variavel aleatoria


2

13
2
Podemos provar que E(X) = 4
ca
3 e E(X ) = 6 . Vamos determinar um intervalo de confian
95% para o par
ametro .
Da proposic
ao 3.2.3 (Corol
ario do Teorema Limite Central) decorre que a vari
avel aleat
oria

X 43
q
n
7

18

segue assintoticamente a lei N (0, 1) e assim pode ser usada como vari
avel fulcral. Ent
ao, como
z(0.975) = 1.96, tem-se

4
X

3
0.95
r
n

1.96
P
1.96

18
e, atendendo a que




X 43
4 1.22227
1.22227
X
4

P 1.96 r
+
n 1.96 = P 3

3
n
n
7

18

= P
4

X
X
,

1.22227
4 1.22227
+

3
3
n
n

conclumos que

4
3

X
X

,
1.22227 4 1.22227

+
3
n
n

e um intervalo aleat
orio que contem com probabilidade aproximadamente 0.95.
Face `
a amostra observada, podemos afirmar, com uma confianca de aproximadamente 95%,
que pertence ao intervalo

x
x
= [2.00503, 2.61653].
,
1.22227 4 1.22227
+

3
3
n
n

Usando este resultado e atendendo a que E(X) = 34 podemos obter um intervalo de confianca para a media ou esperanca matem
atica da vari
avel aleat
oria X. Com efeito, podemos
afirmar que o intervalo
4
4
[ 2.00503, 2.61653] = [2.67337, 3.48871]
3
3
e um intervalo de confianca aproximadamente 95% para E(X).

82

Captulo 3: Estatstica Inferencial

De igual modo se obtem um intervalo de confianca para a vari


ancia da vari
avel aleat
oria
7 2
, conclumos que
X. Uma vez que V ar(X) = 18



7
7
2.005032 ,
2.616532 = [0.55066, 2.66242]
18
18

e um intervalo de confianca aproximadamente 95% para V ar(X).


Passemos `a construc
ao de intervalos de confianca para a media de uma variavel aleatoria.
Comecamos com o caso mais simples em que X tem distribui
 cao normal.
2
Seja X uma vari
avel aleatoria com distribuicao N m, , com m desconhecido e conhecido, e seja (X1 , ..., Xn ) uma amostra aleatoria de X.
Atendendo a que
X m
N (0, 1)
/ n
podemos usar esta vari
avel como vari
avel fulcral na construcao de intervalos de confianca para
a media. Ora, uma vez que se tem
P

X m
z(1 /2)
z(1 /2)
/ n

=1

equivalente a
P

X z(1 /2) m X + z(1 /2)


n
n

podemos afirmar que

X z(1 /2) , X + z(1 /2)


n
n

= 1 ,

e um intervalo aleatorio que contem m com probabilidade 1 .


Face a uma amostra observada obtemos o intervalo de confianca (1 ) 100% para m na
forma



x z(1 /2) , x + z(1 /2) .


n
n
Prova-se que o intervalo de confianca assim construdo tem amplitude mnima e portanto
precisao maxima.
Interpretando o intervalo aleatorio de acordo com o conceito frequencista de probabilidade podemos afirmar que se observarmos um grande n
umero de amostras de dimensao n
e para cada uma construrmos o correspondente intervalo de confianca particular, espera-se
que a percentagem destes intervalos particulares que contem o valor verdadeiro de m seja
neste ambito que dizemos que m pertence ao intervalo
aproximadamente (1 ) 100%. E



x z(1 /2)
com (1 ) 100% de confianca. Esta interpretacao
, x + z(1 /2)
n
n
pode ser usada para qualquer intervalo de confianca associado a qualquer parametro.

83

3.5 - Inferencia para a media de uma variavel aleatoria

Suponhamos agora que e desconhecido e recordemos que, de acordo com a proposic


ao
X m
N (0, 1) e
3.2.4 se tem
/ n
(n 1)S 2
2
Xn1
.
2
Consequentemente, de acordo com a definicao da distribuicao de Student apresentada na
secccao 1.3.4, tem-se
s
X m
/
/ n

(n 1)S 2
X m
tn1 ,
=
2
(n 1)
S/ n

pois X e S 2 sao independentes (Proposicao 3.2.4). Notamos que a independencia entre X e S 2


X m (n 1)S 2
e
implica a independencia entre
. Nestas circunstancias usaremos a variavel
2
/ n
X m
.
fulcral
S/ n
Neste caso, representando por tm (p) o quantil de probabilidade p da lei tm (lei de Student
com m graus de liberdade), temos


X m
tn1 (1 /2) = 1
tn1 (1 /2)
S/ n


S
S
=1
P X tn1 (1 /2) m X + tn1 (1 /2)
n
n
P

e portanto

S
S
X tn1 (1 /2) , X + tn1 (1 /2)
n
n

e um intervalo aleatorio que contem m com probabilidade 1 . Tambem neste caso se


considerou o intervalo de amplitude mnima.
Exemplo 3.5.3 Um estudo acerca do equilbrio do pH em solos sob utilizac
ao de carbonatos e materia org
anica, publicado no n
umero 109 da revista Soil Science, 1984, no artigo
Sodium-Calcium Exchange Equillibria in Soils as Affected by Calcium Carbonate and Organic Matter , indicava os seguintes registos de pH provenientes de 10 amostras da Central Soil
Salinity Research Institute Experimental Farm: 8.53, 8.52, 8.01, 7.99, 7.93, 7.89, 7.85, 7.82,
7.80, 7.72. Admitindo a normalidade da distribuic
ao da vari
avel aleat
oria X que representa
o referido pH, vamos construir um intervalo de confianca 98% para a media ou esperanca
matem
atica de X.
Comecemos por registar que, para a amostra observada de que dispomos, se tem x = 8.006
X m
onde m denota a esperanca matem
e s = 0.28702. A vari
avel fulcral a usar e
atica
S/ n
X m
tn1 .
de X e n a dimens
ao da amostra. Do que foi exposto acima conclumos que
S/ n
Atendendo a que, com 1 = 0.98 e t9 (0.99) = 2.82143, se tem
P


X m
2.82143 = 0.98
2.82143
S/ 10

84

Captulo 3: Estatstica Inferencial

equivalente a
P

S
S
X 2.82143 m X + 2.82143
10
10

= 0.98,

conclumos que o intervalo aleat


orio


S
S

X 2.82143
, X + 2.82143
10
10
contem m com probabilidade 0.98. Assim, face a esta amostra, podemos afirmar que m pertence
ao intervalo


s
s
= [7.79992, 8.26208]
x 2.82143 , x + 2.82143
10
10
com 98% de confianca.
Observa
c
ao 3.5.1 No caso em que X n
ao tem lei normal, de acordo com a proposica
o
X m
N (0, 1). Ent
3.2.3, Corol
ario do Teorema Limite Central, sabemos que
ao, no caso
/ n
em que a vari
ancia da vari
avel aleat
oria X, que denotamos por 2 , e conhecida, usaremos a
X m
e os procedimentos acima na construc
ao de intervalos de confianca para
vari
avel fulcral
/ n
m, tendo contudo intervalos de confianca aproximadamente (1)100%. Se, por outro lado, a
X m
.
vari
ancia da vari
avel aleat
oria X e desconhecida ser
a tambem usada a vari
avel fulcral
S/ n
N
ao tendo a garantia a normalidade da distribuic
ao de X, n
ao conhecemos a distribuic
ao
exacta desta vari
avel fulcral. Neste caso, e dispondo de amostras de dimens
ao suficientemente
grande, ser
a igualmente usada a distribuic
ao N (0, 1) como aproximac
ao para a distribuic
ao
da vari
avel fulcral. Recordamos que tal significa que, para n suficientemente grande, a funca
o
de distribuic
ao da vari
avel fulcral pode ser aproximada pela funca
o de distribuic
ao da referida
distribuica
o.
Exemplo 3.5.4 Consideremos a vari
avel aleat
oria X que representa o tempo de funcionamento sem falhas (em meses) de um determinado tipo de bombas instaladas em estac
oes
de
aguas residuais. Dispomos de uma amostra de X, de dimens
ao 40, que apresenta media
igual a 15.3825 e vari
ancia 43.4251. A partir desta amostra vamos construir um intervalo de
confianca para a media ou esperanca matem
atica de X que denotamos por m. Uma vez que a
vari
ancia de X e desconhecida usamos a vari
avel fulcral
X m
.
S/ n
Por outro lado, como tambem desconhecemos a distribuic
ao de X (e portanto n
ao podemos ter
a garantia de que e normal) usamos a distribuic
ao N (0, 1) como distribuic
ao aproximada para
a distribuic
ao da vari
avel fulcral. Ora, uma vez que, com 1 = 0.95 e z(0.975) = 1.96, se
tem


X m
1.96 0.95
P 1.96
S/ 40

85

3.5 - Inferencia para a media de uma variavel aleatoria

ou, de modo equivalente,


P

S
S
X 1.96 m X + 1.96
40
40

0.95,

conclumos que o intervalo aleat


orio


S
S
X 1.96 , X + 1.96
40
40
contem m com probabilidade aproximadamente 0.95. Assim, face `
a amostra observada, podemos
afirmar que


s
s
= [13.3403, 17.4246]
x 1.96 , x + 1.96
40
40
e um intervalo de confianca aproximadamente 95% para m.
Exemplo 3.5.5 Seja X a vari
avel aleat
oria que representa o intervalo de tempo, em minutos, entre duas chegadas consecutivas de chamadas telef
onicas a uma central, num certo
perodo do dia. Sabe-se que X tem lei E(, 0), com desconhecido. Durante dois meses foram
realizadas 200 observac
oes de X, o que constitui uma amostra que apresenta media igual a 1.5
minutos.
Neste caso, como X n
ao tem lei normal nem dispomos da vari
ancia amostral, vamos usar a
X 1
n a qual segue assintoticamente a lei N (0, 1) como decorre do Teorema
vari
avel fulcral
1

Limite Central.
Uma vez que se tem
P

z(0.99)

n z(0.99)

2.33
X
2.33

1 1
n
n

podemos afirmar que

P
2.33
+1
n

"

"

0.98

0.98

X
0.98,

2.33
+1
n

X
X

2.33
2.33
+1 +1
n
n

e um intervalo aleat
orio que contem E(X) = 1/ com probabilidade aproximadamente igual a
1 .

86

Captulo 3: Estatstica Inferencial

Com base na amostra disponvel, conclumos que E(X) = 1/ pertence ao intervalo




x
x
= [1.2878, 1.7958],
,
1.16475 0.83524
com confianca aproximadamente igual a 98%. Mais ainda, uma vez que V ar(X) = (E(X))2 =
(1/)2 tambem se conclui que
V ar(X) [1.28782 , 1.79582 ] = [1.6584, 3.2248]
com 98% de confianca, aproximadamente.

3.5.2

Testes param
etricos

Recordamos que um teste estatstico nao e mais que um procedimento estatstico com o qual se
pretende analisar a compatibilidade entre os dados (observacoes realizadas ou amostra) e uma
hipotese formulada previamente sobre a distribuicao de uma variavel aleatoria. Esta hipotese
e representada por H0 e e designada hip
otese nula.
Nesta secc
ao estudamos apenas testes cujas hipoteses se referem a parametros de uma
dada distribuic
ao e que, por isso, se designam testes parametricos. Neste curso consideramos
apenas tres tipos de testes estatsticos para um parametro real . A saber, para casos muito
particulares do parametro , sao considerados apenas os testes de hipoteses
i) H0 : = 0 versus H1 : > 0 ;
ii) H0 : = 0 versus H1 : < 0 ;
iii) H0 : = 0 versus H1 : 6= 0 ;
onde 0 e um real fixado.
Comecamos mais uma vez com o caso em que X N (m, 2 ), com conhecido.
Suponhamos que pretendemos testar H0 : m = m0 versus uma hipotese alternativa H1 ,
onde m0 representa um n
umero real conhecido. Por exemplo, no contexto do exemplo 1.4.1
podemos estar interessados em testar H0 : m = 15 contra a hipotese alternativa H1 : m > 15.
Sendo a estatstica de teste uma variavel aleatoria que estabelece o confronto entre os
dados e a hipotese H0 , para este teste e intuitivo considerar a estatstica de teste baseada na
diferenca X m0 . Contudo, tambem sabemos que para construir a regiao crtica de um teste
precisamos de conhecer a distribuic
ao da estatstica de teste e, mais, que esta seja independente
de parametros desconhecidos.
Assim, neste caso, a estatstica de teste a considerar e
En =

X m0

/ n

a qual, quando H0 e verdadeira, segue a lei N (0, 1).


Consequentemente, para testar
H0 : m = m0

versus

H 1 : m > m0

3.5 - Inferencia para a media de uma variavel aleatoria

87

usamos aquela estatstica de teste En e a regiao crtica C = [z(1 ), +[.


A decisao estatstica que se toma a partir de uma dada amostra observada e
rejeitar H0 se o valor observado da estatstica de teste, en , pertencer a C, isto e, se
en z(1 );
manter H0 se en n
ao pertencer a C, isto e, se en < z(1 ).
Uma outra forma de tomar a decisao estatstica final a partir de uma amostra observada
consiste em avaliar a evidencia que os dados dao `a hipotese H0 . Usamos assim a nocao de
p-valor ou nvel de significancia observado de um teste estatstico. Com efeito, o p-valor de um
teste e a probabilidade da estatstica de teste assumir o valor en ou outros mais desfavoraveis `a
hipotese H0 , admitindo H0 verdadeira; no caso do teste referido acima de hipotese alternativa
H1 : m > m0 o p-valor sera a probabilidade de a estatstica de teste assumir um valor que seja
maior ou igual ao que foi realmente observado, isto e P (En en ). Assim, quanto menor for
o p-valor maior e a evidencia que os dados fornecem contra a hipotese H0 . De igual modo,
quanto maior for o p-valor maior e a evidencia que os dados fornecem `a hipotese H0 . Por isso,
dizemos que o p-valor nos da uma medida da evidencia que os dados d
ao `
a hip
otese H0 . A
formula de calculo define-se caso a caso.
Para um nvel de significancia (teorico) previamente fixado, a decisao estatstica e
rejeitar H0 se p-valor ;
manter H0 se p-valor > .
No caso do teste apresentado acima tem-se, como ja dissemos, p-valor =P (Z en ), onde
Z N (0, 1).
Em resumo, a decisao estatstica face a uma amostra observada e
rejeitar H0 se en C ou se p-valor ;
manter H0 se en
/ C ou p-valor > .
Alias, esta e a decisao estatstica associada a qualquer teste estatstico (parametrico ou nao).
Para testar H0 : m = m0 versus H1 : m < m0 usamos a mesma estatstica de teste e a
regiao crtica C =] , z(1 )]. Neste caso temos p-valor= P (Z en ).
No caso de pretendermos testar
H0 : m = m0

versus H1 : m 6= m0

consideramos de novo a mesma estatstica de teste. A regiao crtica a considerar e


C =] , z(1 /2)] [z(1 /2), +[,
sendo o p-valor igual a 2P (Z |en |).
Suponhamos agora que 2 e desconhecido. Neste contexto e para testar a hipotese H0 :
m = m0 contra alguma das hipoteses alternativas ja apresentadas acima, usamos
En =

X m0

S/ n

que, sob a validade de H0 , segue uma lei tn1 .


Entao, para o teste de hipoteses

88

Captulo 3: Estatstica Inferencial

i) H0 : m = m0 versus H1 : m > m0
usamos C = [tn1 (1 ), +[ e p-valor= P (T en ) com T tn1 ;
ii) H0 : m = m0 versus H1 : m < m0
usamos C =] , tn1 (1 )] e p-valor= P (T en );
iii) H0 : m = m0
usamos

versus H1 : m 6= m0
C =] , tn1 (1 /2)] [tn1 (1 /2), +[

e p-valor= 2P (T |en |).

Exemplo 3.5.6 Em muitas aplicac


oes e necess
ario aferir a velocidade de propagac
ao de
ultra-sons no bet
ao (em Km/s) com elevado grau de precis
ao, uma vez que pequenas variac
oes
desta vari
avel aleat
oria, que representamos por V , podem reflectir grandes mudancas no estado
do bet
ao. Com o objectivo de encontrar uma distribuica
o que se possa ajustar convenientemente
a V recolheu-se uma amostra desta vari
avel, com dimens
ao 50, que permitiu construir o seguinte
histograma:
...............
.................. .................
................... ... ... ..................
.. .. .. .. .. ..
.. .. .. .. .. ..
.. .. .. .. .. ..
. . . . . .
..........................................................................................
3.3 3.6 3.9 4.2 4.5
Sabe-se ainda que esta amostra tem media 4.1519 e vari
ancia 0.1501.
A realizac
ao do teste do qui-quadrado como teste de ajustamento permitiu ainda validar a
distribuica
o normal para a vari
avel aleat
oria V .
Realizemos o teste de hip
otese nula H0 : m = 4 contra a hip
otese H1 : m > 4, com nvel de
signific
ancia 0.05.
Ora, uma vez que V tem distribuic
ao normal sabemos que, quando H0 e verdadeira, a
V 4
ao crtica deste teste e
estatstica de teste En = S/n segue a lei tn1 . Assim a regi
C = [t49 (0.95), +[= [1.67655, +[.

O valor observado da estatstica de teste e e50 = s/v4


= 2.7723, o qual pertence `
a regi
ao
50
crtica. Ent
ao, face a estes dados e com = 0.05, rejeitamos H0 .
Notamos que para o nvel de signific
ancia 0.01 a decis
ao final seria a mesma.

Observa
c
ao 3.5.2 No caso em que X n
ao tem lei normal, para testar H0 : m = m0
contra uma hip
otese alternativa adequada usamos a mesma estatstica de teste. Assim, quando
a vari
ancia da vari
avel aleat
oria X, que denotamos por 2 , e conhecida, a proposic
ao 3.2.3
permite-nos concluir que
X m0
N (0, 1).
/ n
Se, por outro lado, a vari
ancia 2 e desconhecida, na presenca de amostras significativamente
grandes usamos a distribuic
ao N (0, 1) como aproximaca
o para a distribuic
ao da estatstica de
Xm
0
oes crticas tendo, contudo, testes de nvel
teste En = S/n . Como tal, usamos as mesmas regi
de signific
ancia assint
otico ou com p-valor assint
otico.

3.5 - Inferencia para a media de uma variavel aleatoria

89

Exemplo 3.5.7 Seja X a vari


avel aleat
oria que representa a amplitude do intervalo de
tempo, expresso em dias, que decorre entre duas excedencias consecutivas de um nvel u0 ,
nosso objectivo averiguar se
previamente fixado, pela precipitac
ao de determinado local. E
poderemos considerar que a media ou esperanca matem
atica de X, que representamos por m,
e inferior a 14.
A partir de registos feitos numa estac
ao udometrica local, foi possvel obter uma amostra
ao s igual a 5.6783.
de X, de dimens
ao 61, que apresenta media x igual a 12.5609 e desvio padr
Vamos ent
ao testar H0 : m = 14 contra H1 : m < 14 com um nvel de signific
ancia
aproximadamente igual a 0.05.
X14
, a qual, quando H0
A estatstica de teste a considerar e En = S/
e verdadeira e atendendo
61
a que se tem um dimens
ao da amostra igual a 61, tem uma distribuic
ao que pode ser aproximada
pela distribuica
o N (0, 1).
A regi
ao crtica considerada para este teste e
C =] , z(0.95)] =] , 1.64].
Para estes dados, o valor observado da estatstica de teste e
e61 =

x 14
= 1.9794.
s/ 61

Como e61 pertence `


a regi
ao crtica, rejeitamos a hip
otese H0 . Assim, para uma probabilidade
aproximadamente igual a 0.05 de estarmos a cometer um erro, rejeitamos a hip
otese de que a
media da amplitude do intervalo de tempo que decorre entre duas excedencias consecutivas de
u0 seja igual a 14. Consequentemente, podemos considerar que tal media e inferior a 14.
Exemplo 3.5.8 Seja X a vari
avel aleat
oria que representa o tempo de funcionamento
entre duas falhas de um termo-higr
ografo. Um teste de ajustamento permitiu ajustar a X
uma distribuic
ao exponencial de densidade f (x) = ex I[0,+[ (x), x IR, onde > 0 e um
par
ametro desconhecido. Pretende-se averiguar se a media do tempo de funcionamento entre
conhecida uma
duas falhas deste aparelho pode ser considerada estatisticamente igual a 10. E
ao s igual
amostra de X, de dimens
ao 40, a qual apresenta media x igual a 9.4671 e desvio padr
a 10.5470.
Na construc
ao de um teste de hip
oteses H0 : m = 10 contra H1 : m 6= 10 usamos a
. Como a distribui
c
ao de X n
ao e normal desconhecemos a
estatstica de teste En = X10
S/ n
distribuic
ao exacta de En . Todavia, sob a hip
otese de H0 ser realmente verdadeira, isto e,
de a media de X ser exactamente igual a 10, podemos aproximar a distribuic
ao de En pela
distribuic
ao N (0, 1).
Uma vez que o valor observado da estatstica de teste e e40 = 0.3196, conclumos que o pvalor e aproximadamente 2P (Z 0.3196) = 20.37448 = 0.74896, onde Z e uma vari
avel com
distribuic
ao N (0, 1). Como a aproximac
ao obtida para o p-valor e muito superior aos nveis de
signific
ancia usualmente considerados, mantemos H0 .
p
Notamos que, como para a lei E(, 0) se tem E(X) = V ar(X), poderamos ter usado a
p
X10
, pois, sob a validade de H0 , tem-se 1 = E(X) =
estatstica de teste En = 10/
V ar(X) =

n
10. Ali
as, no caso em que n
ao nos fornecem o desvio padr
ao da amostra, que denotamos por
X10
seria a u
s, a estatstica de teste 10/

nica
que
poder
amos
usar.
n

90

Captulo 3: Estatstica Inferencial

Exerccio 3.5.1 Um professor resolve, para manter a forma fsica, treinar um pouco de
corrida. Ao fim de algum tempo de treino comeca a participar em corridas a serio cujo percurso
e 10 Km. Sabe-se que o desvio padr
ao estabelecido para este tipo de treino e igual a 2.1 minutos
(j
a convertidos no sistema decimal e que correspondem a 2 minutos e 6 segundos). Nas u
ltimas
40 corridas este professor demorou tempos cuja media foi igual a 38 minutos e 45 segundos .
Com 96% de confianca, construa um intervalo para o tempo medio que este professor demora
a percorrer os 10 Km.
Exerccio 3.5.2 Seja X a vari
avel aleat
oria que representa o erro, em centmetros, cometido por certa m
aquina ao cortar pecas com dois metros de comprimento. Dispomos de uma
amostra de X, de dimens
ao 50, que apresenta media igual a -0.57 cm e desvio padr
ao 2.035
cm. Estudos estatsticos permitiram concluir que X tem distribuica
o normal. Construa um
intervalo que contenha a media de X com 98% de confianca.
Exerccio 3.5.3 O alcance de um morteiro est
a a ser investigado. Nos ensaios experimentais registaram-se os seguintes valores (em metros): 2100, 1984, 2072, 1898, 1950, 1992,
2096, 2103, 2043, 2218, 2244, 2206, 2210, 2152, 1962, 2007, 2018, 2106, 1938, 1956.
Admitindo a normalidade da vari
avel aleat
oria que representa o alcance do morteiro, construa um intervalo com 99% de confianca para o alcance medio do morteiro.
Exerccio 3.5.4 O director de uma estac
ao de r
adio pretende uma estimativa para o
tempo medio que cada famlia dedica, por dia, a ouvir essa estac
ao. Foi recolhida uma amostra
constituda por 61 famlias, tendo sido calculados uma media di
aria de audic
ao de 2,4 horas e
um desvio padr
ao de 0,7 horas. Construa um intervalo de confianca 95% para o tempo medio
di
ario de audic
ao.
Exerccio 3.5.5 Um fabricante de vinhos produz vinho que vende afirmando que o seu
grau alco
olico e de 11%. Uma amostra de 45 garrafas apresenta grau alco
olico medio 10.2%
com desvio padr
ao 1.7%. Construa um intervalo com confianca 95% para o grau alco
olico
medio de cada garrafa.
Exerccio 3.5.6 Pretende-se estudar o tempo de vida, em anos, das baterias produzidas
em determinada f
abrica. Um amostra dos tempos de vida de 49 baterias apresenta vari
ancia
igual a 10.4. Com que confianca podemos afirmar que a media da vari
avel aleat
oria que representa o tempo de vida das baterias, se encontra num intervalo de amplitude mnima igual a
2?
Exerccio 3.5.7 Em determinada cidade est
ao a ser estudados os problemas de congestionamento de tr
ansito nas zonas centrais. O tempo (em minutos) que cada pessoa leva a percorrer
um determinado trajecto daquela cidade, em autom
ovel pr
oprio e em horas de elevado congestionamento de tr
ansito, e uma vari
avel aleat
oria que representamos por T . Estudos estatsticos
permitiram concluir que T N (m, 2 ). Dispomos de uma amostra de T , de dimens
ao 41, que
apresenta media 10.8 e vari
ancia 5.725. Com base nesta amostra, teste a hip
otese H0 : m = 11
contra a hip
otese alternativa H1 : m 6= 11.
Exerccio 3.5.8 No problema 3.5.1, ao nvel de signific
ancia 0.05, parece-lhe prefervel
dizer que o professor corre os 10 Km em 38 minutos e 30 segundos, ou que demora mais do
que esse tempo a percorrer a referida dist
ancia?

91

3.5 - Inferencia para a media de uma variavel aleatoria

Exerccio 3.5.9 O n
umero de chamadas telef
onicas que chegam diariamente a uma central entre as 23 horas e as 24 horas e uma vari
avel aleat
oria `
a qual se pode ajustar uma distribuic
ao de Poisson de par
ametro , desconhecido. Foi realizado um estudo estatstico a partir
do qual se inferiu o valor 2 para o par
ametro . Todavia, actualmente o perodo de observac
ao
corresponde ao hor
ario de um programa televisivo de grande audiencia, pensa-se que o valor
de dever
a ter diminudo. Para testar tal hip
otese fez-se, durante 150 dias, a observac
ao
do n
umero de chamadas que ocorreram no referido perodo. Os dados obtidos encontram-se
resumidos na tabela seguinte:
n
umero de chamadas
n
umero de dias

0
32

1
50

2
40

3
20

4
5

5
3

>5
0

Teste, ao nvel de signific


ancia 0.05, a hip
otese H0 : = 2 versus H1 : < 2.
Exerccio 3.5.10 A maleabilidade de um certo fio de arame produzido por uma f
abrica
(expressa em unidades adequadas) e uma vari
avel aleat
oria `
a qual se ajustou uma distribuica
o
U ([, + ]), com desconhecido.
1. Determine um estimador centrico para .
2. A partir de uma amostra de dimens
ao 38, cuja soma dos valores e 12.78 teste a hip
otese
< 1.19.
Exerccio 3.5.11 Num laborat
orio pretende-se estudar o tempo de secagem (em horas)
de determinado tipo de tinta em superfcie especificada. Denote por T a vari
avel aleat
oria que
representa o referido tempo.
1. Dispomos de uma amostra de T , de dimens
ao 50, a qual apresenta m
edia igual a
12.83 e desvio padr
ao igual a 5.36. Teste H0 : E(T ) = 13 contra H1 : E(T ) < 13.
2. Admita que disp
oe de outra amostra, de dimens
ao 30, a partir da qual se conclui
que o intervalo [10.084, 14.116] contem a media de T com confianca 95%. Usando esta
informac
ao, determine outro intervalo que contenha a media de T com 98% de confianca.
Exerccio 3.5.12 Determinada empresa de seguranca foi contactada para uma eventual
prestac
ao de servicos. Esta empresa poder
a participar numa miss
ao em que a aparencia e a
robustez fsica dos seus segurancas e fundamental. Confrontado com este requisito, o gerente
da empresa assegurou ao potencial cliente que os seus funcion
arios est
ao muito bem preparados
fisicamente, que o seu peso medio e superior a 80 quilogramas e que a sua altura media e superior a 1,75 metros. Devido `
a elevada import
ancia da referida miss
ao, foi necess
ario averiguar
a veracidade de tais afirmac
oes. Para tal seleccionaram-se aleatoriamente 40 segurancas da
empresa e recolheram-se os valores das suas alturas e dos seus pesos.
1. A amostra de pesos apresenta media igual a 82.2 e desvio padr
ao igual a 3.1.
(a) Usando esta amostra, realizou-se um teste de Kolmogorov-Smirnov com o objectivo
de validar uma lei normal para a vari
avel X que representa o peso dos segurancas.
Foi obtido um p-valor igual a 0.66. O que pode afirmar sobre a normalidade de X?
Justifique.

92

Captulo 3: Estatstica Inferencial

(b) Com estes dados e adoptando um nvel de signific


ancia de 0.02, poderemos afirmar
que a media dos pesos dos segurancas e de facto superior a 80 quilogramas?
2. Seja Y a vari
avel que representa a altura dos segurancas da empresa. A amostra das
alturas (em metros) apresenta media igual a 1.81 e desvio padr
ao igual a 0.15 e permitiu
concluir que Y nao possui distribuica
o normal. Com que confianca podemos afirmar que
a media de X pertence ao intervalo (de amplitude mnima) [1.755,1.865]?
Exerccio 3.5.13 Uma organizac
ao de defesa de consumidores recebeu v
arias queixas
acerca da quantidade de tinta, vendida por determinada marca, em baldes de 2 litros. N
ao
querendo publicidade negativa, o fabricante reagiu afirmando ter regulado as m
aquinas recentemente para que a quantidade media de tinta introduzida em baldes com aquele valor nominal
fosse de 2.1 litros e com desvio padr
ao 0.01 litros. Tendo continuado a receber queixas, a referida organizac
ao tratou de proceder a um estudo estatstico para esclarecer a situac
ao. Assim,
foi recolhida uma amostra de X, de dimens
ao 40, que apresenta media igual a 2.08 e desvio
padr
ao igual a 0.055. A mesma amostra permitiu estabelecer a normalidade de X.
1. Construa um intervalo de confianca 98% para a media de X.
2. Realize um teste estatstico, com nvel de signific
ancia 0.05, para averiguar se estes dados
s
ao compatveis com o valor 2.1 para a media de X ou se, por outro lado, tal media deve
ser considerada inferior a 2.1, usando:
(a) a regi
ao crtica do teste;
(b) a noca
o de p-valor do teste.

3.6
3.6.1

Infer
encia para a vari
ancia de uma vari
avel aleat
oria normal
Intervalos de confianca


Seja X uma vari
avel aleatoria com lei N m, 2 , com 2 desconhecido. Do Teorema 3.2.4
decorre que
(n 1)S 2
2
.
Xn1
2
Consequentemente, para construir intervalos de confianca para 2 usamos a variavel fulcral
(n 1)S 2
. O problema da construc
ao de intervalos de confianca de amplitude mnima para
2
a variancia e razoavelmente complicado pelo que consideramos apenas intervalos de caudas
igualmente pesadas. Esta caracterizacao obtem-se considerando inicialmente a variavel fulcral
entre dois valores a e b tais que a probabilidade da variavel fulcral assumir valores inferiores
a a e igual `a probabilidade desta assumir valores superiores a b. Consequentemente, para um
grau de confianca 1 , tem-se a = Xn1 (/2) e b = Xn1 (1 /2).
Entao, devido ao facto de se ter


(n 1)S 2
P Xn1 (/2)
Xn1 (1 /2) = 1
2

3.6 - Inferencia para a vari


ancia de uma variavel aleatoria normal

equivalente a
P

(n 1)S 2
(n 1)S 2
2
Xn1 (1 /2)
Xn1 (/2)

conclumos que o intervalo aleatorio




(n 1)S 2
(n 1)S 2
,
Xn1 (1 /2) Xn1 (/2)

93

= 1 ,

contem 2 com probabilidade 1 . Assim, para uma amostra observada, podemos afirmar
que


(n 1)s2
(n 1)s2
,
Xn1 (1 /2) Xn1 (/2)

e um intervalo de confianca (1 ) 100% para 2 .

Exemplo 3.6.1 Retomemos os dados do exemplo 3.5.6. Recordemos que a vari


ancia da
amostra e dada por s2 = 0.1501. Uma vez que V tem distribuic
ao normal, na construc
ao de um
intervalo de confianca 95% para a vari
ancia de V , que denotamos por 2 , usamos a vari
avel
fulcral
(n 1)S 2
49S 2
=
,
2
2
2 . Por outro lado, atendendo a que se tem X (0.025) = 31.55492 e
a qual tem distribuic
ao X49
49
X49 (0.975) = 70.22241 obtemos


49S 2
P 31.55492
70.22241 = 0.95
2
ou equivalentemente
P

49S 2
49S 2
2
70.22241
31.55492

= 0.95.

Podemos ent
ao afirmar que a probabilidade de 2 pertencer ao intervalo aleat
orio


49S 2
49S 2
,
70.22241 31.55492
e igual a 0.95. Assim, face a esta amostra, conclumos que


49s2
49s2
= [0.10474, 0.23308]
,
70.22241 31.55492
e um intervalo de confianca 95% para 2 .
Observa
c
ao 3.6.1 No caso em que a vari
avel aleat
oria X n
ao tem distribuica
o normal
n
ao h
a resultados a registar para a lei de S 2 . Contudo, em alguns casos particulares, podemos
(n 1)S 2
. Basta
construir intervalos de confianca para a vari
ancia sem usar a vari
avel fulcral
2
atender aos casos em que a vari
ancia e func
ao da media. Nestas situac
oes obtemos um intervalo de confianca para a media, ainda que com grau aproximado, e seguidamente usamos a
relac
ao entre a media e a vari
ancia para construir um intervalo de confianca aproximada para
a vari
ancia. Notamos que este procedimento j
a foi usado nos exemplos 3.5.2 e 3.5.5.

94

Captulo 3: Estatstica Inferencial

3.6.2

Testes param
etricos

Recordando que a estatstica de teste estabelece o confronto entre os dados e a hipotese H0 ,


para construir testes estatsticos para a hipotese H0 : = 02 ha que colocar em confronto a
variancia da amostra e o valor 02 , estipulado pela hipotese H0 para a variancia da variavel
2
aleatoria em estudo (ou vari
ancia da populacao). Tal e conseguido usando o quociente S2 .
0

Notemos que se S2 for consideravelmente diferente de 1 os dados afastam-seda hipotese H0 .


0
Assim, para testar a referida hipotese nula contra uma hipoteses alternativa adequada,
consideramos a estatstica de teste
(n 1)S 2
En =
02
2 .
a qual, quando H0 e verdadeira, segue a lei Xn1
Assim no caso:

i) H0 : 2 = 02 versus H1 : 2 > 02
2 ;
a regiao crtica e C = [Xn1 (1 ), +[ e p-valor= P (Q en ), com Q Xn1
ii) H0 : 2 = 02 versus H1 : 2 < 02
a regiao crtica e C =]0, Xn1 ()] e p-valor= P (Q en );
iii) H0 : 2 = 02 versus H1 : 2 6= 02
a regiao crtica e
C =]0, Xn1 (/2)] [Xn1 (1 /2), +[
e p-valor= 2 min {P (Q en ), P (Q en )}.

Exemplo 3.6.2 Retomemos a vari


avel aleat
oria V do exemplo 3.5.6. Vamos realizar um
teste estatstico que nos permita averiguar se a vari
ancia de V pode ser considerada superior a
0.1. H
a assim que efectuar o teste das hip
oteses H0 : 2 = 0.1 contra H1 : 2 > 0.1, adoptando
para tal um nvel de signific
ancia de, por exemplo, 0.02.
(n 1)S 2
A estatstica de teste a considerar e En =
, a qual, quando H0 e verdadeira, segue
0.1
2
ao crtica deste teste e
a distribuic
ao Xn1 . Consequentemente, a regi
C = [X49 (0.98), +[= [71.40608, +[.
Como, para esta amostra, o valor assumido pela estatstica de teste e
49s2
49 0.1501
=
= 73.549,
0.1
0.1
o qual pertence a C, rejeitamos H0 .
Face a estes dados podemos afirmar que a vari
ancia da vari
avel que representa a velocidade
de ultra-sons no bet
ao e superior a 0.1.
Notamos que esta conclus
ao se mantem para outros nveis de signific
ancia superiores a 0.02.
Esta afirmac
ao pode ser confirmada por observaca
o directa da tabela da lei do qui-quadrado.
Por outro lado, podemos obter a mesma conclus
ao, determinando o p-valor do teste. Com
2 , tem-se
efeito, para Q X49
e50 =

p valor = P (Q 73.549) = 0.0132


(valor obtido usando os programas Excel ou SPSS) que e inferior a 0.02.

3.6 - Inferencia para a vari


ancia de uma variavel aleatoria normal

95

Exemplo 3.6.3 Os erros, em centmetros, cometidos por certa m


aquina ao cortar pecas
de um metro de comprimento, s
ao normalmente distribudos. Uma amostra constituda por 25
pecas permitiu concluir que o erro medio pertence ao intervalo de amplitude mnima [1.27, 0.82],
com 95% de confianca. Face a esta informac
ao, vamos averiguar se a vari
ancia da vari
avel
aleat
oria que representa tais erros pode ser considerada igual a 6 cm2 ou se, pelo contr
ario,
dever
a ser considerada superior a 6 cm2 .
Ora, o intervalo de confianca para a media, com amplitude mnima, e da forma


s
s
x tn1 (1 /2) , x + tn1 (1 /2) .
n
n
Assim


s
s
x t24 (0.975) , x + t24 (0.975)
= [1.27, 0.82].
25
25

Como o ponto medio deste intervalo e igual a x, obtem-se x = 0.225. Por outro lado, tem-se
s
s
x + t24 (0.975) = 0.82 0.225 + 2.06389 = 0.82 s = 2.53.
5
25
Passemos `
a realizac
ao do teste de hip
oteses H0 : 2 = 6 e H1 : 2 > 6, adoptando o nvel
de signific
ancia 0.05.
(n 1)S 2
, a qual, quando H0 e verdadeira, segue
A estatstica de teste a considerar e En =
6
2
a distribuic
ao Xn1 . Assim, para = 0.05, a regi
ao crtica e
C = [X24 (0.95), +[= [36.41503, +[.
Face a estes dados, o valor da estatstica de teste e
e25 =

24 2.532
24s2
=
= 25.6,
6
6

o qual n
ao pertence a C.
Face a estes dados, n
ao podemos afirmar que a vari
ancia da vari
avel que representa os
erros cometidos no corte das pecas seja superior a 6 cm2 .
Exemplo 3.6.4 Um fabricante afirma que o tempo de vida, em anos, das baterias produzidas na sua f
abrica tem desvio padr
ao inferior a 3. Um amostra dos tempos de vida de 36
baterias apresenta vari
ancia igual a 7.65.
Coloquemos as seguintes quest
oes:
1. qual e a confianca que nos permite concluir que a media da vari
avel aleat
oria que representa o tempo de vida das baterias, se encontra num intervalo de amplitude mnima igual
a 2?
2. Admitindo agora que a vari
avel aleat
oria que representa o tempo de vida das baterias
e normalmente distribuda, poderemos afirmar que estes dados s
ao compatveis com a
afirmac
ao do fabricante relativamente `
a vari
ancia da referida vari
avel?

96

Captulo 3: Estatstica Inferencial

1. Denotemos por X a vari


avel aleat
oria que representa o tempo de vida das baterias
produzidas pelo fabricante. Uma vez que desconhecemos a lei de X, podemos afirmar que a
, tem lei
vari
avel fulcral a usar na construc
ao do intervalo de amplitude mnima, isto e, Xm
S/ n
` semelhanca do que foi feito no exemplo anterior, sabemos que o intervalo
assint
otica N (0, 1). A
de confianca aproximadamente igual a (1 ) 10%, para a media, com amplitude mnima, e
da forma


s
s
x z(1 /2) , x + z(1 /2) .
n
n
s
Atendendo a que a amplitude do intervalo e igual a 2 z(1 /2) , obtemos
n

7.65
2 = 2 z(1 /2)
z(1 /2) = 2.17 1 /2 = 0.985.
36
Conclumos ent
ao que, com confianca aproximadamente 97%, se obtem um intervalo de amplitude mnima 2.
2. Para responder `
a segunda quest
ao e admitindo agora que X tem distribuica
o normal, h
a
que testar H0 : 2 = 9 e H1 : 2 < 9, adoptando o nvel de signific
ancia 0.025, por exemplo.
(n 1)S 2
, quando H0 e verdadeira, tem distriA estatstica de teste a considerar, En =
9
2 . Assim, para = 0.025, a regi
ao crtica e
buica
o Xn1
C =]0, X35 (0.025)] =]0, 20.56938].
35 7.65
= 29.75, n
ao pertence a C.
Mais, o valor observado da estatstica de teste, e36 =
9
Face a estes dados, e adoptando o nvel de signific
ancia 0.025, n
ao temos raz
oes para
confirmar a afirmac
ao do fabricante.
Observa
c
ao 3.6.2 No caso em que a vari
avel aleat
oria X n
ao tem distribuic
ao normal
2
n
ao h
a resultados a registar para a lei de S . Contudo, em alguns casos particulares, podemos
(n 1)S 2
realizar testes para a vari
ancia sem usar a estatstica de teste
. Basta atender aos
02
casos em que a vari
ancia e func
ao da media. Nestas situac
oes, realizamos um teste para a
media, ainda que com nvel de signific
ancia aproximado, e seguidamente usamos a relaca
o
entre a media e a vari
ancia para construir um teste para a vari
ancia.
Exerccio 3.6.1 Uma organizac
ao de defesa de consumidores recebeu v
arias queixas acerca
da quantidade de tinta, vendida por determinada marca, em baldes de valor nominal 1 litro.
N
ao querendo publicidade negativa, o fabricante reagiu afirmando ter regulado as m
aquinas
recentemente para que a quantidade media de tinta introduzida em baldes com aquele valor
nominal fosse de 1.1 litros. Tendo continuado a receber queixas, a referida organizac
ao deu
incio a um estudo estatstico para esclarecer a situac
ao. Assim, foi recolhida uma amostra de
30 baldes de tinta que apresenta media igual a 1.06 e desvio padr
ao igual a 0.06. Denote por X
a vari
avel aleat
oria que representa a quantidade de tinta introduzida em cada balde. A mesma
amostra permitiu concluir a normalidade de X.
1. Determine um intervalo que contenha a media de X com 98% de confianca.

3.6 - Inferencia para a vari


ancia de uma variavel aleatoria normal

97

2. Realize um teste estatstico, com nvel de signific


ancia 0.05, para averiguar se o desvio
padr
ao de X pode ser considerado inferior a 0.075.
Exerccio 3.6.2 Uma m
aquina est
a regulada de forma a que o comprimento das pecas que
produz seja uma v.a. real gaussiana de media 50 mm e desvio padr
ao inferior ou igual a 2 mm.
Analisaram-se 85 pecas,Pretiradas ao acaso da produc
ao da m
aquina, cujos comprimentos,
86
2
x1 , x2 , ...x86 , verificam:
i=1 (xi x) = 765.
1. Construa um intervalo com 95% de confianca para a vari
ancia do comprimento das pecas.

2. Tendo em conta apenas a alnea anterior, poder


a afirmar que est
ao a ser cumpridos os
requisitos relativos `
a variabilidade do comprimento das pecas?
Exerccio 3.6.3 Um fabricante de determinado tipo de paqumetro afirma que as medic
oes
efectuadas com este tipo de instrumento apresentam um desvio padr
ao de 0.01 mm. Com
o objectivo de verificar se um paqumetro deste tipo, em servico h
a bastante tempo, ainda
possua as caractersticas indicadas pelo fabricante, o respons
avel pelo laborat
orio de controlo
de qualidade repetiu, em condic
oes semelhantes, 20 medico
es sobre uma determinada dimens
ao
padr
ao. O desvio padr
ao das leituras efectuadas nesta experiencia foi 0.013 mm. Admitindo a
normalidade da populac
ao em estudo poder-se-
a concluir que o paqumetro se degradou com o
uso? Use um nvel de signific
ancia de 0.01.
Exerccio 3.6.4 Uma certa empresa fabrica um produto para o qual e razo
avel considerar
que o peso de cada embalagem e normalmente distribudo com um desvio padr
ao igual a 0.15
quilogramas. O departamento de investigac
ao prop
os um novo processo de fabrico do mesmo
produto. Devido ao custo associado a este novo processo a empresa decide que este n
ao ser
a
adoptado se o peso das embalagens produzidas apresentar um desvio padr
ao superior a 0.1
quilogramas. O registo dos pesos, em quilogramas, de 10 embalagens forneceu os seguintes
valores: 5.0809, 5.0759, 5.0259, 4.6110, 4.8656, 5.0602, 5.0061, 5.0771, 4.8846, 5.0886. Deve
a empresa adoptar o novo processo de fabrico?
Exerccio 3.6.5 Considere o registo de valores da temperatura de fus
ao (em graus centgrados)
de 24 pecas de chumbo j
a apresentado no problema 3.3.1. Suponha que a distribuic
ao subjacente
e normal.
1. Construa um intervalo com confianca 95% para o valor da vari
ancia.
2. Se as pecas fundidas forem constitudas por chumbo puro, o valor de n
ao deveria ser
maior do que 5. Parece-lhe que as pecas poder
ao ser de chumbo puro? Com que nveis
de signific
ancia?
Exerccio 3.6.6 Em determinada estac
ao de servico, o tempo, em dias, que decorre entre
dois reabastecimentos consecutivos de combustvel e descrito por uma vari
avel aleat
oria real X
com distribuic
ao E(, 3). Foi observada uma amostra de dimens
ao 50 dos referidos tempos que
apresenta media 5.2 e vari
ancia 4.23.
1. Construa um intervalo de confianca que contenha E(X) com 90% de confianca.
2. Podemos afirmar que V ar(X) e superior a 4? Use o nvel de signific
ancia 0.05.

98

Captulo 3: Estatstica Inferencial

Exerccio 3.6.7 Um fabricante afirma que o tempo medio de vida das baterias produzidas
na sua f
abrica e superior a 3 anos. Um amostra dos tempos de vida de 36 baterias apresenta
m
adia igual a 3.15 anos e desvio padr
ao igual a 1.65. Denote por X a vari
avel aleat
oria que
representa o tempo de vida das referidas baterias.
1. Realize um teste que lhe permita averiguar se o fabricante tem raz
ao no que respeita ao
tempo medio de vida das baterias. Use o nvel de signific
ancia 0.025.
2. Construa um intervalo que contenha a vari
ancia de X com 95% de confianca.
3. Usando esta amostra, test
amos as hip
oteses H0 : V ar(X) = 3 contra H1 : V ar(X) < 3.
Ao nvel de signific
ancia 0.05, rejeit
amos H0 . Sem realizar o teste, justifique por que
motivo a conclus
ao e a mesma se considerar um nvel de signific
ancia inferior a 0.05.
4. Admita agora que disp
oe de outra amostra, de dimens
ao igual a 30, a partir da qual
pode concluir, com 95% de confianca, que a media de X se encontra num intervalo
(de amplitude mnima) com ponto medio igual a 3.34 e extremo superior igual a 3.98.
Determine a vari
ancia desta amostra.

3.7
3.7.1

Infer
encia para proporc
oes
Intervalos de confianca

Consideremos o exemplo academico da experiencia aleatoria que consiste no lancamento de uma


moeda nao necessariamente equilibrada. Ao realizar esta experiencia 100 vezes foi observada 45
vezes uma das faces. Representemos por p a probabilidade de ocorrencia desta face. Neste caso
sabemos que a estimativa para o parametro p, obtida pelo metodo dos momentos, e pb = 45/100.
Suponhamos que uma empresa admite a possibilidade de lancar um novo produto no mercado e que pretende estudar a receptividade deste produto numa populacao de potenciais
compradores. O respectivo estudo de mercado tem por objectivo principal avaliar, numa dada
populacao que se supoe suficientemente numerosa, a proporcao p de indivduos interessados
em adquirir este novo produto. Tambem neste caso a estimativa para p, obtida a partir de
uma amostra observada, e dada pelo quociente entre o n
umero de indivduos da amostra que
mostraram vontade (ou necessidade) de comprar o produto e a dimensao da amostra.
Contextos similares podem ser encontrados quando se estuda a proporcao de pecas defeituosas produzidas por uma maquina (ou probabilidade de uma peca qualquer produzida pela
maquina ser defeituosa), a proporcao de veculos ligeiros que passam diariamente sobre uma
ponte, a proporc
ao de alunos de uma universidade que se mostram favoraveis ao pagamento
de propinas ou `a proporc
ao de alunos universitarios de determinado pas que advogam a nao
existencia de exames.
Em todos os exemplos acima se estuda a proporcao de indivduos de uma dada populacao com determinada caracterstica ou, por outras palavras, a probabilidade de um indivduo
qualquer dessa populac
ao possuir tal caracterstica. Depois da obtencao de estimativas para
tal proporc
ao p, e agora nosso objectivo construir intervalos de confianca para p. Tal objectivo
e alcancado se entendermos que cada elemento da amostra de que dispomos e o resultado da
realizacao de uma experiencia de Bernoulli.

Anda mungkin juga menyukai