Notas de
M
etodos Estatsticos
ii
Conte
udo
1 Teoria das Probabilidades
1.1 Diferentes conceitos de Probabilidade . . . . . . . . . . . . . . . .
1.2 Condicionamento e independencia estocastica de acontecimentos
1.3 Vari
aveis aleatorias e distribuicoes . . . . . . . . . . . . . . . . .
1.3.1 Vari
aveis aleatorias . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Distribuic
oes discretas e distribuicoes contnuas . . . . . .
1.3.3 Momentos simples e centrados de variaveis aleatorias . .
1.3.4 Distribuic
oes mais usadas em Estatstica . . . . . . . . . .
1.4 Teorema Limite Central . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
3
3
8
13
13
15
19
26
42
2 Estatstica Descritiva
2.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Vari
aveis estatsticas discretas . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Vari
aveis estatsticas contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
49
50
54
Estatstica Inferencial
3.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Distribuic
oes amostrais . . . . . . . . . . . . . . . . . . . .
3.3 Estimac
ao parametrica pontual . . . . . . . . . . . . . . . .
3.4 Testes de ajustamento . . . . . . . . . . . . . . . . . . . . .
3.4.1 Generalidades sobre testes . . . . . . . . . . . . . . .
3.4.2 Teste do Qui-Quadrado como teste de ajustamento
3.4.3 Teste de Kolmogorov-Smirnov . . . . . . . . . . . . .
3.4.4 Papel de probabilidade . . . . . . . . . . . . . . . . .
3.5 Inferencia para a media de uma variavel aleatoria . . . . .
3.5.1 Intervalos de confianca . . . . . . . . . . . . . . . . .
3.5.2 Testes parametricos . . . . . . . . . . . . . . . . . .
3.6 Inferencia para a vari
ancia de uma variavel aleatoria normal
3.6.1 Intervalos de confianca . . . . . . . . . . . . . . . . .
3.6.2 Testes parametricos . . . . . . . . . . . . . . . . . .
3.7 Inferencia para proporc
oes . . . . . . . . . . . . . . . . . .
3.7.1 Intervalos de confianca . . . . . . . . . . . . . . . . .
3.7.2 Testes parametricos . . . . . . . . . . . . . . . . . .
3.8 Regressao linear simples . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
61
61
63
65
70
70
71
76
77
79
79
86
92
92
94
98
98
101
105
Captulo 1
1.1
De um modo geral, a teoria das probabilidades tem como objectivo encontrar modelos matematicos que descrevam certos fenomenos naturais em que se supoe intervir o acaso, isto e,
fenomenos para os quais nao e possvel, a partir do passado, prever deterministicamente o
futuro. A estes fenomenos chamamos fenomenos aleatorios.
Neste contexto surge tambem a nocao de experiencia aleatoria que aqui definimos como
um processo ou conjunto de circunstancias sujeitos a factores casuais capaz de produzir efeitos
observaveis mas incertos.
Exemplo 1.1.1 Lancamento de um dado; lancamento de uma moeda; lancamento de
tres dados; observac
ao e registo de temperatura; avaliac
ao e registo de um caudal; contagem
do n
umero de veculos que passam numa portagem de auto-estrada; contagem do n
umero de
lancamentos de um dado ate obter pela terceira vez a face 2; contagem do n
umero de alunos
que chegam atrasados a uma aula.
+
[
An
n=1
acontecimento intersecc
ao numeravel dos acontecimentos A1 , A2 , A3 , ..., An , ... a
+
\
An
n=1
Defini
c
ao 1.1.1 Definic
ao cl
assica ou de Laplace de probabilidade.
Dada uma experiencia aleat
oria, se e finito e todos os seus elementos s
ao equipossveis,
ent
ao a probabilidade de A e o quociente entre o n
umero de casos favor
aveis `
a ocorrencia de
A e o n
umero de casos possveis de obter ao realizar a experiencia, isto e
P (A) =
#A
.
#
Exemplo 1.1.3 Ao lancarmos um dado equilibrado duas vezes consideremos os acontecimentos A=sada de um n
umero par e de um n
umero mpare B= sada de um n
umero
par seguida de um n
umero mpar, ou seja, B = {(i, j) : i {2, 4, 6}, j {1, 3, 5}} e
A = B {(i, j) : i {1, 3, 5}, j {2, 4, 6}}.
Sabemos que # = 6 6 = 36 e que todos os acontecimentos elementares tem a mesma
ent
possibilidade de ocorrencia. E
ao v
alido o conceito cl
assico de Laplace de probabilidade,
#B
#A
233
1
33
tendo-se P (A) = # = 66 = 2 e P (B) = # = 66 = 14 .
Exemplo 1.1.4 Consideremos a experiencia aleat
oria associada ao Totoloto, isto e, a
experiencia que consiste na extraca
o aleat
oria de 6 bolas de uma urna que contem 49 bolas
numeradas de 1 a 49. Consideremos os acontecimentos A= sada de uma determinada chave
fixae B= sada de uma chave com seis n
umeros pares. Podemos, mais uma vez, usar o
C 24
conceito cl
assico de Laplace para obter P (A) = C149 e P (B) = C649 .
6
Suponhamos agora que lancamos uma moeda equilibrada com as faces representadas por C
e K. Sendo a moeda equilibrada, sabemos que P (C) = P (K) = 1/2. No entanto se lancarmos
a moeda um n
umero reduzido de vezes, a frequencia relativa de C dificilmente sera igual a 1/2.
Mas, sabemos tambem que se prolongarmos a realizacao da experiencia indefinidamente, a
frequencia relativa de C vai estabilizando em torno de 1/2. Este exemplo, aqui apresentado
com um ponto de vista meramente academico, motiva uma outra definicao de probabilidade
que assenta essencialmente na regularidade estatstica associada a certos fenomenos aleatorios
e que permite definir a probabilidade como limite de uma frequencia relativa.
Defini
c
ao 1.1.2 Definic
ao frequencista de probabilidade (Bernoulli). Consideremos uma
experiencia aleat
oria e um acontecimento A que lhe est
a associado. Representemos por fn (A)
a frequencia relativa do acontecimento A em n realizac
oes da experiencia, sempre nas mesmas
circunst
ancias. Tem-se
P (A) = lim fn (A).
n+
Defini
c
ao 1.1.4 Definic
ao axiom
atica de probabilidade. Seja o espaco fundamental associado a uma experiencia aleat
oria e T uma tribo sobre . Uma probabilidade e uma aplicac
ao
P : T [0, 1], que verifica
i) P () = 1
ii) Para qualquer sucess
ao de acontecimentos A1 , A2 , ..., An , ..., dois a dois incompatveis,
+
+
X
[
P (Ai ).
Ai ) =
tem-se P (
i=1
i=1
Proposi
c
ao 1.1.1 Propriedades da probabilidade.
1. P () = 0.
2. (Aditividade) Se A e B s
ao acontecimentos incompatveis ent
ao P (AB) = P (A)+P (B).
3. Se A e B s
ao dois acontecimentos tais que A B, ent
ao P (A) P (B).
Prova. Se A B, ent
ao B e igual `
a uni
ao disjunta entre A e B A. Assim P (B) =
P (A) + P (B A), pelo que se tem P (A) P (B).
4. Se A e B s
ao dois acontecimentos quaisquer ent
ao
(a) P (A) = 1 P (A);
n
[
i=1
Ai )
n
X
P (Ai )
i=1
1.2
Condicionamento e independ
encia estoc
astica de acontecimentos
Suponhamos que para uma experiencia aleatoria conhecemos o espaco fundamental e que temos
definida uma probabilidade P .
Sejam A e B dois acontecimentos tais que P (B) 6= 0. Se depois de realizada a experiencia
soubermos que se realizou B, de que modo essa informacao parcial sobre o resultado da ex o caso, por exemplo, em que ao realizarmos uma
periencia ira modificar a probabilidade de A? E
experiencia para determinar o tempo de vida de uma lampada e sabendo, num determinado
instante, que a lampada ja durou pelo menos 100 horas, querermos saber qual a probabilidade de a lampada durar pelo menos mais 50 horas. Surge assim o conceito de probabilidade
condicionada.
Defini
c
ao 1.2.1 Dado um acontecimento B tal que P (B) 6= 0, chamamos probabilidade
condicional de A dado B, ou probabilidade de A condicionada por B a
P (A|B) =
P (A B)
.
P (B)
Observa
c
ao 1.2.1 Notamos que, para qualquer acontecimento B tal que P (B) 6= 0, a
aplicac
ao P (|B) ( tambem denotada por PB ()) que a um acontecimento A faz corresponder
P (A|B) e uma probabilidade.
Exemplo 1.2.1 Um dado perfeito, com as faces numeradas de 1 a 6, foi lancado duas
vezes. Sabendo que a soma das duas faces foi 6 qual e agora a probabilidade de que no primeiro
lancamento tenha sado a face 1?
Se definirmos B = soma dos resultados ser 6 e A = no primeiro lancamento sair 1
teremos P (A|B) = 1/5. Com efeito, B = {(1, 5), (2, 4), (4, 2), (3, 3), (5, 1)} e A B = {(1, 5)} e
1
portanto P (A|B) = P P(AB)
(B) = 5 .
Exemplo 1.2.2 Consideremos a experiencia aleat
oria que consiste na extracc
ao de uma
carta de um baralho, n
ao viciado, com 52 cartas. Consideremos os acontecimentos A=sada
de
as, B=sada de damae C=sada de espada. Uma vez que se pode aplicar o conceito
4
4
, P (B) = 52
e P (C) = 13
cl
assico de Laplace, tem-se P (A) = 52
52 . Supondo agora que se
observou o acontecimento D=sada de uma figuraa probabilidade dos acontecimentos A, B e
4
3
C ser
a condicionada. De facto, tem-se P (A|D) = 0, P (B|D) = 12
= 13 e P (C|D) = 12
= 41 .
Proposi
c
ao 1.2.1 (Teorema da Probabilidade Total) Sejam B1 , B2 , ..., Bn acontecimentos
do mesmo espaco, disjuntos dois a dois e com probabilidade n
ao nula. Para qualquer outro
n
acontecimento A contido em i=1 Bi , tem-se
P (A) =
n
X
P (A|Bi )P (Bi ).
i=1
Exemplo 1.2.3 Dos tres fornecedores de um produto para um armazem (em partes de
30%, 50% e 20% respectivamente) todos fornecem o produto em lotes que por vezes est
ao em
condic
oes indesejadas (atraso, peso insuficiente, impurezas, falta de especificidade, etc), sendo
a percentagem de lotes em condico
es indesejadas sobre o total fornecido por cada um dos
fornecedores de 0.7%, 0.5% e 0.4%, respectivamente.
Ao escolher aleatoriamente um lote desse produto e verificado que se encontrava em condic
oes
indesejadas, qual o seu fornecedor mais prov
avel?
Consideremos os acontecimentos A= o lote e fornecido pelo fornecedor A, B= o lote e
fornecido pelo fornecedor Be C= o lote e fornecido pelo fornecedor Ce I= o lote e fornecido
em condico
es indevidas.
Tem-se P (A) = 0.3, P (B) = 0.5, P (C) = 0.2, P (I|A) = 0.007, P (I|B) = 0.005 e P (I|C) =
0.004.
P (I|A)P (A)
P (I A)
=
onde
Por outro lado P (A|I) =
P (I)
P (I)
P (I) = P (I|A)P (A) + P (I|B)P (B) + P (I|C)P (C)
= 0.007 0.3 + 0.005 0.5 + 0.004 0.2
= 0.0054.
0.007 0.3
0.389.
Ent
ao P (A|I) =
0.0054
Tambem se tem
P (B|I) =
P (I B)
P (I|B)P (B)
0.005 0.50
=
=
0.463
P (I)
P (I)
0.0054
e
P (C|I) = 1 P (A|I) P (B|I) = 1 0.389 0.463 = 0.148.
Conclumos que o fornecedor mais prov
avel e B.
Calculemos tambem a probabilidade de um determinado lote, escolhido ao acaso, ter vindo
do primeiro fornecedor e se apresentar em condic
oes indesejadas. Esta probabilidade e P (A
I) = P (A|I)P (I) = 0.389 0.0054 0.0021.
Exemplo 1.2.4 Num determinado material podem encontrar-se impurezas de v
arios tipos.
Em ensaios laboratoriais e possvel identificar impurezas de tipo A usando um produto que
10
infelizmente n
ao e totalmente eficaz. Com efeito, se as impurezas s
ao de tipo A o material
adquire um tom azulado de certeza e, em caso contr
ario, a probabilidade de o material ficar
azulado e de 5%. A realizac
ao de v
arios ensaios permitiu concluir que a probabilidade de o
material adquirir o tom azul e de 35%.
Vamos calcular a probabilidade de haver impurezas de tipo A neste material.
Consideremos os acontecimentos A=As impurezas s
ao de tipo Ae B=O material adquire
um tom azulado.
= 0.05. Alem disso A B = A, pois A B,
Sabemos que P (B) = 0.35 e que P (B|A)
donde P (A B) = P (A) e P (B|A) = 1.
(A)
e equivalente a 0.35 = 1P (A) +
Uma vez que P (B) = P (B|A) P (A) + P (B|A)P
0.05(1 P (A)), conclumos que P (A) = 0.3/0.95 0.316.
Exemplo 1.2.5 Um grupo de alunos por vezes, em vez de ir `
as aulas, fica na residencial
a jogar dois jogos, sendo igualmente prov
avel optarem por um ou por outro. Os jogos consistem
em adivinhar o n
umero de pintas obtidas no lancamento de dados. No primeiro jogo joga-se
apenas com um dado e no segundo com dois dados. Sabendo que o resultado foi 2 qual a
probabilidade de estarem a jogar o primeiro jogo?
Sejam A=Os alunos jogam o primeiro jogoe B =O resultado foi 2. Tem-se
P (A|B) =
P (B|A)P (A)
6
P (A B)
=
= .
P (B)
7
P (B|A)P (A) + P (B|A)P (A)
11
12
13
Exerccio 1.2.10 Um sistema electrico e constitudo por dois circuitos C1 e C2 que funcionam em paralelo. O circuito C1 e composto por uma s
o componente, enquanto que o circuito
C2 e constitudo por duas componentes que funcionam em serie. Suponha que as tres componentes falham independentemente umas das outras e que a probabilidade de cada componente
falhar e igual a 0.05.
1. Determine a probabilidade do sistema funcionar.
2. Determine a probabilidade de apenas o circuito C1 funcionar.
Exerccio 1.2.11 A execuc
ao de um projecto de construc
ao de um edifcio no tempo programado est
a relacionada com os seguintes acontecimentos:
E=escavac
ao executada a tempo
F=fundac
oes executadas a tempo
S=superestrutura executada a tempo
que se sup
oem mutuamente independentes. Sabendo que P (E) = 0.8, P (F ) = 0.7 e P (S) = 0.9,
calcule a probabilidade de
1. o edifcio ser terminado no tempo previsto, devido ao cumprimento dos prazos nas tres
actividades referidas.
2. o prazo de execuc
ao ser cumprido para a escavac
ao e n
ao ser cumprido em pelo menos
uma das outras actividades.
1.3
1.3.1
Vari
aveis aleat
orias e distribuic
oes
Vari
aveis aleat
orias
14
Defini
c
ao 1.3.1 Seja o espaco fundamental associado a uma experiencia aleat
oria. Damos o nome de vari
avel aleat
oria real a uma func
ao
X : IR
X()
para a qual e sempre possvel calcular P (X x) = P ({ : X() x}), para qualquer x real.
A palavra vari
avel e utilizada para enfatizar o facto de se tratar de uma funcao que tem
como domnio o espaco fundamental de uma experiencia aleatoria.
Refira-se que habitualmente se designa a variavel aleatoria por letra mai
uscula enquanto que
os valores particulares que esta assume sao representados pela letra min
uscula correspondente.
Se X1 , X2 , ..., Xn sao vari
aveis aleatorias e f e uma funcao real de n variaveis reais contnua,
entao f (X1 , X2 , ..., Xn ) e uma vari
avel aleatoria. Um caso particular muito importante e o da
variavel aleatoria
X n : IR
1X
X n () =
Xi ()
n
i=1
15
x+
1.3.2
Distribuic
oes discretas e distribuic
oes contnuas
16
Defini
c
ao 1.3.4 Uma vari
avel aleat
oria X diz-se discreta (ou que tem distribuic
ao discreta) se assume valores num conjunto finito ou infinito numer
avel S, tendo-se portanto P (X
S) = 1.
Defini
c
ao 1.3.5 Dada uma vari
avel aleat
oria real discreta X, chamamos suporte de X
(ou da distribuic
ao de X) ao menor dos conjuntos S que verificam P (X S) = 1.
O suporte da vari
avel aleatoria X sera denotado por SX . De acordo com as definicoes
anteriores, uma vari
avel aleatoria real X diz-se discreta se e so se assume valores num conjunto finito ou infinito numer
avel. Devemos notar que o conjunto de valores que uma variavel
aleatoria discreta assume pode nao ser exactamente igual ao seu suporte. Contudo, este conjunto contem sempre SX . Mais concretamente, tem-se sempre P (X = a) > 0, para qualquer a
pertencente a SX . Esta afirmac
ao sugere a nocao de funcao de probabilidade de uma variavel
aleatoria discreta.
Defini
c
ao 1.3.6 Dada uma vari
avel aleat
oria real discreta X, damos o nome de funca
o de
probabilidade `
a aplicaca
o
f : R [0, 1]
x P (X = x)
0
se x < 0
0.25 se 0 x < 1
F (x) = P (X x) =
,
0.75 se 1 x < 2
1
se x 2
17
cujo esboco do gr
afico e apresentado na figura seguinte:
..
..
..
...........................
..............................................F
1 ...
.
.........................
0.75 ..
..
..
0.25 ...........................
..................................................................................................................................................................................
0
1
2
Partindo do exemplo anterior, podemos agora ilustrar as propriedades 6 e 7 da funcao de
distribuicao. Com efeito, a func
ao de distribuicao apresenta descontinuidades apenas nos pontos
do conjunto {0, 1, 2} e as amplitudes de salto 0.25, 0.5 e 0.25 correspondem `as probabilidades
P (X = 0), P (X = 1) e P (X = 2), respectivamente.
Passemos agora ao segundo tipo de variaveis aleatorias.
Defini
c
ao 1.3.7 Uma vari
avel aleat
oria real X diz-se contnua se P (X = x) = 0, para
qualquer n
umero real x.
Do ponto de vista das aplicac
oes estatsticas, no conjunto das variaveis contnuas interessanos um subconjunto especial que designamos variaveis aleatorias absolutamente contnuas ou
variaveis aleatorias com distribuicao absolutamente contnua. Devemos mesmo afirmar que,
no contexto de tais aplicac
oes e no ambito em que se insere este texto, as variaveis que sao
contnuas mas nao absolutamente contnuas perdem a sua importancia teorica.
Sao exemplos de vari
aveis aleatorias absolutamente contnuas a velocidade do vento, a
temperatura, as medidas de capacidade, o comprimento e massa (peso), as medidas de areas e
volumes, as resistencias, os caudais, as tensoes de rotura, etc.
No sentido de definir vari
avel aleatoria absolutamente contnua e necessario definir func
ao
densidade.
Defini
c
ao 1.3.8 Damos o nome de func
ao densidade sobre R a uma funca
o real de vari
avel
real f que seja n
ao negativa e que verifique
Z +
f (t)dt = 1.
Depois disto definimos uma variavel aleatoria X como absolutamente contnua como se
segue.
Defini
c
ao 1.3.9 Uma vari
avel aleat
oria real X diz-se absolutamente contnua se existe
uma densidade sobre R tal que a func
ao de distribuic
ao de X se escreve na forma
Z x
F (x) =
f (t)dt, x IR.
Da definic
ao de vari
avel aleatoria absolutamente contnua decorre que a funcao de distribuicao e contnua e verifica
i) f (x) = F (x) nos pontos onde a derivada existe;
18
Em consequencia desta u
ltima propriedade podemos afirmar que, se X for uma variavel
aleatoria absolutamente contnua, a probabilidade de X pertencer ao intervalo [a, b] e a medida
da area limitada inferiormente pela recta de equacao y = 0, superiormente pelo grafico de f e
lateralmente pelas rectas de equac
ao x = a e x = b. Este facto e ilustrado na figura seguinte,
onde a medida da area a tracejado representa a referida probabilidade.
Observa
c
ao 1.3.1 Uma vez que, no
ambito das aplicac
oes estatsticas, as vari
aveis que
s
ao contnuas mas n
ao absolutamente contnuas n
ao tem relev
ancia, no que se segue usamos
a designac
ao contnua para significar absolutamente contnua.
Exemplo 1.3.2 Seja X uma vari
avel aleat
oria contnua com densidade definida pela express
ao analtica
f (x) =
1
ba
se
se
se
se
0
xa
se
F (x) =
ba
1
se
x<a
axb .
x>b
de X e dada por
x<a
axb .
x > b.
..
..
...........................
.......................F
1 .......
......
.
.
.
.
..
.
.....
..
......
.
.
.
.
.
..
....
.................................................................................................................................................
.
a
b
Neste caso dizemos que X segue a lei uniforme no intervalo [a, b] e escrevemos
X U ([a, b]).
19
A independencia de vari
aveis aleatorias e um conceito de importancia primordial em muitas
das aplicac
oes mais usuais da teoria das probabilidades.
Defini
c
ao 1.3.10 Duas vari
aveis aleat
orias reais X e Y dizem-se independentes se
P (X x, Y y) = P (X x)P (Y y),
para quaisquer x e y reais. De igual modo, as vari
aveis aleat
orias reais X1 , X2 , ..., Xn definemse como independentes se
P (X1 x1 , X2 x2 , , Xn xn ) = P (X1 x1 )P (X2 x2 ) P (Xn xn ),
para quaisquer x1 , x2 , , xn reais .
Notamos que no caso em que as variaveis aleatorias X1 , X2 , ..., Xn sao discretas, uma
condicao necessaria e suficiente para que sejam independentes e que se verifique
P (X1 = x1 , X2 = x2 , , Xn = xn ) = P (X1 = x1 )P (X2 = x2 ) P (Xn = xn ),
para x1 SX1 , x2 SX2 , , xn SXn .
1.3.3
Como veremos adiante, quando se pretende conhecer a distribuicao de uma variavel aleatoria
associada a um fenomeno aleatorio, ha que encontrar inicialmente o tipo de distribuicao entre
todas as contnuas e discretas de que dispomos. A tarefa seguinte sera a de conhecer os seus
parametros desconhecidos, os quais nos permitem especificar caractersticas tao importantes
como a localizac
ao e a dispersao dos valores que tal variavel assume.
Neste contexto, surgem as nocoes de media e de variancia de uma variavel que sao particularizacoes dos momentos simples e centrados de uma variavel aleatoria, nocao com a qual nos
ocupamos de seguida.
Defini
c
ao 1.3.11
1. Seja X uma vari
avel aleat
oria real discreta. Se
xSX
esperanca matem
atica ou media de X que e definida por
X
E(X) =
xP (X = x).
xSX
a esperanca matem
atica ou media de X que e dada por
Z +
E(X) =
xf (x)dx.
20
ex se
0
se
onde e um n
umero real positivo. Tem-se
Z
Z +
|x|f (x) dx =
x0
,
x<0
xex dx.
e ent
ao
t
Z +
1
1
xex = lim ex x ex = .
t+
0
0
Conclumos assim que o integral impr
oprio e convergente e portanto E(X) existe, tendo-se
Z +
Z 0
Z +
1
E(X) =
xf (x) dx =
0 dx +
xex dx = .
0
Exemplo 1.3.5 Seja X uma vari
avel aleat
oria seguindo a distribuic
ao de Cauchy redu1 1
, x R.
zida, isto e, a lei de densidade f (x) =
1 + x2
A esperanca matem
atica de X n
ao existe porque
Z +
Z 0
Z +
|x|f (x) dx =
x f (x) dx +
x f (x)dx
=
=
x
dx +
(1 + x2 )
x
dx
(1 + x2 )
1
1
lim log(1 + a2 ) +
lim log(1 + b2 ) = +.
2 a
2 b+
Proposi
c
ao 1.3.2 (Propriedades da esperanca matem
atica) Sejam X e Y duas vari
aveis
aleat
orias definidas sobre o mesmo espaco e tais que E(X) e E(Y ) existem. Tem-se
21
i) se P (X 0) = 1 ent
ao E(X) 0;
ii) E(X + Y ) = E(X) + E(Y );
iii) E(aX + bY ) = aE(X) + bE(Y ),
a, b IR;
iv) se X e Y s
ao independentes, ent
ao E(XY ) = E(X)E(Y );
v) |E(X)| E(|X|).
As propriedades ii), iii) e iv) sao facilmente generalizaveis a um n
umero finito de variaveis
aleatorias. Concretamente, tem-se
E(a1 X1 + a2 X2 + ... + an Xn ) = a1 E(X1 ) + a2 E(X2 ) + ... + an E(Xn ),
a1 , ..., an IR;
2. Se X e uma vari
avel aleat
oria contnua tal que o integral
gente, ent
ao existe esperanca matem
atica de h(X) tendo-se
Z +
E(h(X)) =
h(x)f (x)dx.
22
Proposi
c
ao 1.3.3 A vari
ancia de uma v.a. X verifica as seguintes propriedades:
i) Var(aX + b) = a2 Var(X), a, b R;
ii) Se X e Y s
ao independentes, ent
ao Var(X + Y ) =Var(X)+Var(Y );
iii) Var(X) = E(X 2 ) (E(X))2 (F
ormula de Koenig);
iv) Var(X) = 0 a R : P (X = a) = 1.
Notamos que da primeira propriedade se conclui que
V ar(aX) = a2 V ar(X), a R
V ar(X) = V ar(X)
V ar(X + b) = V ar(X), b R.
Alem disso a propriedade ii) e generalizavel a qualquer n
umero finito de variaveis aleatorias.
Os quantis de uma distribuic
ao, que passamos a definir, sao parametros que permitem
estudar em simult
aneo a localizac
ao e a concentracao dos valores assumidos por uma variavel
aleatoria.
Defini
c
ao 1.3.13 Seja p ]0, 1[. Dada uma vari
avel aleat
oria X, chamamos quantil de
probabilidade p da distribuic
ao de X a um n
umero Q(p) que verifica
lim F (x) p e
xQ(p)
lim
xQ(p)+
F (x) F (Q(p)) p .
Observamos que no caso em que existe um intervalo de valores x que verificam F (x) = p
qualquer um dos valores deste intervalo satisfaz a definicao anterior. Existem na literatura
varias convenc
oes adoptadas por diferentes autores no sentido de determinar Q(p) de forma
u
nica. Neste curso consideramos Q(p) igual ao ponto medio de tal intervalo. Um caso particular
interessante e o dos tres quartis da distribuicao de X e que correspondem aos casos em que
p toma os valores 1/4, 1/2 e 3/4. Os tres quartis sao denotados por Q1 , Q2 e Q3 e verificam
lim F (x) i/4 e F (Qi ) i/4, para i {1, 2, 3}.
xQ
i
qualquer valor do intervalo [0, 1[ serve para primeiro quartil. Assim, de acordo com a convenc
ao
referida acima consideramos Q1 = 0.5.
Similarmente, como
F (1) = lim F (x) = 0.75,
x2
qualquer valor do intervalo [1, 2[ serve para terceiro quartil pelo que consideramos Q3 = 1.5.
Mais, uma vez que lim F (x) = 0.25 < 0.5 e lim F (x) = F (1) = 0.75 > 0.5, conclumos que
x1
x1+
23
1/4
3/4
F (x) =
k/8
se
se
se
se
se
x<1
x [1, 2)
x [2, 3) .
x [3, 4)
x4
ii) {1, 2, 4}
0 se x < 0
0.5 se 0 x < 1
0.6 se 1 x < 2
F (x) =
0.8 se 2 x < 3
1 se x 3.5
0.5
0.3
-1
0.1
0.2
-1
24
6
q
b
0.4
0.25 q
c
q
b
b
-
1 1.5 2
-1
0
1
-1
0.1
0.15
0.05
0
0.15
0
0.05
1
0
0.1
0
2
0.1
0.2
0.1
25
x 100
0
f (x) =
100
x > 100
x2
1. Construa a func
ao de distribuic
ao de X.
0,
caso contr
ario.
Suponha que L, o lucro obtido na venda desta liga (por unidade de peso), depende da percentagem de chumbo, atraves da relac
ao: L = C1 + C2 X. Calcule o valor esperado do lucro por
unidade de peso.
Exerccio 1.3.12 O peso, em Kg, de uma peca e descrito por uma vari
avel aleat
oria com
densidade
x8
se 8 x 9
10 x
se 9 < x 10
f (x) =
.
0
se x < 8 ou se x > 10
1. Calcule o peso medio das pecas e o desvio padr
ao que lhe est
a associado.
2. Cada peca e vendida por 1.7 euros. A todos os compradores que adquiram um peca
pesando menos do que 8.25 Kg e devolvido o seu dinheiro. Alem disso, o custo de produca
o
de cada peca e dado por 0.3 + x/11, onde x e o peso da peca produzida. Qual o lucro
medio por peca?
26
k e|x0.5| x [0, 1]
f (x) =
.
0
x 6 [0, 1]
1. Determine o valor de k.
0
x<0
k e(1 ex )
0 x 21
.
F (x) =
1
12 + k(ex 2 1) 21 < x < 1
1
x1
1.3.4
Distribuic
oes mais usadas em Estatstica
I- Distribui
c
ao de Bernoulli
As variaveis aleatorias com distribuicao ou lei de Bernoulli estao quase sempre relacionadas com experiencias dicotomicas, sendo por isso variaveis que assumem apenas dois valores.
Formalmente convencionamos que tais valores sao 0 e 1.
27
Concretamente, dizemos que uma variavel aleatoria X tem distribuicao de Bernoulli ou que
segue a lei de Bernoulli de parametro p , e escreve-se X B(p), se X assume apenas os dois
valores 0 e 1, com P (X = 1) = p. Tem-se E(X) = p e V ar(X) = p(1 p).
Nas aplicac
oes mais comuns, dada uma experiencia aleatoria e um acontecimento A cuja
probabilidade p = P (A) conhecemos, definimos a variavel aleatoria X que assume o valor 1 se,
ao realizar a experiencia, A ocorre e que assume o valor 0 em caso contrario.
Exemplo 1.3.8 Consideremos a experiencia aleat
oria que consiste no lancamento de um
dado equilibrado, com as faces numeradas de 1 a 6, e A o acontecimento sada de face 2. A
vari
avel aleat
oria que assume o valor 1 se A ocorre e 0 se A n
ao ocorre tem distribuic
ao de
Bernoulli. Uma vez que P (X = 1) = P (A) = 1/6, obtemos E(X) = 1/6 e V ar(X) = 5/36.
` experiencias que apresentam apenas dois resultados possveis damos o nome de exAs
periencias de Bernoulli.
II- Distribui
c
ao Binomial
Consideremos de novo uma experiencia aleatoria e um acontecimento A que lhe esta associado, com p = P (A) conhecido.
Suponhamos que realizamos a experiencia r vezes e que estas realizacoes diferentes sao
independentes umas das outras.
Denotemos por X a vari
avel aleatoria que representa o n
umero de vezes que o acontecimento
A ocorre nas r realizac
oes da experiencia. Nestas condicoes, dizemos que X tem distribuic
ao
Binomial de parametros r e p, escreve-se X B(r, p) e tem-se SX = {0, 1, 2, ..., r} e P (X =
k) = Ckr pk (1 p)rk , para k SX .
Proposi
c
ao 1.3.4 Se X1 , X2 , ..., Xr s
ao vari
aveis aleat
orias independentes com distribuic
ao
de Bernoulli de par
ametro p, ent
ao X1 + X2 + ... + Xr B(r, p).
As propriedades da esperanca matematica e da variancia ja apresentadas e esta u
ltima
proposicao, permitem-nos concluir que E(X) = rp e que V ar(X) = rp(1 p).
Exemplo 1.3.9 O n
umero de caras obtidas ao lancar uma moeda equilibrada dez vezes e
uma vari
avel aleat
oria com distribuica
o B(10, 1/2).
Exemplo 1.3.10 Uma companhia aerea observou que a probabilidade de um passageiro
com bilhete n
ao comparecer ao v
oo e igual a 0.05. Consequentemente decidiu passar a vender
52 bilhetes para cada avi
ao com 50 lugares. Qual a probabilidade de, num dado avi
ao, haver
lugar para todos os passageiros que se apresentarem ao v
oo?
Seja X a vari
avel aleat
oria que representa o n
umero de passageiros que n
ao comparecem
ao v
oo de entre os 52 que possuem bilhete. Nestas condic
oes X B(52, 0.05) e SX =
{0, 1, 2, ..., 52}.
Atendendo a que haver lugar para todos significa que no mnimo n
ao comparecerem
duas pessoas, vamos calcular P (X 2). Ora
P (X 2) = 1 P (X < 2) = 1 (P (X = 0) + P (X = 1))
28
III- Distribui
c
ao Geom
etrica
Seja A um acontecimento associado a uma experiencia aleatoria, com p = P (A) conhecido.
Suponhamos que e possvel realizar a experiencia indefinidamente sendo estas realizacoes
independentes umas das outras.
A variavel aleatoria X que representa o n
umero de vezes que e preciso realizar a experiencia
ate que o acontecimento A ocorra pela primeira vez tem distribuicao Geometrica de parametro
p. Escreve-se X G(p).
Neste caso, tem-se SX = IN e P (X = k) = (1 p)k1 p, para k IN.
.
Tem-se ainda E(X) = 1/p e V ar(X) = 1p
p2
Exemplo 1.3.11 Num armazem s
ao vendidas torneiras de v
arias marcas incluindo a sua
pr
opria marca A. Seja Y a vari
avel aleat
oria que representa o n
umero de clientes que compram
torneiras ate surgir o primeiro (inclusive) que opte por uma torneira da marca A. Sabendo que
a probabilidade de um cliente que compra torneiras escolher a marca A e 0.05, calculemos
P (Y 3).
A vari
avel aleat
oria Y tem distribuic
ao geometrica de par
ametro p = 0.05. Assim
P (Y 3) = 1 P (Y 2)
= 1 (P (Y = 1) + P (Y = 2))
= 1 (0.05 + 0.95 0.05) = 0.9025.
Exemplo 1.3.12 Uma m
aquina produz pecas que s
ao defeituosas com probabilidade 0.02.
Qual o n
umero medio de pecas sem defeito que ser
ao produzidas consecutivamente?
Seja X a vari
avel aleat
oria que representa o n
umero de pecas que a m
aquina produz consecutivamente sem defeito. A vari
avel X + 1 tem distribuic
ao (ou lei) Geometrica de par
ametro
0.02, tendo-se, consequentemente, E(X + 1) = 1/0.02 = 50. Assim E(X) = 49.
IV- Distribui
c
ao uniforme discreta
Uma vari
avel aleatoria X tem distribuicao ou lei uniforme sobre {x1 , x2 , ..., xn } se SX =
{x1 , x2 , ..., xn } e P (X = xi ) = n1 , xi SX . Esta lei e denotada por U ({x1 , , xn }).
Tem-se
n
n
1X
1X 2
E(X) =
xi e V ar(X) =
xi (E(X))2 .
n
n
i=1
i=1
29
k
,
k!
30
Proposi
c
ao 1.3.5 (Estabilidade da distribuic
ao de Poisson) Se X1 , X2 , , Xn s
ao vari
aveis
aleat
orias de Poisson, independentes, de par
ametros 1 , 2 , , n , respectivamente, ent
ao
X1 + X2 + + Xn P(1 + 2 + + n ).
Exemplo 1.3.15 Seja X a vari
avel aleat
oria que representa o n
umero de bacterias Es3
cherichia Coli existentes num cm de
agua. Suponha que X tem distribuic
ao de Poisson e que
a probabilidade de n
ao haver bacterias num cm3 de
agua e igual a 0.05.
Calculemos a probabilidade de existirem pelo menos duas bacterias num cm3 de
agua.
Uma vez que X P() e P (X = 0) = 0.05 = e conclumos que = ln 0.05 o que
equivale a dizer que = ln 0.051 3. Assim
P (X 2) = 1 P (X< 2) = 1
P (X = 0) P (X = 1)
1
0
3
3
= 1 0.2 = 0.8.
+
= 1 0.05
0!
1!
Calculemos agora a probabilidade de que numa amostra de dois cm3 de
agua existam quando
muito 3 bacterias.
Sejam X1 e X2 as vari
aveis aleat
orias que representam o n
umero de bacterias em cada um
dos cm3 de
agua e Y = X1 + X2 a vari
avel aleat
oria que representa, obviamente, o n
umero de
3
bacterias em dois cm de
agua.
Supondo X1 e X2 independentes, podemos afirmar que Y P(3 + 3). Ent
ao
P (Y 3) = P (Y = 0) + P (Y = 1) + P (Y = 2) + P (Y = 3) = e6 61 0.151.
VI - Distribui
c
ao uniforme contnua
Como ja foi dito no exemplo 1.3.2 uma variavel aleatoria tem distribuicao ou lei uniforme
sobre [a, b], escrevendo-se X U ([a, b]), se tem densidade dada por
se x < a
0
1
se a x b
f (x) =
ba
0
se x > b
e, consequentemente, func
ao de distribuicao com expressao analtica
se x < a
0
xa
se a x b .
F (x) =
ba
1
se x > b.
Prova-se que E(X) =
a+b
2
e V ar(X) =
(ba)2
12 .
Notemos que a intervalos contidos em [a, b] com amplitudes iguais correspondem probabilidades iguais.
Um exemplo de uma vari
avel aleatoria com distribuicao uniforme e a que representa um
n
umero real escolhido ao acaso num intervalo limitado [a, b].
31
VII - Distribui
c
ao exponencial
Em estudos de filas de espera surge a necessidade de considerar a variavel aleatoria que
representa a amplitude do intervalo de tempo que decorre entre duas chegadas consecutivas.
Em muitas das aplicac
oes mais comuns, sob algumas restricoes, esta variavel aleatoria segue
uma distribuic
ao ou lei exponencial.
Nos estudos de fiabilidade de maquinas, quando se avalia o tempo de funcionamento sem
falhas, ou em analise de sobrevivencia, quando se pretende avaliar o tempo de sobrevivencia
de um doente sujeito a determinado tratamento, com alguma regularidade e sob circunstancias
muito especiais, surgem tambem variaveis aleatorias com lei exponencial.
Uma vari
avel aleatoria X tem distribuicao ou lei exponencial de parametros > 0 e IR,
e escreve-se X E(, ), se a sua densidade e dada por
e(x) se x
f (x) =
.
0
se x <
O esboco do grafico de f e apresentado de seguida.
A func
ao de distribuic
ao de X e definida por
se
0
F (x) =
1 e(x) se
x<
x
Observemos que se X E(, ) entao X E(, 0). Por outro lado no exemplo 1.3.4
provamos que uma vari
avel aleatoria com distribuicao E(, 0) tem media igual a 1 . Assim,
para X E(, ), tem-se
E(X) = E(X) + = E(X ) + =
Mais, prova-se que V ar(X) = 1/2 .
1
+ .
32
t+
VIII - Distribui
c
ao normal
A distribuic
ao normal, de Gauss ou gaussiana, e talvez a mais importante distribuicao
contnua. De facto, in
umeras sao as variaveis aleatorias que obedecem a esta lei e que sao
usadas na criac
ao de modelos que descrevem exacta ou aproximadamente fenomenos fsicos e
biometricos.
Do ponto de vista das aplicac
oes, tem-se provado que muitos atributos observaveis de certas
populacoes podem ser bem representados por variaveis com distribuicao de Gauss. Por exemplo,
esta distribuic
ao pode constituir uma boa aproximacao para as distribuicoes das alturas e dos
pesos de populac
oes razoavelmente homogeneas, bem como para a distribuicao dos erros de
medida de determinadas grandezas fsicas.
Do ponto de vista teorico, justifica-se a importancia da distribuicao normal pelo facto de
ser uma boa aproximac
ao para a lei da soma de variaveis independentes e ainda pelas suas
excelentes propriedades que lhe conferem uma enorme tratabilidade matematica.
Uma vari
avel aleatoria X tem distribuicao ou lei normal de parametros m e 2 , escreve-se
X N (m, 2 ), se a sua densidade e da forma
f (x) =
1
1 xm 2
e 2 ( ) , x IR.
2
-3
Proposi
c
ao 1.3.6 Propriedades da distribuica
o normal.
1. Se X N (m, 2 ) ent
ao Z =
Xm
N (0, 1).
2. Se Z N (0, 1) ent
ao X = Z + m N (m, 2 ).
3. Se Z N (0, 1) ent
ao
33
Da estabilidade da lei normal e das propriedades da media e da variancia decorre imediatamente que se X1 , X2 , , Xn sao variaveis aleatorias independentes com distribuicao normal
de medias m1 , m2 , , mn e vari
ancias 12 , 22 , , n2 , respectivamente, entao, para quaisquer
reais b, a1 , a2 , ..., an , a vari
avel aleatoria
b + a1 X1 + a2 X2 + + an Xn
tambem tem uma distribuic
ao normal com media b + a1 m1 + a2 m2 + + an mn e variancia
2
2
2
2
igual a a1 1 + a2 2 + + a2n n2 . Na notacao usual escrevemos
n
X
i=1
a i Xi N
n
X
i=1
a i mi ,
n
X
a2i i2
i=1
"
Observa
c
ao 1.3.2 Denotando por FX e por FZ as func
oes de distribuic
ao de X e de Z,
respectivamente, observamos que da primeira propriedade decorre
FX (x) = P (X x) = P
X m
xm
= FZ
xm
As propriedades que acabamos de apresentar, para alem de tornarem a lei normal bastante
atraente para estudos teoricos, como ja dissemos e confirmamos adiante, sao obviamente u
teis
em qualquer aplicac
ao pratica. Com efeito, sempre que dispomos de uma variavel aleatoria com
distribuicao simetrica ou aproximadamente simetrica, devido `a simplicidade deste modelo, e
usual comecar por ajustar uma distribuicao normal. No caso da media nao ser 0 ou da variancia
nao ser igual a 1 podemos sempre usar a transformacao apresentada na observacao 1.3.2 e
determinar probabilidades ou quantis usando sempre uma tabela de probabilidades associadas
`a lei N (0, 1). Apresentamos seguidamente uma das versoes possveis para a referida tabela.
Trata-se da tabela da func
ao de distribuicao da lei N (0, 1).
34
Tabela da func
ao de distribuicao da lei N (0, 1)
P (Z z(p)) = p
z(p)
z(p) = a + b
a b
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
0,0
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594
0,84134
0,86433
0,88493
0,90320
0,91924
0,93319
0,94520
0,95543
0,96407
0,97128
0,97725
0,98214
0,98610
0,98928
0,99180
0,99379
0,99534
0,99653
0,99744
0,99813
0,99865
0,01
0,02
0,03
0,04
0,05
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859
0,84375
0,86650
0,88686
0,90490
0,92073
0,93448
0,94630
0,95637
0,96485
0,97193
0,97778
0,98257
0,98645
0,98956
0,99202
0,99396
0,99547
0,99664
0,99752
0,99819
0,99869
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121
0,84614
0,86864
0,88877
0,90658
0,92220
0,93574
0,94738
0,95728
0,96562
0,97257
0,97831
0,98300
0,98679
0,98983
0,99224
0,99413
0,99560
0,99674
0,99760
0,99825
0,99874
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381
0,84849
0,87076
0,89065
0,90824
0,92364
0,93699
0,94845
0,95818
0,96638
0,97320
0,97882
0,98341
0,98713
0,99010
0,99245
0,99430
0,99573
0,99683
0,99767
0,99831
0,99878
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639
0,85083
0,87286
0,89251
0,90988
0,92507
0,93822
0,94950
0,95907
0,96712
0,97381
0,97932
0,98382
0,98745
0,99036
0,99266
0,99446
0,99585
0,99693
0,99774
0,99836
0,99882
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894
0,85314
0,87493
0,89435
0,91149
0,92647
0,93943
0,95053
0,95994
0,96784
0,97441
0,97982
0,98422
0,98778
0,99061
0,99286
0,99461
0,99598
0,99702
0,99781
0,99841
0,99886
0,06
0,07
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147
0,85543
0,87698
0,89617
0,91309
0,92785
0,94062
0,95154
0,96080
0,96856
0,97500
0,98030
0,98461
0,98809
0,99086
0,99305
0,99477
0,99609
0,99711
0,99788
0,99846
0,99889
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398
0,85769
0,87900
0,89796
0,91466
0,92922
0,94179
0,95254
0,96164
0,96926
0,97558
0,98077
0,98500
0,98840
0,99111
0,99324
0,99492
0,99621
0,99720
0,99795
0,99851
0,99893
0,08
0,09
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646
0,85993
0,88100
0,89973
0,91621
0,93056
0,94295
0,95352
0,96246
0,96995
0,97615
0,98124
0,98537
0,98870
0,99134
0,99343
0,99506
0,99632
0,99728
0,99801
0,99856
0,99896
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891
0,86214
0,88298
0,90147
0,91774
0,93189
0,94408
0,95449
0,96327
0,97062
0,97670
0,98169
0,98574
0,98899
0,99158
0,99361
0,99520
0,99643
0,99736
0,99807
0,99861
0,99900
35
Exemplo 1.3.17 Uma ponte foi projectada para suportar uma sobrecarga total de 1530
KN. Estudos estatsticos permitiram concluir que a vari
avel aleat
oria que representa o peso
de autom
oveis ligeiros tem distribuic
ao normal de media 15 KN e desvio padr
ao 1.5 KN.
Se, em determinado momento, est
ao sobre a ponte 100 autom
oveis ligeiros, determinemos a
probabilidade de serem causados danos na sua estrutura, isto e, do peso total dos autom
oveis
exceder a sobrecarga de 1530 KN.
Denotemos por Xi a vari
avel aleat
oria que representa o peso do autom
ovel i, para i =
100
X
Xi representa o peso total dos 100 autom
oveis, ser
ao
1, ..., 100. Como a vari
avel aleat
oria
i=1
100
X
Xi > 1530}. Ora, usando
causados danos na estrutura da ponte se ocorrer o acontecimento {
i=1
ou seja
100
X
i=1
Ent
ao
! 100
X
i=1
"
Xi > 1530
= P
1
15
! 100
X
i=1
1
15
! 100
X
i=1
"
Xi 1500
>
Xi 1500
15301500
15
"
N (0, 1).
"
No que se segue denotamos por z(p) o quantil de probabilidade p da lei N (0, 1). Por outras
palavras, denotamos por z(p) o n
umero real que verifica P (Z z(p)) = p, onde Z N (0, 1).
Devemos observar que a func
ao INV.NORM do EXCEL(1 ) permite determinar o inverso
da funcao de distribuic
ao de uma variavel aleatoria com lei N (m, 2 ), para quaisquer m e 2 .
Concretamente, o valor real x onde a funcao de distribuicao assume o valor p e determinado
por x=INV.NORM(p; m; ).(2 ) Por exemplo, para X N (3, 4) o valor de x onde a funcao de
distribuicao e igual a 0.7 e determinado por x=INV.NORM(0.7;3;2)=4.0488.
Deste modo, o valor de z(p), para qualquer valor de p, pode ser encontrado usando a func
ao
INV.NORM do Excel, pois z(p) e o n
umero real para o qual a funcao de distribuicao da lei
N (0, 1) e igual a p. Concretamente, tem-se z(p) =INV.NORM(p; 0; 1). Por exemplo z0.975 =
INV.NORM(0.975; 0; 1) = 1.959.
Exerccio 1.3.16 A informaca
o obtida em experiencias anteriores diz-nos que a probabilidade de um certo pluvi
ometro fornecer uma leitura errada e de 0.006. Suponha que em
determinado perodo de tempo a partir deste pluvi
ometro podemos obter 48 leituras. Calcule a
probabilidade de se obter, nesse perodo de tempo,
1. exactamente tres leituras erradas;
1
36
37
38
(c) Se se recusar um grupo de 5 sacos caso o seu peso seja inferior a 248 Kg, qual a
probabilidade de este ser recusado?
Exerccio 1.3.29 Um grupo de adolescentes, constitudo por 12 raparigas e 6 rapazes,
entra num elevador com uma carga m
axima de 900 kg. Suponha que os pesos (expressos em
quilogramas, kg) dos adolescentes podem ser representados por vari
aveis aleat
orias reais independentes e gaussianas, de media 50 kg e de desvio padr
ao 5 kg no caso das raparigas, e de
media 60 kg e de desvio padr
ao 10 kg no caso dos rapazes.
1. Mostre que o peso total do referido grupo e uma vari
avel aleat
oria real gaussiana de media
960 kg e de desvio padr
ao 30 kg.
2. Calcule a probabilidade de, nestas condic
oes, ser excedida a carga m
axima do elevador.
Exerccio 1.3.30 Uma empresa comercializa tintas, vernizes, colas e produtos afins. Sabese que as vari
aveis aleat
orias que representam o lucro mensal da venda de tintas, vernizes e
colas possuem leis N (10, 16), N (8, 8) e N (3, 1), respectivamente. Calcule a probabildade de o
lucro mensal em colas e vernizes exceder o de tintas.
IX - Distribui
c
ao do qui-quadrado
Consideremos n vari
aveis aleatorias independentes X1 ,..., Xn , todas com lei N (0, 1).
A variavel aleatoria
n
X
Xi2
Un =
i=1
segue a distribuic
ao ou lei do qui-quadrado com n graus de liberdade, denotada por Xn2 . Nestas
condicoes escrevemos Un Xn2 .
A distribuic
ao Xn2 e contnua e uma variavel aleatoria com distribuicao Xn2 assume apenas
valores positivos. Para esta vari
avel aleatoria tem-se
E(Un ) = n
Var(Un ) = 2n.
10
15
20
O quantil de probabilidade p da lei 2m sera denotado por m (p) e, para alguns valores
particulares de p e de m pode ser consultado na tabela que apresentamos de seguida.
O valor do quantil m (p), para qualquer valor de m e de p, pode ser encontrado usando
a funcao INV.CHI do Excel(3 ). Concretamente, tem-se m (p) = IN V.CHI(1 p; m). Por
exemplo 9 (0, 97) = IN V.CHI(0, 03; 9) = 18.4796.
3
39
m (p)
V 2m
m
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
P (V m (p)) = p
0,999
0,995
0,99
0,98
p
0,975
0,95
0,05
0,025
0,02
0,01
10,82756
13,81551
16,26623
18,46682
20,51500
22,45774
24,32188
26,12448
27,87716
29,58829
31,26413
32,90949
34,52817
36,12327
37,69729
39,25235
40,79022
42,31239
43,82019
45,31474
46,79704
48,26794
49,72823
51,17859
52,61965
54,05196
55,47602
56,89228
58,30117
59,70306
61,09831
62,48722
63,87009
65,24722
66,61883
7,87944
10,59663
12,83815
14,86025
16,74960
18,54758
20,27774
21,95495
23,58935
25,18818
26,75685
28,29951
29,81947
31,31935
32,80132
34,26719
35,71847
37,15645
38,58226
39,99685
41,40106
42,79565
44,18127
45,55851
46,92789
48,28988
49,64491
50,99337
52,33562
53,67196
55,00270
56,32811
57,64844
58,96392
60,27477
6,63489
9,21034
11,34486
13,27670
15,08627
16,81189
18,47531
20,09023
21,66599
23,20925
24,72497
26,21696
27,68824
29,14124
30,57791
31,99992
33,40866
34,80531
36,19087
37,56625
38,93217
40,28936
41,63839
42,97982
44,31410
45,64168
46,96294
48,27823
49,58788
50,89218
52,19139
53,48577
54,77553
56,06090
57,34207
5,41189
7,82404
9,83741
11,66784
13,38822
15,03321
16,62242
18,16823
19,67902
21,16076
22,61794
24,05395
25,47150
26,87276
28,25949
29,63317
30,99505
32,34616
33,68742
35,01963
36,34344
37,65949
38,96831
40,27036
41,56607
42,85583
44,13999
45,41884
46,69269
47,96180
49,22639
50,48670
51,74292
52,99524
54,24383
5,02388
7,37776
9,34840
11,14328
12,83250
14,44937
16,01276
17,53455
19,02276
20,48317
21,92004
23,33666
24,73560
26,11895
27,48839
28,84535
30,19101
31,52638
32,85232
34,16961
35,47887
36,78071
38,07563
39,36407
40,64647
41,92317
43,19451
44,46079
45,72228
46,97924
48,23188
49,48043
50,72508
51,96599
53,20335
3,84146
5,99146
7,81472
9,48773
11,07049
12,59158
14,06714
15,50731
16,91897
18,30703
19,67513
21,02607
22,36203
23,68479
24,99579
26,29622
27,58711
28,86929
30,14352
31,41043
32,67057
33,92444
35,17246
36,41503
37,65249
38,88513
40,11327
41,33713
42,55697
43,77297
44,98534
46,19425
47,39988
48,60236
49,80185
0,00393
0,10258
0,35184
0,71072
1,14548
1,63538
2,16735
2,73264
3,32511
3,94029
4,57481
5,22602
5,89186
6,57063
7,26094
7,96164
8,67176
9,39045
10,11701
10,85081
11,59131
12,33801
13,09051
13,84842
14,61140
15,37915
16,15139
16,92787
17,70836
18,49266
19,28056
20,07191
20,86653
21,66428
22,46502
0,000982
0,05063
0,21579
0,48441
0,83121
1,23734
1,68987
2,17973
2,70038
3,24697
3,81575
4,40379
5,00875
5,62873
6,26214
6,90766
7,56418
8,23075
8,90652
9,59077
10,28289
10,98232
11,68855
12,40115
13,11972
13,84391
14,57338
15,30786
16,04707
16,79077
17,53873
18,29076
19,04666
19,80625
20,56938
0,00062
0,04041
0,18483
0,42939
0,75188
1,13442
1,56429
2,03247
2,53237
3,05905
3,60868
4,17828
4,76545
5,36819
5,98492
6,61424
7,25500
7,90622
8,56703
9,23669
9,91456
10,60003
11,29260
11,99182
12,69727
13,40858
14,12542
14,84748
15,57448
16,30617
17,04232
17,78271
18,52714
19,27543
20,02743
0,00016
0,02010
0,11483
0,29711
0,55429
0,87209
1,23904
1,64649
2,08790
2,55821
3,05348
3,57057
4,10692
4,66043
5,22935
5,81221
6,40776
7,01491
7,63272
8,26039
8,89719
9,54249
10,19571
10,85636
11,52397
12,19814
12,87850
13,56470
14,25645
14,95345
15,65545
16,36221
17,07351
17,78915
18,50893
40
0,999
0,995
0,99
0,98
p
0,975
0,95
0,05
0,025
0,02
0,01
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
55
60
65
70
75
80
85
90
95
100
67,98517
69,34645
70,70289
72,05466
73,40196
74,74494
76,08376
77,41858
78,74952
80,07673
81,40033
82,72042
84,03713
85,35056
86,66082
93,16753
99,60723
105,98814
112,31693
118,59909
124,83922
131,04120
137,20835
143,34354
149,44925
61,58118
62,88334
64,18141
65,47557
66,76596
68,05273
69,33600
70,61590
71,89255
73,16606
74,43654
75,70407
76,96877
78,23071
79,48998
85,74895
91,95170
98,10514
104,21490
110,28558
116,32106
122,32458
128,29894
134,24655
140,16949
58,61921
59,89250
61,16209
62,42812
63,69074
64,95007
66,20624
67,45935
68,70951
69,95683
71,20140
72,44331
73,68264
74,91947
76,15389
82,29212
88,37942
94,42208
100,42518
106,39292
112,32879
118,23575
124,11632
129,97268
135,80672
55,48886
56,73047
57,96880
59,20398
60,43613
61,66538
62,89181
64,11554
65,33667
66,55527
67,77143
68,98524
70,19676
71,40608
72,61325
78,61914
84,57995
90,50124
96,38754
102,24253
108,06934
113,87057
119,64846
125,40493
131,14168
54,43729
55,66797
56,89552
58,12006
59,34171
60,56057
61,77676
62,99036
64,20146
65,41016
66,61653
67,82065
69,02259
70,22241
71,42020
77,38047
83,29768
89,17715
95,02318
100,83934
106,62857
112,39337
118,13589
123,85797
129,56120
50,99846
52,19232
53,38354
54,57223
55,75848
56,94239
58,12404
59,30351
60,48089
61,65623
62,82962
64,00111
65,17077
66,33865
67,50481
73,31149
79,08194
84,82065
90,53123
96,21667
101,87947
107,52174
113,14527
118,75161
124,34211
23,26861
24,07494
24,88390
25,69539
26,50930
27,32555
28,14405
28,96472
29,78748
30,61226
31,43900
32,26762
33,09808
33,93031
34,76425
38,95803
43,18796
47,44958
51,73928
56,05407
60,39148
64,74940
69,12603
73,51984
77,92947
21,33588
22,10563
22,87848
23,65432
24,43304
25,21452
25,99866
26,78537
27,57457
28,36615
29,16005
29,95620
30,75451
31,55492
32,35736
36,39811
40,48175
44,60299
48,75757
52,94194
57,15317
61,38878
65,64662
69,92487
74,22193
20,78295
21,54185
22,30401
23,06929
23,83757
24,60875
25,38271
26,15935
26,93859
27,72034
28,50450
29,29101
30,07979
30,87076
31,66386
35,65921
39,69942
43,77900
47,89345
52,03909
56,21285
60,41211
64,63466
68,87857
73,14218
19,23268
19,96023
20,69144
21,42616
22,16426
22,90561
23,65009
24,39760
25,14803
25,90127
26,65724
27,41585
28,17701
28,94065
29,70668
33,57048
37,48485
41,44361
45,44172
49,47503
53,54008
57,63393
61,75408
65,89836
70,06490
X - Distribui
c
ao de Student
2.
Sejam U e V duas vari
aveis aleatorias independentes tais que U N (0, 1) e V Xm
U
A variavel aleatoria T = p
segue uma lei ou distribuicao de Student com m graus
V /m
de liberdade que se denota por tm . Escreve-se T tm . A lei tm e contnua e simetrica
em relacao `a origem, para qualquer valor de m N. Na figura seguinte apresentamos o
esboco do grafico da densidade de uma distribuicao de Student com 30 graus de liberdade.
O quantil de probabilidade p da lei tm sera denotado por tm (p) e, para alguns valores parti-
-2
-1
41
tm (p)
T tm
m
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
P (T tm (p)) = p
0,75
0,80
0,85
0,90
p
0,95
0,975
0,99
0,995
0,999
1,00000
0,81649
0,76489
0,74069
0,72668
0,71755
0,71114
0,70638
0,70272
0,69981
0,69744
0,69548
0,69382
0,69241
0,69119
0,69013
0,68919
0,68836
0,68762
0,68699
0,68637
0,68580
0,68530
0,68483
0,68443
0,68404
0,68368
0,68335
0,68304
0,68275
1,37638
1,06065
0,97847
0,94096
0,91954
0,90570
0,89602
0,88889
0,88340
0,87905
0,87557
0,87260
0,87015
0,86805
0,86624
0,86466
0,86327
0,86204
0,86095
0,85996
0,85907
0,85826
0,85752
0,85685
0,85623
0,85566
0,85513
0,85464
0,8541
0,85376
1,96261
1,38620
1,24977
1,18956
1,15576
1,13415
1,11915
1,10814
1,09971
1,09305
1,08766
1,08321
1,07946
1,07628
1,07353
1,07113
1,06903
1,06716
1,06550
1,06401
1,06266
1,06144
1,06033
1,05931
1,05838
1,05752
1,05672
1,05598
1,05530
1,05466
3,07768
1,88561
1,63774
1,53320
1,47588
1,43975
1,41492
1,39681
1,38302
1,37218
1,36343
1,35621
1,35017
1,34503
1,34060
1,33675
1,33337
1,33038
1,32772
1,32534
1,32318
1,32123
1,31946
1,31783
1,31634
1,31497
1,31370
1,31255
1,31143
1,31041
6,31374
2,91998
2,35333
2,13184
2,01504
1,94318
1,89457
1,85955
1,83311
1,81246
1,79588
1,78228
1,77093
1,76130
1,75305
1,74588
1,73960
1,73406
1,72913
1,72471
1,72074
1,71714
1,71387
1,71088
1,70814
1,70561
1,70328
1,70113
1,69912
1,69726
12,70615
4,30265
3,18244
2,77645
2,57057
2,44691
2,36464
2,30600
2,26215
2,22813
2,20098
2,17881
2,16036
2,14478
2,13145
2,11990
2,10981
2,10092
2,09302
2,08596
2,07961
2,07387
2,06865
2,06389
2,05953
2,05553
2,05182
2,04840
2,04523
2,04227
31,82096
6,96454
4,54070
3,74693
3,36493
3,14266
2,99796
2,89646
2,82143
2,76377
2,71807
2,68099
2,65030
2,62449
2,60248
2,58349
2,56693
2,55237
2,53948
2,52797
2,51764
2,50832
2,49987
2,49216
2,48510
2,47862
2,47266
2,46714
2,46202
2,45726
63,65589
9,92498
5,84084
4,60408
4,03211
3,70742
3,49948
3,35538
3,24984
3,16926
3,10581
3,05453
3,01228
2,97684
2,94672
2,92078
2,89823
2,87844
2,86094
2,84533
2,83136
2,81876
2,80733
2,79695
2,78743
2,77872
2,77068
2,76326
2,75638
2,74998
318,2888
22,32845
10,21428
7,17293
5,89352
5,20754
4,78525
4,50076
4,29688
4,14365
4,02476
3,92959
3,85203
3,78742
3,73285
3,68614
3,64576
3,61047
3,57933
3,55183
3,52709
3,50497
3,48496
3,46677
3,45018
3,43497
3,42100
3,40820
3,39627
3,38521
42
1.4
0,75
0,80
0,85
0,90
p
0,95
0,975
0,99
0,995
0,999
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
55
60
65
70
75
80
85
90
95
100
0,68248
0,68223
0,68199
0,68177
0,68156
0,68136
0,68117
0,68100
0,68083
0,68067
0,68052
0,68037
0,68023
0,68010
0,67998
0,67986
0,67974
0,67963
0,67953
0,67942
0,67897
0,67860
0,67828
0,67801
0,67777
0,67756
0,67738
0,67722
0,67708
0,67695
0,85336
0,85299
0,85264
0,85232
0,85201
0,85172
0,85144
0,85118
0,85093
0,85067
0,85047
0,85024
0,85006
0,84986
0,84968
0,84950
0,84933
0,84917
0,84907
0,84886
0,84820
0,84765
0,84718
0,84678
0,84644
0,84613
0,84587
0,84563
0,84542
0,84523
1,05406
1,05350
1,05297
1,05248
1,05201
1,05158
1,05116
1,05077
1,05039
1,05004
1,04970
1,04938
1,04908
1,04879
1,04851
1,04824
1,04799
1,04775
1,04751
1,04729
1,04629
1,04546
1,04476
1,04416
1,04364
1,04319
1,04279
1,04244
1,04212
1,04183
1,30946
1,30857
1,30773
1,30695
1,30621
1,30551
1,30485
1,30423
1,30363
1,30307
1,30254
1,30203
1,30155
1,30109
1,30065
1,30022
1,29982
1,29943
1,29906
1,29872
1,29713
1,29582
1,29471
1,29376
1,29294
1,29225
1,29159
1,29102
1,29052
1,29007
1,69551
1,69388
1,69236
1,69092
1,68957
1,68829
1,68709
1,68595
1,68487
1,68385
1,68287
1,68195
1,68107
1,68023
1,67942
1,67865
1,67792
1,67722
1,67655
1,67590
1,67303
1,67064
1,66863
1,66691
1,66542
1,66412
1,66297
1,66196
1,66105
1,66023
2,03951
2,03693
2,03451
2,03224
2,03011
2,02809
2,02619
2,02439
2,02268
2,02107
2,01957
2,01808
2,01669
2,01536
2,01410
2,01289
2,01173
2,01063
2,00957
2,00855
2,00404
2,00029
1,99713
1,99443
1,99210
1,99006
1,98826
1,98667
1,98524
1,98397
2,45282
2,44867
2,44479
2,44114
2,43771
2,43449
2,43144
2,42856
2,42584
2,42325
2,42080
2,41847
2,41625
2,41413
2,41211
2,41018
2,40834
2,40657
2,40488
2,40323
2,39608
2,39011
2,38509
2,38080
2,37710
2,37387
2,37101
2,36849
2,36624
2,36421
2,74403
2,73848
2,73328
2,72839
2,72380
2,71948
2,71540
2,71156
2,70791
2,70445
2,70118
2,69807
2,69510
2,69228
2,68959
2,68701
2,68455
2,68220
2,67995
2,67778
2,66822
2,66027
2,65361
2,64790
2,64299
2,63869
2,63491
2,63158
2,62858
2,62589
3,37488
3,36527
3,35632
3,34795
3,34002
3,33260
3,32562
3,31900
3,31274
3,30692
3,30124
3,29593
3,29091
3,28611
3,28145
3,27709
3,27287
3,26894
3,26508
3,26137
3,24514
3,23168
3,22041
3,21080
3,20243
3,19523
3,18890
3,18323
3,17828
3,17377
Considere a vari
avel aleatoria que representa o intervalo de tempo entre duas excedencias de
um caudal elevado q (previamente fixado) de uma seccao de determinado curso de agua. A
distribuicao desta vari
avel aleatoria pode ser conhecida ou nao. Suponha agora que, para um
grupo de 50 excedencias consecutivas, estamos interessados em conhecer a probabilidade de
que o tempo total que decorre entre a primeira e a quinquagesima seja superior a determinado
valor t0 (valor de referencia para o problema em estudo). Para abordar este problema ha que
considerar as vari
aveis aleatorias X1 , X2 , , X49 sendo Xi a variavel aleatoria que representa
a amplitude de tempo que decorre entre a i-esima excedencia P
de q e a i+1-esima, para i
{1, 2, , 49}. Uma vez que o referido tempo total e definido por 49
i=1 Xi pretendemos calcular
P
49
X
i=1
X i > t0
"
43
i=1
Pn
Xi nm
i=1
N (0, 1) ou,
Observa
c
ao 1.4.1 Nas condic
oes do teorema escrevemos
n
Pn
44
,
>
P
Xi > 1500 = P
1.5 n
1.5 n
i=1
usando a aproximac
ao decorrente do
Teorema Limite Central, vamos determinar o maior valor
150015n
de n que verifica P Z > 1.5n
0, 01, onde Z N (0, 1). Consultando a tabela da lei
! 225
X
Xi > 2350
i=1
P Z>
100
2250
"
=P
!P
225
i=1Xi
2250
2350 2250
>
2250
2250
"
45
N1 , N2 , ..., N950 s
ao independentes e identicamente distribudas, pelo Teorema Limite Central,
podemos concluir que
950
X
Ni 950 9.5
i=1
! 950
X
i=1
950
X
i=1
N (0, 1),
950 9.5
Ni > 8900
"
= P
1
95
! 950
X
i=1
Ni 9025
"
>
89009025
95
"
46
0.164. Ent
ao, pelo Teorema Limite Central, podemos afirmar que
320
X
i=1
Yi 320 0.164
N (0, 1),
320
X
Yi 320 0.164
i=1
P (Y 85) = P
3200.1640.836
853200.164
3200.1640.836
Exerccio 1.4.1 Os registos dos jogos do campeonato europeu de futebol, desde 1984,
permitiram concluir que a vari
avel aleat
oria que representa o n
umero de golos por jogo (em
tempo regulamentar) tem media 1.8 e desvio padr
ao 1.1. Admitindo a independencia entre o
n
umero de golos em jogos diferentes, determine a probabilidade de se marcarem pelo menos 50
golos em 31 jogos do Euro 2012.
Exerccio 1.4.2 Uma refinaria de petr
oleo possui, num dos parques de abastecimento, um
equipamento recentemente renovado que lhe permite encher, por mes, uma media de 280 tanques
com um desvio padr
ao de 18 tanques. Admitindo a independ
encia entre os abastecimentos
mensais, calcule uma aproximac
ao para a probabilidade de, em tres anos, este equipamento
encher menos de 10400 tanques.
Exerccio 1.4.3 Uma empresa distribuiu, para uso profissional, um telem
ovel a cada um
dos seus 36 funcion
arios. A despesa mensal, em euros, da empresa com cada um desses telem
oveis e representada por uma vari
avel aleat
oria de media 53 euros e desvio padr
ao 15 euros.
Admitindo a independencia das despesas dos diferentes telem
oveis, determine uma aproximaca
o
para a probabilidade de a despesa mensal da empresa com os 36 telem
oveis ser superior a 2000
euros.
Exerccio 1.4.4 Num determinado troco de estrada bastante perigoso ocorrem frequentemente acidentes por excesso de velocidade. O n
umero de feridos graves num acidente devido a
excesso de velocidade no referido troco de estrada, e uma v.a. X com lei de Poisson de media
0.2.
47
48
Captulo 2
Estatstica Descritiva
Se temos tudo sob controlo,
significa que n
ao estamos a caminhar suficientemente r
apido.
2.1
Introduc
ao
50
2.2
Vari
aveis estatsticas discretas
Dada uma amostra de dimensao n extrada de uma populacao representemos por x1 , x2 , ..., xn
os valores correspondentes assumidos pela variavel estatstica X em estudo.
Observa
c
ao 2.2.1 No contexto em que estes textos se inserem passaremos a chamar
amostra observada (ou apenas amostra) ao vector (x1 , x2 , ..., xn ).
Atendendo a que uma vari
avel estatstica X tem associada uma variavel aleatoria X,
uma amostra observada (x1 , x2 , ..., xn ) nao e mais que um valor observado de um vector
(X1 , X2 , ..., Xn ), constitudo por vari
aveis independentes e todas com a lei de X, a que chamaremos adiante amostra aleatoria de X.
Suponhamos que x1 , x2 , ..., xk s
ao os k elementos distintos da amostra observada inicial
(x1 , x2 , ..., xn ), com k n, tendo-se
x1 < x2 < < xk .
51
ni
n
k
X
i=1
k
X
ni = n, e
fi = 1.
i=1
F : IR X
[0, 1]
fi
x
F (xj )
xi x
A
= f1 + f2 + + fj , que tambem denotamos por Fj , chamamos frequencia relativa
acumulada de xj .
Passamos a apresentar o esboco do grafico da funcao cumulativa.
..
F
...........................................
1 ....
..
......................
..
..
..
......................
..
..
..
......................
..
...................................0....................................................................................................................................................................................................
xk1 xk
x1 x2 x3
i=1
52
local. Doutro modo, o valor xi e uma moda da amostra se fi fi1 e fi fi+1 , onde
se considera f0 = 0 e fk+1 = 0. As variaveis estatsticas podem ser unimodais, bimodais,
trimodais, etc. Sempre que apresentem mais que duas modas sao designadas multimodais.
A outra medida de localizac
ao que, `a semelhanca da media, e uma medida de tendencia
central e a mediana. A mediana de uma variavel estatstica (ou da amostra) e o valor real (nao
necessariamente um dos elementos da amostra) que divide a amostra em duas partes iguais.
Concretamente, a mediana e um valor real que denotamos por med e que verifica
lim
xmed
F (x)
1
e
2
lim
xmed+
F (x) F (med)
1
.
2
Retomemos a amostra inicial e denotemos por xi:n o i-esimo elemento da amostra ordenada,
tendo-se assim
x1:n xi:n xn:n
No caso em que a dimensao da amostra e par, qualquer elemento do intervalo [x n2 :n , x n2 +1:n ]
verifica as desigualdades anteriores que definem a mediana. Assim sendo, neste caso, considerase que a mediana da amostra e o ponto medio entre os dois extremos deste intervalo. Em resumo
n
x :n + x n2 +1:n
se n par
2
2
.
med =
x n+1
se n mpar
2
:n
Notemos que a simetria estrita e uma caracterstica rara de obter numa amostra, podendo
acontecer, contudo, que a moda, a media e a mediana apresentem valores muito proximos.
A media de uma amostra, apesar de ser quase sempre o primeiro valor a determinar, e muito
sensvel `a presenca de valores muito elevados ou de valores muito reduzidos em relacao aos
valores tpicos dessa amostra. Por exemplo, a amostra
(1, 2, 2, 2, 3, 3, 4, 4, 4, 5, 6, 18)
tem media igual a 4.5 enquanto a media dos valores 1, 2, 2, 2, 3, 3, 4, 4, 4, 5, 6 e exactamente
3.2727(27). Esta falta de robustez da media amostral e de certa forma contornada com o
calculo da mediana que e, de acordo com a sua definicao, um parametro amostral de tendencia
central bastante robusto `a existencia de valores muito distintos dos restantes.
Outras medidas de localizac
ao da amostra que nos interessa estudar sao os quantis de ordem
p da amostra, com p ]0, 1[. Perante uma amostra, damos o nome de quantil de ordem p,
53
com p ]0, 1[, ao valor real, nao necessariamente pertencente `a amostra, que denotamos por
q(p) e que verifica
lim
xq(p)
F (x) p
lim
xq(p)+
F (x) = F (q(p)) p.
q1 =
x n4 :n
x[ n4 +1]:n
se n/4 inteiro
q3 =
se nao
:n
x 3n
4
x 3n
[ +1]:n
4
se 3n/4 inteiro
.
se nao
` semelhanca do que foi exposto para as variaveis aleatorias, iremos apresentar algumas
A
medidas de dispersao dos dados que constituem a amostra. Na verdade, a moda, a media e a
mediana, quando observadas isoladamente, nao nos permitem tirar conclusoes precisas acerca
da concentrac
ao dos valores que constituem a amostra. Todavia, a posicao dos tres quartis
em relacao ao maximo e ao mnimo amostrais e a amplitude entre o primeiro e o terceiro
quartis, onde se concentram 50% dos dados, fornecem-nos indicacao bastante completa sobre
a dispersao dos valores amostrais.
As medidas de dispersao que consideramos sao a amplitude amostral An = xn:n x1:n ,
a amplitude interquartis q3 q1 e a variancia e o desvio padrao amostrais que definiremos
adiante.
O diagrama de extremos e quartis (ou caixa com bigodes) e um grafico com o qual se
pretende ilustrar a variabilidade dos elementos da amostra em torno da mediana. Este diagrama
e naturalmente utilizado para evidenciar tendencias assimetricas na distribuicao dos dados. Por
exemplo, se a mediana, o terceiro quartil e o maximo estao relativamente proximos, quando
54
comparados com as amplitudes entre a mediana e o primeiro quartil e entre este e o mnimo
amostral, teremos uma amostra que evidencia assimetria negativa.
Na figura seguinte apresentamos um esboco de um grafico de extremos e quartis.
..........................................................................
max
..
..
q3
.................................... ......................................
..........................................................................
med
..
..
..
..
.
..
..........................................................................
q1
..
..
..
..
.........................................................................
min
Uma outra forma de estudar a variabilidade dos elementos amostrais consiste em avaliar a
dispersao com que estes se situam em relacao `a media da amostra. Este proposito consegue-se
considerando inicialmente o quadrado dos desvios entre a media e cada um dos valores da
amostra e calculando posteriormente a media de tais quadrados. A variancia da amostra e
uma versao modificada de tal media de quadrados que se define por
n
n
1 X 2
1 X
(xi x)2 =
xi
(x)2 .
n1
n1
n1
i=1
i=1
p
Chamamos desvio padrao da amostra a sn = s2n .
Em algumas aplicac
oes poderemos usar as seguintes aproximacoes para o desvio padrao:
s2n =
sn
2.3
xn:n x1:n
4
sn
q3 q1
1.349
Vari
aveis estatsticas contnuas
55
representa mais uma vez a dimensao da amostra. A frequencia relativa simples da classe Ai e
i
X
fj .
definida por fi = nni e a frequencia relativa acumulada por Fi =
j=1
Depois de conhecermos os valores das frequencias de cada uma das classes, ha que obter representacoes graficas que nos permitam inferir sobre a distribuicao de probabilidade da vari
avel
aleatoria subjacente aos dados de que dispomos. As representacoes graficas a que nos referimos
sao usualmente designadas em Estatstica histograma e polgono de frequencias.
Para construir um histograma respeitante a uma determinada amostra de dimensao n,
comecamos por dividir os elementos desta amostra em classes (intervalos reais) disjuntas e
que constituam uma partic
ao do intervalo inicial onde se situa a amostra. Este procedimento
permite gerar uma vari
avel estatstica contnua.
No presente curso consideramos apenas classes de igual amplitude dada por
hn
3.5 sn
.
n1/3
Esta restric
ao conduz quase sempre a um n
umero de classes cuja uniao tem uma amplitude
superior `a amplitude total da amostra, o que significa que o extremo inferior da primeira classe
pode nao ser o mnimo amostral, assim como o extremo superior da u
ltima classe pode ser ou
nao o maximo amostral. Representemos tais classes por
A1 := [a0 , a1 ], A2 :=]a1 , a2 ], , Ak :=]ak1 , ak ].
Seguidamente marcamos os valores a0 , a1 , a2 , ak1 , ak no eixo das abcissas de um sistema
de eixos coordenados e marcamos os valores hfni (ou apenas fi ) no eixo das ordenadas, para
i = 1, 2, , k. O histograma consiste no conjunto dos k rectangulos justapostos de base hn e
alturas hfn1 , , hfkn .
O polgono de frequencias e uma linha poligonal que se constroi unindo os pontos de coordenadas ( ai +a2 i1 , hfni ), para i = 1, , k. Podemos acrescentar o segmento que une os pontos
(a0 h2n , 0) e (a0 + h2n , f1 ) e o segmento que une os pontos (ak h2n , fk ) e (ak + h2n , 0).
Apresentamos de seguida um exemplo de um histograma associado ao respectivo polgono
de frequencias.
9.
...............................
40..
.................................... ..... ....
..
.
..
....
7.
...............................
....
..
40..
.
... ...
.
.
.
..
..
..
....
..........................
.
.
.
..
.
.
.
..
... ..................
..
.. ..
.
4.
.
........ ................
..
.
..
..
...........................
40..
..
..
.... ..........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..
..
......
.
.
.
2 ..........................
...
..
..
..
... ....
...
...
40.........
.
.
.
.
.............................
..
..
..
..
..
..
.....
.
.
.
.
.
.
.
...........................................................................................................................................................................................................................................................
0
1
2
3
4
5
6
7
8
De acordo com a definic
ao que apresentamos de funcao densidade de probabilidade e atendendo `a definic
ao de integral definido, podemos concluir que, quando a a dimensao da amostra
tende para a dimensao da populac
aoe, concomitantemente, a amplitude de cada classe tende
para zero, o polgono de frequencias da lugarao grafico de uma densidade. Por outras palavras, podemos afirmar que quando a dimensao da amostra e suficientemente grande o polgono
56
57
Face a um conjunto de dados a partir do qual foi possvel construir o histograma acima
podemos comecar por admitir que a funcao densidade da variavel aleatoria em estudo e da
forma:
1
t
se t [0, 1]
f (t) =
,
0
se t 6 [0, 1]
onde e um parametro real superior a 1, desconhecido.
A func
ao cumulativa associada a uma variavel estatstica contnua e uma funcao real de
variavel real F : IR [0, 1] com expressao analtica:
F (x) =
f1 axa
1 a0
xa1
F1 + f2 a2 a1
...
xa
Fk1 + fk ak ak1
k1
se x < a0
se a0 x < a1
se a1 x < a2
...
se ak1 x < ak
se x ak
...
F
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.............................................
.
.
.
.
.
.
.
.
.
.
.
.
.
1 ....
.
.
.
.
.
.
.
..........
.
.
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7/8 ......
.......
...
.....
.
.
.
...
..
.....
.
.
.
.
.
.
.
.
.
.
5/8 .
.....
..
......
.
.
.
.
.
.
7/16 ......
............
.......
................
.
.
.
3/8 . .....
.. ....
.. ......
..
.
.
.
1/8
.
.
.
..... ...
.
.
.
.
.
........................................................................................................................................................................................................................................................................
1
0
1
2
3
4
5
6
O papelque a func
ao cumulativa desempenha perante os dados, em relacao `a funcao de
distribuicao da vari
avel aleatoria subjacente, e exactamente o mesmo papelque desempenha
o polgono de frequencias relativamente `a funcao densidade.
Nas circunstancias em que estamos na presenca de uma variavel estatstica contnua, definimos quantil de ordem p, para p ]0, 1[, `a custa da funcao cumulativa, como alias fizemos no
caso em que a vari
avel era discreta. Concretamente, o quantil de ordem p e o n
umero real q(p)
58
que verifica
F (q(p)) = p, p ]0, 1[.
Relativamente `a questao da presenca de assimetrias sao validas as desigualdades que as
tambem valida a
definem no caso em que dispomos de uma variavel estatstica discreta. E
interpretacao que fazemos do grafico de extremos e quartis.
Na situac
ao particular em que dispomos de uma variavel contnua, tendo sido ja perdidaa
amostra inicial (so dispomos das classes e das respectivas frequencias), para determinar aproximacoes para a media e para a variancia, entre outros parametros, usamos a variavel das
marcas que denotamos por X . Esta variavel estatstica e discreta e assume exactamente os
valores correspondentes aos pontos medios das classes. Seguidamente consideram-se as aproximacoes
x x e sn sn
Para finalizar este captulo, observamos que no caso do histograma dar alguma evidencia `a
normalidade da distribuic
ao da vari
avel aleatoria em estudo, podemos afirmar que:
Exerccio 2.3.1 Fez-se um estudo acerca da idade em que e diagnosticada uma certa
doenca, obtendo-se os seguintes registos: 18, 18, 25, 19, 23, 20, 42, 18, 21, 18, 18, 20, 18, 18,
20, 18, 19, 28, 17, 18. Calcule a media, o desvio padr
ao e os quartis da amostra. Construa o
diagrama de extremos e quartis. Nota-se alguma concentraca
o especial dos valores?
Exerccio 2.3.2 As notas de 50 alunos num exame foram
8.6
10.6
11.4
11.6
12.2
12.1
12.6
13.0
13.2
13.4
13.6
13.8
13.8
14.0
14.2
14.4
14.6
14.8
15.2
15.4
15.8
16.1
16.4
17.4
18.2
10.2
11.0
11.6
11.8
12.2
12.4
12.8
13.0
13.2
13.6
13.8
13.8
14.0
14.0
14.2
14.6
14.8
15.0
15.2
15.6
15.8
16.4
17.0
17.8
19.2
59
-17,53
-4,73
1,13
3,87
7,68
13,54
-12,07
-3,92
1,14
3,97
8,32
13,68
-9,72
-3,85
1,15
4,13
9,26
14,24
-8,46
-3,02
1,17
4,24
10,26
14,33
-7,00
-2,06
1,48
4,54
10,62
16,19
-6,74
-1,98
1,60
4,59
11,15
16,27
-6,44
-,37
2,07
5,14
11,44
16,85
-6,25
-,05
2,32
6,77
12,72
17,65
-6,03
-,03
3,00
7,60
13,12
19,85
-4,83
,94
3,70
7,66
13,52
25,1
0,03
0,33
0,81
1,09
2,19
3,34
0,05
0,34
0,84
1,19
2,20
3,44
0,07
0,35
0,87
1,26
2,21
3,82
0,08
0,35
0,90
1,29
2,27
3,96
0,21
0,43
0,92
1,54
2,30
4,39
0,23
0,47
0,96
1,65
2,32
4,45
0,26
0,49
0,98
1,76
2,38
4,88
0,26
0,49
0,99
1,84
2,43
5,63
0,29
0,52
1,05
1,84
2,50
6,01
4,04
4,23
4,47
4,78
5,78
6,36
4,10
4,24
4,48
5,11
5,79
6,41
4,10
4,26
4,59
5,14
5,88
6,44
4,12
4,28
4,59
5,30
5,92
6,55
4,12
4,34
4,60
5,41
6,06
6,70
4,14
4,35
4,68
5,45
6,10
6,80
4,16
4,38
4,72
5,46
6,17
8,36
4,19
4,38
4,73
5,49
6,24
9,44
4,21
4,41
4,75
5,58
6,30
9,73
0,13
0,38
0,79
1,29
1,84
2,22
0,16
0,42
0,85
1,34
1,87
2,30
0,16
0,42
0,87
1,49
1,99
2,32
0,18
0,46
0,95
1,52
2,03
2,60
0,20
0,47
0,98
1,57
2,08
2,76
0,29
0,56
1,02
1,58
2,10
2,78
0,30
0,62
1,04
1,61
2,11
2,81
0,30
0,66
1,04
1,68
2,15
2,86
0,31
0,68
1,05
1,73
2,17
2,95
60
-1,98
-1,25
-0,50
0,07
0,70
1,46
-1,96
-1,23
-0,41
0,08
0,82
1,49
-1,94
-1,14
-0,33
0,12
0,92
1,71
-1,89
-1,12
-0,30
0,14
1,01
1,72
-1,86
-1,06
-0,25
0,16
1,07
1,74
-1,78
-1,02
-0,23
0,23
1,11
1,76
-1,61
-00,98
-0,21
0,29
1,26
1,79
-1,45
-0,96
-0,13
0,41
1,30
1,80
-1,42
-0,93
-0,09
0,51
1,31
1,89
0
2
4
1
3
4
1
3
4
1
3
4
1
3
4
1
3
4
2
3
4
2
3
5
2
3
5
2
3
5
2
3
5
2
3
6
2
3
6
2
3
6
2
3
6
2
3
6
2
4
8
2
4
8
2
4
8
20 40 60 80 100
Captulo 3
Estatstica Inferencial
Ninguem melhor se engana quando consente que o enganem os outros...
Jose Saramago
3.1
Introduc
ao
No estudo de um fenomeno ao qual esta associada uma variavel aleatoria temos por objectivo
legtimo conhecer a distribuic
ao dessa mesma variavel. Por exemplo, para a variavel aleatoria X
que representa a amplitude de tempo que decorre entre duas falhas consecutivas de determinado
tipo de bombas instaladas em estac
oes de aguas residuais, estamos interessados em aproximar
a probabilidade de X assumir valores que nao excedam um valor de referencia t0 , isto e,
P (X t0 ). No mesmo contexto, podemos estar interessados em estudar a probabilidade
de que o n
umero de falhas do mesmo tipo de bombas, registados num ano, seja superior a
2. Concretamente, considerando a variavel aleatoria Y que representa tal n
umero de falhas,
pretendemos uma aproximac
ao para P (Y > 2). Ha assim que conhecer a forma da distribuic
ao
de tais vari
aveis aleatorias, aproximar os seus parametros desconhecidos, avaliar a precisao de
tais aproximac
oes, validar a distribuicao que se comecou por ajustar e, por fim, aproximar tais
probabilidades. Esta e uma entre as m
ultiplas abordagens que se podem fazer a um problema
concreto de Engenharia, usando a Estatstica Inferencial.
Suponhamos agora que estudamos o caudal maximo anual de uma seccao de determinado
curso de agua e que estamos interessados em aproximar o n
umero medio de anos hidrologicos
que decorrem entre duas excedencias de um valor elevado u, previamente fixado. Neste caso,
pretendemos aproximar a media de uma variavel aleatoria com distribuicao geometrica, ficando no ambito da Estatstica Inferencial todas as questoes relacionadas com a obtencao de
aproximac
oes para o parametro p de tal distribuicao. Por outro lado, um assunto com igual
relevancia em estudos hidrologicos diz respeito `a determinacao do valor u que tem probabilidade, por exemplo 0.05, de ser excedido pelo caudal de uma seccao de determinado curso
de agua. Denotando por Q a vari
avel aleatoria que representa o referido caudal, pretendemos
determinar, pelo menos de forma aproximada, o quantil de probabilidade 0.95 da distribuic
ao
de Q. Por outras palavras, e nosso objectivo obter um valor de caudal elevado u que tem uma
probabilidade de ser excedida aproximadamente igual a 0.05.
61
62
Dada a forma como se entrelacam a Teoria das Probabilidades e a Estatstica Inferencial (Estatstica Indutiva ou Inferencia Estatstica) nao e facil estabelecer uma fronteira entre
estas duas disciplinas. Na verdade, ainda que a Teoria das Probabilidades possa existir e
evoluir de forma independente, a Estatstica Inferencial gera-se e desenvolve-se sempre acompanhada por conceitos de natureza probabilstica. Nos exemplos concretos de fenomenos aos
quais estao associadas uma ou mais variaveis aleatorias reais, podemos afirmar, grosso modo,
que os propositos da Teoria das Probabilidades e da Estatstica Inferencial sao de certo modo
inversos. No ambito da Teoria das Probabilidades, partindo de modelos matematicos envolvendo variaveis aleatorias e as suas distribuicoes, determinamos parametros, probabilidades,
distribuicoes relacionadas com estas, etc. Do ponto de vista da Estatstica Inferencial faz-se
um estudo percorrendo uma trajectoria que se inicia a partir da Estatstica Descritiva e que
se encerra com o conhecimento da distribuicao de uma ou varias variaveis aleatorias ou com
a construcao de modelos matematicos, envolvendo varias variaveis aleatorias, que se ajustem
convenientemente aos dados observados.
Assim, a Estatstica Inferencial tem por objectivo a construcao de metodologias que permitam estabelecer modelos envolvendo variaveis aleatorias que descrevam, com o maior rigor
possvel, fenomenos aleatorios observaveis, partindo de observacoes recolhidas por amostragem.
No contexto em que se insere este curso a trajectoria de estudo a que nos referimos acima
comeca com o tratamento de dados (que constituem a amostra da variavel aleatoria em estudo)
do ponto de vista restrito da Estatstica Descritiva, ao que se segue o enquadramento da distribuicao da vari
avel aleatoria subjacente numa famlia de distribuicoes (normal, exponencial,
Poisson, etc). Devemos observar que este enquadramento e, numa primeira analise, efectuado
de forma meramente visual, comparando, por exemplo para variaveis aleatorias contnuas, a
forma generica do histograma (ou do polgono de frequencias associado) com a forma generica
da densidade de cada famlia de leis. No entanto, esta comparacao pouco decisiva, pode nao ser
simples, tendo que contar muitas vezes com o conhecimento que o Estatstico tem do fenomeno.
Seguidamente, sera nosso objectivo especificar a distribuicao da variavel aleatoria em estudo,
estimando os seus parametros desconhecidos com metodos de estimacao pontual e intervalar,
ao que se seguira a validac
ao da referida distribuicao. Tal validacao e levada a cabo usando
os chamados testes de ajustamento ou de adequacao de uma lei. A questao de, por exemplo,
decidir se, face a uma determinada amostra observada, um determinado valor concreto para
um parametro e aceitavel, coloca-nos perante a construcao de um teste estatstico parametrico.
Numa segunda parte deste captulo estudamos modelos de regressao linear simples que nao
sao mais do que modelos matematicos com os quais se pretende descrever uma relacao linear
existente entre uma vari
avel aleatoria, que se supoe normal, e uma variavel nao aleatoria sujeita
`a influencia de uma perturbac
ao aleatoria.
Uma amostra observada de dimensao n que e constituda por valores assumidos por uma
variavel aleatoria X pode ser entendida como um valor assumido por um vector de variaveis
aleatorias, todas com a distribuic
ao de X. Surge assim o conceito de amostra aleatoria da
variavel X como vector de vari
aveis aleatorias independentes e todas com a distribuicao de
X. Alguns dos valores numericos associados a uma amostra observada, como a media e a
variancia, possuem caractersticas, respeitantes quase sempre `a sua legitimidade para aproximar
os correspondentes parametros da vari
avel aleatoria subjacente `a amostra, que nao sao mais do
63
3.2 - Distribuic
oes amostrais
que consequencias das propriedades da amostra aleatoria. Algumas dessas propriedades serao
apresentadas numa secc
ao inicial sobre distribuicoes amostrais.
3.2
Distribuic
oes amostrais
1X
Xi
n
Xn =
i=1
e chamamos vari
ancia amostral `a variavel aleatoria
Sn2 =
i=1
i=1
1 X 2
1 X
n
2
X n.
(Xi X n )2 =
Xi
n1
n1
n1
Observa
c
ao 3.2.1 A media amostral tambem se denota por X e a vari
ancia amostral
2
por S .
Proposi
c
ao 3.2.1 Seja X uma vari
avel aleat
oria que admite vari
ancia e (X1 , X2 , ..., Xn )
uma amostra aleat
oria de X. Tem-se E(X n ) = E(X), V ar(X n ) = V ar(X)/n e E(S 2 ) =
V ar(X).
Prova. Com efeito,
E(X) = E(
i=1
i=1
1X
1X
Xi ) =
E(Xi )
n
n
E(X) =
1X
E(X) = E(X).
n
i=1
Por outro lado, atendendo a que a soma de variaveis aleatorias independentes tem variancia
igual `a soma das vari
ancias das variaveis envolvidas nessa soma, temos
n
i=1
i=1
i=1
X
1X
1
n
1X
V ar(X) = V ar(
Xi ) = 2 V ar(
V ar(Xi ) = 2 V ar(X).
Xi ) = 2
n
n
n
n
Para provar que E(S 2 ) = V ar(X) notemos que
n
i=1
i=1
n
1 X 2
1 X
2
(Xi X)2 =
Xi
X
S =
n1
n1
n1
2
64
E(S 2 )
1
n1
n
X
i=1
E(Xi2 )
n
2
E(X )
n1
2)
ar(X) + (E(X))
n
n1 (V
ar(X) + (E(X))2 )
n
n1 (V
n
n1 (V
ar(X) + (E(X))2 )
V ar(X)
n
n1 (
n
n
n1 V
1
n1 V
ar(X)
+ (E(X))2 )
ar(X) = V ar(X).
O resultado que apresentamos de seguida da legitimidade `a media da amostra como aproximacao da media ou esperanca matematica da variavel aleatoria que descreve os resultados de
um fenomeno que se pretende estudar. Devemos notar que, como se espera, tal aproximacao
melhora com o aumento da dimensao da amostra.
Proposi
c
ao 3.2.2 (Lei dos grandes n
umeros) Sejam X1 , X2 , , Xn , vari
aveis aleat
orias
independentes e todas com a mesma distribuic
ao de esperanca matem
atica m. Ent
ao, para todo
o > 0, tem-se
P (|X n m| ) 1, n +.
A normalidade assint
otica da vari
avel aleatoria media amostral decorre imediatamente como
corolario do Teorema Limite Central.
Proposi
c
ao 3.2.3 (Corol
ario do Teorema Limite Central) Sejam X1 , X2 , ..., Xn vari
aveis
aleat
orias independentes e todas com a mesma distribuic
ao. Se E(X1 ) = m e V ar(X1 ) = 2 ,
ent
ao
Xn m
x = P (Z x), x IR,
lim P
n+
/ n
onde Z N (0, 1).
Observac
ao: Nas condic
oes da proposicao 3.2.3 usamos a notacao X N (m, n ) ou equi
N (0, 1).
valentemente Xm
/ n
No caso particular em que X tem distribuicao normal a estabilidade da lei normal permite2
nos concluir que X N (m, n ). Alem disso, a normalidade da distribuicao de X permite-nos
estabelecer a distribuic
ao exacta de S 2 . Estes resultados encontram-se na proposicao que
apresentamos de seguida.
Proposi
c
ao 3.2.4 Se X N (m, 2 ) e (X1 , X2 , ..., Xn ) e uma amostra aleat
oria de X,
ent
ao
ao independentes;
1. X e S 2 s
2
2. X N (m, n );
3.
n1 2
S
2
2n1 .
65
3.3 - Estimac
ao parametrica pontual
se X N (m, 2 ), ent
ao X N (m, n );
se X nao tem lei normal (ou no caso em que tal distribuicao e desconhecida) usamos
2
3.3
Estimac
ao param
etrica pontual
assintoticamente centrico.
2
0
2
2
3
3
0
2
3
0
3
1
1
2
3
1
2
7
3
2
1
1
2
1
0
2
4
2
0
1
3
1
4
0
1
3
1
4
2
0
1
2
1
2
3
4
3
as estimativas para a media e para a variancia da variavel aleatoria subjacente a estes dados
sao x = 1.9 e s2 = 1.8877.
66
Neste curso apresentamos apenas um metodo para obtencao de estimadores. O metodo dos
momentos que passamos a expor.
Suponhamos que a func
ao de distribuicao da variavel aleatoria X depende do parametro
k
= (1 , 2 , , k ) IR e seja (X1 , , Xn ) uma amostra aleatoria de X. Suponhamos que
existe o momento simples de ordem k de X (o que implica a existencia de todos os momentos
de ordem inferior a k), ou seja E(X k ), e consideremos o momento emprico de ordem k de X
n
1X k
Xi .
definido por
n
i=1
Defini
c
ao 3.3.2 Se existir uma func
ao g com valores em IRk , para a qual se tem
= g(E(X), E(X 2 ), , E(X k )),
ent
ao o estimador de obtido pelo metodo dos momentos, que representamos por n , e definido
por
n
n
1X k
1X 2
n = g(X n ,
Xi , ,
Xi ).
n
n
i=1
i=1
E(X) = b + a1
V ar(X) =
1
a2
1
a
E(X) = b + a1
1
2
2
E(X ) (E(X)) = a2
a=
2
2
E(X )(E(X))
v
r
u n
u X 2
1
1
n 1 2
2
t1
v
r
,
X
, Xn
(
an , bn ) =
Xi X
Sn
=
u n
n
n
n
1
u 1 X
i=1
2
2
S
2
t
Xi X
n
n
i=1
Observa
c
ao 3.3.1 1. Usaremos, indistintamente, as designac
oes estimador de (a,b)e
estimadores de a e de b.
n1 2
2. Para grandes valores de n podemos substituir S 2 por
S .
n
67
3.3 - Estimac
ao parametrica pontual
Exemplo 3.3.4 Seja X uma vari
avel aleat
oria que possui uma lei N m, 2 . Atendendo
a que E(X) = m e V ar(X) = E(X 2 ) (E(X))2 , conclumos que os estimadores de m e 2 , gen
1X 2
n1 2
2
2
rados pelo metodo dos momentos, s
ao m
n = Xn e
Xi X =
n =
Sn . Verificamos
n
n
i=1
b = E(X) +
3(E(X 2 ) (E(X))2 )
pois b a > 0. Assim, o estimador de (a, b), gerado pelo metodo dos momentos, e definido por
q
2
n = X n 3 n1
a
n S
.
q
n1 2
b
3
S
n = Xn +
n
da qual resulta
v
u n
u3 X 2
b
n = t
Xi ,
n
i=1
pois > 0.
68
69
Seja T a vari
avel aleat
oria que representa o tempo necess
ario `
a confecc
ao de cada uma das
remessas.
1. Justifique por que motivo se pode ajustar a T uma distribuic
ao com func
ao densidade:
1
t
se t [0, 1]
f (t) =
,
0
se t 6 [0, 1]
onde e um par
ametro real superior a 1, desconhecido. Esboce o gr
afico de f .
2. Mostre que E(T ) =
+1 .
100
X
ti = 77.55.
i=1
onde e um par
ametro real desconhecido. Determine um estimador centrico de .
( + 1)(x 51 ) se x [ 15 , 65 ]
f (x) =
,
0
se x
/ [ 51 , 65 ]
+1
+2
70
3.4
3.4.1
Testes de ajustamento
Generalidades sobre testes
Retomemos o contexto do exemplo 1.4.1 e denotemos por X a variavel aleatoria que representa
o peso de determinado tipo de automoveis. Na presenca de um histograma associado a uma
amostra desta vari
avel aleatoria que de alguma evidencia `a normalidade de X podemos colocar
varias questoes. Por exemplo, podemos considerar que a distribuicao de X e de facto normal?
Para responder a questoes deste tipo, pretendemos gerar um procedimento estatstico que,
colocando em confronto os dados disponveis e a hipotese de normalidade da distribuicao de
X, permita decidir acerca da veracidade desta hipotese. No mesmo estudo podera tambem ser
nosso objectivo averiguar se a esperanca matematica de X pode ser considerada igual a 15KN
ou se, em contrapartida, dever
a ser considerada superior a tal valor. Questoes similares podem
em contextos desta natureza que surgem os testes
ser formuladas sobre a vari
ancia de X. E
estatsticos ou ensaios de significancia que sao, como ja dissemos, procedimentos estatsticos que
permitem, a partir da amostra observada, tomar uma decisao sobre a veracidade de uma entre
duas hipoteses antag
onicas, acerca da forma da distribuicao ou de parametros da distribuic
ao
de variaveis ou de vectores aleatorios. Notamos que nos estudos mais complexos, em que os
modelos matematicos, construdos para descrever fenomenos de interesse, envolvem um grande
n
umero de vari
aveis e consequentemente (ou nao) tambem um grande n
umero de parametros, os
testes estatsticos, ainda que menos simples, tem sempre por base estabelecer um contraponto
entre duas hipoteses alternativas, usando para tal a amostra observada.
Suponhamos ent
ao que pretendemos testar uma hipotese H0 - hipotese nula ou privilegiada
- contra uma hipotese alternativa H1 , ambas relacionadas com a distribuicao de uma variavel
nosso objectivo tomar uma
aleatoria X (com a forma ou com parametros da distribuicao). E
decisao, a que chamaremos decisao estatstica, acerca da veracidade de uma destas hipoteses,
usando para tal uma amostra observada (x1 , ..., xn ) da variavel aleatoria X.
Atendendo a que neste contexto H0 e verdadeira ou falsa, podemos cometer dois erros
distintos:
Erro de tipo I - erro que se comete ao rejeitar H0 , quando H0 e verdadeira.
Erro de tipo II - erro que se comete ao nao rejeitar H0 , quando H0 e falsa.
Defini
c
ao 3.4.1 Chamamos nvel de signific
ancia de um teste estatstico `
a probabilidade
de rejeitar H0 quando H0 e verdadeira.
O nvel de significancia e usualmente denotado por .
Defini
c
ao 3.4.2 Uma estatstica de teste e uma vari
avel aleat
oria, func
ao da amostra, que
estabelece o confronto entre os dados e a hip
otese H0 e sobre a qual baseamos a nossa decis
ao
estatstica (conclus
ao final).
Defini
c
ao 3.4.3 Damos o nome de regi
ao crtica de um teste, que se representa por C, ao
conjunto dos valores que a estatstica de teste pode assumir e que conduzem `
a rejeic
ao de H0 .
Observemos que tendo em conta a definicao de nvel de significancia de um teste estatstico,
tem-se
= P (C/H0 verdadeira).
71
3.4.2
Ao construir um teste estatstico para validar uma determinada distribuicao, a que chamaremos teste de ajustamento, podemos colocar na hipotese H0 a distribuicao completamente
especificada ou nao. Concretamente, podemos formular hipoteses do tipo
H0 : X segue uma lei normal
que diz respeito apenas `a forma generica da distribuicao ou
H0 : X segue a lei N (2, 5)
em que se especifica completamente a lei concretizando os seus parametros. Analogamente
podemos colocar, por exemplo, como hipotese nula
H0 : X segue uma lei de Poisson
ou
H0 : X segue a lei P(3).
O teste do qui-quadrado de ajustamento adapta-se a ambos os casos. Todavia, no presente curso apresentamos apenas o caso em que H0 diz respeito a uma lei com parametros
especificados (assumem-se conhecidos depois de estimados).
Seja X uma vari
avel aleatoria para a qual se postulou uma lei L, com parametros especificados, e (X1 , ..., Xn ) uma amostra aleatoria da variavel aleatoria X.
Vamos construir um teste estatstico de hipoteses
H0 : X segue a lei L versus H1 : X nao segue a lei L
Consideremos inicialmente uma particao do suporte da lei L : A1 , A2 , . . . , Am .
Sejam
Nj = {i : Xi Aj } a frequencia absoluta da classe Aj , j = 1, . . . , m,
ej = nP (X Aj ) a frequencia esperada da classe Aj , j = 1, . . . , m, sob a validade de
H0 .
A estatstica do teste e
m
X
(Nj ej )2
Qn =
ej
j=1
com Q 2m1 .
Assim a decisao estatstica final e
72
rejeitar H0 se qn m1 (1 )
nao rejeitar H0 se qn < m1 (1 ),
onde qn representa o valor observado da estatstica de teste.
Observa
c
ao 3.4.1 Atendendo a que a lei do qui-quadrado e apenas uma lei aproximada
para a estatstica de teste, devemos usar tal aproximac
ao somente nos casos em que esta e
considerado pela generalidade dos autores de Estatstica
considerada razoavelmente boa. E
que a referida aproximac
ao deve ser usada para valores de frequencias esperadas superiores ou
iguais a 5. Assim, nos exemplos em que se obtem frequencias esperadas inferiores a 5, devemos
proceder ao reagrupamento das classes que constituem a partic
ao inicial do suporte da lei L. Tal
reagrupamento pode ser conseguido, por exemplo, juntando classes adjacentes ou aumentando
as amplitudes das classes com frequencia esperada inferior a 5 e diminuindo consequentemente
as amplitudes das que lhes s
ao contguas.
Exemplo 3.4.1 O tempo (em minutos) que cada pessoa leva a percorrer um determinado trajecto duma cidade, em autom
ovel pr
oprio e em horas de elevado congestionamento
de tr
ansito, e representado por uma vari
avel aleat
oria T . Dispomos de uma amostra de T ,
de dimens
ao 60, que apresenta media igual a 26.024 e vari
ancia igual a 191.619. Sabendo
que a construc
ao do histograma tornou plausvel a hip
otese de normalidade de T , vamos realizar um teste do qui-quadrado, tendo por objectivo validar de forma mais robusta tal hip
otese.
2 = 188.426. Pretendemos ent
s
a
o
testar
Recorde-se que
b2 = 59
60
H0 : T segue a lei N (26.024, 188.426)
contra
H1 : T n
ao segue a lei N (26.024, 188.426).
Consideremos a seguinte partic
ao do suporte da distribuic
ao N (26.024, 191.6192)(que como
sabemos e o conjunto R):
] , 8], ]8, 14], ]14, 20], ]20, 24], ]24, 28], ]28, 32], ]32, 38], ]38, 44], ]44, +[.
No quadro seguinte apresentamos as frequencias observadas associadas a esta partic
ao:
ni
] , 8]
5
]8, 14]
7
]14, 20]
8
]20, 24]
8
]24, 28]
4
]28, 32]
9
]32, 38]
6
]38, 44]
7
]44, +[
6
= 60P (T 8) = 5.67496
= 60P (14 < T 20) = 8.39141
= 60P (24 < T 28) = 6.95051
= 60P (32 < T 38) = 8.41037
= 60P (T > 44) = 5.71039.
e2
e4
e6
e8
Os valores das frequencias esperadas e das frequencias observadas encontram-se no quadro que
apresentamos de seguida.
73
ni
ei
] , 8]
5
5.67496
]8, 14]
7
5.75674
]14, 20]
8
8.39141
]20, 24]
8
6.66022
A estatstica de teste e
Qn =
]24, 28]
4
6.95051
]28, 32]
9
6.66696
]32, 38]
6
8.41037
]38, 44]
7
5.77843
]44, +[
6
5.71039
9
X
(Ni ei )2
i=1
ei
9
X
(ni ei )2
i=1
ei
= 3.6692,
o qual n
ao pertence `
a regi
ao crtica, usando tal nvel de signific
ancia, n
ao rejeitamos a hip
otese
H0 . Assim, conclumos que estes dados n
ao s
ao incompatveis com o facto de T possuir uma
distribuic
ao normal.
Exemplo 3.4.2 Considere a vari
avel aleat
oria X que representa o tempo que cada doente
deve esperar para ser atendido num servico de urgencias de um hospital pedi
atrico. Os tempos
de espera (em minutos) relativos a 50 pacientes desse hospital constituem a seguinte amostra:
35
47
22
22
64
10
63
8
25
6
23
27
94
47
37
19
21
58
15
51
39
83
7
10
11
12
13
19
19
28
16
14
72
31
16
13
24
32
51
29
108
45
36
33
77
68
55
16
42
9
74
ni
[0, 3.8[
4
[3.8, 8.2[
7
[8.2, 13.4[
7
[13.4, 19.8[
6
[19.8, 28[
6
[28, 39.6[
6
[39.6, 59.4[
8
[59.4, +[
6
8
X
(Ni ei )2
ei
i=1
8
X
(Ni 6.25)2
6.25
i=1
2
0
2
2
3
3
0
2
3
0
3
1
1
2
3
1
2
7
3
2
1
1
2
1
0
2
4
2
0
1
3
1
4
0
1
3
1
4
2
0
1
2
1
2
3.
4
3
75
H0 : X P(1.9)
contra a hip
otese contr
aria. Como o suporte de X e o conjunto
N0 , a partic
ao considerada e
T
{0}, {1}, {2},{3},{4},{5} {6}, [7, +[ N.
Relativamente `
a amostra apresentada podemos construir a tabela seguinte de frequencias
absolutas observadas.
T
0 1
2
3 4 5 6 [7, +[ N
ni 7 14 14 10 4 0 0
1
Sob a validade de H0 , as seguintes frequencias esperadas s
ao:
e1
e3
e5
e7
= 50P (X
= 50P (X
= 50P (X
= 50P (X
= 0) = 7.47843
= 2) = 13.49857
= 4) = 4.06082 < 5
= 6) = 0.488652 < 5
e2
e4
e6
e8
= 50P (X
= 50P (X
= 50P (X
= 50P (X
= 1) = 14.20902
= 3) = 8.54909
= 5) = 1.54311 < 5
7) = 0.172307 < 5.
5
X
(Ni ei )2
i=1
ei
a qual, quando H0 e verdadeira, segue assintoticamente a lei 251 . Para um nvel de signific
ancia assint
otico igual a 0.01, como 4 (0.99) 13.277, a regi
ao crtica considerada e
C = [13.277, +[.
Como o valor observado da estatstica de teste e 0.49448, o qual n
ao pertence `
a regi
ao
crtica, n
ao rejeitamos a hip
otese H0 , usando um nvel de signific
ancia assint
otico igual a
0.01. Ou seja, para o referido nvel de signific
ancia, podemos admitir que X segue uma lei de
Poisson.
Devemos observar que esta seria a conclus
ao final, mesmo para outros nveis de signific
ancia
mais elevados, por exemplo 0.05.
76
Exerccio 3.4.2 Seja X a v.a. que representa o tempo de funcionamento entre duas
conhecida uma amostra de X, de dimens
falhas de um termo-higr
ografo. E
ao 41, a qual
apresenta media igual a 10.3245 e desvio padr
ao igual a 8.6474. Com o objectivo de averiguar
se X segue uma lei exponencial de densidade f (x) = ex 1I[0,+[ (x), x IR, realize um teste
de ajustamento do qui-quadrado, com nvel de signific
ancia 0.05. As frequencias observadas
encontram-se na tabela seguinte:
ni
]0, 8]
23
]8, 16]
9
]16, 24]
4
]24, 32]
3
]32, 40]
1
]40, 48]
0
]48, +[
1
3.4.3
Teste de Kolmogorov-Smirnov
1
{Xi : Xi x, i = 1, . . . , n} .
n
77
agora nosso objectivo saber se, face a uma amostra observada, podemos admitir que X
E
tem uma determinada func
ao de distribuicao F .
Para testar
H0 : A funcao de distribuicao de X e F
versus
H1 : A funcao de distribuicao de X nao e F
consideramos a estatstica de teste
En =
2 2
(1)k e2k x , x 0
k=
G(x) =
.
0,
x<0
Consequentemente, consideramos a regiao crtica C = [g1 , +[ onde g1 representa o quantil de probabilidade 1 de G, tendo-se assim G(g1 ) = 1 . A funcao de distribuicao G
encontra-se tabelada e tem-se, por exemplo, g0.95 1.36 e g0.99 1.64.
3.4.4
Papel de probabilidade
(3.1)
78
se puder ajustar convenientemente uma recta, podemos validar, ainda que informalmente, a
funcao de distribuic
ao F .
Chamamos papel de probabilidade a este diagrama de dispersao. Observamos que no caso
em que a func
ao h envolve termos do tipo ln(1 p), para contornar o problema que surge com
ln(1 nn ) considera-se o diagrama de dispersao constitudo pelos pontos de coordenadas
i
xi:n , h(
) , i = 1, 2, ..., n.
n+1
Devemos ainda observar que a construcao do papel de probabilidade nao exige a estimacao
previa dos parametros desconhecidos da lei de X.
Exemplo 3.4.4 A vari
avel aleat
oria X tem funca
o de distribuic
ao
F (x) =
0,
1 e(x) ,
x<
,
x
i
, i = 1, . . . , n, como o que
n+1
apresentamos de seguida, d
a-nos uma validac
ao informal da hip
otese de exponencialidade da
distribuica
o de X.
ln(1
i ....
41 )...
...
...
...
...
...
..
......................................................................................................................................................................................................................................................................................
xi:40
Exemplo 3.4.5 Suponhamos que pretendemos usar o papel de probabilidade para validar
de forma previa uma distribuic
ao N (m, 2 ) para a vari
avel aleat
oria X.
Admitindo tal hip
otese de normalidade e atendendo a que P (X x) = p e equivalente a
P (Z xm
mos que
) = p, conclu
x = m + FZ1 (p),
onde FZ representa a func
ao de distribuica
o da lei N (0, 1).
79
i
para i {1, . . . , n}.
Constr
oi-se um diagrama de dispers
ao dos pontos
n
Um papel de probabilidade, como o que apresentamos a seguir, torna plausvel a normalidade
da distribuic
ao da vari
avel aleat
oria subjacente `
a amostra observada.
xi:n , FZ1
...
.
i ...
FZ1 ( 50
)..
.
...
...
...
...
...
...
.
......................................................................................................................................................................................................................................................................................................................
xi:50
i
FZ1 ( 44
)
3.5
3.5.1
...
...
...
...
...
...
...
...
.........................................................................................................................................................................................................................................
xi:44
Infer
encia para a m
edia de uma vari
avel aleat
oria
Intervalos de confianca
O metodo dos momentos apresentado na seccao 3.1, assim como todos os outros metodos de
estimacao pontual, permite associar estimadores aos parametros desconhecidos da distribuic
ao
de uma dada vari
avel aleatoria. Por sua vez, a cada estimador podemos associar tantas estimativas quantas as amostras usadas para o seu calculo. Sabemos tambem que, na generalidade
dos casos, nenhuma destas estimativas sera coincidente com o verdadeiro valor do parametro,
que continua desconhecido, embora aproximado.
Na verdade, mesmo dispondo de varias estimativas para um dado parametro, nao dispomos
de qualquer informac
ao relativamente `a sua precisao ou `a confianca que nelas podemos depositar. Esta contingencia da estimac
ao pontual e ultrapassada se implementarmos metodos de
estimacao intervalar (ou de estimac
ao por intervalos).
Concretamente, depois de obtida uma estimativa pontual para um determinado parametro, a precisao desta estimativa sera naturalmente evidenciada atraves de um intervalo que a
contenha e cuja amplitude e uma medida dessa mesma precisao. Por outro lado, a confianca que
temos na estimativa que obtivemos nao e mais senao a contrapartida emprica da probabilidade
de o parametro a estimar pertencer a um determinado intervalo aleatorio.
Comecemos ent
ao por apresentar algumas generalidades sobre intervalos de confianca.
Seja X uma vari
avel aleatoria com funcao de distribuicao dependente de um parametro
real, desconhecido, e seja (X1 , ..., Xn ) uma amostra aleatoria de X.
80
Xn m
N (0, 1)
/ n
(n 1)S 2
m
2 . Assim X
e uma vari
avel fulcral para m (quando e
Xn1
2
/ n
(n 1)S 2
e uma vari
avel fulcral para 2 .
conhecido) e
2
bem como
O metodo da vari
avel fulcral consiste resumidamente no seguinte: supondo que a variavel
fulcral tem distribuic
ao contnua (exacta ou aproximada), procuramos dois valores reais q1 e
q2 tais que
P (q1 V (X1 , ..., Xn ) q2 ) = 1 , ]0, 1[.
Se for possvel desenvolver esta dupla desigualdade ate isolarmos na forma
P (f (X1 , ..., Xn ) g(X1 , ..., Xn )) = 1 ,
fica assim determinado o intervalo aleatorio [f (X1 , ..., Xn ), g(X1 , ..., Xn )] que contem com
probabilidade 1 .
No caso em que para a vari
avel fulcral so se conhece uma distribuicao aproximada diremos,
obviamente, que o intervalo aleatorio [f (X1 , ..., Xn ), g(X1 , ..., Xn )] contem com probabilidade
aproximadamente 1 .
Neste curso damos especial relevo `a construcao de intervalos de confianca para medias,
variancias e para o parametro da distribuicao de Bernoulli o qual, apesar de ser tambem
uma media, necessita de um enquadramento teorico particular. Contudo, antes de iniciar a
construcao de intervalos de confianca para a media de variaveis aleatorias apresentamos um
exemplo onde se ilustra o metodo da variavel fulcral.
Exemplo 3.5.2 Seja X a vari
avel aleat
oria que representa a quantidade de chuva que
cai no espaco de uma hora em determinado lugar. Observou-se que num perodo de dois dias
consecutivos choveu ininterruptamente, registando-se uma quantidade total de precipitac
ao de
145.3 litros por metro quadrado. Suponha que a distribuic
ao de X e contnua admitindo den2x
3x
sidade da forma f (x) = 3
e um par
ametro desconhecido.
2 I[0,] (x) + 3 2 I(,3] (x), onde > 0
81
13
2
Podemos provar que E(X) = 4
ca
3 e E(X ) = 6 . Vamos determinar um intervalo de confian
95% para o par
ametro .
Da proposic
ao 3.2.3 (Corol
ario do Teorema Limite Central) decorre que a vari
avel aleat
oria
X 43
q
n
7
18
segue assintoticamente a lei N (0, 1) e assim pode ser usada como vari
avel fulcral. Ent
ao, como
z(0.975) = 1.96, tem-se
4
X
3
0.95
r
n
1.96
P
1.96
18
e, atendendo a que
X 43
4 1.22227
1.22227
X
4
P 1.96 r
+
n 1.96 = P 3
3
n
n
7
18
= P
4
X
X
,
1.22227
4 1.22227
+
3
3
n
n
conclumos que
4
3
X
X
,
1.22227 4 1.22227
+
3
n
n
e um intervalo aleat
orio que contem com probabilidade aproximadamente 0.95.
Face `
a amostra observada, podemos afirmar, com uma confianca de aproximadamente 95%,
que pertence ao intervalo
x
x
= [2.00503, 2.61653].
,
1.22227 4 1.22227
+
3
3
n
n
Usando este resultado e atendendo a que E(X) = 34 podemos obter um intervalo de confianca para a media ou esperanca matem
atica da vari
avel aleat
oria X. Com efeito, podemos
afirmar que o intervalo
4
4
[ 2.00503, 2.61653] = [2.67337, 3.48871]
3
3
e um intervalo de confianca aproximadamente 95% para E(X).
82
7
7
2.005032 ,
2.616532 = [0.55066, 2.66242]
18
18
X m
z(1 /2)
z(1 /2)
/ n
=1
equivalente a
P
= 1 ,
x z(1 /2)
com (1 ) 100% de confianca. Esta interpretacao
, x + z(1 /2)
n
n
pode ser usada para qualquer intervalo de confianca associado a qualquer parametro.
83
(n 1)S 2
X m
tn1 ,
=
2
(n 1)
S/ n
e portanto
S
S
X tn1 (1 /2) , X + tn1 (1 /2)
n
n
X m
2.82143 = 0.98
2.82143
S/ 10
84
equivalente a
P
S
S
X 2.82143 m X + 2.82143
10
10
= 0.98,
X 2.82143
, X + 2.82143
10
10
contem m com probabilidade 0.98. Assim, face a esta amostra, podemos afirmar que m pertence
ao intervalo
s
s
= [7.79992, 8.26208]
x 2.82143 , x + 2.82143
10
10
com 98% de confianca.
Observa
c
ao 3.5.1 No caso em que X n
ao tem lei normal, de acordo com a proposica
o
X m
N (0, 1). Ent
3.2.3, Corol
ario do Teorema Limite Central, sabemos que
ao, no caso
/ n
em que a vari
ancia da vari
avel aleat
oria X, que denotamos por 2 , e conhecida, usaremos a
X m
e os procedimentos acima na construc
ao de intervalos de confianca para
vari
avel fulcral
/ n
m, tendo contudo intervalos de confianca aproximadamente (1)100%. Se, por outro lado, a
X m
.
vari
ancia da vari
avel aleat
oria X e desconhecida ser
a tambem usada a vari
avel fulcral
S/ n
N
ao tendo a garantia a normalidade da distribuic
ao de X, n
ao conhecemos a distribuic
ao
exacta desta vari
avel fulcral. Neste caso, e dispondo de amostras de dimens
ao suficientemente
grande, ser
a igualmente usada a distribuic
ao N (0, 1) como aproximac
ao para a distribuic
ao
da vari
avel fulcral. Recordamos que tal significa que, para n suficientemente grande, a funca
o
de distribuic
ao da vari
avel fulcral pode ser aproximada pela funca
o de distribuic
ao da referida
distribuica
o.
Exemplo 3.5.4 Consideremos a vari
avel aleat
oria X que representa o tempo de funcionamento sem falhas (em meses) de um determinado tipo de bombas instaladas em estac
oes
de
aguas residuais. Dispomos de uma amostra de X, de dimens
ao 40, que apresenta media
igual a 15.3825 e vari
ancia 43.4251. A partir desta amostra vamos construir um intervalo de
confianca para a media ou esperanca matem
atica de X que denotamos por m. Uma vez que a
vari
ancia de X e desconhecida usamos a vari
avel fulcral
X m
.
S/ n
Por outro lado, como tambem desconhecemos a distribuic
ao de X (e portanto n
ao podemos ter
a garantia de que e normal) usamos a distribuic
ao N (0, 1) como distribuic
ao aproximada para
a distribuic
ao da vari
avel fulcral. Ora, uma vez que, com 1 = 0.95 e z(0.975) = 1.96, se
tem
X m
1.96 0.95
P 1.96
S/ 40
85
S
S
X 1.96 m X + 1.96
40
40
0.95,
Limite Central.
Uma vez que se tem
P
z(0.99)
n z(0.99)
2.33
X
2.33
1 1
n
n
P
2.33
+1
n
"
"
0.98
0.98
X
0.98,
2.33
+1
n
X
X
2.33
2.33
+1 +1
n
n
e um intervalo aleat
orio que contem E(X) = 1/ com probabilidade aproximadamente igual a
1 .
86
3.5.2
Testes param
etricos
Recordamos que um teste estatstico nao e mais que um procedimento estatstico com o qual se
pretende analisar a compatibilidade entre os dados (observacoes realizadas ou amostra) e uma
hipotese formulada previamente sobre a distribuicao de uma variavel aleatoria. Esta hipotese
e representada por H0 e e designada hip
otese nula.
Nesta secc
ao estudamos apenas testes cujas hipoteses se referem a parametros de uma
dada distribuic
ao e que, por isso, se designam testes parametricos. Neste curso consideramos
apenas tres tipos de testes estatsticos para um parametro real . A saber, para casos muito
particulares do parametro , sao considerados apenas os testes de hipoteses
i) H0 : = 0 versus H1 : > 0 ;
ii) H0 : = 0 versus H1 : < 0 ;
iii) H0 : = 0 versus H1 : 6= 0 ;
onde 0 e um real fixado.
Comecamos mais uma vez com o caso em que X N (m, 2 ), com conhecido.
Suponhamos que pretendemos testar H0 : m = m0 versus uma hipotese alternativa H1 ,
onde m0 representa um n
umero real conhecido. Por exemplo, no contexto do exemplo 1.4.1
podemos estar interessados em testar H0 : m = 15 contra a hipotese alternativa H1 : m > 15.
Sendo a estatstica de teste uma variavel aleatoria que estabelece o confronto entre os
dados e a hipotese H0 , para este teste e intuitivo considerar a estatstica de teste baseada na
diferenca X m0 . Contudo, tambem sabemos que para construir a regiao crtica de um teste
precisamos de conhecer a distribuic
ao da estatstica de teste e, mais, que esta seja independente
de parametros desconhecidos.
Assim, neste caso, a estatstica de teste a considerar e
En =
X m0
/ n
versus
H 1 : m > m0
87
versus H1 : m 6= m0
X m0
S/ n
88
i) H0 : m = m0 versus H1 : m > m0
usamos C = [tn1 (1 ), +[ e p-valor= P (T en ) com T tn1 ;
ii) H0 : m = m0 versus H1 : m < m0
usamos C =] , tn1 (1 )] e p-valor= P (T en );
iii) H0 : m = m0
usamos
versus H1 : m 6= m0
C =] , tn1 (1 /2)] [tn1 (1 /2), +[
Observa
c
ao 3.5.2 No caso em que X n
ao tem lei normal, para testar H0 : m = m0
contra uma hip
otese alternativa adequada usamos a mesma estatstica de teste. Assim, quando
a vari
ancia da vari
avel aleat
oria X, que denotamos por 2 , e conhecida, a proposic
ao 3.2.3
permite-nos concluir que
X m0
N (0, 1).
/ n
Se, por outro lado, a vari
ancia 2 e desconhecida, na presenca de amostras significativamente
grandes usamos a distribuic
ao N (0, 1) como aproximaca
o para a distribuic
ao da estatstica de
Xm
0
oes crticas tendo, contudo, testes de nvel
teste En = S/n . Como tal, usamos as mesmas regi
de signific
ancia assint
otico ou com p-valor assint
otico.
89
x 14
= 1.9794.
s/ 61
n
10. Ali
as, no caso em que n
ao nos fornecem o desvio padr
ao da amostra, que denotamos por
X10
seria a u
s, a estatstica de teste 10/
nica
que
poder
amos
usar.
n
90
Exerccio 3.5.1 Um professor resolve, para manter a forma fsica, treinar um pouco de
corrida. Ao fim de algum tempo de treino comeca a participar em corridas a serio cujo percurso
e 10 Km. Sabe-se que o desvio padr
ao estabelecido para este tipo de treino e igual a 2.1 minutos
(j
a convertidos no sistema decimal e que correspondem a 2 minutos e 6 segundos). Nas u
ltimas
40 corridas este professor demorou tempos cuja media foi igual a 38 minutos e 45 segundos .
Com 96% de confianca, construa um intervalo para o tempo medio que este professor demora
a percorrer os 10 Km.
Exerccio 3.5.2 Seja X a vari
avel aleat
oria que representa o erro, em centmetros, cometido por certa m
aquina ao cortar pecas com dois metros de comprimento. Dispomos de uma
amostra de X, de dimens
ao 50, que apresenta media igual a -0.57 cm e desvio padr
ao 2.035
cm. Estudos estatsticos permitiram concluir que X tem distribuica
o normal. Construa um
intervalo que contenha a media de X com 98% de confianca.
Exerccio 3.5.3 O alcance de um morteiro est
a a ser investigado. Nos ensaios experimentais registaram-se os seguintes valores (em metros): 2100, 1984, 2072, 1898, 1950, 1992,
2096, 2103, 2043, 2218, 2244, 2206, 2210, 2152, 1962, 2007, 2018, 2106, 1938, 1956.
Admitindo a normalidade da vari
avel aleat
oria que representa o alcance do morteiro, construa um intervalo com 99% de confianca para o alcance medio do morteiro.
Exerccio 3.5.4 O director de uma estac
ao de r
adio pretende uma estimativa para o
tempo medio que cada famlia dedica, por dia, a ouvir essa estac
ao. Foi recolhida uma amostra
constituda por 61 famlias, tendo sido calculados uma media di
aria de audic
ao de 2,4 horas e
um desvio padr
ao de 0,7 horas. Construa um intervalo de confianca 95% para o tempo medio
di
ario de audic
ao.
Exerccio 3.5.5 Um fabricante de vinhos produz vinho que vende afirmando que o seu
grau alco
olico e de 11%. Uma amostra de 45 garrafas apresenta grau alco
olico medio 10.2%
com desvio padr
ao 1.7%. Construa um intervalo com confianca 95% para o grau alco
olico
medio de cada garrafa.
Exerccio 3.5.6 Pretende-se estudar o tempo de vida, em anos, das baterias produzidas
em determinada f
abrica. Um amostra dos tempos de vida de 49 baterias apresenta vari
ancia
igual a 10.4. Com que confianca podemos afirmar que a media da vari
avel aleat
oria que representa o tempo de vida das baterias, se encontra num intervalo de amplitude mnima igual a
2?
Exerccio 3.5.7 Em determinada cidade est
ao a ser estudados os problemas de congestionamento de tr
ansito nas zonas centrais. O tempo (em minutos) que cada pessoa leva a percorrer
um determinado trajecto daquela cidade, em autom
ovel pr
oprio e em horas de elevado congestionamento de tr
ansito, e uma vari
avel aleat
oria que representamos por T . Estudos estatsticos
permitiram concluir que T N (m, 2 ). Dispomos de uma amostra de T , de dimens
ao 41, que
apresenta media 10.8 e vari
ancia 5.725. Com base nesta amostra, teste a hip
otese H0 : m = 11
contra a hip
otese alternativa H1 : m 6= 11.
Exerccio 3.5.8 No problema 3.5.1, ao nvel de signific
ancia 0.05, parece-lhe prefervel
dizer que o professor corre os 10 Km em 38 minutos e 30 segundos, ou que demora mais do
que esse tempo a percorrer a referida dist
ancia?
91
Exerccio 3.5.9 O n
umero de chamadas telef
onicas que chegam diariamente a uma central entre as 23 horas e as 24 horas e uma vari
avel aleat
oria `
a qual se pode ajustar uma distribuic
ao de Poisson de par
ametro , desconhecido. Foi realizado um estudo estatstico a partir
do qual se inferiu o valor 2 para o par
ametro . Todavia, actualmente o perodo de observac
ao
corresponde ao hor
ario de um programa televisivo de grande audiencia, pensa-se que o valor
de dever
a ter diminudo. Para testar tal hip
otese fez-se, durante 150 dias, a observac
ao
do n
umero de chamadas que ocorreram no referido perodo. Os dados obtidos encontram-se
resumidos na tabela seguinte:
n
umero de chamadas
n
umero de dias
0
32
1
50
2
40
3
20
4
5
5
3
>5
0
92
3.6
3.6.1
Infer
encia para a vari
ancia de uma vari
avel aleat
oria normal
Intervalos de confianca
Seja X uma vari
avel aleatoria com lei N m, 2 , com 2 desconhecido. Do Teorema 3.2.4
decorre que
(n 1)S 2
2
.
Xn1
2
Consequentemente, para construir intervalos de confianca para 2 usamos a variavel fulcral
(n 1)S 2
. O problema da construc
ao de intervalos de confianca de amplitude mnima para
2
a variancia e razoavelmente complicado pelo que consideramos apenas intervalos de caudas
igualmente pesadas. Esta caracterizacao obtem-se considerando inicialmente a variavel fulcral
entre dois valores a e b tais que a probabilidade da variavel fulcral assumir valores inferiores
a a e igual `a probabilidade desta assumir valores superiores a b. Consequentemente, para um
grau de confianca 1 , tem-se a = Xn1 (/2) e b = Xn1 (1 /2).
Entao, devido ao facto de se ter
(n 1)S 2
P Xn1 (/2)
Xn1 (1 /2) = 1
2
equivalente a
P
(n 1)S 2
(n 1)S 2
2
Xn1 (1 /2)
Xn1 (/2)
(n 1)S 2
(n 1)S 2
,
Xn1 (1 /2) Xn1 (/2)
93
= 1 ,
contem 2 com probabilidade 1 . Assim, para uma amostra observada, podemos afirmar
que
(n 1)s2
(n 1)s2
,
Xn1 (1 /2) Xn1 (/2)
49S 2
49S 2
2
70.22241
31.55492
= 0.95.
Podemos ent
ao afirmar que a probabilidade de 2 pertencer ao intervalo aleat
orio
49S 2
49S 2
,
70.22241 31.55492
e igual a 0.95. Assim, face a esta amostra, conclumos que
49s2
49s2
= [0.10474, 0.23308]
,
70.22241 31.55492
e um intervalo de confianca 95% para 2 .
Observa
c
ao 3.6.1 No caso em que a vari
avel aleat
oria X n
ao tem distribuica
o normal
n
ao h
a resultados a registar para a lei de S 2 . Contudo, em alguns casos particulares, podemos
(n 1)S 2
. Basta
construir intervalos de confianca para a vari
ancia sem usar a vari
avel fulcral
2
atender aos casos em que a vari
ancia e func
ao da media. Nestas situac
oes obtemos um intervalo de confianca para a media, ainda que com grau aproximado, e seguidamente usamos a
relac
ao entre a media e a vari
ancia para construir um intervalo de confianca aproximada para
a vari
ancia. Notamos que este procedimento j
a foi usado nos exemplos 3.5.2 e 3.5.5.
94
3.6.2
Testes param
etricos
i) H0 : 2 = 02 versus H1 : 2 > 02
2 ;
a regiao crtica e C = [Xn1 (1 ), +[ e p-valor= P (Q en ), com Q Xn1
ii) H0 : 2 = 02 versus H1 : 2 < 02
a regiao crtica e C =]0, Xn1 ()] e p-valor= P (Q en );
iii) H0 : 2 = 02 versus H1 : 2 6= 02
a regiao crtica e
C =]0, Xn1 (/2)] [Xn1 (1 /2), +[
e p-valor= 2 min {P (Q en ), P (Q en )}.
95
s
s
x t24 (0.975) , x + t24 (0.975)
= [1.27, 0.82].
25
25
Como o ponto medio deste intervalo e igual a x, obtem-se x = 0.225. Por outro lado, tem-se
s
s
x + t24 (0.975) = 0.82 0.225 + 2.06389 = 0.82 s = 2.53.
5
25
Passemos `
a realizac
ao do teste de hip
oteses H0 : 2 = 6 e H1 : 2 > 6, adoptando o nvel
de signific
ancia 0.05.
(n 1)S 2
, a qual, quando H0 e verdadeira, segue
A estatstica de teste a considerar e En =
6
2
a distribuic
ao Xn1 . Assim, para = 0.05, a regi
ao crtica e
C = [X24 (0.95), +[= [36.41503, +[.
Face a estes dados, o valor da estatstica de teste e
e25 =
24 2.532
24s2
=
= 25.6,
6
6
o qual n
ao pertence a C.
Face a estes dados, n
ao podemos afirmar que a vari
ancia da vari
avel que representa os
erros cometidos no corte das pecas seja superior a 6 cm2 .
Exemplo 3.6.4 Um fabricante afirma que o tempo de vida, em anos, das baterias produzidas na sua f
abrica tem desvio padr
ao inferior a 3. Um amostra dos tempos de vida de 36
baterias apresenta vari
ancia igual a 7.65.
Coloquemos as seguintes quest
oes:
1. qual e a confianca que nos permite concluir que a media da vari
avel aleat
oria que representa o tempo de vida das baterias, se encontra num intervalo de amplitude mnima igual
a 2?
2. Admitindo agora que a vari
avel aleat
oria que representa o tempo de vida das baterias
e normalmente distribuda, poderemos afirmar que estes dados s
ao compatveis com a
afirmac
ao do fabricante relativamente `
a vari
ancia da referida vari
avel?
96
7.65
2 = 2 z(1 /2)
z(1 /2) = 2.17 1 /2 = 0.985.
36
Conclumos ent
ao que, com confianca aproximadamente 97%, se obtem um intervalo de amplitude mnima 2.
2. Para responder `
a segunda quest
ao e admitindo agora que X tem distribuica
o normal, h
a
que testar H0 : 2 = 9 e H1 : 2 < 9, adoptando o nvel de signific
ancia 0.025, por exemplo.
(n 1)S 2
, quando H0 e verdadeira, tem distriA estatstica de teste a considerar, En =
9
2 . Assim, para = 0.025, a regi
ao crtica e
buica
o Xn1
C =]0, X35 (0.025)] =]0, 20.56938].
35 7.65
= 29.75, n
ao pertence a C.
Mais, o valor observado da estatstica de teste, e36 =
9
Face a estes dados, e adoptando o nvel de signific
ancia 0.025, n
ao temos raz
oes para
confirmar a afirmac
ao do fabricante.
Observa
c
ao 3.6.2 No caso em que a vari
avel aleat
oria X n
ao tem distribuic
ao normal
2
n
ao h
a resultados a registar para a lei de S . Contudo, em alguns casos particulares, podemos
(n 1)S 2
realizar testes para a vari
ancia sem usar a estatstica de teste
. Basta atender aos
02
casos em que a vari
ancia e func
ao da media. Nestas situac
oes, realizamos um teste para a
media, ainda que com nvel de signific
ancia aproximado, e seguidamente usamos a relaca
o
entre a media e a vari
ancia para construir um teste para a vari
ancia.
Exerccio 3.6.1 Uma organizac
ao de defesa de consumidores recebeu v
arias queixas acerca
da quantidade de tinta, vendida por determinada marca, em baldes de valor nominal 1 litro.
N
ao querendo publicidade negativa, o fabricante reagiu afirmando ter regulado as m
aquinas
recentemente para que a quantidade media de tinta introduzida em baldes com aquele valor
nominal fosse de 1.1 litros. Tendo continuado a receber queixas, a referida organizac
ao deu
incio a um estudo estatstico para esclarecer a situac
ao. Assim, foi recolhida uma amostra de
30 baldes de tinta que apresenta media igual a 1.06 e desvio padr
ao igual a 0.06. Denote por X
a vari
avel aleat
oria que representa a quantidade de tinta introduzida em cada balde. A mesma
amostra permitiu concluir a normalidade de X.
1. Determine um intervalo que contenha a media de X com 98% de confianca.
97
98
Exerccio 3.6.7 Um fabricante afirma que o tempo medio de vida das baterias produzidas
na sua f
abrica e superior a 3 anos. Um amostra dos tempos de vida de 36 baterias apresenta
m
adia igual a 3.15 anos e desvio padr
ao igual a 1.65. Denote por X a vari
avel aleat
oria que
representa o tempo de vida das referidas baterias.
1. Realize um teste que lhe permita averiguar se o fabricante tem raz
ao no que respeita ao
tempo medio de vida das baterias. Use o nvel de signific
ancia 0.025.
2. Construa um intervalo que contenha a vari
ancia de X com 95% de confianca.
3. Usando esta amostra, test
amos as hip
oteses H0 : V ar(X) = 3 contra H1 : V ar(X) < 3.
Ao nvel de signific
ancia 0.05, rejeit
amos H0 . Sem realizar o teste, justifique por que
motivo a conclus
ao e a mesma se considerar um nvel de signific
ancia inferior a 0.05.
4. Admita agora que disp
oe de outra amostra, de dimens
ao igual a 30, a partir da qual
pode concluir, com 95% de confianca, que a media de X se encontra num intervalo
(de amplitude mnima) com ponto medio igual a 3.34 e extremo superior igual a 3.98.
Determine a vari
ancia desta amostra.
3.7
3.7.1
Infer
encia para proporc
oes
Intervalos de confianca