Anda di halaman 1dari 123

FGV/EPGE - Mestrado em Finanas e Economia Empresarial

Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

O Que Estatstica?

ESTATSTICA

Estatstica a cincia que permite obter


informaes sobre um fenmeno, a partir
do registro de observaes deste fenmeno.

Professor: Eduardo Campos


ESTATSTICA:
DADOS INFORMAO

A estatstica divide-se
em duas reas:

Estatstica Descritiva

Inferncia Estatstica

Exemplo:
Clculo do coeficiente de rendimento
(c.r.) = mdia ponderada das notas em
cada disciplina medida-resumo do
desempenho acadmico de um aluno.

Estatstica Descritiva ou
Anlise Exploratria de Dados

A estatstica descritiva ocupa-se da


anlise/descrio de um conjunto de
dados por intermdio de tabelas, grficos
e/ou medidas-resumo, com o objetivo de
facilitar sua visualizao e compreenso.

Inferncia Estatstica ou
Estatstica Inferencial

A inferncia estatstica consiste de um


conjunto de tcnicas para, a partir de uma
amostra selecionada de um universo,
formular concluses para este universo.

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo:

Tipos de Dados
Dados = matria prima da estatstica.

Pesquisa eleitoral estimao dos


percentuais de intenes de voto em todo
o universo eleitoral, a partir de uma
amostra de, digamos, 2.000 pessoas.

A identificao da ferramenta estatstica


adequada para trat-los depende da
identificao correta do tipo dos dados.
A seguir so apresentadas as tipologias
mais importantes para classificar dados.

1 - Dados Primrios x Secundrios

2 - Dados em Corte x Sries Temporais

Dados primrios so aqueles obtidos


de forma direta, mediante observao,
pesquisas ou experimentos controlados.

Dados em corte (transversal) so aqueles


referentes ao mesmo instante de tempo.

Dados secundrios so aqueles que no


so obtidos diretamente, e sim mediante
publicaes (como relatrios ou artigos).

Obs - Dados que possuem ambas as


dimenses (de corte e de tempo) so
denominados longitudinais ou em painel.
Dados em painel consistem no registro de
informaes ao longo do tempo para um
conjunto de unidades em corte transversal.
Tambm podem ser encarados como
um conjunto de n sries temporais.

Dados de sries temporais so aqueles


registrados ao longo de um perodo de
tempo, com determinada frequncia.

3 - Dados Qualitativos x Quantitativos


Dados qualitativos so aqueles que
representam um atributo ou qualidade.
Exemplos: profisso, gnero, raa, estado
civil, classe social, nvel de educao, etc.
Dados quantitativos so nmeros que
resultam de uma contagem ou medida.
Exemplos: idade, peso, altura, renda, nmero
de filhos, nmero de banheiros em casa, etc.

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 1.1 - Faturamento bruto no ms


passado, em milhes de R$, das 30 filiais
de uma determinada empresa de varejo:

1. ESTATSTICA
DESCRITIVA

11,8 3,6
8,9 9,1
10,2 8,0
15,3 12,3
6,2 11,2

16,6 13,5 4,8 8,3


7,7 2,3 12,1 6.1
11,4 6,8 9,6 19,5
8,5 15,9 18,7 11,7
10,4 7,2 5,5 14,5

Que concluses voc pode tirar?

Esses dados esto na chamada forma


bruta, difcil de analisar diretamente.

Distribuio de Frequncias

Precisamos usar tcnicas adequadas para


resum-los ou facilitar sua visualizao.

A distribuio de frequncias
uma tabela que agrupa os dados
em classes (intervalos), indicando o
nmero ou a proporo de observaes
que pertencem a cada uma das classes.

disto que trata a


estatstica descritiva!

As classes no precisam
ter amplitudes iguais.

Distribuio de Frequncias Absolutas


Classe

Frequncia

2 | 5

5 | 8

8 | 11

11 | 14

14 | 17

17 | 20

Total:

30

A notao | significa que o extremo inferior da classe


no est includo, e o extremo superior est includo!

Limitaes da distribuio
de frequncias absolutas:
1. A frequncia absoluta de cada classe no
tem interpretao direta. sempre necessrio
olhar para o total de observaes consideradas.
2. No permite a comparao com outra
distribuio cujos totais sejam diferentes.
O uso de frequncias relativas
soluciona os problemas acima.

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio de Frequncias Relativas


Representa a proporo ou o percentual
de observaes que caem em cada classe.
Classe

Frequncia Relativa

2 | 5
5 | 8
8 | 11
11
| 14
14 | 17
17 | 20
Total:

3/30 = 0,1 = 10%


= 7/30 ou 23,33%
23,33%
23,33%
13,33%
6,67%
1 = 100%

Distribuio de Frequncias Acumuladas


Representa a soma das frequncias
at a classe considerada (inclusive).
Classe
2 | 5

Frequncia Acumulada
3 ou 10%

5 | 8

3 + 7 = 10 ou 33,3%

8 | 11

3 + 7 + 7 = 17 ou 56,7%

11
| 14

24 ou 80%

14 | 17

28 ou 93,3%

17 | 20

30 ou 100%

Histograma (Frequncias Absolutas) - ex. 1.1:

Histograma
Frequncias
10

O histograma uma representao


grfica da distribuio de frequncias.

8
6
4

Como obter o histograma?

2
0

Colocar as classes no eixo horizontal,


as frequncias no eixo vertical,
e traar um diagrama de barras.

Grfico de Barras

2-|5

5-|8

8-|11

11-|14

14-|17

Classes
17-|20

O histograma de frequncias relativas tem o


mesmo formato, com o eixo vertical modificado.

Exemplo 1.2
Nmero de reclamaes dirias x frequncia
em certo ms, no SAC de uma empresa:

Representao grfica apropriada para


variveis que representam contagens.

Consiste de barras verticais centradas


nos valores assumidos pela varivel,
e com espaos separando as barras.

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 1.3:
Grfico de Pizza ou de Setores
O grfico de pizza, ou de setores, um
diagrama estatstico bastante popular.
apropriado quando o objetivo
identificar partes de um todo.

Medidas de Posio
Uma medida de posio um valor em
torno do qual os dados esto concentrados.

Mdia
a soma das observaes dividida
pelo nmero de observaes:
n

Sinnimos: medida de localizao


ou de tendncia central.

x
i =1

x 1 + x 2 + ... + x n
.
n

Principais medidas de posio:


Mdia , Mediana e Moda.

no de
observaes

i-sima
observao

Exemplo 1.4:
No exemplo 1.1, o faturamento mdio
= 307,7/30 = 10,3 milhes.
Note que o valor 10,3 no ocorre.
Nenhum problema!
A mdia de um conjunto de dados no
precisa ser um dos valores observados.

Salrios de economistas recm-formados


(em R$ 1.000): 2,8; 6,0; 2,6; 3,1; 3,0.
Salrio mdio (destes 5 economistas):
= 3,5 (R$ 3.500,00).
Este nmero representativo
dos salrios desses 5 economistas?

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

R: No, pois est bem acima


de 4 dos 5 valores.
Claramente, o valor responsvel
por esta distoro foi o 6,0.
O 6,0 um valor atpico ou discrepante,
tecnicamente denominado outlier.

Mediana
o valor Md que divide os dados
ordenados em duas partes iguais.

Concluso:
A mdia uma medida de posio
muito sensvel presena de outliers!

Neste caso, recomendvel utilizar outra


medida de posio, chamada mediana!

Exemplo 1.4 (cont.):


Salrios ordenados:
2,6; 2,8; 3,0; 3,1; 6,0.

Se n for mpar: Md = observao central.

Md = 3,0.

Se n for par:
Md = mdia das duas observaes centrais.

Nota-se que 3,0 mais representativo da


posio ou tendncia central dos salrios.

Em algumas situaes, nem a mdia nem


a mediana sero medidas apropriadas.
Obs - A mediana uma medida de posio
robusta ou resistente. O sentido que ela resiste
(mantm seu valor) na presena de outliers.

Exemplo 1.5 - O gerente de uma loja de


calados est interessado em saber qual
tamanho de calado ele deve priorizar na
hora de planejar seu estoque, a partir dos
tamanhos dos calados vendidos no ltimo
ms. Qual a medida de posio adequada?

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Moda
A moda o valor que ocorre com
maior frequncia em um conjunto
de observaes (notao: Mo).

Um conjunto de dados que possua 2 modas


chamado bimodal. Se possui mais de 2,
multimodal. Se no possui moda, amodal.

Exerccio 1.1 - As notas de uma turma


foram: 9, 7, 8, 6, 3, 8, 7 e 8. Obtenha a
mdia, a mediana e a moda das notas.

Principais Medidas de Posio no Excel


Considere que os dados esto
na coluna A, clulas A1 a A8.
Mdia: MEDIA(A1:A8).
Mediana: MED(A1:A8).
Moda: MODO(A1:A8).

Mdia Ponderada
A mdia ponderada, p, definida como:
k

p =

jx j
j=1
k

1x 1 + 2 x 2 + ... + k x k
.
1 + 2 + ... + k

Exemplo 1.6 - Em uma pequena empresa,


os salrios dos 12 funcionrios esto
distribudos da seguinte forma:
5 ganham R$ 2.500,00;
2 ganham R$ 3.000,00;
3 ganham R$ 4.000,00;
2 ganham R$ 4.500,00.
Calcule o salrio mdio dos
funcionrios desta empresa.

Mdia para Dados Agrupados


Quando os dados esto disponveis agrupados
(na forma de uma distribuio de frequncias),
s possvel obter a mdia por aproximao.

j=1

peso do j-simo valor distinto de x (no


exemplo = frequncia do j-simo salrio)

O que se faz a mdia dos pontos mdios


das classes, ponderados por suas frequncias.

Resposta do exemplo 1.6: R$ 3.291,67.

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exerccio 1.2 - Obtenha o peso mdio da


populao cuja distribuio de frequncias :
Classe
40 |
50 Kg
50 |
60 Kg
60 |
70 Kg
70 |
80 Kg
80 |
90 Kg

Frequncia
2
5
7
8
3

Mediana para Dados Agrupados

Exemplo 1.7 - Considere a distribuio


de frequncias dos consumos domiciliares
mensais de energia eltrica em uma
determinada rea, apresentada a seguir:

Soluo: (2*45 + 5*55 +


7*65 + 8*75 + 3*85)/25 = 67 Kg.

Faixas de Consumo

Frequncia Relativa

0 | 50 KWh

8%

50 | 100 KWh

12%

100 | 150 KWh

32%

150 | 300 KWh

O primeiro passo obter


a distribuio acumulada:
Faixas de Consumo

Frequncia Acumulada

40%

0 | 50 KWh

8%

300 | 500 KWh

8%

50 | 100 KWh

20%

Total:

100%

100 | 150 KWh

52%

O clculo da mediana feito


por meio de uma regra de 3.

A figura a seguir posiciona a mediana


(= 100+h) na distribuio acumulada:

150 | 300 KWh

92%

300 | 500 KWh

100%

h calculado por meio da seguinte regra de trs:

150 100 52 20
=
.
h
50 20
Assim, h = 46,8 e a mediana :
Md 100 + h = 146,8 KWh.

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Mdia Geomtrica
A mdia geomtrica g
definida da seguinte forma:

g = (x 1 x 2 ...x n )n .
1

Exemplo 1.8 - Seja um investimento com


taxas de retorno anuais de 10 e 20% nos
anos 1 e 2, respectivamente.
A mdia simples (aritmtica) dos retornos
15%. Isto poderia levar impresso de
que algum que invista neste ativo por 2
anos obteria um retorno de 15% ao ano,
uma concluso totalmente equivocada.

Para ilustrar, considere um capital de


R$ 1000,00 investido no incio do ano 1.
Qual o valor capitalizado ao final dos 2 anos?
1.000*(1+R1)*(1+R2) = 1.000*1,1*1,2 =
R$ 1.320,00.
fator de capitalizao
no ano 1

O retorno mdio efetivo ou equivalente


Req o retorno por perodo que levaria
ao mesmo valor final caso os retornos
de todos os perodos fossem iguais.

fator de capitalizao
no ano 2

O fator de capitalizao equivalente


referente a n perodos obtido por meio
da mdia geomtrica dos fatores de
capitalizao referentes cada perodo:
(1+Req)n = (1+R1)(1+R2)...(1+Rn)

(1+Req) = [(1+R1)(1+R2)...(1+Rn)]1/n
E da se obtm o Req.

No exemplo 1.8:

(1 + R eq ) =

(1 + R 1 )(1 + R 2 ) = 1,32 = 1,148913,

de tal forma que Req = 14,8913%.


Interpretao: para obter o valor final de R$
1.320,00 com a mesma taxa de retorno em
cada ano, esta taxa teria que ser 14,8913%.

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Medidas de Disperso
Frequentemente, uma medida de posio
no fornece todas as informaes de que
precisamos para tomar uma certa deciso.
Por exemplo, uma pessoa com metade
do corpo em um forno, e a outra metade
em um freezer, na mdia estar bem!

Naturalmente, voc escolheria o fornecedor B


(menor risco inerente ao prazo de entrega).
A medida de disperso mais simples a
amplitude total = mximo - mnimo.

Exemplo 1.9 - Dois fornecedores, A e


B, apresentaram os seguintes prazos de
entrega, referentes aos ltimos 5 clientes
(em dias):
Fornecedor A 18; 10; 17; 3; 2.
Fornecedor B 9; 10; 10; 9; 12.
Com base nos prazos acima, qual dos
fornecedores voc escolheria: A ou B?

Seja (xi-) o desvio de xi em relao mdia.


Possveis medidas de disperso seriam:
n

( x ) ou

i =1

i =1

Uma forma mais completa de definir


uma medida de disperso : valor que
nos informa o quanto os dados variam
em torno de uma medida de posio.

( x )
i

Problema:
n

(x ) = 0, sempre!
i =1

Soluo:
trabalhar com
os mdulos
ou quadrados
dos desvios!

Desvio (Absoluto) Mdio

Varincia (
2)

a mdia dos mdulos dos desvios:

a mdia dos quadrados dos desvios:

DM =

| xi |

i =1

Esta medida no muito usada. mais usual


trabalhar com os quadrados dos desvios.

2 =

(x
i =1

) 2

Exerccio 1.3 - Seja um conjunto de 3 dados:


x1 = 2, x2 = 5 e x3 = 8. Ache a varincia. R: 6.

10

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 1.9 (cont.):

Forma alternativa para o clculo de 2:

Prazos de entrega aos ltimos 5 clientes:


n

=
2

x
i =1

2
i

x
i =1

Fornecedor A 18; 10; 17; 3; 2.


2
i

Fornecedor B 9; 10; 10; 9; 12.

2.

Para o fornecedor A: 2 = 45,2.


Para o fornecedor B: 2 = 1,2.
.

Interpretao?

A varincia apresenta um srio problema: ela


expressa no quadrado da unidade original,
em geral uma unidade que sequer faz sentido.
Como consequncia, a varincia
no possui interpretao direta.
Por esta razo o desvio padro, apresentado
a seguir, adotado com maior frequncia.

Interpretao de (vlida se o histograma


apresentar formato similar ao de um sino):

Desvio Padro (
)

= 2 .
No exemplo 1.9, para o fornecedor A: =
6,72 dias, e para o fornecedor B: = 1,10 dias.
O desvio padro preserva a unidade original
dos dados e ainda possui interpretao direta.

Regra Z para Deteco de Outliers

99,72%

Identifica como outliers valores


fora do intervalo [-3,+3].

(uma regra mais geral ser apresentada adiante)

11

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 1.10:
Aplicao em Anlise de Investimentos

A curva mais clara (ao B) oscila em torno de


um patamar superior quele em torno do qual
oscilam os retornos da ao A.

RETORNOS DIRIOS DE 2 AES

Ao A

49

45

41

37

33

29

25

21

17

Ao B

13

Neste contexto, o desvio padro uma medida


do risco do ativo, chamada volatilidade.

12
10
8
6
4
2
0
-2
-4
-6
-8

usual analisar a mdia e o desvio padro dos


retornos (variaes de preo) de um ativo.

DIAS

Em compensao, a flutuao dos retornos da


ao B bem maior maior risco.

Medidas de Disperso no Excel


Considere que os dados esto
na coluna A, clulas A1 a A8.
Varincia: VARP(A1:A8).
Desvio Padro: DESVPADP(A1:A8).

mdia amostral.

s2 =

(x i x )2
i =1

n 1

x i2 nx 2
i =1

n 1

Para enfatizar que estamos calculando


as quantidades Populacionais, ou seja,
considerando que o conjunto de dados o
nosso universo de estudo, como o caso.
Quando trabalharmos com uma amostra,
com o objetivo de estimar a varincia 2 de
uma populao (matria da P2), a frmula
apropriada passar a ser a do slide seguinte.

Varincia para Dados Agrupados

Varincia Amostral (s2)

Questo: por que o P no final do comando?

Quando os dados esto disponveis na forma de


distribuio de frequncias (isto , agrupados),
s possvel obter a varincia por meio de uma
aproximao, a partir da mdia dos quadrados
dos desvios dos pontos mdios das k classes em
relao mdia, ponderados pelas frequncias:

graus de liberdade

Esta medida usada para estimar a varincia


de uma populao. Os comandos no excel
so, respectivamente: VARA e DESVPADA.

2
j ( x j )
j=1

12

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exerccio 1.4 - Calcule a varincia dos pesos


na populao do exerccio 1.2, com base
apenas na distribuio de frequncias:
Classe
40 |
50 Kg
50 |
60 Kg
60 |
70 Kg
70 |
80 Kg
80 |
90 Kg

Frequncia
2
5
7
8
3

Coeficiente de Variao (CV)


Quando queremos comparar dados
expressos em diferentes unidades ou
magnitudes, o uso do desvio padro
leva a concluses equivocadas, sendo
necessrio utilizar uma outra medida
chamada coeficiente de variao.

R: 128.

Exemplo 1.11 - Suponha que estejamos


interessados em estudar a variabilidade de
salrios em diferentes ramos de atividade
profissional. Como um caso extremo,
considere a comparao entre salrios
de gerentes e de auxiliares de escritrio.
Sabe-se que o salrio mdio dos
gerentes de R$ 5.000,00 e o dos
auxiliares de escritrio de R$ 500,00.

Frmula do Coeficiente de Variao:

CV = .

CV dos salrios dos auxiliares de


escritrio: 100/500 = 0,2 ou 20%.
CV dos salrios dos gerentes: 100/5.000 =
0,02 ou 2% disperso relativa menor.

O desvio padro dos salrios dos gerentes


foi igual ao dos salrios dos auxiliares
de escritrio, ambos iguais a 100.
Isto indica variabilidade alta ou baixa?
No caso dos auxiliares de escritrio, cujos
salrios esto em torno de R$ 500,00, alta.
J para os gerentes, cujos salrios esto em
torno de R$ 5.000,00, relativamente baixa.

Propriedades do Coeficiente de Variao:


1 - adimensional, isto , no expresso
em nenhuma unidade de medida.
2 - uma medida de disperso relativa.
3 - CV pequeno = dados homogneos
e CV grande = dados heterogneos.

13

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Outras Medidas Importantes

Assimetria

Medidas de posio e disperso so


importantes, mas no exaustivas para
representar um conjunto de dados.

A assimetria uma medida do quanto a curva


de frequncia dos dados est afastada de um
aspecto simtrico em relao ao eixo central.

Estudaremos a seguir os conceitos


de assimetria, curtose e percentis.

Se a metade esquerda da curva um espelho


da metade direita, dizemos que os dados so
simtricos. Caso contrrio, que so assimtricos.

A figura a seguir ilustra as trs possibilidades:

Curtose

A curtose uma medida do achatamento


da curva de frequncia dos dados. As figuras
a seguir ilustram as 3 situaes possveis:
esta
distribuio
simtrica

esta distribuio
apresenta assimetria
positiva ou direita

esta distribuio
apresenta assimetria
negativa ou esquerda

A figura a seguir ilustra as trs possibilidades:

referncia

aspecto achatado, com


valores distribudos de
modo uniforme

aspecto pontiagudo, com


valores concentrados em
um intervalo estreito e
caudas mais pesadas

Percentis (ou Quantis)


O p-simo percentil ou percentil p de
um conjunto de dados o valor x tal que
p% dos dados so menores ou iguais a x.
Os percentis 25, 50 e 75 so chamados quartis:
250 Percentil = primeiro quartil (Q1)
500 Percentil = segundo quartil (Q2) = mediana
750 Percentil = terceiro quartil (Q3).

14

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Clculo de Quartis

Quartis
So medidas Q1, Q2 e Q3 que
dividem os dados em 4 partes iguais.

Exemplo 1.12 - Considere a distribuio


de frequncias dos consumos domiciliares
mensais de energia eltrica em uma
determinada rea, apresentada no
exemplo 1.7 e reproduzida a seguir:

Faixas de Consumo

Frequncia Relativa

0 | 50 KWh

8%

50 | 100 KWh

12%

100 | 150 KWh

32%

Faixas de Consumo

Frequncia Acumulada

150 | 300 KWh

40%

0 | 50 KWh

8%

300 | 500 KWh

8%

50 | 100 KWh

20%

Total:

100%

100 | 150 KWh

52%

O clculo dos quartis feito por meio de


uma regra de 3, como j foi feito para
a mediana (que o segundo quartil!).

Repetindo o procedimento adotado


para obter a mediana no exemplo 1.7:

O primeiro passo obter


a distribuio acumulada:

150 | 300 KWh

92%

300 | 500 KWh

100%

h foi calculado por meio da regra de trs:

150 100 52 20
=
.
h
50 20
E obtivemos:
Md (= Q2) 100 + h = 146,8 KWh.
Vamos agora ao clculo dos demais quartis:

15

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

A figura a seguir posiciona Q1 na distribuio


de frequncias acumuladas (Q1 = 100+h):

h calculado por meio da seguinte regra de trs:

150 100 52 20
=
.
h
25 20

Assim, Q1 100 + 8 = 108 KWh.

A figura a seguir posiciona Q3 na distribuio


de frequncias acumuladas (Q3 = 150+h):

h calculado por meio da seguinte regra de trs:

300 150 92 52
=
.
h
75 52

Assim, Q3 150 + 86 = 236 KWh.

Amplitude Interquartlica
uma medida de disperso dada pela
diferena entre o terceiro e o primeiro quartis:

Esquema de 5 Nmeros (ECN)


Representao esquemtica que mostra os
quartis e os valores mximo e mnimo de
um conjunto de dados, da seguinte forma:

Q = Q3 Q1.
Obs - no confundir com amplitude
total = valor mximo - valor mnimo.

16

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Box-Plot

Exemplo 1.13 - Seja o seguinte conjunto de


dados (ordenado): 5, 10, 12, ... , 37, 42, 45.

um diagrama que representa:


- a mediana,
- os quartis Q1 e Q3,

Sabendo-se que os quartis so 20, 25


(mediana) e 28, obtenha o box-plot.

- uma linha que vai de Q3 at a maior


observao menor ou igual a LS = Q3+1,5Q,
- outra linha que vai de Q1 at a menor
observao maior ou igual a LI = Q1-1,5Q.

Aplicaes do Box-Plot

Como detectar e identificar o tipo de assimetria?


A partir das distncias da mediana aos quartis.

1. Comparar disperses (via amplitudes


interquartlicas) de dois conjuntos de dados.
2. Identificar a presena de assimetria
(e o tipo dela se positiva ou negativa).

Se a mediana est mais prxima de Q1,


os dados apresentam assimetria positiva.
Se a mediana est mais prxima de Q3,
os dados apresentam assimetria negativa.
Se a distncia da mediana para os quartis a
mesma, os dados tm distribuio simtrica.

Aplicaes do Box-Plot (cont.)


3. Detectar a presena de outliers:

Exerccio 1.5 - As idades das mulheres


com 40 anos ou mais, em uma localidade,
apresentam Q1 = 49, Md = 54 e Q3 = 63. A
mais velha tem 71 anos. Obtenha o box-plot.

Valores acima de LS so outliers (superiores)


Valores abaixo de LI so outliers (inferiores)

Soluo:

Os outliers costumam ser assinalados com *.

17

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Anlise Bidimensional

Diagrama de Disperso

a anlise estatstica que envolve 2 variveis.


Por exemplo:
1) gasto com alimentao e renda
2) nota em uma prova e horas de estudo
3) vendas e investimento em publicidade
etc.

Um diagrama de disperso um
grfico de pontos {(xi,yi); i = 1,2,...,n}
que indica se parece ou no existir
alguma relao entre 2 variveis X e Y,
e identificar qual o tipo desta relao.
cada ponto desses representa o valor
de X e de Y para a i-sima observao

O diagrama de disperso permite


visualizar uma relao de associao.
Este um dos objetivos da estatstica
descritiva. Todavia, muito importante
saber mensurar a fora desta associao.

Covarincia
A covarincia uma medida da
variabilidade conjunta de X e Y.
Frmula:
n

Para isto, precisamos de medidas-resumo.

Interpretao da Covarincia:
Uma covarincia positiva nos diz que
quando X tende a variar acima de sua mdia
(xi> X), Y tambm tende (yi> Y), e quando
X tende a variar abaixo de sua mdia
(xi< X), Y tambm tende (yi< Y), ou seja:
X e Y variam no mesmo sentido.

XY =

(x
i =1

X )( y i Y )
n

Interpretao da Covarincia (cont.):


Uma covarincia negativa nos diz que
quando X tende a variar acima de sua mdia
(xi> X), Y tende a variar abaixo de sua
mdia (yi< Y), e quando X tende a variar
abaixo de sua mdia (xi< X), Y tende a
variar acima de sua mdia (yi> Y), ou seja:
X e Y variam em sentidos opostos.

18

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 1.14 - Considere 3 alunos cujos


nmeros X de faltas a um curso e notas Y
na prova so dados a seguir:
X

Aluno 1

Aluno 2

Aluno 3

Frmula alternativa para a covarincia:

XY =

x i y i n X Y x i y i
=

i =1

i =1

X Y .

Calcule a covarincia entre faltas e notas.


R: XY = -3.

A covarincia evidencia o sentido da relao


entre as variveis, mas o interesse maior
costuma ser medir a fora desta associao.

No caso de relaes lineares (isto , aquelas


que so bem representadas por uma reta), o
coeficiente de correlao resolve o problema.

Interpretao do
Coeficiente de Correlao:
- Se a relao linear entre X e Y for
positiva e perfeita, a correlao igual a 1.
- Se a relao linear entre X e Y for
negativa e perfeita, a correlao igual a -1.
- Se no houver relao linear: o valor
do coeficiente de correlao zero.

Coeficiente de Correlao
O coeficiente de correlao um
nmero entre -1 e 1, que mede a fora
da associao linear entre X e Y.
Frmula:

XY =

XY
.
XY

Obs - Correlao x Independncia!


importante frisar que a correlao mede
apenas a fora de uma associao linear,
no fornecendo informao acerca de
relaes de dependncia no lineares.
Por exemplo, se Y = X2, XY = 0,
porm as variveis so dependentes.

19

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Se a relao linear entre X e Y for positiva,


mas no perfeita, a correlao est entre 0 e 1.

Se a relao linear entre X e Y for negativa,


mas no perfeita, a correlao est entre -1 e 0.

Neste caso, quanto maior a intensidade da


associao, mais prximo XY est de 1.

Neste caso, quanto maior a intensidade da


associao, mais prximo XY est de -1.

Por exemplo, um coeficiente de correlao


igual a 0,95 indica uma relao linear
positiva e forte entre X e Y.

Por exemplo, um coeficiente de correlao


igual a -0,1 indica uma relao linear
negativa e fraca entre X e Y.

Exemplo 1.14 (cont.) - Ache a correlao


entre notas e faltas. Os desvios padro
so, respectivamente, 2,16 e 1,41.

Resumo das Propriedades do


Coeficiente de Correlao:
1 - varia entre -1 e 1

Resposta:

XY =

XY
3
=
0,98.
X Y 2,16 *1,41

2 - adimensional (no possui unidade)


3 - representa a fora da relao
linear (apenas) entre 2 variveis.

A associao linear entre o nmero de


faltas e a nota negativa ou inversa (o
que seria de se esperar), e bem forte.

Obs - correlao x causalidade.

Covarincia e Correlao Amostrais

Medidas de Associao no Excel

s XY =
isto que a
funo COVAR
do Excel calcula!

(x i x )( yi y)
i =1

rXY =

n 1

s XY
,
s Xs Y

onde sX e sY so os desvios padro amostrais.


(perceba que, numericamente, rXY = XY)

Covarincia (amostral):
COVAR(A1:A8;B1:B8).
Correlao: CORREL(A1:A8;B1:B8).
Importante: na hora de calcular a
covarincia e a correlao entre duas
variveis, no ordene os dados. Isto no
faz o menor sentido e induz uma relao
crescente espria entre as variveis.

20

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

2.
PROBABILIDADE
(CONCEITOS E
LEIS BSICAS)

Os 3 conceitos fundamentais da teoria


da probabilidade so os seguintes:
1 - Experimento Aleatrio
2 - Espao Amostral
3 - Evento.
Cada um deles apresentado
e exemplificado a seguir.
Notas de Aula - Professor Eduardo
Lima Campos.

Experimento Aleatrio
Um experimento aleatrio uma ao
cujo resultado no pode ser previsto.

Embora o resultado de um experimento


aleatrio no possa ser pr-determinado,
possvel descrever o conjunto dos
resultados que podem ocorrer.

Exemplos:
2.1 - Lanar um dado e observar a
face que fica voltada para cima.
2.2 - Selecionar uma bolinha de uma urna com
bolinhas vermelhas e azuis e verificar sua cor.

Espao Amostral
O espao amostral associado a um
experimento aleatrio o conjunto
de todos os seus possveis resultados.

Este conjunto chamado


espao amostral.
Notas de Aula - Professor Eduardo
Lima Campos.

Evento
Um evento um
subconjunto do espao amostral.
No exemplo 2.1, alguns possveis eventos so:

Notao: S.
No exemplo 2.1 S = {1,2,3,4,5,6}.
No exemplo 2.2 S = {azul`,vermelha`}.

A = face par` = {2,4,6};


B = face>3` = {4,5,6};
C = face=2` = {2}.
Notas de Aula - Professor Eduardo
Lima Campos.

21

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Um evento ocorre quando o resultado do


experimento um ponto que pertence a ele.
Exemplos com os eventos do slide anterior:

Unio e Interseo de Eventos

No exemplo 2.1, considere os eventos:

Se a face observada foi o 5,


dizemos que B ocorreu,
Se a face observada foi o 4,
dizemos que A e B ocorreram,

A: Face par` = {2,4,6}


B: Face > 3` = {4,5,6}

e assim por diante...


Notas de Aula - Professor Eduardo
Lima Campos.

O evento A ou B ocorre` dado pela


unio do evento A com o evento B.

Probabilidade Definio

AB = {2,4,5,6}.

O evento A e B ocorrem` dado pela


interseo do evento A com o evento B.

Seja A um evento definido em um espao


amostral S. A probabilidade de A, denotada
por P(A), uma funo que satisfaz a 3
Axiomas, os quais so apresentados a seguir.

AB = {4,6}.
Notas de Aula - Professor Eduardo
Lima Campos.

Propriedades da Probabilidade:

Axiomas da Probabilidade
quanto mais perto de 1, maior a probabilidade de que A ocorra.

1) 0 P(A) 1, p/ todo A definido em S.


2) P(S) = 1.

este um evento
especial, chamado
evento certo.

3) P(AB) = P(A) + P(B), se AB = .


O Axioma 3 pode ser generalizado para mais de 2 eventos. Por exemplo,
P(ABC) = P(A)+P(B)+P(C), se os 3 pares possveis tm intersees vazias.

Eventos Especiais e suas Probabilidades


O espao amostral S o evento
certo, cuja probabilidade 1 (Axioma 2).
O conjunto (vazio) o evento
impossvel, cuja probabilidade 0.
O evento composto de todos os pontos
no favorveis a A chamado evento
complementar de A e denotado por Ac.
Sua probabilidade : P(Ac) = 1-P(A).

22

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Atribuio de Probabilidades
Se os elementos do espao amostral so
todos equiprovveis, a probabilidade de
um evento A obtida da seguinte forma:

#A
P( A ) =
#S

casos favorveis
ao evento A
casos possveis

Exemplo 2.3 - Seja o experimento: lanar 3


moedas e observar as faces voltadas para cima.
Seja: CA` = cara e CO` = coroa.
O espao amostral associado
a este experimento aleatrio :
S = {(CA,CA,CA);(CA,CA,CO);
(CA,CO,CA);(CO,CA,CA);(CA,CO,CO);
(CO,CA,CO);(CO,CO,CA);(CO,CO,CO)},
totalizando #S = 8 casos possveis.

Seja o evento: A = 2 caras`.


Obtenha a probabilidade de A.
Soluo:
A = {(CA,CA,CO);(CA,CO,CA);(CO,CA,CA)}
#A = 3 casos favorveis.

P( A ) =

#A 3
= .
#S 8

Abordagens da Probabilidade
A abordagem anterior para obter
probabilidades chamada clssica.
Existem ainda duas outras formas de
pensar, abordar ou, ainda, interpretar o
conceito de probabilidade, denominadas
abordagens frequentista e subjetivista.
Notas de Aula - Professor Eduardo
Lima Campos.

Abordagem Frequentista:
A probabilidade de um evento A a
frequncia relativa de ocorrncia de A,
quando o experimento aleatrio repetido
muitas vezes (rigorosamente, o limite da
frequncia relativa de A, quando n ).
Abordagem Subjetivista:
A probabilidade de um evento A baseada
em achismo ou na opinio de especialistas.

Lei da Adio
(Probabilidade do OU`)
Sejam A e B dois eventos, com interseo
AB. Qual a probabilidade de AB?
(ou seja, de que A ou B ocorram)
A Lei da Adio fornece a soluo deste
problema, por meio da seguinte frmula:
P(A
B) = P(A) + P(B) - P(A
B)
Notas de Aula - Professor Eduardo
Lima Campos.

23

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 2.4 - Um aluno estuda para um


exame por 2 livros. O primeiro aborda
30% do programa. O segundo, 28%. 24%
do programa abordado pelos dois livros.
Qual a probabilidade de que determinado
tpico do programa esteja em pelo menos
um dos dois livros utilizados pelo aluno?

Soluo: Seja A = tpico estar no


primeiro livro` e B = tpico estar no
segundo livro`. Pede-se P(AB).
So dados no enunciado:
P(A) = 0,30, P(B) = 0,28
e P(AB) = 0,24.
Aplicando a Lei da Adio:
P(AB) = 0,30 + 0,28 0,24 = 0,34.

Notas de Aula - Professor Eduardo


Lima Campos.

Notas de Aula - Professor Eduardo


Lima Campos.

Prova Formal da Lei da Adio:


Leis de DeMorgan
A idia escrever AB e B como unio
de 2 eventos mutuamente exclusivos:
(I) AB = A(BAc).
Note que: A(BAc) = .
(II) B = (AB)(BAc).
Note que: (AB)(BAc) = .
Em seguida, s aplicar o Axioma 3 em
ambas as equaes, e isolar P(BAc).

Eventos Mutuamente Exclusivos


2 eventos A e B so mutuamente
exclusivos (ou disjuntos) se a ocorrncia
de um impede a ocorrncia do outro. Se B
ocorre, ento A no ocorre, e vice-versa.
Em outras palavras, so aqueles que no
possuem pontos em comum, ou seja:
A
B = , o que implica P(A
B) = 0.

AcBc = (A
B)c
AcBc = (A
B)c

Exemplo 2.4 (cont.) - Calcule a


probabilidade de que o contedo no
esteja em nenhum dos dois livros.

Exemplo 2.5 - Considere o


lanamento simultneo de 2 dados.
Verifique se os pares de eventos
a seguir so mutuamente exclusivos:
a) A = soma das faces igual a 7` e
B = soma das faces igual a 11`.
b) A = soma das faces maior
que 8` e B = faces iguais`.

Notas de Aula - Professor Eduardo


Lima Campos.

24

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soluo:

Exemplo 2.6 - Distribuio por sexo dos


funcionrios promovidos em uma empresa:

a) A = {(3,4),(4,3),(2,5),(5,2),(1,6),(6,1)}
e B = {(5,6),(6,5)} e AB = . Portanto:
A e B so mutuamente exclusivos.
b) A ={(3,6),(6,3),(4,5),(5,4),(4,6),(6,4),
(5,6),(6,5),(5,5),(6,6)}, B =
{(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}
e AB = {(5,5),(6,6)}. Portanto:
A e B no so mutuamente exclusivos.

a) Qual a probabilidade de um funcionrio ser


do sexo masculino e ter sido promovido?
Soluo: sejam os eventos: A = ter sido
promovido` e B = ser do sexo masculino`.
Diretamente da tabela, temos que 46
indivduos satisfazem ambas as condies.
Assim: P(AB) = 46/310 = 0,1483.

Promovidos

No-Promovidos

Total

Masc.

46

184

230

Fem.

72

80

Total

54

256

310

Responda as perguntas a seguir.


Notas de Aula - Professor Eduardo
Lima Campos.

b) Qual a probabilidade de um funcionrio


do sexo masculino ter sido promovido?
O que est sendo pedido a
probabilidade (condicional) de A
dado B, denotada por P(A|B).
Obs - Perceba a diferena entre P(A|B) e
P(AB). Esta uma confuso comum!
Notas de Aula - Professor Eduardo
Lima Campos.

A idia que somente os casos favorveis


ao evento condicionante (B = ser do sexo
masculino`) passam a ser os casos possveis.
Promovidos

No-Promovidos

Total

Masc.

46

184

230

Fem.

72

80

Total

54

256

310

Notas de Aula - Professor Eduardo


Lima Campos.

A probabilidade de A dado B
, portanto, 46/230 = 0,2.

Se dividirmos numerador e denominador


acima pelo total de funcionrios (310),
obtemos P(A|B) em funo de P(AB)
e P(B), conforme apresentado a seguir.
Notas de Aula - Professor Eduardo
Lima Campos.

25

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Probabilidade Condicional
Sejam 2 eventos A e B,
tais que P(B)>0.

Exemplo 2.7 - Considere novamente


o exemplo 2.1, e sejam os eventos:
A: Face par` e B: Face > 3`.
a) Calcule P(A|B).

A probabilidade de A dado B :
P(A|B) = P(A
B)/P(B).

R: 2/3.

Notas de Aula - Professor Eduardo


Lima Campos.

Eventos Independentes

Exemplo 2.7 (cont.) - b) A: face par` e


B: face > 3` so eventos independentes?

2 eventos so independentes se a
ocorrncia de um no interfere na
probabilidade de ocorrncia do outro.

R: no, pois P(A|B) P(A).

Ou seja, se:
P(A|B) = P(A).
Notas de Aula - Professor Eduardo
Lima Campos.

Exemplo 2.8 - Em uma classe, os percentuais


de aprovados em lgebra e literatura so,
respectivamente, 75% e 84%. 63% so
aprovados em ambas as disciplinas.
a) Qual a probabilidade de um aluno ter
passado em lgebra ou em literatura?
b) Se um aluno passou em literatura, qual a
probabilidade de ter passado em lgebra?
c) Ter passado em lgebra e ter passado
em literatura so eventos independentes?
Notas de Aula - Professor Eduardo
Lima Campos.

Obs - No confunda eventos


independentes com eventos
mutuamente exclusivos!
Notas de Aula - Professor Eduardo
Lima Campos.

Soluo:
Sejam A = ter passado em lgebra`
e B = ter passado em literatura`.
a) P(AB) = P(A) + P(B) - P(AB)
= 0,75 + 0,84 0,63 = 0,96.
b) P(A|B) = P(AB)/P(B) = 0,75.
c) Sim, pois P(A|B) = P(A) = 0,75.
Notas de Aula - Professor Eduardo
Lima Campos.

26

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 2.9 - Seja uma urna com 8


bolinhas azuis e 4 vermelhas. 2 bolinhas
so selecionadas ao acaso desta urna.
a) Qual a probabilidade de que a primeira
bolinha retirada da urna seja vermelha
e que a segunda seja azul?

Para revolver o problema, basta inverter a


frmula da probabilidade condicional para
obter P(A
B) como funo de P(A|B) e
P(B).
P(A|B) = P(A
B)/P(B).

Seja A = segunda bolinha azul e


B = primeira bolinha vermelha.
Queremos P(AB).

P(A
B) = P(A|B)P(B).

Notas de Aula - Professor Eduardo


Lima Campos.

Notas de Aula - Professor Eduardo


Lima Campos.

Lei da Multiplicao
(Probabilidade do E`)

Soluo do exemplo 2.9, item a:

Sejam A e B dois eventos, com P(B)>0. Qual


a probabilidade de que A e B ocorram?
A Lei da Multiplicao fornece a soluo
deste problema, por meio da frmula a seguir:

A = segunda bolinha azul e B = primeira


bolinha vermelha. Do enunciado, temos
que: P(A|B) = 8/11 e P(B) = 4/12.
Assim:
P(AB) = 8/33.

P(A
B) = P(A|B)P(B)

Notas de Aula - Professor Eduardo


Lima Campos.

Evento A
B no Diagrama de rvore:

Diagrama de rvore:
P(A|B)
P(B)

P(B)
P(Ac|B)
P(A|Bc)

P(Bc)

Bc
P(Ac|Bc)
Notas de Aula - Professor Eduardo
Lima Campos.

Ac

P(Ac|B)

Ac

P(A|Bc)

P(Ac|Bc)

Ac

Ac
P(Bc)

P(A|B)

Bc

Notas de Aula - Professor Eduardo


Lima Campos.

27

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Forma-Produto para Independncia


Vimos que, pela Lei da Multiplicao:
P(A
B) = P(A|B)P(B).
Por outro lado, vimos que 2 eventos A e B
so independentes se: P(A|B) = P(A).
Pode-se concluir que A e B so
independentes se: P(A
B) = P(A)P(B).

Exerccio 2.1 - Sejam 2 eventos A e B


tais que P(A) = 0,3 e P(AB) = 0,5.
Determine o valor de P(B) se:
a) A e B so mutuamente exclusivos.
b) A e B so independentes.
Respostas: a) 0,2. b) 2/7.

Notas de Aula - Professor Eduardo


Lima Campos.

Evento A no Diagrama de rvore


Exemplo 2.9 (cont.)
b) Qual a probabilidade de que a segunda
bolinha selecionada seja azul?

P(B)

P(A|B)

P(Ac|B)

Ac

P(A|Bc)

P(Ac|Bc)

Ac

Considere novamente:
A = segunda bolinha azul e
B = primeira bolinha vermelha.
Notas de Aula - Professor Eduardo
Lima Campos.

Lei da Probabilidade Total


Sejam A e B dois eventos, em que A
possa ocorrer condicionado a B ou a Bc.
A probabilidade total do evento A pode
ser calculada por meio da seguinte frmula:
P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)
Notas de Aula - Professor Eduardo
Lima Campos.

P(Bc)

Bc

Notas de Aula - Professor Eduardo


Lima Campos.

Soluo do exemplo 2.9, item b:


Do enunciado, temos que:
P(A|B) = 8/11, P(B) = 4/12,
P(A|Bc) = 7/11 e P(Bc) = 8/12.
Assim:
P(A) = 2/3.
Notas de Aula - Professor Eduardo
Lima Campos.

28

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 2.10 - A empresa X lana um


servio indito de envio de mensagens
pelo celular. Ela calcula que este novo
servio gera lucro no primeiro ano com
probabilidade 0,6, caso o concorrente
no introduza um servio semelhante.
Caso contrrio, a probabilidade de lucro
0,3. Suponha ainda que exista 50% de
chances de que o concorrente introduza
um servio semelhante naquele ano.

Uma dica aqui comear identificando


os possveis eventos de interesse, e as
probabilidades fornecidas no enunciado:
A: servio lucrativo p/ a empresa X`
B: concorrente introduz servio semelhante`.
So fornecidas no enunciado
as seguintes probabilidades:
P(A|B) = 0,3; P(A|Bc) = 0,6 e P(B) = 0,5.

Soluo:
a) Qual a probabilidade de que o concorrente
introduza o servio e que, mesmo assim, ele
seja lucrativo para a empresa X?
b) Qual a probabilidade de que o servio
seja lucrativo para a empresa X?
c) Qual a probabilidade de que o servio
seja lucrativo para a empresa X ou o
concorrente introduza o servio?

Exerccio 2.2 - Demonstre que,


se A e B so independentes, ento:
a) A e Bc tambm so independentes.
b) Ac e B tambm so independentes.

a) Pela Lei da Multiplicao, temos que:


P(AB) = P(A|B)P(B) = 0,3*0,5 = 0,15.
b) Pela Lei da Probabilidade Total:
P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)
= 0,3*0,5 + 0,6*0,5 = 0,45.
c) Pela Lei da Adio:
P(AB) = P(A) + P(B) P(AB)
= 0,45 + 0,5 0,15 = 0,8.

Soluo: a) Pela Lei da Probabilidade Total:


P(A) = P(AB) + P(ABc), logo: P(ABc)
= P(A) - P(AB). Alm disto, como A e B
so independentes: P(AB) = P(A)P(B).
Assim: P(ABc) = P(A) - P(A)P(B)
= P(A)[1 - P(B)] = P(A)P(Bc), C.Q.D..
b) igual ao item a), invertendo A e B.

c) Ac e Bc tambm so independentes.

c) anloga ao item a), porm escrevendo


a L.P.T. para Ac (ao invs de para A).

29

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 2.11 - 2 mquinas (M1 e M2) so


usadas para fabricar o mesmo tipo de item.
Suponha que:
60% dos itens tenham sido fabricados por M1,
40% dos itens tenham sido fabricados por M2,

Um item selecionado aleatoriamente.

a) Qual a probabilidade de
que ele seja defeituoso?

e que:
1% dos itens fabricados por M1 tm defeito,
2% dos itens fabricados por M2 tm defeito.
Notas de Aula - Professor Eduardo
Lima Campos.

Os eventos de interesse so:


Sejam A = ser defeituoso` e
B = ter sido produzido por M1`.

Notas de Aula - Professor Eduardo


Lima Campos.

Soluo do item a:
Pede-se P(A)

So fornecidas no enunciado
as seguintes probabilidades:

Aplicando a Lei da Probabilidade Total:

P(B) = 0,6, P(Bc) = 0,4,


P(A|B) = 0,01 e P(A|Bc) = 0,02.

P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)


= 0,01*0,6 + 0,02*0,4 = 0,014.

Notas de Aula - Professor Eduardo


Lima Campos.

Notas de Aula - Professor Eduardo


Lima Campos.

Soluo do item b: pede-se P(B|A), que


pode ser obtida da seguinte forma:
b) Se (= dado que) o item selecionado
defeituoso, qual a probabilidade de
que ele tenha sido produzido por M1?

P(B|A) = P(A
B)/P(A)
= P(A|B)P(B)/P(A)
= 0,01*0,6/0,014 = 0,429.
A frmula acima, que permite obter P(B|A) a
partir de P(A|B) chamada Teorema de Bayes.

Notas de Aula - Professor Eduardo


Lima Campos.

Notas de Aula - Professor Eduardo


Lima Campos.

30

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Teorema de Bayes
Sejam A e B eventos definidos em S, sendo
A dependente de B, na sequncia: B A.
O Teorema de Bayes (p/ 2 eventos) se ocupa
da sequncia reversa: A B, fornecendo:

P( B | A ) =

P(A | B)P(B)
.
P(A)

Notas de Aula - Professor Eduardo


Lima Campos.

obtida
pela Lei da
Probabilidade
Total

Exemplo 2.12 - Um candidato que


cursou o MFEE tem probabilidade 0,9
de ser selecionado para uma vaga em
um cargo gerencial. Caso contrrio,
esta probabilidade de apenas 0,3.
70% dos candidatos cursaram o MFEE.
a) Calcule a probabilidade de que um candidato
ao acaso seja selecionado para a vaga.

Os eventos de interesse so:

Soluo do Item a:

A = ser selecionado`
B = ter cursado o MFEE`.

Pede-se P(A).

So fornecidas no enunciado
as seguintes probabilidades:

Aplicando a Lei da Probabilidade Total:

P(A|B) = 0,9, P(A|Bc) = 0,3 e P(B) = 0,7.

P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)


= 0,9*0,7 + 0,3*0,3 = 0,72.

Notas de Aula - Professor Eduardo


Lima Campos.

Exemplo 2.12 (cont.)

Notas de Aula - Professor Eduardo


Lima Campos.

Soluo do Item b:
Pede-se P(B|A)

b) Se um candidato foi selecionado


para a vaga, qual a probabilidade
de que ele tenha cursado o MFEE?

P(B|A) = P(A|B)P(B)/P(A)
= 0,9*0,7/0,72 = 0,875.
O Teorema de Bayes pode ser ampliado
para mais de 2 Eventos, fazendo, por
exemplo: B1, B2 e B3, ao invs de B e Bc.
Notas de Aula - Professor Eduardo
Lima Campos.

31

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Teorema de Bayes para 3 Eventos


Um funcionrio selecionado aleatoriamente.
Exemplo 2.13 - Os funcionrios de uma
empresa dividem-se em 3 grupos: economistas,
engenheiros e analistas de sistemas. Estes
funcionrios podem ocupar cargos tcnicos ou
gerenciais. Sabemos que 20% dos funcionrios
so analistas de sistemas, 30% so engenheiros
e 50% so economistas. 1% dos analistas
de sistemas, 2% dos engenheiros e 3% dos
economistas fazem parte da direo da empresa.

Os eventos de interesse so:


A = ser diretor da empresa
B1 = ser analista
B2 = ser engenheiro
B3 = ser economista.
So fornecidas no enunciado
as seguintes probabilidades:
P(B1) = 0,2, P(B2) = 0,3, P(B3) = 0,5,
P(A|B1) = 0,01, P(A|B2) = 0,02, P(A|B3) = 0,03.

Lei da Adio para 3 Eventos


P(A
B
C) = P(A) + P(B) + P(C) - P(A
B)
- P(A
C) - P(B
C) + P(A
B
C).

Lei da Multiplicao para 3 Eventos


P(A
B
C) = P(A|B
C)P(B|C)P(C).

a) Qual a probabilidade de que ele


seja um dos diretores da empresa?
b) Dado que ele um dos diretores, qual a
probabilidade de que seja engenheiro?

Soluo do Item a - Ampliando a Lei


da Probabilidade Total para 3 eventos:
P(A) = P(A|B1)P(B1) + P(A|B2)P(B2) +
P(A| B3)P(B3) = 0,01*0,2 + 0,02*0,3 +
0,03*0,5 = 0,002 + 0,006 + 0,015 = 0,023.
Soluo do Item b:
P(B2|A) = P(A|B2)P(B2)/P(A)
= 0,02*0,3/0,023 = 0,2609.

Independncia para 3 Eventos


3 eventos A, B e C so
independentes se, e somente se:
P(A
B
C) = P(A)P(B)P(C),
P(A
B) = P(A)P(B),
P(A
C) = P(A)P(C),
e
P(B
C) = P(B)P(C).

32

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Varivel Aleatria (V.A.)


Uma varivel aleatria (v.a.) uma
representao numrica dos resultados
possveis de um experimento aleatrio.

3. VARIVEIS
ALEATRIAS

Exemplo 3.1 - Seja o experimento


do exemplo 2.3 (lanar trs moedas
e observar o nmero de caras). A v.a.
adequada : X = nmero de caras observadas.

S (espao amostral):

Valores de X:

(CO,CO,CO)
(CA,CO,CO)
(CO,CA,CO)
(CO,CO,CA)
(CA,CA,CO)
(CA,CO,CA)
(CO,CA,CA)
(CA,CA,CA)

0
1

Definio formal de v.a.: funo


real definida da seguinte forma:
S R
i | X(i)

2
3

V.A.`s Discretas x Contnuas


A v.a. do exemplo anterior
assume valores contveis.
Este tipo de v.a. chamada discreta.

Isto , a cada ponto i do espao amostral


S, associa-se um nmero real x = X(i).

Distribuio de Probabilidade
Representa como as probabilidades
distribuem-se de acordo com os valores de X.
Notao:
Para a v.a. em si X (maiscula).

Uma v.a. que assuma valores em um


intervalo contnuo chamada contnua.

Para os valores de X x (minscula).

33

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio de
Probabilidade Discreta

Exemplo 3.2 - Na situao do exemplo 3.1,


qual a distribuio de probabilidade de X?

uma funo P(X=x) que associa,


a cada valor possvel x de uma v.a.
discreta X, a sua probabilidade.

Soluo - a distribuio de probabilidade de X :


x

P(X=x)

1/8

3/8

1) P( X = x ) 0, x

3/8

2) P ( X = x ) = 1

1/8

Propriedades de uma distribuio discreta:

Exemplo 3.3 - Seja X = peso de um


carregamento em Kg, com distribuio:

Distribuio de Probabilidade
Contnua (Funo de Densidade)
Uma distribuio contnua f(x)
uma funo que permite calcular
a probabilidade de que uma v.a.
contnua pertena a um intervalo.
P(aXb) a rea sob o grfico de f(x)
que corresponde ao intervalo [a,b].

Propriedades de uma funo de densidade:


1) f(x) 0, para todo x.
2) A rea total sob o grfico igual a 1.

f(x)

O clculo desta rea


envolve uma
8.000
integral:

f ( x )dx

6.000

A figura mostra: P(6.000X8.000).

Exemplo 3.4 - Seja X uma v.a.


contnua com a seguinte distribuio:
f(x) = cx2, 0<x<2.
a) Qual o valor da constante c?
Voc tem que igualar a integral a 1.

3) P(X=x) = 0, para todo x.

b) Calcule P(X>1).
R: a) 3/8 b) 7/8.

34

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Valor Esperado de uma V.A.


O valor esperado de uma v.a. X, E(X),
a mdia dos valores que X assumiria
em infinitas repeties do experimento.

Exemplo 3.5 - Considere a distribuio:


P(X=0) = 1/2
P(X=1) = 1/3
P(X=2) = 1/6.
Calcule o valor esperado de X.

Frmula para o caso discreto:

Soluo:

E (X ) = xP( X = x ).

E(X) = 0*1/2 + 1*1/3 + 2*1/6 = 2/3.

Observaes:
1 - E(X) tambm chamado mdia de X.
2 - E(X) no um valor que se espera que
ocorra, podendo ser (e em geral ) um
valor que no ocorre, como neste caso!
3 - E(X) pode ser interpretado como o
ponto de equilbrio da distribuio, em
que as probabilidades so os pesos.

Exemplo 3.6 - Um investimento de risco


oferece, em um ano, rentabilidade de 10%
com probabilidade 0,4 e rentabilidade de
-4% com probabilidade 0,6.
Qual a rentabilidade esperada ao final do
ano?
O investimento compensa?
Obs - trata-se de um investimento,
de tal forma que imprescindvel
considerar o custo de oportunidade.

Soluo:
O retorno de (- 4)% ocorre com
probabilidade 0,6.
O retorno de 10% ocorre com
probabilidade 0,4.
O retorno esperado : (- 4)*0,6 + 10*0,4
= 1,6%, bem inferior, por exemplo,
rentabilidade anual da poupana.
Portanto, o investimento no compensa.

Frmula do valor esperado


para o caso contnuo:

E(X) = x f ( x )dx.

35

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 3.7 - Calcule E(X),


sendo X a v.a. definida no exemplo 3.4.
f(x)

Exemplo 3.8 (aplicao em finanas): CAPM,


ou Capital Asset Pricing Model (Sharpe, 1964)
Estabelece uma relao entre o prmio de risco
de uma ao e o prmio de risco do mercado:

2
3
E(X) = x x 2 dx =
0 8
4 2

32 3
3x
x dx =

80
8 4

3
= .
2

Moda de uma V.A.


No caso discreto, o valor que ocorre com
maior probabilidade. No caso contnuo,
definida como x tal que f(x) seja mxima.
Mediana de uma V.A.
o valor que divide a distribuio em 2
intervalos com probabilidades iguais (0,5).
No caso contnuo, divide f(x) em 2 reas iguais.

Varincia de uma V.A.

E (X i ) rf = (E (X m ) rf ).
O prmio de risco da ao i a diferena
entre o valor esperado de seu retorno Xi e
o retorno de um investimento sem risco rf.

Exemplo 3.9 - Calcule a mediana


da v.a. definida no exemplo 3.4.
Soluo:

3 2
3k 2
x dx = 0,5 x dx = 0,5
80
08
3
k
= 0,5 k 3 = 4 k = 3 4.
8

A varincia pode ser


calculada da seguinte forma equivalente:
V(X) = E(X2) - E2(X)

A varincia V(X) de uma v.a. X


o valor esperado de [X-E(X)]2.

Sendo:
Exemplo 3.10 - Calcule V(X),
sendo X a v.a. definida no exemplo 3.5.

R : V (X ) = [ x E(X )]2 P(X = x ) = 5 / 9.


x

E (X ) = x P(X = x ), no caso discreto


2

e
E (X 2 ) = x 2 f(x) dx, no caso contnuo.

36

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 3.10 (cont.) - Recalcule V(X),


usando a forma equivalente do slide anterior.

Exemplo 3.11 - Calcule V(X),


sendo X a v.a. definida no exemplo 3.4.
2

f(x)

Soluo:

3
E (X ) = x x 2 dx =
8
0

E(X2) = 02*1/2 + 12*1/3 + 22*1/6 = 1.

32 4
3 x5
12
x
dx
=
= .

80
8 5 0 5

V(X) = E(X2) - E2(X) = 1-(2/3)2 = 1 - 4/9 = 5/9.

12 3
3
V(X) = E(X ) E (X) = = .
5 2
20

Desvio Padro de uma V.A.

Algumas Propriedades Importantes


do Valor Esperado e da Varincia

a raiz quadrada de V(X):

DP (X ) = V( X)
Coeficiente de Variao de uma V.A.

CV( X) =

DP(X)
.
E(X)

Exemplo 3.12 - Seja um produto importado


cujo preo, em dlares, apresenta, ao longo
de um perodo, mdia 80 e desvio padro 8.
a) Se a taxa de cmbio for 2 R$/Dlar,
calcule o valor esperado, a varincia,
o desvio padro e o CV do preo em R$.
b) Se o preo do produto aumenta 10 dlares,
calcule a mdia, a varincia, o desvio padro
e o CV do preo (em dlares), aps o aumento.

(1) Se b uma constante, e Y = b:


E(Y) = b e V(Y) = 0.
(2) Se a uma constante, e Y = aX:
E(Y) = aE(X) e V(Y) = a2V(X).
(3) Se a e b so constantes, e Y = aX + b:
E(Y) = aE(X) + b e V(Y) = a2V(X).

Soluo do item a:
a) Seja X o preo do produto em dlares.
Ento: E(X) = 80, DP(X) = 8 e V(X) = 64.
Seja Y o preo do produto em R$.
Ento: Y = 2X. Logo, E(Y) = 2E(X) =
R$ 160, V(Y) = 22V(X) = 4*64 = 256 R$2,
DP(Y) = R$ 16 e CV(Y) = 16/160 = 0,1 = 10%.

37

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soluo do item b:
b) Seja Z o preo em dlares aps o
aumento. Ento: Z = X + 10.

Padronizando uma V.A.


Seja X uma v.a. tal que E(X) = e
V(X) = 2. Seja Z = (X-
)/
. Ento:
E(Z) = 0 e V(Z) = 1.

Logo, E(Z) = E(X) + 10 = 90 dlares,


V(Z) = V(X) = 64 dlares2, DP(Z) =
8 dlares e CV(Z) = 8/90 = 8,88%.

Demonstrao:
Z pode ser escrito da seguinte forma:
aX+b, sendo a = 1/ e b = -/.

Isto se chama padronizar a v.a. X (ou seja,


transform-la em uma nova v.a., chamada
de Z, que possui mdia zero e varincia 1).

Funo de Distribuio
(Acumulada)

Agora basta usar as propriedades:


E(aX+b) = aE(X) + b e V(aX+b) = a2V(X).

Funo F(x) que associa, a cada valor


x
,
a probabilidade de que X seja
menor ou igual a x, isto : P(X
x).

Assim:
E(Z) = E(X)/ - / = 0 e
V(Z) = (1/)2V(X) = 1, C.Q.D..

Exemplo 3.13 - Ache F(x) para a v.a. do


exemplo 3.5 (relembrando a distribuio:
P(X=0) = 1/2, P(X=1) = 1/3, P(X=2) = 1/6).

Soluo:

Exemplo 3.14 - Considere a distribuio de


probabilidade: f(x) = 2x, 0<x<1. Ache F(x).

Para x < 0, F(x) = 0.

Soluo:

Para 0 x < 1, F(x) = 1/2.

Para x < 0, F(x) = 0.

Para 1 x < 2, F(x) = 1/2 + 1/3 = 5/6.


Para x 2, F(x) = 1/2 + 1/3 + 1/6 = 1.

Para 0 x < 1:
x

F( x ) = P( X x ) = f ( x )dx = 2 xdx = x 2 .

Para x 1, F(x) = 1.

38

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Propriedades de F(x):
1. Lim F( x ) = 0 e Lim F( x ) = 1.
x

2. No caso discreto, F(x) contnua


direita. No caso contnuo, contnua.
3. No caso contnuo, possvel, a partir
da f.d.a., obter a funo de densidade f(x)
original, derivando F(x) com respeito a x:

f (x) =

dF( x )
.
dx

Exemplo 3.15 - Se X uma v.a. c/ mdia


e varincia 2, determine um limite inferior
para a probabilidade de que X esteja entre
-2 e +2 (isto , a 2 desvios da mdia).

Desigualdade de Chebyshev
Seja X uma v.a. c/ valor esperado
E(X) e varincia V(X), ambos finitos.
Ento, para arbitrrio > 0:

P[ X E ( X ) ]

V (X )
ou
2
V(X)
P[ X E ( X ) < ] 1 2 .

Covarincia e Correlao entre 2 V.A.`s


A covarincia entre duas variveis
aleatrias X e Y definida como:

Cov(X, Y) = E[(X E(X))(Y E(Y))],


ou ainda : E(XY) E(X)E(Y).
E o coeficiente de correlao :

R: 0,75.

Corr ( X, Y ) = XY =

Propriedades da Covarincia
(a, b, c e d constantes)

Cov( X, Y )
.
V (X) V (Y )

Exerccio 3.1 - Seja X uma v.a. com mdia 1 e


varincia 4. Sejam ainda: Y = 2X e Z = 3X + 2.
Determine:

P.1) Cov(X,X) = V(X).


P.2) Cov(aX,cY) = acCov(X,Y).
P.3) Cov(aX+b,cY+d) = acCov(X,Y).

a)
b)
c)
d)
e)

Cov(X,Y) R:8.
Cov(X,Z) R: 12.
Cov(Y,Z) R: 24.
Corr(X,Z) R: 1.
Corr(Y,Z) R: 1.

39

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio Uniforme Discreta

4. DISTRIBUIOES
DISCRETAS

a distribuio discreta mais simples


possvel. Considera que todos os valores
de X possuem a mesma probabilidade:

1
P(X = x ) = , x = 1, 2, ..., k.
k
Exemplo 4.1 - No lanamento de um dado,
a v.a. que representa a face voltada para
cima segue distribuio uniforme discreta.

Distribuio de Bernoulli
Experimento de Bernoulli um
experimento aleatrio que possui
apenas dois resultados possveis.
Exemplos:

Um dos resultados chamado


sucesso, e o outro, fracasso.
A probabilidade de sucesso
designada por p.

4.2 - Lanar uma moeda e


observar a face voltada para cima.
4.3 - Observar se um atirador acerta o alvo.

Como consequncia, a
probabilidade de fracasso 1-p.
.

Seja agora uma v.a. X que assume valor


0, se ocorre um fracasso, e 1, se ocorre
um sucesso. A distribuio desta v.a. :

Frmula da Distribuio de Bernoulli:

x
0

P(X=x)
1-p

P(X=x) = px(1-p)1-x, x = 0,1; 0<p<1.

Notao usual: X ~ Bernoulli(p).


A distribuio acima chamada
distribuio de Bernoulli.

o ~ significa
segue distribuio

40

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio Binomial
Sejam agora n realizaes independentes
de experimentos de Bernoulli com a
mesma probabilidade de sucesso p.
Considere que estejamos interessados
no nmero de sucessos observados.

Exemplo 4.4 - Ao lanar 3 moedas, qual


a probabilidade de obtermos 2 caras?
Faamos:
{CA} = sucesso e {CO} = fracasso.

Neste problema, a v.a. X de interesse


representa o nmero de sucessos (caras).

Frmula da Distribuio Binomial:


A distribuio da v.a. que representa o nmero
de sucessos em n realizaes independentes de
experimentos de Bernoulli, todos com mesma
probabilidade de sucesso p, chama-se binomial.

n (nmero de realizaes) e p (probabilidade


de sucesso) so os parmetros da distribuio.

n x
n x
P(X = x) = p (1 p) , x = 0,1,..., n; 0 < p < 1.
x

n!
=
.
x!( n x )!

probabilidade de
obter x sucessos
em n realizaes
independentes

Notao usual: X ~ Bin(n,p).

Soluo do Exemplo 4.4:


A v.a. de interesse : X = nmero de caras.

Exemplo 4.5 - Qual a probabilidade de


que um atirador acerte o alvo 3 vezes em 5
tentativas, se a probabilidade dele acertar
um tiro em uma tentativa qualquer 2/3?

X ~ Bin(3,1/2). Pede-se P(X=2).


2

3 1 1 3
P(X = 2) = = .
2 2 2 8

41

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soluo:

Valor Esperado e Varincia da Binomial:

A v.a. de interesse :
X = nmero de acertos.
Se considerarmos que as tentativas so
independentes, ento: X ~ Bin(5,2/3).

E(X) = np
V(X) = np(1-p)

Da:
5 2
P(X = 3) =
3 3

1
= 0,3292.
3

Exemplo 4.5 (cont.) - Calcule o valor


esperado do nmero de acertos do atirador.

Soluo:
Exemplo 4.6 - Considere um exame com
20 questes de mltipla escolha, cada uma
com 5 alternativas. Se um aluno que no
estudou nada resolve chutar todas as
respostas, qual a probabilidade de que
acerte 30% da prova (isto , 6 questes)?

A v.a. de interesse : X = nmero de acertos.


Logo: X ~ Bin(20;0,2). Da:

20
6
14
P(X = 6) = (0,2) (0,8) = 0,1091.
6
Qual o valor esperado do nmero
de questes que o aluno acerta?

Exemplo 4.7 (importante aplicao em


finanas) - O preo de uma ao a cada
dia uma v.a., com probabilidade 0,4 de
descer R$ 1,00 e probabilidade 0,6 de subir
R$ 1,00. As variaes de preo a cada dia
so independentes, e as probabilidades de
aumento ou queda de preo se mantm
fixas. Se no primeiro dia o preo da ao
R$ 100,00, calcule o valor esperado
do preo da ao no quinto dia.

Soluo:
A trajetria da ao pode ser representada
em uma rvore, chamada rvore binomial.
A v.a. de interesse :
X = nmero de vezes que a ao sobe.
Qual a distribuio de X?

42

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

P(X=x)

0,0256

0,1536

0,3456

0,3456

Por outro lado, se a ao subir todos os


dias (X=4), Y ser igual a R$ 104,00.

0,1296

E nos casos intermedirios?

P(Y=y)

O valor esperado de Y pode ser


calculado de 2 formas.

96

0,0256

98

0,1536

100

0,3456

E ( Y ) = yP( Y = y) = 96 * 0,0256 + 98 * 0,1536 +

102

0,3456

100 * 0,3456 + 102 * 0,3456 + 104 * 0,1296 = 100,8.

104

0,1296

R: o valor esperado do preo (preo esperado)


da ao no quinto dia R$ 100,80.

Seja agora Y uma outra v.a.,


representando o preo final da ao.
Note que, se a ao cair todos os dias
(X=0), Y ser igual a R$ 96,00.

Forma 1 - diretamente da distribuio de Y,


aplicando a definio de valor esperado:

Forma 2 - escrevendo Y como funo de X:

E(aX+b) = aE(X) + b.

Y = 2X+96,

No caso, a = 2, b = 96 e E(X) = np = 2,4.


Assim:

e aplicando a frmula do valor


esperado de aX+b (captulo 3):

E(Y) = 2*2,4+96 = 100,8.

43

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio Hipergeomtrica

Exemplo 4.8 - Considere 4 extraes sem


reposio de bolinhas, de uma urna que
contm 8 bolinhas azuis e 5 vermelhas.

Em princpio, poderamos pensar na


extrao de cada bolinha como um
experimento de Bernoulli, e a v.a. X de
interesse (nmero de bolinhas azuis na
amostra) seguindo distribuio binomial.

Calcule a probabilidade de que 3 sejam azuis.

Pergunta: o que nos impede de fazer isto?

Resposta:

De forma geral, considere uma populao


(no exemplo, urna) com N elementos
(no exemplo, bolinhas), dentre os quais
temos r sucessos (no exemplo, ser azul).

A amostragem sem reposio, o que faz


com que sucessivas extraes sejam
dependentes e as probabilidades de
sucesso mudem a cada extrao.

Seja ento uma amostra de


tamanho n, obtida sem reposio.
Qual a probabilidade de que tenhamos
exatamente x sucessos nesta amostra?

A distribuio da v.a. que representa o


nmero de sucessos na amostra chamase hipergeomtrica, c/ parmetros N, r e n.

Para obter a frmula da distribuio


hipergeomtrica s fazer: P(A) = #A/#S
(casos favorveis sobre casos possveis).

O nmero de casos possveis o nmero


total de amostras de tamanho n que
podemos obter da populao, ou seja:

N
.
n
O nmero de casos favorveis o nmero de
formas de extrair x sucessos dentre os r possveis
e (n-x) fracassos dentre os N-r possveis:

r N r

.
x n x

44

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Frmula da Distribuio Hipergeomtrica:

r N r

x n x

P(X = x) =
.
N

n
probabilidade de que ocorram x sucessos, em
uma amostra sem reposio de tamanho n

Soluo do exemplo 4.8:


Seja X o nmero de bolinhas azuis
na amostra de tamanho 4. Ento:
8 13 8 8 5


3 4 3 3 1

P(X = 3) =
=
= 0,3916.
13
13


4
4

Notao usual: X ~ Hiper(N,r,n).

Exemplo 4.9

Soluo:
Seja X o nmero de peas defeituosas
na amostra de tamanho 5. Ento:

Considere um lote de 10 peas, das quais


4 so defeituosas. Se extrairmos 5 peas,
sem reposio, qual a probabilidade de
que 2 sejam defeituosas?

Exemplo 4.10 - Para tentar passar pela


alfndega, um traficante esconde 5 plulas
de narcticos em um vidro que contm
10 plulas de aspirina. O fiscal fica
desconfiado, e decide tomar uma amostra
de 4 plulas, para inspeo. Qual a
probabilidade do traficante ser preso?

4 6

2 3
P(X = 2) = = 0,4762.
10

5

Soluo: seja X = nmero de plulas


de narcticos na amostra. Que valores X tem
que assumir para que o traficante seja preso?

45

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

O traficante preso se X1. Mas P(X1) =


1-P(X=0), sendo P(X=0) calculada a seguir:
5 10

0 4
P(X = 0) = = 0,1539.
15

4

Valor Esperado e Varincia


da Hipergeomtrica:

r
N
r N n
r
V(X) = n 1

N N N 1
E( X ) = n

Logo: P(X1) = 1 0,1539 = 0,8461.

Aproximao da
Hipergeomtrica pela Binomial
Se N muito maior do que n (N 20n),
a distribuio hipergeomtrica pode ser
aproximada pela distribuio binomial
(cujas probabilidades so mais simples
de calcular), com parmetros n e p = r/N.

Soluo: A probabilidade exata seria


calculada da seguinte forma:
300 700

5 5

P(X = 5) =
.
1000

10
Note que as combinaes envolvidas
so bastante chatas de se calcular...

Exemplo 4.11 - Em uma eleio, suponha


que 300 dos 1000 habitantes de um
municpio so eleitores de um candidato
A. Toma-se uma amostra de 10 eleitores.
Qual a probabilidade de que exatamente 5
deles pretendam votar no candidato A?

A probabilidade aproximada pode ser


calculada utilizando a distribuio
binomial, com n = 10 e p = 300/1000 = 0,3.
10
P(X = 5) (0,3)5 (0,7)5 = 0,1029.
5
Compare com o resultado exato
(calculado no Excel: 0,1026)

46

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio Geomtrica
Considere, como na definio da
Binomial, realizaes independentes
de experimentos de Bernoulli, todos
com mesma probabilidade de sucesso p.
A distribuio da v.a. que representa
o nmero de realizaes necessrias
at que ocorra o primeiro sucesso
chama-se geomtrica, com parmetro p.

Frmula da Distribuio Geomtrica:

P( X = x ) = (1 p) x 1 p, x = 1,2,...; 0 < p < 1.


probabilidade de que o primeiro sucesso
venha a ocorrer na x-sima realizao.

Parmetro: p.
Notao: X ~ Geom(p).

Exemplo 4.12 - A probabilidade de um


indivduo acertar um alvo 2/3. Se ele
deve atirar at que acerte o alvo pela
primeira vez, qual a probabilidade de
que sejam necessrios exatamente 5 tiros?

Valor Esperado e Varincia da Geomtrica:

Soluo: Seja X o nmero de tiros at o


primeiro acerto. Ento: X ~ Geom(2/3).

V(X) = (1-p)/p2

E(X) = 1/p

2 2
P(X = 5) = 1 = 0,0082.
3 3

No exemplo 4.12, qual o nmero de tiros


esperado at que ocorra o primeiro acerto?

Soluo:
Exerccio (Resolvido) 4.1 - Um jogador
converte 10% dos pnaltis que cobra.
a) Qual a probabilidade de que ele acerte
apenas uma cobrana em 5 tentativas?

a) Seja X o nmero de pnaltis


que o jogador acerta. Ento:
X ~ Bin(5;0,1).
Pede-se P(X=1).

b) Qual a probabilidade de que ele precise


bater 5 pnaltis at acertar o primeiro?

5
P(X = 1) = (0,1)1 (0,9) 4 = 0,32805.
1

47

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

b) Seja X o nmero de cobranas at que


o jogador acerte a primeira. Ento:
X ~ Geom(0,1).
Pede-se:

P(X = 5) = (0,9) 4 (0,1) = 0,06561.

Distribuio Binomial Negativa


Considere novamente realizaes
independentes de experimentos de
Bernoulli com probabilidade de sucesso p.
A distribuio da v.a. que representa o nmero
de realizaes necessrias at que ocorra o
r-simo sucesso (r = 1, 2, 3, ...) chama-se
binomial negativa, com parmetros r e p.
Se r = 1, camos na distribuio
geomtrica (caso particular).

Soluo do exemplo 4.13:

Exemplo motivador para a prxima


distribuio a ser apresentada:

Exemplo 4.13 - Na situao do exemplo


4.12, calcule a probabilidade de que o
atirador precise de 4 tiros para acertar pela
segunda vez o alvo (ou seja, de que o
segundo acerto ocorra no quarto tiro).

Frmula da Distribuio Binomial Negativa:


x 1
(1 p) x r p r , x = r, r + 1,...; 0 < p < 1.
P(X = x ) =
r 1
probabilidade de que o r-simo sucesso
venha a ocorrer na x-sima realizao.

Parmetros: r e p.
Notao usual: X ~ BNeg(r,p).

Valor Esperado e Varincia


da Binomial Negativa:

Seja X o nmero de tiros at o segundo acerto.


X ~ BNeg(2,2/3).
2

E(X) = r/p
2

3 2 2
P(X = 4) = 1 = 0,1481.
1 3 3

V(X) = r(1-p)/p2

48

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio de Poisson
Seja a taxa de ocorrncia de um evento
por unidade de tempo ou de espao. Por
exemplo, acidentes/hora em uma estrada.
A distribuio da v.a. que representa
o nmero de ocorrncias de um evento
com taxa , no intervalo correspondente,
chama-se Poisson, com parmetro .

Valor Esperado e Varincia da Poisson:

E(X) =
V(X) =

Frmula da Distribuio de Poisson:

x e
P(X = x ) =
, x = 0,1,...; > 0.
x!
probabilidade de que ocorram x eventos, em um
intervalo no qual ocorrem, em mdia, eventos

Parmetro: .
Notao usual: X ~ Poi().

Exemplo 4.14 - Em determinada rodovia,


ocorrem, em mdia, 3 acidentes por hora.
Supondo distribuio de Poisson,
calcule as seguintes probabilidades:
a) De que ocorram 2 acidentes em uma hora.

A Poisson a nica distribuio na qual


a mdia e a varincia so sempre iguais!

Soluo:
a ) P ( X = 2) =

b) De que ocorram pelo menos 2 acidentes


em 20 minutos (20 minutos = 1/3 de hora).

Aproximao da Binomial pela Poisson

3 2 e 3
= 4,5e 3 .
2!

b) Aqui deve - se converter o para o perodo de


20 minutos (= 1/3 de hora) se ocorrem, em mdia,
3 acidentes em uma hora, ento ocorre em mdia 1 a
cada 20 minutos. Assim, o para 20 minutos 1, e :

Se n for grande e p for pequeno, o


nmero de sucessos em n realizaes
independentes de experimentos de
Bernoulli pode ser aproximado pela
distribuio de Poisson, com = np.

P(X 2) = 1 [P(X = 0) + P(X = 1)] = 1 2e 1.

49

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 4.15 - Uma companhia de


seguros de automveis descobriu que
somente cerca de 0,005% da populao
est includa em um certo tipo de sinistro
cada ano. Se seus 20.000 segurados so
escolhidos ao acaso na populao, qual
a probabilidade aproximada de que 3
clientes venham a ser includos nesta
categoria de sinistro no prximo ano?

Exerccio (Resolvido) 4.1 (cont.)


(combinando contedos dos captulos 2 e 4)
c) Dado que so necessrias mais que
3 tentativas at o primeiro acerto, qual
a probabilidade de que este acerto
ocorra em, no mximo, 5 tentativas?

Soluo:
Um olhar desatento poderia nos levar a
calcular P(X=4) + P(X=5), quando o que
pedido uma probabilidade condicional:

P(X 5 | X > 3),

P(X 5 | X > 3) =

P[(X 5) (X > 3)]


=
P(X > 3)

P(X = 4) + P(X = 5)
=
1 [P(X = 1) + P(X = 2) + P(X = 3)]

sendo X ~ Geom(0,1).
Esta probabilidade
calculada da seguinte forma:

Observaes:
1 - A probabilidade do denominador
no exclui P(X = 0), porque uma v.a.
geomtrica no pode assumir valor 0!
Note que a geomtrica e a binomial
negativa so as nicas distribuies
discretas que no assumem valor 0.

0,1385
= 0,19.
0,729

2 - Esta probabilidade P(X > 3) pode ser


obtida de forma direta pela distribuio
binomial com n = 3 e p = 0,1, j que, se
Y ~ Bin(3;0,1), ento: P(X > 3) = P(Y = 0).
Assim:
P(X > 3) = P(Y = 0) =
3
(0,1)0 (0,9)3 = 0,729.
0

50

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio Uniforme Contnua

5. DISTRIBUIOES
CONTNUAS

Frmula da Uniforme:

a distribuio contnua
mais simples que existe.
Pressupe que as probabilidades estejam
distribudas de maneira uniforme pelo
intervalo de variao de X (de a ).

Clculo de Probabilidades
Utilizando a Uniforme:

f(x) = 1/(-), <x<.


P(aXb) = (b-a)/(
-
)
Parmetros: e .
Notao: X ~ Unif(,).

Valor Esperado e Varincia da Uniforme:

E(X) = (
+
)/2
V(X) = (
-
)2/12

Exemplo 5.1 - As notas de uma turma


apresentam mdia 5 e varincia 3. A
nota mnima para aprovao 7.
Supondo distribuio uniforme, calcule
a probabilidade de um aluno ser aprovado.

R: 1/6.

51

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio Exponencial
Distribuio definida para valores de X
estritamente positivos, usual para
representar tempo (durao, espera, etc.).

Parmetro: .
Notao: X ~ Expo().
Valor Esperado e Varincia:

Frmula da Exponencial:

E(X) = 1/

V(X) = 1/
2

f ( x ) = e , x > 0; > 0.
x

Demonstrao do Valor Esperado:

E(X ) = xe x dx = xe x dx.

e x
e x
E (X ) = x

dx

0 0

= ( xex ) 0 + e x dx

Esta integral deve ser resolvida por partes,


fazendo u = x e dv = e-xdx.
Temos ento que: du = dx e v = -e-x/.

= ( xe

x
1
e
+
= .
0

Assim:

Demonstrao da Varincia:

E(X2)

E(X2)

E2(X).

V(X) =

calculado da seguinte forma:

E (X 2 ) = x 2 e x dx = x 2 e x dx.
Esta integral tambm deve ser resolvida
por partes, mas agora fazendo u = x2 e
dv = e-xdx.

Funo Distribuio
Acumulada da Exponencial:

F(x) = P(X
x) = 0, x
0
-

= 1-e x, x>0.

52

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Demonstrao da F.D.A.:
Para x0, F(x) = P(Xx) = 0.

Exemplo 5.2 - O tempo de espera em


uma fila segue distribuio exponencial.
Se um cliente espera, em mdia, 10 minutos
para ser atendido, qual a probabilidade:
a) De que demore menos do que 12 minutos
para ele ser atendido? R: 1-e-1,2.

Para x>0:
x

F( x ) = P(X x ) = e x dx =
0
x

e x dx =
0

1 e x
= 1 e x .

d) De que ele espere mais do que 10 minutos


(isto , mais do que a mdia E(X))?
R: e-1 0,368.

b) De que demore menos do que 7 minutos


para ele ser atendido? R: 1-e-0,7.
c) E entre 7 e 12 minutos? R: e-0,7-e-1,2.

Exemplo 5.3 - O tempo (em horas) de


durao das lmpadas de uma marca segue
uma distribuio exponencial com = 0,01.
Calcule a mediana do tempo
de durao das lmpadas.
R: 69,31 horas.

O resultado do item d) indica que a mdia da


exponencial sempre maior que a mediana!

Falta de Memria
uma importantssima propriedade
da distribuio exponencial. Ela diz que:

Interpretao: 50% das lmpadas desta


marca duram mais do que 69,31 horas.

Interpretao: se uma lmpada j durou x


horas, a probabilidade dela durar mais s
horas a partir dali a mesma que ela teria
de durar s horas a partir da sua fabricao.
Em outras palavras, no h desgaste.

P(X>x+s|X>x) = P(X>s).
Isto considerado uma crtica ao uso da
exponencial para este tipo de aplicao.

53

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Relao entre a Exponencial e a Poisson


Demonstrao:
P(X>x+s|X>x) =
P[(X>x+s)(X>x)]/P(X>x) =
P(X>x+s)/P(X>x) =
e-(x+s)/e-x = e-s
= P(X>s), C.Q.D.

Exemplo 5.4 - O nmero de navios que


chega a um porto, cujo estaleiro comporta
4 navios, segue distribuio de Poisson.
A cada 24 horas, aportam, em mdia, 12
navios. Com base nestes dados, calcule:
a) A probabilidade de que, no intervalo de
uma hora, nenhum navio venha a aportar.
b) A probabilidade de que o tempo decorrido
entre dois navios seja superior a uma hora.
R: a) e-0,5 b) e-0,5.

Se o nmero X de ocorrncias de um
evento por unidade de tempo segue
distribuio de Poisson com parmetro :
X ~ Poi(),
ento o intervalo de tempo T (medido
na mesma unidade de tempo) entre duas
ocorrncias sucessivas segue distribuio
exponencial com parmetro , ou seja:
T ~ Expo().

Distribuio Normal

1
f (x) =
e
2

( x ) 2
2 2

; x ; , 2 > 0.

Parmetros: (=E(X)) e 2 (=V(X)).


Notao: X ~ N(,2).
O grfico da distribuio Normal apresenta
formato similar ao de um sino (bell shaped).

Distribuio Normal para diferentes valores de :

Clculo de Probabilidades Normais

Distribuio Normal para diferentes valores de :

Exemplo 5.5 - Considere que as


alturas dos alunos desta turma sigam
distribuio Normal, com mdia igual
a 170 cm e desvio padro igual a 5 cm.
Seja o experimento que consiste na
seleo de um aluno qualquer e na
medio de sua altura.

54

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Em princpio, voc calcularia:


A v.a. que representa o resultado
deste experimento X ~ N(170,25).

Qual a probabilidade de que a altura


do aluno esteja entre 170 e 172,3 cm?

Para calcular a probabilidade


solicitada, usaremos a tabela Normal.
A tabela Normal fornece probabilidades
associadas a uma v.a. padronizada, :

Z=

X
,

que possui mdia 0 e varincia 1


(como vimos no captulo 3 do curso).

Usando a Tabela Normal:

altura de um aluno selecionado ao acaso

1 ( x50170)
e
dx
170 5 2

172, 3

P(170 X 172,3) =

Problema:

1
A integral de f ( x ) =
e
2
no possui soluo analtica!

( x ) 2
22

P(170 < X < 172,3) =


170 X 172,3
P
<
<
=

172,3 170
170 170
P
<Z<
=
5
5

= P(0 < Z < 0,46).

P(0 < Z < 0,46) encontrada na tabela.

Resposta final do item a):


A probabilidade de que a altura de
um aluno selecionado ao acaso esteja
entre 170 e 172,3 cm 0,1772.

b) Qual a probabilidade de que a altura


do aluno esteja entre 170 e 175 cm?

55

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Neste caso:

Ilustrando na Tabela Normal:


k

P(170 < X < 175) =


170 X 175
P
<
<
=



175 170
170 170
P
<Z<
=
5
5

= P(0 < Z < 1).

Resposta final do item b): 0,3413.

Ilustrao da Simetria da Normal:

c) Qual a probabilidade de que a altura do


aluno esteja entre 165 e 170 cm?
P(-1 < Z < 0)

P(0 < Z < 1)

Soluo:
P(-1 < Z < 1)

Pela simetria da Normal, temos:


P(-1 < Z < 0) = P(0 < Z < 1) = 0,3413.

Revisitando a figura do captulo 1:


d) Qual a probabilidade de que a altura do
aluno esteja entre 165 e 175 cm?

Soluo: do slide anterior,


P(-1 < Z < 1) = 0,6826.

99,72%

Considerando =
E(X) e = DP(X).

Esta a probabilidade de X estar a no mximo


1 desvio padro de distncia da sua mdia.

56

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

e) Qual a probabilidade de que a altura


do aluno esteja entre 170 e 180 cm?

g) Qual a probabilidade de que a altura do


aluno seja maior do que 170 cm?

Soluo: P(170 < X < 180) =


P(0 < Z < 2) = 0,4772.

Soluo: P(X > 170) = P(Z > 0).


A rea total sob a curva igual a 1.
Logo, a resposta 0,5.

f) E entre 160 e 180 cm?


Soluo: P(160 < X < 180) =
P(-2 < Z < 2) = 2*0,4772 = 0,9544.

i) E menor do que 175 cm?


P(Z < 0)

Soluo: P(X < 175) = P(Z < 1) = 0,5 +


P(0 < Z < 1) = 0,5 + 0,3413 = 0,8413.
j) E menor do que 165 cm?
Soluo: P(X < 165) =
P(Z < -1) = P(Z > 1) = 0,1587.

h) E maior do que 175 cm?

P(Z > 0)

Soluo: P(X > 175) = P(Z > 1) = 0,5 P(0 < Z < 1) = 0,5 - 0,3413 = 0,1587.

Exemplo 5.6 - O VPL de um projeto, em


R$ 1.000,00, segue distribuio N(80,16).
Calcule a probabilidade do VPL ser:
a) maior que 80 e menor que 83 mil.
b) maior que 79 e menor que 82 mil.

Ilustrando na Tabela Normal:

Soluo:
VPL do projeto

a)

P(80 < X < 83) =

80 X 83
P
<
<
=



83 80
80 80
P
<Z<
=
4
4
= P(0 < Z < 0,75).

57

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Resposta do item a) 0,2734.


b)

Ilustrando na Tabela Normal:

P(79 < X < 82) =

79 80 X 82 80
P
<
<
=

4
4
P( 0,25 < Z < 0,5) =
P( 0,25 < Z < 0) + P(0 < Z < 0,5) =
P(0 < Z < 0,25) + P(0 < Z < 0,5).

Resposta do item b):

Por causa da simetria!

0,0987+0,1915 = 0,2902.

Soluo:
Exemplo 5.7 - A rentabilidade de uma
estratgia financeira no mercado futuro,
referente a certo perodo, possui distribuio
Normal, com mdia 5% e desvio padro 3%.

Seja X1 = rentabilidade da estratgia.

P ( X1 < 0) =
X 0
P 1
<
=


05

P Z <
=
3

P(Z < 1,67 ) =


0,0475.

a) Qual a probabilidade da rentabilidade


ser negativa, no perodo considerado?

Soluo:
b) Compare a estratgia do item a)
com outra cuja mdia 6% e cujo desvio
padro 4%. Considere como critrio
de comparao a probabilidade de
perda (rentabilidade negativa).
Considerando este critrio, por
qual das estratgias voc optaria?

Seja X2 = rentabilidade da nova estratgia.


P(X 2 < 0) =
X 0
P 2
<
=


06

P Z <
=
4

P(Z < 1,5) =


0,0668.

Considerando a
probabilidade de
perda, a primeira
estratgia mais
vantajosa.

58

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 5.8 - As notas dos alunos de um


vestibular distribuem-se normalmente, com
mdia 8 e desvio padro 1. Se a relao
candidato/vaga de 40 para 1, calcule a nota
mnima para que o aluno seja aprovado.

Temos que achar na tabela o valor de k


correspondente probabilidade 0,475:
k

Obs - ser necessrio achar *


tal que: P(X > *) = 0,025.
Assim: z0,025 = 1,96.

Buscaremos na tabela o valor k tal que:


P(Z > k) = 0,025, denotado por z0,025.

Exemplo 5.9 - Ache os seguintes percentis


importantes envolvendo a distribuio
Normal, que sero teis em intervalos
de confiana e testes de hipteses:

Resposta do Exemplo 5.8: 9,96.

a) z0,05 = valor de k tal que P(Z > k) = 0,05.


b) z0,005 = valor de k tal que P(Z > k) = 0,005.
c) z0,1 = valor de k tal que P(Z > k) = 0,1.
d) z0,01 = valor de k tal que P(Z > k) = 0,01.

b) z0,005 = valor de k tal que P(Z > k) = 0,005.


(achar na tabela o valor correspondente a 0,495).

a) z0,05 = valor de k tal que P(Z > k) = 0,05


(achar na tabela o valor correspondente a 0,45).

Interpolando: z0,05 = 1,645.

c) z0,1 = valor de k tal que P(Z > k) = 0,1.


(achar na tabela o valor correspondente a 0,4).

Assim: z0,1 = 1,28.

Interpolando: z0,005 = 2,575.

59

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

d) z0,01 = valor de k tal que P(Z > k) = 0,01.


(achar na tabela o valor correspondente a 0,49).

Funo Linear de uma Normal

Se X segue distribuio Normal, ento Y


= aX+b tambm Normal, com E(X) e
V(X) dados pelas propriedades do captulo 3:
E(Y) = aE(X) + b
e V(Y) = a2V(X).

Assim: z0,01 = 2,33.

Frmula:
Distribuio Lognormal
Seja uma v.a. Normal
X ~ N(,2) e seja Y = eX.
A distribuio de Y chamada
lognormal, com parmetros e 2.

Aplicao da lognormal
em economia e finanas:
Pressuposto usual para a distribuio dos
preos de ativos no mercado financeiro.

f ( y) =

1
y 2

1
2 2

(ln y )2

; y > 0, , > 0.

A distribuio lognormal
apresenta assimetria positiva.
Valor Esperado: E ( Y ) = e

2
2

Exemplo 5.10 - As alturas em uma


populao (em cm) seguem distribuio
lognormal com parmetros = 5,11 e 2 =
1. Qual a porcentagem de indivduos desta
populao com altura inferior a 164 cm?

Clculo de probabilidades lognormais:


conduzido usando que, se Y segue
distribuio lognormal com parmetros
e 2, ento X = lnY segue distribuio
Normal com os mesmos parmetros.

Soluo: P(Y<164) = P(lnY<ln164) =


= X ~ N(5,11;1).

X 5,11 ln 164 5,11


P
<
= P(Z < 0,01) = 0,496.
1
1

5,1.

60

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio Qui-Quadrado

Valor Esperado e Varincia:

Frmula:

f (x) =
2

E(X) =
V(X) = 2

x 2 e 2 ; x > 0; > 0.

Relao entre a Qui-Quadrado e a Normal:

Parmetro: (graus de liberdade)

Se Z ~ N(0,1) :
Y = Z 2 ~ 12

Notao: X ~ 2 .

Distribuio Gama
Frmula:
A distribuio qui-quadrado um caso
particular de uma distribuio geral chamada
gama, apresentada a seguir (no cai na prova).

f (x) =

1 x
x e ; x > 0; , > 0,
( )

sen do : () = x 1e x dx = ( 1)!, se Z.
0

Notao: X ~ Gama(,).

A distribuio gama possui dois


casos particulares importantes:

Distribuio Beta
(tambm no cair na prova)
Frmula:

- A distribuio exponencial ( = 1 e = );
- A distribuio qui-quadrado com graus
de liberdade ( = /2 e = 1/2).
Aplicao da Gama em economia e finanas:
modelos de severidade em risco operacional.

( + ) 1
x (1 x )1 ;
()()
0 < x < 1; , > 0.

f (x) =

Notao: X ~ Beta(,).

61

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soma de V.A.`s

6. FUNES
LINEARES DE V.A.`s

Exemplo 6.1 - Um elevador suporta


um peso mximo de 500Kg. Podemos
estar interessados na probabilidade do
peso limite ser ultrapassado quando 7
pessoas entram neste elevador.
Neste caso, a v.a. de interesse :
7

S = Xi ,
i =1

peso da
i-sima pessoa.

e a probabilidade de interesse : P(S>500).

Valor Esperado da Soma de n V.A.`s:

Soma de Normais Independentes


com Mdias e Varincias Iguais

E (S) = E (X i ).
i =1

Varincia da Soma de n
V.A.`s Descorrelacionadas:
n

V(S) = V(Xi ).
i =1

Exemplo 6.1 (cont.)


7

S = X i , e queremos P(S>500).
i =1

peso da i-sima pessoa

Supondo que os pesos das pessoas deste


universo tenham mdia = 70 e varincia
2 = 100, temos que S ~ N(490,700), e:

500 490
)=
700
P( Z > 0,38) = 0,3520.

P(S > 500) = P( Z >

Considere a soma S de n v.a.`s Xi, i =


1,2,...,n, Normais e independentes,
c/ mdias e varincias 2. Ento:

S ~ N(n, n 2 ).
E agora estamos aptos a calcular a
probabilidade de interesse do exemplo 6.1.

Exemplo 6.2 - Uma mquina de caf


calibrada para produzir pacotes com peso
500g. Entretanto, na prtica, os pesos reais
dos pacotes produzidos sero v.a.`s.
Suponha que os pesos dos pacotes produzidos
pela mquina sigam distribuio Normal
com mdia 500 g e varincia 16 g2.
a) Se selecionarmos 100 pacotes (considere
os pesos dos pacotes independentes),
qual a probabilidade de que o peso
total seja maior do que 49,96 Kg?

62

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Mdia de V.A.`s

Soluo:
peso total = soma dos pesos

A mdia de n v.a.`s X1, X2, ..., Xn,


definida da seguinte forma:

S = X i ~ N(n, n ).
2

i =1

49.960 50.000

P(S > 49.960) = P Z >

40

= P(Z > 1) = P(1 < Z < 0) + 0,5 =


P(0 < Z < 1) + 0,5 = 0,8413.

Mdia de Normais Independentes


com Mdias e Varincias Iguais
Considere a mdia X de n v.a.`s Xi,
i = 1,2,...,n, independentes e Normais,
c/ mdias e varincias 2. Ento:

X ~ N(,

2
).
n

X=

Xi
i =1

Note a distino entre a mdia de n variveis


aleatrias e o valor esperado de cada uma delas.

Demonstrao do Valor Esperado de

x:

1 n
1 n
E(X) = E( Xi ) = E( Xi ) =
n i=1
n i=1
1 n
1
E(Xi ) = n = .

n i=1
n

Ou seja, assim como a soma, a mdia de


Normais independentes tambm Normal.

Demonstrao da Varincia de

x:

n
1n
1
V(X) = V( Xi ) = V( Xi ) =
n i=1
n i=1

1 2 2
1 n
V
(
X
)
=
n = .

i
n2
n
n i=1
2

v.a.`s descorrelacionadas

Exemplo 6.2 (cont.) - b) Qual a


probabilidade do peso mdio dos 100
pacotes ser menor do que 500,7 g?
Soluo: peso mdio = X ~ N (, ).
mdia dos pesos.
n
2

500 ,7 500

P ( X < 500 ,7 ) = P Z <


=
0, 4

P (Z < 1,75 ) =
0,5 + P (0 < Z < 1,75 ) =
0,5 + 0, 4599 = 0,9599 .

63

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exerccio 6.1 - Um fabricante de


baterias alega que seu artigo tem uma
vida esperada de 40 meses. Sabe-se que
os tempos de durao tm distribuio
Normal com desvio padro de 8 meses.
Qual a probabilidade de que o tempo
mdio de durao de 64 baterias
selecionadas ao acaso esteja entre 38 e
42 meses, se o fabricante estiver correto?

Teorema Central do Limite (TCL)

Se n suficientemente grande (> 30), a soma


e a mdia de n v.a.`s independentes, com mdias
e varincias finitas (quaisquer que sejam
suas distribuies), seguem distribuio
aproximadamente Normal se n grande.

R: 0,9544.

Exemplo 6.3
Sejam X1, X2, ..., X32 v.a.`s independentes,
com distribuio de Poisson com = 8.
Calcule a probabilidade aproximada de que a
mdia destas 32 variveis seja menor que 9.

Exerccio 6.2 - Uma prateleira suporta


200 Kg. 49 latas so colocadas sobre ela.
O peso das latas uma v.a. com mdia
4 Kg e desvio padro 1 Kg.
Calcule a probabilidade aproximada de
que a prateleira no suporte o peso.

R: 0,9772.

R: 0,2843.

Lei dos Grandes Nmeros

Combinaes Lineares de V.A.`s

A mdia de n v.a.`s independentes,


todas com mesmo valor esperado ,
tende a aproximar-se de quando n cresce.

Uma combinao linear de v.a.`s uma


nova v.a. C definida da seguinte forma:
n

Formalmente :

C = a iXi .
i =1

Lim P X = 0 , > 0.
n

pesos da combinao linear.

64

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Valor esperado e varincia para n = 2


(ou seja, para C = aX+bY):
Valor Esperado:

E(C) = aE(X) + bE(Y).


Varincia (supondo XY = 0):

V (C) = a 2 V ( X ) + b 2 V (Y ).

Casos particulares importantes se X e Y so v.a.`s descorrelacionadas:


E(X+Y) = E(X) + E(Y)

E(L) = 2E(L1) + 3E(L2) = 22 milhes de R$.


V(L) = (2)2V(L1) + (3)2V(L2) = 4*16 + 9*4 =
64 + 36 = 100 DP(L) = 10 milhes de R$.

E se X e Y forem correlacionadas?
Neste caso, a frmula da varincia de uma
combinao linear C = aX + bY torna-se:

V(X+Y) = V(X) + V(Y)


E(X-Y) = E(X) E(Y)

Exemplo 6.4 - O lucro dirio L de uma


corretora (em milhes de R$) L = 2L1+3L2,
em que L1, o lucro da rea industrial,
uma v.a. com mdia 5 e varincia 16, e
L2, o lucro da rea comercial, outra v.a.
com mdia e varincia iguais a 4. L1 e L2
so independentes. O valor esperado, a
varincia e o desvio padro de L so:

ateno!

V(C) = a 2 V( X) + b 2 V( Y) + 2abCov( X, Y).

V(X-Y) = V(X) + V(Y)

Exemplo 6.5 - Sejam X, Y e Z variveis


aleatrias tais que Z = 2Y-3X. Os desvios
padro de X e Y so, respectivamente, 2 e 4.
Determine a varincia de Z, se Cov(X,Y) = 3.

Exemplo 6.6 - Seja X a v.a. que


representa o retorno de uma ao 1, Y a
v.a. que representa o retorno de uma ao
2, e C o retorno de uma carteira composta
pelas aes 1 e 2: C = aX+bY.

Soluo:
V(Z) = (2)2V(Y) + (-3)2V(X)
+ 2*2*(-3)*Cov(X,Y) = 4*16 +
9*4 - 12*3 = 100 36 = 64.

pesos propores do
capital alocadas em cada ao.

65

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Considere uma carteira com 60% do capital


alocado na ao 1 e 40% na ao 2.
A ao 1 possui retorno esperado 3% e
volatilidade (desvio padro) 7%. A ao 2
possui retorno esperado 6% e volatilidade
10%. Os retornos das aes possuem
coeficiente de correlao igual a -0,5.
Calcule o retorno esperado e a
volatilidade desta carteira.

O retorno esperado de C :
E(C) = aE(X) + bE(Y) =
0,6*0,03 + 0,4*0,06 =
0,042 = 4,2%.

A covarincia entre X e Y :
Cov(X,Y) = XYXY =
-0,5*0,07 *0,1 = -0,0035.

A varincia da carteira :
V(C) = a 2 2X + b 2 2Y + 2abCov(X, Y) =

0,36*0,072+0,16*0,12 +

Do ponto de vista de mercado, a


explicao simples: quando uma ao
cai, espera-se que a outra se valorize,
evitando um prejuzo muito grande.

2*0,6*0,4*(-0,0035) = 0,0017.
E o desvio padro (volatilidade):
C = V(C) = 0,041 = 4,1%.

No jargo do mercado, isto se


chama hedge (= proteo).

bem menor do que de ambas as aes!

Sob o ponto de vista estatstico (frmula),


vemos que a reduo proeminente deve-se ao
fato da correlao ser fortemente negativa!

No entanto, um ponto a ser destacado que


a diversificao vantajosa mesmo se
a correlao for positiva, contanto que
no perfeita, como mostrado a seguir.

Comearemos mostrando que, se XY = 1, a


volatilidade da carteira igual combinao
linear das volatilidades das aes:
C = aX + bY.
Demonstrao: note da frmula de V(C), que,
se XY = 1: V(C) = (aX + bY)2. Portanto,
o desvio padro C = aX + bY, c.q.d.
Em particular, se X = Y = : C = .

66

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Da, fcil ver que para qualquer XY < 1 :


C < aX + bY.
Ou seja, para qualquer valor da correlao (<
1), a volatilidade da carteira ser menor que a
combinao linear das volatilidades das aes.
Em particular, se X = Y = : C < .

Carteira de Risco Mnimo


Dadas as volatilidades das aes, X e Y, e
Cov(X,Y) = XYXY, os pesos tais que a
carteira tenha o menor risco possvel so:

a=

2Y Cov( X, Y)
2X + 2Y 2Cov( X, Y)

Concluso:
A diversificao leva a um risco menor do
que o da ao mais voltil e, se as carteiras
apresentam a mesma volatilidade, conduz a
uma reduo desta volatilidade, qualquer que
seja a correlao entre elas (contanto que < 1).
Se XY = -1, possvel formar uma
carteira com risco zero. Todavia, isto
tem pouca aplicao prtica (por que?).

Covarincia Entre Combinaes


Lineares (a, b, c e d constantes):

Cov(aX+bY,cZ+dW) =
Cov(aX,cZ) + Cov(aX,dW)
+ Cov(bY,cZ) + Cov(bY,dW).

b = 1 a.

Exemplo 6.7 - Na situao do


exemplo 6.5, calcule o coeficiente
de correlao entre X e Z = 2Y-3X.

Exerccio 6.3 - Sejam X, Y e Z variveis


aleatrias tais que Z = 2Y-3X. Os desvios
padro de X e Y so, respectivamente, 2 e 4.

Soluo:
Determine a varincia de Z, se Cov(X,Z) = 4.
Cov(X,Z) = Cov(X,2Y-3X) =
Cov(X,2Y) + Cov(X,-3X) =
2Cov(X,Y) - 3Cov(X,X) =
2Cov(X,Y) - 3V(X) = 2*3 3*4 = -6.

R: 4.

Por outro lado, V(X) = 4 e V(Z) = 64, assim:


Corr(X,Z) = -6/(2*8) = -6/16 = -3/8 = -0.375.

67

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Estimao Pontual

7. ESTIMADORES E
SUAS PROPRIEDADES

Exemplo 7.1 - Seja o interesse em obter


alguma informao sobre uma turma grande,
por exemplo, a altura mdia dos alunos.
Alunos da turma = universo em estudo.
Altura = caracterstica de interesse.

Se o universo (= turma) apresenta um


tamanho moderado, este um problema
de estatstica descritiva: o clculo - e no
a estimao - de uma medida de posio.
Porm, em geral, o universo em estudo
muito amplo (imagine uma turma
bem grande), o que pode tornar invivel
observar os valores da caracterstica de
interesse para todas as unidades (= alunos).

Populao
Define-se populao como a
distribuio de probabilidade
considerada adequada para
a caracterstica de interesse.
Uma suposio usual que a caracterstica de
interesse (no caso, a altura dos alunos) siga
distribuio Normal populao Normal.

Neste caso, temos um problema de


inferncia estatstica, em que, a partir de
um subconjunto do universo em estudo,
queremos descobrir algo sobre este universo.

Este algo o parmetro de interesse.

Os slides seguintes formalizam as


definies de populao e parmetro.

Parmetro
Um parmetro uma quantidade fixa
e desconhecida na populao, sobre
a qual queremos obter informao.
No exemplo, o parmetro de interesse a
altura mdia dos alunos, ou seja, a mdia da
distribuio das alturas, que denotamos por .

68

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Se o universo em estudo grande (como


estamos supondo), preciso selecionar
um subconjunto de n unidades (alunos)
e registrar as alturas de cada um deles.

O resultado de cada experimento pode


ser representado por uma varivel aleatria
Xi, que representa a altura do i- simo
aluno selecionado, para i = 1, 2, ..., n.

A seleo de cada aluno, e o registro da


sua altura, um experimento aleatrio.
Temos ento n experimentos aleatrios.

O conjunto de v.a.`s: {X1, X2, ..., Xn}


o que se denomina amostra.

Amostra

Estimador

Amostra um conjunto de v.a.`s: {X1,


X2, ..., Xn} que representam os valores
da caracterstica de interesse para as
n unidades selecionadas do universo.
O caso em que X1, X2, ..., Xn so independentes
define um tipo importante de amostra, chamado
amostra aleatria ou amostra aleatria simples.

Estimador uma estatstica (funo das


v.a.`s da amostra) usada para obter um
valor plausvel para um parmetro.
O estimador natural para :
n

o chapu significa
que estamos
estimando

= X =

X
i =1

mdia da
amostra
ou mdia
amostral

Estimador x Estimativa

Questo importante:

Quando substitumos no estimador os


valores observados de X1, X2, ..., Xn,
obtemos uma estimativa do parmetro.

O que um bom estimador?

Exemplo 7.1 (cont.) - Considere a amostra


observada de tamanho 5: x1 = 174, x2 =
186, x3 = 186, x4 = 180 e x5 = 174 (cm).
5

A estimativa de : x =

xi
i =1

= 180.

Em linhas gerais, aquele que tem alta


probabilidade de gerar uma estimativa
prxima ao parmetro de interesse.

69

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Resultado importante (visto no captulo 6):

Se a populao Normal, a
distribuio de
Normal.

Tecnicamente, a distribuio de um
estimador chamada distribuio amostral.

Estimador No Viciado
Um estimador no viciado (ou no
tendencioso, no viesado) aquele cujo
valor esperado igual ao parmetro.

Distribuio Amostral
A distribuio amostral de um estimador
a sua distribuio de probabilidade.
Ela representa o comportamento dos valores
assumidos pelo estimador em amostras
repetidas isto significa: considerando
todas as amostras de tamanho n possveis.

Um estimador sem vcio aquele que, em


algumas amostras erra para baixo, em outras
erra para cima, mas, em mdia, acerta .
Um estimador viciado errar mais para baixo
(subestimando o parmetro) ou mais para cima
(sobrestimando), a depender da direo do vcio.

Ou seja, um estimador no
viciado para um parmetro se:

E ( ) = .

no viciado

viciado p/ baixo

viciado p/ cima

Resultado importante (visto no captulo 6):

E ( X ) = , e assim X
no viciado para .

Embora a ausncia de vcio seja uma


propriedade importante, ela no garante
que um estimador seja adequado.

:
O vcio (ou tendncia, ou vis) de

B( ) = E ( ) .

A varincia tambm importante, pois


mede a disperso em torno do parmetro.

Do ingls: bias = vcio.

70

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Qual dos estimadores propostos abaixo


melhor para estimar o parmetro ?

Quanto menor a
varincia, maior ser:

distribuio de 1

P( < < + ),

distribuio de 2

para um arbitrrio, > 0.

- +

Estimao de 2

Erro Padro
O desvio padro de um estimador
denominado erro padro (EP).

O candidato natural para estimar a


varincia 2 de uma populao seria:
n

Vimos no captulo 6 que:

V (X ) =

2 e assim:
EP ( X ) =
.
n
n

Isto porque:

E( *2 ) =

* =
2

( n 1) 2
, que diferente de 2 .
n

(X X )
i =1

X nX
i =1

Problema:
o estimador acima viciado.

Estimador No Viciado para 2


n

S2 =

(X i X ) 2
i =1

n 1

X
i =1

2
i

nX 2

n 1

O vcio do estimador :

2
B( ) = E ( ) = .
n
2
*

2
*

Este estimador chamado varincia amostral.


S = S2 chamado desvio padro amostral.

71

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Comparao de Estimadores
Se 2 estimadores so no viciados para
um parmetro, qual deles o melhor?
R: o que tiver menor varincia.
Este estimador dito mais eficiente.

Interpretao:
Se Ef > 1, significa que o
estimador 1 mais eficiente

Eficincia Relativa
Sejam 1 e 2 dois estimadores
no-viciados para um parmetro .
A eficincia relativa do estimador 1
em relao ao 2 dada pela razo entre
as varincias dos estimadores 2 e 1, isto :

V( 2 )
Ef ( 1 , 2 ) =
.
V( 1 )

Exemplo 7.2 - Seja uma AAS de tamanho 3


de uma populao com mdia e varincia
2, e sejam os seguintes estimadores para :

X1 + X 2 + X 3
3
X + X3
e 2 = 1
.
2

1 = X =
Se Ef < 1, significa que o
estimador 2 mais eficiente
Se Ef = 1, os estimadores
so igualmente eficientes.

A razo de varincias s tem utilidade


para comparar estimadores no viciados.
E quando eles so viciados,
ou um deles viciado?

Neste caso, a medida adequada de


eficincia no mais a varincia.

Calcule a eficincia relativa do


estimador 1 em relao ao estimador 2.

Isto porque a varincia mede a incerteza do


estimador em torno do seu valor esperado:

V( ) = E[ E ( )]2 ,
e o que queremos a incerteza em
torno do valor real do parmetro:

E ( ) 2 .
Esta medida chamada erro quadrtico
mdio, em geral abreviado por EQM.

72

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

O EQM pode ser escrito como


funo da varincia e do vcio:

No caso de estimadores viciados, a


eficincia relativa definida como:

EQM ( 2 )
Ef ( 1 , 2 ) =
.
EQM ( 1 )

EQM( ) = V( ) + B 2 ( ).

(Para estimadores no viciados,


o EQM e a varincia so iguais)

Esta frmula serve tanto para estimadores


viciados quanto no viciados (j que, neste
ltimo caso, o EQM igual varincia).

Estimador Eficiente
(= Melhor Estimador No Viciado)

Propriedades Desejveis de um Estimador


em Amostras Finitas (tamanho moderado):

Um estimador chamado eficiente se:

1. Ser no viciado.

1. no viciado
e
2. sua varincia menor do que a de
qualquer outro estimador no viciado.

Propriedades Assintticas (= vlidas para


amostras grandes) Desejveis de um Estimador:

2. Se for no viciado, ter pequena varincia


ou erro padro. Melhor ainda, ser eficiente.
3. Se for viciado, que tenha EQM pequeno.

Estimador Consistente

Um estimador dito consistente se


satisfaz a uma das seguintes condies:

1. Ser assintoticamente no viciado (isto


, seu vcio tender a zero quando n ).
2. Ser consistente.
A consistncia a mais importante de todas
as propriedades, e ser detalhada a seguir.

1) no viciado e:

Lim V( ) = 0.
n

assintoticamente
no viciado.

ou 2) viciado, mas:

Lim
B( ) = 0 e Lim
V( ) = 0.
n
n

73

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Estimao de uma Proporo


Aplicaes:
1- Estimao da proporo p de eleitores que
pretendem votar em certo candidato;
2 - Estimao da proporo p de itens
defeituosos, em controle de qualidade;
3 - Estimao da proporo p de usurios de
celular que desenvolvem cncer cerebral.

Clculo do Valor Esperado de p:

1 n
1 n
Xi ) = E( Xi ) =

n i=1
n i=1
n
n
1
1
1
E(Xi ) = p = np = p.

n i=1
n i=1
n

E(p) = E(

Propriedades de p :
1. um estimador no viciado para p.
2. um estimador consistente para p
(consequncia da aplicao da L.G.N.).
3. Tem distribuio amostral
assintoticamente Normal (T.C.L.).

Estimador para p:
Seja C o conjunto de unidades, dentre i = 1,
2, ..., n, que contm o atributo de interesse.
Seja: Xi = 0, se a unidade iC
Seja: Xi = 1, se a unidade iC
n

frequncia
relativa ou
proporo
amostral

Xi

p = i =1
n

= X.

Clculo da Varincia de p (sob AAS):

V(p) = V(

2 n

n
1 n
1
1
Xi ) = V(Xi ) =

n i=1
n
n
i =1

1

n

2 n

p(1 p) = n
i =1

np(1 p) =

V(X ) =
i =1

p(1 p)
.
n

Distribuio Amostral de p :

p(1 p)
p N p,
.
n

aproximada para n grande.


Padronizando: Z =

p p
N (0,1).
p(1 p)
n

74

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Nada foi dito at agora sobre como obter


bons estimadores para um parmetro. Isto diz
respeito aos chamados mtodos de estimao.

8. MTODOS
DE ESTIMAO

Estudaremos a seguir o mtodo da mxima


verossimilhana e o mtodo dos momentos.
Um terceiro mtodo, chamado mnimos
quadrados, ser estudado em econometria.

Mtodo da Mxima Verossimilhana

Seja uma AAS observada {x1,x2,...,xn} de uma


populao com parmetro desconhecido .
O estimador de mxima verossimilhana
aquele que conduz ao valor de que tornaria
mxima a probabilidade de obter essa amostra.

Se fosse um problema de probabilidade,


voc calcularia P(X=2) para um dado valor
de (usando a frmula do slide anterior).

Mas o problema aqui inverso:


temos x (amostra), no caso: x = 2, e
queremos saber qual o valor de .

Exemplo 8.1 - Seja X1 uma AAS de


tamanho 1 de uma populao Poisson, cujo
parmetro . A amostra observada foi x = 2.
Ache o EMV de .
Soluo - se X ~ Poisson():

xe
P(X = x ) =
; x = 0,1,2,...; > 0.
x!

A probabilidade de que a amostra


fornecida no enunciado ocorra :

P(X = 2) =

2e
.
2!

Perceba que esta probabilidade


uma funo de , e no de x!

75

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

P(X = 2) como funo de :

Funo de Verossimilhana
P(X=x), encarada como funo de ,
chamada funo de verossimilhana.

0,3
0,25
0,2

O nome original em ingls likelihood


function, da a notao usual: L().

0,15
0,1
0,05

14,5

13,9

13,2

12

12,6

11,4

10,7

10,1

9,46

8,2

8,83

7,57

6,94

6,31

5,68

5,05

4,42

3,79

3,16

1,9

2,53

1,27

0,64

0,01

A idia do mtodo a ser apresentado


buscar o valor de que maximiza L().

Resolvendo o problema graficamente:


E no caso de uma AAS de tamanho n>1?
0,3

mximo da funo

0,25
0,2

A idia a mesma, s que agora a funo de


verossimilhana a distribuio conjunta das
v.a.`s da amostra, encarada como funo de .

0,15

ponto de mximo

0,1
0,05

14,5

13,9

13,2

12,6

12

11,4

10,7

10,1

9,46

8,83

8,2

7,57

6,94

6,31

5,68

5,05

4,42

3,79

3,16

2,53

1,9

1,27

0,64

0,01

Funo de Verossimilhana (caso discreto)

Exemplo 8.1 (cont.) no caso de uma AAS


de tamanho n de uma populao Poisson():
n

O produto pelo fato de ser uma


AAS (v.a.s independentes!)
n

P(X1 = x1 , X2 = x 2 ,...,Xn = x n ) = P(Xi = xi ),


(x1,x2,...,xn).

i =1

L()

L ( ) =

xi
i=1 e n
n

x !

i =1

Esta funo deve ser


maximizada em relao a .

76

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Funo de Log-Verossimilhana
l() = ln[L()] chamada
funo de log-verossimilhana.
O valor de que maximiza l()
o mesmo que maximiza L().

Exemplo 8.1 (cont.) - funo de


log-verossimilhana para a Poisson:

n xi


n
i=1
e n
l() = ln n
= x ln n + c

i =1 i
x i!
i =1

Nos casos prticos, bem mais fcil derivar


(e, portanto, maximizar) l() do que L().

Maximizando a Funo
de Log-Verossimilhana:

Exemplo 8.1 (cont.) - A derivada da funo


de log-verossimilhana encontrada :

O ponto de mximo de l()


o valor de tal que:
l`() = 0 e l``() < 0.
Um facilitador: em geral, l()
cncava, o que garante que: l``() < 0,
. Portanto, basta resolver: l`() = 0.

Assim, temos que


xi
resolver a equao: l`() = i =1 n = 0,

l`() =

xi

i =1

Logo, o estimador de mxima


verossimilhana (EMV) :

MV = X.

cuja soluo : =

xi
i =1

= x.

77

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Caso Contnuo:

Mtodo da Mxima Verossimilhana:


1. Escrever a funo de verossimilhana
2. Escrever a funo de log-verossimilhana
3. Derivar a funo de log-verossimilhana
4. Igualar a derivada do passo 3 a zero, e
resolver para o parmetro de interesse
5. Aplicar a funo encontrada em (4)
{X1,X2,...,Xn}, obtendo assim o EMV.

E se a populao de interesse for contnua


(p.ex., exponencial com parmetro )?

A idia a mesma, s que agora a funo de


verossimilhana passa a ser a distribuio
conjunta de n variveis aleatrias contnuas.

Funo de Verossimilhana (caso contnuo)


Por analogia com o caso discreto:

Exemplo 8.2 - Seja uma AAS


de tamanho n de uma populao
exponencial com parmetro .

f (x1 , x 2 ,..., x n ) = f (x i ),
i =1

(x1,x2,...,xn).

Obtenha o EMV de .

L(), caso
contnuo

Soluo:

A funo de log-verossimilhana :

A funo de densidade : f(x) = e-x, x>0.

x i
x i
n i=1

n
l() = ln e
= ln + ln e i=1 =

A funo de verossimilhana :
i=1

e
i=1

x i

=e
n

xi
i=1

( )

n ln() xi .
n

i =1

L() = f (x i ) =

Derivando e igualando a zero :


l`( ) =

n n
n
1
xi = 0 = n
= .
i
=
1

xi x
i =1

78

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exerccio 8.1 - Seja uma AAS de tamanho


n de uma populao Bernoulli(p).

Logo, o EMV :

Obtenha o EMV de p.

1
MV = .
X

R:

p MV = X.

Soluo Resumida do Exerccio 8.1:


n
xi
i=1

L(p) = pxi (1 p)1xi = p

n
(1xi )
i=1

(1- p)

Exemplo 8.3 - Seja uma AAS de


tamanho n de uma populao N(,2).
=

i=1

n
xi
i=1

n
n xi
i=1

Obtenha os EMV`s de e 2.

l(p) = x i ln(p) + n xi ln(1- p).


i=1
i=1
n
n
n
n

xi n xi
xi np
xi

=
i
1
l`(p) = i=1 +
(1) = i=1
= 0 p = i=1 .
p
(1 p)
p(1 p)
n
p

(1- p)

Soluo:

A idia aqui derivar a funo de logverossimilhana em relao a e = 2


(que so os parmetros a serem estimados).

A funo de verossimilhana :
n

L(, = 2 ) = f (x i ) =
i=1

(2) e
i =1

( x ) 2
i
2

n
2

=(2) e

i=1

( x i ) 2
2

79

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Derivando em relao :

A funo de log-verossimilhana :

(x i )
l(, )
.
= i=1

n ( xi )

2
i=1
l(, ) = ln (2) e
=

Igualando a zero:

(xi )
n
ln(2) i=1
.
2
2
2

Derivando em relao :
n

(xi )

l(, )
n
= + i=1

2
22

(x
i =1

) = 0 = x MV = X.

Assim, os EMV`s de e 2 da Normal so:

Igualando a zero e substituindo por x :

MV = X.
n

2MV =

(X
i =1

i =1

X) 2
.

(x x)

Propriedades Estatsticas dos EMV


1) No so necessariamente no viciados, mas
so assintoticamente no viciados e consistentes.
2) So assintoticamente eficientes.
3) Seguem distribuio aproximadamente
Normal, para grandes amostras
(isto , so assintoticamente Normais).

Obs - note que o EMV de 2 viciado.

EMV para os casos mais importantes:


Bernoulli : p MV = X.
Poisson : = X.
MV

1
.
X
1
= .
X

exp onencial : MV =
geomtrica : p MV

Normal : MV = X e

2
MV

(X i X )

i =1

80

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Princpio da Invarincia do EMV


Se o EMV de , ento o EMV de
uma funo g() simplesmente g ( ).
Exemplo 8.4 - O EMV de q = (1-p) da
distribuio de Bernoulli, usando o P.I., :

Exemplo 8.5 - Considere que queiramos


estimar a probabilidade de uma mulher
no ter filhos, em uma populao Poisson.
Ache o EMV desta probabilidade,
baseado em uma AAS de tamanho n.

R : PMV ( X = 0) = e MV = e X .

q MV = 1 p MV = 1 X.

Exerccio 8.2 - Considere uma AAS de


tamanho n de uma populao referenciada
pela distribuio: f(x) = x-1, 0<x<1, >0.

Soluo Resumida do Exerccio 8.2:


n

L() = x i1 = n x i 1.
i=1

Obtenha o EMV de .

i=1

l() = nln() + ( 1)ln(x i ).


i=1

R : MV =

n
n

ln(X i )

l`() =

n
+ ln(x i ) = 0 =
i=1

i =1

n
n

ln(x )
i=1

O que so momentos ?
Mtodo dos Momentos
Momentos populacionais:
E(X), E(X2), ..., E(Xk).
Vantagem: bem mais simples do que
o mtodo da mxima verossimilhana
e, na maior parte dos casos prticos
de interesse, leva ao mesmo resultado.

Momentos amostrais:
n

Xi
i =1

X i2
,

i =1

X ik
,...,

i =1

81

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Mtodo dos Momentos para


Distribuies com 1 Parmetro
No caso de distribuies com apenas
1 parmetro (ex., Poisson, exponencial,
Bernoulli, geomtrica), o estimador de
momentos obtido igualando o primeiro
momento populacional ao primeiro
momento amostral - ou seja:

E(X) = X.

Mtodo dos Momentos para


Distribuies com 2 Parmetros

No caso de populaes com 2 parmetros


(ex.: Normal), o estimador de momentos
obtido igualando os 2 primeiros momentos
populacionais - E(X) e E(X2) - aos
respectivos momentos amostrais.

Dica para a soluo do exerccio 8.3:


Para obter o estimador da varincia, voc
precisar usar que E(X2) = V(X) + E2(X), e:
n

+X =
2

i =1

2
i

2
i

i =1

nX 2

i =1

2MM =

(X

X2

MM

1
exponencial : MM = .
X
1
geomtrica : p MM = .
X

Exerccio 8.3 - Seja uma AAS de


tamanho n de uma populao N(,2).
Obtenha os estimadores de
momentos de e 2.
n

R : MM = X e 2MM =

(X i X ) 2
i =1

Exerccio 8.4 - Seja uma AAS de tamanho


n de uma populao referenciada pela
distribuio: f(x) = x-1, 0<x<1, >0.

R : MM =

X
.
1 X

Obs passo intermedirio :

X)2

i =1

Bernoulli : p MM = X.
Poisson :
= X.

Obtenha o estimador de momentos de .

2
i

Estimadores de momentos para os casos


mais importantes envolvendo 1 parmetro:

verificar que E(X) =

.
+1

82

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Motivao

9. INTERVALOS
DE CONFIANA
(PARTE 1 - CONCEITOS BSICOS,
ICS P/ MDIA E PROPORO,
TAMANHO DE UMA AMOSTRA)

R: No.
Pode (e deve) haver um
erro de estimao:

x .
Este erro devido ao fato de no estarmos
observando todo o universo em estudo, e
sim apenas um subconjunto deste universo.

Intervalo de Confiana
Um intervalo de confiana (IC) um
intervalo numrico, construdo a partir
da estimativa pontual, no qual podemos
confiar que o parmetro esteja contido.
o quanto confiamos determinado por uma
quantidade denominada grau de confiana

Considere o problema da estimao


pontual da mdia de uma populao.
O que a estimativa de permite
concluir acerca do valor real de ?
Podemos afirmar que
igual sua estimativa?

Ento, podemos afirmar que a estimativa


obtida est prxima ao valor de ?

R: Em princpio, sim. Isto o mnimo


que se espera de um estimador adequado.

A questo : quo prxima?

Grau de Confiana x Probabilidade


No correto dizer que a probabilidade de
que pertena ao intervalo calculado
0,95, mas sim que temos 95% de confiana
de que pertena ao intervalo calculado.
A distino acima muito importante, e
ficar clara no decorrer da exposio.

83

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Construo de um IC para
Para explicar como construir um IC,
partiremos do conceito de margem de erro,
considerando uma probabilidade de 0,95.
Na estimao da mdia de uma populao
Normal, a margem de erro o valor tal que:

P( < X < + ) = 0,95.

O que nos diz esta probabilidade?

Note agora que:

P( < X < + ) = 0,95


pode ser reescrita realocando no centro:

P( X < < X + ) = 0,95.

Nos diz que, se considerarmos todas as


amostras de tamanho n possveis e para
cada uma delas calcularmos o intervalo:
estimativa

[ x ; x + ],
estar contido em 95% deles.

Suponha agora que, com base em uma nica


amostra observada (que, notem, s o que
temos na prtica) seja calculado o intervalo:

[ x ; x + ].
Pergunta: est correto afirmar que:

P( x < < x + ) = 0,95 ?

Resposta: no! Embora tenhamos visto que:

P( X < < X + ) = 0,95,

(I)

completamente errado afirmar que:

P( x < < x + ) = 0,95.

(II)

Justificativa: no h nenhuma v.a. em (II),


somente nmeros, e assim no podemos
falar em probabilidade, como em (I).

84

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

O intervalo numrico calculado


a partir da amostra observada:

Significado de Confiana

[ x ; x + ]

1 - Sabemos que, se calculssemos o IC


[ x ; x + ] para todas as amostras de
tamanho n possveis, o parmetro
estaria em 95% dos intervalos calculados.

o que chamamos de IC (de 95%) para .


95% o grau de confiana deste IC.

3 - Esta amostra pode ser uma das 95%


cujo IC contm o valor de .
4 - Esta amostra tambm pode ser uma das
5% cujo IC no contm o valor de .

2 - Na prtica, temos apenas uma amostra


(aquela que selecionamos pra observar).

5 - Nada mais razovel do que confiarmos


que nossa amostra seja uma daquelas 95%
cujo IC contm .

O grau com que confiamos o


grau de confiana, no caso 95%.

No que voc confiaria mais: 3 ou 4?

Como escolher o grau de confiana?


Os graus de confiana usuais so:
90%, 95% e 99%.

Relao entre o grau de confiana


e o tamanho do IC:
quanto maior o grau de confiana
escolhido, mais amplo ser o IC.
.

Um IC de 99% bastante confivel, mas


em compensao, pode ser amplo demais,
caso em que no teria utilidade prtica.
Um IC de 90% ser bem mais estreito,
mas em compensao estamos expostos a
um percentual de erro elevado (1 em 10).
O grau de 95% um bom trade-off entre
as duas situaes acima sendo, por esta
razo, adotado com bastante frequncia.

85

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

De forma genrica, representaremos o grau


de confiana como 100(1-)%, sendo que:
= 0,1 corresponde ao grau de confiana 90%.
= 0,05 corresponde ao grau 95%.
= 0,01 corresponde ao grau 99%.
Este possui uma interpretao especfica,
que est relacionada com testes de hipteses,
assunto que ser estudado mais adiante.

P( < X < + ) = (1 )
( + )
( )
P
<Z<
= (1 )
/ n
/ n


P
<Z<
= (1 )
/ n
/ n

.
= z = z
n
/ n
2
2
k tal que p(Z>k) = /2, sendo Z ~ N(0,1).
No caso mais comum, = 0,05 e k = 1,96.
Estimadores e suas Propriedades Prof. Eduardo Lima Campos.

Valores Importantes da Normal:


Para o IC de 95% ( = 0,05) z0,025 = 1,96.
Para o IC de 90% ( = 0,1) z0,05 = 1,645.
Para o IC de 99% ( = 0,01) z0,005 = 2,575.
O procedimento para achar cada um
destes valores foi visto no captulo 5.

Clculo de
Para obter o IC, necessrio calcular .
No caso da estimao da mdia de
uma Normal, podemos usar o resultado:
X ~ N(,

2
X
)Z=
~ N(0,1).

n
n

Assim:

IC p/ a Mdia de uma Populao Normal


(considerando conhecido)

IC100(1 )% () = x z
; x + z
.
n
n
2
2

grau de confiana do IC
(90, 95 ou 99 %).

Esta quantidade a margem de erro , que


representa o erro mximo que pode estar sendo
cometido, com grau de confiana 100(1-)%.

Exemplo 9.1 - Na situao do exemplo


7.1, considere que o desvio padro das
alturas de toda a turma (populacional)
seja = 6. A altura mdia na amostra, j
calculada, foi 180. Determine o IC95%().
Soluo:
Para um grau de confiana de 95%, o valor
da Normal a ser usado z = z 0, 025 = 1,96.
2

86

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Substituindo na frmula do IC, temos:

Interpretao Errada

6
6

IC95% () = 180 1,96


;180 + 1,96

5
5

A probabilidade de que , a altura mdia


de todos os alunos da turma, esteja entre
174,74 e 185,26 igual a 0,95.

= [174,74;185,26].

Qual a interpretao deste IC?

Interpretao Correta
Temos 95% de confiana de que
esteja no intervalo [174,74;185,26].

Isto est relacionado com a


interpretao em amostras repetidas.

no v.a., e sim uma constante, cujo


valor no conhecemos. Ou est ou no
est no intervalo calculado (no faz
sentido atribuir probabilidades a isto!).

Interpretao em Amostras Repetidas


Se selecionssemos todas as amostras de
tamanho 5 possveis da populao, e para
cada uma delas calculssemos o IC:

IC95% () = x 1,96 ; x + 1,96 ,


5
5

estaria em 95% dos intervalos.

Soluo: substituir por seu estimador S.

Problema: na prtica no conhecido,


portanto no h como calcular este intervalo.

Problema: quando desconhecido


e utilizamos S no lugar de em:

X
,
/ n
a distribuio no mais
N(0,1), e sim t de Student.

87

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Distribuio t de Student

Grfico da Distribuio t de Student:

- Distribuio contnua proposta por William


Gosset, funcionrio da cervejaria Guiness,
sob o pseudnimo de Student (estudante).
- Assim como a distribuio Normal,
a distribuio t possui mdia zero,
simtrica e possui forma de sino.

- Conforme aumenta, o comportamento


da distribuio t aproxima-se do da Normal.
- No caso do IC para a mdia, = n-1, o que
justifica aproximaes pela Normal quando
o tamanho da amostra n grande (>30).
- A distribuio tambm t tabelada, mas
a tabela t diferente da tabela Normal.

Exemplo 9.2 No exemplo 9.1, considere


agora que desconhecido, estimado a
partir da amostra: x1 = 174, x2 = 186, x3 =
186, x4 = 180 e x5 = 174 cm. Ache o IC95%().

Parmetro: = nmero de graus de liberdade.

IC p/ a Mdia de uma Populao Normal


(considerando desconhecido e estimado)

s
s
IC100(1 )% () = x t
;x + t
.
n 1;
n 1;
n
n

2
2
grau de confiana do
IC (90, 95 ou 99 %).

n1;

T uma v.a. com distribuio


t de Student com n-1 g.l..

o valor k tal que: P(T>k) = /2.

Consultando a Tabela t:

t 4;0, 025 = 2,776.

Soluo - obtendo a estimativa de


a partir da amostra observada:
n

s2 =

(x i x) 2

=
n 1
2
(174 180) + (186 180) + (186 180) + (180 180) 2 + (174 180) 2
4
= 36 s = 36 = 6.
2

i =1

88

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Substituindo na frmula do IC, temos:


6
6

IC95% () = 180 2,776


;180 + 2,776

5
5

Exemplo 9.3 - Foi tomada uma amostra


de 25 trabalhadores de uma fbrica.
Esta amostra forneceu salrio mdio de
R$ 400,00 e desvio padro R$ 450,00.

= [172,55;187,45].

Interpretao: temos 95% de confiana


de que esteja no intervalo acima.

Considerando a populao Normal,


obtenha o IC de 90% p/ o salrio mdio
dos trabalhadores da fbrica. Interprete.

Soluo:
Consultando a Tabela t:

x = 400; s = 450.
O valor na tabela t t 24;0,05 = 1,711.
O IC solicitado :
450
450

IC 90% () = 400 1,711


;400 + 1,711
=
25
25

[ 246,01;553,99].
Interpretao: com 90% de confiana, o salrio mdio de
todos os trabalhadores da fbrica encontra-se neste intervalo.

Exemplo 9.4 - Suponha que a vida


til de uma marca de tv`s de LED seja
normalmente distribuda. A partir de
uma amostra de 16 tv`s, estimou-se
uma vida til mdia de 8.900 horas, e
um desvio padro igual a 500 horas.

Consultando a Tabela t:

Construa IC`s de 95% e 99% para o


tempo mdio de vida til das tv desta
marca. Interprete estes intervalos.

89

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soluo (95%):

Soluo (99%):

x = 8.900; s = 500.
O valor na tabela t 15;0,025 = 2,131.

O que muda s o valor na tabela t,


que agora : t 15;0,005 = 2,947.

O IC de 95% :

O IC de 99% :

500
500

IC95% () = 8.900 2,131


;8.900 + 2,131
=
16
16

[8.633,6;9.166,4].

500
500

IC99% () = 8.900 2,947


;8.900 + 2,947
=
16
16

[8.531,6;9.268,4].

Interpretao: com 95% de confiana, a vida til mdia desta


marca de tubos de imagem encontra-se neste intervalo.

O intervalo aumentou, como tinha que ser!

Erro conceitual comum:

Outro erro conceitual comum:

Temos 95% de confiana de que a


estimativa esteja no intervalo.

A probabilidade de que o parmetro


esteja no intervalo 0,95.

O que est errado?

O que est errado?

Exemplo 9.5 - Os ndices de endividamento


de empresas de um certo setor da economia
seguem distribuio Normal.

Consultando a Tabela t para 99%:

t 8; 0 , 005 = 3,355.

A mdia de uma amostra de tamanho 9 foi


52 e o desvio padro foi 30. Calcule os
ICs de 90, 95 e 99% para o ndice de
endividamento mdio das empresas do setor.

90

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soluo (99%):
x = 52, s = 30.
O valor na tabela t 8;0,005 = 3,355.

Consultando a Tabela t para 95%:

t 8; 0 , 025 = 2,306.

O IC de 99% :
30
30

IC99% () = 52 3,355
;52 + 3,355
=
9
9

[18,5;85,5].
Interpretao: com 99% de confiana, o ndice mdio de
endividamento das empresas deste setor est entre 18,5 e 85,5.

Soluo (95%):
Consultando a Tabela t para 90%:
O valor na tabela t 8;0,025 = 2,306.

t 8; 0 , 05 = 1,86.

O IC de 95% :
30
30

IC95% () = 52 2,306
;52 + 2,306
=
9
9

[28,9;75,1].
Interpretao: com 95% de confiana, o ndice mdio de
endividamento das empresas deste setor est entre 28,9 e 75,1.

Soluo (90%):

O valor na tabela t 8;0,05 = 1,86.

Exemplo 9.6 - A estimativa de com base


em uma amostra foi 5, com IC de 95% dado
por [2;8]. Atribua verdadeiro (V) ou falso
(F) cada afirmativa abaixo, justificando:

O IC de 90% :
30
30

IC90% () = 52 1,86
;52 + 1,86
=
9
9

[33,4;70,6].
Interpretao: com 90% de confiana, o ndice mdio de
endividamento das empresas deste setor est entre 33,4 e 70,6.

a) A probabilidade de que
esteja entre 2 e 8 0,95 ( )
b) Temos 95% de confiana de que
o intervalo [2;8] contm ( )

91

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

c) Se considerssemos todas as amostras


(de mesmo tamanho n) possveis, em 95%
delas o intervalo [2;8] conteria ( )

d) Se considerssemos todas as amostras


(de mesmo tamanho n) possveis, 95%
delas levariam a ICs que conteriam ( )

Determinando o Tamanho
de uma Amostra
Um aspecto importante da estatstica a
determinao do nmero de unidades a
serem selecionadas = tamanho da amostra.

e) O erro cometido na estimao de


de, no mximo, 3 unidades ( )

f) O erro de estimao de, no mximo, 3


unidades, com grau de confiana 95% ( )

Neste caso, a preciso resultante deve


ser avaliada, por meio do clculo da
margem de erro observada ou efetiva:

obs = z
2

s
n

H duas abordagens possveis:


1 - Para um custo pr-fixado, selecionar
o maior nmero possvel de unidades.

2 - Para um nvel de preciso pr-fixado


(margem de erro) determinar o tamanho
de amostra que conduza a esta preciso.
Neste caso, comum inverter a frmula da
margem de erro para obter n em funo de .
Assim, a partir da especificao da margem
de erro desejada (erro mximo tolervel),
calcula-se o tamanho da amostra necessrio.

(se for conhecido, ento ele que deve ser


usado no clculo de obs. Todavia, lembre-se
que, na prtica, esta hiptese no faz sentido)

No caso da mdia de uma


populao Normal, temos:

= z
2

z 2 2
n=

Problema: na prtica no conhecido,


portanto no h como obter o valor de n.

92

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

H 2 solues paliativas:
Note que no faz sentido usar a estimativa
de na frmula, uma vez que ainda no
temos a amostra (a frmula para definir
o tamanho da amostra que ser coletada!).

1 - Utilizar a estimativa do em uma


pesquisa anterior com caracterstica similar.

2 - Utilizar estimativa do
em uma amostra piloto.

Da mesma forma que fizemos para ,


podemos construir um IC para uma
proporo p, com base no resultado:
Distribuio Amostral de p:

p(1 p)
p N p,
.
n

Intervalo de Confiana para


uma Proporo (Grandes Amostras)

p(1 p)
p(1 p)
IC100(1 )% (p) = p z
; p + z
.
n
n
2
2

margem de erro observada obs, para o


caso da estimao de uma proporo.

aproximada para n grande, pelo TCL.

Exemplo 9.7 - So examinadas 70 peas


selecionadas ao acaso de um lote, e
observa-se que 49 so defeituosas.
Construa um IC de 95% para a
proporo de peas defeituosas no lote.
Soluo :

0,7 * 0,3
0,7 * 0,3
IC95% (p) = 0,7 1,96
;0,7 + 1,96

70
70

= [0,7 0,1073;0,7 + 0,1073] = [0,5927;0,8073].

Tamanho de Amostra para Estimar p


Neste caso, temos:
p(1 p)
= z
n
2

n=

z 2 p(1 p)
2

Problema: o valor de p desconhecido!

93

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Grfico da funo p(1-p):

0,9

0,96

0,84

0,78

0,72

0,6

0,66

0,48

0,42

0,3

0,36

0,24

0,18

0,12

0,54

P = 0,5
p

Embora p seja desconhecido, a funo


p(1-p) assume valor mximo em p = 1/2.

p(1-p)
1/4

0,06

Porm, no caso da estimao de p, h um


procedimento simples e bastante elegante
para contornar e resolver este problema.

Fazendo p(1-p) = 1/4 na frmula de n:

n=

z2
4 2

cota superior para n. O valor


de n obtido desta forma
chamado conservador.

Se p for diferente de 1/2, a frmula acima


fornece um n maior do que o necessrio.
Portanto, esta frmula garante uma margem
de erro igual ou menor que a especificada.

E se reduzirmos esta margem para 5%?


Soluo:

1
= 400.
2

Concluso: para reduzir a margem


de erro pela metade, necessrio
quadruplicar o tamanho da amostra!

Exemplo 9.8 - Qual o tamanho de amostra


necessrio para estimar uma proporo
com uma margem de erro de 10% (a 95%
de confiana), com base em uma AAS?
Soluo (considerando z 2):

22
1
1
= 2 =
= 100.
2
4

(0,1) 2

A tabela a seguir apresenta a relao


entre a margem de erro requerida e o
valor de n a 95% de confiana (z 2):

n
0,1 100
0,05 400
0,02 2.500

n usual das
pesquisas
eleitorais!

94

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

O IC para a varincia 2 de uma populao


Normal baseia-se no seguinte resultado:

10. INTERVALOS
DE CONFIANA
(PARTE 2 - IC`S PARA VARINCIA E
PARMETROS DE 2 POPULAES)

IC para a Varincia de
uma Populao Normal

s2
s2

IC 100(1)% ( ) = (n 1) 2 ; (n 1) 2
.



n 1,
n 1, 1

2
2

Q = (n 1)

S2
~ 2n 1 .
2

Este o resultado mais importante


envolvendo a distribuio qui-quadrado.

Exemplo 10.1 - Uma amostra de 30 alunos


de uma universidade apresenta varincia
amostral das notas dada por: s2 = 132,7.

valor k 2 na tabela

valor k1 na tabela

qui - quadrado tal que :

P(X > k 2 ) = .
2

qui - quadrado tal que :

Supondo que a populao Normal,


obtenha o IC de 95% para 2.

P(X < k1 ) = .
2

Consultando a Tabela Qui-Quadrado:

Soluo - os valores da qui-quadrado so:

229;0,975 = 16 e 229;0,025 = 45,7.


Onde:

229;0,975 = 16 e 229;0,025 = 45,7.

Substituindo na frmula do IC:


132,7
132,7
IC 95% ( 2 ) = 29
;2 9
= [84,21;240 ,52].
16
45,7

95

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

O prximo IC a ser estudado para a diferena


entre as mdias de 2 Populaes Normais.

Estimador no viciado para 1-2:

X1 X 2

Sejam 2 populaes Normais com mdias 1


e 2 e desvios padro 1 e 2. Sejam 2 AAS`s
independentes de tamanhos n1 e n2.
Onde:

(diferena das mdias amostrais).

Considere o problema de estimar a diferena


entre as mdias destas 2 populaes: 1-2.

Varincia do Estimador de 1-2:

Pr ova : E( X1 X2 ) = E(X1 ) E( X2 ) = 1 2 .

Distribuio Amostral de X1 X 2 :

(X1 X2 ) ~ N(1 2 ,
amostras so independentes!

V(X1 X 2 ) = V(X1 ) + V (X 2 )
=

12 22
+ .
n1 n 2

Na prtica, 12 e 22 so desconhecidas

12 22
+ ).
n1 n2

Padronizando:

Z=

(X1 X2 ) (1 2 )
~ N(0,1).
12 22
+
n1 n 2

e, desta forma, precisam ser estimadas.

IC para a Diferena das Mdias


de Duas Populaes Normais

Neste caso, a soluo usual assumir que

IC100(1)% (1 2 ) =

12 = 22 = 2 , e substituir 2 por seu estimador

1 1
1 1
+ ; (x1 x2 ) + t
+ ,
(x1 x2 ) t n +n 2;sp
sp
n
n
2
;
+

n1 n2
n1 n2
2
2

2
p

no viciado S , cuja frmula apresentada a seguir :

S2p =
pooled

(n1 1)S12 + (n 2 1)S22


.
n1 + n 2 2

sp =

(n1 1)s12 + (n 2 1)s22


.
n1 + n 2 2

96

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 10.2 - Para uma AAS de 8


lmpadas de uma marca A, a vida
mdia estimada foi de 4.600 horas,
com s1 = 250 horas. Para uma AAS de
10 lmpadas de uma marca B, a vida
mdia estimada foi de 4.000 horas, com
s2 = 200 horas. Supondo que a durao
das lmpadas de ambas as marcas siga
distribuio Normal, obtenha um IC de
99% para a diferena entre a vida mdia
das lmpadas das 2 marcas.
Interprete este intervalo.

Pressupostos para o IC para 1-2:


1 - As populaes so Normais.
2 - As amostras so independentes, de
tamanhos n1 e n2 (no necessariamente iguais).
Onde:

3 - As varincias das populaes


so iguais: 12 = 22 = 2 .
.

No captulo 12, veremos uma forma


de testar a validade do pressuposto 3.

Soluo:

Consultando a Tabela t:

sp =

(n1 1)s12 + (n 2 1)s 22


7 * (250) 2 + 9 * (200) 2
=
n1 + n 2 2
16
= 49.843,75 = 223,26.

IC 99% (1 2 ) = ( x1 x 2 ) m t 16;0 , 005s p

= ( 4.600 4.000) m t 16;0 , 005s p

1
8

1
n1

+ 101

+ n12 =

= [(600) m 2,921 * 223,26 * 0,4743]

= [(600 ) m 309,33] = [290,67;909,33].

Interpretao: temos 99% de confiana


de que a diferena entre os tempos
mdios de durao das duas marcas
esteja entre 290,67 e 909,33.

Exerccio 10.1 - 2 amostras independentes de


duas turmas apresentam as seguintes notas:

Obs - analogia com testes de hipteses:

Turma 1 - 5.0, 6.0, 3.5, 9.0, 8.5.


Turma 2 - 4.0, 10.0, 7.0, 5.0.

O IC fornece bastante evidncia de que as


mdias das duas populaes sejam diferentes.
O teste de hipteses como esta (1 = 2)
ser estudado mais frente, no captulo 12.

Ache o IC de 95% para 1- 2.

97

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soluo:

A seguir, ser estudado o IC


para a diferena de propores.

4 * 5,425 + 3 * 7
= 2,4698.
7

sp =

IC95% (1 2 ) = (6,4 6,5) m t 7 ;0, 025s p


= [ 0,1 m ( 2,365 * 2,4698 * 0,6708) ]
= [ 0,1 m 3,9182] = [ 4,0182;3,8182].

1
5

+ 14

Sejam 2 populaes com propores p1 e p2,


e 2 AAS`s independentes de tamanhos n1 e n2,
selecionadas de forma independente destas
populaes. O estimador no viciado de p1-p2 :

p1 p 2 .
(diferena das propores amostrais)

Interpretao?

fcil verificar que:

E(p1 p 2 ) = p1 p 2 .
Logo, o estimador no viciado para p1-p2.
A varincia do estimador proposto
(supondo amostras independentes) :

V(p1 p 2 ) =

p1 (1 p1 ) p 2 (1 p 2 )
+
.
n1
n2

Padronizando:

Z=

(p

p 2 ) (p1 p 2 )
N(0,1).
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2

Distribuio Amostral de p1 p 2 :

p (1 p1 ) p2 (1 p2 )
.
p1 p2 N p1 p2 , 1
+
n1
n2

aproximada para n1 e n2 grandes, portanto


o IC s ser vlido sob esta condio.

Intervalo de Confiana p/ a Diferena


de Propores (Grandes Amostras)

Portanto, o IC (assinttico) para a diferena de


propores baseia-se na distribuio Normal.

p (1 p1 ) p2 (1 p2 )
IC100(1)%(p1 p2 ) = (p1 p2 ) m z 1
+
.
n1
n2
2

Obs - deve ser ressaltado que este IC demanda


que as duas amostras sejam grandes.

98

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 10.3 - Duas financeiras aplicam


diferentes critrios para concesso de
crdito. No banco de dados da financeira 1,
foram selecionados ao acaso 180 clientes,
dos quais 140 eram inadimplentes. No
banco de dados da financeira 2, foram
selecionados ao acaso 300 clientes, dos
quais 220 eram inadimplentes. Com base
nestes dados, obtenha o IC de 90% para a
diferena entre as propores de clientes
inadimplentes nas duas corretoras.

Exerccio 10.2 - Suponha que queiramos


comparar a proporo de aposentados no
Sudeste com a proporo de aposentados
no Nordeste. 2 amostras de tamanho 36 de
cada uma das regies forneceram as
seguintes propores de aposentados:

Soluo:

140 220
IC90% (p1 p 2 ) =

m
180 300
140 140 220 220
1

180 180 300 300


1,645
+
180
300

R: [-0.0216;0.1105].

Distribuio F
O prximo IC a ser estudado baseia-se
em uma distribuio contnua chamada
F, que tem como parmetros 1 e 2.

p SE = 0,18 e p NE = 0,168.
Ache o IC de 99% para a diferena entre as
propores de aposentados nas 2 regies.
R: [-0,218;0,242].

Distribuio F - Grfico:

/2

A notao :

graus de liberdade
do denominador

IC p/ a Razo de Varincias
de Duas Populaes Normais

s2

22
s 22
2
IC100(1)% ( 2 ) = 2 f
;
f
.

2 n 1,n 1;

n 1,n 1; 1
1
s1 1 2 2 s1 1 2 2
valor k1 tal que :

P(F < k1 ) =
1 , 2 ;

F ~ F1 ,2 .

graus de
liberdade do
numerador

valor k 2 tal que : P(F > k 2 ) = .


2

.
2

/2
k2

99

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Para obter o valor da cauda inferior da


distribuio F, usa-se a seguinte frmula:

Problema:
A distribuio F s tabelada para a cauda
superior. Entretanto, como a distribuio F no
simtrica, o valor da cauda inferior no o
negativo do valor da cauda superior, como
ocorre com a Normal e com a t de Student.


1 , 2 ; 1
2

1
f

2 , 1 ;

Como obter o valor da cauda inferior?

Exemplo 10.4 - 2 amostras independentes


de duas turmas apresentam as notas:

Achando o valor da cauda superior da F:

Turma 1 - 5.0, 6.0, 3.5, 9.0, 8.5.


Turma 2 - 4.0, 10.0, 7.0, 5.0.

Ache o IC de 95% para

22
.
12

Achando o valor da cauda inferior da F:

f4,3;0,025 =
15,10.

E o intervalo solicitado :

22
IC95% 2 = [0,1293;19,4839].
1

f3,4;0,025 =
9,98.

Invertendo: f4,3;0,975 =
1/9,98 = 0,1002.

H alguma evidncia contra o pressuposto


necessrio ao clculo do IC para 1- 2?

100

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 10.5 - 2 amostras independentes


de tamanho 6, de 2 populaes Normais,
forneceram mdias 8 e 12 e varincias
iguais a, respectivamente, 40 e 37.

Soluo:

O slide seguinte ilustra a consulta


tabela F, agora para cauda superior = 5%.

Ache o IC de 90% para a razo entre a


varincia da populao 2 e a da populao 1.

Achando o valor da cauda superior da F:

O valor da cauda inferior da F :

f 5 , 5; 0 , 95 = 1 / 5,05 = 0,198.
E o intervalo solicitado :
f5,5;0,05 =
5,05.

Erros mais Comuns no Clculo


do IC para Razo de Varincias:

2
IC90% 22 = [0,1831;4,6713].
1

IC`s Assintticos
1. baseados na aproximao da t pela Normal.

1 - Consultar a tabela errado, trocando


o numerador com o denominador.

2. baseados no TCL (mdia de populao no


normal, proporo ou diferena de propores).
.

2 - Obter o valor da cauda inferior da F


dividindo 1 pelo valor da cauda superior,
sem inverter os graus de liberdade.

3. baseados no EMV (e suas propriedades em


grandes amostras, j enunciadas no captulo 8).

101

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Testes de Hipteses

11. TESTES
DE HIPTESES
(PARTE 1 - CONCEITOS BSICOS E
TESTES PARA MDIA E PROPORO)

Esta hiptese de igualdade chamada


hiptese nula, e representada por H0.
Ela ser investigada a partir da amostra.

Uma hiptese estatstica uma afirmao


a respeito de um parmetro da populao.
Exemplo 11.1 - No exemplo das alturas dos
alunos (7.1), podemos formular a seguinte
hiptese: (que a altura mdia dos
alunos da turma inteira) igual a 175 cm.

Se a amostra fornece evidncia contra


H0, ento rejeitamos esta hiptese.

Neste caso, aceitamos uma hiptese


alternativa, representada por H1.
H1 contradiz o que se afirma em H0.
No exemplo, teramos H1: 175.

Caso contrrio, se a amostra no fornece


evidncia contra H0, no rejeitamos H0.
Obs - embora no seja rigorosamente correto,
algumas vezes aceitar H0 empregado.
Veremos, no entanto, que os testes usuais no
fornecem evidncia para concluir (aceitar) que
H0 verdadeira, apenas para no rejeitar isto.

Em resumo, diante das hipteses:


H0: = 175 (hiptese nula)
e
H1: 175 (hiptese alternativa),
tomamos uma das seguintes decises:
no rejeitar H0
ou
rejeitar H0 (e, neste caso, aceitar H1).

102

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Analogia com um Julgamento


Embora o ponto de partida seja a
hiptese nula, a hiptese alternativa
que um teste permite evidenciar (ou no).

ela, portanto, que queremos tentar


comprovar, quando formulamos um teste.

Isto nada mais do que


um teste de hipteses.
Qual a hiptese nula?

Em nosso sistema judicirio, um jri


s decide condenar um ru caso haja
evidncia de que ele seja culpado.
Isto porque o sistema considera mais
grave condenar um eventual inocente
do que absolver um eventual culpado.

Erros em Testes de Hipteses


Um teste de hipteses no leva
necessariamente deciso correta.

Qual a hiptese alternativa?

Qualquer que seja nossa deciso,


sempre existe a possibilidade de erro.

R: H0: ru inocente
H1: ru culpado.

Existem 2 tipos de erro que podemos


cometer ao testar hipteses: tipo I e tipo II.

Nvel de Significncia
O erro tipo I o erro que consiste em
rejeitar H0, quando ela verdadeira.

A probabilidade de cometer este erro


denotada por , e tem um nome especfico:

O nvel de significncia de um teste


a probabilidade de cometer o erro tipo I
pr-especificado por quem vai fazer o
teste. Os valores usuais so: 0,01, 0,05 e 0,1.

nvel de significncia.

103

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Uma questo que pode surgir : por que


no trabalhar com um valor de muito
pequeno, bem menor ainda do que 0,01?

O erro tipo II o erro que consiste em


no rejeitar H0, quando ela falsa.
A probabilidade do erro
tipo II denotada por .

Porque isto aumentaria muito a exposio


ao erro oposto, ou seja, o de no rejeitar H0
quando ela falsa, denominado erro tipo II.

Resumo - Erros em um Teste de Hipteses:


H0 Verdadeira
Rejeitar H0

H0 Falsa

Quanto menor o valor


de , maior o valor de .

Diretrizes para Formular Hipteses


A formulao das hipteses de um teste
deve levar em considerao o seguinte:

Erro Tipo I

No Rejeitar
H0

Erro Tipo II

1) H0 deve ser definida de tal forma


que o erro de rejeit-la quando ela for
verdadeira (isto , o tipo I) seja mais
grave do que o erro contrrio (tipo II).

a probabilidade de cometer este


erro o nvel de significncia.

Isto porque o erro tipo I tem uma


probabilidade pr-especificada como
um valor pequeno (isto , controlada).
2) H1, por outro lado, a hiptese
da qual um teste capaz de fornecer
evidncia estatstica (= concluso de
que a hiptese verdadeira, sujeita a
uma probabilidade de erro controlada).

Mtodos para Testar Hipteses


H trs mtodos para testar hipteses:
1. Mtodo do Intervalo de Confiana
2. Mtodo da Regio Crtica
3. Mtodo do P-Valor

104

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Testando uma Hiptese a partir


de um Intervalo de Confiana
O teste de H0: = k contra H1: k,
ao nvel de significncia , pode ser
feito usando o IC de 100(1-
)% (da
a notao 100(1-)% que adotamos!).
A regra de deciso a seguinte:
Se k no pertence ao IC, rejeitamos H0
Caso contrrio, ou seja, se k
pertence ao IC, no rejeitamos H0

Exemplo 11.1 (cont.)


Vamos usar o mtodo do IC
para conduzir o seguinte teste:
H0: = 175
x
H1: 175,
ao nvel de significncia = 0,05.
(considere conhecido, igual a 6)

Erro conceitual comum:


No rejeitar H0 ao nvel porque a
estimativa de pertence ao IC de 100(1-)%.
Por que isto est errado?

IC`s e Testes de Hipteses (Bilaterais)


O IC com grau
de confiana::

permite testar ao
nvel de significncia:

90%

0,1

95%

0,05

99%

0,01

Soluo: As hipteses de interesse so:


H0: = 175 (hiptese nula);
H1: 175 (hiptese alternativa).
O IC95%() (calculado no exemplo
9.2) foi: [174,74;185,26].
.
Basta verificar se este intervalo contm
o 175. De imediato, vemos que sim.
Concluso:
no rejeitamos H0, ao nvel = 0,05.

Resposta: a estimativa est sempre


dentro do intervalo, por construo.

O correto seria: no rejeitar H0 ao nvel


se k (isto , o valor de contemplado
em H0) pertence ao IC de 100(1-)%.

105

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 11.2 - (exemplo 9.3) Uma AAS


de 25 trabalhadores de uma fbrica foi
selecionada, fornecendo salrio mdio
de R$ 400,00 e desvio padro R$ 450,00.
Considerando a populao Normal, teste
a hiptese de que o salrio mdio dos
empregados da fbrica seja R$ 600,00,
ao nvel de significncia = 0,1.

Obs - Note, na formulao do teste,


que falamos em testar a hiptese de
que o salrio mdio seja R$ 600,00.
Isto consistente com o que foi dito
anteriormente: o ponto de partida,
a referncia, a hiptese nula. ela
que queremos testar. Porm, da sua
contrapartida - a hiptese alternativa que o teste poder fornecer evidncia.

Soluo: As hipteses de interesse so:


H0: = 9.000 (hiptese nula);
H1: 9.000 (hiptese alternativa).
O IC95%() foi (exemplo 9.4):
[8.633,6;9166,4].
Basta verificar se este intervalo contm
o 9.000. De imediato, vemos que sim.
Assim, no rejeitamos H0, ao nvel = 0,05.

Soluo: As hipteses de interesse so:


H0: = 600 (hiptese nula);
H1: 600 (hiptese alternativa).
O IC90%() foi (exemplo 9.3):
[246,01;553,99].
Basta verificar se este intervalo contm
o 600. De imediato, vemos que no.
Assim, rejeitamos H0, ao nvel = 0,1.

Exemplo 11.3 - (exemplo 9.4) Suponha que a


vida til de uma marca de tv`s de LED seja
normalmente distribuda. A partir de uma
amostra de 16 tv`s, estimou-se uma vida
til mdia de 8.900 horas, e um
desvio padro igual a 500 horas.
Teste se o tempo mdio das tv`s desta marca
igual a 9.000, ao nvel de significncia 0,05.

O Mtodo da Regio Crtica


Embora o mtodo do IC seja simples
e conveniente, o mtodo da regio crtica
o mtodo formal para testar hipteses.
Para a explicao deste mtodo,
necessrio definir 2 quantidades:
-

Estatstica de teste
- Regio crtica

106

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

A estatstica de teste uma estatstica


(= funo das v.a.`s na amostra) baseada
no estimador do parmetro de interesse.
Seja a mdia de uma populao
Normal com conhecido. A estatstica
do teste de H0: = k contra H1: k :
valor testado

Xk
Z=
.
/ n

erro padro

Quando H0 verdadeira
( = k), sabemos que:

Z=

Xk
~ N(0,1).
/ n

Portanto, se houver evidncia de que o


resultado acima no seja vlido, ento
porque H0 no deve ser verdadeira.

O valor observado de Z :

z0 =

xk
.
/ n

Se z0 um valor que seria pouco provvel


caso Z ~ N(0,1), isto representa evidncia
contra Z ~ N(0,1) e, portanto, contra H0.

A regio crtica RC (ou regio de rejeio)


o conjunto dos valores de z0 que
conduzem deciso de rejeitar H0.
Para o teste de H0: = k contra
H1: k ( conhecido):
RC = (-,-z/2][z/2,).
Isto garante probabilidade de erro tipo I - que
a probabilidade de ZRC sob H0 - igual a .

Quais valores de z0 so pouco provveis


se H0 verdadeira, isto , se Z ~ N(0,1)?

Ora, os valores que correspondem


s caudas da distribuio N(0,1),
aos quais chamamos regio crtica.

Por Que Rejeitar H0 Quando z0 RC?


Note que, se H0 verdadeira:
P(ZRC) = P[(Z-z/2)(Zz/2)] = ,
que um valor pr-especificado e baixo.
Assim, se z0RC, temos que decidir entre:

z/2 denominado valor crtico.

107

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

1 - H0 verdadeira, e o evento ZRC, cuja


ocorrncia era improvvel (probabilidade
) acabou ocorrendo por obra do acaso
ou
2 - H0 falsa.
O mais lgico optar pela alternativa 2.

Assim, tomamos a deciso de rejeitar H0.

Se o valor observado da estatstica de


teste no pertencer RC, a amostra no
fornece evidncia para rejeitar H0.

Nesta situao, tomamos a


deciso de no rejeitar H0.

Como = 0,05, usamos z0,025 = 1,96,


e assim: RC = (-,-1,96][1,96,).
Clculo de z0:

z0 =

x 175 180 175


=
= 1,8634.
6/ 5
6/ 5

Este valor no pertence RC.


Concluso: no rejeitamos H0, ao nvel 0,05.

Resumo do Mtodo da Regio Crtica:


Se o valor observado da estatstica de
teste pertencer RC, a amostra fornece
evidncia estatstica para rejeitar H0.

Nesta situao, tomamos a


deciso de rejeitar H0.

Exemplo 11.1 (cont.) - Vamos agora aplicar o


mtodo da RC para conduzir o teste H0: = 175
x H1: 175, ao nvel de significncia = 0,05.
Considere = 6. A amostra observada a
do exemplo 7.1 (n = 5 e mdia = 180 cm.).
Soluo - os valores crticos possveis so os
mesmos dos respectivos IC`s de 100(1-)%:
Para = 0,01 z0,005 = 2,575.
Para = 0,05 z0,025 = 1,96.
Para = 0,1 z0,05 = 1,645.

Se desconhecido, deve ser


substitudo por seu estimador S,
e a estatstica do teste torna-se:

T=

Xk
.
S/ n

cujo valor observado :

t0 =

xk
.
s/ n

estimativa
do erro
padro

108

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Neste caso, a regio crtica baseia-se na


distribuio t com n-1 graus de liberdade:

RC = (-,-tn-1;/2][tn-1;/2,).

Assim como no caso do IC, se a amostra grande


(>30), pode-se usar a Normal como aproximao.

No exemplo 11.1, vamos agora considerar


desconhecido e testar as mesmas hipteses:
H0: = 175
x
H1: 175,
A estimativa de foi obtida no exemplo
9.2: s = 6. O valor crtico o percentil
usado naquele exemplo: t4;0,025 = 2,776.

Assim:
RC = (-,-2,776][2,776,).

x 175 180 175


t0 =
=
= 1,8634.
s/ 5
6/ 5
Este valor no pertence RC.

Erro conceitual comum:


No rejeitar H0 porque t0 (ou z0)
pertence ao IC de 100(1-)%.
Por que isto est errado?

Concluso: no rejeitamos
H0, ao nvel 0,05.

Resposta: o valor calculado da estatstica


de teste no tem nada a ver com IC.
Estariam sendo misturados 2 mtodos.

Exemplo 11.2 (cont.) - Aplique o mtodo


da RC para testar a hiptese de que o
salrio mdio dos empregados da fbrica
seja igual a R$ 600,00, ao nvel = 0,1.

O correto seria:
no rejeitar H0 porque k pertence ao IC
ou
rejeitar H0 porque t0 ou (z0) pertence RC.

109

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soluo:
1 - As hipteses de interesse so:
H0: = 600 (hiptese nula);
H1: 600 (hiptese alternativa).
O nvel de significncia pedido = 0,1.
2 - A regio crtica do teste :
RC = (-,-t24;0,05][t24;0,05,).

3 - Clculo de t0:

t0 =

x 600 400 600


200
=
=
= 2,2222.
450 / 5
90
s / 25
4 - Verifica-se que t0 pertence RC.

5 - Concluso: rejeitamos H0, ao nvel 0,1.

No exemplo 9.3, vimos que t24;0,05 = 1,711.

Em algumas situaes especficas, no


estaremos preocupados em evidenciar
se o parmetro de interesse (, nos
exemplos at aqui) diferente de k, e
sim se ele maior ou menor do que k.

Isto conduz ao estudo de testes unilaterais.

Testes Unilaterais/Unicaudais
Exemplo 11.4 - Um fabricante afirma
que seus cigarros contm, em mdia, no
mximo 30mg de nicotina. Queremos
verificar a partir de uma amostra se
existe evidncia contra esta afirmao.
Neste caso, H1, a hiptese que se quer
evidenciar, no 30, e sim > 30.

Assim mais apropriado estabelecer


como hiptese alternativa H1: > 30.

Valores Crticos da Normal para


Testes Unilaterais (Exemplo 5.9):

H0 naturalmente definida como: 30.


(obs - equivalente adotar H0: = 30)

Para = 0,01 z0,01 = 2,33.

A regio crtica definida com base na


hiptese alternativa, e ser, neste caso:
RC = [z;), se for conhecido ou
RC = [tn-1;;), se for desconhecido.
no dividimos por 2!

Para = 0,05 z0,05 = 1,645.


Para = 0,1 z0,1 = 1,28.
Obs - para H1: < k, a RC : (-;-z], para
conhecido, e (-;-tn-1,], para desconhecido.

110

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 11.4 (cont.) - Foi coletada uma


amostra de 25 cigarros, fornecendo mdia
31,5 mg. O desvio padro populacional
conhecido, e igual a 3 mg. Ao nvel = 0,05,
os dados refutam a afirmao do fabricante?
Soluo: RC = [1,645;) e z0 = 2,5, que
pertence RC. Desta forma, rejeita-se H0,
ao nvel de significncia = 0,05. Os dados
refutam a afirmao do fabricante, a este nvel.

Exerccio 8.1 - Um economista afirma que o


ndice de endividamento mdio das empresas
de certo setor inferior a 30. Voc decide
verificar esta hiptese, a partir de uma AAS
de 9 empresas. Sua amostra forneceu mdia
8 e desvio padro 30. Se os ndices de
endividamento seguem distribuio Normal,
sua amostra fornece evidncia favorvel
afirmao do economista, aos 3 nveis usuais?

Teste para uma Proporo

Considere agora o desvio padro


desconhecido e estimado, com s = 3 mg.
Da tabela t, t24;0,05 = 1,711,
e assim: RC = [1,711;).
t0 = 2,5, que pertence RC acima,
portanto a concluso permanece.
Obs - O mtodo do IC no pode
ser aplicado para testes unilaterais!

Resposta:
(quais as hipteses pertinentes?)

t0 = - 2,2 e rejeitamos H0 aos nveis 0,05 e 0,1.


Logo, a estes nveis, h evidncia favorvel
hiptese formulada pelo economista ( < 30).

O teste baseia-se no seguinte resultado


(grandes amostras), apresentado no captulo 7:

As hipteses de interesse so:


H0: p = k
H1: p k,
sendo p uma proporo populacional
(por exemplo, de eleitores que
pretendem votar em um certo candidato).

proporo amostral.

Z=

p p
N(0,1).
p(1 p)
n

O teste, portanto, vlido apenas em


grandes amostras ( um teste assinttico).

111

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

A estatstica do teste obtida substituindo


em Z o valor considerado em H0 (p = k):

Z=

p k
.
k (1 k )
n

O teste consiste em calcular o valor da


estatstica Z para a amostra observada:

z0 =

p k
,
k (1 k )
n

e verificar se z0 pertence RC, que


baseada na distribuio Normal.

Exemplo 11.5 - Uma corretora afirma


que 30% dos seus clientes so avessos
ao risco. Uma AAS de 64 clientes
revela que 20 so avessos ao risco.

Soluo:
As hipteses de interesse so:
H0: p = 0,3
H1: p 0,3,

Teste a afirmao da corretora, ao


nvel de significncia = 0,1.

sendo p a proporo do total de clientes


da corretora que so avessos ao risco.

= 0,1 z0,05 = 1,645, e assim:


Erro mais comum no teste para propores:
RC = (-,-1,645][1,645,).

0,3125 0,3
z0 =
= 0,2182.
0,3(1 0,3)
64

Colocar dentro da raiz do denominador


o valor de p-chapu, ao invs de k.
Esta confuso ocorre porque, no IC para p, de
fato a proporo amostral que fica dentro da raiz.

Como z0 no pertence RC, no


rejeitamos H0 ao nvel = 0,1.

112

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 11.6 - Uma emissora de TV


afirma que o ndice de audincia de seu
programa carro chefe, em determinada
localidade e horrio, de 60%. Um
instituto de pesquisa entrevista 400
pessoas naquela localidade. Se 220
entrevistados assistem ao programa no
horrio em questo, existe evidncia
estatstica contra a afirmativa feita pela
emissora, ao nvel de significncia 0,05?

Para = 0,05:
RC = (-,-1,645].

z0 =

0,55 0,6
= 2,04.
0,6(1 0,6)
400

Portanto, z0 pertence RC, e assim


rejeitamos H0 ao nvel = 0,05.

Deciso x Nvel de Significncia

Soluo:
As hipteses de interesse so:
H0: p = 0,6
H1: p < 0,6,
sendo p a proporo de audincia do
programa na populao em estudo.

Concluso:

A amostra fornece evidncia contra a


afirmativa da emissora, ao nvel 0,05.

E aos outros nveis usuais?

Note ento que:

No exemplo 11.6, rejeitamos H0 aos


nveis 0,05 e 0,1, mas no ao nvel 0,01.

Se uma hiptese no rejeitada a um


certo nvel de significncia, tambm no
o ser a nveis inferiores (a RC diminuir).

Isto conduz seguinte concluso:

Por outro lado:

a deciso em um teste depende do


nvel de significncia estabelecido!

Se uma hiptese rejeitada a um certo


nvel de significncia, tambm o ser a
nveis superiores (pois a RC aumentar).

113

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

P-Valor
Podemos definir um ponto de corte, isto ,
um valor de abaixo do qual no rejeitamos
H0, e acima do qual passamos a rejeitar H0.

Este ponto chamado p-valor do teste.

Testando Hipteses Usando o P-Valor

A regra de deciso a seguinte:

se p-valor rejeitamos H0
se p-valor > no rejeitamos H0

O p-valor de um teste o menor


valor de que nos leva a rejeitar H0.
O p-valor utilizado para testar
hipteses de forma direta.
Sinnimos: nvel descritivo e
probabilidade de significncia.

Exemplo 11.7 - O p-valor obtido para um


teste foi 0,07. Qual a concluso do teste
para os 3 nveis de significncia usuais?
Soluo:
Para = 0,01 ou 0,05, no rejeitamos H0
(pois o p-valor maior do que ambos);
Para = 0,1, rejeitamos H0
(pois o p-valor menor do que 0,1).

Clculo do P-Valor
O p-valor de um teste dado pela
probabilidade, calculada sob H0,
de que a estatstica de teste assuma
um valor igual ou mais extremo
do que o valor calculado na amostra.
Mais extremo = mais dentro da RC.

Para elucidar a definio, considere o teste


de H0: = k contra H1: > k, em que z0
o valor observado da estatstica de teste.

Note que, se z0 > z, o p-valor fica


menor do que . Isto corresponde
situao em que H0 rejeitada.

114

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Por outro lado, se z0 < z, o p-valor fica


maior do que . Isto corresponde
situao em que H0 no rejeitada.

Exemplo 11.8 - Calcule o p-valor do teste


do exemplo 11.4, e utilize-o para formular
sua concluso aos nveis usuais.

Se z0 = z, o p-valor
igual a , e H0 rejeitada.

Soluo:
Em um teste bilateral, o p-valor obtido
multiplicando o p-valor unilateral por 2.
p - valor = PH0 (Z 2,5) = 0,5 0,4938 = 0,0062.

No exemplo 11.8, se H1: 30:


indica que a probabilidade calculada sob H0

R: p-valor = 2*0,0062 = 0,0124.

Concluso?

P-Valor para o Teste t


Exerccio 11.2 - No exemplo 11.6, calcule
o p-valor do teste, e utilize-o para formular
suas concluses aos nveis usuais.

R: 0,0207.

Quando a varincia desconhecida, e


usamos o teste t, a tabela t no permite
determinar o p-valor com exatido.
O clculo pode ser feito via
funo DIST.T do excel.
O comando DIST.T.CD(t0;g.l.), se o teste
unilateral e DIST.T.BC(t0;g.l.) se bilateral.

115

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Teste para a Varincia de uma Normal


Considere uma populao Normal com
mdia (desconhecida) e varincia 2.

12. TESTES DE
HIPTESES

As hipteses de interesse so:


H0: 2 = k contra H1: 2 k.

(PARTE 2 - TESTES PARA VARINCIA


E PARA COMPARAR 2 POPULAES,
E O CONCEITO DE PODER DO TESTE)

O teste baseia-se no seguinte


resultado, apresentado no captulo 10:
S2
Q = (n 1) 2 ~ 2n 1 .

N muito grande, comum fazer: n = n0.

O teste consiste em calcular o valor da


estatstica do teste na amostra observada:

A estatstica do teste obtida


fazendo 2 = k: Q = (n 1)

S2
.
k

s2
q0 = (n 1) ,
k

Sob H0, Q segue distribuio


qui-quadrado com n-1 g.l..

e verificar se q0 pertence ou no
RC, definida no slide a seguir.

Regio Critica:

RC = (0, 2


n 1, 1
2

] [ 2

n 1,

Exemplo 12.1 - Seja uma AAS de


tamanho n = 30 de uma populao
Normal. Mdia e desvio padro amostrais
foram, respectivamente: 32 e 3,63.

, ).

valor k1 tal que :


P(X < k1 ) =

ou :

P(X > k1 ) = 1
2

valor k 2 tal que :


P(X > k 2 ) =

Conduza o teste:
H0: 2 = 16 contra H1: 2 16,
ao nvel = 0,05.

116

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Soluo:

q 0 = (n 1)

s2
(3,63) 2
= 29
= 23,88.
k
16

RC = (0,16] [45,7, ).

Teste de Diferena de Mdias


Considere 2 populaes Normais com
mdias 1 e 2 e desvios padro 1 e 2.

Concluso?

O objetivo aqui testar:


H0: 1 = 2 contra H1: 1 2.

Exerccio 12.1 - Teste H0: 2 = 16 contra


H1: 2 < 16, ao nvel 0,05 (RC = (0, n2 1,1 ]).

Estas hipteses podem ser reescritas como:


H0: 1-2 = 0 contra H1: 1-2 0.

Assim como no caso do IC para


1-2, sero consideradas 2 AAS`s
independentes das duas populaes.

Caso 1 - 1 e 2 so conhecidos.

O teste baseia-se no seguinte resultado:

12 22
(X1 X2 ) ~ N(1 2 , + ).
n1 n2

Estatstica do Teste
obtida substituindo em Z o valor do
parmetro testado (que no caso 1-2)
quando H0 verdadeira (1-2 = 0):

Padronizando:

Z=

(X1 X2 ) (1 2 )
~ N(0,1).
12 22
+
n1 n 2

Z=

(X1 X2 )
12 22
+
n1 n 2

117

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

O teste consiste em calcular o valor


da estatstica Z na amostra observada:

z0 =

(x1 x 2 )

Caso 2 - 1 e 2 so
desconhecidos e estimados.

12 22
+
n1 n 2

e verificar se z0 pertence ou no
RC, baseada na distribuio Normal.

Estatstica do Teste:

T=

O teste consiste em calcular o valor


da estatstica T na amostra observada:

X1 X 2
.
1 1
Sp
+
n1 n 2

Regio Crtica (teste bilateral):

RC = (-,-tn1+n2-2,/2][tn1+n2-2,/2,).

Exemplo 12.2 - Seja a situao do exemplo


10.2: Para uma AAS de 8 lmpadas de
uma marca A, a vida mdia estimada foi de
4.600 horas, com s1 = 250 horas. Para uma
AAS de 10 lmpadas de uma marca B, a
vida mdia estimada foi de 4.000 horas,
com s2 = 200 horas. Suponha que a
durao das lmpadas de ambas as marcas
siga distribuio Normal. Teste, ao nvel
0,01, a hiptese de que o tempo mdio de
durao das marcas A e B seja o mesmo.

t0 =

sp =

x1 x 2
,
1 1
sp
+
n1 n 2

(n1 1)s12 + (n 2 1)s 22


n1 + n 2 2

e verificar se t0 pertence ou no RC.

Soluo: primeiramente, achemos a regio


crtica RC do teste. Consultando a tabela t:

Portanto: RC = (-,-2,921][2,921,).

118

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

sp =

(n1 1)s12 + (n 2 1)s 22


7 * (250) 2 + 9 * (200) 2
=
n1 + n 2 2
16

Exerccio 12.2 - 2 amostras independentes


de 2 turmas apresentam as seguintes notas:

= 49.843,75 = 223,26.

t0 =

x1 x 2
4.600 4.000
=
= 5,67.
1 1
1 1
sp
+
223,26 +
n1 n 2
8 10

Turma 1 - 5.0, 6.0, 3.5, 9.0, 8.5.


Turma 2 - 4.0, 10.0, 7.0, 5.0.

Portanto: t0 RC, e assim


rejeitamos H0 ao nvel 0,01.

Conduza o teste de diferena


de mdias, ao nvel 0,05.

Soluo Parcial:
Implementao no Excel
RC = (-,-2,365][2,365,).

Funo TESTE.T(caudas = 2;tipo = 2).

t 0 = 0,0604.

O resultado obtido o p-valor do teste.


No caso do exerccio 12.2 0,9536.

Concluso?

Teste para Diferena de Propores


Considere 2 populaes com propores
p1 e p2 a serem comparadas.

O teste baseia-se no seguinte resultado:

p (1 p1 ) p2 (1 p2 )
.
p1 p2 N p1 p2 , 1
+
n1
n2

aproximada para n1 e n2 grandes

As hipteses do teste so
H0: p1 = p2 contra H1: p1 p2,
o que pode ser reescrito da forma:
H0: p1-p2 = 0 contra H1: p1-p2 0.

Padronizando:

Z=

(p

p 2 ) (p1 p 2 )
N(0,1).
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2
1

119

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Substituindo p1 e p2 no denominador
por suas respectivas estimativas, a
aproximao permanece vlida. Assim:

Z=

O teste consiste em calcular o valor


da estatstica Z na amostra observada:

z0 =

(p1 p 2 ) (p1 p 2 )
N (0,1)
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2

p1 p 2
,
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2

Finalmente, fazendo p1-p2 = 0,


obtemos a estatstica do teste.

e verificar se z0 pertence ou no RC,


que baseada na distribuio Normal.

Exemplo 12.3 - Duas financeiras aplicam


diferentes critrios para concesso de
crdito. No banco de dados da financeira 1,
foram selecionados ao acaso 180 clientes,
dos quais 140 eram inadimplentes. No banco
de dados da financeira 2, foram selecionados
ao acaso 300 clientes, dos quais 220 eram
inadimplentes. Teste, ao nvel 0,1, se existe
evidncia de diferena entre as propores
de inadimplncia nas duas financeiras.

Soluo:

Exemplo 12.3 (cont.) - Teste, ao nvel 0,1,


se a proporo de inadimplentes na primeira
financeira maior do que na segunda.
Soluo:
Neste caso, as hipteses so:
H0: p1 = p2 contra H1: p1 > p2,
que podem ser reescritas como:
H0: p1-p2 = 0 contra H1: p1-p2 > 0.

A regio crtica, para o nvel = 0,1,


: RC = (-,-1,645][1,645,).
z0 =

(14 / 18) (22 / 30)


= 1,1064.
(14 / 18)(4 / 18) (22 / 30)(8 / 30)
+
180
300

Como z0 no pertence RC, no


rejeitamos H0 ao nvel = 0,1.

O valor de z0 permanece o mesmo,


mas a regio crtica passa a ser:
RC = [z0,1,) = [1,28,).

Como z0 no pertence RC, no


rejeitamos H0 ao nvel = 0,1.
Ou seja, neste caso a deciso no mudou.

120

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

As hipteses de interesse do teste F so:

Teste de Razo de Varincias

H 0 : 12 = 22
H1 : 12 22

Um dos pressupostos para realizar


o teste de diferena de mdias de
2 populaes Normais que as
varincias das populaes sejam iguais.

que podem ser reescritas como:


2
H 0 : 22 = 1
1

Esse pressuposto pode ser testado, por


meio de um teste chamado teste F.

H1 :

O teste baseia-se no seguinte resultado,


apresentado no captulo 10:

Estatstica do teste:

S12 22
~ Fn11,n 2 1.
S22 12

F=

Substituindo acima o valor da razo


de varincias contemplado em H0
(isto , 1), obtemos a estatstica do teste.

S12
.
S22

Sob H0, a estatstica acima segue


distribuio F com n1-1 e n2-1 graus.

Regio Crtica (teste bilateral):

O teste consiste em calcular o valor da


estatstica F para a amostra observada:

RC = (0; f


n1 1, n 2 1; 1
2

s12
f0 = 2 .
s2
e verificar se f0 pertence ou no RC.

22
1
12

] [f

n1 1, n 2 1;

; ).

valor k 2 na tabela F tal que :


1 , 2 ; 1
2

1
f

2 , 1 ;
2

P(F > k 2 ) = .
2

/2
k2

121

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Exemplo 12.4 (exemplo 10.5) - 2 AAS`s


independentes de tamanho 6, de 2 populaes
Normais, forneceram mdias 8 e 12 e
varincias 40 e 37, respectivamente. Teste, ao
nvel = 0,1, a hiptese de varincias iguais.

Achando os valores da Tabela F:

Soluo:
Valor da estatstica F: f0 = 40/37 = 1,08.
O processo para obter os valores da tabela F
o mesmo do exemplo 10.5, repetido a seguir.

f5,5;0,05 =
5,05.

f 5 ,5;0 , 95 = 1 / 5,05 = 0,198.

RC = (0; f 5,5;0,95 ] [f 5,5;0, 05 ; ).

5,05.

Exerccio 12.3 - Na situao do


exerccio 12.2, conduza o teste de
razo de varincias, ao nvel 0,05.
Soluo:

0,198.
Valor da estatstica F: f0 = 0,775.

Concluso: f0 no pertence RC e,
assim, no rejeitamos, ao nvel 0,1,
a hiptese de varincias iguais.

Achando o valor da cauda superior da F:

f4,3;0,025 =
15,10.

O processo para obter os valores da tabela F


o mesmo do exemplo 10.4, repetido a seguir.

Achando o valor da cauda inferior da F:

f3,4;0,025 =
9,98.

Invertendo: f4,3;0,975 =
1/9,98 = 0,1002.

122

FGV/EPGE - Mestrado em Finanas e Economia Empresarial


Disciplina: Estatstica/2016 - Professor: Eduardo Lima Campos

Regio Crtica:

RC = (0; f 4,3; 0,975 ] [f 4,3; 0,025 ; )


= (0;0,10] [15,10; ).
Concluso?

Erros conceituais comuns:


1 - No rejeitar H0 porque
o 1 no pertence RC;
2 - No rejeitar H0 porque f0
pertence ao IC de 100(1-)%.
3 - Inverter as varincias amostrais
no clculo de f0 (confuso com IC).

Poder de um Teste
O poder de um teste de
hipteses a probabilidade de
rejeitar H0 quando ela falsa.

O poder tambm pode ser


chamado potncia do teste.

Implementao no Excel
O teste F pode ser implementado no
Excel por intermdio da funo
TESTE.F. s entrar com dados em
colunas, e a funo retorna o p-valor.
No caso do exerccio 12.3,
o p-valor 0,7844 (interprete!).

Erros conceituais comuns (cont.)


4 - Consultar a tabela errado, trocando
o numerador com o denominador.
5 - Obter o valor da cauda inferior da F
dividindo 1 pelo valor da cauda superior,
sem inverter os graus de liberdade.

Erros em um Teste de Hipteses x Poder:

Rejeitar H0
No Rejeitar
H0

H0 Verdadeira

H0 Falsa

Erro Tipo I

Deciso
Correta
Erro Tipo II

a probabilidade desta deciso correta o poder do teste

123

Anda mungkin juga menyukai