REVISÃO DE ESTATÍSTICA
Exercício1:
Numa Mesa de Operações trabalham 5 operadores em bolsa de
valores. Desejamos saber o volume de operações fechadas por
um determinado operador. Para isso escolhemos uma amostra de
30 dias de operações fechadas nos últimos 6 meses.
Considerando essa amostra significativa, observe os dados e
responda os ítens abaixo:
Amostra
22 23 21 25 23 26 24 24 25 28 24 24 25 25 25
24 25 23 27 24 23 27 26 25 26 22 22 25 25 24
Conclusões:
• Frequência do número máximo de operações fechadas=
• Frequência do número mínimo de operações fechadas=
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 4
Curso de Estatística- prof. Dr. José Nicolau Pompeo
TOTAL
21 1 3,33%
22 3 10,00%
23 4 13,33%
24 7 23,33%
25 9 30,00%
26 3 10,00%
27 2 6,67%
28 1 3,33%
TOTAL 30 100,00%
TOTAL
Frequência Acumulada
Oper Fechadas Absoluta Relativa
21 1 3,33%
22 4 13,33%
23 8 26,67%
24 15 50,00%
25 24 80,00%
26 27 90,00%
27 29 96,67%
28 30 100,00%
TOTAL
Exercício 2:
Considere a tabela abaixo, que mostra as vendas diárias de uma
determinada loja.
DIA VENDAS DIÁRIAS DIA VENDAS DIÁRIAS
1 R$ 22 000,00 15 R$ 32 000,00
2 R$ 20 000,00 16 R$ 36 000,00
3 R$ 18 000,00 17 R$ 34 000,00
4 R$ 16 000,00 18 R$ 36 000,00
5 R$ 18 000,00 19 R$ 33 000,00
6 R$ 25 000,00 20 R$ 32 000,00
7 R$ 28 000,00 21 R$ 33 000,00
8 R$ 26 000,00 22 R$ 36 000,00
9 R$ 16 000,00 23 R$ 35 000,00
10 R$ 25 000,00 24 R$ 33 000,00
11 R$ 27 000,00 25 R$ 32 000,00
12 R$ 29 000,00
13 R$ 32 000,00
14 R$ 30 000,00
Total
PERCENTIL
n é o número total de observações da série
x é a ordem de uma determinada observação
p é o percentil em porcentos dessa observação.
100%
0%
1 x n
100% - 0% p - 0
=
n- 1 x- 1
x - 1
p = x 100 %
n–1
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 8
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Exercício 3:
Considere as 11 observações da tabela. Ordene-as de forma
crescente e calcule o percentil de todas as observações.
Calcule a posição dos percentís 30% e 80%.
52 48 49 47 44 42 46 38 33 25 29
Solução:
Série 25 29 33 38 42 44 46 47 48 49 52
Ordem 1 2 3 4 5 6 7 8 9 10 11
Série 25 29 33 38 42 44 46 47 48 49 52
Percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Exercício 4:
Considere a tabela de rentabilidades mensais do Mercado
Financeiro, durante o mês X.
APLICAÇÃO RENTABILIDADE % A M
Ouro.....................................0,12%
Inflação.................................0,56%
Dólar Paralelo.......................0,65%
FIF Curto Prazo....................1,25%
Caderneta Poupança............1,38%
CDB (aplic < $5 mil)..............1,78%
FIF 30 dias............................1,82%
FIF 60 dias............................1,94%
CDB (aplic>$100 mil)............2,08%
Bolsa RJ................................3,56%
Bolsa SP................................3,87%
a) Estabelecer a ordem e o percentil de cada uma das observações .
b) Calcule o percentil para a rentabilidade de 1,58%.
Ordem 1 2 3 4 5 6 7 8 9 10 11
Série
Percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 10
Curso de Estatística- prof. Dr. José Nicolau Pompeo
MEDIDAS DE POSIÇÃO
MEDIANA
É chamada de Medida de Tendência Central. É o ponto ou
elemento a meio caminho dos dados, ou seja, a metade dos
números está acima dela e a outra metade está abaixo.
MODA
A moda é o valor que ocorre com maior frequência.
Então, a mudança de valor de um elemento da série em geral, não afeta a
moda.
MÉDIA
• Média da População é a soma de todos os elementos da série,
dividida pelo número de elementos.
µx = Σ xi/ N
i=1 ou ainda,
µx = 1/ N Σ xi
i=1
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 11
Curso de Estatística- prof. Dr. José Nicolau Pompeo
n
x= 1/ n Σ xi
i=1
Exercício 5:
Numa Mesa de Operações trabalham 5 operadores em bolsa de
valores. Desejamos saber o volume de operações fechadas por
um determinado operador. Para isso escolhemos uma amostra de
30 dias de operações fechadas nos últimos 6 meses.
Considerando essa amostra significativa, observe os dados e
responda os ítens abaixo:
Amostra
22 23 21 25 23 26 24 24 25 28 24 24 25 25 25
24 25 23 27 24 23 27 26 25 26 22 22 25 25 24
MÉDIA PONDERADA
O valor da Média Ponderada é dada pela expressão:
N
Σ pi . xi
i=1
µx = ONDE,
N
Σ pi
i=1
onde x i, representa o valor do dado repetido, e p j
representa o peso ou a frequência.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 13
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Exercício 6:
O capital de uma empresa é formado por três
acionistas, de acordo com a tabela abaixo.
Capital Participação %
Acionista A R$ 750.000,00 25%
Acionista B R$ 1.800.000,00 60%
Acionista C R$ 450.000,00 15%
Exercício 7:
Considere a tabela de lucro para as empresas
abaixo. Calcule a Média, a Moda e a Mediana.
PROPRIEDADES DA MÉDIA
Exercício 8:
Considere a amostra abaixo.
a) Calcule a média µ.
b) Calcule os desvios em relação à média, de acordo com a tabela.
c) Calcule a soma dos quadrados dos desvios em relação à média.
d) Calcule a soma dos quadrados dos desvios para os valores
diferentes da média.
Responda:
a) O valor da média da tabela acima é:
b) A soma dos desvios em relação à média é:
c) O que você pode concluir a respeito da soma dos quadrados dos
desvios para valores diferentes da média?
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 17
Curso de Estatística- prof. Dr. José Nicolau Pompeo
VARIÂNCIA
Utilizaremos o termo dispersão para indicar o grau de
afastamento de um conjunto de números em relação à sua
média.
Uma forma de medir a dispersão consiste em tomar a
diferença entre o maior e o menor valor. Essa grandeza é
chamada de AMPLITUDE.
O desvio médio absoluto ( DMA ) é uma boa medida de
dispersão porque dá a distância média de cada número em
relação à média.
Σ xi - µ
i=1
DMA =
N
onde xi é um elemento da amostra e µ a média dos elementos
da amostra.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 18
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Exercício 9:
Dada a amostra abaixo, calcule o DMA.
52 48 49 47 44 42 46 38 33 25 29
x x-µ x - µ
52
48
49
47
44
42
46
38
33
25
29
SOMA
µ=
DMA =
Σ (xi - µ) 2
i=1
Var (x)= σ 2
x =
n
• Variância Para Amostras
n
Σ (xi –x ) 2
i=1
2
Var (x)= S x =
n-1
Logo, a VARIÂNCIA é a média dos quadrados dos DESVIOS. No
cálculo da VARIÂNCIA DA AMOSTRA dividimos por ( n – 1 ) para que
Valor Esperado de S2 represente o melhor estimador de σ2. É difícil
interpretar o valor numérico da Variância.
Exercício 10:
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 20
Curso de Estatística- prof. Dr. José Nicolau Pompeo
52 48 49 47 44 42 46 38 33 25 29
x x-µ (x - µ)2
52
48
49
47
44
42
46
38
33
25
29
SOMA
Var (x)= σ x =
2
2
Var (x)= S x =
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 21
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Exercício 11:
Um determinado observador coletou os seguintes
valores de vendas de pizzas de calabresa durante
um período de 9 dias:
X 40 56 38 38 63 59 52 49 46
a) Calcule a média de vendas
b) Calcule a mediana para esses números
c) Calcule a distância média
d) Calcule o desvio médio absoluto
e) Calcule a Variância
X X - µ X - µ (X - µ )2
40
56
38
38
63
59
52
49
46
SOMA
Mediana =
µ=
DMA =
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 22
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Var (x)= σ x =
2
2
Var (x)= S x =
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 23
Curso de Estatística- prof. Dr. José Nicolau Pompeo
DESVIO PADRÃO
A variância é medida em uma unidade que é o quadrado da unidade
de medida dos elementos da amostra. Em geral, é mais conveniente
calcular a raíz quadrada positiva da Variância que representa uma
medida mais precisa para a dispersão dos dados. Essa raíz quadrada
positiva da Variância chamamos de DESVIO PADRÃO.
PARA POPULAÇÕES:
DP ( X) = σx = √ σ 2x
σx = √ Σ n
i =1 (xi - µ) 2
n
PARA AMOSTRAS:
DP ( X) = S x = √ S 2
x
S=√ Σx
n
i =1 (xi –x ) 2
n - 1
O Desvio Padrão é uma medida que serve para avaliarmos a
Dispersão dos Dados da Amostra (representativa da População).
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 24
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Exercício 12:
Um determinado observador coletou os seguintes
valores de vendas de pizzas de calabresa durante
um período de 9 dias:
X 40 56 38 38 63 59 52 49 46
Calcule o Desvio Padrão para Amostra
X X - µ (X - µ )2
40
56
38
38
63
59
52
49
46
SOMA
S=x
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 25
Curso de Estatística- prof. Dr. José Nicolau Pompeo
DESVIO PADRÃO σ
CV= = MÉDIA
POP µ
DESVIO PADRÃO s
CV= =
MÉDIA AMOSTRA X
Exercício 13:
Considere duas carteiras de Aplicações no Mercado
Financeiro, por um prazo de 6 meses.
a) Calcule a rentabilidade média de cada carteira.
b) Calcule o Desvio Padrão Populacional.
c) Calcule o Desvio Padrão Amostral.
d) Calcule o Coeficiente de Variação para a População.
e) Calcule o Coeficiente de Variação para a Amostra.
f) Calcule qual das duas carteiras tem maior
dispersão, aplicando o Coeficiente de Variação.
A B
5% 6%
9% 7%
15% 9%
12% 7%
9% 6%
6% 8%
SOLUÇÃO
µA = =
µB = =
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 28
Curso de Estatística- prof. Dr. José Nicolau Pompeo
XA XA - µ (XA- µ )2 XB XB - µ (X B - µ )2
5% 6%
9% 7%
15% 9%
12% 7%
9% 6%
6% 8%
SOMA SOMA
σA =
σB =
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 29
Curso de Estatística- prof. Dr. José Nicolau Pompeo
SA=
SB=
RESPOSTA:
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 30
Curso de Estatística- prof. Dr. José Nicolau Pompeo
A B
µ 9,33% 7,17%
σ 3,40% 1,07%
s 3,72% 1,17%
C V popul 0,36 0,15
C V amos 0,40 0,16
Exercício 14:
As rentabilidades anuais durante os últimos 5 anos das ações X e
Y estão expressas na tabela abaixo. Qual das duas ações tem
maior dispersão? Calcule os Coeficientes de Variação de X e Y.
X Y
12% 12%
15% 16%
12% 15%
11% 9%
14% 13%
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 32
Curso de Estatística- prof. Dr. José Nicolau Pompeo
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 33
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Exercício 15:
Considere a tabela abaixo, como uma amostra representativa das
taxa de juros de financiamentos cobradas por duas grandes lojas
durante os últimos 6 meses. Calcule a Média, a Variância, o
Desvio Padrão das taxas de juros, e o Coeficiente de Variação
para ambas as lojas, e verifique a loja que apresenta
financiamentos mais caros.
X Y
5,20% 6,50%
8,60% 7,20%
12,50% 9,60%
14% 8,90%
9,80% 7,60%
6,50% 9,50%
PROBABILIDADE
Definimos Probabilidade como sendo o estudo dos fenômenos aleatórios, ou
ainda “uma estimativa do que um indivíduo pensa que seja a viabilidade de
ocorrência de um evento” – sendo que dois indivíduos podem estimar
diferentemente uma probabilidade.
Costuma-se ainda interpretar a Probabilidade como “Frequência Relativa”,
embora essa definição também esteja sujeita a crítica. Porisso, o termo
Probabilidade, na abordagem matemática permanece sem definição.
Iniciaremos o estudo da Probabilidade analisando o ato de jogar uma moeda.
Quando lançamos uma moeda o resultado será cara (K) ou coroa (C).
Embora a jogada de uma moeda constitua um bom exemplo de um evento
aleatório, não dispomos de uma maneira precisa para predizermos o
resultado de nossa jogada, quando jogamos uma vez. No entanto, se
efetuarmos diversas jogadas já podemos predizer alguns resultados.
Se jogarmos uma moeda duas vezes, teremos quatro possibilidades de
resultado.
h ! (n – h) !
2n
TESTES DE HIPÓTESES
Nos exemplos acima, admitimos que a moeda seja equilibrada, ou seja, que
em qualquer jogada havia uma chance de 50% de obter cara e 50% de obter
coroa.
Jogando a moeda apenas uma vez, não temos condições de afirmar se ela é
ou não equilibrada. Porisso estudamos os Testes de Hipóteses.
Sabemos que ao jogar uma moeda “n” vezes podemos obter um número de
caras próximo de n/2. Então surge a pergunta:
Quando decidimos por um teste de 10% , isto significa que há apenas 10% de
chance de que nosso processo de teste afirme que a moeda é desequilibrada
quando é na realidade honesta. Aumentando o número de jogadas podemos
não só obter maior precisão na medida, como verificar com mais chance de
acerto se a moeda é ou não desequilibrada.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 41
Curso de Estatística- prof. Dr. José Nicolau Pompeo
n!
h ! (n – h) !
2n
Chamando de:
“s” o Espaço Amostral
N (A) o número de resultados de um evento A
Pr (A) a Probabilidade de ocorrência deA , escrevemos:
N (A)
Pr(A) =
s
N (A) 3
Pr(A) = =
s 8
N (A) 4
Pr(A) = =
s 36
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 43
Curso de Estatística- prof. Dr. José Nicolau Pompeo
PROBABILIDADE DE
NÃO-OCORRÊNCIA DE UM EVENTO
As vezes interessa-nos saber a Probabilidade de Não-Ocorrência de um
evento. Por exemplo, no jogo de dois dados, estamos interessados em Não
obter a soma 7. Se há um chance de 1/6 de obter soma 7, então há 5/6 de
chance de Não-Obter soma 7.
PROBABILIDADE DE UM A UNIÃO
{ (1, 6) , (2,5), (3,4), (4,3), (5,2), (6,1)}, sendo N(A) = 6, Pr (A) = 6/36.
{ (1, 6) , (2,5), (3,4), (4,3), (5,2), (6,1), (1, 4) , (2,3), (3,2), (4,1)}
Espaço Amostral:
A 1 = KKK A 5 = CKK
A 2 = KKC A 6 = CKC
A 3 = KCK A 7 = CCK
A 4 = KCC A 8 = CCC
PROBABILIDADE DE UM A INTERSECÇÃO
Pr (A ∪ B) = Pr (A) + Pr (B) - Pr (A ∩ B)
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 46
Curso de Estatística- prof. Dr. José Nicolau Pompeo
PRINCÍPIO DA MULTIPLICAÇÃO
Suponha que queiramos adquirir um carro de uma das quatro cores:
vermelho, azul, verde ou branco, e com um dos tipos de carroceria: 4 portas,
2 portas, perua. Quantos tipos de carro devemos considerar ao todo?
PROBABILIDADE CONDICIONAL
É a Probabilidade de ocorrência de um determinado evento, quando se sabe
que outro evento ocorreu.
Exemplo:
Seja A o evento “obter o total 8 com um par de dados”
Seja B o evento “obter 5 na primeira jogada” Pr (B) = 1/6
Calcular Pr (A ⏐B).
REGRA DO PRODUTO
Se a Probabilidade de um evento não depende do conhecimento de ter
acontecido um outro evento, os eventos são definidos como Independentes.
Dois eventos independentes não se afetam um ao outro. O fato de sabermos
que um dos eventos ocorreu nada nos diz sobre se o outro ocorrerá ou não.
Para se calcular a Probabilidade de ocorrência conjunta de dois eventos
independentes, basta multiplicarmos as respectivas Probabilidades. Assim:
Pr (A e B) = Pr (A) x Pr (B)
Calcular a Probabilidade de se obter três caras no lançamento de 3 moedas.
A Probabilidade de cada evento é igual a ½. Logo:
Pr (A e B e C) = 0,125
EXERCÍCIO 16:
Calcule a Probabilidade do número de “caras”que aparecerão jogando-se uma
moeda honesta 12 vezes. Monte uma tabela e determine a amplitude da Zona de
Aceitação necessária para que a chance de se cometer um ERRO TIPO 1, seja
inferior a 5%.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 48
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXERCÍCIO 17:
Qual a Probabilidade de se obter soma 7 ou a soma 11 na jogada de dois dados?
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 49
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXERCÍCIO 18:
Jogando-se uma moeda “n” vezes, qual a Probabilidade de obter-se ao menos
uma cara?
EXERCÍCIO 19:
Suponha que você tenha 40% de chance de receber uma oferta de emprego da
firma de sua primeira escolha, 40% de chance de receber uma oferta da firma de
sua segunda escolha e 16% de chance de receber uma oferta de ambas as firmas.
Qual é a probabilidade de receber uma oferta de qualquer uma das firmas?
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 50
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXERCÍCIO 20:
Suponha que você remova todas as cartas de ouro de um baralho de 52 cartas,
devolva ao baralho o ás de ouro, baralhe as 40 cartas restantes e tire uma ao acaso.
Se a carta tirada é um ás, qual a probabilidade de ser o ás de ouro?
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 51
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Primeiro: devemos saber qual a relação dos valores possíveis, e quais não o são.
Segundo: devemos saber quão viável é cada um desses diversos valores.
Pr (Y=1) = 1/6
Pr (Y=2) = 1/6
Pr (Y=3) = 1/6
Pr (Y=4) = 1/6
Pr (Y=5) = 1/6
Pr (Y=6) = 1/6
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 52
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Pr (X=O) = 1/8
Pr (X=1) = 3/8
Pr (X=2) = 3/8
Pr (X=3) = 1/8
f (a) = Pr ( X = a )
0 ≤ f(a) ≤ 1
• Portanto, para que uma função “f” seja uma Função de Probabilidade
válida para uma variável aleatória, a soma de seus valores possíveis deve
ser 1. Assim:
Pr (X=O) = 1/8
Pr (X=1) = 3/8
Pr (X=2) = 3/8
Pr (X=3) = 1/8
F ( a ) = Pr ( X ≤ a)
E(X) = Σ f (a ) . a i i = µ
i =1
onde a1, a2, ... a n são todos os valores possíveis da variável aleatória X.
1 + 2 + 3 + 4 + 5 + 6
µ = = 3,5
6
µ = E ( X ) = 3,5
E (c X) = c . E (X)
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 56
Curso de Estatística- prof. Dr. José Nicolau Pompeo
E ( X2 ) = Σ f (x ) . x i
2
i
i =1
E (X2) = 24/8 = 3
Var (X) = E ( X2 – 2 X µ + µ 2 )
X X-µ (X-µ)2
1 2,50 6,25
2 1,50 2,25
3 0,50 0,25
4 0,50 0,25
5 1,50 2,25
6 2,50 6,25
SOMA 17,50
1+2+3+4+5+6
µ = = 3,5 Var (X) = 17,50/6 = 2,9167
6
Exercício 21:
Em uma determinada Corretora de Valores os analistas definiram os
possíveis cenários da rentabilidade do mercado de ações para os próximos
6 meses: Ruim, Regular, Bom e Excelente. Pelo consenso do grupo de
analistas, as rentabilidades e suas probabilidades associadas para cada
cenário estão na tabela abaixo:
Rentabilidade Probabilidade
Ruim -10% 10%
Regular 0% 20%
Bom 12% 40%
Excelente 25% 30%
E(X) = 11,30%
EXERCÍCIO 22:
Nas tabelas abaixo, dá-se a Função de Densidade para uma variável
aleatória X. Calcule a Esperança e a Variância dessa variável aleatória.
a)
X f (X)
1 0,250
2 0,250
3 0,250
4 0,250
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 61
Curso de Estatística- prof. Dr. José Nicolau Pompeo
b)
X f (X)
10 0,500
20 0,250
30 0,125
40 0,125
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 62
Curso de Estatística- prof. Dr. José Nicolau Pompeo
X Prob(X)
3 0,06
4 0,14
5 0,24
6 0,28
7 0,20
8 0,08
Dias de Vendas 1 2 3 4 5 6 7 8
Probabilidades 0,04 0,15 0,20 0,25 0,19 0,10 0,05 0,02
Exemplo :
A tabela abaixo registra as rentabilidades anuais das ações A e B negociadas na Bolsa
de Valores. Calcular os valores das médias, desvios padrões e coeficientes de variação
dessas duas ações.
Ação A Ação B
1 991 9,00% 12,00%
1 992 10,00% 10,50%
1 993 12,00% 9,50%
1 994 10,50% 11,00%
1 995 9,50% 12,50%
Média 10,20% 11,10%
DP 1,15% 1,19%
CV 0,1129 0,1075
13%
1995
12%
Ação B
1991
11% 1994
10% 1992 1993
9%
8%
8% 9% 10% 11% 12% 13%
Ação A
O diagrama de dispersão das rentabilidades das duas ações acima mostra que as
rentabilidades das duas ações A e B são parecidas, porém com tendências opostas.
Uma forma de medir a relação entre as duas séries de observações é com as medidas
estatísticas de: COVARIÂNCIA E COEFICIENTE DE CORRELAÇÃO.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 64
Curso de Estatística- prof. Dr. José Nicolau Pompeo
COVARIÂNCIA DA POPULAÇÃO
n
Σ ( Xi - µx ) . (Yi - µy)
i =1
Cov (X,Y) = σx,y =
n
COVARIÂNCIA DA AMOSTRA
n
Σ ( Xi - x ) . (Yi - y)
i =1
Cov (X,Y) = Sx,y =
n-1
VALORES E SIGNIFICADOS DO
COEFICIENTE DE CORRELAÇÃO
Exercício 23:
Considere 5 vendedores de empresa, que efetuam visitas a seus clientes de acordo
com a tabela abaixo, sendo respectivamente o número de produtos vendidos de
acordo com o número de visitas. Calcule a Média, o Desvio Padrão, a Covariância e o
Coeficiente de Correlação entre as visitas e o número de produtos vendidos.
VISITAS Produtos
Vendidos
A 42 140
B 105 330
C 66 190
D 87 350
E 50 110
DPs
COVs
r xy =
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 68
Curso de Estatística- prof. Dr. José Nicolau Pompeo
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 69
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Resposta:
VISITAS Produtos X - µx Y - µy
Vendidos (X - µx ) .(Y-µ
y )
A 42 140 - 28 - 84 2 352
B 105 330 35 106 3 710
C 66 190 -4 - 34 136
D 87 350 17 126 2 142
E 50 110 - 20 - 114 2 280
Média 70 224
DPS 26,04 109,91
SOMA 10 620
COV 2 655
r xy = 0,93
AMOSTRAGEM
Até agora estudamos a Estatística descritiva onde analisamos os dados amostrais da sua
distribuição de frequências ou probabilidades. No entanto o nosso objetivo é fazer
Inferência Estatística sobre a população a partir dos dados amostrais. Nossa grande
questão é: Como se comporta a população a partir de dados que analisamos e dos
resultados que obtivemos na amostra. Como exemplo: se uma amostra indicar que a altura
média da população é de 1,65 m, o que podemos inferir a respeito da população?
Nossa hipótese é de que o fenômeno estudado obedece um determinado modelo
matemático. Verifique que quando aumentamos o número de observações, a distribuição de
probabilidades obedece a uma curva chamada curva de Gauss.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 70
Curso de Estatística- prof. Dr. José Nicolau Pompeo
DISTRIBUIÇÃO NORMAL
A função de probabilidade da Distribuição Normal, tem a forma de um sino.
Muitas populações seguem a distribuição normal, como exemplo citamos:
Uma variável aleatória normal não é uma variável aleatória discreta, e sim uma variável
aleatória contínua. Como exemplo de variável aleatória contínua citamos:
Uma variável aleatória contínua pode tomar qualquer valor numérico real em determinado
intervalo, podendo assumir infinitos valores. Nesses casos as probabilidades são dadas por
intervalos.
• P (X = a) = 0
A área sob a função entre dois valores é a probabilidade de a variável “x” estar entre esses
valores.
A função f(x) é uma função de densidade para a variável aleatória X se satisfaz a
propriedade de que a área sob a curva f(x) à esquerda da reta x=b , à direita da reta x=a, e
acima do eixo “x” é igual a Pr ( a < x < b ). É importante lembrar que a área total sob a
função f(x) deve ser igual a 1.
Logo, para calcular a probabilidade de uma variável aleatória contínua estar entre dois
números, é necessário calcular a área sob a função de densidade entre esses números. O
cálculo da área sob uma curva exige uma técnica de cálculo chamada “integração”.
A figura abaixo mostra quatro distribuições normais com a MESMA VARIÂNCIA mas
com MÉDIAS DIFERENTES.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 72
Curso de Estatística- prof. Dr. José Nicolau Pompeo
X - µ
Z= dado X
σ encontramos Z
ou seja,
Prob ( a < Z < b ) = φ (b) - φ (a)
φ (a) = Pr ( Z < a) e φ (b) = Pr ( Z < b)
ou seja φ (b) é a função de distribuição acumulada de Z.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 74
Curso de Estatística- prof. Dr. José Nicolau Pompeo
1 2
-(1/2) z
f (Z) = . e
√ 2π
tem as seguintes propriedades:
• E (Z) = 0
• Var (Z) = 1
• f (Z) → 0 quando Z → + ∞ ou - ∞
• A curva é simétrica ao redor da média. A área total sob a curva é
definida como 100%; cada metade da curva tem 50% da área total.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 75
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Exemplo:
A série de observações X tem média igual a 40 e desvio padrão igual a 10. Se
retirarmos uma observação dessa série, qual é a probabilidade que seu valor
seja igual ou menor que 52,4?
Solução:
O primeiro passo é calcular o valor de Z.
X - µ 52,4 - 40
Z= = = + 1,24
σ 10
Z=1,24
Exemplo:
Um vendedor afirma ter vendido $ 1 350 000 durante um ano. Com isso
afirma estar entre os 5% dos vendedores que mais venderam na empresa.
Considerando que as vendas realizadas tem distribuição normal com média
igual a $ 1 250 000 e desvio padrão igual a $ 100 000, verifique se a
afirmação do vendedor é verdadeira.
Solução:
Se consultarmos a tabela de Distribuição Normal veremos que a
probabilidade de 0,95 está situada entre Z = 1,64 (com probabilidade igual a
0,9495) e Z= 1,65 (com probabilidade igual a 0,9505). Interpolando
encontramos Z= 1,645 ( com probabilidade de 0,95).
X - µ X - 1 250 000
Z= = = + 1,645
σ 100 000
• φ ( - a) = Pr (Z < - a ) = 1 - φ (a)
• Pr (Z > b ) = 1 - φ (b)
EXERCÍCIO 24:
A série de observações X tem média igual a 40 e desvio padrão igual a 10. Se
retirarmos uma observação dessa série, qual é a probabilidade que seu valor
seja igual ou menor que 35?
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 82
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXERCÍCIO 25:
A série de observações X tem média igual a 40 e desvio padrão igual a 10. Se
retirarmos uma observação dessa série, qual é a probabilidade que seu valor
seja igual ou menor que 60 e maior ou igual a 25?
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 83
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXERCÍCIO 26:
Sendo Z uma Distribuição Normal Padronizada, calcule:
a) Pr (Z > 1 )
b) Pr ( Z < - 1)
c) Pr ( 1 < Z < 1,5 )
d) Pr ( - 1 < Z < 2 )
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 84
Curso de Estatística- prof. Dr. José Nicolau Pompeo
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 85
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXERCÍCIO 27:
Os depósitos efetuados em um determinado Banco durante um determinado mês, são
distribuídos normalmente, com média de R$ 10 000,00 e desvio padrão de R$ 1 500,00. Se
um depósito é selecionado ao acaso, encontre a probabilidade de que o depósito seja:
a) igual ou menor que R$ 10 000,00
b) um valor entre R$ 12 000,00 e R$ 15 000,00
c) maior que R$ 20 000,00
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 86
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXERCÍCIO 28:
Em um exame final de Métodos Quantitativos, a média foi de 75 o desvio padrão de 15.
Calcule a probabilidade de um estudante:
a) obter uma nota superior a 70
b) obter nota superior a 70 e inferior a 80.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 87
Curso de Estatística- prof. Dr. José Nicolau Pompeo
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 88
Curso de Estatística- prof. Dr. José Nicolau Pompeo
Ação A Ação B
Mês 1 6,00% 7,30%
Mês 2 7,20% 6,80%
Mês 3 6,80% 6,40%
Mês 4 6,40% 8,20%
Mês 5 6,20% 8,70%
Média
DP
CV
VISITAS Produtos
Vendidos
A 60 200
B 120 420
C 80 250
D 65 140
E 72 150
4.O processo de empacotamento de arroz foi ajustado de maneira que uma média
µ = 13 kg é colocada em cada saco. O desvio padrão do peso líquido é de σ = 0,1 kg
e sabe-se que a distribuição dos pesos segue uma distribuição normal. Calcule a
probabilidade de que um saco escolhido aleatoriamente contenha entre 12,9 e 13,2
kg de arroz. Calcule ainda a probabilidade de que o peso esteja entre 13,1 e 13,2 kg.
6. A vida útil de uma certa marca de pneus tem uma distribuição normal com
µ= 38 000 km e σ = 3 000 km.
a) Qual a probabilidade de que um pneu escolhido aleatoraiamente tenha uma
vida útil de no mínimo 35 000 km?
b) Qual a probabilidade de que ele dure mais do que 45 000 km?
INTERVALOS DE CONFIANÇA
É um intervalo baseado em observações de uma amostra e construído de
maneira que haja uma probabilidade especificada de o intervalo conter o
verdadeiro valor desconhecido de um parâmetro.
Em geral calculamos intervalos de confiança que tenham uma chance de
95% de conter o verdadeiro valor.
Sabemos que para uma amostra, a sua média x se aproxima da média da
população µ.
Surge a pergunta: Quão próximo de µ estará x ?
A resposta a esta pergunta nos obriga a buscar um valor “c” de tal maneira
que µ esteja contido no intervalo ( ⎯x - c) e (⎯x + c).
O procedimento estatístico consiste em fixarmos um valor de 95% para a
Probabilidade do número estar contido nesse intervalo. Logo, precisamos
determinar a amplitude do intervalo para que haja 95% de chance de ele
conter o verdadeiro valor.
Vamos então calcular o valor de “c” que verifica a equação:
⎯x - µ ⎯x - µ
Z = = √n
√ σ2 / n σ
Na tabela que fornece a Probabilidade para a Distribuição Normal
Padronizada, sendo (-z < Z < z ) verificamos que uma probabilidade igual a
0,95 tem como correspondência z = 1,96.
Portanto afirmamos que (-1,96 < Z < 1,96).
Observe que ao substituirmos (⎯x - µ ) por “+ c” e “ – c” obtemos
c√ n 1,96 σ
= 1,96 ou seja : c=
σ √ n
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 91
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXEMPLO:
De uma determinada população retiramos uma amostra com 100 elementos onde a
média amostral é igual a 7 e o Desvio Padrão igual a 40. Determine o intervalo de
confiança para a média da população (µ) considerando um nível de confiança igual a
95%.
Sabemos que:
1,96 σ
c= e que ⎯
√ n
logo:
1,96 x 40
= c = 7,84 portanto: 7 – 7,84 < µ < 7 + 7,84 ou ainda
√ 100
Conclusão: Há 95% de chance de que média populacional µ esteja entre 0,84 e 14,84.
Concluímos então, que se X tem uma Distribuição Normal, então a média amostral
⎯x terá uma Distribuição Normal com média µ e variância σ2/ n .
TESTES DE HIPÓTESES
Ao trabalharmos com Teste de Hipóteses, elegemos um “valor hipotético” como
parâmetro da população que está sendo estudada. Depois coletamos uma
amostra a mais aleatória possível e comparamos a estatística hipotética com o
parâmetro suposto. Por exemplo, calculamos a média amostral ⎯x e
comparamos com a média da população - µ - ( eleita como parâmetro).
A seguir, ou aceitamos ou rejeitamos o valor hipotético como sendo correto.
- c +c
H0 : µ = µ*
EXEMPLO:
Consideremos os pesos de 27 pessoas coletadas como amostra de uma população de 500
pessoas, de acordo com a tabela abaixo ( em kg)
Queremos testar a hipótese de que esses pesos foram extraídos de uma Distribuição Normal
com média 110. (Note que a média amostral é igual a 102,2 e desvio padrão amostral igual
a 11,05).
x - µ
t = √n
s
terá Distribuição t com ( n - 1 ) graus de liberdade.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 94
Curso de Estatística- prof. Dr. José Nicolau Pompeo
102,2 - 110
t = √ 27 = - 3,67
11,05
Se a hipótese é verdadeira, então “t” tem Distribuição “t” com 26 graus de
liberdade. Ao consultarmos a tabela abaixo verificamos que o valor crítico para um
teste de 1% é 2,779 , ou seja, podemos rejeitar a Hipótese Nula ao nível de 1%
quando o valor da estatística de teste é exterior a 2,779. No caso, ( - 3,67 ) é
exterior e estamos na Região Crítica ou de Rejeição.
√n ( ⎯x - µ * )
Z =
σ
( X1 - ⎯x ) 2 + ( X2 - ⎯x ) 2 + ... + ( Xn - ⎯x ) 2
S=
n - 1
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 95
Curso de Estatística- prof. Dr. José Nicolau Pompeo
√n ( ⎯x - µ * )
t =
s
APÊNDICE
DISTRIBUIÇÃO BINOMIAL
A Distribuição Binomial é uma distribuição discreta de probabilidade, aplicável quando um
experimento é realizado “n” vezes, cada prova tendo uma probabilidade de sucesso “p” e
sendo independente de qualquer outra prova anterior.
Pr (A ∩ B) = Pr (A) . Pr (B) = p . p = p2
Podemos afirmar igualmente que a chance de falha nas 10 provas é dado por
“(1 – p) 10”. Ou seja, se p= 0,8 então a chance de 10 falhas é de “0,2 10”.
10 10 !
2 = = 45
2 ! ( 10 – 2 ) !
10
2 x 0,8 2 x 0,2 8 = 7,373 x 10 -5
Prob ( X = i ) = n
i . p i . ( 1 – p ) n-i
Pr ( Z = 1 ) = p
Pr ( Z = 0 ) = 1 – p
Var (X) = Var (A1) + Var (A2) + Var (A3) + ... + Var (An) = n p ( 1 – p )
Exemplo:
Um exame de múltipla escolha comporta 20 questões. Cada questão tem quatro respostas
possíveis (com apenas uma certa). Há, assim, 0,25 de probabilidade de responder a uma
questão corretamente, “por palpite”. Qual a probabilidade de acertar ao menos 10 questões
nessas condições?
Prob ( X = i ) = n
i . p i . ( 1 – p ) n-i
Prob ( X = k ) = 20
k . 0,25 k. ( 0,75 ) 20 - k
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 99
Curso de Estatística- prof. Dr. José Nicolau Pompeo
k Pr ( X = k ) k Pr ( X = k )
0 0,003 6 0,168
1 0,021 7 0,112
2 0,067 8 0,060
3 0,133 9 0,027
4 0,189 10 0,009
5 0,202 11 0,003
EXERCÍCIO 30:
Calcule a probabilidade de em uma família de quatro crianças (admitindo uma
probabilidade de ½ no nascimento de um filho homem ou mulher) haver:
a) pelo menos um menino
b) pelo menos uma menina e um menino
Prob(1 menino) = 4
1 . ( ½) 1 ( 1/2) 4–1
= 1/4
Prob(2 meninos)= 4
2 . ( ½) 2 ( 1/2) 4-2
= 3/8
Prob(3 meninos)= 4
3 . ( ½) 3 ( 1/2) 4-3
= 1/4
Prob(4 meninos)= 4
4 . ( ½) 4 ( 1/2) 4-4
= 1/16
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 100
Curso de Estatística- prof. Dr. José Nicolau Pompeo
= 1 - ( 1/2 ) 4 = 15/16
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 101
Curso de Estatística- prof. Dr. José Nicolau Pompeo
TAMANHO DA AMOSTRA
Quando afirmamos que o valor da média amostral não coincide com a média da
população, estamos estimando essa média amostral com uma certa margem de erro.
Daí a necessidade de trabalhar com Intervalos de Confiança. Quando fixamos a
Probabilidade de ( µ ) estar no intervalo, por exemplo, 90%, estamos afirmando que
há uma margem de 10% do valor desconhecido não estar no intervalo. Então, ao
estabelecer a Probabilidade de acerto estamos automaticamente estabelecendo a
Probabilidade de erro. Sendo o erro, por exemplo, igual a 10%, é fácil verificar que as
duas caudas da curva de Gauss, para a Distribuição Normal, conterão valores
porcentuais que guardam uma simetria, ou seja cada cauda terá um erro de 5%.
Chamando então o erro de ( α ) cada cauda terá um erro igual a α/2, sendo o Desvio
Padrão Normal Padronizado denominado de Z α/2.
Quando trabalhamos com amostras cada vez maiores estamos variando o valor do
desvio padrão amostral. Nesse caso podemos afirmar que:
x -µ ⎯x - µ
Z α/2 = = √n
√ S2 / n S
ou ainda:
Sx Sx
x -Z α/2 . <µ< x + Z α/2
√n √n
onde, Sx
Z α/2 = e (erro de estimativa)
√n
Da expressão acima podemos tirar o tamanho da amostra que é dado por:
2
Z α/2 . Sx
n =
e
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO 102
Curso de Estatística- prof. Dr. José Nicolau Pompeo
EXEMPLO:
Calcular o tamanho de uma amostra com nível de confiança igual a 95% sabendo que
o erro de estimativa é igual a 0,50 e o desvio padrão igual a 2,45. (Observe na tabela
que para um nível de confiança igual a 95% temos Z α/2 = 1,96).
Então:
n = ( 1,96 x 2,45/ 0,50)2 = 92,24
EXERCÍCIO 31:
Considere uma amostra de 64 elementos cujo desvio padrão é igual a 16. Se o valor da
média amostral é igual a 50, estime a média da população ( µ ) considerando um
intervalo de confiança com nível de confiança igual a 95%. (Sendo a amostra
suficientemente grande, a distribuição é normal e a probabilidade de 95% ao redor da
média – de acordo com a tabela – estabelece os valores de desvios padrões
normalizados iguais a Z = - 1,96 e Z = + 1,96)
x -µ
Z α/2 = =
√ S /n
2
µx = x +Z α/2 S/√n
µx = 50 + 1,96. 16 / √ 64
µx = 50 + 3,92
Bibliografia Consultada:
• Kazmier, Leonard J.
• Estatística Aplicada à Economia e Administração,
Ed. Mc Graw Hill, 1982
• Spiegel, Murray R.
• Estatística, Ed. McGraw Hill do Brasil, 1981
• Wonnacott, Thomas H.
• Estatística Aplicada à Economia e Administração
Livros Técnicos e Científicos Editora S A , 1981
• Hoel, Paul G.
• Estatística Elementar, Ed. Atlas, 1977
• Lapponi, Juan C.
• Estatística, Laponi Treinamento e Editora, 1977