Estatística II
1 1 4
e, portanto, P(25 ≤ X < 29) = (29 25) 4
80 80 80
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.2 – A função de densidade
probabilidade
Dizemos que f(x) (fdp)
é uma função contínua de probabilidade ou
função de densidade de probabilidade para uma variável aleatória
contínua X, se satisfaz duas condições:
i) 𝑓(𝑥) ≥ 0, para todo 𝑥 ∈ (−∞, +∞)
ii) A área definida por f(x) é igual a 1.
Com auxílio do cálculo diferencial e integral, podemos
caracterizar a condição ii) através de
f ( x)dx 1.
Da mesma forma, para calcular probabilidades, temos que para
b
𝑎 ≤ 𝑏, P(a X b) a f ( x)dx; , a integral indica a área sob f(x) definida
pelo intervalo [a; b].
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.2 – A função de densidade
probabilidade (fdp)
Note que, pela forma como a atribuímos as probabilidades no
caso contínuo, teremos área zero sob qualquer valor individual, isto
é, P(X = k) = 0 para qualquer k. Portanto, em se tratando de variáveis
aleatórias contínuas, a probabilidade de ocorrência de um valor
isolado é sempre zero e, consequentemente, as probabilidades
calculadas sobre os intervalos [a; b], [a; b), (a; b] e (a; b) são as
mesmas, para qualquer valor de a e b.
Exemplo: Num teste intelectual com alunos de um colégio Y, o
tempo para realização de uma bateria de questões de raciocínio
lógico é medido e anotado para ser comparado com um modelo
teórico. Este teste é utilizado para identificar o desenvolvimento da
capacidade de raciocínio lógico e auxiliar a aplicação de medidas
corretivas. O modelo teórico considera T, tempo de teste em minutos,
como uma variável aleatória contínua com função de densidade de
probabilidade dada por:
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.2 – A função de densidade
probabilidade
1 (fdp)
(t 4) se 8 t 10;
40
3
f (t ) se 10 t 15
20
0 caso contrário
O gráfico da fdp é apresentado a seguir (construiremos ele no
software R). Deve ser notado que, pela definição de f(x), ela se
anula para t < 8 ou t >15.
0.05
0.00
6 8 10 12 14 16 18
t
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.2 – A função de densidade
probabilidade
Através do uso de(fdp)
integral, essa mesma probabilidade seria
calculada da seguinte forma:
12 10 12
P(9 T 12) f (t )dt f (t )dt f (t )dt
9 9 10
10
1 t
12
3
2
10 1 12 3
9 40
(t 4)dt
10 20
dt 4t t
40 2 9 20 10
11 6 7
0, 4375
80 20 16
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.3 – Valor Médio de uma Variável
Aleatória Contínua
O valor esperado ou média da variável aleatória contínua X, com
fdp dada por 𝑓(𝑥), é dada pela expressão:
E ( X ) xf ( x)dx.
Vamos a um exemplo:
Investidores estudaram uma certa carteira de ações e
estabeleceram um modelo teórico para a variável R, rendimento das
ações (em mil R$). Suponha que R é uma variável aleatória contínua
com a seguinte função de densidade:
1 r
1 , se 0 r 20
f (r ) 40 10
0, caso contrário
3 3 9
( x )2
1
f X ( xi ) e 2 2
x
2
E(X) =
Var(X) = 2
2e-05
1e-05
0e+00
x
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.4 – O modelo de distribuição Normal
Algumas propriedades da densidade da Normal podem ser,
facilmente, observadas de seu gráfico:
fX(xi) é simétrica em relação à ;
fX(xi) 0 quando x ;
o valor máximo de fX(xi) se dá para x = e 𝜇 − 𝜎 e 𝜇 + 𝜎 são
pontos de inflexão de f(xi)
Quando temos 𝜇 = 0 e 𝜎 2 = 1, temos uma distribuição padrão
ou reduzida, ou brevemente N(0,1). Para essa a função de densidade
reduz-se a
z2
1
f z ( zi ) ( z ) e 2
x
2
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.4 – O modelo de distribuição Normal
Assim, o gráfico da normal padrão pode ser representado por:
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.4 – O modelo de distribuição Normal
Vamos partir de um exemplo prático:
Vamos trabalhar com uma série dos fundos de investimentos da
Petrobrás gerenciado pelo Bando do Brasil. Observou-se que o
comportamento dos fundos entre 02/01/2012 a 13/03/2012 tiveram
um comportamento muito aproximado a uma curva normal como
pode ser observado no gráfico abaixo:
A média ficou em torno de R$ 7,27
a cota do fundo e o desvio padrão
foi de R$ 0,295.
a 2
b) Qual deveria ser o preço máximo (em R$) para que o investidor
tenha uma probabilidade de lucro pequena, de cerca de 10%?
Vamos verificar essa possibilidade com o auxílio do R.
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.4 – O modelo de distribuição Normal
Aplicações da v.a. reduzida.
A transformação da normal para a sua correspondente reduzida
z~N(0,1). Para determinar a probabilidade de X [a,b], procedemos
com o seguinte cálculo:
P(a X b) = P(a - X - b - ) =
b) Qual deveria ser o preço máximo (em R$) para que o investidor
tenha uma probabilidade de lucro pequena, de cerca de 10%?
Assim, precisamos obter um valor em R$ tal que: P(X < R$) = 0,1.
Então,
X 7, 27 R$ 7, 27 R$ 7, 27
P P( Z ) 0,1
0, 295 0, 295 0, 295
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.5 – A distribuição t de student
A distribuição t de Student é importante no que se refere a
inferências sobre médias populacionais.
Diz-se que uma variável aleatória contínua T tem distribuição t de
Student se sua função de densidade é dada por:
𝑣+1 𝑣+1
𝑡 2 −
2
𝑓 𝑡; 𝑣 = 2 1+ , −∞ < 𝑡 < ∞
𝑣 𝑣
𝜋𝑣
2
Essa expressão, certamente, é assustadora! Mas eis uma boa
notícia: não precisaremos dela para calcular probabilidades! No
entanto, é interessante notar duas características básicas dessa
expressão: o argumento t da função aparece elevado ao quadrado e fT
depende apenas do número de graus de liberdade da qui-quadrado e,
portanto, o parâmetro desta distribuição é, também, o número de
graus de liberdade.
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.5 – A distribuição t de student
Em termos de média e variância a distribuição t de Student, (com
v graus de liberdade) que será indicada por t(v), será:
𝑣
𝐸 𝑡 =0 𝑉𝑎𝑟 𝑡 =
𝑣−2
Quanto maior o valor de v mais t aproxima-se de uma normal
N~(0,1), isso pode ser verificado no gráfico abaixo:
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.5 – A distribuição t de student
Assim como no caso da normal, seria necessária uma tabela para
cada valor de v. Os programas computacionais de estatística
calculam probabilidades associadas a qualquer distribuição t. Mas
nos livros didáticos é comum apresentar uma tabela da distribuição t
que envolve os valores críticos, ou seja, valores que deixam
determinada probabilidade acima deles. Mais precisamente, o valor
crítico da t(v) associado à probabilidade α é o valor tv;α tal que
𝑃 𝑡 𝑣 > 𝑡𝑣;𝛼 = 𝛼
Para encontrar o valor tabelado basta pegarmos o grau de
liberdade v e compararmos com a nossa probabilidade de cometer o
erro tipo I (isso será visto mais adiante).
Suponha que tenhamos v=6 e queiramos um erro de 5% para uma
distribuição uni caudal, então teríamos:
Tabela Bicaudal
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.6 – A distribuição Qui-Quadrado
A distribuição qui-quadrado é um caso específico da distribuição
Gama.
Como definição temos:
Uma variável aleatória contínua Y tem distribuição qui-quadrado
com v graus de liberdade (denotada por 2 (𝑣) ) se sua função
densidade for dada por:
𝑣 𝑦
1 −1 −
𝑣 𝑦 2 𝑒 2 ,𝑦 > 0
𝑣
2
22
𝑓 𝑦; 𝑣 = 0, 𝑦 <0
A média e variância para a qui-quadrado são:
E(Y)=v Var(Y)=2v
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.6 – A distribuição Qui-Quadrado
Graficamente a distribuição qui-quadrado se comporta da seguinte
forma:
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.6 – A distribuição Qui-Quadrado
Usando a tabela qui-quadrado para v=10, observe que
P(Y>2,558)=0,99; ao passo que P(Y>18,307)=0,05.
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.6 – A distribuição F de Snedecor
Sejam U e V duas v.a. independentes, cada uma com distribuição
qui-quadrado, com v1 e v2 graus de liberdade, respectivamente.
Então, a v.a.
U v1
W
V v2
Tem densidade dada por:
𝑣1
(𝑣1 +𝑣2 ) 2 𝑣1 2 𝑤 (𝑣1 −2)/2
𝑔 𝑤, 𝑣1 , 𝑣2 = ,
(𝑣1 /2)(𝑣2 /2) 𝑣2 (1 + 𝑣1 𝑓/𝑣2 ) (𝑣1 +𝑣2 )/2
𝑤>0
Diremos que W tem distribuição F de Snedecor, com 𝑣1 e 𝑣2
graus de liberdade, e usaremos a notação W~F(𝑣1 , 𝑣2 ). Podemos
mostrar que:
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.6 – A distribuição F de Snedecor
𝑣2 2𝑣2 2 (𝑣1 +𝑣2 −2)
𝐸 𝑊 = 𝑉𝑎𝑟 𝑊 =
𝑣2 −2 𝑣1 (𝑣2 −2)2 (𝑣2 −4)
O gráfico típico de uma distribuição F varia conforme seu grau de
liberdade como pode ser verificado abaixo:
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.6 – A distribuição F de Snedecor
Vamos considerar que nossa distribuição F tenha comportamento
de média e variância com a seguinte característica W~F(5,7).
Consultando a Tabela F teremos: P(F > 3,97) = 0,05, ou P (F 3,97)
= 0,95.