Aplicação Da Distr Normal Finanças

UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS

FACULDADE DE ECONOMIA
Estatística II
Prof. Dr. Ricardo Bruno Nascimento dos Santos

VARIÁVEIS ALEATÓRIAS
CONTÍNUAS
I.2 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I.2.1 - Introdução
Definição: Uma função X definida pelo espaço amostral  e
assumindo valores num intervalo de ´números reais, é dita uma
variável aleatória contínua.
A principal característica de uma v.a. contínua é que, sendo
resultado de uma mensuração, o seu valor pode ser pensado como
pertencendo a um intervalo ao redor do valor efetivamente
observado (sempre nosso valor efetivamente observado será a
média).
Podemos então destacar as diferenças da v.a. discreta e contínua
como sendo:
Exemplos de v.a. contínuas:
- Tempo de resposta de um sistema computacional
- Tempo de vida de uma máquina
- Resistência de um material
- Oscilação diária em um índice na bolsa de valores
Além destas podemos também destacar:

De forma semelhante àquela desenvolvida para variáveis discretas,
precisamos estabelecer para as contínuas a atribuição de probabilidades às
suas diversas realizações que, neste caso, podem assumir um número
infinito de valores diferentes. Abordamos esta questão através do próximo
exemplo.
Exemplo: Estudos anteriores revelam a existência de um grande lençol
de água no subsolo de uma grande região. No entanto, sua profundidade
ainda não foi determinada, sabendo-se apenas que o lençol pode estar
situado em qualquer ponto, entre 20 e 100 metros.
Vamos supor que escolhemos, ao acaso, um ponto nessa região e
dispomos de uma sonda que, ao fazer a perfuração, detecta com precisão à
profundidade do reservatório de água. Denotamos por X a variável
aleatória representando a profundidade.
Notemos que, apesar de X poder ser qualquer número entre 20 e 100
metros, o instrumento, com que trabalhamos, pode não ser tão preciso
como gostaríamos. Por exemplo, uma profundidade de 32,571 metros
poderia ser medida por 32,6 metros.
Vamos assumir que temos um instrumento ideal que não faz
aproximações. Nessas condições, podemos supor a sonda acoplada a
um instrumento indicador da profundidade e um dispositivo que,
quando a sonda encontrar água, provoque a imediata interrupção da
perfuração.
Uma vez não que temos informações adicionais a respeito da
profundidade do lençol, é razoável assumirmos que a sonda pode
parar em qualquer ponto entre 20 e 100 metros, sem que tenhamos
motivos para privilegiar essa ou aquela profundidade. Assim,
consideraremos todos os pontos como igualmente prováveis. Se
utilizarmos a mesma idéia de atribuir a cada possível ponto uma
probabilidade, teremos uma dificuldade extra, pois eles pertencem a
um intervalo de [20; 100], em que existem infinitos números reais.
Assim, se cada um deles tiver, individualmente, probabilidade
maior que 0, a soma das probabilidades será igual a infinito e não 1,
como requer a definição da função de probabilidades. Em geral, em
situações como esta, não é interessante considerar um único valor
para a variável aleatória, mas intervalos de valores na atribuição de
probabilidades. Neste caso, sabemos que o espaço amostral
corresponde ao intervalo [20; 100] e as profundidades são
igualmente prováveis.
Suponha por um momento, que dividimos o espaço amostral em 8
intervalos de comprimento 10. Logo, é razoável atribuir aos
intervalos a probabilidade 1/8, correspondendo à relação entre o
comprimento de cada um deles e o comprimento do espaço amostral.
Isto é, 10 para 80 ou 1/8.
Assim, como dividimos em 8 faixas de igual comprimento e sem
intersecção entre elas, teremos os intervalos [20; 30), [30; 40), ...,
[90; 100] todos com a mesma probabilidade de 1/8, pois todos tem o
mesmo tamanho.
Para construirmos um histograma, podemos supor que 1/8 é a
frequência relativa da ocorrência de cada um dos intervalos. As
ordenadas do gráfico são as densidades, calculadas de modo que a
área de cada retângulo seja a frequência relativa (probabilidade) do
intervalo.
Note que, dada as características do problema, a divisão em 8 intervalos

produziu o mesmo valor de densidade de 1/80 pra todos eles. Se dividirmos
o intervalo [20; 100] em 16 faixas iguais, utilizando o mesmo argumento
anterior, temos que os intervalos [20; 25), [25; 30), ..., [95; 100] terão todos
a mesma probabilidade 1/16. O histograma correspondente será:
O histograma mostra que apesar de termos diferentes intervalos, a

densidade permanece a mesma, igual a 1/80.
Podemos continuar esse procedimento aumentando cada vez mais a
quantidade de faixas, com a consequente diminuição de suas amplitudes de
tal forma que, em uma situação teórica com infinitos intervalos, temos o
seguinte histograma:
Estamos agora em condições de caracterizar, completamente a
atribuição de probabilidade para o caso contínuo. Ela será definida
pela área abaixo de uma função positiva, denominada de função de
densidade de probabilidade (fdp). Observe que a densidade em si não
é uma probabilidade, mas uma função matemática que nos auxilia na
atribuição de probabilidades. Assim, para a variável aleatória
contínua X representando a profundidade do lençol de água, a fdp f é
dada por:
1 / 80 para 20  x  100;
f ( x)  
 0 para x  20 ou x  100.
Tendo em vista que, nesse exemplo a função de densidade é
bastante simples, a probabilidade de que a profundidade do lençol
esteja em um dado intervalo pode ser calculada com o uso de área de
figuras planas. Assim, para obter a probabilidade de uma
profundidade entre 25 e 29, calculamos a área do retângulo:
1 1 4
e, portanto, P(25 ≤ X < 29) = (29  25)   4 
80 80 80
I.2.2 – A função de densidade
probabilidade
Dizemos que f(x) (fdp)
é uma função contínua de probabilidade ou
função de densidade de probabilidade para uma variável aleatória
contínua X, se satisfaz duas condições:
i) 𝑓(𝑥) ≥ 0, para todo 𝑥 ∈ (−∞, +∞)
ii) A área definida por f(x) é igual a 1.
Com auxílio do cálculo diferencial e integral, podemos
caracterizar a condição ii) através de

 f ( x)dx  1.

Da mesma forma, para calcular probabilidades, temos que para
b
𝑎 ≤ 𝑏, P(a  X  b)  a f ( x)dx; , a integral indica a área sob f(x) definida
pelo intervalo [a; b].
probabilidade (fdp)
Note que, pela forma como a atribuímos as probabilidades no
caso contínuo, teremos área zero sob qualquer valor individual, isto
é, P(X = k) = 0 para qualquer k. Portanto, em se tratando de variáveis
aleatórias contínuas, a probabilidade de ocorrência de um valor
isolado é sempre zero e, consequentemente, as probabilidades
calculadas sobre os intervalos [a; b], [a; b), (a; b] e (a; b) são as
mesmas, para qualquer valor de a e b.
Exemplo: Num teste intelectual com alunos de um colégio Y, o
tempo para realização de uma bateria de questões de raciocínio
lógico é medido e anotado para ser comparado com um modelo
teórico. Este teste é utilizado para identificar o desenvolvimento da
capacidade de raciocínio lógico e auxiliar a aplicação de medidas
corretivas. O modelo teórico considera T, tempo de teste em minutos,
como uma variável aleatória contínua com função de densidade de
probabilidade dada por:
probabilidade
1 (fdp)
(t  4) se 8  t  10;
 40

 3
f (t )   se 10  t  15
 20
 0 caso contrário


O gráfico da fdp é apresentado a seguir (construiremos ele no
software R). Deve ser notado que, pela definição de f(x), ela se
anula para t < 8 ou t >15.
Vamos verificar agora se a função f(t) satisfaz a definição de

densidade. Para calcular P(9 < T  12), vamos obter a área sob f(t)
no intervalo (9; 12]:
probabilidade (fdp)
Assim P(9< T  12) = 7/16 valor esse obtido pela soma do
trapézio definido no intervalo (9, 10) com o retângulo determinado
pelo intervalo [10,12] (veja a figura).
0.15
0.10
f(t)
0.05
0.00
6 8 10 12 14 16 18
t
probabilidade
Através do uso de(fdp)
integral, essa mesma probabilidade seria
calculada da seguinte forma:
12 10 12
P(9  T  12)   f (t )dt   f (t )dt   f (t )dt 
9 9 10
10
1 t 
12
 3 
2
10 1 12 3

9 40
(t  4)dt  
10 20
dt    4t    t  
40  2 9  20 10
11 6 7
   0, 4375
80 20 16
I.2.3 – Valor Médio de uma Variável
Aleatória Contínua
O valor esperado ou média da variável aleatória contínua X, com
fdp dada por 𝑓(𝑥), é dada pela expressão:

E ( X )     xf ( x)dx.

Já a sua variância é dada por:


   ( x   ) 2 f ( x)dx.
2

Como no caso discreto, a variância é a medida de dispersão mais

utilizada na prática. Aqui podemos, também, utilizar a expressão
alternativa 𝜎 2 = 𝐸 𝑋 2 − 𝜇2 , com 𝐸 𝑋 2 sendo calculada como:

E ( X )   x 2 f ( x)dx.
2

I.2.3 – Valor Médio de uma Variável
Aleatória Contínua
O desvio padrão é a raiz quadrada da variância e, como já
mencionado anteriormente, tem a mesma unidade de medida da
variável original, o que facilita a interpretação dos seus valores.
Vamos a um exemplo:
Investidores estudaram uma certa carteira de ações e
estabeleceram um modelo teórico para a variável R, rendimento das
ações (em mil R$). Suponha que R é uma variável aleatória contínua
com a seguinte função de densidade:
1  r 
   1  , se 0  r  20
f (r )   40  10 

 0, caso contrário
Vamos aplicar no Software R

I.2.3 – Medidas de Posição para Variáveis Aleatórias
Contínuas
Vamos determinar a média e a variância de R. Temos,
20 20
20 1  r  1 r  1 r 
3
20 2
35
 r   1dr         5  R$ mil.
0 40  10  400  3 0 40  2 0 3 3
Para variância, calculamos primeiro E(R2):
20 20
20 1  r  1 r 
4
1 r 3
200 500
E(R )  
2 2
r   1dc        100   R$ mil.
0 40  10  400  4 0 40  3 0 3 3
2
500  35  275
Assim:  2
 E ( R 2
)   2
      R $30,56 mil 2
3  3  9
Portanto o desvio padrão será:  R  30,56  R$5,53 mil

Qual seria a probabilidade de conseguirem um rendimento entre 8
e 10 mil? Vamos fazer no R
I.2.4 – O modelo de distribuição Normal
A distribuição normal é uma das mais essenciais e importantes
distribuições da estatística, conhecida também como Distribuição de Gauss
ou Gaussiana. Foi primeiramente introduzida pelo matemático Abraham de
Moivre.
Além de descrever uma série de fenômenos físicos e financeiros,
possui grande uso na estatística inferencial. É inteiramente descrita por
seus parâmetros de média e desvio padrão, ou seja, conhecendo-se estes
consegue-se determinar qualquer probabilidade em uma distribuição
Normal.
Um interessante uso da Distribuição Normal é que ela serve de
aproximação para o cálculo de outras distribuições quando o número de
observações fica grande. Essa importante propriedade provém do Teorema
do Limite Central que diz que "toda soma de variáveis aleatórias
independentes de média finita e variância limitada é aproximadamente
Normal, desde que o número de termos da soma seja suficientemente
grande" (Ou seja, que a amostra seja maior que 30 observações).
Diz-se que X tem Distribuição Normal com média  e variância
2 se sua função de densidade de probabilidade (fdp) é:
( x )2
1 
f X ( xi )  e 2 2
x 
 2
E(X) = 
Var(X) = 2
Pode-se ainda verificar que os parâmetros  e 2 representam,

respectivamente, a média e a variância da distribuição. A
demonstração requer algumas manipulações de integral. O que não
vai ser demonstrado aqui. Assim quando indicarmos que X ~ N (;
2), segue imediatamente que E(X) =  e Var(X) = 2.
Graficamente a curva normal comporta-se da seguinte maneira:
Distribuição Nomal(60.000,8.300)
4e-05
3e-05
f(x)
2e-05
1e-05
0e+00
30000 40000 50000 60000 70000 80000 90000
x
Algumas propriedades da densidade da Normal podem ser,
facilmente, observadas de seu gráfico:
fX(xi) é simétrica em relação à ;
fX(xi)  0 quando x  ;
o valor máximo de fX(xi) se dá para x =  e 𝜇 − 𝜎 e 𝜇 + 𝜎 são
pontos de inflexão de f(xi)
Quando temos 𝜇 = 0 e 𝜎 2 = 1, temos uma distribuição padrão
ou reduzida, ou brevemente N(0,1). Para essa a função de densidade
reduz-se a
z2
1 
f z ( zi )   ( z )  e 2
x 
2
Assim, o gráfico da normal padrão pode ser representado por:
Vamos partir de um exemplo prático:
Vamos trabalhar com uma série dos fundos de investimentos da
Petrobrás gerenciado pelo Bando do Brasil. Observou-se que o
comportamento dos fundos entre 02/01/2012 a 13/03/2012 tiveram
um comportamento muito aproximado a uma curva normal como
pode ser observado no gráfico abaixo:
A média ficou em torno de R$ 7,27
a cota do fundo e o desvio padrão
foi de R$ 0,295.
Vamos construir a fdp desta

variável aleatória no software R.
Os limites de intervalo serão R$ 6 e
R$ 8,25
No cálculo de probabilidades para variáveis contínuas, devemos
resolver a integral da fdp no intervalo de interesse, isto é,
b ( x   )2
1 
P(a  X  b) =  e 2 2
a  2
Entretanto, a integral acima só pode ser resolvida de modo

aproximado e por métodos numéricos. Por essa razão, as
probabilidades para o modelo Normal são calculadas com auxílio de
software estatísticos ou por tabelas.
A partir do exemplo anterior, vamos visualizar algumas
possibilidades e informações probabilísticas que podem ser tiradas a
partir da curva da normal criada para o fundo de ações da Petrobrás.
Cálculo da probabilidade de um modelo Normal usando o R
Levando em consideração as informações do exemplo anterior,
pergunta-se:
a) Qual a probabilidade de obtermos lucro se na época do resgaste o
valor da ação for de R$ 7,18.
Para realizar tal tarefa vamos usar o comando pnormal que faz o
cálculo da probabilidade. Além disso, vamos fazer também a
representação gráfica na curva da normal.
b) Qual deveria ser o preço máximo (em R$) para que o investidor
tenha uma probabilidade de lucro pequena, de cerca de 10%?
Vamos verificar essa possibilidade com o auxílio do R.
Aplicações da v.a. reduzida.
A transformação da normal para a sua correspondente reduzida
z~N(0,1). Para determinar a probabilidade de X  [a,b], procedemos
com o seguinte cálculo:
P(a  X  b) = P(a -   X -   b - ) =
a X  b a b

P     P Z 
        
e, portanto, quaisquer que sejam os valores de  e , utilizamos a

Normal Padrão para obter probabilidades com a distribuição Normal.
Os valores para P(0  Z  z), z>0 são apresentados na seguinte
tabela.
Com a simetria da densidade Normal podemos calcular valores de
probabilidades em outros intervalos. Note que a simetria também
implica que a probabilidade de estar acima (ou abaixo) de zero é 0,5.
Como probabilidade é sempre um número entre 0 e 1, a tabela
contém apenas a parte decimal.
Por exemplo, para X~N(2,9), teremos:
 22 X 2 52
P(2  X  5)  P     P(0  Z  1)  0,3413
 9 9 9 
Agora como foi localizado o valor 0,3413 na tabela normal?
Para obter P(0  X  2), usamos a assimetria da Normal:
02 22
P(0  X  2)  P  Z   P ( 3  Z  0)  P(0  Z  3 )
2 2
 9 9 
P(0  Z  0, 6666)  0, 2486
Podemos ainda calcular as probabilidades de intervalos com

extremos negativos, utilizando os correspondentes intervalos na parte
positiva. Um outro recurso importante no uso da tabela é a utilização
do complementar. Por exemplo,

P( X  3)  P Z 

32
   
  P Z  13  0,5  P 0  Z  13  0,5  0,1293  0,3707
3 
A tabela também pode ser utilizada no sentido inverso, isto é,
dado uma certa probabilidade, desejamos obter o valor que a
originou. Por exemplo, quanto vale c tal que P(0 Z  c) = 0,4?
Procurando no corpo da tabela, a probabilidade que mais se
aproxima de 0,4 é 0,3997; correspondendo a 1,28 que será o valor de
c.
Suponha, agora, que queremos encontrar d tal que P(Z > d) = 0,8.
Observamos que d precisa ser negativo, pois a probabilidade
desejada é maior que ½, que é o valor de P(Z > 0). Assim, o
intervalo (0; d) precisa ter probabilidade 0,3. Pela simetria da
Normal, o intervalo (-d, 0) também tem probabilidade 0,3. Da tabela,
segue que –d = 0,84 e portanto d = -0,84.
Vamos finalizar essa seção utilizando o exemplo anterior para o
fundo de ações da Petrobrás/BB.
a) Qual a probabilidade de obtermos lucro se na época do resgaste o
valor da ação for de R$ 7,18?
 X  7, 27 7,18  7, 27 
P( X  7,18)  P     P ( Z  0,31)  0,5  0,1179  0,3821
 0, 295 0, 295 
b) Qual deveria ser o preço máximo (em R$) para que o investidor
tenha uma probabilidade de lucro pequena, de cerca de 10%?
Assim, precisamos obter um valor em R$ tal que: P(X < R$) = 0,1.
Então,
 X  7, 27 R$  7, 27  R$  7, 27
P    P( Z  )  0,1
 0, 295 0, 295  0, 295
I.2.5 – A distribuição t de student
A distribuição t de Student é importante no que se refere a
inferências sobre médias populacionais.
Diz-se que uma variável aleatória contínua T tem distribuição t de
Student se sua função de densidade é dada por:
𝑣+1 𝑣+1
 𝑡 2 −
2
𝑓 𝑡; 𝑣 = 2 1+ , −∞ < 𝑡 < ∞
𝑣 𝑣
 𝜋𝑣
2
Essa expressão, certamente, é assustadora! Mas eis uma boa
notícia: não precisaremos dela para calcular probabilidades! No
entanto, é interessante notar duas características básicas dessa
expressão: o argumento t da função aparece elevado ao quadrado e fT
depende apenas do número de graus de liberdade da qui-quadrado e,
portanto, o parâmetro desta distribuição é, também, o número de
graus de liberdade.
Em termos de média e variância a distribuição t de Student, (com
v graus de liberdade) que será indicada por t(v), será:
𝑣
𝐸 𝑡 =0 𝑉𝑎𝑟 𝑡 =
𝑣−2
Quanto maior o valor de v mais t aproxima-se de uma normal
N~(0,1), isso pode ser verificado no gráfico abaixo:
Assim como no caso da normal, seria necessária uma tabela para
cada valor de v. Os programas computacionais de estatística
calculam probabilidades associadas a qualquer distribuição t. Mas
nos livros didáticos é comum apresentar uma tabela da distribuição t
que envolve os valores críticos, ou seja, valores que deixam
determinada probabilidade acima deles. Mais precisamente, o valor
crítico da t(v) associado à probabilidade α é o valor tv;α tal que
𝑃 𝑡 𝑣 > 𝑡𝑣;𝛼 = 𝛼
Para encontrar o valor tabelado basta pegarmos o grau de
liberdade v e compararmos com a nossa probabilidade de cometer o
erro tipo I (isso será visto mais adiante).
Suponha que tenhamos v=6 e queiramos um erro de 5% para uma
distribuição uni caudal, então teríamos:
Tabela Bicaudal
I.2.6 – A distribuição Qui-Quadrado
A distribuição qui-quadrado é um caso específico da distribuição
Gama.
Como definição temos:
Uma variável aleatória contínua Y tem distribuição qui-quadrado
com v graus de liberdade (denotada por 2 (𝑣) ) se sua função
densidade for dada por:
𝑣 𝑦
1 −1 −
𝑣 𝑦 2 𝑒 2 ,𝑦 > 0
 𝑣
2
22
𝑓 𝑦; 𝑣 = 0, 𝑦 <0
A média e variância para a qui-quadrado são:
E(Y)=v Var(Y)=2v
Graficamente a distribuição qui-quadrado se comporta da seguinte
forma:
Usando a tabela qui-quadrado para v=10, observe que
P(Y>2,558)=0,99; ao passo que P(Y>18,307)=0,05.
I.2.6 – A distribuição F de Snedecor
Sejam U e V duas v.a. independentes, cada uma com distribuição
qui-quadrado, com v1 e v2 graus de liberdade, respectivamente.
Então, a v.a.
U v1
W
V v2
Tem densidade dada por:
𝑣1
 (𝑣1 +𝑣2 ) 2 𝑣1 2 𝑤 (𝑣1 −2)/2
𝑔 𝑤, 𝑣1 , 𝑣2 = ,
(𝑣1 /2)(𝑣2 /2) 𝑣2 (1 + 𝑣1 𝑓/𝑣2 ) (𝑣1 +𝑣2 )/2
𝑤>0
Diremos que W tem distribuição F de Snedecor, com 𝑣1 e 𝑣2
graus de liberdade, e usaremos a notação W~F(𝑣1 , 𝑣2 ). Podemos
mostrar que:
𝑣2 2𝑣2 2 (𝑣1 +𝑣2 −2)
𝐸 𝑊 = 𝑉𝑎𝑟 𝑊 =
𝑣2 −2 𝑣1 (𝑣2 −2)2 (𝑣2 −4)
O gráfico típico de uma distribuição F varia conforme seu grau de
liberdade como pode ser verificado abaixo:
Vamos considerar que nossa distribuição F tenha comportamento
de média e variância com a seguinte característica W~F(5,7).
Consultando a Tabela F teremos: P(F > 3,97) = 0,05, ou P (F  3,97)
= 0,95.
Agora se quisermos encontrar:

0,05 = P{F(5,7) < f0}=P{1/F(7,5) < f0}=P{F(7,5) > 1/ f0},
Procurando na Tabela F, para F(7,5), obtemos 1/ f0=4,88 e,
portanto, f0=0,205.

Aplicação Da Distr Normal Finanças

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Aplicação Da Distr Normal Finanças

Diunggah oleh

Hak Cipta:

Format Tersedia

UNIVERSIDADE FEDERAL DO PARÁ

INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS

Prof. Dr. Ricardo Bruno Nascimento dos Santos

Além destas podemos também destacar:

Note que, dada as características do problema, a divisão em 8 intervalos

O histograma mostra que apesar de termos diferentes intervalos, a

Vamos verificar agora se a função f(t) satisfaz a definição de

Já a sua variância é dada por:

Como no caso discreto, a variância é a medida de dispersão mais

Vamos aplicar no Software R

Portanto o desvio padrão será:  R  30,56  R$5,53 mil

Pode-se ainda verificar que os parâmetros  e 2 representam,

30000 40000 50000 60000 70000 80000 90000

Vamos construir a fdp desta

Entretanto, a integral acima só pode ser resolvida de modo

a X  b a b

e, portanto, quaisquer que sejam os valores de  e , utilizamos a

Podemos ainda calcular as probabilidades de intervalos com

Agora se quisermos encontrar:

Anda mungkin juga menyukai