Estatstica Aplicada
Veterinria
L O N D R I N A
Estado do Paran - Brasil
Sumrio
Pgina
Lista de Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lista de Figuras
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 Introduo
Aplicaes da Estatstica
1.2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Amostragem
2.1
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2
Tcnicas de Amostragem
2.3
1.1
1.2.1
vi
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.2.1
10
2.2.2
Amostragem sistemtica
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2.2.3
Amostragem estraticada . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
16
3 Conceitos elementares
20
3.1
Diviso da estatstica
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
3.2
Tipos de variveis
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
3.3
Dimensionamento da amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
3.3.1
. . . . . . . .
24
3.3.2
. . . . . . .
25
4 Estatstica Descritiva
4.1
4.2
4.3
30
30
4.1.1
30
4.1.2
. . . . . . . . . . . . . . . . . . .
32
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
4.2.1
33
4.2.2
. . . .
35
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
Distribuio de frequncias
5 Grcos
5.1
5.2
5.3
42
43
5.1.1
Grco em colunas
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
5.1.2
Grco em barras
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
5.1.3
47
5.1.4
. . . . . . . . . . . . . . . . . . . . . . . . .
48
5.1.5
. . . . . . . . . . . . . . . . . . . . . . . . . .
50
5.1.6
52
53
5.2.1
Grco em basto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
54
5.3.1
Histograma
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
5.3.2
Polgono de frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
5.3.3
Grco de ramo-e-folhas
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
56
5.3.3.1
5.4
5.3.4
. . . . . . . . . . . . . . . . . . . . . . . .
57
5.3.5
Grco de disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
5.3.6
. . . . . . . . . . . . . . . . . . . . . . . .
59
5.3.7
Grco de Linhas
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
62
6 Medidas de Posio
64
6.1
64
6.2
65
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3
Mdia Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
6.4
Mediana
70
6.5
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4.1
. . . . . . . . . . . . . .
70
6.4.2
. . . . . . . . . . . . . . . . . . . .
72
Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
6.5.1
. . . . . . . . . . . . . . . . . . . .
73
. . . . . . . . . . . . . . . . . . . . . .
77
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
6.7.1
77
6.7.2
. . . . . . . . . . . . . . . . . . . . . . . .
79
6.7.3
Grco de caixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
82
6.6
6.7
Medidas Separatrizes
6.8
Assimetria e Curtose
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
6.8.1
Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
6.8.2
Curtose
86
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
92
7.1
Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
92
7.2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
7.3
Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
7.3.1
95
7.3.2
95
7.3.3
. . . . . . . . . . . . . . . . . . . . . . . . .
97
7.3.4
Propriedades da varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
7.4
Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
100
7.5
Coeciente de Variao
100
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8 Anlise Combinatria
107
8.1
Fatoriais
8.2
. . . . . . . . . . . . . . . . . . . . . . . . . .
108
8.3
Permutaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
110
8.3.1
. . . . . . . . . . . . . . . . . . . . . . . . . .
111
Arranjos e Combinaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
114
8.4.1
114
8.4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Quantidade de Permutaes
Combinaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
107
8.4.2
Arranjos
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
115
8.5
Quantidade de Arranjos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
117
8.6
Quantidade de Combinaes
118
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2
. . . . . . . . . . . . . . . . . . . . . . . . . .
121
9.1.1
Experimento Aleatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
121
9.1.2
Espao Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
122
9.1.3
Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
122
Conceito de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
123
9.2.1
. . . . . . . . . . . . . . . . . . . . . . . . . .
123
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
126
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
126
126
9.4.1.1
Unio de Eventos: . . . . . . . . . . . . . . . . . . . . . . . . . . .
126
9.4.1.2
Interseo de Eventos:
. . . . . . . . . . . . . . . . . . . . . . . .
127
9.4.1.3
Sub-Conjuntos:
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
127
9.4.1.4
Eventos Disjuntos:
. . . . . . . . . . . . . . . . . . . . . . . . . .
127
9.4.1.5
Complemento: . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
128
9.3
Propriedades da Probabilidade
9.4
Diagramas de Venn
9.4.1
9.4.2
9.5
121
. . . . . . . . . . . . . . . . . . . . . .
128
Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
131
9.5.1
132
9.5.2
. . . . . . . . . . . . . . . . . . . .
133
9.5.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
136
9.5.4
9.5.5
. . . . . . . . . . . . . . . . .
137
. . . . . . . . . . . . . . . . . . . . . . . . . .
138
9.5.6
. . . . . . . . . . . . . . . . . . . . . . . . . .
139
9.5.7
Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
141
146
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
146
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
148
148
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
149
150
10.2.4 Varincia de Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
151
. . . . . . . . . . . . . . .
152
. . . . . . . . . . . . . . . . . . . . . . .
154
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
154
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
156
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
160
164
165
172
175
11.1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
175
176
178
180
191
192
12.2
198
. . . . . . . . . . . . . . . . . . . . . . . . . .
Lista de Tabelas
Pgina
mg/100 ml.
Tabela 1.1 -
cido arcrbico, em
. . . . . . . . . . . . . . . . . . . . . . . .
Tabela 2.1 -
Dados sobre tilpias do Nilo, coletados por alunos do curso de Medicina Veterinria da Universidade Estadual de Londrina, no ano de 2005.
Tabela 2.2 -
Tabela 3.1 -
1o
. . . . . . . .
11
. . . . . . . . . . . . . . . . . . . . . .
16
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabela 3.3 -
Tabela 4.1 -
. . . . . . . . . . . . . . . . . . . . .
28
31
32
34
Tabela 4.5 -
27
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . .
21
Tabela 4.2 -
(kg)
. . . . . . . . . . . . . .
36
. . . . .
38
Tabela 4.6 -
Tabela 4.7 -
Tabela 5.1 -
Tabela 6.1 -
(kg)
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
de
30
40
62
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabela 6.3 -
67
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabela 6.4 -
Tabela 6.5 -
Tabela 6.6 -
Tabela 7.1 -
Tabela 7.2 -
. . . . . .
94
Tabela 7.3 -
Desvios e quadrado dos desvios para pesos dos animais da raa Alaska . . . . .
96
Tabela 7.4 -
98
Tabela 7.5 -
Tabela 7.6 -
Tabela 7.7 -
Tabela 7.8 -
Tabela 9.1 -
Tabela 9.2 -
Tabela 9.3 -
Tabela 9.4 -
horas)
. . . . . . . . .
73
80
. . . . . . .
89
. . . . . . . . . . . . . . . . . . . . . . . . .
90
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
em 43 crianas.
92
. . . . . . . . . . . . . . . . .
103
. . . . . . . . . . . . . . . . . . . . . . . .
104
. . . . . . . . . . . . .
104
. . . . . . . . . . . . . . . . . . . . . . .
105
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
132
134
135
136
Y.
. . . . . . . . . . . . . . . . . . . . . .
de Bernoulli.
. . . . . . . . . . . . . . . .
148
155
. . . . . . .
163
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
194
Lista de Figuras
Pgina
Figura 5.1 -
Figura 5.2 -
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Figura 5.3 -
. . . . . . . . . . . . . . . . . . . . . . . . .
44
Cor dos Olhos dos alunos do 1 ano do curso de Medicina Veterinria da Universidade Estadual de Londrina em 2011.
Figura 5.4 -
43
. . . . . . . . . . . . . . . . . . . .
45
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
Figura 5.5 -
. . . . . . .
47
Figura 5.6 -
. . . . . . .
49
Figura 5.7 -
Categoria dos animais atendidos no Hospital Veterinrio da Universidade Estadual de Londrina, no ano de 2005.
Figura 5.8 -
50
Categoria dos animais atendidos no Hospital Veterinrio da Universidade Estadual de Londrina, no ano de 2005.
Figura 5.9 -
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
51
52
. . . . . . . . . . . . . . . . . . . . . . . . . .
53
Figura 5.11 - Nmero de atendimentos dirios, do Hospital Veterinrio, da Universidade Estadual de Londrina, nos ltimos 50 dias.
. . . . . . . . . . . . . . . . . . . .
54
. . . . . . . . . . . . . . . . . . .
55
Figura 5.13 - Comparao de pesos (g) de tilpias para quatro equipes de alunos do curso de
Medicina Veterinria da Universidade Estadual de Londrina em 2003.
. . . . .
58
Figura 5.14 - Relao entre peso e comprimento de tilpias do Nilo, do tanque de piscicultura
da Universidade Estadual de Londrina, 2003.
. . . . . . . . . . . . . . . . . .
59
Figura 5.15 - Relao entre peso e comprimento de tilpias do Nilo, controladas para a varivel
tempo de recuperao da anestesia, do tanque de piscicultura da Universidade
Estadual de Londrina, 2003.
. . . . . . . . . . . . . . . . . . . . . . . . . . .
60
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
62
Figura 6.1 -
Esquema para obteno da moda pelo mtodo de Czuber, do nmero de atendimentos do Hospital Veterinrio da UEL, 2005.
. . . . . . . . . . . . . . . .
74
. . . . . . . . . . . . . . . . . . . . . . . . . .
83
Figura 6.2 -
Figura 6.3 -
Frequncia cardaca dos animais atendidos no Hospital Veterinrio, da Universidade Estadual de Londrina, em 2003.
Figura 6.4 -
. . . . . . . . . . . . . . . . . . . . .
83
Frequncias respiratrias dos animais atendidos no Hospital Veterinrio, da Universidade Estadual de Londrina, em 2003.
. . . . . . . . . . . . . . . . . . .
p = 0, 30.
n = 10
87
. . . . . . . . . . . . . . .
148
. . . . . . . . . . . . . . . .
153
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
157
161
1 3
y .
4
. . . . . . . . . . . . . . . . . . . . . . . . .
173
. . . . . . . . . . . . . . . . . . . . . . . . .
176
f (y) =
b.
. . . . . . . . . . . . . . . . . . . . . . . .
176
Figura 11.4 -
desvio da mdia.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
177
Figura 11.5 -
desvios da mdia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
177
Figura 11.6 -
desvios da mdia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
177
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
177
178
. . . . . . . . . . . . . . . . . . . . . . . .
179
Captulo 1
Introduo
A estatstica, de uma forma geral, trata da organizao, interpretao e apresentao de
dados, sejam de contagens ou mensuraes. A palavra
de dados (nmeros).
Mesmo sem serem estudiosos da rea, as pessoas convivem com informaes estatsticas
praticamente todos os dias, seja atravs de rdio, televiso, jornais ou relatrios tcnicos das mais
diversas reas.
Vrias denies so dadas estatstica, entre elas:
Estatstica a arte e cincia de coletar, analisar e interpretar dados.
A estatstica uma cincia da tomada de deciso diante de incertezas.
Estatstica a cincia de fazer uso efetivo dos dados numricos relativos aos grupos de
indivduos ou de experimentos.
O pensamento estatstico ser um dia to necessrio para o cidado quanto a habilidade
de ler e escrever. (Wells, H. G., 1993)
A estatstica preocupa-se com a compreenso do mundo real atravs da informao que
ns extramos da classicao e mensurao. Sua caracterstica distintiva lidar com a
variabilidade e a incerteza, que esto em toda parte. (Bartholomew, 1995)
Ao conjunto de mtodos estatsticos usados no tratamento da variabilidade nas cincias
mdicas e biolgicas, convencionou-se chamar de
Bioestatstica.
Captulo 1. Introduo
dutos rastreados,
pro-
treamento de informaes na produo animal. Este trabalho teve como objetivo comparar dois tipos
de rastreabilidade em sunos: individual e de grupo, utilizando o sistema de identicao e registro de
dados eletronicamente. Os
alimentar serviram de base para comparao entre os dois sistemas. Uma amostra foi considerada
a partir do erro admissvel, estabelecido pelo produtor.
2 ,
foi estudada a
associao entre variveis resposta e explicativas como anlise preliminar. As variveis explicativas
associadas com a varivel resposta
Os leites foram
examinados de hora em hora durante as primeiras 10 horas aps o corte ou esmagamento da cauda
com o objetivo de vericar a ocorrncia de hemorragia ou diarria para os dois tratamento. Os animais
do TB foram examinados duas vezes ao dia com o objetivo de determinar o dia da queda da cauda.
Quanto presena ou ausncia de diarria adotou-se os seguintes critrios: ausncia de diarria (fezes
consistentes ou pastosas); e, presena de diarria (fezes lquidas com ou sem desidratao dos leites).
Todos os leites foram pesados no dia do nascimento e aos 21 dias de idade.
1. Planejamento do problema:
!
Captulo 1. Introduo
a) denio da importncia do problema que se pretende estudar;
b) determinao do objetivo e nalidade do estudo;
c) determinao das variveis que sero observadas (ou coletadas) e a forma como as mesmas
sero obtidas (mensurao, contagem, questionrio, etc.).
3. Formulao de hipteses.
Em toda pesquisa, exceto naquelas meramente descritivas ou exploratrias, a formulao de
uma hiptese estatstica necessria para sua comprovao ou rejeio.
4. Vericao da hiptese:
consiste da coleta de dados, anlise estatstica e apresentao dos resultados.
5. Parte nal:
concluso ou discusso, bibliograa, anexos, apndices.
a)
Populao
pessoas, etc) que possuam pelo menos uma caracterstica comum, a qual se deseja estudar.
Parmetro - uma medida numrica que descreve uma caracterstica de uma populao.
So
Exemplos:
pulacional),
b)
Amostra
(mdia populacional),
(proporo populacional),
(varincia populacional),
(desvio-padro po-
faz-se inferncia sobre as caractersticas da populao. Uma amostra tem que ser representativa
da populao.
Estatstica
(varincia amostral),
Como exemplo, considere uma pesquisa realizada com 30 alunos do primeiro ano, do
curso de Medicina Veterinria, da Universidade Estadual de Londrina, no ano de 2013, em que a
estatura mdia foi de
y
= 1, 74 m.
estatstica.
Realizou-se a mesma pesquisa com
todos
dicina Veterinria, da Universidade Estadual de Londrina, no ano de 2013, e a estatura mdia foi de
= 1, 75 m.
Neste caso,
um
parmetro,
varivel.
censo),
a)
custo reduzido:
b)
tempo:
quando se utiliza a amostragem ao invs do censo, gasta-se menos tempo para concluso
do estudo, pois trabalha-se com menos elementos. Por outro lado, quando o produto perecvel,
a amostragem a nica soluo;
c)
aprofundamento:
a pesquisa amostral pode ser mais detalhada, visto que so examinados me-
amostral
mais informativa do que realizar o censo usando como instrumento de coleta de informao um
questionrio.
Captulo 1. Introduo
Exerccios
1) Seja
yi = {y1 y2 y3 y4 y5 y6 y7 } .
yi = {17, 0 8, 9 28, 7 20, 5 8, 9 26, 1 43, 9} .
Calcular (passo-a-passo):
yi ;
c)
i=1
b) Soma dos 5 primeiros tempos:
yi ;
i=2
5
yi ;
d) Quadrado da soma:
i=1
e) Soma de Quadrados:
)2
yi
i=1
yi2 ;
i=1
n
g) Suponha a constante
k = 15
e calcule
y =
yi
i=1
k yi ;
i=1
h) Soma dos desvios em relao a
k:
(yi k);
i=1
(yi y).
i=1
ao item anterior?
j) Demonstre algebricamente o resultado encontrado no item anterior;
k) Soma de quadrado dos desvios:
(yi y)2 ;
i=1
l) Considerando-se
y como
(yi y)2 ;
i=1
X,
vamente:
a)
xi yi ;
b)
i=1
xi
i=1
yi ;
i=1
100
mililitros, presentes em
80
mg/100 ml.
mg/100ml)
Frequncias
(fi )
Ponto Mdio
0, 0 0, 2
0,1
0, 2 0, 4
0,3
0, 4 0, 6
18
0,5
0, 6 0, 8
35
0,7
0, 8 1, 0
16
0,9
1, 0 1, 2
1,1
80
80
Total
(xi )
Determine:
a)
fi ,
i = 1, 2, . . . , 6;
c)
i=1
b)
e)
)2
xi fi
i=1
xi fi ,
i = 1, 2, . . . , 6;
i=1
k
( k
d)
x2i fi ;
i=1
xi fi
i=1
k
i=1
fi
i = 1, 2, . . . , 6.
i = 1, 2, . . . , 6;
exames
Captulo 1. Introduo
f)
k
1
2
xi fi
V =
n1
i=1
)2
xi fi
i=1
k
fi
i = 1, 2, . . . , 6;
i=1
Captulo 2
Amostragem
2.1 Introduo
Usualmente trabalha-se com apenas uma amostra da populao. Em geral, selecionase uma amostra (ou parte) da populao em estudo e, a partir dela, tabula-se a caracterstica (ou
varivel) que est sendo avaliada.
partir dos resultados obtidos na amostra, o pesquisador dever estend-los para toda a populao,
estabelecendo inclusive as margens de erro e acerto nas previses.
A realizao do censo no garante que a pesquisa esteja livre de erros. Os erros de coleta
e manuseio de um grande nmero de dados, em geral, so maiores do que as imprecises a que se
est sujeito quando generaliza-se, via inferncia, as concluses de uma amostra bem selecionada.
Para que se possa fazer inferncias vlidas sobre a populao, a partir de uma amostra,
necessrio que esta seja representativa da populao.
representativa da populao e, por isso, uma forma de se conseguir essa representatividade fazer com
que o processo de escolha da amostra seja, de alguma forma, aleatrio, introduzindo desta maneira o
conceito de amostra probabilstica, conforme discutido em Bolfarine & Bussab, 2005.
dimento que ser adotado para escolher os elementos que iro compor a amostra.
9
10
Captulo 2. Amostragem
N,
sem reposio,
ser escolhido para a amostra, sendo cuidadosamente planejada para se evitar qualquer tendenciosidade.
Processo de coleta:
n
Todos os
nmeros aleatrios, com a utilizao de algum programa computacional ou utilizando-se uma urna
que recebe os nmeros de
N.
a amostra.
Utilizao:
Exemplo 1:
Proceder a um sorteio, em sala de aula, com 45 alunos, para compor uma amostra de
tamanho 5.
Soluo:
sala = 1:45
sample(sala, 5, replace=F)
# ou, simplesmente,
sample(45, 5, replace=F)
Tcnicas de Amostragem
Obs.:
a opo
11
replace=F quer dizer que um aluno sorteado no poder ser sorteado novamente, ou
Exemplo 2:
(false ) por
sem reposio.
(true ):
replace=T.
retirar uma amostra desse conjunto para um estudo, como apresentado na Tabela 2.1 .
Tabela 2.1 Dados sobre tilpias do Nilo, coletados por alunos do curso de Medicina Veterinria da
Universidade Estadual de Londrina, no ano de 2005.
Tilpia
Turma
Equipe
Induo
Peso
Comp
Alt
Comp_cabea
2000
2021
165
408,5
29,0
7,3
7,8
17,0
2000
2021
183
400,0
29,5
9,0
7,3
8,9
2000
2021
161
397,2
29,3
8,7
8,0
28,7
2000
2021
108
431,6
29,5
9,1
7,6
115,0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
500
2000
2021
147
309,4
25,8
8,1
6,7
As variveis
Alt
.
.
.
20,5
Recup
(altura) e
Comp_cabea
Peso
Comp
Pode-se pensar, neste caso, em duas situaes em que a amostragem simples ao acaso utilizada.
varivel especca,
a progra-
ca exatamente como no Exemplo 1, ou seja, para se retirar uma amostra aleatria
comprimento (cm),
tem-se
dados = read.table(`http://www.uel.br/pessoal/silvano/Dados/Tilapia.txt',
dec=`,', head=T)
attach(dados)
names(dados)
(amostra = sample(Comp, 15, replace=F))
12
Captulo 2. Amostragem
amostra de indivduos,
manter os valores observados de cada varivel. Neste caso, necessrio carregar o pacote
car.
Os comandos so:
require(car)
(saida = some(dados, n=15, replace=FALSE))
Um professor,
utilizando-se de sua lista de chamada, poderia compor uma amostra chamando todos os alunos cujo
nmero na pauta terminasse em um determinado digito. Assim, o professor chamaria para compor
sua amostra, por exemplo, todos os alunos com nmeros terminados em zero, ou seja, os nmeros
13.000
alunos. Neste caso, poderia-se obter uma relao completa dos mesmos e selecionar um a cada
50
Processo de coleta:
seja
o intervalo de amostragem
o tamanho da populao e
N
k= .
n
Sorteia-se um nmero
Utilizao:
Exemplo:
entre
k,
x, x + k, x + 2k, . . ..
pesquisa para saber o grau de conhecimento dos alunos quanto prosso escolhida. Dispe-se de
uma lista, em ordem alfabtica, de todos os alunos. Uma amostra de 50 estudantes ser selecionada.
Proceda escolha desta amostra.
Tcnicas de Amostragem
13
Soluo:
n = 50 ; N = 400 ; k = N/n
(amostra = sample(k, 1))
(amostras = seq(amostra, N, k))
alunos da UEL, seria razovel obter uma amostra dentro de cada curso e depois reunir as informaes
numa nica amostra, que seria representativa dos alunos da UEL.
Processo de coleta:
deve-se dividir as
unidades da populao em
N1 , N2 , . . . , Nj
n1 , n2 , . . . , nj ,
estratos
de modo que
n = n1 + n2 + . . . + nj .
Procedimento:
1) calcular a frao de amostragem dada por:
f=
n
;
N
14
Captulo 2. Amostragem
n1 = N 1 f ;
n2 = N2 f ;
. . .;
nj = Nj f
sendo:
Nj
n
j );
Exemplo 1:
N = 2.000,
N4 = 100.
n = 80
Se a alocao deve ser proporcional, qual o tamanho da amostra a ser extrada de cada
Soluo:
Os comandos do
so:
Exemplo 2:
Considere o conjunto de dados tilpia, que tem 4 estratos (Equipes: 1011, 1012, 2021,
2022), e o objetivo retirar uma amostra de tamanho 5 para cada extrato da varivel comprimento
(Comp). Os comandos so
Tcnicas de Amostragem
15
dados = read.table(`http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt',
dec=`,', head=T)
attach(dados)
names(dados)
(Amostras = tapply(Comp, Equipe, sample, size=5))
Caso o nmero de amostras dentro de cada estrato seja diferente, pode-se utilizar o pacote
sampling,
em que possvel determinar se as amostras retiradas dentro de cada estrato sero do tipo:
amostragem aleatria simples
require(sampling)
amost.estrat.simples = strata(dados, c(``Equipe"), size = c(5, 7, 3, 4),
method = ``srswor")
(amostras.est.simples = getdata(dados, amost.estrat.simples))
R.
amostragem sistemtica
Erro amostral:
Exemplo:
escolha aleatoriamente
da UEL e verique o peso mdio (kg ) desses animais. Retirada uma outra amostra de
50
animais,
16
Captulo 2. Amostragem
Ocorre um
erro no amostral
incorretamente. Tais problemas resultam em um erro que no seja uma simples utuao amostral
aleatria, como por exemplo, a escolha de uma amostra no aleatria e tendenciosa, a utilizao de
um instrumento de mensurao defeituoso, uma questo formulada de modo tendencioso, um grande
nmero de recusas de resposta ou a cpia incorreta dos dados amostrais.
Muitos desses erros so provenientes do prprio observador, devido ao grau de treinamento (experincia), o excesso de trabalho, seu estado fsico e/ou condies ambientais.
Como exemplo, cita-se o caso de cinco radiologistas que examinaram, em diferentes
pocas, separadas por um perodo de dois meses, as mesmas 1.200 radiograas de trax, com a
nalidade de diagnosticar a existncia de tuberculose pulmonar. As radiograas de tamanho-padro
foram lidas separadamente por cada radiologista e os resultados se encontram na Tabela 2.2.
Radiologista
1a
Leitura
2a
Leitura
118
139
69
78
83
88
96
89
106
92
Deve-se concluir que tais discordncias no reetem uma variao real e sim, erros cometidos por quem procedeu leitura do material radiogrco.
a)
populao
17
b)
dados a serem coletados - ao se efetuar a coleta dos dados importante vericar se todos esses
dados sero importantes para os propsitos da pesquisa, e se nenhum dado essencial est sendo
omitido;
c)
d)
e)
o, deve-se escolher a melhor tcnica para selecionar a amostra: amostragem simples ao acaso,
amostragem estraticada, etc.;
f)
vericao preliminar
testar em uma pequena parte da populao as seguintes caractersticas: se a tcnica a ser utilizada
para a coleta a melhor possvel; se a forma escolhida de registro das informaes no deve ser
alterada; se os coletores esto bem treinados, enm deve-se vericar a ecincia da metodologia
a ser empregada;
g)
anlise dos dados - apurados os resultados, os mesmos devem ser analisados estatisticamente.
Os
dados podem ser apresentados em forma de tabelas ou grcos. Podem ser calculadas algumas
medidas, alguns testes estatsticos e realizadas algumas inferncias.
18
Captulo 2. Amostragem
Exerccios
1) Um pesquisador est interessado em avaliar o Peso (kg ) de animais domsticos das espcies
caninas e felinas, no importando a raa. Para isso, ele dispe de uma lista de dados, disponvel
em
http://www.uel.br/pessoal/silvano/Veter/Dados/HV.txt,
(a) Retire uma amostra aleatria de 25 animais. Explique o processo de seleo. Quantos so
da espcie canina e felina?
(b) importante para o pesquisador coletar amostras de cada espcie. Sendo assim, que tipo
de amostragem ele deve utilizar?
(c) Considerando o item 1b, retire uma amostra de tamanho 20 para a espcie canina e de
tamanho 5 para a espcie felina. Relacione as amostras retiradas. Qual o peso mdio dos
dados? E para cada um dos estratos?
3) Um hematologista deseja fazer uma nova vericao de uma amostra de tamanho 10 dos 854
espcimes de sangue analisados por um laboratrio em determinado ms. Para isto, ele cria uma
estrutura amostral numerando como 001, 002, ..., 854. Use a tabela de nmeros aleatrios ou
calculadora para escolher que espcimes de sangue sero selecionados? Explique como escolheu
os nmeros da tabela aleatria.
4.000,
n = 60
Para que a
alocao seja proporcional, qual deve ser o tamanho da amostra a ser retirada de cada estrato?
19
5) Deseja-se realizar um estudo, junto comunidade universitria da Universidade Estadual de Londrina, quanto posse e cuidado com os animais domsticos. Explique de que forma voc planejaria
esta pesquisa. Tambm, elabore 10 questes relativas ao assunto que ser pesquisado.
Captulo 3
Conceitos elementares
3.1 Diviso da estatstica
A estatstica uma cincia dividida basicamente em duas partes:
estatstica descritiva
tabelas,
dos experimentais, e tem como objetivo tirar concluses sobre populaes com base nos resultados observados em amostras extradas dessas populaes.
Tipos de variveis
21
distingui-los.
Exemplo:
Foi elaborado um questionrio com 34 questes para se traar o perl dos alunos do
1o
1o
Aluno
Gnero
Procedncia
Nmero de
Estatura
irmos
(m)
Grau de
instruo dos pais
Masculino
Londrina
1,73
Superior incompleto
Masculino
Londrina
1,71
Segundo grau
Feminino
Campinas
1,65
Superior completo
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
27
Feminino
So Paulo
1,68
Primeiro grau
28
Masculino
Londrina
1,76
Primeiro grau
29
Feminino
Arapongas
1,58
Superior completo
1.
Variveis categricas (ou qualitativas) - apresentam como possveis realizaes uma qualidade (ou atributo) do indivduo pesquisado. O nmero de categorias pode depender do interesse
do estudo. Elas se dividem em:
a)
Exemplo:
Gnero dos estudantes, estado civil, tipo sanguneo, cor dos olhos, cor dos
22
social (alta, mdia, baixa), presso sangunea (baixa, normal, alta), etc.
2.
a)
variveis numricas discretas - so aquelas que assumem valores em pontos da reta real,
frequentemente resultam de uma contagem e no possuem unidade de medida.
Exemplo:
qualquer valor em certo intervalo da reta real, normalmente resultam de uma mensurao e
apresentam unidade de medida.
Exemplo:
etc.
A importncia dessa classicao justica-se porque cada tipo de varivel resposta exige
um mtodo de anlise estatstica especco. Esquematicamente, tem-se:
3
Nominal
Qualitativas
q8
q
q
q
q
q
qq
+
q
q
q
q
q
Ordinal
qq
qqq
q
q
qqq
qqq
&
Variveis
3
Discreta
Quantitativas
+
Contnua
Dimensionamento da amostra
23
A distino entre variveis contnuas e discretas muitas vezes articial, pois depende
da aproximao (preciso) utilizada.
tempo, portanto, por denio, uma varivel aleatria contnua, porm, em muitos
casos ela medida em anos completos (discretizao da varivel), o que a torna uma
varivel discreta.
Portanto, poder ocorrer situaes em que uma varivel contnua ser tratada como uma
varivel discreta.
a)
b)
Varincia ou percentual
c)
Nvel de conana - deve-se imaginar que, ao se apresentar um valor percentual, referente taxa
de prevalncia do fenmeno estudado na amostra observada, esse valor tem, em relao ao valor
percentual da populao, uma diferena, que , a priori, arbitrada pelo pesquisador. Esta diferena
arbitrada considerada tendo em conta um nvel de acerto que normalmente consideramos de 95%
ou 99% de conana, ou seja, o nvel de conana de que a diferena arbitrada realmente ocorra
at o limite de diferena proposto.
Os nveis de conana propostos rotineiramente so de
pela letra
99%
de conana.
Simbolizado
Z, este valor substitudo na frmula (3.1) por uma constante 1, 96 quando o nvel de
conana corresponde a
d)
95%
95%
Informao de literatura
e por
2, 58
99%.
de certo fenmeno, apresenta, na literatura, resultados que se pode utilizar para a determinao
24
em relao ao valor de
Chama-se
ao valor complementar de
para
100%,
+ (1 ) = 100%.
e)
50%,
1 = 50%.
n0 =
z 2 (1 )
( p)2
(3.1)
n=
n0
n0
1+
N
(3.2)
em que:
n0 :
amostra inicial;
z:
nvel de conana;
N:
tamanho da populao;
= p:
Em populaes
nitas
Para populaes
Dimensionamento da amostra
Exemplo:
25
()
de 2%,
z = 1, 96
N = 40.000.
e um erro de preciso de
4%.
Soluo:
n0 =
z2 2
2
(3.3)
n=
n0
n0
1+
N
(3.4)
sendo:
=x
:
Doena rara, mas muito grave, causada, usualmente, pelo consumo de alimentos contaminados com a bactria
Listeria monocytogenes.
26
Obs.:
se, por exemplo, 30 observaes da populao e calcula-se o desvio padro da caracterstica a estudar;
Para populaes nitas, utilizam-se as frmulas (3.3) e (3.4) e, para populaes innitas,
apenas a frmula (3.3) utilizada.
Exemplo:
Numa pesquisa para se determinar a taxa mdia do teor de hemoglobina em fmeas bovinas
da raa Aquitnica, com idade acima de 12 meses, depara-se com o problema de denir-se o tamanho
da amostra. Sem informaes a priori, seleciona-se uma amostra de
do teor de hemoglobina de cada animal e, a seguir, calcula-se a varincia (captulo 7), cujo valor, por
exemplo, de
preciso de
Soluo:
1, 72 (g/dl)2 .
0, 15 g/dl.
z = 1, 96
e uma
Dimensionamento da amostra
27
Exerccios
1) Classique cada uma das variveis apresentadas na Tabela 3.2 em qualitativa (nominal ou ordinal)
ou quantitativa (discreta ou contnua).
Tabela 3.2 Dados parciais coletados no Hospital Veterinria da Universidade Estadual de Londrina,
ano 2013.
Sexo
Castrado
Espcie
Peso (kg )
No
Canina
20,0
Londrina
No
Canina
20,0
Londrina
No
Canina
13,0
No
Canina
No
TR
FC
FR
Magro
38,3
124
Normal
28
Londrina
Normal
39,5
100
80
2,5
Londrina
Magro
35,1
132
Canina
11,2
Londrina
Magro
38,9
144
120
No
Canina
11,0
Camb
Magro
39,2
100
40
No
Canina
10,2
Londrina
Normal
38,4
208
No
Canina
10,2
Londrina
Caqutico
39,5
100
32
No
Canina
10,0
Londrina
Normal
39,6
96
32
No
Canina
10,0
Camb
Obeso
39,7
156
36
No
Felina
3,3
Camb
Normal
39,0
220
48
Sim
Felina
2,2
Londrina
Normal
39,6
72
No
Felina
3,5
Londrina
Normal
39,4
208
64
No
Felina
3,3
Londrina
Normal
39,0
96
36
Sim
Felina
2,7
Londrina
Magro
39,2
126
28
No
Felina
6,5
Londrina
Magro
38,6
220
No
Felina
6,5
Londrina
Normal
38,9
184
60
Sim
Felina
5,4
Londrina
Magro
38,8
168
32
No
Felina
5,3
Londrina
38,2
176
68
No
Felina
4,5
Londrina
Magro
38,2
148
60
No
Felina
3,1
Camb
Obeso
39,7
200
40
No
Felina
3,0
Londrina
Normal
38,1
160
46
No
Felina
2,9
Rolndia
Normal
36,5
172
88
No
Felina
Londrina
Normal
37,5
120
56
Cidade
Irmos
EN
28
2) Considerando-se as equaes
n0 =
z2 2
2
n=
n0
n0
1+
N
para variveis quantitativas, mostre passo-a-passo, que o tamanho amostral para populao innita
pode ser expresso pela seguinte equao:
n=
em que
3) Fixe
N
,
N ( )2
1+ 2
z
z = 1, 96, s2 = 4
=x
n0
3,0
2,0
1,5
1,0
0,5
0,1
0,01
= 0, 3
z = 1, 96.
Demonstre os
clculos passo-a-passo.
N = 1.000.
6) Um pesquisador est interessado em avaliar a temperatura retal (TR, em grau Celsius) de animais domsticos das espcies caninas e felinas, no importando a raa.
Sabe-se, de estudos
1, 1513 o C 2 .
Para isso, ele dispe de uma lista com a relao dos animais atendidos no Hos-
http://www.uel.br/pessoal/silvano/Veter/Dados/HV.txt.
Dimensionamento da amostra
a) Considerando-se
z = 1, 96
29
0, 3 o C ,
e um erro de preciso de
7) Suponha que um pesquisador tenha diversas gaiolas que contenham, cada uma,
ratos. Qual a
elementos.
10
dos
854
Para isto,
aleatrios ou a calculadora para escolher que espcimes de sangue sero selecionados? Explique
como selecionou a amostra.
4.000,
n = 60
Para que a
alocao seja proporcional, qual deve ser o tamanho da amostra a ser retirada de cada estrato?
563.
10
101
nmeros aleatrios para escolher os nmeros das etiquetas. Explique como escolheu os nmeros
da tabela aleatria.
Captulo 4
Estatstica Descritiva
4.1 Organizao e apresentao de dados
A apresentao de dados na forma de tabela um dos mtodos estatsticos mais simples
e utilizado. Uma tabela estatstica consegue expor os resultados de determinada pesquisa ou parte
dela, sinteticamente, em que se tem uma viso mais clara e fcil dos resultados obtidos. Ao dispor
os dados em linhas e colunas, distribudos de forma ordenada, segundo regras estabelecidas, tem-se
as tabelas estatsticas.
a)
Ttulo:
uma indicao que precede a tabela estatstica e que contm a designao do fenmeno
b)
Cabealho:
colocado na parte superior da tabela, tem por nalidade especicar o contedo das
colunas;
c)
Corpo:
cruzamento de uma coluna com uma linha. As casas nunca devero car em branco, contendo
sempre um nmero ou um sinal convencional:
...
0
31
(zero), quando o valor numrico for menor que a metade da unidade de medida adotada
d)
Coluna indicadora:
a parte da tabela que tem por nalidade especicar o que contm as linhas;
Toda tabela dever ter identicao feita com algarismos arbicos, de modo crescente,
precedidos da palavra
Tabela,
mento.
A Tabela 4.1 um exemplo sobre a maneira de se resumir e apresentar dados coletados,
relativos uma pesquisa ou experimento.
Tabela 4.1 Animais atendidos no Hospital Veterinrio (HV) da Universidade Estadual de Londrina
(UEL), no ano de 2005.
Frequncias
Pequeno porte
20.650
Mdio porte
12.300
Pequeno porte
Total
5.700
38.650
Fonte: HV da UEL.
Na Tabela 4.1, o ttulo :
Pequeno porte
Mdio porte
Grande porte
Frequncias
32
20.650
12.300
5.700
Fonte:
a indicao do rgo ou entidade responsvel pelo fornecimento dos dados ou pela sua
b)
Notas:
metodologia adotada na coleta ou preparo dos dados. Devem ser colocadas embaixo da indicao
da fonte;
c)
Chamadas:
colocada aps a nota. Devem ser feitas atravs de algarismos arbicos escritos entre parnteses,
e colocados direita da coluna;
A Tabela 4.2 um exemplo sobre a maneira de se resumir e apresentar dados coletados,
relativos uma pesquisa ou experimento.
alunos do
1o
realizada em 2002.
Tabela 4.2 Espcies de animais atendidos no Hospital Veterinrio da Universidade Estadual de Londrina. Londrina - Paran, 2002.
Espcies
Percentual (%)
Canina
85,00
Felina
11,07
Equina
2,50
Bovina
0,71
Lagarto
0,36
Roedor
0,36
Distribuio de frequncias
33
Observaes:
As tabelas so constitudas por trs traos horizontais paralelos, um para separar o topo, outro
para separar o cabealho e o terceiro para o rodap. No so usados traos verticais para separar
os dados;
Devem ser identicadas na parte superior iniciada com a palavra Tabela e seu nmero de ordem,
em algarismos arbicos seguidos de hfen, separando o ttulo.
No caso da tabela ter de ocupar mais de uma pgina, no ser delimitada na parte inferior e
o cabealho ser repetido na pgina seguinte.
Quando no for possvel dispor a tabela na posio normal de leitura, ela dever ser apresentada
de forma que a rotao se efetue no sentido horrio.
Exemplo 1 -
nao articial, no Hospital Veterinrio da UEL, em 2005. Os seguintes nmeros de lhotes foram
34
observados:
Dados Brutos:
Quando os dados esto dispostos sem qualquer ordem lgica, recebem o nome de dados brutos.
Ao organizarmos os dados brutos, em ordem crescente ou decrescente de grandeza,
obtemos o rol:
Rol:
Li :
Ls :
A:
amplitude
total
Li = 0;
dos
Ls = 5;
dados,
que
diferena
entre
maior
menor
valor
do
rol
A = Ls Li = 5 0 = 5.
Uma tabela de distribuio de frequncia pode ser construda, tanto a partir dos dados
brutos como do rol. Para o exemplo em questo, tem-se:
Tabela 4.3 Nmero de lhotes de cadelas submetidas a inseminao articial no Hospital Veterinrio
da UEL em 2005.
Nmero de Filhotes
3,33
13,33
20,00
10
33,34
23,33
6,67
da amostra:
fr =
fi
.
n
fr % =
fi
100.
n
Distribuio de frequncias
35
Evidentemente a soma das frequncias absolutas igual ao nmero total das cadelas que foram
submetidas inseminao articial.
Para se construir a Tabela 4.3, usando o
R, os comandos so:
Filhotes = c(5,4,3,4,3,1,4,4,5,3,0,1,3,2,2,3,2,3,4,2,3,3,1,1,3,3,4,2,4,2)
(filhotes.caes = table(Filhotes))
(percentual.caes = round(100*prop.table(filhotes.caes), dig=2))
(tabela.filhotes = cbind(filhotes.caes, percentual.caes))
colnames(tabela.filhotes) = c(`Freq. Absoluta', `Percentual')
tabela.filhotes
Isto quer dizer que se usssemos as tabelas de frequncias, como no caso das variveis
discretas teramos uma tabela com muitas linhas, tornando-a pouco operacional.
este problema usa-se descrever as variveis numricas contnuas atravs de
Para contornar
tabelas de classes de
(kg)
Dados Brutos
5,5
19,0
28,0
30,0
33,0
40,0
40,0
40,3
40,5
12,6
12,6
14,2
14,2
17,5
17,5
18,0
19,0
19,2
21,0
21,0
27,0
27,0
27,0
27,2
28,0
28,0
30,0
30,0
39,8
13,5
O que se pode dizer sobre os ces com base nestes dados? possvel ter uma ideia clara,
apenas observando os nmeros? O passo seguinte, optativo, poderia ser a obteno do rol:
Rol
5,5
12,6
12,6
13,5
14,2
14,2
17,5
17,5
18,0
19,0
19,0
19,2
21,0
21,0
27,0
27,0
27,0
27,2
28,0
28,0
28,0
30,0
30,0
30,0
33,0
39,8
40,0
40,0
40,3
40,5
36
uma tabela, pode depender mais do bom senso do pesquisador, de acordo com seus interesses e
necessidades, do que de regras pr-estabelecidas. Um exemplo disso a Tabela 4.4 que mostra os
Tabela 4.4 Frequncias dos intervalos entre cios observados em um rebanho leiteiro da raa Holands, segundo a classicao de Gaines (1994).
Percentual (%)
0 3
0,1
4 17
6,3
18 24
44,6
25 35
5,8
36 48
16,3
> 48
27,0
Caso no haja, por parte do pesquisador, um motivo para o uso de intervalos de classes
diferentes, pode-se optar pela utilizao de uma das regras para se construir os intervalos de classes.
Dentre as vrias regras existentes, duas tem sido adotadas:
a)
(k1)
i
, i = 0, 1, . . . , k 1.
n=
)
k1 (
k1
i=0
= (1 + 1)k1 = 2k1
Gaines, J.D. Proceedings for annual meeting. Kansas City: Society for Theriogenology, 1994.
Analysis of repro-
Distribuio de frequncias
37
k = 1+
log10 n
log10 n
=1+
log10 2
0, 301029
k = 1 + 3, 3 log n
b)
literatura. Para o exemplo em questo, o nmero de classes recomendado ser dado por:
k = 1 + 3, 3 log 30
= 1 + 3, 3 1, 4771
ou
k=
30 = 5, 4772.
= 5, 8745
Logo, sero utilizadas, aproximadamente,
k=6
a =
amplitude total
nmero de classes
40, 5 5, 5
= 5, 9579.
5, 8745
a = 6 kg
classes.
A primeira classe de frequncias um intervalo do tipo
(l + 2a)
e assim sucessivamente.
l (l + a),
a segunda
(l + a)
fechado esquerda e portanto pertencem classe valores iguais ao extremo inferior dessa classe.
Tambm estamos indicando que o intervalo aberto direita e portanto no pertencem classe
valores iguais ao extremo superior.
38
Assim, tem-se:
Tabela 4.5 Distribuio de frequncia dos pesos
(kg)
Pesos (kg )
Ponto mdio
11
3,33
11
17
14
16,67
17
23
20
26,67
23
29
26
23,33
29
35
32
13,33
35
41
38
16,67
30 dados.
17
29
animais nas classes extremas. No entanto isto tem um preo, por exemplo, tudo que se sabe agora
que apenas um valor est entre
5, 0
11, 0 kg ,
11, 0
17, 0 kg ,
e assim
por diante. Mas no se sabe quais so esses valores. Dessa forma, como no se conhece os dados
originais, como acontece muitas vezes em certas publicaes cientcas, deve-se utilizar o ponto mdio
da classe, como um valor representativo. Assim, tudo se passa como se os dados originais fossem
constitudos por um valor igual a
20, 0 kg ,
8 kg ,
14, 0 kg ,
etc.
Para estruturar a tabela de frequncias usando o
caes = c(5.5,19.0,28.0,30.0,33.0,40.0,40.0,40.3,40.5,12.6,
12.6,14.2,14.2,17.5,17.5,18.0,19.0,19.2,21.0,21.0,
27.0,27.0,27.0,27.2,28.0,28.0,30.0,30.0,39.8,13.5)
hist(caes, plot=F, breaks=c(5,11,17,23,29,35,41), right=F)
Caso queira construir a tabela da forma exata como apresentado na Tabela 4.5,
acrescente os seguintes comandos:
Distribuio de frequncias
39
Exemplo:
(kg)
2,63
3,63
1,94
3,69
2,77
1,42
2,48
3,77
2,75
2,04
2,16
4,05
1,80
2,22
2,06
1,20
1,67
5,41
1,57
3,09
2,16
3,94
2,06
3,55
3,56
3,57
2,39
2,48
1,53
2,67
2,18
3,93
3,34
2,78
3,26
3,06
3,32
3,37
0,75
i) Encontre o nmero de classes para a construo de uma tabela para estes dados;
Soluo:
Soluo:
Soluo:
40
Soluo:
Soluo:
http://www.ibge.gov.br/estadosat/temas.php?sigla=rs&tema=pecuaria2012,
Acasalamentos
Raas
Fecundos
Infecundos
Charolesa
606
394
Indubrasil
508
632
Nelore
394
406
Fonte: Fictcia
41
Tabela 4.7 Nmero de cabeas da produo pecuria dos estados do Sul do Brasil em 2012.
Estados
Pecuria
Totais
Paran
Santa Catarina
Bovinos
9.413.937
4.072.960
14.140.654
27.627.551
Sunos
5.518.927
7.480.183
6.213.316
19.212.426
Ovinos
638.923
307.651
4.095.648
5.042.222
Equinos
325.837
122.565
468.691
917.093
Caprinos
176.130
57.243
100.283
333.656
Bubalinos
24.502
13.898
74.792
113.192
Muares
39.132
1.965
2.888
43.985
1.710
925
1.747
4.382
16.139.098
12.057.390
25.098.019
53.294.507
Asininos
Totais
R:
pec_pr = read.csv2('http://www.ibge.gov.br/estadosat/download/pr_pecuaria2012.csv',
sep=';', head=F)
pr = data.frame(pec_pr[1:8, -3])
pec_sc = read.csv2('http://www.ibge.gov.br/estadosat/download/sc_pecuaria2012.csv',
sep=';', head=F)
sc = data.frame(pec_sc[1:8, -3])
pec_rs = read.csv2('http://www.ibge.gov.br/estadosat/download/rs_pecuaria2012.csv',
sep=';', head=F)
rs = data.frame(pec_rs[1:8, -3])
rebanhos = data.frame(PR=pr, SC=sc[ , 2], RS=rs[ , 2])
pecuaria = data.frame(rebanhos[with(rebanhos, order(-RS)), ])
names(pecuaria) = c('Pecuria', 'Paran', 'Santa Catarina', 'Rio Grande do Sul')
require(xtable)
xtable(pecuaria)
Captulo 5
Grcos
O objetivo da representao grca apresentar de maneira clara, rpida e objetiva os
dados coletados na primeira fase do trabalho estatstico. Um grco tem a funo de transmitir uma
idia visual do comportamento de um conjunto de valores, de forma a se poder tirar concluses claras
de tabelas complicadas.
Existem
a) toda representao grca deve ter ttulo, escala e fonte dos dados, de forma a dispensar qualquer
esclarecimento adicional;
c) a primeira srie de variveis dever car no eixo das abscissas (X ). Consequentemente, a segunda
no eixo das ordenadas (Y );
g) ao lado da escala da abscissa deve ser escrita a caracterstica relativa mesma. Em cima da escala
da ordenada deve constar a caracterstica correspondente. A razo da altura para a largura pode
variar de 60% a 80% para que a gura tenha boas propores (simetria e equilbrio);
Existem inmeras formas grcas interessantes, sero apresentados apenas alguns tipos
de grcos.
42
43
(ni
ou
fi ),
b) a distncia entre as barras deve ser constante e de preferncia menor que a largura das barras.
Considere o
100
Frequncias
80
60
40
20
0
Pinscher
Pastor
Alemo
Poodle
Rottweiller
SRD
Outros
Figura 5.1 Raas caninas atendidas no Hospital Veterinrio da Universidade Estadual de Londrina
em 2003.
O programa
44
Captulo 5. Grcos
Nem sempre interessante utilizar os dados absolutos no eixo das ordenadas. de uso
mais frequente apresent-la utilizando-se a porcentagem. A Figura 5.2 apresenta os mesmos dados
utilizados na Figura 5.1, s que transformando os valores absolutos em porcentagem.
40
Percentuais (%)
30
20
10
0
Pinscher
Pastor
Alemo
Poodle
Rottweiller
SRD
Outros
Figura 5.2 Percentual de raas caninas atendidas no Hospital Veterinrio da Universidade Estadual
de Londrina em 2003.
R:
Observe que neste caso, so fornecidos os totais observados para cada categoria. Caso
o grco fosse construdo a partir de um banco de dados, seria necessrio tabular os valores de cada
categoria primeiro. Considere os dados dos pers dos alunos do curso de Medicina Veterinria do ano
de 2011. Na Figura 5.3 so apresentados os resultados para a cor dos olhos, em porcentagem.
45
80
Percentual (%)
60
40
20
0
Castanhos
Verdes
Azuis
Pretos
Figura 5.3 Cor dos Olhos dos alunos do 1 ano do curso de Medicina Veterinria da Universidade
Estadual de Londrina em 2011.
O programa
por:
rm(list=ls())
require(foreign)
perfil = read.epiinfo('http://www.uel.br/pessoal/silvano/Veter/Dados/Perfil2011.rec')
names(perfil) ; attach(perfil)
(tab.olhos = table(Q6))
names(tab.olhos) = c('Azuis','Castanhos','Pretos', 'Verdes')
barplot(tab.olhos, xlab="Cor dos olhos", ylab="Frequncias", col="LightYellow", las=1)
abline(h=0, lwd=1)
#------------------------------------# Ordenando por valores decrescentes #------------------------------------(tab.olhos.ord = sort(tab.olhos, decreasing = T))
barplot(tab.olhos.ord, xlab="Cor dos olhos", ylab="Frequncias",
col="LightYellow", las=1)
abline(h=0, lwd=1)
#---------------------------# Utilizando os percentuais #----------------------------
46
Captulo 5. Grcos
par(mai=c(1,1,.15,.2))
barplot(100*prop.table(tab.olhos.ord), ylim=c(0,80), xlab="Cor dos olhos",
ylab="Percentual (%)", col="LightYellow", las=1, space=0.7)
abline(h=0, lwd=1)
Quando os rtulos dos eixos (atributo) da varivel so longos, pode-se optar pelo grco
de barras.
Outros
SRD
Pinscher
Pastor
Alemo
Poodle
Rottweiller
20
40
60
80
100
120
Frequncias
Figura 5.4 Raas caninas atendidas no Hospital Veterinrio da Universidade Estadual de Londrina
em 2003.
horiz=T
R,
X.
47
1500
Bovinos
Sunos
Nmero de cabeas
(x 10.000)
1000
500
0
Rio Grande do Sul
Paran
Santa Catarina
Estados
Figura 5.5 Produo pecuria dos estados do sul do Brasil no ano de 2012.
48
Captulo 5. Grcos
Os comandos do
rm(list=ls())
cabecas=c(14140654, 9413937, 4072960,
6213316, 5518927, 7480183,
4095648, 638923, 307651,
468691, 325837, 122565,
100283, 176130, 57243,
74792, 24502, 13898,
2888, 39132,
1965,
1747,
1710,
925)/10000
(dados = matrix(cabecas, nrow=8, byrow=T))
rownames(dados) = c('Bovinos','Sunos','Ovinos','Equinos','Caprinos',
'Bubalinos','Muares','Asininos')
colnames(dados) = c('Rio Grande do Sul','Paran','Santa Catarina')
dados
#----------------------------# Apenas Bovinos e Sunos #----------------------------(parte = dados[1:2, 1:3])
par(mai=c(1, 1.2, .2, .2))
ylim = range(0, 1600, by=300)
barplot(parte, beside=T, col = c("lightgreen", "lightblue"), ylim=ylim,
angle=c(90, 0), xlab="Estados", ylab='', las=1)
legend(7, 1400, angle=c(90,0), legend=rownames(parte), bty='n',
fill=c('lightgreen','lightblue'), cex=1)
mtext('Nmero de cabeas \n (x 10.000)', side=2, line=4)
abline(h=0)
49
2000
Bovinos
Sunos
Nmero de cabeas
(x 10.000)
1500
1000
500
0
Rio Grande do Sul
Paran
Santa Catarina
Estados
Figura 5.6 Produo pecuria dos estados do sul do Brasil no ano de 2008.
Os comandos do
50
Captulo 5. Grcos
n
f
360o
io
fi
360
fi .
n
io =
corresponde ao ngulo
io .
n = 38.650,
360o
Assim, tem-se:
1o =
360
360
20.650 = 192, 34o 2o =
12.300 = 114, 57o
38.650
38.650
3o =
360
5.700 = 53, 09o
38.650
Figura 5.7 Categoria dos animais atendidos no Hospital Veterinrio da Universidade Estadual de
Londrina, no ano de 2005.
O programa
51
Pequeno Porte
(68,4%)
Grande Porte
(7,4%)
Mdio Porte
(24,2%)
Figura 5.8 Categoria dos animais atendidos no Hospital Veterinrio da Universidade Estadual de
Londrina, no ano de 2005.
52
Captulo 5. Grcos
14 %
Incomoda muito
Incomoda pouco
32 %
28 %
Gnero
Feminino
Masculino
6 %
14 %
6 %
Tolerncia ao Cigarro
O programa
pedroso = read.table("http://www.uel.br/pessoal/silvano/Veter/Dados/questionario.txt",
head=T, dec=".", sep="")
attach(pedroso)
Sexo = factor(Sexo, label=c("Feminino", "Masculino"))
Toler = factor(Toler, label=c("Indiferente", "Incomoda muito", "Incomoda pouco"))
dupla.ent.p = round(100*prop.table(table(Toler, Sexo)), 2)
par(mar=c(3.1, 2.7, 1, 1), cex.lab=1.2, col.lab='black')
plot(dupla.ent.p, col="LightYellow", xlab="Tolerncia ao Cigarro", ylab='Gnero',
main='', las=1, cex.axis=1.1)
text(.25, .65, paste(dupla.ent.p[1,1],'%', sep=' '), col= "red", cex=1.1)
text(.49, .65, paste(dupla.ent.p[2,1],'%', sep=' '), col= "red", cex=1.1)
text(.82, .65, paste(dupla.ent.p[3,1],'%', sep=' '), col= "red", cex=1.1)
text(.25, .12, paste(dupla.ent.p[1,2],'%', sep=' '), col= "blue", cex=1.1)
53
10
Freqncias
0
0
Nmero de Filhotes
Figura 5.10 Nmero de lhotes de cadelas submetidas a inseminao articial no Hospital Veterinrio da UEL em 2003.
O programa
Filhotes = c(5, 4, 3, 4, 3, 1, 4, 4, 5, 3, 0, 1, 3, 2, 2, 3,
2, 3, 4, 2, 3, 3, 1, 1, 3, 3, 4, 2, 4, 2)
sort(Filhotes)
(tab.cad = table(Filhotes))
par(mai=c(1,1,.2,.3),mgp=c(3, 1, 0))
54
Captulo 5. Grcos
5.3.1 Histograma
uma sequncia de retngulos justapostos, em que cada retngulo tem como base a
amplitude do intervalo e como altura as respectivas frequncias (absoluta ou relativa). A Figura 5.11
mostra a distribuio do nmero de atendimentos dirios, do Hospital Veterinrio, da Universidade
Estadual de Londrina, nos ltimos 50 dias.
20
Frequncias
15
10
0
12
18
24
30
36
42
48
54
Nmero de atendimentos
55
atendimentos/dia.
O programa
atend=c(49,39,42,43,45,22,23,24,25,23,32,30,31,32,33,12,15,16,19,20,18,30,31,32,33,
33,26,26,27,28,28,27,33,30,31,32,33,29,29,27,28,41,39,38,35,37,35,34,36,36)
par(mai=c(1, 1, .2, .2))
hist(atend, breaks=c(12,18,24,30,36,42,48,54), freq=T, right=F, col="red", main="",
ylim=c(0,20), las=1, xaxt="n", xlab='', ylab='Frequncias', border="blue", density=10)
mtext('Nmero de atendimentos', side=1, line=2) ; abline(h=0)
axis(1, at = c(12,18,24,30,36,42,48,54), line=-1)
Obs.:
labels=T.
20
Frequncias
15
10
0
9
15
21
27
33
39
45
51
57
Pontos Mdios
Figura 5.12 Nmero mdio de atendimentos dirios, do Hospital Veterinrio, da Universidade Estadual de Londrina, nos ltimos 50 dias.
Os comandos do
56
Captulo 5. Grcos
atend=c(49,39,42,43,45,22,23,24,25,23,32,30,31,32,33,12,15,16,19,20,18,30,31,32,33,
33,26,26,27,28,28,27,33,30,31,32,33,29,29,27,28,41,39,38,35,37,35,34,36,36)
(histo = hist(atend, breaks=c(12,18,24,30,36,42,48,54), las=1, freq=T, right=F, xlab='',
ylab="Frequncias", col="LightYellow", main="", ylim=c(0,20), plot=F))
(pontos.medios = c(9, histo$mids, 57))
(fr = c(0, histo$counts, 0))
par(mai=c(1,1,.2,.2))
plot(pontos.medios, fr, type="l", lwd=2, bty="l", xlab="Pontos Mdios",
ylab="Frequncias", col="red", main="", ylim=c(0,20),las=1, xaxt="n")
axis(1, at=c(pontos.medios))
abline(h=0)
ramo-e-folhas
12 15 16 18 19 20 22 23 23 24 25 26 26 27 27 27 28 28 28 29 29 30 30 30 31
31 31 32 32 32 32 33 33 33 33 33 34 35 35 36 36 37 38 39 39 41 42 43 45 49
12
ramo = 1 e folha = 2
15
ramo = 1 e folha = 5
16
ramo = 1 e folha = 6
18
ramo = 1 e folha = 8
19
ramo = 1 e folha = 9
45
ramo = 4 e folha = 5
49
ramo = 4 e folha = 9
57
b) Escrever os ramos em ordem crescente verticalmente e passar uma linha vertical direta deles.
1 | 2
1 | 5689
2 | 02334
2 | 56677788899
3 | 0001112222333334
3 | 55667899
4 | 123
4 | 59
Os comandos do
atend=c(49,39,42,43,45,22,23,24,25,23,32,30,31,32,33,12,15,16,19,20,18,30,31,32,33,
33,26,26,27,28,28,27,33,30,31,32,33,29,29,27,28,41,39,38,35,37,35,34,36,36)
stem(atend)
Obs.:
console do R
Box Plot )
O chamado grco de caixa (ou box plot, box-whisker plot ), tem por nalidade a deteco de
observaes discrepantes e o estudo da simetria da distribuio.
O grco de caixas d uma idia da posio, disperso, assimetria, caudas e dados discrepantes.
A posio central dada pela mediana e a disperso por
dq .
As posies relativas de
q1 , q2 , q3
do uma noo
da assimetria da distribuio. Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos
valores remotos e pelos pontos atpicos (Bussab & Morettin, 2003).
A Figura 5.13 mostra a comparao, atravs do grco de caixas, dos pesos
(g)
de tilpias do
nilo, coletados por quatro equipes de alunos do curso de Medicina Veterinria, no tanque de piscicultura da
Universidade Estadual de Londrina, no ano de 2003.
58
Captulo 5. Grcos
500
Pesos (g)
450
400
+
+
1012
2021
2022
350
300
250
1011
Equipes
Figura 5.13 Comparao de pesos (g) de tilpias para quatro equipes de alunos do curso de Medicina
Veterinria da Universidade Estadual de Londrina em 2003.
A determinao dos quartis e demais valores para a construo do grco de caixas ser visto
no Captulo 6.
Os comandos do
tilapia = read.table("http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt",
head=T, dec='.')
attach(tilapia)
names(tilapia)
(medias = tapply(Peso, factor(Equipe), mean))
par(mai=c(1,1,.2,.2))
boxplot(Peso~factor(Equipe), xlab='Equipes', ylab='Pesos (g)', las=1, bty='l',
col="LightYellow", pch=19, outline=F)
points(medias, pch="+", cex=1.5, col="blue")
(X, Y )
do sistema de coordenadas
cartesianas. O objetivo deste tipo de diagrama vericar se existe algum tipo de associao entre as variveis
observadas.
59
500
450
Peso (g)
400
350
300
250
200
22
24
26
28
30
Comprimento (cm)
Figura 5.14 Relao entre peso e comprimento de tilpias do Nilo, do tanque de piscicultura da
Universidade Estadual de Londrina, 2003.
Da Figura 5.14 nota-se uma relao linear crescente entre as variveis Peso e Comprimento. No
Captulo
tilapia = read.table("http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt",
header=TRUE, dec=",")
attach(tilapia)
names(tilapia)
par(mai=c(1, 1, .2, .2))
plot(Peso ~ Comp, las=1, xlab="Comprimento (cm)", ylab="Peso (g)", pch=19, col="blue",
cex=1.2, bty="l")
detach(tilapia)
60
Captulo 5. Grcos
A Figura 5.15 mostra a relao entre o peso
(s)
(g)
e comprimento
(cm)
raio de cada circunferncia. Quanto maior o raio, maior o tempo que o animal levou para se recuperar da
anestesia.
500
Pesos (g)
400
300
200
22
24
26
28
30
32
Comprimento (cm)
Figura 5.15 Relao entre peso e comprimento de tilpias do Nilo, controladas para a varivel tempo
de recuperao da anestesia, do tanque de piscicultura da Universidade Estadual de
Londrina, 2003.
A Figura 5.15 mostra que h tilpias que demoraram mais tempo a se recuperar da anestesia. Os comandos
do
tilapias = read.table('http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt',
head=T, dec=',')
attach(tilapias)
names(tilapias)
symbols(Peso~Comp, circles = Recup/500,
inches=F, bty="l", bg="LightGreen", xlab="Comprimento (cm)",
ylab="Pesos (g)", fg="blue", las=1)
61
recebido.
420
Pesos (g)
400
380
360
340
320
Semanas
Figura 5.16 Peso mdio de 10 tilpias, do tanque de piscicultura da UEL, acompanhadas durante 8
semanas.
Os comandos do
prod = read.table("http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt",
head=T, dec=",")
(dados=data.frame(Prod=sort(prod[1:8,4]), Semanas=1:8))
attach(dados)
par(mai=c(1,1,.2,.2))
plot(Semanas, Prod, las=1, xlab="Semanas", ylab="Pesos (g)", lwd=2.5, type="b",
bty="l", col="blue", xaxt='n')
axis(1, at=c(0,1,2,3,4,5,6,7,8))
detach(prod)
Um cuidado a se ter com grcos, com as escalas adotadas. Muitas vezes uma mudana de
escala pode dar uma impresso errnea sobre a realidade dos acontecimentos.
62
Captulo 5. Grcos
Meses
Nmero de atendimentos
Janeiro
410
Fevereiro
430
Maro
450
Abril
408
Maio
408
Junho
405
Fonte: Fictcia
Os grcos, com escalas diferentes, para representar os dados da Tabela 5.1, so dados pelas
Figuras 5.17 e 5.18.
450
450
400
350
Nmero de atendimentos
Nmero de atendimentos
440
430
420
300
250
200
150
100
410
50
400
0
Janeiro
Fevereiro
Maro
Abril
Maio
Meses
Junho
Janeiro
Fevereiro
Maro
Abril
Maio
Junho
Meses
Observe que na Figura 5.17 tem-se a impresso de que houve um nmero muito grande de
63
atendimentos comparado aos outros meses. Perceba que a escala do grco comea em 400 atendimentos.
J na Figura 5.18 a escala comea no zero e percebe-se que no ms de maro houve, realmente, um nmero
maior de atendimentos, mas que a quantidade de atendimentos a mais no to signicativa quanto quela
apresentada na Figura 5.17. Logo, cuidado ao analisar grcos, seja crtico.
Os comandos do
atend = c(410,430,450,408,408,405)
names(atend) = c('Janeiro', 'Fevereiro', 'Maro', 'Abril', 'Maio', 'Junho')
barplot(atend-400, las=1, xlab='Meses', ylab='Nmero de atendimentos',
col='red', yaxt='n', space=0.6, density=10)
axis(2, at=seq(0,50, by=10), lab=seq(400,450, by=10), las=1)
abline(h=0, col='black', lwd=1)
barplot(atend, las=1, xlab='Meses', ylab='Nmero de atendimentos',
col='red', yaxt='n', space=0.6, density=10)
axis(2, at=seq(0,450, by=50), las=1)
abline(h=0, col='black', lwd=1)
Uma grande variedade de modelos grcos, aplicados s mais diversas reas, pode ser encontrada
na seguinte pgina:
http://bm2.genes.nig.ac.jp/RGM2/index.php?clear=all.
Captulo 6
Medidas de Posio
Viu-se que o resumo de dados atravs de grcos e tabelas de frequncias fornece muitas informaes sobre o comportamento de uma varivel. Muitas vezes, deseja-se resumir ainda mais esses dados,
apresentando um ou alguns valores que sejam representativos do conjunto em estudo.
As medidas de posio so utilizadas para sintetizar, em um nico nmero, o conjunto de
dados observados da varivel em estudo. Usualmente emprega-se uma das seguintes medidas de posio (ou
localizao) central: mdia, mediana ou moda.
y.
Exemplo:
Os pesos, em
kg ,
de
10
seguintes valores:
3, 7 3, 8 4, 8 5, 1 3, 9 4, 1 4, 2 4, 0 4, 5 5, 0.
Logo, a mdia ser:
y =
3, 7 + 3, 8 + 4, 8 + 5, 1 + 3, 9 + 4, 1 + 4, 2 + 4, 0 + 4, 5 + 5, 0
= 4, 31 kg.
10
Os comandos do
pesos = c(3.7, 3.8, 4.8, 5.1, 3.9, 4.1, 4.2, 4.0, 4.5, 5.0)
mean(pesos)
64
65
y1 , y2 , . . . , yn
os
valores da varivel
Y,
1
yi
n i=1
n
y =
sendo
yi
(6.1)
o total de observaes.
em que
Prova
Peso (pi )
P1
P2
P3
P4
P 1 , P2 , P3
y =
P4
P1 + P2 + 2 P3 + 2 P4 + T
5
pi
i=1
em que o valor
pi
i=1
De forma genrica, tem-se:
y =
yi pi
i=1
i=1
pi
66
sendo
Exemplo:
pi
P1
P2
P3
P4
P5
Notas
8,5
6,5
7,7
9,0
7,5
10,0
Pesos
Soluo:
Os comandos do
distribuies de frequncias,
o clculo da mdia
passa a ser:
y =
y i fi
i=1
k
,
fi
i=1
sendo
yi
o nmero de classes e
fi
as frequncias observadas.
Portanto, o clculo da mdia para dados agrupados, nada mais que o clculo de uma
mdia ponderada em
Exemplo:
Considere a distribuio de frequncias dos pesos de ces das raas Fila Brasileira e Pastor Alemo,
Mdia Geomtrica
67
(kg)
de
30
(kg)
11
17
23
29
35
41
Ponto mdio
(yi )
yi fi
1
5
8
7
4
5
Total
30
Soluo:
Os comandos do
yi = c(8,14,20,26,32,38)
fi = c(1,5,8,7,4,5)
(media = weighted.mean(yi, fi))
Obs.:
A mdia sofre muita inuncia de valores atpicos. Por outro lado, tima se a distribuio dos dados
calculada por:
yg = n y1 y2 . . . yn
ou
yg =
yi
(6.2)
i=1
A Contagem Bacteriana Total - CBT relaciona-se principalmente com prticas de higiene durante
a ordenha e limpeza do equipamento de ordenhar. Sendo assim, considere os dados apresentados na Tabela 6.2
68
Tabela 6.2 Efeito da temperatura de armazenamento e tempo aps a ordenha sobre o crescimento
bacteriano.
Temperatura de
armazenamento
(o C)
3 horas
9 horas
24 horas
9.000
9.000
10.000
15
10.000
46.000
5.000.000
25
18.000
1.000.000
57.000.000
35
30.000
35.000.000
800.000.000
Fonte:
Obs.:
Tempo de armazenamento
http://www.laticinio.net/inf_tecnicas.asp?cod=62
4 oC
Determine a mdia geomtrica do nmero de bactrias encontrada nos trs tempos apresentados
na Tabela 6.2.
Soluo:
Os comandos do
require(psych)
cbt_3 = c(9000, 10000, 18000, 30000)
cbt_9 = c(9000, 46000, 1000000,35000000)
cbt_24 = c(10000, 5000000, 57000000, 800000000)
geometric.mean(cbt_3)
geometric.mean(cbt_9)
Mdia Geomtrica
69
geometric.mean(cbt_24)
Observe que necessrio instalar o pacote
psych.
asbio,
os
comandos seriam:
require(asbio)
cbt_3 = c(9000, 10000, 18000, 30000)
G.mean(cbt_3)
Pode ser necessrio o uso de logaritmos para o clculo da mdia geomtrica. Nesta situao,
aplica-se o logaritmo ao segundo termo da Equao (6.2), obtendo-se:
log yg
yg
1
(log10 y1 + log10 y2 + + log10 yn )
n
10
yg =
70
Exemplo:
Soluo:
6.4 Mediana
A mediana, denotada por
zar o centro da distribuio de frequncias quando os valores so dispostos em ordem crescente ou decrescente
de magnitude.
o valor que divide o conjunto ordenado de valores em duas partes com igual nmero de
elementos, ou seja, 50% das observaes cam acima da mediana e 50% cam abaixo.
Para calcular a mediana deve-se, em primeiro lugar, ordenar os dados para que se possa localizar
a posio da mediana e assim encontrar seu valor.
mpar.
posio:
EM d =
Exemplo:
n+1
.
2
O nmero de pacientes atendidos no Hospital Veterinrio da UEL, nos ltimos 11 dias foi:
10 12
Determine a mediana.
11
17 21 18
16
17 20
15
27
Mediana
71
10 11
12
15 16 17
17
18 20
21
27.
EM d =
11 + 1
= 6,
2
mediana
neste
Os comandos do
pacientes = c(10, 12, 11, 17, 21, 18, 16, 17, 20, 15, 27)
median(pacientes)
Obs.: Caso queira ordenar os elementos, o comando :
sort(pacientes)
b) A varivel em estudo discreta e
par.
(
EM d =
Exemplo:
n
2
n+2
2
)
.
Acrescentando-se mais um dia aos dados do nmero de paciente atendidos pelo Hospital Vete-
10 11
12
14 15 16
17
17 18
20
21
27.
Portanto, a mediana ser a mdia aritmtica dos valores cujos elementos so:
(
EM d =
Logo,
Md =
12
=6
2
)
12 + 2
=7 .
2
16 + 17
= 16, 5.
2
A mediana uma medida resistente a valores atpicos (muito grandes ou muito pequenos).
Os comandos do
pac = c(10, 11, 12, 14, 15, 16, 17, 17, 18, 20, 21, 27)
median(pac)
72
(EM d Fac1 )
a,
fM d
M d = Li +
(6.3)
sendo:
Li
a
fM d
Fac1
Exemplo:
EM d =
Portanto, a classe mediana :
23 29,
n
30
=
= 15.
2
2
Md
Md
(15 14)
6
7
= 23, 86 kg.
= 23 +
6.5 Moda
Outra medida que pode ser utilizada a
moda,
qualitativa.
Moda
73
Exemplo 1:
155 161 163 163 168 168 168 169 172 175.
Logo, a altura modal entre esses alunos
Os comandos do
M o = 168 cm,
estat = c(155, 161, 163, 163, 168, 168, 168, 169, 172, 175)
tab.est = table(estat)
estat.mo = names(tab.est)[tab.est == max(tab.est)]
estat.mo
Exemplo 2:
Exemplo 3:
Exemplo 4:
Tipo Sanguneo
Frequncia
277
141
102
37
AB
O sangue tipo O ocorreu com maior frequncia. Ento a moda dessa amostra sangue tipo O.
tivas discretas,
variveis quantita-
a determinao da moda imediata, bastando, para isso, consultar na tabela, o valor que
apresenta maior frequncia, sendo este a moda. Considerando-se os dados da Tabela 6.3, determine a moda.
Tabela 6.3 Tempo (em semanas) de sobrevida de ratos com cncer induzido experimentalmente.
Sobrevida (semanas)
30
Nmero de ratos
10
Neste caso, a moda 6 semanas, pois o valor que ocorre com maior frequncia.
Para dados agrupados em uma tabela de distribuio de frequncias para
variveis quantita-
Moda bruta - o mtodo mais rudimentar para o clculo da moda em tabelas de frequncias, com valores
agrupados em classes. Consiste em tomar o ponto mdio da classe modal (aquela que apresenta maior
frequncia).
74
b)
Figura 6.1 Esquema para obteno da moda pelo mtodo de Czuber, do nmero de atendimentos
do Hospital Veterinrio da UEL, 2005.
Processo:
Na Figura 6.1, marca-se, na classe modal, os vrtices A, B, C e D;
Traa-se retas
AC
BD;
No ponto de interseco dessas retas (E), traa-se uma perpendicular ao eixo das ordenadas, localizando
o ponto
Mo ,
O ponto
Mo
onais a
anterior e
Por
valor da moda;
divide a intervalo da classe modal
2 ,
sendo
(a)
traa-se a reta
FG
Li
(Mo ),
o limite inferior e
Ls
ABE
EG,
CDE ;
Mo = Li + x;
EF
a distncia entre
Li
e a moda
(6.4)
Emanuel Czuber: nasceu em 19/01/1851 em Praga, Repblica Tcheca e morreu em 22/08/1925 em Gnigl, Austria.
Moda
75
Sendo os tringulos
ABE
CDE
EF
EG
AB
CD
x
ax
1
2
x2
x
= a1 x1
=
1
a
1 + 2
(6.5)
M o = Li +
1
a,
1 + 2
(6.6)
em que:
Li
a
c)
Frmula de Pearson - em distribuies moderadamente assimtricas pode ser usada a frmula de Pearson,
dada por:
Mo
x
= 3M d 2
em que:
Md
x
= o valor da mediana;
= a mdia amostral;
(6.7)
76
Exemplo:
Determinar a moda pelos mtodos: moda bruta, Czuber e Pearson da seguinte distribuio:
Classes
fi
Fi
10
20
10
10
20
30
15
25
30
40
20
45
40
50
15
60
50
60
68
60
70
70
Total
a) A classe modal
30 40,
70
35;
Mo =
Li +
1
a,
1 + 2
Mo =
30 +
5
10 = 35.
5+5
Mo
x
= 3M d 2
Mo
Observaes:
a) mdia, mediana e moda tm interpretaes diferentes, mas ajudam igualmente a representar um conjunto
de dados. A mdia pode ser vista como ponto de equilbrio das observaes, a mediana como o ponto
mdio e a moda como o ponto de mxima frequncia;
b) dados categricos (ou qualitativos) no tem mdia nem mediana, mas podem ter moda.
c) se a distribuio dos dados absolutamente
simtrica
assimetria positiva;
Na seo 6.8, pgina 84, apresentado formas de se calcular a assimetria e a curtose de uma
conjunto de dados.
77
Escolha da mdia:
i) quando a distribuio dos dados pelo menos aproximadamente simtrica;
ii) quando for necessrio obter posteriormente outros parmetros que podem depender da mdia, como
por exemplo a varincia, o desvio padro, etc.
b)
Escolha da mediana
i) quando h valores extremos;
ii) quando deseja-se conhecer o ponto central da distribuio;
iii) quando a distribuio dos dados muito assimtrica.
c)
Escolha da moda
i) quando a medida de interesse o ponto mais tpico ou popular dos dados;
ii) quando precisa-se apenas de uma rpida idia sobre a tendncia central dos dados.
Quando os
dados so assimtricos, a mediana identica mais adequadamente o centro de um conjunto de dados. Para
entender bem uma distribuio, pode-se conhecer valores acima ou abaixo dos quais se encontra uma determinada porcentagem dos dados atravs da medidas separatrizes. Separatriz de uma srie de
termos colocados
em ordem crescente de valor, o termo da srie que a divide em duas partes quaisquer. As principais separatrizes so a
100 p
(100 p)% das observaes esto nele ou abaixo dele e 100(1p)% esto nele ou acima dele (0 < p < 1).
Assim, o percentil generaliza qualquer tipo de medida separatriz. Logo, tem-se:
i) o percentil de ordem 50
(P50 )
a mediana;
P25 = Q1 , P50 = Q2
P75 = Q3 ,
respectivamente,
100 p,
ou seja
P100 p .
No
so
78
y1
o menor valor e
yn
y 1 , y2 , , yn
p.
representando os
entre 0 e 1, o p-simo
y +y
(i+1)
(i)
, se f = 0
2
yp =
y
se f > 0
(i+1) ,
em que
a parte inteira e
a parte fracionria de
np = i + f .
R,
Um outro critrio, que pode ser adotado, considerar a estatstica de ordem par mais prxima.
Neste caso, no
Exemplo:
R,
29, 0 29, 5 29, 3 25, 8 29, 8 24, 3 27, 0 29, 6 30, 0 28, 5
Determinar os percentis:
0, 20 0, 34 0, 45.
Medidas Separatrizes
79
Soluo:
Os comandos do
4 so:
tilap = c(29.0,29.5,29.3,25.8,29.8,24.3,27.0,29.6,30.0,28.5)
quantile(tilap, probs=c(0.20,0.34,0.45), type=2)
quantile(tilap, probs=c(0.20,0.34,0.45), type=3)
Q1 , Q2
Q3 ,
dividem as observaes ordenadas em quatro partes iguais. O primeiro quartil separa os 25%
inferiores dos 75% superiores dos valores ordenados; o segundo quartil a mediana e o terceiro quartil separa
os 75% inferiores dos 25% superiores dos dados.
Para o clculo dos quartis, utiliza-se uma frmula semelhante da mediana, dada por:
( in
4
Qi = Li +
Fac1
)
a,
fQi
(6.8)
em que:
Li
a
fQi
Fac1
D 1 , D 2 , D3 , . . . , D 9
grupos com cerca de 10% deles em cada grupo. A frmula dada por:
( in
Di = Li +
10
Fac1
fDi
)
a,
(6.9)
80
em que:
Li
a
fDi
Fac1
H nalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1% em cada
grupo. A frmula dada por:
( in
)
Fac1
Pi = Li + 100
a,
fPi
(6.10)
em que:
Li
a
fPi
Fac1
Exemplo:
da raa Landrace,
Tabela 6.4 Peso mdio (kg) das leitegadas da raa Landrace, ao nascer.
Pesos mdios (kg)
Frequncias
12, 0 12, 5
12, 5 13, 0
10
13, 0 13, 5
12
13, 5 14, 0
23
14, 0 14, 5
17
14, 5 15, 0
10
15, 0 15, 5
15, 5 16, 0
Determine:
Medidas Separatrizes
a) a mdia, a mediana e a moda;
Soluo:
Soluo:
c) Determine:
Soluo:
Q1 , Q2 , Q3 , D5 , D6 , P95 ;
81
82
LS = Q3 + 1, 5dq .
LI = Q1 1, 5dq
Q3 ,
d q = Q3 Q1 ;
Q1
e o limite superior
4) vericar se h observaes discrepantes. As observaes que estiverem acima do limite superior ou abaixo
do limite inferior sero consideradas discrepantes do restante dos dados. So, em geral, representadas por
um asterisco (*) ou ().
Na Figura 6.2 so apresentados os quartis, bem como os limites inferior e superior, alm da
mdia e de outliers.
Medidas Separatrizes
83
Exemplo:
Na Figura 6.3 apresentado as frequncias cardacas dos animais atendidos no Hospital Veterinrio,
Freqncia Cardaca
200
150
100
50
Fmeas
Machos
Sexo dos Animais
Figura 6.3 Frequncia cardaca dos animais atendidos no Hospital Veterinrio, da Universidade Estadual de Londrina, em 2003.
Pelo grco, observa-se que as fmeas tm batimentos cardacos mais homogneos que os ma-
84
chos, embora haja alguns animais com batimentos discrepantes em relao ao seu grupo. Em termos mdios,
percebe-se que a mdia de batimentos cardacos para machos e fmeas aproximadamente igual.
Para construo do grco, os comandos do
4 so:
simtrica
ou seja,
y = M d = M o.
b) Assimtrica direita ou positiva.
Quando a cauda da curva da distribuio declina para direita, tem-se uma distribuio com
curva assi-
mtrica positiva:
y > M d > M o.
c) Assimtrica esquerda ou negativa;
Analogamente, quando a cauda da curva da distribuio declina para esquerda, tem-se uma distribuio
com
Assimetria e Curtose
85
Gracamente, tem-se um eixo de referncia ou eixo de simetria, que traado sobre o valor
da mdia da distribuio. Sempre que a curva da distribuio se afastar do referido eixo, ser considerada
como tendo um certo grau de afastamento, que considerado como uma assimetria da distribuio. Ou seja,
assimetria o grau de afastamento que uma distribuio apresenta do seu eixo de simetria.
Existem diversos mtodos para o clculo da medida de assimetria e, entre eles:
a) o
1o coeciente
As =
y M o
s
2o coeciente
de assimetria de Pearson.
Quando a distribuio for quase simtrica ou moderadamente assimtrica, pode-se calcular o grau de
assimetria substituindo-se a moda pela mediana, segundo a relao emprica proposta por Pearson:
As =
c) o
3(
y M d)
s
coeciente quartil de assimetria que, em seu clculo, recorre apenas aos quartis.
Trata-se de uma medida muito til quando no for possvel empregar o desvio-padro como medida de
disperso. denido por:
Asq =
d) o
Q3 2 M d + Q1
Q3 Q1
Outra medida utilizada para avaliar a assimetria de uma distribuio de frequncias o coeciente momento
de assimetria, calculado com base nos momentos centrados da segunda e terceira ordem, denido por:
m3
Asm = ( )3
m2
em que:
(yi y)3 fi
m3 =
Obs.:
i=1
(yi y)2 fi
m2 =
i=1
simtrica;
As > 0 a distribuio assimtrica positiva;
As < 0 a distribuio assimetrica negativa.
As = 0,
ento a distribuio
86
6.8.2 Curtose
A curtose uma medida de disperso que indica at que ponto a curva de frequncias de uma
distribuio se apresenta mais alada ou mais achatada do que uma curva-padro, denominada curva normal.
Para avaliar o grau de curtose de uma curva ou distribuio de frequncias, pode-se adotar dois
tipos de medidas:
a)
kp =
em que,
dq
a distncia interquartlica;
D9
dq
2 (D9 D1 )
o nono decil e
se
k = 0, 263,
se
k > 0, 263,
se
k < 0, 263,
D1
k = 0, 263,
crtica.
b)
km =
em que
m4
m4
m22
ou, ainda,
s2
km =
m4
(s2 )2
a varincia.
A interpretao da curtose :
Chama-se
km > 3
distribuio normal. Diz-se desta funo probabilidade que leptocrtica, ou que a distribuio tem
caudas pesadas (o signicado que relativamente fcil obter valores que se afastam da mdia a vrios
mltiplos do desvio padro);
Se o valor
km < 3
Chama-se-lhe platicrtica.
Obs.:
Assimetria e Curtose
Exemplo:
87
0.020
Densidade de Probabilidade
0.015
0.010
0.005
0.000
0
20
40
60
80
100
120
140
160
180
200
Frequncia Respiratria
Figura 6.4 Frequncias respiratrias dos animais atendidos no Hospital Veterinrio, da Universidade
Estadual de Londrina, em 2003.
4 so:
rm(list=ls())
dados = read.table("http://www2.uel.br/pessoal/silvano/Dados/Dados_HV.txt", sep="\t",
header=T, dec=",")
attach(dados) ; names(dados)
(media = mean(FR, na.rm=T)) ; (desvio = sd(FR, na.rm=T)) ;
(minimo = min(FR, na.rm=T)) ;
88
80
85
86
90
95
96
99
100
101
103
103
103
104
105
108
108
109
110
110
110
a) Agrupar os dados em classes e calcular a mdia aritmtica, a moda (bruta e Czuber) e a mediana;
b) Determine, sem agrupar os dados em classes (dados brutos): a mdia aritmtica, a moda e a mediana.
Utilize-se do
4 e de calculadora.
2) Em um estudo sobre instituies de atendimento mdico, foram obtidos dados da disponibilidade de leitos
de 50 dessas instituies:
48
53
58
62
64
66
69
71
77
81
49
54
58
62
64
67
69
72
77
82
50
55
59
63
65
67
70
73
78
83
52
56
60
64
65
67
70
74
78
86
52
57
61
64
66
68
71
76
80
90
a) Determine a mdia e a mediana dos dados e, tambm, determine o terceiro quartil e interprete-o;
b) Construa o histograma;
c) Construa o grco de caixas (box plot ).
d) Agora, utilizando o
e) Agrupar os dados em classes (Sturges) e calcular a mdia, a moda (bruta e Czuber) e a mediana.
131 119
138
125
129 126
131
132
Calcule a
4.
126 128
128
131
5a
1a
classe igual a
Assimetria e Curtose
89
de um laboratrio, so os seguintes:
5, 1
4, 0
6, 4
5, 0
5, 5
9, 0
5, 5
5, 5
6, 0
8, 0
d) a mediana;
b) a mdia geomtrica;
e) a moda.
c) a mdia harmnica;
4 ou da sua calculadora.
6) Com base nos dados apresentados na Tabela 1.1, pgina 7, calcular a mdia aritmtica simples, a mdia
geomtrica, a mdia harmnica, a mediana e moda de cido ascrbico no plasma.
7) Qual o tipo mais comum de suicdio apresentado na Tabela 6.5? A esse tipo de medida estatstica, qual o
nome que se d?
Causa atribuda
Frequncias
Alcoolismo
263
Diculdade nanceira
198
Doenca mental
700
189
Desiluso amorosa
416
Outras
217
Total
1983
Qual a probabilidade de um indivduo que se suicidou, t-lo feito por desiluso amorosa?
10
13
15
17
17
18
19
21
4.
90
9) Com base nos dados da Tabela 6.6, calcule o peso mdio dos ratos em cada idade. Usando o
4, construa o
grco de caixas para a varivel peso, considerando-se cada rato (apenas um grco com todos os ratos).
Compare os resultados e comente.
Nmero do rato
Idades
30
34
38
42
46
76,2
95,5
99, 2
122,7
134,6
81,5
90,0
101,2
125,9
136,2
50,0
60,0
47,5
50,0
63,5
79,2
65,1
75,7
63,2
74,8
64,5
74,1
72, 2
72, 3
94, 7
88, 5
88, 1
96, 0
85, 3
84, 0
62, 3
57, 5
82, 1
79, 3
79, 0
92, 6
110,0
98, 7
100,0
98, 3
10) Trinta pessoas foram consultadas sobre sua cor favorita. Suas respostas foram:
Vermelho
Azul
Azul
Roxo
Preto
Preto
Azul
Marrom
Vermelho
Azul
Amarelo
Azul
Verde
Amarelo
Preto
Amarelo
Azul
Verde
Azul
Verde
Azul
Preto
Preto
Azul
Azul
Azul
Laranja
Vermelho
Verde
Vermelho
11) Calcule para a tabela de frequncias abaixo sua respectiva mdia e mediana.
Xi
Fi
19
25
28
12) Determinar o quarto decil, o primeiro quartil e o septuagsimo segundo percentil da seguinte distribuio:
Classes
4 9
9 14
14 19
19 24
fi
8
12
17
Fi
Assimetria e Curtose
91
Se voc seguir apenas por caminhos traados, chegar onde todos poderiam chegar.
Alexandre Graham Bell
Captulo 7
Medidas de disperso ou
variabilidade
As medidas de disperso servem para indicar o quanto os dados se apresentam dispersos em
relao ao seu valor mdio.
Mdias
Animal 1
Animal 2
Animal 3
Animal 4
Animal 5
Alaska
3,0
3,5
4,5
4,0
5,0
4,0
Beli
4,2
3,8
4,1
3,9
4,0
4,0
Califrnia
3,0
3,0
4,0
5,0
5,0
4,0
Chinchila
4,0
4,0
4,0
4,0
4,0
4,0
Analisando-se os resultados da Tabela 7.1, verica-se que a mdia de pesos para as quatro raas
a mesma, ou seja, quatro quilos. Embora o valor mdio seja o mesmo, a varivel peso tem um comportamento
diferente dentro de cada raa. Assim, para a raa Alaska, o peso varia de 3,0 a 5,0 quilos; para a raa Beli,
a variao de 3,8 a 4,2 quilos; para a Califrnia, de 3,0 a 5,0 quilos; para a Chinchila, no h variao. Em
geral, um alto grau de uniformidade ou pequena disperso desejvel.
92
93
At .
Para os dados apresentados na Tabela 7.1, a amplitude total ser:
Amplitude total
Alaska
At = 5, 0 3, 0 = 2, 0 kg
Beli
At = 4, 2 3, 8 = 0, 4 kg
Califrnia
At = 5, 0 3, 0 = 2, 0 kg
Chinchila
At = 4, 0 4, 0 = 0, 0 kg
O problema em se considerar a amplitude total como medida de disperso dos dados, o fato
dela levar em considerao em seu clculo, apenas os valores extremos e no todos os valores. Assim, dois
conjuntos de dados podem apresentar a mesma amplitude total, mesmo que tenham disperso muito diferente.
Embora fcil de calcular e de interpretar, no deve ser usada normalmente como medida de disperso.
Uma forma de se calcular as amplitudes usando os comandos do
4 :
coelhosd = c(3.0,3.5,4.5,4.0,5.0,4.2,3.8,4.1,3.9,4.0,
3.0,3.0,4.0,5.0,5.0,4.0,4.0,4.0,4.0,4.0)
coelhos = matrix(coelhosd, 4,5, byrow=T)
colnames(coelhos) = c('Animal1','Animal2','Animal3','Animal4','Animal5')
rownames(coelhos) = c('Alaska', 'Beli','Califrnia','Chinchila')
coelhos
alaska = range(coelhos[1,])
diff(alaska)
belie = range(coelhos[2,])
diff(belie)
california = range(coelhos[3,]) ;
diff(california)
chinchila = range(coelhos[4,])
diff(chinchila)
Desvio = yi y
ou
Desvio = yi M d
94
Considere os pesos dos animais da raa Alaska, apresentados na Tabela 7.1 e calcule os desvios em torno da
mdia. Esses clculos so apresentados na Tabela 7.2.
Tabela 7.2 Desvios e desvios absolutos para pesos dos animais da raa Alaska.
Animais
Desvios:
(yi y)
Desvios absolutos:
|yi y|
3, 0 4, 0 = 1, 0
|3, 0 4, 0| = 1, 0
3, 5 4, 0 = 0, 5
|3, 5 4, 0| = 0, 5
4, 5 4, 0 =
0, 5
|4, 5 4, 0| = 0, 5
4, 0 4, 0 =
0, 0
|4, 0 4, 0| = 0, 0
5, 0 4, 0 =
1, 0
|5, 0 4, 0| = 1, 0
Soma
(yi y) = 0
i=1
|yi y| = 3, 0
i=1
Observe que a soma dos desvios em relao mdia sempre zero, logo, ela no informativa a
respeito da variabilidade dos dados, portanto, melhor utilizar a soma dos valores absolutos dos desvios, que
ser sempre positiva. A soma dos valores absolutos ser tanto maior quanto maior o nmero de observaes
(n).
O desvio absoluto mdio pode ser calculado como:
1
|yi y|
n i=1
n
dy =
dy =
3, 0
= 0, 6 kg .
5
No
1
dy =
|yi y|fi
n i=1
n
Para o clculo do desvio absoluto mdio dos dados, independentemente de raa, tem-se:
Varincia
95
n = length(coelhosd)
desvio_medio = (1/n)*(sum(abs(coelhosd - mean(coelhosd))))
7.3 Varincia
A medida de variabilidade mais utilizada a varincia, que simplesmente a soma dos quadrados
dos desvios, divididos pelo total de observaes menos um. Pode-se calcular a varincia para dados provenientes
de uma populao ou amostra e de dados brutos ou agrupados em classes.
(yi )2
2 =
i=1
(7.1)
(yi y)2
s2 =
i=1
n1
(7.2)
Considere os dados da Tabela 7.1 e calcule a varincia para os pesos dos animais da raa Alaska. Na Tabela
7.3 so apresentados os desvios calculados.
96
Animais
Desvios:
(yi y)
(yi y)2
3, 0 4, 0 = 1, 0
(3, 0 4, 0)2 = 1, 00
3, 5 4, 0 = 0, 5
(3, 5 4, 0)2 = 0, 25
4, 5 4, 0 =
0, 5
(4, 5 4, 0)2 = 0, 25
4, 0 4, 0 =
0, 0
(4, 0 4, 0)2 = 0, 00
5, 0 4, 0 = 1, 0
n
(yi y) = 0
(5, 0 4, 0)2 = 1, 00
n
(yi y)2 = 2, 5
Soma
i=1
i=1
(yi y)2
s2 =
i=1
n1
2, 5
= 0, 625 kg 2 .
51
Uma forma computacionalmente mais eciente, para o clculo da varincia, obtida quando se
desenvolve a soma de quadrados dos desvios, da seguinte maneira:
(yi y)2
i=1
(yi2 2yi y + y2 )
i=1
y
yi2 2
i=1
i=1
yi + n
y2
i=1
yi2
yi
n
n
i=1
2
yi
yi + n
n
n i=1 i=1
n
(
)2
yi
yi2
i=1
i=1
(7.3)
s2 =
y2
n 1 i=1 i
)2
yi
i=1
(7.4)
4 dado por:
Varincia
97
Para o clculo da varincia dos pesos de todos os coelhos, sem levar em considerao a raa, :
media = mean(coelhosd)
media
n = length(coelhosd)
ou, simplesmente
var(coelhosd)
fi
e obtm-se:
(yi y)2 fi
s2 =
i=1
n1
s2 =
y 2 fi
n 1 i=1 i
Exemplo:
n
(
)2
yi fi
i=1
(7.5)
98
Frequncias (fi )
120 140
140 160
160 180
180 200
200 220
220 240
240 260
130
12
150
15
170
17
190
14
210
11
230
250
s =
3.214.200
86 1
)2
16.340
86
fi = c(8,12,15,17,14,11,9)
xi = c(130,150,170,190,210,230,250)
nc = sum(fi) ; nc
xifi = sum(xi*fi)
xi2fi = sum(xi^2*fi)
var_carcaa = 1/(nc-1) * (xi2fi - xifi^2/nc)
claro que, com a facilidade computacional e a disponibilidade de programas estatsticos gratuitos como o
4, se o pesquisador dispe dos dados brutos, recomendvel que as estatsticas sejam baseadas
neles. As distribuies de frequncias servem, neste caso, apenas para apresentar as informaes de forma
resumida.
altera a varincia;
Varincia
Exemplo:
99
Considere uma constante
c=4
Soluo:
e calcule a varincia;
Soluo:
e determine a varincia;
Soluo:
Soluo:
Soluo:
Y:
100
Soluo:
m2 .
Uma forma de se obter uma medida de disperso com a mesma unidade de medida dos dados observados , simplesmente, extrair a raiz quadrada da varincia, obtendo-se o desvio padro. Ele representado
por
s.
Logo,
s=
s2 .
s2 = 0, 625 kg 2 .
Portanto,
s2
0, 625 kg 2
=
= 0, 790569415 kg.
No
4, basta extrair a raiz quadrada das varincias de cada raa calculadas anteriormente.
sd1 = sqrt(var1)
sd2 = sqrt(var2)
sd3 = sqrt(var3)
sd4 = sqrt(var4)
sd(coelhosd)
Coeciente de Variao
101
Logo, pode ser conveniente expressar a variabilidade dos dados de uma varivel de modo
inde-
pendente da sua unidade de medida utilizada, tirando a inuncia da ordem de grandeza da varivel.
Tal
CV =
s
100
y
Sua utilidade est em fornecer uma medida para a homogeneidade de um conjunto de dados.
Quanto menor o coeciente de variao, mais homogneo o conjunto de dados.
bastante til na comparao de duas variveis ou dois grupos que, a princpio, no so comparveis.
Em geral, considera-se:
a) Baixa disperso:
b) Mdia disperso:
c) Alta disperso:
CV < 15%;
15% < CV < 30%
CV > 30%
102
Exemplo:
Calcular a mdia, a varincia, o desvio padro e o coeciente de variao para as variveis Estatura
Estatura (cm)
= 177 162 188 157 166 153 158 176 168 163
Peso (kg)
= 68, 0 83, 0 72, 0 99, 9 51, 0 52, 0 52, 0 66, 5 80, 0 48, 0
Idade (anos)
= 18, 0 20, 1 20, 5 17, 7 19, 2 18, 9 26, 9 20, 1 20, 7 19, 3
Soluo:
Coeciente de Variao
103
Quando procedemos a uma investigao cientca em que utilizamos dados de uma frao representativa de uma populao (amostra), a mdia aritmtica determinada apresentar, em relao
mdia populacional, um afastamento.
Se outras amostras fossem retiradas da populao, apresentariam mdias aritmticas que teriam outros afastamentos em relao mdia populacional. Para se determinar a mdia destes
afastamentos utilizamos o
g/24 horas.
horas)
em 43 crianas.
3,7
1,6
2,5
3,0
3,9
1,9
3,8
1,5
1,1
1,8
1,4
2,7
2,4
2,1
2,1
3,3
3,2
2,3
2,3
2,4
0,8
3,1
1,8
1,0
2,0
2,0
1,3
2,7
2,9
3,2
1,9
1,6
2,9
2,0
1,0
2,7
3,0
1,3
1,5
4,6
2,1
2,8
1,9
e) determine o erro-padro.
2) Em uma granja foi observada a distribuio dos frangos em relao ao peso, apresentada na Tabela 7.6.
104
Peso (gramas)
Frequncia absoluta
960 980
60
980 1000
160
1000 1020
280
1020 1040
260
1040 1060
160
1060 1080
80
3) Uma das caractersticas da gota, distrbio hereditrio que ocorre especialmente em homens, a hiperuricemia (excesso de cido rico no sangue). Embora nem todos os indivduos com hiperuricemia desenvolvam
manifestaes clnicas de gota, h muito tempo tem-se reconhecido que o componente hereditrio da doena est ligado a uma tendncia para hiperuricemia. A Tabela 7.7 apresenta a distribuio de frequncias
das dosagens de cido rico srico em 267 homens sadios.
3, 0 3, 5
3, 5 4, 0
15
4, 0 4, 5
33
4, 5 5, 0
40
5, 0 5, 5
54
5, 5 6, 0
47
6, 0 6, 5
38
6, 5 7, 0
16
7, 0 7, 5
15
7, 5 8, 0
8, 0 8, 5
8, 5 9, 0
Total
Pede-se:
Frequncia absoluta
267
Coeciente de Variao
105
a) calcule a mdia;
b) determine a varincia dos dados;
c) determine o desvio padro e interprete-o.
4) Em trabalho laboratorial realizado no Jockey Club Brasileiro, vericou-se que os animais apresentaram
no Jockey Club de Porto Alegre apresentou valor mdio de hematcrito igual a 38% e varincia de 25%.
Opinar sobre os Coecientes de Variao (CV).
5) Calcular a mdia aritmtica e desvio padro dos seguintes dados relativos dosagem de hemoglobina
vericada em 12 animais bovinos(mg ):
15
14
13
11
13
14
13,5
12
16
14,5
12
9.
6) Em 25 pessoas adultas do sexo masculino, observou-se em relao ao teor de hemoglobina um valor mdio
igual a
13, 7 mg .
0, 45 mg .
valor.
7) Na Tabela 7.8 apresenta-se a distribuio de frequncias quanto ao nmero de acidentes por dia, durante
setenta dias, na rodovia X. Determinar a mdia aritmtica e o desvio padro.
Nmero de acidentes
Nmero de dias
21
16
12
mm)
http://www2.uel.br/pessoal/silvano/Dados/Toucinho.txt.
Usando o
R:
a) Construa o histograma;
b) Faa o grco de caixas considerando apenas um grupo. Refaa o grco para comparar a espessura
entre tipos; Discuta os resultados observados;
c) Calcule a mdia, o desvio-padro e o coeciente de variao das espessuras para cada tipo. Interprete.
Hematcrito (ou Ht ou Htc) a percentagem ocupada pelos glbulos vermelhos ou hemcias no volume total de
sangue.
106
d) Repita os clculo efetuados no item (8c) para todos os animais e compare os resultados.
clnica foi registrado. Os dados ordenados so apresentados a seguir, separadamente para machos (M) e
fmeas (F):
Machos
Fmeas
10
12
15
15
15
16
18
18
22
22
24
10
10
11
11
12
18
Remisso completa o termo utilizado em Medicina para designar a fase da doena aonde no h sinais de atividade
da mesma mas no possvel concluir como cura.
!
Recidiva (popularmente conhecido como recada) o retorno da atividade de uma doena.
Captulo 8
Anlise Combinatria
A Anlise Combinatria a parte da Matemtica em que se estuda as tcnicas de contagem
de agrupamentos que podem ser feitos com elementos de um dado conjunto.
de agrupamentos que se pode formar: um em que se leva em conta a
agrupamento e outro em que a
dentro do
Um requisito bsico simplicao das frmulas da Anlise Combinatria o fatorial, que ser
explicado a seguir.
8.1 Fatoriais
Indica-se por
5!
5! = 5 4 3 2 1
portanto,
5! = 120.
Tem-se tambm:
4!
4 3 2 1 = 24
7!
7 6 5 4 3 2 1 = 5.040
n,
sendo
n > 1,
dene-se:
n! = n (n 1) (n 2) 3 2 1
1! = 1
e
107
0! = 1
108
0! =
1! =
2! =
21=2
3! =
321=6
4! =
4 3 2 1 = 24
5! =
5 4 3 2 1 = 5 4! = 120
6! =
6 5 4 3 2 1 = 6 5! = 720
e assim por diante. Ao desenvolver um fatorial, colocando-se os fatores em ordem decrescente, pode-se parar
onde for conveniente, indicando os ltimos fatores tambm na notao fatorial.
Calcule:
a)
9!
b)
10!
c)
11!
d)
e)
f)
g)
h)
i)
5!15!
13!7!
j)
6!
k)
10!
9!
10!
12!
6!
8!
10!
4!6!
12!
10!2!
l)
m)
n)
o)
5!
4 5! 6 3!
30 + 0! 3 1!
13!
5!
+ 13
3!10!
3!2!
n!
(n 1)!
(n + 1)!
n!
p) Calcule
R,
na equao
n! = 12 (n 2)!
basta
factorial(9)
factorial(10)/factorial(9)
A2
A3 )
R2 )
109
R1
A2
R2
R1
A3
R2
Assim, cada animal poderia ser atendido por um dos dois residentes, gerando as seguintes
possibilidades:
A1 R1 , A1 R2 , A2 R1 , A2 R2 , A3 R1 , A3 R2 .
serem atendidos.
m maneiras
m n.
Exerccios:
1) Com os algarismos
1, 2, 3, 4
2) Quantas placas de licena de automveis podem ser formadas por 3 letras e 4 algarismos sendo as letras
apenas vogais e sendo os algarismos distintos?
3) Uma sorveteria oferece uma taa de sorvete que pode vir coberto com calda de chocolate ou de morango
ou de caramelo. Se o sorvete pode ser escolhido entre 10 sabores diferentes, quantas so as opes para
um cliente escolher a taa com a cobertura?
4) Uma moeda ser lanada 6 vezes e a cada vez ser anotado o resultado obtido, cara ou coroa, formando
assim uma sequncia de 6 resultados. Quantas sequncias diferentes podem ser formadas?
110
espcies de animais para serem adotadas: Canina e Felina. Da espcie Felina h 3 raas e da canina 5
raas. De quantas maneiras os animais podero ser adotados?
8.3 Permutaes
Com os seguintes smbolos
, ,
Denomina-se
), ( ), (
), (
), (
), ( ).
dados.
Duas permutaes dos mesmos objetos so diferentes se a ordem dos objetos numa delas
diferente da ordem em que os objetos esto colocados na outra.
Exemplos:
1) Formar os anagramas da palavra UEL.
Soluo:
No
R,
tem-se
require(combinat)
U = c(`U',`E',`L')
permn(U)
2) Formar os anagramas da palavra LILI.
Soluo:
No
R,
tem-se
require(combinat)
L = c(`L',`I',`L',`I')
permn(L)
Permutaes
111
Soluo:
No
R,
tem-se
require(combinat)
R = c(`I',`M',`A')
permn(R)
M = c('R','I','A')
permn(M)
Exerccios:
1) Forme todas as permutaes dos algarismos
1, 2
3.
nmero de permutaes
minados elementos. Para determinar esse nmero, tem-se que considerar duas situaes possveis:
permutaes com elementos distintos;
permutaes com elementos repetidos.
(, , , , )
1a etapa:
escolher a
1a
letra da permutao.
112
2a etapa:
escolher a
2a
letra da permutao. Tem-se 4 possibilidades para esta etapa, uma vez que uma das
3a etapa:
escolher a
3a
4a etapa:
escolher a
4a
5a etapa:
escolher a
5a
5! = 120
54321 =
P5 .
Assim, tem-se:
P5 = 5! = 120.
Assim, racionando da mesma forma, conclui-se que o nmero de permutaes de
por:
Pn = n!
A soluo no
R,
require(combinat)
nsamp(n=5, k=5, replace=FALSE, ordered=TRUE)
Exemplos:
1) Quantos so os anagramas da palavra BRASIL?
Soluo:
Os comandos a seguir, no
R,
require(combinat)
nsamp(n=6, k=6, replace=FALSE, ordered=TRUE)
DD = c('B','R','A','S','I','L')
Perm = unlist(permn(DD))
t(array(Perm, dim = c(6, gamma(7))))
Permutaes
113
2) Com os algarismos
1, 3, 4, 6, 7
9,
Soluo:
Para formar um nmero par deve-se primeiro escolher o algarismo da casa das unidades, que pode ser o 4 ou 6.
Como so algarismos distintos, a quantidade de nmeros pares que se pode formar :
2 P5 = 2 5! = 2 120 = 240.
A, A,
B,
h apenas 3 permutaes:
A1
A2 ,
(B, A, A)
(B, A2 , A1 )
P3 = 3! = 6.
2!
2 elementos se eles forem considerados distintos). Indica-se o nmero de permutaes de 3 elementos sendo
2 repetidos por
P32 .
Tem-se:
P32 =
Quando se tem
n1
3!
6
= = 3.
2!
2
so repetidos de um tipo,
n2
repetidos de outro tipo e assim por diante, o nmero de permutaes que se pode formar dado por:
n!
,
n1 !n2 !n3 ! nk !
(n1 + n2 + n3 + + nk = n)
Exemplos:
1) Quantos so os anagramas da palavra ELEGER?
Soluo:
ELEGER 6 letras, sendo 3 E, 1 L, 1 G, 1 R. O nmero de anagramas :
P63 =
6!
6 5 4 3!
=
= 120
3!
3!
n3
so
114
Soluo:
ESTATSTICA 11 letras, sendo 1 E, 2 S, 3 T, 2 A, 2 I, 1 C. O nmero de anagramas :
3,2,2,2
P11
=
11!
= 831.600
3!2!2!2!
Soluo:
VETERINRIA 11 letras, sendo 1 V, 2 E, 1 T, 2 R, 2 I, 1 N, 2 A. O nmero de anagramas :
2,2,2,2
P11
=
11!
= 2.494.800
2!2!2!2!
Exerccios:
1) Quantos nmeros pares so obtidos permutando-se os algarismos
1, 2, 2, 3, 3, 3
4?
2) Determine o nmero de permutaes que podem ser feitas com as letras de cada palavra:
a) ORDEM
c) AMAZONAS
b) DOMINAR
d) MANADA
ou
Andressa e Herick
ou
Andressa e Igor
Fernanda e Herick
ou
Fernanda e Igor
ou
Herick e Igor
Arranjos e Combinaes
115
Em cada um destes
combinaes.
estes so
dados.
Denominam-se
combinaes
de
elementos dados.
{Andressa e Herick}
{Andressa e Igor}
{Fernanda e Herick}
{Fernanda e Igor}
{Herick e Igor}
8.4.2 Arranjos
Suponha que os animais a serem adotados so de espcies diferentes: um canino e um felino.
Assim, a
1a
2a
sorteadas fossem Andressa e Fernanda, nesta ordem, Andressa caria com o co e a Fernanda com o gato.
Mas, se os sorteados fossem Fernanda e Andressa, nesta ordem, Fernanda caria com o co e Andressa com
o gato.
Tem, neste caso, uma situao em que os agrupamentos:
Andressa e Fernanda
Fernanda e Andressa
arranjos
dos
arranjos.
de
elementos dados.
Denominam-se
importa a ordem
s sucesses formadas de
termos
116
(Andressa, Herick)
(Andressa, Igor)
(Fernanda, Andressa)
(Fernanda, Herick)
(Fernanda, Igor)
(Herick, Andressa)
(Herick, Fernanda)
(Herick, Igor)
(Igor, Andressa)
(Igor, Fernanda)
(Igor, Herick)
Observe que dois arranjos so diferentes se tiverem elementos diferentes, ou se tiverem os mesmo elementos
porm em ordens diferentes.
Exemplos:
1) Formar as combinaes dos algarismos
1, 3, 5, 7
tomados
2.
Soluo:
As combinaes so os conjuntos de dois algarismos escolhidos entre os algarismos dados:
{1, 3}, {1, 5}, {1, 7}, {1, 9}, {3, 5}, {3, 7}, {3, 9}, {5, 7}, {5, 9}, {7, 9}
1, 3, 5
tomados
3.
Soluo:
Os arranjos so as sucesses de trs algarismos distintos escolhidos entre os algarismos dados:
(1, 3, 5), (1, 3, 7), (1, 5, 7), (1, 5, 3), (1, 7, 3), (1, 7, 5)
(3, 1, 5), (3, 1, 7), (3, 5, 1), (3, 5, 7), (3, 7, 1), (3, 7, 5)
(7, 1, 3), (7, 1, 5), (7, 3, 1), (7, 3, 5), (7, 5, 1), (7, 5, 3)
Exerccios:
1) Forme as combinaes das letras a, b, c e d tomadas duas a duas.
2) Forme os arranjos das letras a, b, c e d tomadas duas a duas.
3) Quatro equipes, A, B, C e D, esto classicadas para o quadrangular nal de um campeonato em que as
trs primeiras colocadas sero premiadas (com prmios diferentes).
a) Escreva todas as possibilidades para as trs primeiras colocaes no campeonato.
b) Cada uma destas possibilidades corresponde a um arranjo ou a uma combinao das equipes tomadas
trs a trs?
Quantidade de Arranjos
117
4) Cesar, Diego, Maisa, Nara e Sabrina entregaram o trabalho relativo pesquisa feita no Hospital Veterinrio
da UEL e dois deles sero escolhidos para uma apresentao perante a classe.
a) Escreva todas as possibilidades de escolha dos dois que faro a apresentao do trabalho.
b) Cada uma destas possibilidades corresponde a um arranjo ou a uma combinao dos 5 alunos tomados
dois a dois?
elementos tomados
An,k
Akn ).
Para determinar esta quantidade de arranjos, deve-se formar uma sucesso de
entre os
k termos escolhidos
elementos dados:
1o termo
1o
2o
3o
ko
. . .,
possibilidades para
ele.
Para cada uma destas possibilidades, o
3o
(n 2)
possibilidades para o
2o
termo.
possibilidades para o
3o
(n 2)
termo.
(
Arranjo
possibilidades
1o
2o
3o
. . .,
ko
(n 1)
(n 2)
n (k 1)
Pelo princpio fundamental da contagem, conclui-se que a quantidade de arranjos que podem ser
formados :
An,k =
n!
(n k)!
Exemplos:
1) Quantos so os arranjos de 6 elementos, tomados 3 a 3?
118
n!
(n k)!
6!
(6 3)!
A6,3 =
A6,3 = 120
2) Vinte equipes cursos disputam o campeonato interno da UEL de futebol de salo. Quantas so as possibilidades de classicao nos dois primeiros lugares (campeo e vice-campeo)?
Soluo:
An,k =
n!
(n k)!
A20,2 =
20!
(20 2)!
A20,2 = 380
Exerccios:
1) Calcule os nmeros
a)
A5,2
c)
A10,4
b)
A8,5
d)
A12,3
2) Numa corrida de frmula 1 h 24 pilotos participando e apenas os dez primeiros colocados ganham pontos.
Quantas so as possibilidades de classicao nos 10 primeiros lugares?
3) Com as letras da palavra FLAMENGO, quantas palavras distintas formadas de 5 letras distintas podem
ser escritas? (As palavras no precisam ter sentido na linguagem comum).
4) Sero eleitas duas pessoas para representarem os alunos do curso Medicina Veterinria.
Uma ser o
representante principal e a outra ser suplente. Dez alunos esto interessados. Quantos so os possveis
resultados da eleio.
Cnk .
elementos tomados
a1 , a2 , a3 , , ak
Cn,k
(ou pelo
elementos distintos:
Quantidade de Combinaes
podem ser obtidas
k!
119
permutaes:
k!
arranjos dos
Cn,k =
elementos tomados
k.
k!:
An,k
k!
Logo
Cn,k =
n!
k!(n k)!
Exemplos:
1) Quantas so as combinaes de 6 elementos tomados 2 a 2?
Soluo:
Cn,k =
n!
k!(n k)!
C6,2 =
6!
2!(6 2)!
C6,2 = 15
No laboratrio h 15 camundongos
em condies homogneas e que podem ser utilizados no experimento. De quantos modos diferentes o
experimento pode ser realizado?
Soluo: Como so 15 camundongos e apenas 5 sero utilizados no experimento, basta calcular o nmero de
combinaes possveis.
Cn,k =
n!
k!(n k)!
Exerccios:
1) Calcule os nmeros:
C15,5 =
15!
5!(15 5)!
C15,5 = 3.003
120
a)
C8,6
c)
C7,4
b)
C12,3
d)
C100,2
2) Calcule o valor de
na equao
Cn,2 = n + 2.
Captulo 9
prob,
Tal
>
require(prob)
Exemplos:
a) o lanamento de uma moeda;
b) lanar trs moedas justas e observar as faces voltadas para cima;
c) lanar um dado e observar a face voltada para cima;
d) anotar o resultado de um exame de gravidez;
e) colocar 20 sementes em um germinador e observar, aps um certo perodo de tempo, o nmero de sementes
germinadas;
121
122
Exemplos:
a) o lanamento de uma moeda:
= {C, K},
>
tosscoin(1);
>
tosscoin(3);
>
= {1, 2, 3, 4, 5, 6};
>
rolldie(1)
= {P ositivo, N egativo};
>
e) colocar 20 sementes em um germinador e observar, aps um certo perodo de tempo, o nmero de sementes
germinadas:
= {0, 1, 2, . . . , 20}
>
9.1.3 Evento
qualquer subconjunto do espao amostral. Os eventos so geralmente representados por letras
maisculas, como A, B, C,
. . ..
Conceito de Probabilidade
Exemplo:
123
cura de certa doena. Para tanto, trs doentes foram tratados com a referida droga. O espao amostral
dado por:
= no cura.
>
R,
B=
>A
O evento
= Tr[c(2,3,5),]
O conceito clssico surgiu no sculo XVII a partir dos jogos de azar e dene a probabilidade de
o evento
P (A) =
Exemplo:
a) mpar?
b) Menor que 3?
c) Primo?
R,
tem-se:
124
400 m3 /ha.
Exemplo:
1 ha
Planejamento Familiar
Um casal planeja ter lhos at terem uma menina e no mximo quatro lhos. Qual a probabilidade de este
casal ter uma lha?
Esta questo pode ser respondida com o uso de simulao:
1) Utilize a tabela de nmeros aleatrios e selecione 20 nmeros:
1 2 7
0 3
5 6 3
0 6
2 1
3) Agrupe os nmeros de acordo com planejamento do casal para simular as diferentes possibilidades de lhos.
Numere cada simulao como uma famlia:
Conceito de Probabilidade
125
P (A)
A=
Nmero de ocorrncias de A
Nmero de repeties
P (A) =
8
= 1.
8
Para responder s questes anteriores, repete-se a simulao com vrios grupos. Assim, tem-se:
Grupo
No
10
11
12
13
14
15
16
17
18
19
de
Famlias
No
de
Famlias com
Filhas
P (A)
P (A) =
Nmero de tentativas
Probabilidades
0, 5
0, 5 0, 5 =
0, 5 0, 5 0, 5 =
F
0, 5 0, 5 0, 5 0, 5 =
0,5
0,25
0,125
0,0625
0, 9375
Que uma aplicao do modelo geomtrico.
Exemplo:
1) Dentre 10.878 partos sucessivos que ocorreram em uma maternidade de So Paulo, e que resultaram em
crianas vivas, 100 foram de gmeos. Qual a probabilidade (em porcentagem) de nascimento de um par de
gmeos entre os recm-nascidos vivos que podem ser estimados a partir desses dados? Considere o evento
20
126
coerncia
Obs.:
Se
A,
ento
= 1 P (A).
P (A)
Os espaos
>
union(A, B)
ou B .
Diagramas de Venn
127
>
e em
B.
B,
intersect(A, B)
9.4.1.3 Sub-Conjuntos:
Diz-se: B sub-conjunto de
A
ou B implica em
A.
B A = A
BA
B A = B
Notao:
S
B
A
128
S
B
A
Notao:
B=
9.4.1.5 Complemento:
o evento que consiste de todos os elementos do espao amostral que
no esto contidos em
A, ou seja, a negao de A.
Notao:
Ac .
Ac A = S
c
A
Ac A =
Sc
A
>
setdi(A, B)
Se
P (A B) = 0,
P (A B) = P (A) + P (B)
Diagramas de Venn
Exemplo:
129
a) A = sair o nmero 3;
Determinar:
P (A);
P (B);
P (A B);
P (C);
P (A C)
P (Ac ).
Soluo:
Obs.:
Pode-se determinar a probabilidade da unio de trs ou mais eventos, usando a teoria de conjuntos.
P (A B C) =
A, B
C,
P [(A B) C]
= P (A B) + P (C) P [(A B) C]
= P (A) + P (B) P (A B) + P (C) P (A C) P (B C) + P (A B C)
P (A B C) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C)
130
so disjuntos
AB =
P (A B) = 0.
P (A B) = P (A) + P (B)
A1 , A2 , A3 , . . . ,
)
Ai
i=1
Exemplo:
P (Ai ).
i=1
Soluo:
P (S) = 1,
e que
A Ac =
sendo
P () = 0,
A Ac = S P (A Ac ) = P (S).
logo:
P (A Ac ) = P (S)
P (A) + P (Ac ) = 1
P (Ac ) = 1 P (A).
Probabilidade Condicional
Exemplo:
131
Soluo:
condicional de A dado B,
denota-se por
>
P (A|B).
ocorreu, chamada
probabilidade
B,
P (A|B) =
P (A B)
,
P (B)
se
P (B) > 0
P (B|A) =
P (A B)
,
P (A)
se
P (A) > 0
prob(A, given=B)
ou, ainda,
>
prob(B, given=A)
Na probabilidade condicional, a ocorrncia de um evento altera a probabilidade de ocorrncia de
outro evento.
Exemplo:
de 2010, foram coletadas diversas informaes e, entre elas, o Porte do animal e o Sexo do mesmo, conforme
apresentado na Tabela 9.1.
132
Sexo
Pequeno
Total
Mdio
Grande
Fmea
649
41
77
767
Macho
495
27
65
587
1.144
68
142
1.354
Total
Considerando-se que o animal escolhido de mdio porte, qual a probabilidade de ser fmea? Dado que o
animal macho, qual a probabilidade de ser de grande porte?
Soluo:
A, ou seja,
B, ou seja,
Exemplo:
P (A B)
P (B|A) =
P (A).
Soluo:
P (A|B) =
1, 2, . . . , 15.
P (A B)
P (B).
Probabilidade Condicional
133
R,
Epictetus , no sculo II D.C., arma que as aparncias para a mente so de quatro tipos:
ou so e no parecem ser;
Mente
Parecer
+
-
Ser
Da mesma forma, pode-se pensar na relao entre uma doena e o teste para detect-la. Pode-se
resumir esta relao da seguinte forma:
http://epiclcn.blogspot.com.br/ em 14/06/2012.
134
Relao
Teste
Doena
Verdadeiro positivo
Falso positivo
Falso negativo
Verdadeiro negativo
Portanto, o bom uso de um teste diagnstico requer, alm de consideraes clnicas, o conhecimento de medidas que caracterizam a sua qualidade: a sensibilidade, a especicidade e os parmetros que
reetem a sua capacidade de produzir decises clnicas corretas: valor da predio positiva (VPP) e o valor
da predio negativa (VPN).
Na anlise da qualidade de testes diagnsticos, interessa conhecer duas
probabilidades condi-
cionais que, pela sua importncia, recebem nomes especiais: sensibilidade e especicidade.
A sensibilidade, denotada por
s,
denida como:
s = P (T+ |D+ ),
ou seja, a probabilidade de o teste ser positivo sabendo-se que o paciente que est sendo examinado doente.
Portanto, a sensibilidade mede a capacidade de reao do teste em um paciente doente
A especicidade, denotada por
e,
denida como:
e = P (T |D ),
ou seja, a probabilidade de o teste ser negativo sabendo-se que o paciente examinado no portador da
doena. Logo, a especicidade mede a capacidade de no reao do teste em pacientes no portadores da
doena.
Na etapa de pesquisa para a determinao do grau de conabilidade de um teste diagnstico, o
pesquisador utiliza-o primeiramente em dois grupos muito especcos de pessoas: um de portadores da doena
e outro de pacientes sem a doena em questo. Os resultados desta etapa da pesquisa podem ser resumidos
na forma da Tabela 9.2.
Tabela 9.2 Esquema padro de sntese dos dados para vericao da qualidade de um teste clnico.
Teste
Doena
Total
Positivo
Negativo
Presente
a+b
Ausente
c+d
Total
a+c
b+d
Para denir os ndices que descrevem o grau de conabilidade de um teste, precisamos trabalhar
com os seguintes eventos:
Probabilidade Condicional
135
T+
D+
Sensibilidade
s=
Exemplo:
Especicidade
a
a+b
e=
d
c+d
Metstase de
Tomograa computadorizada
Total
carcinoma heptico
Positiva (T+ )
Negativa (T )
Presente (D+ )
52
15
67
Ausente (D )
74
83
61
89
150
Total
Sensibilidade
Especidade
s=
a
a+b
e=
d
c+d
s=
52
= 0, 776
67
e=
74
= 0, 892
83
> require(DiagnosisMed)
> diagnosis(52, 15, 9, 74)
> require(epibasix)
> dados = cbind(c(52,15), c(9,74))
> sensSpec(dados)
136
seguintes ndices denominados valor da predio positiva (VPP) e valor da predio negativa (VPN), denidos
respectivamente por:
Valor da predio positiva (VPP) a probabilidade do paciente estar realmente doente quando
o resultado do teste positivo.
V P P = P (D+ |T+ ) =
a
a+c
V P N = P (D |T ) =
d
b+d
Tabela 9.4 Probabilidades necessrias para o clculo dos ndices VPP e VPN.
Populao
Proporo
Positivo
Negativo
Doente
ps
p(1-s)
Sadia
1 - p
(1 - p) (1 - e)
(1 - p)e
Total
ps + (1 - p)(1 - e)
p (1 - s) + (1 p)e
Predictive value of a single diagnostic test in unselected populations. The New England Journal of Medicine,
v.274, p.1171-3, 1966
a contagem do nmero de casos que existe em uma populao de pacientes em um momento especco no
tempo.
Probabilidade Condicional
137
V P P = P (D+ |T+ ) =
ps
.
ps + (1 p)(1 e)
V P N = P (D |T ) =
(1 p)e
.
p(1 s) + (1 p)e
Para o exemplo da Tabela 9.3, considere que a prevalncia de metstase de carcinoma de fgado
de 2%, os valores de predio da tomograa computadorizada so:
V PP
V PP
0, 02 0, 776
ps
=
ps + (1 p)(1 e)
0, 02 0, 776 + (1 0, 02)(1 0, 8916)
= 0, 1275.
=
V PN
V PN
(1 p)e
(1 0, 02) 0, 892
=
p(1 s) + (1 p)e
0, 02 (1 0, 776) + (1 0, 02) 0, 8916)
= 0, 9949.
=
Portanto, o valor de predio positiva baixo enquanto que o valor de predio negativa
bastante alto. Se o resultado da tomograa computadorizada negativo, a chance de no haver metstase
de 99,5%. O clculo de VPP e VPN no
V PP
a
a+c
V PN =
d
b+d
P (A|B) =
>
P (A B)
P (B)
P (A B) = P (B) P (A|B)
P (A B)
P (A)
P (A B) = P (A) P (B|A)
prob(B)*prob(A, given=B)
ou, ainda.
P (B|A) =
>
prob(A)*prob(B, given=A)
138
Exemplo:
= retirar um s
Soluo:
> require(MASS)
> CC = cards(makespace=TRUE)
> (A = subset(CC, suit == "Heart"))
> (B = subset(CC, rank == "A"))
> (B = subset(CC, rank %in% "A"))
> prob(A)*prob(B, given=A)
> fractions(prob(A)*prob(B, given=A))
sem reposio.
Os eventos P1 e P2 so independentes?
Pede-se:
a) Calcular a probabilidade de sair branca na
1a
extrao e preta na
2a
extrao.
b) Construir o espao amostral e indicar as probabilidades associadas a cada um dos pontos amostrais.
Calcular as probabilidades:
Probabilidade Condicional
a) de sair bola branca na
b) de sair bola preta na
2a
2a
139
extrao;
extrao;
c) de ter sado bola preta na primeira extrao sabendo-se que (dado que) saiu bola branca na segunda
extrao;
d) de ter sado bola preta na primeira extrao sabendo-se que (dado que) saiu bola preta na segunda extrao.
2a
com reposio
da
1a
bola.
Os eventos B1 e B2 so independentes?
Os eventos P1 e P2 so independentes?
Construir o espao amostral e indicar as probabilidades associadas a cada um dos pontos amostrais.
Calcular as probabilidades:
a)
P (B2 );
b)
P (P2 );
c)
P (B2 |B1 );
d)
P (B2 |P1 );
e)
P (P2 |B1 );
f)
P (P2 |P1 );
Independncia de Eventos
Dois eventos so considerados independentes quando a ocorrncia de um deles no depende da
ocorrncia do outro, isto ,
P (A|B) = P (A)
P (B|A) = P (B).
P (A B) = P (A) P (B)
Exemplo 1:
Efeitos colaterais com o uso de certa droga ocorrem em 10% de todos os pacientes que a tomam.
140
Soluo:
Soluo:
Exemplo 2:
Suponha que a probabilidade de uma pessoa ser do tipo sanguneo O 40%, ser A 30% e ser
Rh+
Nestas condies, qual a probabilidade de uma pessoa tomada ao acaso da populao ser:
a) O e
Rh+ ?
Soluo:
b) AB e
Rh ?
Soluo:
Probabilidade Condicional
141
de Bayes.
Sejam
A1 , A2 , A3 , , Ak
Teorema
P (Ai |B) =
P (Ai ) P (B|Ai )
k
i = 1, , k.
P (Ai )P (B|Ai )
i=1
Exemplo:
Sabe-se que dos animais atendidos pelo Hospital Veterinrio da Universidade Estadual de Londrina,
40% so provenientes da regio norte, 15% da regio sul, 20% da regio leste, 15% da regio oeste da cidade
de Londrina e os 10% restantes so provenientes de outras cidades. Observou-se, ainda, que 5% dos animais
da regio norte foram submetidos a algum procedimento cirrgico, enquanto que para as outras regies os
percentuais foram: 3% para a regio sul, 8% para a regio leste, 4% para a regio oeste e 15% para outras
cidades. Uma cha escolhida aleatoriamente acusou que o animal foi submetido a um procedimento cirrgico.
Qual a probabilidade desse animal ser de outra cidade?
Soluo:
142
Exerccios - Probabilidades
1) Para cada um dos casos abaixo, escreva o espao amostral correspondente e conte seus elementos.
Tipos
Pessoas
85
193
252
Sorteando-se uma pessoa ao acaso, qual a probabilidade da mesma ser do tipo sangneo AB?
3) Uma urna contm duas bolas brancas (B ) e trs bolas vermelhas (V ). Retira-se uma bola ao acaso da
urna. Se for branca, lana-se uma moeda; se for vermelha, ela devolvida urna e retira-se outra. D o
espao amostral para o experimento.
4) Lance um dado at que a face 5 aparea pela primeira vez. Enumere os resultados possveis desse experimento.
5) Dentre seis nmeros positivos e oito negativos, dois nmeros so escolhidos ao acaso e multiplicados. Qual
a probabilidade de que o produto seja positivo?
6) Um casal pretende ter lhos. Admitindo probabilidades iguais para ambos os sexos, qual a probabilidade
de que venha a ter trs lhos do mesmo sexo?
7) Num grupo de 30 animais, 12 esto com parasitose intestinal. Trs animais so escolhidos ao acaso, um
aps o outro, sem reposio. Qual a probabilidade de pelo menos 2 deles no estarem infectados?
8) Considere o lanamento de dois dados. Considere os eventos:
A = soma dos nmeros obtidos igual a 9, e
B = nmero do primeiro dado maior ou igual a 4.
Enumere os elementos de A ou B. Obtenha
A B, A B
Ac
e suas probabilidades.
Probabilidade Condicional
143
9) Uma universidade tem 10 mil alunos dos quais 4 mil so considerados esportistas. Temos ainda que 500
alunos so do curso de biologia diurno, 700 da biologia noturno, 100 so esportistas e da biologia diurno
e 200 so esportistas e da biologia noturno. Um aluno escolhido ao acaso e pergunta-se a probabilidade
de:
a) ser esportista;
b) ser esportista e aluno da biologia noturno;
c) no ser da biologia;
d) ser esportista ou aluno da biologia;
e) no ser esportista nem aluno da biologia.
10) Uma fazenda contm quatro bezerros Nelore, cinco Gir e seis Guzer. Outra fazenda contm cinco bezerros
Nelore, seis Gir e dois Guzer. Sorteia-se um bezerro de cada fazenda. Qual a probabilidade de que ambos
sejam da mesma raa?
11) Num cruzamento de galos de pescoo pelado com galinhas do mesmo tipo, temos a probabilidade de
1/4
para obter um lho de pescoo coberto. Numa ninhada de seis pintos, qual a probabilidade de que nenhum
tenha pescoo coberto?
12) Sabendo-se que 2% dos exames clnicos feitos por um laboratrio apresentam falha humana, 1% falha
tcnica e 2,5% pelo menos uma das duas falhas, qual a probabilidade de um exame ter as duas falhas?
13) Uma fazenda composta de 70% de animais machos e 30% de fmeas. Sabe-se que 40% dos machos e
60% das fmeas so da raa Nelore. Qual a probabilidade de que escolhido um animal da raa Nelore, ele
seja macho?
14) Uma escola do ensino mdio do interior de So Paulo tem 40% de estudantes do gnero masculino. Entre
estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem de 50%.
Qual a
0, 3.
0, 7
se chove e com
0, 8
se no chove. Em agosto
16) Dos animais de uma fazenda, 60% so castrados. Se no for castrado, a probabilidade de ter tido um distrbio hormonal de 10%, enquanto que para os demais essa probabilidade aumenta para 30%. Pergunta-se:
144
17) Uma urna contm 10 bolas verdes, 8 vermelhas, 4 amarelas, 4 pretas e cinco brancas, todas de mesmo
raio. Uma bola retirada ao acaso. Qual a probabilidade de a bola escolhida ser:
a) no verde;
c) vermelha ou preta;
b) no-branca ou vermelha;
Qual a
a) Ocorrer soma 6;
c) ocorrer soma 2;
20) Uma carta retirada de um baralho comum de 52 cartas. Qual a probabilidade de:
1, 2, 3, . . . , 30.
22) Uma moeda viciada, de maneira que as caras so 3 vezes mais provveis de aparecer do que as coroas.
Se esta moeda lanada duas vezes. Qual a probabilidade de ocorrer cara apenas uma vez?
Probabilidade Condicional
23) Das 8 alunas de uma classe, 3 tm olhos azuis.
145
Se duas delas so escolhidas aleatoriamente, qual a
probabilidade de:
24) De 120 estudantes, 70 estudam matemtica, 80 estudam portugus e 40, matemtica e portugus. Se um
estudante escolhido aleatoriamente, encontre a probabilidade dele:
d) no estudar matemtica;
b) s estudar portugus;
c) s estudar matemtica;
mtica.
25) Em uma prova caram dois problemas. Sabe-se que 132 alunos acertaram o primeiro problema, 86 erraram
o segundo, 120 acertaram os dois e 54 acertaram apenas um problema. Qual a probabilidade de que um
aluno, escolhido ao acaso:
26) Um professor de probabilidade props a seus alunos o seguinte problema: So dadas duas moedas, uma
perfeita (probabilidade de cara igual 1/2), e outra com duas caras. Uma moeda escolhida ao acaso e
lanada trs vezes. Qual a probabilidade que seja obtida 3 caras?
Captulo 10
e associar um valor
amostral.
146
Conceitos Iniciais
147
Resultados Possveis
<E
E
E
"
E
J
<E
"
<E
"
<E
"
Probabilidades
EEE
0,216
EE E
0,144
E EE
0,144
EE
0,096
EEE
0,144
EE
0,096
EE
0,096
E
E
0,064
{
}
E EE,
EE
E,
EEE,
E,
E
EE,
E
E
E
= EEE, EE E,
EE
P (EEE) = 0, 216
= 0, 144
P (EE E)
P (EEE)
= 0, 144
P (EE E) = 0, 096
P (E EE)
= 0, 144
P (E E E) = 0, 096
EE)
P (E
= 0, 096
P (E E E) = 0, 064
148
i = 1, . . . , n chamado distribuio
n
Observao:
P (yi ) = 1.
i=1
Costuma-se adotar, tambm, a notao
assumir o valor
da varivel aleatria
P (Y = yi )
Y = {nmero
yi
P (Y = yi )
0,064
0,288
0,432
0,216
Y.
0.40
0.35
0.30
Probabilidades
P (yi ),
0.25
0.20
0.15
0.10
0.05
0
Y.
yi .
yi
Nmero de Sucessos
149
R,
bastam os comandos:
vacas = 0:3
prob_suc = 0.6
prenhez = data.frame(Pr = dbinom(vacas, 3, prob_suc))
rownames(prenhez) = 0:3
prenhez
plot(vacas, dbinom(vacas, size=3, prob=prob_suc), xlab="Nmero de Sucessos",
ylab="Probabilidades", main=`', axes=F, type="h", col=`blue')
points(vacas, dbinom(vacas, size=3, prob=prob_suc), pch=16, , col=`blue')
axis(1, vacas)
axis(2, seq(0, 0.45, .05), las=1)
abline(h=0, col="gray", cex=2.5, lwd=2)
box(bty=`l')
Exemplo:
Y ={nmero
( )
3
P (Y = y) =
0, 6y (1 0, 6)3y ,
y
em que
(3)
y
Exerccios:
y = 0, . . . , 3.
3!
.
y!(3 y)!
Calcular
P (Y = 0), P (Y = 1), P (Y = 2)
interpretar o resultado.
Soluo:
P (Y = 3),
150
necessrio
Y = E(Y ) =
esperana matemtica de Y
ao valor:
(10.1)
yi P (yi )
i=1
Exemplo:
Portanto,
yi
P (Y = yi )
0,064
0,288
0,432
0,216
Total
1,000
E(Y ) =
Interpretao:
como:
yi P (Y = yi )
animais emprenhados.
animais emprenhados.
uma constante e
da esperana matemtica:
a)
E(k) = k
E(kX) = kE(X)
c)
d)
E(X k) = E(X) k
e) Se
151
E(XY ) = E(X)E(Y ).
10.2.4 Varincia de Y
Dada a varivel aleatria
Y,
Y2 = V (Y ) =
chamamos de varincia de
n [
]2
yi E(Y ) P (yi ).
Y,
ao valor:
(10.2)
i=1
Portanto,
P (Y = y)
0,064
3,24
0,20736
0,288
0,64
0,18432
0,432
0,04
0,01728
0,216
1,44
0,31104
Total
1,000
V (Y ) = 0, 72.
Y =
0,72000
V (Y ) = 0, 8485281
CV =
Y2 = V (Y ) = E(Y 2 ) [E(Y )]
em que
E(Y 2 ) =
i=1
Logo,
yi2 P (Y = yi ).
Y
100 = 47, 14%.
Y
152
yi2
yi2 P (Y = y)
0,000
0,000
0,288
0,288
0,288
0,432
0,864
1,728
0,216
0,648
1,944
Total
1,000
1,8
P (Y = y)
0,064
y P (Y = y)
3,960
Assim,
[
]2
E(Y 2 ) E(Y )
( )2
3, 96 1, 8
V (Y ) =
V (Y ) =
V (Y ) = 0, 72.
Propriedades da Varincia
Supondo
uma constante e
para a varincia:
a)
V (k) = 0
b)
V (kX) = k 2 V (X)
c)
d)
V (X Y ) = V (X) V (Y ),
e)
V (X k) = V (X)
f ) Se
Obs.:
O fato de
se
so independentes.
COV (X, Y ) = 0
no implica que
sejam independentes.
yi
F (yi ) = P (Y yi )
i = 1, 2, . . . , n
Y.
ou distribuio
153
yi
P (Y = yi )
0,064
0,288
0,432
0,216
F(Y) =
P (Y yi )
1.0
Probabilidades
0.8
0.6
0.4
0.2
0.0
0.5
1.0
1.5
2.0
2.5
3.0
Nmero de Sucessos
Interpretar o valor
F (2).
Exerccios:
1) Considere um pasto com 3 vacas da raa Holandesa e 5 vacas da raa Gir. Sero retirados do pasto 3
animais, atravs de sorteio e
raa Gir. Pede-se:
sem reposio.
Dena a varivel
154
a) obter uma tabela contendo todos os possveis resultados desse experimento e as probabilidades associadas a cada um deles;
b) obter a distribuio da varivel aleatria
2) Seja
P (y)
0,1
0,2
0,3
0,2
0,1
0,1
Pede-se:
e a varincia de Y;
V ar(Y + 1).
que a represente;
b) a probabilidade de pelo menos 3 ovos eclodirem;
c) a esperana e a varincia de
Y.
sveis: sucesso (resultado de interesse) ou fracasso (resultado pelo qual no estamos interessados).
Exemplos:
a) Lanar
uma moeda.
b) Inseminar
um animal.
c) Colocar
d) Plantar
uma semente.
Jakob Bernoulli (Nascido em 27/12/1654 em Basel, Sua e falecido em 16/08/1705), tambm conhecido como
Jacob, Jacques ou James Bernoulli.
<
"
155
Resultados Possveis
Probabilidades
S (Sucesso)
1p
Y com
F (F racasso)
A distribuio de probabilidade de
0
distribuio de Bernoulli, com parmetro
dada
por:
P (Y = y)
1p
Total
de Bernoulli.
= E(Y ) =
yi P (Y = yi )
i=1
= E(Y ) = 0 (1 p) + 1 p
= E(Y ) = p
V (Y ) =
n [
]2
yi E(Y ) P (Y = yi )
i=1
V (Y ) = (0 p)2 (1 p) + (1 p)2 p
ou
[
]
V (Y ) = 02 (1 p) + 12 p [p]2
V (Y ) = p2 (1 p) + p(1 p)2
V (Y ) = p p2
V (Y ) = p(1 p)
V (Y ) = p (1 p)
Portanto,
V (Y ) = p(1 p)
E(Y ) = p
e
Notao: Y Be(p).
Funo de Probabilidades:
156
y = 0, 1.
clculo das probabilidades ser feito usando termos da expanso do binmio de Newton. O teorema do binmio
de Newton dado por:
(x + y)
n ( )
n
k=0
xnk y k
( )
( )
( )
( )
n n0 0
n n1 1
n n2 2
n nn n
x
y +
x
y +
x
y + ... +
x
y
0
1
2
n
( )
( )
n n2 2
n n3 3
n
n1 1
= x + nx
y +
x
y +
x
y + . . . + yn
2
3
=
(x + y)
em que
( )
n
n!
=
.
k
k!(n k)!
(x + y) = x + y
2
(x + y) = x2 + 2xy + y 2
3
(x + y) = x3 + 3x2 y + 3xy 2 + y 3
4
realizaes
independentes
constante e igual a p;
n.
ensaios tem
distribuio binomial
p.
dada por:
( )
n y
P (Y = y) =
p (1 p)ny ,
y
y = 0, 1, . . . , n.
( )
n
n!
; p
=
y
y!(n y)!
157
a probabilidade de sucesso e
(1 p)
a probabilidade de fracasso.
Bin(10; 0, 3),
10
ou seja, o estudo de
30%.
0.25
Probabilidades
0.20
0.15
0.10
0.05
0.00
0
10
Nmero de Sucessos
n = 10
p = 0, 30.
Para gerar o grco da distribuio no
Bin(n, p)
so
158
E(Y ) = n p
e
Exemplo 1:
Uma moeda lanada dez vezes. Qual a probabilidade de se obter duas caras? Determine a
esperana e a varincia.
Soluo:
Exemplo 2:
Uma infeco experimental em camundongos determina morte de 30% dos animais a ela subme-
tidos. Qual a probabilidade de obter num lote de 10 animais, uma mortalidade de, no mximo 20%?
Soluo:
159
Exemplo 3:
Voc leva sua cadela ao veterinrio e descobre atravs de um exame de ultrasonograa que ela
Soluo:
Soluo:
Soluo:
160
A distribuio de Poisson
rncias (sucessos) de um evento de interesse, por unidade de tempo, comprimento, rea ou volume. tambm
chamada de distribuio dos eventos raros.
Exemplos:
a) Nmero de insetos de uma espcie coletados por armadilha por dia;
ml
km
rodado;
de urina;
d) Nmero de pacientes que chegam a um pronto atendimento de uma pequena cidade durante a madrugada;
ha.
Note que os possveis valores que as variveis descritas podem assumir so:
0, 1, . . . ,.
Funo de Probabilidades:
distribuio de Poisson.
P oi()
dada por:
P (Y = y) =
em que
e y
,
y!
y = 0, 1, . . .
igual ao nmero mdio de ocorrncias do evento de interesse por unidade de tempo, distncia ou
rea.
Notao: Y P oi().
O grco gerado pela funo de probabilidades de uma distribuio de Poisson, para
apresentado na Figura 10.4.
= 4,
161
0.20
Probabilidades
0.15
0.10
0.05
0.00
0
10
11
12
Obs.:
Para valores de
= 4,
= 4, 0.
P oi()
so
E(Y ) =
V (Y ) =
e
Exemplo 1:
Um pesquisador est interessado no nmero de ovos depositados por uma espcie de pssaro.
Na primavera, ele procura e encontra 80 ninhos. O nmero mdio de ovos por ninho foi 3,8 e a varincia foi
3,1. Porque a varincia aproximadamente igual mdia, ele acha que pode ser razovel descrever o nmero
de ovos por ninho como tendo uma distribuio Poisson com mdia 3,8.
162
b) Se esta realmente representa a distribuio populacional, qual seria a probabilidade de no encontrar ovo
num ninho?
Soluo:
dpois(0, lambda=3.8)
Soluo:
1 - ppois(5, lambda=3.8)
Soluo:
dpois(3:6, 3.8)
sum(dpois(3:6, 3.8))
Exemplo 2:
0, 001
de no imunizar um animal.
a) trs animais;
163
Soluo:
dpois(3, lambda=5)
Soluo:
1 - ppois(1, lambda=5)
Exemplo 3:
um nmero nito.
Uma aproximao, que simplica a especicao de sua distribuio, supor que pode
tomar qualquer valor do conjunto {0, 1, 2, . . . }. Em um plano de sade com 5.694 liados, ao m de um
ano, foram realizadas
13.098
Nmero de consultas
Frequncias
Frequncias
589
304
1.274
126
1.542
39
1.144
10
663
Pede-se:
a) Especique o modelo de Poisson para esses dados.
Soluo:
Nmero de consultas
164
Soluo:
ncons = c(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
Obs = c(589, 1274, 1542, 1144, 663, 304, 126, 39, 10, 3)
(saude = data.frame(ncons, Obs)) ; attach(saude)
(media = weighted.mean(ncons, Obs))
dpois(0:9, lambda=media)
1 - ppois(6, lambda=media)
Soluo:
bin(n, p)
quando
Exemplo:
Seja
for pequeno,
P ois(),
com
np 7.
165
Soluo:
n = 10000
p = 0.0005
lambda = n*p
dpois(0, lambda)
Soluo:
1 - dpois(0, lambda)
c) a probabilidade do nmero de animais com efeitos colaterais estar entre 3 e 5 animais, inclusive.
Soluo:
1 sucesso.
Assim, se designarmos
= {S, F S, F F S, . . . , F F F S, . . .}
166
primeiras
n1
posies temos
F,
n-sima
n em que nas
ocorre o sucesso
S.
primeiro sucesso;
p;
P (X = x) = p (1 p)x1
x = 1, 2, . . .
R.
a)
primeiro sucesso;
p;
P (Y = y) = p (1 p)y
Notao:
Exemplo:
y = 0, 1, 2, . . .
Y G(p).
A probabilidade de se encontrar aberto o sinal de trnsito numa esquina
0, 20.
Qual a probabilidade
de que seja necessrio passar pelo local 5 vezes para encontrar o sinal aberto pela primeira vez?
Soluo:
dgeom(4, prob=0.20)
167
Um casal com problemas para engravidar, recorreu a uma tcnica de inseminao articial no
Soluo:
dgeom(2, prob=0.40)
0, 40.
168
R$ 30.000, 00
3%.
Seja
o nmero de divisores do
3) Seja
os grcos da distribuio de
Y,
paga
para os valores de
ganha
R$ 80, 00.
4.000
E(Y ) = 3, 15
ou
e
ganha
R$ 50, 00,
A
A
E(Y ) = R$ 9, 21.
0, 10.
10
R$ 600, 00
pessoas.
bolas numeradas de
faa
1, 2, 3, 4
126.000
R,
R$ 20, 00.
no litoral
Utilizando o
n?
R$ 20, 00
Y Bin(n, 0, 20).
E(Y ) = 2, 7.
ganha
respectivamente:
R$ 1.000, 00.
6.
se retirar as bolas
2, 3, 4 ou 5 nada recebe;
ir escolher outra bola, sem repor a primeira, e se esta segunda for a bola 6, recebe
contrrio, nada recebe. Calcular quanto a pessoa que est jogando espera lucrar. Resp:
e se retirar a bola
R$3.600, 00;
caso
R$ = 230, 00.
7) Uma moeda lanada 20 vezes. Qual a probabilidade de sarem 8 caras? Calcule a esperana e varincia.
Faa o grco da distribuio usando o
R.
8) Sabe-se que 20% dos animais submetidos a um certo tratamento no sobrevivem. Se esse tratamento foi
aplicado em 20 animais e se X o nmero de no sobreviventes:
a) faa o grco da distribuio;
b) qual o nmero mdio esperado de animais sobreviventes; Resp: 16.
c) Calcule a varincia e o desvio padro de X; Resp: 3,2 ; 1,788854.
P (2 < X 4);
e) Calcular a
P (X 2).
169
Resp: 0,4236.
Resp: 0,9308.
10) Seja
X Bin(10, 2/3).
Calcular:
P (X 2);
Resp: 0,003404
c)
P (X 4);
Resp: 0,98034
d)
Resp: 0,05690235
11) Sabe-se que 10% das vacinas de um determinado laboratrio tem validade vencida. Retiram-se, casualmente, 10 vacinas de uma partida, qual a probabilidade de:
a) todas as vacinas estarem com validade vencida? Resp:
b) no mximo trs com validade vencida? Resp:
c) existir vacina com validade vencida? Resp:
d) uma vacina com validade vencida? Resp:
1, 0 1010
0, 9298
0, 6513
0, 3874
E(X) = 1
12) Suponha que sabido que 30% de uma certa populao so imunes a alguma doena. Se uma amostra
aleatria de tamanho 10 selecionada desta populao, qual a probabilidade de que:
a) ela contenha exatamente 4 pessoas imunes? Resp: 0,20012
b) ela contenha mais que 4 pessoas imunes? Resp: 0,15027.
c) Construa a distribuio de probabilidade e faa o grco.
13) Em uma grande populao, 16% dos membros so canhotos. Em uma amostra aleatria de tamanho 10,
encontre:
a) a probabilidade de que exatamente dois sejam canhotos; Resp: 0,28555
b)
P (X 2);
Resp: 0,49195
c)
P (X < 2);
Resp: 0,50805
d)
P (1 X 4).
Resp: 0,81209
170
14) Suponha que a probabilidade de recuperao para uma certa doena seja conhecida e igual a 0,4. Se 15
contraem a doena (assuma como sendo uma amostra aleatria), qual a probabilidade que:
15) Considerando que a probabilidade de nascer uma criana do sexo feminino de 47%, qual a probabilidade
de que uma famlia de 6 lhos seja constituda por seis crianas do sexo feminino? Resp: 0,01077922
16) Um administrador de hospital, que tem estudado as admisses ao setor de emergncias diariamente, por
um perodo de alguns anos, chegou a concluso que elas so distribudas de acordo com a distribuio
de Poisson. Os registros do hospital revelam que as admisses ao setor de emergncias so, em mdia,
trs por dia, durante este perodo. Dado que o administrador est correto em assumir uma distribuio de
Poisson, encontra a probabilidade que:
a) exatamente duas admisses ao setor de emergncias ocorrero em um dado dia; Resp: 0,2240
b) nenhuma admisso ao setor de emergncias ocorrer em um dado dia; Resp: 0,0498
c) ocorram trs ou quatro admisses ao setor de emergncias em um dado dia. Resp: 0,3920
17) Em um estudo sobre um certo organismo aqutico, um grande nmero de amostras foram coletados de
um tanque, e o nmero de organismos em cada amostra foi contado. O nmero mdio de organismos por
amostra foi encontrado como sendo dois. Assumindo o nmero de organismos tendo uma distribuio de
Poisson, encontre a probabilidade que:
cm3
de um lquido. Admitindo-se
cm3 ?
Resp: 5
3
b) Encontre a probabilidade de que pelo menos duas bactrias ocorram num volume de lquido de 1cm .
Resp: 0,9596
171
19) Se a probabilidade de um indivduo sofrer uma reao nociva, resultante da infeco de um determinado
soro 0,0001. Determinar a probabilidade de, entre 2.000 indivduos:
20) Num livro de 800 pginas h 800 erros de impresso. Qual a probabilidade de que uma pgina contenha
pelo menos 3 erros? Resp: 0,080301
21) Seja X a varivel aleatria nmero de plantas com mutao, em um total de n plantas irradiadas, e
p = 0, 0004
a) a probabilidade de no aparecer nenhuma planta com mutao em 900 plantas irradiadas; Resp: 0,69768
b) a probabilidade de aparecer ao menos uma planta com mutao em 900 plantas irradiadas; Resp:
0,30232
22) Seja X o nmero de rvores de castanha-jarana (Lecythis lurida) por hectare numa oresta tropical. Suponha que X tem distribuio de Poisson (essa espcie distribui-se aleatoriamente pela regio) com mdia
3 plantas por hectare. Pede-se:
a) Calcular a probabilidade de se encontrar no mximo uma rvore dessa espcie, ao se observar 1 hectare
dessa oresta. Resp: 0,19915
b) Calcular a probabilidade de se encontrarem 3 ou mais rvores dessa espcie ao se observar 1 hectare
dessa oresta. Resp: 0,57681
Captulo 11
Denio:
a)
contnua em
f (y),
tal que:
f (y) 0, y ;
f (y)
e o eixo
igual a 1, ou seja,
f (y) dy = 1.
A funo
f (y)
Observa-se que:
[
]
P aY b =
f (y)dy,
(11.1)
a
corresponde rea limitada pela funo
f (y),
eixo
e pelas retas
Y =a
Y = b.
[
]
[
]
[
]
[
]
P a<Y <b =P aY <b =P a<Y b =P aY b .
Exemplo:
f (y)
dada por:
0,
f (y) =
ay 3 ,
0,
se
y 0;
se
0 < y 2;
se
y>2
172
na
173
a
em que
de modo que
f (y)
Y.
Soluo:
Se
Y = 2,
o eixo
f (y)
e a
f (y),
Y = 0,
2.0
f(x)
1.5
1.0
0.5
0.0
0.0
0.5
1.0
2.0
f (y) =
1 3
y .
4
A esperana matemtica (ou valor mdio) e a varincia de uma varivel aleatria contnua
so dadas, respectivamente, por:
Y = E(Y ) =
y f (y)dy
( )
2
Y2 = V (Y ) = E Y 2 [E(Y )]
em que,
E(Y ) =
y 2 f (y)dy .
Y,
174
Exerccio:
f (y) =
a) Fazer o grco de
2y
se
y < 0;
se
0 y 1;
se
y > 1;
f (y);
Soluo:
b) Vericar se
f (y)
Soluo:
c) Calcular
Soluo:
Soluo:
Distribuio Normal
Se
175
F (y)
F (y) = P (Y y) =
a
dene-se a
como:
Se
f (y)
f (t)dt.
Y,
176
e 2
1
f (y) =
2 2
)2
,
para
< Y < ,
(11.2)
em que:
R,
2 > 0,
y
= 100
2 = 100,
assume,
0.4
0.4
0.3
0.3
f(x)
f(x)
0.2
0.2
0.1
0.1
0.0
0.0
a
60
80
100
120
140
b.
Esta distribuio apropriada para modelar variveis aleatrias contnuas, que assumem valores
em algum subconjunto dos nmeros reais.
pertencer a um certo intervalo
[a; b]
P (a Y b) =
a
2 2
e 2
)2
dy
a e b basta calcular
Distribuio Normal
177
2) denida por dois parmetros: a mdia () e o desvio padro ( ), sendo que a mdia controla a localizao
do centro da distribuio ( o ponto de simetria), j o desvio padro controla a disperso da curva ao redor
da mdia;
3) O ponto de mximo de
f (y)
o ponto
Y = ;
99,7%
95,4%
68,3%
Figura 11.4
+ 2
+ 3
6) Notao:
Exemplo:
Y N (, 2 ).
Suponha que os pesos de animais adultos da raa pastor alemo possam ser descritos por uma
26 kg
42 kg ,
34 kg
e desvio padro
4 kg .
26
42 kg .
26
42.
fossem tabeladas diretamente a partir dessa funo, seriam necessrias tabelas de dupla entrada, complicando
consideravelmente as coisas.
178
espalhamento como interpretao, de se esperar que uma distribuio normal com desvio padro 2 seja
mais espalhada que uma distribuio normal com um desvio padro 1. A Figura 11.8(a) mostra as curvas
com mesma mdia e desvios variando de
1
2 a
3.
Y.
Quanto maior for a mdia mais deslocada direita estar a curva. A Figura 11.8(b)
ilustra o fato.
0.8
0.4
sigma=1/2
sigma=1
sigma=2
sigma=3
0.3
f(x)
f(y)
0.6
Mdia = 1
Mdia = 6
0.4
0.2
0.2
0.1
0.0
0.0
5
10
(a) Relao entre os desvios xada a mdia da distri- (b) Relao entre as mdias da distribuio, xado o desbuio.
vio padro.
Devido as diculdades de clculo e em se construir tabelas da funo dependendo de dois parmetros, recorre-se a uma mudana de varivel, transformando a varivel aleatria
na varivel aleatria
Z.
Y,
com mdia
e desvio-padro
Y,
Y .
preciso ento,
transformando-a na
179
Z.
ou escore
Z,
desvios-padro. Assim,
Z=
y
,
em que:
Z = nmero de desvios padres a contar da mdia;
y = o valor que a varivel aleatria assume;
= mdia da populao;
distribuio normal:
1
z2
1
f (z) =
e 2 ,
2
para
< Z < .
68,3%
99,7%
95,4%
V (Z) = 1.
E(Z) = 0 e varincia
Esses valores foram obtidos atravs da aplicao das propriedades do valor esperado e varincia,
180
considerando que
Y N (, 2 ):
[
]
Y
= E
1
E(Y )
=
1
=
( )
E(Z)
[
V (Z) =
=
=
E(Z) = 0.
1
V (Y )
2
1
2
2
V (Z) = 1.
Normal:
Z N (0, 1)
Y = Z +
Y N (, 2 ).
Seja
Z N (0; 1).
l) P( Z < 2,23)
Para encontrar as probabilidades dos itens do exemplo 1, basta usar a funo acumulada do
R,
cuja sintaxe
pnorm(1.57) - pnorm(0)
Exemplo 2:
Sabendo-se que
Z N (0; 1)
tal que:
181
qnorm
do
R,
cuja sintaxe
clculo ca:
qnorm(0.5 + 0.43699)
qnorm(0.5 - 0.35314)
Exemplo 3:
Seja
Y N (4; 1).
Determine:
a)
P (Y 4);
d)
b)
e)
P (Y 1);
c)
f)
P (0 Y 2);
pnorm
do
R.
Como a mdia
igual a 4 e o desvio-padro igual a 1, necessrio especic-los na funo. Assim, para os itens (a) e (b), por
exemplo, o clculo ca:
pnorm(4, 4, 1)
pnorm(5, 4, 1) - pnorm(4, 4, 1)
Exemplo 4:
Seja
Y N (3, 16),
ou seja, a varivel
Soluo:
=3
e varincia
2 = 16.
Faa o
182
Exemplo 5:
Assumindo-se
que a varivel estatura (Y) seja normalmente distribuda, calcule a probabilidade de um aluno aleatoriamente
selecionado ter estatura entre
1, 70m
1, 80m.
Soluo:
Exemplo 6:
- Vagas:
60
PROVAS
1
Classicao:
77 -
A/N
PTS
TPTS
NP
39
1,667
65,013
65,013
52,318
13,712
592,6
7,502
4,6
34,509
Lngua Port./Literatura
14
2,3
32,2
69,909
55,397
13,029
611,4
Lngua Estrangeira
0,8
3,2
Especca A
16
2,5
40
Especca B
16
2,5
40
80
52,319
15,814
676,2
Conhecimentos Gerais
Redao
1880,2
183
Classicao
1
60
Pontuao
2.150,2
1.899,3
184
Distribuio Normal
zt
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,00000
0,00399
0,00798
0,01197
0,01595
0,01994
0,02392
0,02790
0,03188
0,03586
0,1
0,03983
0,04380
0,04776
0,05172
0,05567
0,05962
0,06356
0,06749
0,07142
0,07535
0,2
0,07926
0,08317
0,08706
0,09095
0,09483
0,09871
0,10257
0,10642
0,11026
0,11409
0,3
0,11791
0,12172
0,12552
0,12930
0,13307
0,13683
0,14058
0,14431
0,14803
0,15173
0,4
0,15542
0,15910
0,16276
0,16640
0,17003
0,17364
0,17724
0,18082
0,18439
0,18793
0,5
0,19146
0,19497
0,19847
0,20194
0,20540
0,20884
0,21226
0,21566
0,21904
0,22240
0,6
0,22575
0,22907
0,23237
0,23565
0,23891
0,24215
0,24537
0,24857
0,25175
0,25490
0,7
0,25804
0,26115
0,26424
0,26730
0,27035
0,27337
0,27637
0,27935
0,28230
0,28524
0,8
0,28814
0,29103
0,29389
0,29673
0,29955
0,30234
0,30511
0,30785
0,31057
0,31327
0,9
0,31594
0,31859
0,32121
0,32381
0,32639
0,32894
0,33147
0,33398
0,33646
0,33891
1,0
0,34134
0,34375
0,34614
0,34849
0,35083
0,35314
0,35543
0,35769
0,35993
0,36214
1,1
0,36433
0,36650
0,36864
0,37076
0,37286
0,37493
0,37698
0,37900
0,38100
0,38298
1,2
0,38493
0,38686
0,38877
0,39065
0,39251
0,39435
0,39617
0,39796
0,39973
0,40147
1,3
0,40320
0,40490
0,40658
0,40824
0,40988
0,41149
0,41309
0,41466
0,41621
0,41774
1,4
0,41924
0,42073
0,42220
0,42364
0,42507
0,42647
0,42785
0,42922
0,43056
0,43189
1,5
0,43319
0,43448
0,43574
0,43699
0,43822
0,43943
0,44062
0,44179
0,44295
0,44408
1,6
0,44520
0,44630
0,44738
0,44845
0,44950
0,45053
0,45154
0,45254
0,45352
0,45449
1,7
0,45543
0,45637
0,45728
0,45818
0,45907
0,45994
0,46080
0,46164
0,46246
0,46327
1,8
0,46407
0,46485
0,46562
0,46638
0,46712
0,46784
0,46856
0,46926
0,46995
0,47062
1,9
0,47128
0,47193
0,47257
0,47320
0,47381
0,47441
0,47500
0,47558
0,47615
0,47670
2,0
0,47725
0,47778
0,47831
0,47882
0,47932
0,47982
0,48030
0,48077
0,48124
0,48169
2,1
0,48214
0,48257
0,48300
0,48341
0,48382
0,48422
0,48461
0,48500
0,48537
0,48574
2,2
0,48610
0,48645
0,48679
0,48713
0,48745
0,48778
0,48809
0,48840
0,48870
0,48899
2,3
0,48928
0,48956
0,48983
0,49010
0,49036
0,49061
0,49086
0,49111
0,49134
0,49158
2,4
0,49180
0,49202
0,49224
0,49245
0,49266
0,49286
0,49305
0,49324
0,49343
0,49361
2,5
0,49379
0,49396
0,49413
0,49430
0,49446
0,49461
0,49477
0,49492
0,49506
0,49520
2,6
0,49534
0,49547
0,49560
0,49573
0,49585
0,49598
0,49609
0,49621
0,49632
0,49643
2,7
0,49653
0,49664
0,49674
0,49683
0,49693
0,49702
0,49711
0,49720
0,49728
0,49736
2,8
0,49744
0,49752
0,49760
0,49767
0,49774
0,49781
0,49788
0,49795
0,49801
0,49807
2,9
0,49813
0,49819
0,49825
0,49831
0,49836
0,49841
0,49846
0,49851
0,49856
0,49861
3,0
0,49865
0,49869
0,49874
0,49878
0,49882
0,49886
0,49889
0,49893
0,49896
0,49900
3,1
0,49903
0,49906
0,49910
0,49913
0,49916
0,49918
0,49921
0,49924
0,49926
0,49929
3,2
0,49931
0,49934
0,49936
0,49938
0,49940
0,49942
0,49944
0,49946
0,49948
0,49950
3,3
0,49952
0,49953
0,49955
0,49957
0,49958
0,49960
0,49961
0,49962
0,49964
0,49965
3,4
0,49966
0,49968
0,49969
0,49970
0,49971
0,49972
0,49973
0,49974
0,49975
0,49976
3,5
0,49977
0,49978
0,49978
0,49979
0,49980
0,49981
0,49981
0,49982
0,49983
0,49983
3,6
0,49984
0,49985
0,49985
0,49986
0,49986
0,49987
0,49987
0,49988
0,49988
0,49989
3,7
0,49989
0,49990
0,49990
0,49990
0,49991
0,49991
0,49992
0,49992
0,49992
0,49992
3,8
0,49993
0,49993
0,49993
0,49994
0,49994
0,49994
0,49994
0,49995
0,49995
0,49995
3,9
0,49995
0,49995
0,49996
0,49996
0,49996
0,49996
0,49996
0,49996
0,49997
0,49997
185
Exerccios
1) Suponha que
= 8; 2 = 4,
a) Construa o grco de
ou seja,
Y N (8; 4).
Y;
P (Y 9, 5);
R,
P (6 Y 10).
1, 70 m
e desvio padro
0, 08 m.
1, 60
1, 82 m?
186
1, 58?
z0
z0
seja
0, 40.
qnorm(c(.1, .9))
4) Um teste de aptido para o exerccio de certa prosso exige uma sequncia de operaes a serem executadas rapidamente uma aps outra. Para passar no teste, o candidato deve complet-lo em
80
minutos no
mximo. Admita que o tempo para completar o teste seja uma varivel aleatria N(90, 400).
a) Qual a porcentagem dos candidatos com chances de serem aprovados?
5) sabido que, para adultos do sexo masculino, gozando de boa sade, em uma certa populao, a temperatura corporal segue distribuio gaussiana com mdia de 36,8 graus e desvio-padro de 0,15 graus.
a) Se considerarmos 1.000 dessas pessoas, quantas se esperariam com temperatura entre 36,8 e 37,2
graus?
6) Um pesquisador deseja criar um padro para identicar presena de infeco bacteriana (Pseudomonas sp)
no trato respiratrio atravs de cultura de escarro. Para isto, coletaram-se dados de pessoas sabidamente
sadias e determinou-se o nmero de colnias encontradas em cada cultura. Foram encontrados os seguintes
resultados:
17
22
23
23
23
23
24
24
24
24
24
24
25
25
25
25
25
25
25
26
28
28
29
30
30
31
31
35
35
35
36
40
41
41
41
42
51
54
56
56
56
58
60
68
79
187
Determine uma faixa de normalidade de 95% para o nmero de colnias de bactrias no trato respiratrio
de pessoas sadias, usando o mtodo da curva de Gauss.
escarro = c(17, 22, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25,
25, 26, 28, 28, 29, 30, 30, 31, 31, 35, 35, 35, 36, 40, 41, 41, 41, 42,
51, 54, 56, 56, 56, 58, 60, 68, 79)
(n = length(escarro))
(mdia = mean(escarro))
(var.amostra = var(escarro))
(var.pop = ((n-1)/n) * varincia)
# ou,
(var.pop = sum((escarro - mean(escarro))^2) / n)
qnorm(c(.025, .975), mean=mdia, sd=sqrt(var.pop))
170 cm
5 cm.
165 cm?
N (50kg ; 4kg 2 ).
R$ 60, 00,
R$ 80, 00.
9) Mensuraes de pesos foram realizadas in vivo em 142 fmeas de bovinos da raa Nelore.
desvio padro obtidos foram:
= 390, 19 kg
distribuio normal:
= 45, 23 kg .
A mdia e
188
395 kg ;
380, 17 kg ;
385, 0 kg ;
385
390 kg ;
10) Uma amostra de 120 sunos mestios, com seis meses de idade, apresenta quanto ao peso (em kg):
= 80kg
a) Quantos sunos tm peso entre
= 12kg.
189
72
82 kg ?
92
104 kg ?
11) A distribuio dos pesos de coelhos criados numa granja pode muito bem ser representado por uma
com o peso, da seguinte forma: 20% dos mais leves como pequenos, os 40% seguintes como mdios,
os 30% seguintes como grandes e os 10% restantes como extras.
classicao?
E(X)
V (X).
kx2
f (x) =
0
se
0 x 2;
se
x<0
ou
x > 2.
13) Suponha que o peso de animais recm-nascidos (em kg) pode ser considerado uma varivel aleatria com
a seguinte densidade:
1
1
x+
10
10
9
3
f (x) =
x+
40
20
0,
se
0 x 2;
se
2 < x 6;
caso contrrio.
a) inferior a
3 kg ;
190
p = 0,6625
b) entre
4 kg ;
p = 0,25
Captulo 12
Exemplo:
Suponha que a distribuio das estaturas dos alunos da UEL possa ser representada por um modelo
gaussiano e que os parmetros populacionais, mdia e varincia, fossem conhecidos e iguais, respectivamente,
a
1, 72 m e 0, 0225 m2 .
1, 75 m?
1, 65 m
Se os dados seguem uma distribuio normal, ento tem-se que a funo densidade de probabilidade dada
por:
f (y) =
1 y 2
1
e 2 ( ) , < Y < +
2
1,75
P (1, 65 Y 1, 75) =
1,65
1 y1,72 2
1
e 2 ( 0,15 ) dy = 0, 2589
0, 15 2
191
192
Assim,
tem-se:
Parmetro
Estatstica
s2
Desvio padro
Proporo
Mdia
Varincia
Considere:
Y =
yi
i=1
em que que:
chamado estimador e
y = 1, 73 m
Y.
P(Y=y)
1/5
1/5
Total
b) Calcular a mdia
Y = E(Y )
e a varincia
[
]2
2 = E(Y 2 ) E(Y ) .
193
Soluo:
n = 2, com reposio,
extrao e
Amostra
Y1 + Y2
Y =
2
Probabilidade
Y2 ,
Y1
Y1 + Y2
Y =
2
Amostra
Y1 + Y2
Y =
2
Probabilidade
1/25
(5;1)
1/25
(1;3)
1/25
(5;3)
1/25
(1;5)
1/25
(5;5)
1/25
(1;5)
1/25
(5;5)
1/25
(1;7)
1/25
(5;7)
1/25
(3;1)
1/25
(7;1)
1/25
(3;3)
1/25
(7;3)
1/25
(3;5)
1/25
(7;5)
1/25
(3;5)
1/25
(7;5)
1/25
(3;7)
1/25
(7;7)
1/25
(5;1)
1/25
(5;3)
1/25
(5;5)
1/25
(5;5)
1/25
(5;7)
1/25
53 = 125,
(mdia).
(1;1)
52 = 25.
194
P (Y = y)
1/25
2/25
Probabilidades
0.20
0.15
0.10
0.05
1/25
0.00
Total
4
Mdias
Calcular a mdia
Y = E(Y )
e a varincia
[
]2
Y2 = E(Y 2 ) E(Y ) .
Soluo:
y = 1:7
probab=c(1, 2, 5, 6, 6, 4, 1)/25
require(distrEx)
Y = DiscreteDistribution(supp=y, prob=probab)
E(Y) ; var(Y) ; sd(Y)
par(mai=c(1, 1, .2, .5))
plot(probab~y, las=1, type="h", bty="l", col="blue",
xlab="Mdias", ylab="Probabilidades")
points(y, prob, pch=19, col="blue")
195
n
N,
basta usar o
R.
popul = c(1, 3, 5, 5, 7)
(amostra = sample(popul, 2, replace=T))
# ou
tilapia = read.table('http://www.uel.br/pessoal/silvano/Dados/Tilapia.txt', head=T)
attach(tilapia)
(amostra.tila = sample(Peso, 20, replace=F))
R,
da amostra.
Para se determinar a
varincia de uma populao necessrio denir uma funo para efetuar tal clculo, dada por:
196
Teorema:
Seja
aleatria simples de
Y.
e varincia
2 ,
e seja
(Y1 , Y2 , . . . , Yn )
uma amostra
Ento:
2
.
Y2 = V (Y ) =
n
Y = E(Y ) =
Quando o tamanho da amostra aumenta, independentemente da forma da distribuio da populao, a distribuio amostral de
aproxima-se cada vez mais de uma distribuio normal. Esse resultado, fundamental
Teorema:
Para amostras aleatrias simples (Y1 , Y2 , . . . , Yn ), retiradas de uma populao com mdia
2 ,
varincia
com mdia
aproxima-se, para
, ou seja,
Y N
(
)
2
,
.
n
ter distribuio
exata
(12.1)
Corolrio:
e
, e
Z=
em que
e = Y
Y a
N (0, 1),
(12.2)
e o parmetro
isto ,
no
so:
require(TeachingDemos)
clt.examp(n = 50, reps = 10000, nclass =16)
197
Suponha que os comprimentos de jacars adultos de uma certa raa siga o modelo normal com
= 1, 69 m
e varincia igual a
0, 01 m2 .
1, 63
1, 69 m?
Soluo:
Exemplo 2:
22 mm.
= 27, 3 mm
n = 35
e o desvio padro
= 7, 8 mm.
Y < 22 mm?
Soluo:
Soluo:
a m de que
198
12.2
que
1, 69 m.
Seja
Yi
Yi =
Logo,
Yi
ser
1,
se
Xi > 1, 69 m
0,
se
Xi 1, 69 m
As quantidades
Y1 , Y2 , , Y10
tambm so
10
Xi
1,58
1,63
1,72
1,75
1,69
1,68
1,70
1,64
1,77
1,74
Yi
Portanto, a proporo
encontrada na amostra,
p.
p=
indicando que
Denio:
50%
Seja
Y1 + Y2 + + Y10
0 + 0 + 1 + + 1
=
= 0, 5
10
10
Y =
sendo
P (Y = 1) =
tal que:
1,
0,
P (Y = 0) = 1 .
E(p) = p = E
Yi
199
Yi
(1
)
(1 )
V ar(p) = p2 = V ar
=
= p =
.
n
n
n
i=1
i=1
2)
sucientemente grande
(n > 30), p
ter
[
]
(1 )
a
p N ,
,
n
em que
p
z=
(1)
n
N (0, 1)
Quando
de
p=
y
,
n
estimativa
Logo,
p =
Exemplo 1:
p(1 p)
.
n
Retira-se uma amostra de 400 pessoas, obtendo-se 8 portadores da doena. Determine a proporo estimada
de pessoas portadoras da doena e o desvio padro.
Soluo:
Exemplo 2:
80%
indivduos que tomaram a vacina foi sorteada e testes foram feitos para vericar a imunizao ou no desses
indivduos. Se o fabricante estiver correto, qual a probabilidade da proporo de imunizados na amostra ser
inferior
0, 75?
E superior
0, 85?
200
Soluo: