Probabilidades
Brulio Roberto Gonalves Marinho Couto
Janana Giovani Noronha de Oliveira
Octvio Alcntara Torres
Reinaldo Carvalho de Morais
ESTATSTICA E PROBABILIDADES
Belo Horizonte
Junho de 2015
COPYRIGHT 2015
GRUPO NIMA EDUCAO
Todos os direitos reservados ao:
Grupo nima Educao
Todos os direitos reservados e protegidos pela Lei 9.610/98. Nenhuma parte deste livro, sem prvia autorizao
por escrito da detentora dos direitos, poder ser reproduzida ou transmitida, sejam quais forem os meios
empregados: eletrnicos, mecnicos, fotogrficos, gravaes ou quaisquer outros.
Edio
Grupo nima Educao
Vice Presidncia
Arthur Sperandeo de Macedo
Coordenao de Produo
Gislene Garcia Nora de Oliveira
Ilustrao e Capa
Alexandre de Souza Paz Monsserrate
Leonardo Antonio Aguiar
Equipe EaD
Conhea
o Autor
Brulio Roberto Gonalves Marinho Couto
doutor em Bioinformtica, mestre em Cincia
da Computao, especialista em Estatstica,
bacharel em Engenharia Qumica e tcnico
em Qumica. Atuante nas reas de Estatstica,
Clculo Numrico, Informtica em Sade,
Epidemiologia Hospitalar e Bioinformtica.
Professor do Centro Universitrio de Belo
Horizonte (UniBH).
Conhea
a Autora
Janana
em
mestre
Giovani
em
Licenciatura
Noronha
Estatstica
em
de
e
Oliveira
graduada
Matemtica
com
Conhea
o Autor
Octvio Alcntara Torres bacharel em
Estatstica e mestre em Demografia. Possui
experincia nas reas de probabilidade
e
estatstica,
regresso
correlao,
Conhea
o Autor
Reinaldo Carvalho de Morais mestre e
bacharel em Administrao Pblica, graduado
em Estatstica e especialista em Gesto
Financeira. Possui experincia em pesquisas
sobre economia e finanas pblicas mineiras,
bem como docncia nas disciplinas de
estatstica, de economia, de engenharia
econmica, de matemtica financeira e de
administrao da produo.
Apresentao
da disciplina
Egressos de cursos de Engenharia e Tecnologia so profissionais que
resolvem problemas. E como isso ocorre? Pela aplicao eficiente
do mtodo cientfico. Pois bem, disso que se trata essa disciplina:
apresentar
ferramentas
estatsticas
que
possibilitaro
voc
UNIDADE 1
Introduo estatstica
Conceitos bsicos
O papel das variveis numa base de dados: identificao, auxiliares,
variveis explicativas e varivel reposta (desfecho)
Tipos de variveis
Uso do Excel como um sistema de gerenciamento de dados
e dos formulrios do Google Docs para coleta de informaes
Reviso
003
004
006
UNIDADE 2
Anlise exploratria de dados
Sntese grfica de dados
Sntese tabular de dados
Sntese numrica de dados
Reviso
023
024
026
047
048
059
UNIDADE 3
Introduo teoria de probabilidades
A teoria das probabilidades
Probabilidade clssica e probabilidade frequentista
Leis bsicas de probabilidades
Unio e interseo de eventos
Tabelas de contingncia
Eventos independentes
Teorema de Bayes
Reviso
061
062
064
066
067
068
070
072
072
076
UNIDADE 4
Modelos probabilsticos
Variveis aleatrias
Modelos probabilsticos
Distribuio binomial
Distribuio Poisson
Distribuio normal
Reviso
079
080
081
088
088
089
090
095
012
015
017
021
UNIDADE 5
Estimao de mdias e propores
Teorema central do limite
Estimao pontual e por intervalos de confiana para uma
mdia populacional
Estimao pontual e por intervalos de confiana para uma
proporo populacional
Uso do Excel no clculo de intervalos de confiana para
mdia e proporo
Introduo ao programa EpiInfo
Reviso
096
097
099
UNIDADE 6
Planejamento de experimentos
Clculo de tamanho de amostra baseado em intervalos de
confiana para uma proporo
Clculo de tamanho de amostra baseado em intervalos de confiana
para uma mdia
Planejamento de experimentos
Planejamento de experimentos - terminologia bsica
Reviso
124
125
UNIDADE 7
Testes de Hipteses
A construo e o significado de uma hiptese estatstica
Testes para uma amostra
Testes para duas ou mais amostras
Reviso
147
148
149
151
167
172
UNIDADE 8
Anlise de correlao e regresso
Anlise de correlao
Regresso linear simples
Regresso linear mltipla
Reviso
174
175
176
185
193
200
REFERNCIAS
202
103
112
116
120
121
127
132
135
140
144
Introduo
estatstica
Introduo
Podemos entender o mtodo estatstico como um processo para obter,
apresentar e analisar caractersticas ou valores numricos, identificando
padres que possibilitam a tomada de deciso em situaes de incerteza.
Pode acreditar, se voc aplicar o mtodo estatstico para a anlise e soluo
de problemas, muito rapidamente se tornar um especialista de qualquer
rea do conhecimento! Num mundo real, completamente cercado de
incertezas, ser capaz de identificar padres de comportamento de
pessoas, projetos, produtos, servios, etc pode transform-lo num mago.
Entretanto, antes de voc transformar-se num mago, necessrio
um entendimento adequado do mtodo estatstico, que tem suas
armadilhas. Costumo dizer que Estatstica no Matemtica... muito
mais difcil. Na verdade, Estatstica uma das reas da Matemtica
Conceitos
bsicos
O papel das
variveis numa
base de dados:
identificao,
auxiliares,
variveis
explicativas e
vriavel reposta
(desfecho)
Tipos de
variveis
Uso do Excel
como um
sistema de
gerenciamento
de dados e dos
formulrios do
Google Docs
para coleta de
informaes
Reviso
que, por sinal, a Cincia cuja aplicao no mundo real possibilitou ter
uma vida incrivelmente confortvel. Bom, quando afirmo que Estatstica
no Matemtica, quero dizer que, na Matemtica que voc aprendeu no
Ensino Fundamental e Mdio, os problemas tm usualmente uma nica
forma de serem resolvidos e devem todos chegar ao mesmo resultado
ESTATSTICA E PROBABILIDADES
Conceitos
bsicos
Voc sabe o que populao? E amostra? Vejamos o exemplo a seguir.
Vamos supor que uma cozinheira esteja preparando dois litros de sopa.
Como ela sabe se a sopa est temperada?
Os dois litros de sopa formam a populao e, se a cozinheira
comer/provar toda a sopa, estar fazendo um censo, o que geraria
um absurdo do tipo , a sopa estava tima!.
A cozinheira sabe que em experimentos baseados em ensaios
destrutivos, quando a prpria anlise destri o dado coletado, o
censo um absurdo. Na verdade, ela sabe que censos, de modo
geral, so inviveis, muito caros e/ou muito demorados. Mais
ainda, ela sabe que se usar uma pequena amostra cuidadosamente
retirada, chamada amostra representativa, poder tomar decises
sobre toda a populao envolvida no problema com um alto grau
de confiana.
A cozinheira ento retira uma pequena amostra, uma pitada
da comida, prova-a e generaliza o resultado para toda a sopa.
Isso chamado de inferncia: tomar decises sobre toda uma
populao com base em informaes parciais de uma amostra
(veja a FIGURA 1).
Entretanto, a cozinheira sabe que para fazer inferncias vlidas,
deve tomar cuidado para no trabalhar com amostras viciadas. E o
que seria isso?
Se ela retirar uma amostra somente da parte de cima da sopa, muito
provavelmente ter uma amostra viciada, isto , sem representantes
006
unidade 1
ESTATSTICA E PROBABILIDADES
matriculados
na
disciplina
Estatstica
Probabilidades;
007
unidade 1
Populao finita: o
nmero de unidades
de observao pode
ser contado e
limitado.
ESTATSTICA E PROBABILIDADES
008
unidade 1
Populao infinita:
a quantidade
de unidades de
observao
ilimitada, ou a sua
composio tal
que as unidades
da populao no
podem ser contadas.
ESTATSTICA E PROBABILIDADES
Populao
amostrada
Inferncia
Amostra
009
unidade 1
ESTATSTICA E PROBABILIDADES
010
unidade 1
A amostragem deve
ser usada porque
torna o processo
eficiente e preciso.
ESTATSTICA E PROBABILIDADES
que
sero
apresentadas
somente
nas
prximas unidades.
COUTO
(2003)
apresentam
as
principais
011
unidade 1
Amostra
probabilstica:
existe uma garantia,
em termos de
probabilidade, de que
qualquer membro
da populao possa
ser selecionado para
amostra.
ESTATSTICA E PROBABILIDADES
012
unidade 1
Qualquer que
seja o esquema
de amostragem,
probabilstico ou
no, deve-se sempre
garantir que a
amostra reflita as
caractersticas da
populao da qual
foi retirada.
ESTATSTICA E PROBABILIDADES
013
unidade 1
Uma varivel a
quantificao de
uma caracterstica
de interesse da
pesquisa (SOARES e
SIQUEIRA, 2002).
ESTATSTICA E PROBABILIDADES
CARACTERSTICAS
Variveis de identificao
e auxiliares
Variveis explicativas
Varivel desfecho
014
unidade 1
ESTATSTICA E PROBABILIDADES
Tipos de
variveis
Se considerarmos a maioria absoluta das variveis envolvidas em
experimentos de pequeno e mdio porte nas reas de Cincias
Exatas e Engenharia, teremos duas situaes para o tipo da varivel.
I) Varivel qualitativa ou categrica: aquela que expressa
caractersticas ou atributos de classificao, distribudos em
categorias mutuamente exclusivas de objetos ou entidades.
Categorias mutuamente exclusivas ou mutuamente excludentes
no podem ser observadas simultaneamente num mesmo
indivduo. Por exemplo, grupo sanguneo (A, B, AB, O) uma
varivel categrica mutuamente exclusiva: um indivduo tem
somente um grupo sanguneo, no podendo ser classificado em
mais de uma categoria ao mesmo tempo. Variveis qualitativas
tm um nvel baixo de informao, sendo obtidas por um critrio
de classificao. Por exemplo, sexo (masculino, feminino), estado
civil (com companheiro, sem companheiro), cor de um produto
(branco, verde, amarelo, azul), tipo de transmisso de um carro
(manual, automtica), conformidade de qualidade de um produto
(aceito, no aceito), dia chuvoso (sim, no), resultado final de um
aluno numa disciplina (aprovado, reprovado) etc.
A anlise de uma varivel categrica muito restrita e simples:
conta-se quantas unidades amostrais ou resultados observados em
cada categoria da varivel e calcula-se o percentual de ocorrncia
de cada classe ou categoria.
015
unidade 1
A funo de cada
varivel na base de
dados, assim como o
seu tipo, definir que
tipo de anlise ser
feita.
ESTATSTICA E PROBABILIDADES
016
unidade 1
As variveis
quantitativas so
chamadas tambm
de numricas.
ESTATSTICA E PROBABILIDADES
ferramentas
essenciais
para
coleta
de
dados
de
017
unidade 1
ESTATSTICA E PROBABILIDADES
018
unidade 1
ESTATSTICA E PROBABILIDADES
PARMETROS
26,4 = 1,60
26,4 = 1,70
7,17 = 0,60
7,18 = 0,90
227,48 = 36
1779,7 = 68
pH
8,44 = 0,12
7,40 = 0,35
Tratamentos: (A) controle (gua potvel + rao); (B) efluente tratado (efluente do sistema de
filtro de aguap + rao)
Fonte: REIDEL et al., 2005.
Tratamento A
Tratamento B
mdia
mdia
0,235 a
43,267
0,232 a
46,113
1,172 a
2,426
1,160 a
1,901
0,001
1,391 a
42,269
1,054 a
45,582
0,028
5,280 a
38,890
4,300 a
45,721
0,028
75 a
80,467
80 a
25,819
0,08
Sobrevivncia (%)
Teste t-Student
T calculado
Mdias seguidas da mesma letra, na linha, no diferem significadamente pelo teste t de Student ao nvel 5% de significncia
019
unidade 1
ESTATSTICA E PROBABILIDADES
O experimento baseado
Dentre as
020
unidade 1
ESTATSTICA E PROBABILIDADES
Reviso
Vimos nessa unidade alguns dos principais tpicos introdutrios do
campo da Estatstica. Em resumo, estudamos sobre:
Populao, amostra, censo e amostragem:
-- Censo de toda a populao no vivel, devido aos altos
custos e/ou quando a pesquisa envolve ensaios destrutivos.
-- Uma pequena, mas cuidadosamente escolhida amostra
pode ser usada para representar a populao.
-- Os resultados observados numa amostra representativa
podero ser generalizados, sem risco de chegar a uma
concluso diferente daquela que seria obtida no caso de
trabalhar com toda a populao.
-- A questo mais importante numa amostragem no
o tamanho da amostra, mas como a amostra ser
obtida, pois o delineamento amostral mal feito invalida
qualquer pesquisa.
Tipos de variveis:
-- Varivel qualitativa ou categrica: aquela que expressa
caractersticas ou atributos de classificao, distribudos
em categorias mutuamente exclusivas de objetos ou
entidades.
-- Varivel quantitativa: aquela obtida por meio de um
processo de medio ou contagem.
021
unidade 1
Varivel
quantitativa:
aquela obtida
por meio de um
processo de medio
ou contagem.
ESTATSTICA E PROBABILIDADES
022
unidade 1
Anlise
exploratria
de dados
Introduo
Conforme citado na Unidade 1, se voc usar tcnicas de anlise
estatstica, voc poder rapidamente se transformar num especialista
em qualquer assunto, certo? Pois bem, como exemplo, que tal se tornar
um especialista em reprovao em disciplinas bsicas de cursos de
Engenharia e Tecnologia? E voc no precisar repetir nenhuma
dessas disciplinas para ser um especialista em reprovao...! Esse
um problema bem conhecido, mas suas causas e fatores associados
no! Uma hiptese que durante o ensino fundamental e mdio muitos
alunos no conseguem adquirir habilidade em resolver problemas
matemticos. Essa deficincia ento culmina nos cursos de Engenharia
com altos ndices de reprovao no ciclo bsico. Disciplinas como
Clculo Diferencial, Geometria Analtica e lgebra Linear (GAAL),
Qumica Geral e Algoritmos (AEDS) podem ser verdadeiros infernos
para alunos da rea de Exatas.
Sintese grfica
de dados
Sintese tabular
de dados
Sinteses
numrica de
dados
Reviso
ESTATSTICA E PROBABILIDADES
Sntese grfica
de dados
Uma figura vale mais que mil palavras! Isso verdade, entretanto um
grfico vale mais que mil palavras se e somente se ele for desenhado
de forma clara, correta e concisa. Sempre desenhe grficos a partir
de seus dados, mas tente faz-los de tal forma que a frase basta
olhar para entender seja vlida. Os grficos mais teis para anlise
de dados de experimentos de pequeno e mdio porte na rea de
Cincias Exatas e Engenharia so: grficos de pizza, barras, colunas,
linha, sries histricas, histograma, grfico de Pareto, grfico misto,
de coluna e de linha, diagrama de disperso e box-plot (tabela 3).
De todos esses, somente vejo sentido em construi-los mo
histogramas e diagramas de disperso. Entretanto, na prtica
devemos construir grficos usando ferramentas computacionais
como o Excel.
TABELA 3 - Grficos mais teis para anlise de dados de experimentos
de pequeno e mdio porte na rea de Cincias Exatas e Engenharia.
NMERO DE VARIVEIS
ENVOLVIDAS
Pizza ou setor
Uma
Categrica
Colunas (verticais)
Uma
Categrica
Barras (horizontais)
Uma
Categrica
Histograma
Uma
Grficos de linha
Duas
Sries histricas
Duas
Grfico de Pareto
Uma
Categrica
Grfico misto, de
coluna e linhas
Duas
Diagrama de
disperso
Duas
Uma ou mais
Quantitativa
TIPO DE GRFICO
Box-plot
Fonte: Elaborado pelo autor.
026
unidade 2
ESTATSTICA E PROBABILIDADES
027
unidade 2
Mesmo em casos
excepcionais,
quando o grfico
no exportado
para nenhum
outro aplicativo,
sendo impresso
diretamente do Excel,
o ttulo no deve ser
colocado no meio da
figura.
ESTATSTICA E PROBABILIDADES
A maioria absoluta (58%) dos 760 artigos publicados nos volumes 298 a 301 da NEJM utilizou somente tcnicas de
Estatstica Descritiva na anlise dos dados. Praticamente um quarto dos artigos usou teste t de student e 15% aplicou
teste de qui-quadrado nas tabelas de contingncia, ferramentas que sero discutidas na Unidade 7 deste livro.
Fonte: BAILAR & MOSTELLER,1992.
028
unidade 2
ESTATSTICA E PROBABILIDADES
Anlise de 21 disciplinas avaliadas em sete semestres (2011/1 a 2014/1), considerando amostra de 78.399 alunos.
Quatro disciplinas tm mais de 40% de seus alunos reprovados: Clculo Diferencial, Geometria Analtica e lgebra
Linear, Clculo de Vrias Variveis e Algoritmo e Estruturas de Dados.
Fonte: Elaborado pelo autor.
029
unidade 2
ESTATSTICA E PROBABILIDADES
030
unidade 2
ESTATSTICA E PROBABILIDADES
031
unidade 2
ESTATSTICA E PROBABILIDADES
FIGURA 7 Grfico distorcido: desenhando a figura com a altura muito pequena, em relao
largura, a informao falseada e se tem a sensao de estabilidade dos dados.
032
unidade 2
ESTATSTICA E PROBABILIDADES
10. D
iagrama de disperso: Ferramenta que nos permite avaliar
o efeito de uma varivel explicativa quantitativa sobre um
desfecho. Serve tanto para visualizarmos funes matemticas
tericas (figura 9) quanto funes de relacionamentos
empricos j conhecidos (figura 10), mas a sua grande utilidade
033
unidade 2
ESTATSTICA E PROBABILIDADES
034
unidade 2
ESTATSTICA E PROBABILIDADES
Fonte: Elaborado pelo autor baseado nos dados em DAFICO, Dario de Arajo. Mtodo Simples para Explicar a
Resistncia Compresso do Concreto de Alto Desempenho. Disponvel em: http://www2.ucg.br/nupenge/pdf/Dario.
pdf. Acesso em 14 maio 2015.
035
unidade 2
ESTATSTICA E PROBABILIDADES
036
unidade 2
ESTATSTICA E PROBABILIDADES
037
unidade 2
ESTATSTICA E PROBABILIDADES
038
unidade 2
ESTATSTICA E PROBABILIDADES
039
unidade 2
ESTATSTICA E PROBABILIDADES
040
unidade 2
ESTATSTICA E PROBABILIDADES
mx = 25;
R = mx mn = 25 0 = 25
041
unidade 2
ESTATSTICA E PROBABILIDADES
120 10.
R
Passo 3 Determinar o tamanho de cada subintervalo (h). h k . No
R 25
exemplo, h k 10 . 2,5 Ou seja, no nosso exemplo, temos 120
valores que variam de 0 a 25 e vamos dividi-los em 10 classes de
tamanho 2,5.
Passo 4 - Contar a frequncia de valores em cada classe. No
exemplo, comeando em zero (valor mnimo), teremos uma
tabela de distribuio de frequncias, base para construo do
histograma, de 2,5 a 2,5 pontos cada subintervalo. Vamos verificar
na base de dados quantos valores se encaixam em cada classe.
Observe na figura 14 o smbolo --|, ele indica que o valor direita
faz parte do intervalo, mas o valor sua esquerda no! Ou seja, o
intervalo 2,5 --| 5,0 implica em valores acima de 2,5 e menores ou
iguais a 5,0. Por exemplo, alunos que tiraram 5,0 so contabilizados
somente no segundo intervalo (2,5 --| 5,0), assim como aqueles
que tiraram 7,5 pontos entram somente na terceira classe (5,0
--| 7,5). Veja tambm o smbolo |--|, ele s pode ser usado no
primeiro subintervalo e possibilita que incluamos o valor 0,0 na
primeira classe (0,0 |--| 2,5). Se no fizssemos isso, no teramos
onde colocar a frequncia de valores iguais a zero. Eventualmente
voc poder se deparar com tabelas construdas com o smbolo
invertido, |--, que indica valores maiores ou iguais ao nmero
colocado esquerda e menores que o valor colocado direita. Por
exemplo, 30 |-- 40 implica valores maiores ou iguais a 30 e menores
que 40. Usei a notao --| que o padro usado pelo Excel na
construo de histogramas (figura 14).
Lembre-se de que o total, a soma da coluna Frequncia, deve
ser exatamente o tamanho da amostra (n). Alm da coluna de
frequncia absoluta, podemos calcular a frequncia relativa ou
percentual de cada classe (em relao ao total de valores) e
042
unidade 2
Lembre-se de que
o total, a soma da
coluna Frequncia,
deve ser exatamente
o tamanho da
amostra (n).
ESTATSTICA E PROBABILIDADES
PERCENTUAL
PERCENTUAL ACUMULADO
35
29%
29%
22
18%
48%
5%
53%
8%
60%
3%
63%
12
10%
73%
10
8%
82%
10
8%
90%
5%
95%
5%
100%
Total 120
100%
043
unidade 2
ESTATSTICA E PROBABILIDADES
044
unidade 2
Grfico de Pareto:
Esta ferramenta
tima para ajudar
na definio de
prioridades, quando
precisamos fazer
um plano de ao
para melhoria de
qualidade de um
servio ou produto.
ESTATSTICA E PROBABILIDADES
045
unidade 2
ESTATSTICA E PROBABILIDADES
046
unidade 2
ESTATSTICA E PROBABILIDADES
FIGURA 18 Box-plot com as taxas de aprovao de oito disciplinas de ciclo bsico de cursos
de Engenharia: Desenho e Estatstica se destacam das outras disciplinas, que tm taxas de
aprovao bem menores e mais heterogneas. Clculo Integral a disciplina com menor taxa de
aprovao e maior variabilidade dos dados.
Sntese tabular
de dados
Na anlise exploratria de dados, em ltima instncia, todos os
resultados so apresentados ou na forma de figuras ou de tabelas.
Assim como nos grficos, invista no ttulo da tabela e sempre
coloque respostas claras para pelo menos quatro perguntas: O
que? Quem? Quando? Onde? Sugerimos que a interpretao das
informaes na tabela tambm seja colocada no prprio ttulo. Se
necessrio, coloque notas explicativas, usando siglas somente
para coisas realmente conhecidas. A tabela 4 um exemplo de
formato de tabelas, apresentando modelo para sntese de variveis
categricas de uma base de dados.
047
unidade 2
ESTATSTICA E PROBABILIDADES
CATEGORIA
FREQUNCIA
Conceito
Instituio privada
1509
32%
Instituio pblica
3164
68%
Sexo
Turno
3520
Sntese numrica
de dados
A sntese numrica de variveis categricas muito simples, basta
que voc apresente suas categorias, a frequncia de valores em
cada categoria e os respectivos percentuais, tal como apresentado
na tabela 3. J a sntese de variveis quantitativas mais ampla e
envolve resumir dois aspectos:
1. um valor tpico ou caracterstico para a varivel;
2. uma medida do grau de variabilidade ou de disperso
dos dados.
PERCENTUAL
1.
048
unidade 2
75%
ESTATSTICA E PROBABILIDADES
049
unidade 2
ESTATSTICA E PROBABILIDADES
30 + 40
= 35
2
050
unidade 2
Se mdia e mediana
forem semelhantes,
ento usar a mdia
para representar os
dados.
ESTATSTICA E PROBABILIDADES
Isso mesmo, essas pessoas tm, em mdia, 1,4 filhos! Voc deve
estar se perguntado, como assim... um e 0,4 filho? No existe
051
unidade 2
ESTATSTICA E PROBABILIDADES
0-1,4 =
-1,4
1-1,4 =
-0,4
1-1,4 =
-0,4
2-1,4 =
+0,6
3
3-1,4 =
+1,6
Resduo
0-1,4 =
-1,4
1-1,4 =
-0,4
1-1,4 =
-0,4
2-1,4 =
+0,6
3-1,4 =
+1,6
Resduo elevado
ao quadrado
(-1,4)2 =
(-0,4)2 =
(-1,4)2 =
(+0,6)2 =
(+1,6)2 =
0,16
0,36
1,96
0,16
052
unidade 2
2,56
ESTATSTICA E PROBABILIDADES
053
unidade 2
ESTATSTICA E PROBABILIDADES
054
unidade 2
muito comum, ao
divulgarmos uma
sntese de uma
varivel quantitativa,
apresentarmos a sua
mdia, seguida do
seu desvio padro no
formato ( X = s ).
ESTATSTICA E PROBABILIDADES
CV
CV <= 20% Dados com pouca variabilidade, bem comportados, homogneos. A varivel
tem um comportamento bem previsvel.
20 < CV <= 30% Dados com variabilidade intermediria.
CV > 30% Dados com muita variabilidade, heterogneos. A varivel tem um
comportamento muito imprevisvel.
CV > 100% Neste caso, o desvio padro maior que a mdia. Dados com variabilidade
extrema, muito heterognea. A varivel tem um comportamento catico,
completamente imprevisvel.
Fonte: Elaborado pelo autor.
2,1
11,5
x 100 = 19%;
0,8
x 100 = 36%;
2,2
055
unidade 2
ESTATSTICA E PROBABILIDADES
056
unidade 2
ESTATSTICA E PROBABILIDADES
057
unidade 2
ESTATSTICA E PROBABILIDADES
Alm de grficos, tabelas com a sntese numrica dos dados coletados no estudo
tambm foram apresentadas no artigo. O uso dessas ferramentas estatsticas
de anlise de dados mostrou de forma inequvoca que valia a pena implementar
aes como o Clculo Zero, pois o fato de se ofertar essa disciplina afetava o
resultado dos alunos nas disciplinas obrigatrias de Clculo Diferencial e GAAL.
Esse um exemplo real de como usar a anlise exploratria dos dados e
outras tcnicas de Estatstica e Probabilidades para se entender a fundo
um problema, resolvendo-o e se tornando um especialista na rea.
Referncia:
XLI CONGRESSO BRASILEIRO DE EDUCAO EM ENGENHARIA, 2013. Avaliao
do Impacto do Clculo Zero no Desempenho de Alunos Ingressantes de Cursos
de Engenharia. Paran: FADEP, 2013. Disponvel em: <http://www.fadep.br/
engenharia-eletrica/congresso/pdf/116280_1.pdf>. Acesso em 14 maio 2015.
058
unidade 2
ESTATSTICA E PROBABILIDADES
Reviso
Vimos nesta unidade os principais tpicos da anlise exploratria
de dados, tambm denominada de Estatstica Descritiva:
Sntese grfica: Uma figura vale mais que mil palavras! Isso
verdade, entretanto um grfico vale mais que mil palavras se e
somente se ele for desenhado de forma clara, correta e concisa.
Sempre desenhe grficos a partir de seus dados, mas tente fazlos de tal forma que a frase basta olhar para entender seja vlida.
Os grficos mais teis para anlise de dados de experimentos de
pequeno e mdio porte na rea de Cincias Exatas e Engenharia
so: grficos de pizza, barras, colunas, linha, sries histricas,
histograma, grfico de Pareto, grfico misto, de coluna e de linha,
diagrama de disperso e box-plot. Na prtica devemos construir
grficos usando ferramentas computacionais como o Excel.
Sntese tabular de dados: Na anlise exploratria de dados, em
ltima instncia, todos os resultados so apresentados ou na forma
de figuras ou de tabelas. Assim, invista no ttulo da tabela e sempre
coloque respostas claras para pelo menos quatro perguntas: O
que? Quem? Quando? Onde? Tambm sugiro que a interpretao
das informaes na tabela seja colocada no prprio ttulo. Se
necessrio, coloque notas explicativas, usando siglas somente para
coisas realmente conhecidas.
Sntese numrica: O resumo de uma varivel categrica muito
simples, basta que voc apresente suas categorias, a frequncia
de valores em cada categoria e os respectivos percentuais. J a
sntese de variveis quantitativas mais ampla e envolve resumir
dois aspectos:
1. Um valor tpico ou caracterstico para a varivel, que
definido pela mdia ( X ) e pela mediana (Md). Se mdia
e mediana forem semelhantes, ento a mdia deve ser
usada para representar os dados. Entretanto, caso haja
059
unidade 2
Na anlise
exploratria de
dados, em ltima
instncia, todos
os resultados so
apresentados ou na
forma de figuras ou
de tabelas.
ESTATSTICA E PROBABILIDADES
060
unidade 2
Introduo
teoria de
probabilidades
Introduo
A origem da teoria das probabilidades comumente associada
questes colocadas por MR (1607-1684) a PASCAL (16231662). Todavia, existem autores que sustentam que o clculo das
probabilidades iniciou-se na Itlia, com PACCIOLI (1445-1514),
CARDANO (1501-1576), TARTAGLIA (1499-1557) e GALILEO (15641642), dentre outros.
Contudo, foi ADOLPHE QUTELET (1796 1874) o pioneiro na
tarefa de mensurar, ou seja, quantificar uma pequena amostra do
universo de interesse da investigao, almejando inferir sobre toda
a populao em estudo, baseando-se em anlises probabilsticas e
embasando-se em rigorosos mtodos cientficos.
A teoria das probabilidades, porm, s comea a fazer sentido
nas engenharias por volta de 1930, quando surgem os primeiros
trabalhos prticos destinados aos engenheiros. O primeiro foi
executado pelo matemtico WILLIAM GOSSET (1876 1937), com
a aplicao das probabilidades no Controle de Qualidade em uma
fbrica de cervejas.
Probabilidade
clssica e
probabilidade
frequentista
Leis bsicas de
probabilidade
Unio e
interseo de
eventos
Tabelas de
contingncia
Eventos
independentes
Teorema de
Bayes
Reviso
ESTATSTICA E PROBABILIDADES
A teoria das
probabilidades
A teoria das probabilidades nasce na Idade Mdia com os
tradicionais jogos de azar existentes na Corte. Jogos de
cartas e dados, ou mesmo os lanamentos de moeda so
classificados como fenmenos que envolvem o acaso, assim
como a maioria dos jogos esportivos. Uma aplicao direta
da teoria das probabilidades no campo das Engenharias o
processo de deciso, seja para aumentar o investimento ou
cortar despesas, no qual o profissional do mercado de trabalho
deve arriscar-se mantendo os ps no cho.
Evento
Aleatrio
(E)
qualquer
subconjunto
espao amostral.
064
unidade 3
de
um
ESTATSTICA E PROBABILIDADES
065
unidade 3
ESTATSTICA E PROBABILIDADES
Probabilidade
clssica e
probabilidade
frequentista
A probabilidade de realizao de um evento A dada pelo quociente
entre o nmero de ocorrncias de A pelo nmero de eventos
possveis, ou seja:
P(A)=
nmero de orcorrncias de A
espao amostral ()
066
unidade 3
ESTATSTICA E PROBABILIDADES
Existem
duas
restries
aplicao
da
definio
da
Leis bsicas de
probabilidades
Para qualquer evento E de um espao amostral : 0 P ( E ) 1;
P ( ) = 1;
P ( Ac ) = 1 - P ( A ), sendo Ac o evento complementar ao evento A;
067
unidade 3
A probabilidade pode
ser resumida como
o quociente do que
se quer pelo que se
tem.
ESTATSTICA E PROBABILIDADES
DESCRIO MATEMTICA
(AB)C=A(BC)
(AUB)UC=AU(BUC)
Comutatividade
AB = BA
AUB = BUA
Distributividade
(AB)UC=(AUC)(BUC)
(AUB)C=(AC)U(BC)
Absoro
ACB AB=A
ACB AB=B
Modulares
A = A
A =
A =
A =A
Leis de De Morgan
Dupla negao
As operaes
com os eventos
utilizam as mesmas
propriedades
matemticas.
AB = AUB
AUB = AB
A=A
Unio e interseo
de eventos
A unio de dois eventos A e B, indicada por A U B, o evento que
contm todos os elementos de A e todos os elementos de B.
P(AUB)=P(A)+P(B)-P(AB)
P ( A U B ) = P ( A ) + P ( B ), se A e B so mutuamente exclusivos;
068
unidade 3
ESTATSTICA E PROBABILIDADES
AB
TOTAL
Positivo
156
139
37
12
344
Negativo
28
25
65
Total
184
164
45
16
409
069
unidade 3
ESTATSTICA E PROBABILIDADES
Eventos mutuamente
exclusivos no
a mesma
coisa de eventos
independentes.
Tabelas de
contingncia
As tabelas de contingncia so aplicadas na avaliao do
relacionamento das categorias com respeito aos grupos segundo
dois modos: independncia ou homogeneidade. Ou seja, eventos
com dupla entrada.
A aplicao de tabela de contingncia dois por dois dada quando
n elementos, selecionados aleatoriamente de uma populao, so
classificados em duas categorias. Depois dos elementos serem
classificados, um tratamento aplicado e alguns so examinados
novamente e classificados nas duas categorias. O que se almeja
saber : o tratamento alterou significativamente a proporo de
objetos em cada uma das duas categorias?
070
unidade 3
ESTATSTICA E PROBABILIDADES
REFRIGERANTE
TOTAL
Bom
1190
795
1985
Defeito
10
15
Total
1200
800
2000
071
unidade 3
ESTATSTICA E PROBABILIDADES
Eventos
independentes
Um ou mais eventos pode (m) ser classificado (s) como
independente (s) quando a realizao de um dos eventos no afeta
a probabilidade de ocorrncia do outro, e vice-versa.
Quando dois eventos so independentes, P ( A B ) = P ( A ) . P ( B ).
Teorema
de Bayes
A probabilidade condicional, ou seja, as chances de um evento A
ocorrer, dado que outro evento B ocorreu, dada por:
P(A|B)=
P(A B)
P(B)
para P ( B ) > 0.
O teorema de Bayes prope que, se os eventos E1,E2,,En so
parties do espao amostral , ento:
P ( Ei | B ) =
P ( B | Ei ) . P ( Ei )
P(B)
072
unidade 3
Um ou mais
eventos pode (m)
ser classificado (s)
como independente
(s) quando a
realizao de um dos
eventos no afeta
a probabilidade de
ocorrncia do outro,
e vice-versa.
ESTATSTICA E PROBABILIDADES
Numa sala de aula, sabe-se que 10% dos homens e 2% das mulheres
tm mais de 1,80 m. A sala tem 70% de mulheres e 30% de homens. Um
estudante foi escolhido aleatoriamente, e constatou-se que tem mais de
1,80 m. Qual a probabilidade de que seja homem?
0,10 . 0,70
= 0,9211
0,10.0,70+0,02.0,30
073
unidade 3
ESTATSTICA E PROBABILIDADES
074
unidade 3
ESTATSTICA E PROBABILIDADES
c) P ( defeitocerveja ) =
400
0,2.1000 + 0,2 * 1000
=
1000 + 1000
2000
= 0,20
075
unidade 3
= 0,0850 = 0,5
0,1700
ESTATSTICA E PROBABILIDADES
Reviso
A teoria das probabilidades utilizada em todas as reas do
conhecimento. Ela visa auxiliar o profissional no mercado de
trabalho a predizer valores futuros, estimando as chances de
ocorrncia de um evento antes que ele ocorra.
Para calcular a probabilidade, basta dividir o que se quer pelo que
se tem, ou seja:
076
unidade 3
= 0,0150 = 0,1875
0,0800
ESTATSTICA E PROBABILIDADES
Filmes
A Probabilidade Estatstica do Amor Primeira Vista (Adaptado)
Jennifer E. Smith
Com uma certa atmosfera de Um dia, mas voltado para o pblico jovem
adulto, a probabilidade estatstica do amor primeira vista uma histria
romntica, capaz de conquistar fs de todas as idades. Quem imaginaria
que quatro minutos poderiam mudar a vida de algum? Mas exatamente
o que acontece com Hadley. Presa no aeroporto em Nova York, esperando
outro voo depois de perder o seu, ela conhece Oliver. Um britnico fofo,
que se senta a seu lado na viagem para Londres. Enquanto conversam
sobre tudo, eles provam que o tempo , sim, muito, muito relativo. Passada
em apenas 24 horas, a histria de Oliver e Hadley mostra que o amor,
diferentemente das bagagens, jamais se extravia.
077
unidade 3
ESTATSTICA E PROBABILIDADES
078
unidade 3
Modelos
probabilsticos
Introduo
Assim como a Matemtica, tambm a Estatstica apresenta
funes que norteiam o comportamento de suas variveis, como
as retas, parbolas e hiprboles. Na Estatstica temos os modelos
probabilsticos. Esses modelos so funes paramtricas que
descrevem o comportamento de uma varivel em estudo.
Variveis
aleatrias
Modelos
probabilsticos
Distribuio
binomial
Distribuio
Possion
Distribuio
normal
Reviso
ESTATSTICA E PROBABILIDADES
Variveis
aleatrias
O estudo das variveis aleatrias de suma importncia nas
engenharias ou mesmo em qualquer outra rea do conhecimento
tcnico e cientfico. Isso porque, nem sempre, os dados que
compem o estudo estatstico so nmeros, sendo necessrio
descobrir um meio de transform-los em nmeros, a partir de uma
funo chamada de varivel aleatria, visando facilitar a estimativa
das medidas estatsticas.
Probabilidade
Seja um experimento aleatrio qualquer de um espao amostral e um
espao de probabilidades P. Ento a varivel aleatria X no espao de
probabilidade uma funo real definida no espao amostral , tal que
( X x ) um evento aleatrio para qualquer x real.
As
variveis
aleatrias
podem
ser
classificadas
como
081
unidade 4
As variveis
aleatrias podem
ser classificadas
como contnuas
ou discretas, de
acordo com o
domnio da varivel
abordada no
estudo.
ESTATSTICA E PROBABILIDADES
Variveis discretas
funo P ( x ) aquela nas quais se associam probabilidades aos
valores da varivel aleatria X abordada no estudo estatstico.
Ou seja, quando uma varivel aleatria X assume os valores
x1,x2,x3,,xn com as respectivas probabilidades p ( x1 ), p ( x2 ), p (
x3 ) ,, p ( xn ) definidas por uma P ( X ), na qual a soma de todas
as possveis probabilidades igual a um, conforme apresentado
na tabela 7, ou seja:
TABELA 7 - Distribuio de probabilidades discretas
X
x1 x2 x3 ... xn
P (X) p ( x1 ) p ( x2 ) p ( x3 ) ... p ( xn )
Fonte: Elaborado pelo autor.
E (x) = xi . p ( xi )
i =1
082
unidade 4
O valor esperado,
indicado por
E (x) = , a mdia
de uma varivel
discreta.
ESTATSTICA E PROBABILIDADES
Var ( x ) = E ( x2 ) - [ E ( x ) ] 2
sendo E ( x ) o valor esperado, e E (x2 ) dada por:
E ( x2 ) = x12 . p ( x1 ) + x22. p ( x2 ) + x32 . p ( x3 ) + ... + xn2 . p ( xn )
n
E ( x2 ) = xi . p ( xi )
i =1
DP ( x ) =
Var ( x )
P(Y)
Valores associados
varivel Y
Probabilidade conjunta
P ( X, Y )
Probabilidade
marginal de Y
P(X)
Probabilidade marginal de X
083
unidade 4
Pois P (X,Y)
uma f.d.p.
ESTATSTICA E PROBABILIDADES
p ( xi ) = p ( x1) + ( x2 ) + p ( x3 ) + ... + p ( xn ) = 1
i =1
P(X)
Valores associados
varivel X
Probabilidade conjunta
P ( X, Y )
Probabilidade
marginal de X
P(Y)
Probabilidade marginal de Y
E ( X, Y ) = xi . yj . p ( xi , yj )
i =1 j =1
084
unidade 4
Pois P (X,Y)
uma f.d.p.
ESTATSTICA E PROBABILIDADES
Portanto,
E ( X, Y ) = a . d . p ( a , d ) + b . d . p ( b, d ) + c . d . p ( c, d ) + a . e . p ( a, e ) + b . e . p ( b , e ) +
+ c . e . p ( c, e ) + a . f . p ( a, f ) + b . f . p ( b, f ) + c . f . p ( c, f )
Para a tabela de distribuio a seguir:
TABELA 10 - Distribuio discreta
X
P (a, d )
P ( b, d)
P ( c, d )
P(d)
P ( a, e )
P ( b, e )
P ( c, e )
P(e)
P ( a, f )
P ( b, f )
P ( c, f )
P(f)
P(X)
P ( a )
P ( b )
P(c)
Variveis contnuas
uma funo f ( x ) aquela nas quais se associam probabilidades
aos infinitos valores da varivel aleatria X, abordada no estudo
estatstico. Ou seja, quando uma varivel aleatria X assume
infinitos valores em um determinado intervalo ( a, b ), sendo a
probabilidade igual a zero para valores fora desse intervalo e a
soma de todas as possveis probabilidades contidas nesse intervalo
igual a um. Portanto, para as variveis contnuas, temos que:
f (x) 0, x R;
+ oo
P(Y)
- oo
P ( a x b) = f ( x ) dx
a
(probabilidade correspondente
085
unidade 4
ESTATSTICA E PROBABILIDADES
E (x) =
x .f ( x ) dx
a
E ( x ) = x2 . f ( x ) dx
2
f ( x, y ) d x d y =1
E ( X, Y ) =
x . y . f ( x, y ) d x d y
086
unidade 4
A covarincia
para as variveis
contnuas ou
discretas, ou seja, a
medida estatstica
que possibilita
verificar se as
variveis envolvidas
na anlise so
diretamente ou
inversamente
proporcionais.
ESTATSTICA E PROBABILIDADES
Cov ( X, Y ) = E ( X, Y ) - E ( X ) . E ( Y )
Sendo -1 X,Y 1.
Var ( x ) = 2
E(a)=a
Var ( a ) = 0
E(ax)=a.E(x)
Var ( a x ) = a2 . Var ( x )
E(abx)=ab.E(x)
E(axby)=a.E(x)b.E(y)
087
unidade 4
ESTATSTICA E PROBABILIDADES
Modelos
probabilsticos
Assim como na Matemtica, temos os modelos que representam
o comportamento da varivel abordada no estudo, ou seja,
as retas, parbolas e hiprboles dentre tantas outras funes
matemticas. Na Estatstica, os modelos probabilsticos descrevem
o comportamento de uma varivel, sendo possvel calcular
a probabilidade associada aos eventos da varivel abordada
no estudo, recorrendo apenas aos modelos probabilsticos.
Esses modelos so chamados de distribuies, apresentando
particularidades prprias que facilitam a sua identificao, podendo
ser divididos em contnuos e discretos, assim como as variveis
A distribuio
binomial denotada
por X~Bin ( n; p ),
sendo n o nmero
de amostragens
(tentativas) e p
a probabilidade
de sucesso do
experimento.
Distribuio
binomial
A distribuio binomial denotada por X~Bin ( n; p ), sendo
n o nmero de amostragens (tentativas) e p a probabilidade
de sucesso do experimento. Trata-se de uma distribuio
discreta, aplicada em casos dicotmicos, ou seja, experimentos
aleatrios com apenas duas possibilidades de resposta,
denotadas por sucesso ou falha. Podemos citar como exemplo
o lanamento de uma moeda, um item ter defeito ou no, um
funcionrio faltar ou no.
Para se caracterizar como distribuio binomial, a varivel aleatria
abordada no estudo deve ter:
a. n tentativas ou provas independentes, ou seja, eventos
sem reposio;
088
unidade 4
ESTATSTICA E PROBABILIDADES
n
n-x
P ( X = x ) = ( x ). px. ( 1 - p )
n
n
sendo: ( x ) a combinao de n elementos x a x, ou seja: ( x ) =
n!
e p a probabilidade de sucesso.
( n- x) ! . x!
Distribuio
Poisson
A distribuio Poisson denotada por X~Poisson (), sendo
1
a taxa mdia, ou seja, = e sendo tambm sempre
inversamente proporcional ao intervalo de tempo ou espao
definido no problema. Portanto, o seu valor deve corresponder
ao tamanho do intervalo apresentado. Assim, para qualquer
089
unidade 4
A distribuio
binomial
amplamente
aplicada para avaliar
probabilidades de
eventos relacionados
com controle de
qualidade, mercado
de aes, risco de
aplices de seguro,
anlise demogrfica
e vendas, dentre
outras inmeras
situaes de controle
da variabilidade
inerente ao processo
produtivo.
ESTATSTICA E PROBABILIDADES
P(X=x)=
e- . x
x!
Distribuio
normal
A distribuio normal denotada por X~Normal (; 2 ), sendo
o valor esperado, ou seja, a mdia da distribuio normal e a
varincia dadas por:
E ( x ) = e Var ( x ) = 2, respectivamente.
Por diversas razes, tanto na teoria quanto na prtica, a distribuio normal
a mais importante das distribuies de probabilidade. Isso porque muitas
variveis no mundo real tm comportamento bastante aproximado dessa
distribuio. Sua relevncia pode ser destacada pelo fato de:
090
unidade 4
A distribuio
Poisson pode ser
aplicada como
um caso limite da
binomial, quando
o tamanho da
amostra em eventos
dicotmicos maior
que 30.
ESTATSTICA E PROBABILIDADES
1 - No toca o eixo x.
2 - S tem uma moda.
091
unidade 4
A distribuio
amostral de
muitas estatsticas
tenderem
distribuio normal,
em face do teorema
do limite central.
ESTATSTICA E PROBABILIDADES
x-
092
unidade 4
ESTATSTICA E PROBABILIDADES
093
unidade 4
ESTATSTICA E PROBABILIDADES
P(X)
0,10
0,30
0,40
3
0,20
094
unidade 4
ESTATSTICA E PROBABILIDADES
Reviso
A distribuio discreta usada em casos cujos dados analisados podem
ser alocados em uma tabela de probabilidades, sendo que aquelas
localizadas no centro da tabela so classificadas como probabilidade
conjunta e as localizadas nas laterais, como probabilidades marginais.
Probabilidades marginais so aquelas que correspondem a apenas
uma das variveis em estudo, e as probabilidades conjuntas so as
que correspondem a duas variveis analisadas concomitantemente.
A distribuio contnua usada em casos cujos dados analisados
podem ser alocados em um intervalo contnuo.
No que tange as distribuies de probabilidade, cabe ressaltar:
TABELA 13 - Reviso das medidas de tendncia central
LIMITAES
DISTRIBUIO
Binomial
QUANDO USAR
Poisson
Normal
Para estudar mais sobre os contedos abordados nessa unida, sob perspectiva aplicada, consulte as
obras sugeridas abaixo.
MOORE, David. A estatstica bsica e sua prtica. Rio de Janeiro. LTC, 2014.
Para uma fundamentao matemtica mais aprofundada sobre o assunto, consulte a seguinte obra:
MONTGOMERY, Douglas; RUNGER, George Estatstica aplicada e probabilidade para engenheiros. 3 ed.
Rio de Janeiro: LTC, 2009.
095
unidade 4
Estimao de
mdias
e propores
Introduo
Nas unidades anteriores, voc estudou trs grandes reas do
mtodo estatstico: amostragem e coleta de dados; anlise
exploratria de dados; e teoria de probabilidades. A partir de agora,
voc vai entender como essas reas se relacionam para construir a
quarta rea do mtodo estatstico, que a deciso na presena de
incerteza ou estatstica inferencial.
A estatstica inferencial recebe esse nome por ser um conjunto de
mtodos e tcnicas que permitem, a partir dos dados provenientes
de uma amostra, inferir informaes sobre toda a populao alvo
do estudo. Logicamente existe uma incerteza associada a esse
processo, mas ela quantificada atravs dos nveis de confiana
e margens de erro do estudo. Essa a grande contribuio da
estatstica inferencial, permitir que se conhea o nvel de incerteza
da informao antes de tomar decises.
Existe uma infinidade de tcnicas de estatstica inferencial,
como os intervalos de confiana, testes de hipteses
paramtricos e no paramtricos, anlises de correlao
e regresso, dentre outras. Para que voc tenha noo da
quantidade de tcnicas, imagine que exista um curso de
graduao em Estatstica com durao de quatro anos em
que o aluno passa a maior parte do tempo estudando tcnicas
de estatstica inferencial. E ainda assim esse tempo no
suficiente para estudar todas as tcnicas!
Teorema
central do limite
Estimao
pontual e por
intervalos de
confiana para
uma mdia
populacional
Estimao
pontual e por
intervalos de
confiana para
uma proporo
populacional
Uso do Excel
no clculo de
intervalos
de confiana
para mdia e
proporo
Introduo ao
programa EpiInfo
Reviso
ESTATSTICA E PROBABILIDADES
Teorema central
do limite
Imagine a seguinte situao: um engenheiro de produo deseja
monitorar um processo de produo de fibra sinttica de maneira
a garantir que a caracterstica de qualidade resistncia trao
esteja sempre dentro dos limites de especificao. conhecido
que a resistncia trao das fibras produzidas naquela empresa
normalmente distribuda com mdia de 75 psi (libras fora por
polegada quadrada) com desvio-padro de 3,5 psi.
Como no vivel medir a caracterstica de qualidade em todas
as peas produzidas (inspeo 100%) ele decidiu coletar amostras
periodicamente para verificar se no houve alterao na mdia
do processo. Acontece que cada vez que ele coleta uma amostra
e obtm a mdia dessa amostra existe uma variao, ou seja,
as mdias das amostras so sempre diferentes. A dvida : o
engenheiro pode afirmar que houve alterao na mdia do processo
(de todas as peas produzidas) ou a variao devida simplesmente
uma flutuao amostral?
O teorema central do limite (TCL) poder auxiliar o engenheiro a
interpretar os resultados dessas amostras e resolver a dvida. O
TCL diz que quando trabalhamos com amostras e calculamos
mdias, as mdias das amostras so normalmente distribudas
em torno da verdadeira mdia populacional. Isso acontece porque,
exatamente pelo fato de serem baseadas em sorteio aleatrio, as
amostras so sempre diferentes e, se calcularmos ento a mdia
em cada amostra, bem difcil encontrarmos exatamente os
mesmos valores.
Entretanto, apesar de as amostras serem diferentes e terem mdias
diferentes, se selecionarmos vrias amostras e obtivermos suas
mdias, podemos fazer um histograma dessas mdias. Ao realizar
esse procedimento poderemos ver que, medida que aumentamos
099
unidade 5
ESTATSTICA E PROBABILIDADES
z=
X-
n .
EXEMPLO
Pensando no exemplo das fibras sintticas, chamamos de X a
varivel aleatria resistncia trao das fibras. Sabemos que a
mdia 75 psi e o desvio-padro 3,5 psi. Encontre a probabilidade
de uma amostra aleatria de n = 25 fibras ter uma resistncia mdia
menor que 73,6 psi.
Note que a distribuio amostral de
psi e um desvio-padro de
X = = 3,5 = 0,7 psi
n 25
100
unidade 5
ESTATSTICA E PROBABILIDADES
padronizao:
z=
73,6 - 75
= -2
35
25
Ento,
P(
normal padro).
O resultado acima indica que a probabilidade de selecionar
uma amostra de fibras e obter resistncia mdia menor
que 73,6 psi de 2,28%. Na Unidade 7 veremos que essa
probabilidade pode ser considerada baixa e, portanto, de posse
dessa informao, o engenheiro poderia adotar o seguinte
critrio: ao observar uma amostra de fibras com resistncia
mdia menor que 73,6 psi, o processo deve ser verificado.
101
unidade 5
ESTATSTICA E PROBABILIDADES
Distribuio amostral
de X para n = 2
102
unidade 5
Distribuio amostral
de X para n = 30
ESTATSTICA E PROBABILIDADES
Estimao pontual
e por intervalos de
confiana para uma
mdia populacional
Neste tpico, voc vai aprender a obter uma estimativa para mdia
populacional e calcular a preciso dessa estimativa. Voc vai
entender por que apresentar a margem de erro e o nvel de confiana
da pesquisa to importante quanto apresentar a estimativa
pontual para mdia. Aps a leitura deste tpico, voc ter um novo
olhar sobre as estatsticas que lhe so apresentadas diariamente
em jornais ou revistas.
Considere que uma montadora desenvolveu um novo modelo e est
elaborando a ficha tcnica do veculo. Uma informao relevante
para o cliente o consumo mdio de combustvel. Sabe-se que
o consumo est relacionado ao tipo de combustvel (etanol ou
gasolina ), maneira de conduzir, ao tipo de via (cidade ou estrada),
qualidade do combustvel, dentre outras variveis. O consumo
pode variar tambm entre os veculos de mesmo modelo, por
essa razo podemos tratar o consumo de combustvel como uma
varivel aleatria.
103
unidade 5
ESTATSTICA E PROBABILIDADES
ETANOL (KM/L)
GASOLINA (KM/L)
Cidade
8,7
12,5
Estrada
10,4
15,2
para estimar , o
pode ser
104
unidade 5
ESTATSTICA E PROBABILIDADES
E = Z
/ n
2
Onde:
z 2 est relacionado ao nvel de confiana desejado para o estudo;
o desvio-padro populacional da varivel aleatria X;
n o tamanho da amostra coletada.
O nvel de confiana do estudo definido pelo valor de z2 que
pode ser obtido da tabela da distribuio normal padro. O nvel de
confiana dado em valor percentual e deve ser sempre inferior
a 100%. Chamamos significncia () o percentual restante, de
maneira que confiana + significncia = 100%. Por exemplo, para
um estudo com 95% de confiana, o valor de ser 5%. O valor de z
105
unidade 5
ESTATSTICA E PROBABILIDADES
/ n
2
35
= 1,325
IC [ ; ( 100 - ) % ] =
106
unidade 5
ESTATSTICA E PROBABILIDADES
Exemplo:
Para os dados da tabela 21, supondo que o desvio-padro para o
consumo de etanol na estrada seja de 2 km/l, obtenha o intervalo de
95% para o verdadeiro consumo mdio.
Soluo:
Para resolver a questo acima, podemos utilizar a equao:
IC [ ; 95% ] =
E = Z
/ n
2
Logo:
E = 1,96 *
2
= 0,663
35
Ento:
IC [ ; 95% ] = 10,4 0,663
O intervalo comumente apresentado como segue:
IC [ ; 95% ] = [ 9,737 ; 11,063 ]
Dessa forma, afirmamos com 95% de confiana que o consumo
mdio de etanol na estrada para o novo modelo de veculo est
entre 9,737 km/l e 11,063 km/l.
107
unidade 5
ESTATSTICA E PROBABILIDADES
quando
trabalhamos
com
grandes
amostras
) normalmente
108
unidade 5
Felizmente, quando
trabalhamos com
grandes amostras
( n > 30 ), o desviopadro amostral
(s) uma boa
aproximao para
o desvio-padro
populacional (),
o que possibilita
a utilizao
da equao
apresentada para o
clculo da margem
de erro.
ESTATSTICA E PROBABILIDADES
ser normal
109
unidade 5
ESTATSTICA E PROBABILIDADES
Exemplo:
Uma equipe de engenharia est desenvolvendo uma nova
mistura para concreto e deseja estimar a resistncia mdia
do produto compresso. Como o teste de resistncia
compresso um ensaio destrutivo, o mximo que a equipe
conseguiu para realizao do estudo foram 10 corpos de prova.
A resistncia mdia compresso da amostra foi de 2.500 psi
e o desvio-padro foi de 45 psi. Sabendo que a resistncia do
concreto compresso segue uma distribuio normal, obtenha
uma estimativa intervalar para a verdadeira resistncia mdia
populacional com 95% de confiana.
110
unidade 5
ESTATSTICA E PROBABILIDADES
Soluo:
Observe que o tamanho da amostra pequeno, n = 10, e o desviopadro foi obtido da amostra (no conhecemos o desvio-padro
populacional). Nesse caso, para construir o intervalo de confiana,
necessrio utilizar a distribuio t-student e a margem de erro deve
ser calculada utilizando a equao:
E = t ( 2 ; n - 1)
/
Onde t
111
unidade 5
ESTATSTICA E PROBABILIDADES
Estimao pontual
e por intervalos
de confiana para
uma proporo
populacional
Como so calculadas as margens de erro das pesquisas eleitorais?
Possivelmente no incio da unidade voc tenha ficado instigado a
descobrir como feito esse clculo. Antes de dar incio, preciso
entender que as pesquisas eleitorais buscam descobrir o percentual
de eleitores que so favorveis ao candidato A ou B, e esses
percentuais so tratados na estatstica como propores.
Para simplificar os clculos, vamos pensar em uma eleio que foi
para o segundo turno e, portanto, tem apenas dois candidatos. Uma
empresa de pesquisa entrevistou 2.500 eleitores quanto inteno
de voto nos candidatos A e B. Note que "candidato" uma varivel
qualitativa, e o que queremos descobrir como estimar a probabilidade
112
unidade 5
ESTATSTICA E PROBABILIDADES
113
unidade 5
ESTATSTICA E PROBABILIDADES
E = Z
/
2
pq
n
E= 1,96
0,52 0,48
2.500
= 0,0196
114
unidade 5
ESTATSTICA E PROBABILIDADES
Exemplo:
A empresa XYZ compra tubos de ao do fornecedor A. Na ltima
semana, a XYZ recebeu uma proposta de comprar tubos de ao do
fornecedor B pela metade do preo do fornecedor A. Para decidir,
o gerente de compras deseja estimar qual o percentual de no
conformidade nos tubos do fornecedor B (proporo de tubos
defeituosos). Em um lote de 150 tubos havia 21 no conformes.
Obtenha o intervalo de 90% de confiana para a verdadeira
proporo de tubos no conformes do fornecedor B.
Soluo:
Uma estimativa pontual para a verdadeira proporo de tubos no
conformes dada por:
p = 21 = 0,14
150
Verificamos que a aplicao do teorema central do limite adequada,
= 21 e n . q = 150 * 0,86 = 129, ou seja, ambos so maiores
pois n . p
que 5, indicando que a amostra suficientemente grande. Podemos
estimar a margem de erro do estudo pela equao:
E = Z
E = 1,645
/2 pq
n
0,14 0,86
= 0,047
150
115
unidade 5
ESTATSTICA E PROBABILIDADES
Uso do Excel no
clculo de intervalos
de confiana para
mdia e proporo
Agora que voc j sabe exatamente como so obtidos os intervalos
de confiana, vamos utilizar o Excel para construir uma calculadora
de intervalos de confiana. Comearemos pelo intervalo para mdia.
Nos tpicos anteriores, vimos que o intervalo de confiana para a
mdia populacional pode ser obtido de duas maneiras: utilizando
a distribuio normal (estatstica z) ou a distribuio t-student
(estatstica t). Vimos tambm que a distribuio t-student
utilizada quando o tamanho da amostra menor que 30 e o desviopadro populacional desconhecido. Nos outros casos, utilizamos
a distribuio normal.
Vamos construir primeiramente uma calculadora para intervalos de
confiana utilizando a distribuio normal. Utilizaremos os dados
sobre consumo de combustvel do primeiro exemplo.
A figura a seguir ilustra como deve ficar nossa calculadora nas
colunas A e B.
116
unidade 5
O intervalo de
confiana para a
mdia populacional
pode ser obtido
de duas maneiras:
utilizando a
distribuio normal
(estatstica z)
ou a distribuio
t-student
(estatstica t).
ESTATSTICA E PROBABILIDADES
117
unidade 5
ESTATSTICA E PROBABILIDADES
intervalo o valor de
de
+ E.
Para construir a calculadora para amostras pequenas e desviopadro populacional desconhecido, vamos utilizar os dados
do exemplo sobre a resistncia do concreto compresso.
O procedimento o mesmo do anterior, alterando apenas as
informaes relativas aos parmetros da distribuio t-student:
FIGURA 30 - Calculadora para intervalo de confiana para mdia:
amostras pequenas e desvio-padro populacional desconhecido
118
unidade 5
ESTATSTICA E PROBABILIDADES
p.qn =
119
unidade 5
ESTATSTICA E PROBABILIDADES
Introduo ao
programa EpiInfo
O software EpiInfo uma ferramenta muito til para anlise de
dados. Esse software foi desenvolvido pelo Centro de Controle de
Doenas (CDC) para anlise de dados epidemiolgicos, entretanto
pode ser utilizado em qualquer rea, inclusive em engenharia. O
software est disponvel no site www.cdc.gov/epiinfo
Veja no material web da disciplina os vdeos de instalao do EpiInfo
e de introduo anlise de dados utilizando essa ferramenta.
120
unidade 5
ESTATSTICA E PROBABILIDADES
IC [ ;99% ] = x E
E = Z
/ n
2
Logo:
E = 2,575 *
0,02
40
= 0,008
Ento:
IC [ ; 99% ] = 74,045 0,008
O intervalo comumente apresentado como segue:
IC [ ;99% ] = [ 74,037 ; 74,053]
Dessa forma, afirmamos com 99% de confiana que o dimetro mdio dos
anis est entre 74,037 milmetros e 74,053 milmetros.
Reviso
Nesta unidade, voc aprendeu a construir estimativas pontuais e por
intervalos para os verdadeiros parmetros populacionais atravs de
dados provenientes de amostras. Aprendeu tambm que existem
ao menos quatro maneiras de obter estimativas intervalares, e que
a escolha da maneira adequada para cada situao determinada
basicamente pelo tipo de dados (qualitativo ou quantitativo) e
pelo tamanho da amostra ( n < 30 ou n 30 ). O esquema abaixo
apresenta de maneira resumida o processo de deciso:
121
unidade 5
ESTATSTICA E PROBABILIDADES
Qualitativo parmetro p
Amostra grande ( n 30 )
Aplicvel quando np 5 e nq 5
O intervalo de
confiana pode ser
obtido pela equao 4.
122
unidade 5
ESTATSTICA E PROBABILIDADES
123
unidade 5
Planejamento de
experimentos
Introduo
Na Unidade 5, Estimao de mdias e propores, voc aprendeu
a estimar parmetros populacionais a partir de dados amostrais.
Voc deve ter observado que os resultados amostrais foram
disponibilizados, mas no foram apresentados os mtodos
utilizados para seleo das amostras ou sequer a justificativa para
o tamanho amostral. Nesta unidade voc vai aprender a planejar
um experimento de pequeno e mdio porte na rea de Engenharia
e Cincias Exatas, bem como calcular o tamanho mnimo de uma
amostra que tenha representatividade estatstica.
Uma situao que utiliza o planejamento de experimentos muito
frequentemente o estudo dos efeitos do tratamento trmico de
metais sobre suas propriedades mecnicas. Considere que uma
equipe de engenharia deseja estudar o efeito de trs diferentes
tipos de banho de tmpera sobre a dureza de um determinado tipo
de ao. Os tipos de banho de tmpera utilizados so tmpera em
1
Clculo de
tamanho de
amostra baseado
em intervalos de
confiana para
uma proporo
Clculo de
tamanho de
amostra baseado
em intervalos de
confiana para
uma mdia
Planejamento
de experimentos
Planejamento
de experimentos
- terminologia
bsica
Reviso
ESTATSTICA E PROBABILIDADES
Clculo de
tamanho de
amostra baseado
em intervalos de
confiana para
uma proporo
Para alguns pesquisadores, a definio do tamanho da amostra
o nico cuidado necessrio para validade estatstica do estudo.
Como voc observou na introduo dessa unidade, existe uma srie
de cuidados que devem ser tomados ao conduzir experimentos em
engenharia, alm do tamanho da amostra. A comear pelo objetivo
do estudo.
Se o objetivo do estudo comparar resultados expressos em forma
de porcentagens ou propores, existe um mtodo adequado para
o clculo do tamanho amostral. Se o objetivo comparar resultados
expressos em forma de mdias, existe outro mtodo adequado para
o clculo do tamanho amostral. Diversos outros fatores podem ser
considerados nestes clculos, alterando, assim, a adequao de
cada mtodo.
Neste tpico voc aprender a calcular o tamanho amostral para um
estudo que tem o interesse de estimar uma proporo populacional.
Os parmetros controlados so o nvel de confiana e a margem de
erro mxima desejados para o estudo. Vejamos um exemplo:
Exemplo 8
Uma empresa fabricante de motores deseja comprar correias do
fornecedor Borracho, pois o atual fornecedor tem apresentado
127
unidade 6
Se o objetivo do
estudo comparar
resultados expressos
em forma de
porcentagens
ou propores,
existe um mtodo
adequado para o
clculo do tamanho
amostral.
ESTATSTICA E PROBABILIDADES
n=
2
Z/2 pq
E2
Onde:
n: o tamanho da amostra calculado
z2 : escore z que separa uma rea de /2 na cauda direita da
distribuio normal padro
uma estimativa da verdadeira proporo populacional.
p:
q : obtido por 1-p
E: a margem de erro mxima aceitvel para o estudo.
Note que a equao acima exige que se tenha um
conhecimento prvio da verdadeira proporo populacional.
Esse pressuposto pode no ser satisfeito na prtica. Nesse
e a equao
caso, deve-se utilizar o valor 0,5 no lugar de p,
passa a ser:
128
unidade 6
ESTATSTICA E PROBABILIDADES
Desconhecendo estimativa de p
n=
Z/220,25
E2
n=
129
unidade 6
ESTATSTICA E PROBABILIDADES
130
unidade 6
Para o clculo do
tamanho amostral,
o resultado deve ser
sempre arredondado
para cima,
independentemente
do valor decimal.
ESTATSTICA E PROBABILIDADES
n=
(z/ )2
Npq
2
(z/2)2 + (N - 1) E2
pq
n=
n=
n=
131
unidade 6
ESTATSTICA E PROBABILIDADES
Clculo de tamanho de
amostra baseado em
intervalos de confiana
para uma mdia
No incio dessa unidade falamos que o clculo do tamanho amostral
depende de vrios fatores, sendo o principal deles o objetivo do
estudo. Nesta seo voc aprender a calcular o tamanho amostral
para um estudo que tem o interesse de estimar uma mdia
populacional. Os parmetros controlados continuam sendo o nvel
de confiana e a margem de erro mxima desejados para o estudo.
Vejamos um exemplo:
Exemplo 9
Uma empresa fabricante de baterias automotivas desenvolveu
um novo produto e deseja estimar a sua vida mdia. De estudos
anteriores, sabe-se que a vida mdia das baterias produzidas
por esse fabricante segue uma distribuio normal, com desviopadro de seis meses. A equipe de engenharia do produto ressalta
a importncia da correta estimao da vida mdia da bateria, pois
a partir desta ser determinado o tempo de garantia. Por essa
razo, decidiu-se que o nvel de confiana do estudo ser de 99%
e a margem de erro mxima aceitvel para a estimativa de trs
meses. Utilizando a equao abaixo, a equipe poder determinar o
tamanho amostral necessrio para atender s exigncias do estudo.
Equao 4: Tamanho de amostra exigido para estimativa de uma
mdia populacional
n=
Z(/2)
E
132
unidade 6
ESTATSTICA E PROBABILIDADES
Onde:
n: o tamanho da amostra
Z/2: escore z que separa uma rea de /2 na cauda direita da
distribuio normal padro
: o desvio-padro populacional
E: a margem de erro mxima aceitvel para a estimativa.
Utilizando a equao 4, a equipe determinou que para estimar a
vida mdia da nova bateria desenvolvida, com 99% de confiana na
estimativa e margem de erro mxima de trs meses, ser necessria
uma amostra de 27 baterias.
n=
{ 2,5753 x 6 }
Devemos sempre
arredondar o
resultado para cima.
n = 26,5 27
Ao calcular tamanho de amostra para estimativa de uma mdia
populacional, continua valendo aquela regra de arredondamento
apresentada no tpico anterior, ou seja, devemos sempre arredondar
o resultado para cima.
Voc deve ter observado no exemplo 9 que j dispnhamos de
uma estimativa a priori do desvio-padro populacional (), ou seja,
a equipe utilizou o desvio-padro das outras baterias. Em muitas
situaes prticas, o desvio-padro populacional no conhecido e
nesses casos pode-se utilizar uma das seguintes alternativas:
1. Utilizao da regra emprica da amplitude para estimao
do desvio-padro: Amplitude4. Para aplicao
dessa alternativa, necessrio coletar uma amostra
piloto de aproximadamente 87 observaes. Para maior
133
unidade 6
ESTATSTICA E PROBABILIDADES
N2 (Z/2)2
(N - 1) E2 + 2(Z/2)2
Exemplo 10
Suponha que o exrcito brasileiro deseje encomendar uma remessa
de uniformes para os novos recrutas. Para melhor adequao dos
tamanhos dos uniformes, o sargento decidiu obter uma estimativa
da altura mdia deles. Dos 100 novos recrutas, o sargento deseja
134
unidade 6
ESTATSTICA E PROBABILIDADES
n=
[ 1,965 x 30 ]
n = 139
Sem entender o que havia feito de errado, o sargento decidiu
conversar com um soldado que tinha conhecimento de estatstica
para auxili-lo. O soldado informou ento que, neste caso, o
sargento deveria utilizar a equao 5, que leva em considerao o
tamanho populacional. Utilizando o mtodo adequado, o sargento
decidiu, portanto, que para estimar a altura mdia dos 100 novos
recrutas, com 95% de confiana e margem de erro mxima da
estimativa de cinco cm, era necessria uma amostra de 59 recrutas:
n=
Planejamento de
experimentos
O planejamento de experimentos, tambm conhecido como
DOE (Design of Experiments), um conjunto de tcnicas
estatsticas que visa garantir uma coleta de dados eficiente
para uma anlise de dados que seja informativa e confivel.
Esse conjunto de tcnicas tem vasta utilizao em diversas
135
unidade 6
O planejamento
de experimentos,
tambm conhecido
como DOE (Design
of Experiments),
um conjunto de
tcnicas estatsticas
que visa garantir
uma coleta de
dados eficiente
para uma anlise
de dados que
seja informativa e
confivel.
ESTATSTICA E PROBABILIDADES
136
unidade 6
O objetivo do DOE
identificar quais
so os fatores
que atuam sobre
o processo, quais
desses fatores
so controlveis
e, dentre os
controlveis, qual
a relao que tm
com o resultado
do processo ou
a caracterstica
de qualidade de
interesse.
ESTATSTICA E PROBABILIDADES
Entradas
SISTEMA
(PRODUTO/PROCESSO
Fatores controlveis
(especificados pelo pesquisador)
Fonte: WERKEMA & AGUIAR, p.15, 2006. Adaptado.
137
unidade 6
Y
Varaveis resposta
(Caractersticas de
Qualidade)
ESTATSTICA E PROBABILIDADES
138
unidade 6
As rplicas so
repeties do
experimento
feitas sob as
mesmas condies
experimentais.
ESTATSTICA E PROBABILIDADES
139
unidade 6
Chamamos de
blocos os conjuntos
homogneos
de unidades
experimentais.
ESTATSTICA E PROBABILIDADES
FORNECEDOR B
FORNECEDOR C
FORNECEDOR D
Tc. 1
Tc. 1
Tc. 1
Tc. 1
Tc. 2
Tc. 2
Tc. 2
Tc. 2
Tc. 3
Tc. 3
Tc. 3
Tc. 3
Tc. 4
Tc. 4
Tc. 4
Tc. 4
Planejamento de
experimentos terminologia bsica
Agora que voc j aprendeu quais so os princpios bsicos do DOE,
vamos aprender alguns termos comuns e muito teis para o bom
planejamento do experimento. Sero apresentados seis termos
bsicos, a saber: Unidade Experimental, Fatores, Nveis de um
Fator, Tratamento, Ensaio e Varivel Resposta (ou desfecho). Para
140
unidade 6
ESTATSTICA E PROBABILIDADES
141
unidade 6
Os Nveis de
um fator so os
diferentes modos
de presena de um
fator no estudo
considerado.
ESTATSTICA E PROBABILIDADES
C. Observe que a unidade experimental seria cada um dos parachoques sobre os quais aplicaramos os distintos tratamentos.
Definimos como Ensaio cada realizao do experimento em uma
determinada condio de interesse (tratamento), ou seja, ao aplicar
um tratamento a uma unidade experimental, realizamos um ensaio.
No nosso exemplo sobre a resistncia compresso do concreto,
cada ensaio consiste em produzir um corpo de prova utilizando
determinada tcnica de mistura do concreto.
No exemplo sobre os mtodos de pintura de para-choques
automotivos, um ensaio seria aplicar um tratamento em uma
unidade experimental (para-choque), por exemplo, pintar um parachoque por Imerso usando tinta A.
Por fim, o termo Varivel Resposta, voc j conheceu nas unidades
anteriores, nada mais que o resultado de interesse registrado aps
a realizao de um ensaio. No exemplo sobre as tcnicas de mistura
do concreto, a varivel resposta a resistncia compresso do corpo
de prova produzido com cada uma das tcnicas de mistura. J no
exemplo sobre os mtodos de pintura de para-choques automotivos,
a varivel resposta fora de adeso da tinta sobre o para-choque,
medida aps a aplicao da tinta com cada mtodo de aplicao e tipo
de tinta.
Considere que voc tenha uma mquina de secar roupas que trabalha
com diferentes nveis de temperatura e deseja determinar o efeito do nvel
de temperatura sobre o tempo de secagem das roupas.
a. Defina para essa situao cada um dos seis termos bsicos.
b. O que seria uma rplica nesse estudo?
c. Descreva um vis de amostragem que poderia ser resolvido
pela aleatorizao.
142
unidade 6
ESTATSTICA E PROBABILIDADES
143
unidade 6
ESTATSTICA E PROBABILIDADES
Reviso
Nesta unidade voc aprendeu que, para calcular o tamanho
amostral, diversos fatores devem ser levados em considerao.
Em especial voc aprendeu a calcular o tamanho amostral em
quatro situaes: quando o objetivo do estudo a estimativa de
uma proporo populacional, sendo o tamanho populacional finito
ou infinito. E quando o objetivo do estudo a estimativa de uma
mdia populacional, novamente, sendo o tamanho populacional
finito ou infinito. O quadro abaixo resume essas situaes:
QUADRO 4 - Equaes para clculo de tamanho amostral segundo objetivos do estudo
Estimar uma proporo populacional
n=
pq
(Z/2)
E2
(Z/ )2
Nqp
2
n=
(Z/ )2 + (N - 1) E2
pq
2
144
unidade 6
N2 (Z/2)2
(N - 1) E2 + 2(Z/2)2
ESTATSTICA E PROBABILIDADES
145
unidade 6
ESTATSTICA E PROBABILIDADES
146
unidade 6
Testes de
Hipteses
Introduo
O teste de hipteses uma tcnica estatstica utilizada para avaliar
alguma afirmao feita sobre uma populao de interesse atravs
de dados amostrais. Por exemplo: um engenheiro pode estar
interessado em avaliar a hiptese de que o tempo de durao de
um fusvel seja de 1.000 horas, contra a hiptese de que tal valor
seja diferente de 1.000 horas. Essa seria uma afirmao sobre uma
mdia, uma vez que a varivel de interesse tempo de durao
quantitativa. Nesse caso, o objetivo testar se a hipottica mdia
de 1.000 horas verdadeira.
No exemplo em questo, seria impraticvel observar o tempo de
durao de todos os fusveis fabricados, ou seja, da populao
de interesse. De forma que necessria a utilizao de dados
amostrais. O engenheiro poderia selecionar alguns fusveis, calcular
o valor da mdia e comparar com o valor proposto de 1.000 horas.
Voc ir aprender que, alm de avaliar afirmaes sobre mdias,
as hipteses estatsticas tambm podem ser testadas para outros
parmetros de interesse, como propores (em caso de variveis
categricas), desvio-padro, medianas, etc.
A construo
e o significado
de uma hiptese
estatstica
Testes para uma
amostra
Testes para
duas ou mais
amostras
Reviso
ESTATSTICA E PROBABILIDADES
A construo e
o significado de
uma hiptese
estatstica
Uma hiptese estatstica pode ser construda a partir de alguma teoria
sobre determinado assunto, ou atravs de alguma afirmao sobre
certo parmetro da populao em anlise. No caso do engenheiro
interessado em testar se o tempo mdio de durao de um fusvel
1.000 horas, a hiptese no se deu atravs de uma teoria, mas
possivelmente em funo da experincia dele com o assunto.
Um teste estatstico tem como objetivo o fornecimento de
evidncias para subsidiar a deciso de rejeitar ou no rejeitar uma
hiptese sobre algum parmetro de uma populao atravs de
dados obtidos por uma amostra.
A afirmao sobre a mdia populacional tida como a hiptese
nula. Damos o nome de hiptese alternativa afirmao contrria
da hiptese nula.
Exemplo 11
Um fabricante afirma que o tempo mdio de secagem da tinta de
sua marca de 30 minutos. Uma pessoa decide testar se essa
149
unidade 7
Damos o nome de
hiptese alternativa
afirmao contrria
da hiptese nula.
ESTATSTICA E PROBABILIDADES
150
unidade 7
Nvel de
significncia:
Consiste na
probabilidade de
rejeitar a hiptese
nula, dado que ela
verdadeira.
ESTATSTICA E PROBABILIDADES
Testes para
uma amostra
A distribuio da estatstica de teste tende para o formato de uma
distribuio normal quando o tamanho da amostra relativamente
grande (geralmente maior ou igual a 30). Se o tamanho da amostra
for pequeno (menor do que 30) e o desvio-padro for desconhecido,
a distribuio da estatstica de teste apresenta formato mais
prximo da distribuio t de Student. Essa informao importante
porque definir at que valor da estatstica de teste a hiptese deve
ser rejeitada.
151
unidade 7
Se o tamanho da
amostra for pequeno
(menor do que 30)
e o desvio-padro
for desconhecido,
a distribuio da
estatstica de teste
apresenta formato
mais prximo da
distribuio t de
Student.
ESTATSTICA E PROBABILIDADES
Exemplo 12
Uma indstria realiza o empacotamento do produto caf em
gros. Um dos objetivos que a embalagem contenha 500
gramas de caf. natural que em situaes como essa exista
alguma variao no peso do produto empacotado. Dessa forma,
podem ter pacotes com 498 gramas, com 502 gramas, com 501
gramas, com 499 gramas, ou qualquer outro valor prximo do
especificado. No entanto, a indstria geralmente trabalha para
que exista certa margem de aceitao tanto para cima quanto
para baixo, devido aos seguintes fatores:
pacotes com volume muito alto podem provocar aumento
exagerado de custos;
pacotes com peso muito abaixo dos 500 gramas
podem provocar sanes indstria junto aos rgos
de fiscalizao.
Para certificar de que o peso esteja dentro da margem aceitvel,
pode ser invivel verificar todos os produtos embalados (ou
seja, toda a populao de interesse). Nesse contexto, tornase interessante utilizar amostras para testar se o processo
encontra-se dentro de padres aceitveis, ou seja, para testar
se o processo encontra-se sobre controle.
Suponha que um profissional especializado em controle
estatstico de processos resolva fazer esse teste. Nesse
caso, o objetivo testar a hiptese de que o processo
esteja sob controle, ou seja, que o peso mdio do caf aps
empacotamento seja de 500 gramas. Para a operacionalizao
do teste, 36 pacotes foram inspecionados (pesados). Sabendo
que a mdia obtida atravs dessa amostra foi de 502 gramas,
e que o desvio-padro foi de 3 gramas, podemos afirmar que o
processo est sob controle?
Para operacionalizar esse teste, devemos seguir as seguintes etapas:
152
unidade 7
ESTATSTICA E PROBABILIDADES
1 e
tapa: Estabelea as hipteses de interesse
No caso em estudo, o parmetro2 a ser testado a mdia. Temos o
interesse em verificar se ela igual a 500 gramas. Ento devemos
estabelecer as hipteses nula e alternativa. Dessa forma, as
hipteses so:
H0: = 500 gramas
H1: 500 gramas
Note que o teste refere-se mdia populacional e no amostral.
A mdia amostral ser utilizada como base para tomar a deciso
sobre rejeio ou no rejeio da hiptese nula.
2 etapa: Obteno da estatstica de teste
O valor mdio obtido pela amostra foi:
2-U
m parmetro refere-se determinada medida que caracterize a populao de
interesse. Os parmetros mais frequentemente investigados atravs dos testes
de hipteses so: a mdia, o desvio-padro, no caso de variveis quantitativas e a
proporo, no caso de variveis categricas.)
3-A
variabilidade amostral ocorre porque existem chances de tomarmos tanto
amostras parecidas com a populao de interesse quanto amostras pouco
semelhantes populao. Qualquer processo de amostragem sujeita-se a essa
situao. Cabe ao pesquisador levar esse fato em considerao ao construir um
teste de hipteses
153
unidade 7
Os parmetros mais
frequentemente
investigados
atravs dos testes
de hipteses
so: a mdia, o
desvio-padro, no
caso de variveis
quantitativas e
a proporo, no
caso de variveis
categricas.)
ESTATSTICA E PROBABILIDADES
x = n
154
unidade 7
ESTATSTICA E PROBABILIDADES
502 - 500
= 4,0
3/36
155
unidade 7
ESTATSTICA E PROBABILIDADES
4-O
bserve pela Figura 35 que 34% + 13,5% = 47,5%. Ao multiplicarmos esse valor
por dois, obtemos os 95%.
156
unidade 7
ESTATSTICA E PROBABILIDADES
157
unidade 7
ESTATSTICA E PROBABILIDADES
158
unidade 7
ESTATSTICA E PROBABILIDADES
4 etapa: Concluso
Com base nos valores obtidos pela estatstica de teste e pela
regio de rejeio, tomamos uma deciso em relao hiptese
nula. No caso em questo, a deciso rejeit-la, pois o valor 4
desvios-padro (relativo aos 2 gramas de distncia entre a mdia
amostral e a mdia populacional proposta na hiptese nula) pode
ser considerado muito longe da mdia, uma vez que se encontra na
parte vermelha do diagrama. A estatstica de teste no valor de 4,00
maior do que o valor crtico de + 1,96 (nmero obtido na tabela da
Figura 37, que serve de referncia para rejeio ou no rejeio da
hiptese nula).
Exemplo 13
Um processo foi delineado para fabricar bancadas de tamanho
igual a 120 centmetros. Para verificar se o processo encontra-se
sob controle, um especialista coletou uma amostra de 64 peas.
Foi obtida uma mdia amostral
-
s/n
159
unidade 7
ESTATSTICA E PROBABILIDADES
5-O
valor 0,10 refere-se aos 10% escolhidos como nvel de significncia pelo
pesquisador. Tal valor consiste na probabilidade de rejeitar a hiptese nula, dado
que ela verdadeira, ou seja, probabilidade de tomar uma deciso equivocada em
relao hiptese.
160
unidade 7
ESTATSTICA E PROBABILIDADES
161
unidade 7
ESTATSTICA E PROBABILIDADES
4 etapa: Concluso
Como o valor de Z = 1,00 obtido pela estatstica de teste no supera
a valor crtico de 1,645, ou seja, no pertence regio crtica, no
rejeitamos a hiptese nula. No podemos descartar a hiptese de
que a mdia seja 120 centmetros. Portanto, h indcios de que o
processo encontra-se sob controle.
162
unidade 7
ESTATSTICA E PROBABILIDADES
- = 10,2 - 10,0
0,2/16 = 4,0
s/n
163
unidade 7
ESTATSTICA E PROBABILIDADES
4 etapa: Concluso
Como o valor 4,0 obtido pela estatstica de teste supera a valor
crtico 2,13 obtido pela distribuio t, rejeitamos a hiptese de que a
mdia seja de 10 milmetros. Portanto, o processo encontra-se fora
de controle.
164
unidade 7
ESTATSTICA E PROBABILIDADES
Sp =
(1 -)
n
Z=
p-
Sp
165
unidade 7
Quando trabalhamos
com variveis
quantitativas, o
principal parmetro
de interesse
costuma ser a
mdia.
ESTATSTICA E PROBABILIDADES
= 0,004286 = 0,0655
(1n -) = 0,30 (149- 0,30) = 0,21
49
p-
sp
166
unidade 7
ESTATSTICA E PROBABILIDADES
4 etapa: Concluso
O valor - 0,53, obtido pela estatstica de teste, encontra-se fora da
regio de rejeio, sendo prximo de zero e longe do valor crtico de
-1,96. Dessa forma, no rejeitamos a hiptese nula. Portanto, no
h indcios de que a proporo de trabalhadores estressados na
empresa estudada seja diferente de 30%.
No prximo tpico voc ver situaes em que o pesquisador
tem como interesse comparar os valores dos parmetros de
duas amostras.
167
unidade 7
Temos um teste
de hiptese para a
comparao de duas
mdias ou de duas
propores.
ESTATSTICA E PROBABILIDADES
Z=
s21 s22
+
n1 n2
s s
+
n1 n2
2
1
2
2
80 - 88
6 10
+
50 40
2
-8
36 100
+
50 40
-8
-8
-8
= 1,7944 = -4,46
3,22
0,72 + 2,5
168
unidade 7
ESTATSTICA E PROBABILIDADES
Z=
2
p 1 - p
p (1 - p) + p (1 - p)
n1
n2
169
unidade 7
ESTATSTICA E PROBABILIDADES
170
unidade 7
ESTATSTICA E PROBABILIDADES
171
unidade 7
ESTATSTICA E PROBABILIDADES
Reviso
Nessa unidade aprendemos os fundamentos dos testes de
hipteses. O principal objetivo deles contrapor uma hiptese de
interesse, conhecida como hiptese nula, a uma hiptese contrria,
conhecida como hiptese alternativa, em relao a um parmetro
de interesse (geralmente a mdia, no caso de variveis quantitativas
e a proporo, no caso de variveis categricas).
As hipteses podem ser unilaterais ou bilaterais. No primeiro caso, a
hiptese nula de igualdade contrape-se hiptese alternativa, em
que o sinal de menor ou maior. No caso dos testes bilaterais, na
hiptese alternativa temos o sinal de diferente. Todos os exemplos
dessa unidade focaram em testes bilaterais.
Para definir o tipo de teste a ser utilizado, levamos em considerao
o tamanho da amostra e o conhecimento ou no do desvio-padro
populacional. Quando desconhecemos o desvio-padro e a amostra
tem tamanho inferior a 30, utilizamos o teste t. No caso de conhecer
o desvio-padro populacional ou a amostra igual ou superior a 30,
utilizamos o teste Z. O nome do teste ocorre em funo da distribuio
da estatstica de teste, que construda atravs do conjunto de
possveis amostras, o que conhecido como distribuio amostral.
172
unidade 7
ESTATSTICA E PROBABILIDADES
173
unidade 7
Anlise de
correlao e
regresso
Introduo
Ao analisar um conjunto de dados, podemos ter interesse no
relacionamento entre duas variveis quantitativas. Dessa forma,
poderamos traar o seguinte questionamento: um aumento no valor
da varivel X se relaciona a um aumento na varivel Y? Qual seria a
magnitude dessa relao? As tcnicas de anlise de correlao e
anlise de regresso podem ser utilizadas para estudos desse tipo.
A relao entre variveis quantitativas pode ser modelada
atravs de anlise de correlao e regresso. Com a evoluo da
informtica nos ltimos 20 anos, essas tcnicas tm sido cada vez
mais utilizadas no ambiente empresarial.
Nesta unidade, voc aprender a desenvolver clculos para
correlao e regresso tanto passo a passo como atravs do
software Microsoft Excel.
Anlise de
correlao
Regresso
linear simples
Regresso
linear mltipla
Reviso
ESTATSTICA E PROBABILIDADES
Anlise de
correlao
Quando temos interesse em investigar o quanto duas variveis
quantitativas esto associadas, podemos utilizar uma medida
conhecida como coeficiente de correlao.
Diagrama de disperso
Antes de calcular a correlao entre duas variveis, interessante
representar os dados num diagrama de disperso.
176
unidade 8
O coeficiente de
correlao mede o
grau de intensidade
do relacionamento
linear entre
duas variveis
quantitativas.
ESTATSTICA E PROBABILIDADES
800
700
600
500
400
300
200
100
0
50
100
150
200
6-A
ssociao negativa: Duas variveis apresentam associao negativa quando o
crescimento de uma se associa diminuio da outra, ou o contrrio, a queda em
uma se associa ao acrscimo da outra.
177
unidade 8
250
300
ESTATSTICA E PROBABILIDADES
80
70
60
Y
50
40
30
20
10
0
0
10
X
178
unidade 8
15
20
ESTATSTICA E PROBABILIDADES
15
14
14
13
13
12
12
11
11
10
0
10
X
179
unidade 8
15
20
ESTATSTICA E PROBABILIDADES
Cor ( X, Y ) = r =
( x -x ) ( y - y )
sxsy ( n - 1)
X - Temperatura ( Celsius) 100 110 120 130 140 150 160 170 180 190
Y - Resultado (porcentagem) 45
51
54
61
66
70
74
78
85
89
Calcule o coeficiente de correlao entre as variveis.
Soluo:
Ao realizar uma anlise de correlao, interessante construir o
diagrama de disperso para ter uma ideia sobre a associao entre
as variveis:
180
unidade 8
ESTATSTICA E PROBABILIDADES
100
90
Y - Resultado (%)
80
70
60
50
40
30
20
10
0
0
50
100
150
200
X - Temperatura ( C)
Fonte: HINES et al (2006), pag.369
( )
100 - 145 = -45
110 - 145 = -35
120 - 145 = -25
130 - 145 = -15
140 - 145 = -05
150 - 145 = +05
160 - 145 = +15
170 - 145 = +25
180 - 145 = +35
190 - 145 = +45
( )
45 - 67,3 = -22,3
51 - 67,3 = -16,3
54 - 67,3 = -13,3
61 - 67,3 = -06,3
66 - 67,3 = -01,3
70 - 67,3 = +02,7
74 - 67,3 = +06,7
78 - 67,3 = +10,7
85 - 67,3 = +17,7
89 - 67,3 = +21,7
= 1
Cor ( X, Y ) = r =
( )( )
(-45) (-22,3) = 1003,5
(-35) (-16,3) = 570,5
(-25) (-13,3) = 332,5
(-15) (-6,3) = 94,5
(-5) (-1,3) = 6,5
(5) (2,7) = 13,5
(15) (6,7) = 100,5
(25) (10,7) = 267,5
(35) (17,7) = 619,5
(45) (21,7) = 976,5
3985
3985
=
= + 0,99
( 30,3) (14,7) (10 -1)
4008,7
181
unidade 8
( )( ) =
3985
ESTATSTICA E PROBABILIDADES
Preo (X)
Quantidade (Y)
10
11
12
13
14
15
16
17
18
19
200 171 168 165 170 147 120 130 105 124
Soluo:
Antes de calcular o coeficiente de correlao, interessante
construir o diagrama de disperso para ter uma ideia da direo e
da forma da associao entre as variveis.
FIGURA 49 - Quantidade x preo
220
Y - Quantidade
200
180
160
140
120
100
8
10
12
14
X - Preo
182
unidade 8
16
18
20
ESTATSTICA E PROBABILIDADES
( )
-4,5
-3,5
-2,5
-1,5
-0,5
0,5
1,5
2,5
3,5
4,5
( )
50
21
18
15
20
-3
-30
-20
-45
-26
-747
=
( 3,0) (29,6) (10 -1)
-225
-73,5
-45
-22,5
-10
-1,5
-45
-50
-157,5
-117
( )(
) =
=1
Cor ( X, Y ) = r =
( )( )
-747
= - 0,93
799,2
183
unidade 8
-747
ESTATSTICA E PROBABILIDADES
184
unidade 8
ESTATSTICA E PROBABILIDADES
Regresso
linear simples
A regresso linear simples tem como objetivo estimar uma equao
que relacione matematicamente duas variveis, sendo que uma
delas explicada pela outra. A varivel explicada geralmente
denominada varivel resposta ou varivel dependente. A varivel
explicativa denominada varivel explanatria ou varivel
independente.
A anlise de regresso mltipla tem por objetivo estimar uma
equao que relacione matematicamente uma varivel resposta a
duas ou mais variveis explicativas.
A figura 51 reapresenta os dados relativos figura 45 onde a varivel
resposta VALOR se correlaciona REA DO IMVEL.
FIGURA 51 - Valor do imvel x rea do imvel
185
unidade 8
ESTATSTICA E PROBABILIDADES
Onde:
Yi = valor da varivel dependente na i-sima tentativa, ou observao;
0 = primeiro parmetro da equao de regresso, o qual indica o
intercepto no eixo Y, ou seja, o valor de Y quando X = 0;
1= segundo parmetro da equao de regresso, chamado
coeficiente angular, que indica a inclinao da reta de regresso;
i = o valor do erro, que significa a diferena entre o valor verdadeiro
e o valor previsto pela equao de regresso ( a letra grega
psilon). Aps a estimao da equao de regresso, o erro
passa a ser denominado resduo.
Os parmetros 0 e 1 no modelo de regresso linear so estimados
pelos valores 0 e 1 que se baseiam nos dados amostrais. O
chapu sobre as letras indica que foi feita uma estimativa dos
186
unidade 8
Mtodo dos
mnimos quadrados:
uma tcnica
estatstica utilizada
para resumir um
conjunto de variveis
quantitativas numa
equao.
ESTATSTICA E PROBABILIDADES
^
^ ^
Y = 0+ 1X
^
o = Y - ^ 1X
Exemplo 20
Um professor acredita que a NOTA na prova de estatstica esteja
relacionada ao nmero de HORAS DE ESTUDO dos alunos. Para
tentar convencer os estudantes dessa relao, o professor resolve
fazer a pesquisa levantando dados de sete estudantes, conforme o
quadro abaixo.
187
unidade 8
A anlise de
regresso se
distingue da
correlao por supor
uma relao de
causalidade entre as
variveis resposta e
explanatria.
ESTATSTICA E PROBABILIDADES
Estudante
1
2
3
4
5
6
7
Horas de
estudo (X)
20
15
35
26
30
24
18
Nota na
prova (Y)
72
62
87
77
90
83
68
Estudante
1
2
3
4
5
6
7
Horas de
estudo (X)
20
15
35
26
30
24
18
MDIA (X) = 24
Nota na
prova (Y)
72
62
87
77
90
83
68
MDIA(Y) = 77
X.Y
400
225
1225
676
900
576
324
2
X = 4.326
1440
930
3045
2002
2700
1992
1224
XY = 13.333
188
unidade 8
ESTATSTICA E PROBABILIDADES
189
unidade 8
ESTATSTICA E PROBABILIDADES
Com a evoluo
da informtica, a
tcnica de regresso
mltipla passou a
ser cada vez mais
utilizada pelas
organizaes e pelos
cientistas, pois os
clculos se tornaram
menos tediosos.
190
unidade 8
ESTATSTICA E PROBABILIDADES
Estatstica de regresso
R mltiplo
0,918
R-Quadrado
0,843
R-quadrado ajustado
0,811
Erro padro
4,470
Observaes
7
191
unidade 8
ESTATSTICA E PROBABILIDADES
ANOVA
gl
Regresso
Resduo
Total
SQ
MQ
F
Valor p
1 536,085 536,085 26,8271 0,00353
5 99,915 19,983
6
636
Interseo
Varivel X 1
A equao estimada :
^
Y = 44,6 +1,35 . X1
192
unidade 8
Stat t
6,88
5,18
valor-P
0,00
0,00
ESTATSTICA E PROBABILIDADES
Na regresso
linear simples, uma
varivel resposta
pode ser explicada
por uma varivel
explanatria.
Regresso
linear mltipla
Na regresso linear simples, uma varivel resposta pode ser
explicada por uma varivel explanatria. Na figura 51, o valor do
imvel pode ser previsto com base no seu tamanho (em metros
quadrados). O valor obtido para o R2 foi de 0,45. Isso significa que
a varivel explanatria X explica 45% da variao na varivel Y. No
exemplo em questo, outras variveis tambm podem ser utilizadas
para explicar melhor a variao de Y (preo do imvel), como por
exemplo a idade do imvel, o preo do condomnio, o nmero de
banheiros, etc.
Dessa forma, na regresso mltipla, uma varivel resposta se
relaciona a duas ou mais variveis explanatrias. O objetivo tambm
predizer os valores de Y com base nas variveis explanatrias.
Na maioria das vezes, uma varivel resposta se relaciona a
mais de uma varivel explanatria. Nessa situao, tambm
193
unidade 8
ESTATSTICA E PROBABILIDADES
194
unidade 8
A estimao
da equao de
regresso linear
mltipla tambm
se d atravs do
mtodo dos mnimos
quadrados.
ESTATSTICA E PROBABILIDADES
195
unidade 8
ESTATSTICA E PROBABILIDADES
Axis Title
Chart
Title
800.000,00
700.000,00
600.000,00
500.000,00
400.000,00
300.000,00
200.000,00
100.000,00
-
y
=
1868,2x
+
239876
R
=
0,55094
Series1
Linear
(Series1)
50
100
150
200
Axis Title
196
unidade 8
250
300
ESTATSTICA E PROBABILIDADES
Soluo
DADOS > ANLISE DE DADOS > REGRESSO > OK
Nos intervalos de entrada e sada, insira o endereo das variveis
explanatria e dependente, respectivamente, assim como foi feito
para a regresso simples. Em seguida, aperte OK.
Aps rodar a regresso mltipla, o Excel produz tabelas. Segue
a primeira:
TABELA 20: Estatsticas da regresso mltipla
197
unidade 8
ESTATSTICA E PROBABILIDADES
gl
2
55
57
SQ
MQ
557.278.841.710 278.639.420.855
360.283.037.601
6.550.600.684
917.561.879.310
F
42,5
Valor p
0,000
Coeficientes
Interseo
86.873
Varivel X 1
1.335
Varivel X 2
67.719
Erro padro
60.689
285
24.091
A equao estimada :
^
Y = 86.873 + 1.335X1 + 67.719X2
Na ltima coluna temos os valores p, que mostram que as variveis
so significativas e o intercepto no, conforme os testes t para
cada coeficiente separadamente. O intercepto no caso no tem
significado prtico nesse exemplo.
198
unidade 8
Stat t
1,43
4,68
2,81
valor-P
0,16
0,00
0,01
ESTATSTICA E PROBABILIDADES
199
unidade 8
ESTATSTICA E PROBABILIDADES
Reviso
A presente unidade tratou do tema relao entre duas ou mais
variveis quantitativas. Foi demonstrado que, para o estudo de duas
variveis quantitativas simultaneamente, faz-se interessante o uso de
diagramas de disperso com o objetivo de inspecionar visualmente
se elas apresentam associao. Devemos observar, principalmente,
a forma, a intensidade e a direo da relao entre as variveis. Alm
disso, tambm importante o clculo do coeficiente de correlao,
que fornece um valor entre 0 e 1, podendo ser negativo no caso de
relacionamento linear inverso entre as variveis.
Outra tcnica bastante interessante para o estudo da relao entre
duas variveis a regresso simples, muito til para fazer previses.
Alm da regresso simples, a regresso mltipla tambm bastante
200
unidade 8
ESTATSTICA E PROBABILIDADES
John,
SIMON,
Gary.
Estatstica
Aplicada:
Economia,
201
unidade 8
ESTATSTICA E PROBABILIDADES
Referncias
BARBETTA, Pedro Alberto, REIS, Marcelo Menezes, BORNIA, Antnio
Cezar. Estatstica: Para Cursos de Engenharia e Informtica. 3 ed. Atlas,
2010. VitalBook file.
BAILAR III, John.C.; MOSTELLER, Frederick. Medical uses of statistics. 2.
ed. Boston: NEJM Books, 1992.
CARVALHO, Danilo Heraldo; COUTO, Brulio Roberto Gonalves Marinho.
Levantamentos por amostragem ou pesquisas de survey. Relatrio
tcnico DCET, N 3/2003. 107p
DAVID M. et al. Estatstica: teoria e aplicaes usando Microsoft Excel
em portugus. 3 ed. Rio de Janeiro: LTC, 2000
DOANE, David, SEWARD, Lori. Estatstica Aplicada Administrao e
Economia. ArtMed, 2010. VitalBook file.
DOWNING, Douglas. Estatstica Aplicada. Trad. Alfedro Alves de Farias:
2ed So Paulo: Saraiva, 2003
FIELD, Andy. Descobrindo a Estatstica Usando o SPSS. 2 ed. Porto
Alegre: ARTMED, 2009. 688p
FORMULRIO GOOGLE DOCS. Disponvel em: <https://docs.google.com/
forms>. Acesso em: 15 abr. 2015
FREUND, John. Estatstica Aplicada Economia. 11 ed. Bookman, 2006.
VitalBook file.
GAZZARRRINI, Rafael. Lotus 1-2-3: o software que ajudou a mudar o
mundo. 18 fev. 2013. In: Site TecMundo. Disponvel em: <http://www.
tecmundo.com.br/tecnologia/36697-lotus-1-2-3-o-software-que-ajudoua-mudar-o-mundo.htm>. Acesso em: 15 abr. 2015
202
ESTATSTICA E PROBABILIDADES
203
ESTATSTICA E PROBABILIDADES
204
www.animaeducacao.com.br