Estatística - Apostila 1 Curso de Engenharia Civil

ESTATÍSTICA – APOSTILA 1
CURSO DE ENGENHARIA CIVIL
Prof. Jorge Santana
Montes Claros
Agosto/2009
I – OS MÉTODOS ESTATÍSTICOS: finalidade e aplicações; conceitos básicos de Estatística.
1 - O que é Estatística?
“Todas as ciências têm suas raízes na história do homem.

A Matemática, que é considerada a ciência que une à clareza do raciocínio a síntese da
linguagem, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário,
empírico.
A Estatística, ramo da Matemática Aplicada, teve origem semelhante.
Desde a antiguidade, vários povos já registravam o número de habitantes, de nascimentos, de
óbitos, faziam estimativas das riquezas individuais e sociais, distribuíam equitativamente terras ao povo,
cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de
estatísticas.
Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas.
A partir do século XVI começaram a surgir às primeiras análises sistemáticas de fatos sociais,
como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números
relativos.
No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente
científica. Godofredo Achenwal batizou a nova ciência (ou método) com o nome de Estatística,
determinando o seu objetivo e suas relações com as ciências.
As tabelas tornaram-se mais completas, surgiram às representações gráficas e o cálculo das
probabilidades, e a Estatística deixou de ser simples catalogação de dados numéricos coletivos para se
tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de partes
desse todo (amostras).
Atualmente, o público leigo (leitor de jornais e revistas) posiciona-se em dois extremos
divergentes e igualmente errôneos quanto à validade das conclusões estatísticas: ou crê em sua
infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os objetivos, o campo e o
rigor do método estatístico; ignoram a Estatística, quer teórica quer prática, ou a conhecem muito
superficialmente.
Na era da energia nuclear, os estudos estatísticos têm avançado rapidamente e, com seus processos
e técnicas, têm contribuído para a organização dos negócios e recursos do mundo moderno.
(...) Exprimindo por meio de números as observações que se fazem de elementos com pelo menos
uma característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os
chamados dados referentes a esses elementos.
Podemos dizer, então, que:
A Estatística é uma parte da Matemática Aplicada que fornece métodos para coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a
análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.
Em geral, as pessoas quando se referem ao termo estatística, o fazem no sentido da organização e
descrição dos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc.),
desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais que
permitam conclusões que transcendam os dados obtidos inicialmente.
Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma
empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento,
produtividade), a formulação de soluções apropriadas e um planejamento objetivo da ação.” (CRESPO
1997).
2
2 – Conceitos básicos de Estatística
2.1 – População
É uma coleção completa de todos os elementos (valores, pessoas, medidas, etc.) a serem estudados.
2.2 – Censo
É uma coleção de dados relativos a todos os elementos da população.
2.3 – Amostra
É um subconjunto da população.
2.4 – Um parâmetro
É uma medida numérica que descreve uma característica da população.
2.5 – Uma estatística

É uma medida numérica que descreve uma característica de uma amostra.
2.6 – Estudo observacional

Tipo de estudo em que se verificam e se medem características específicas, mas não se manipulam nem se
modificam os elementos a serem estudados.
2.7 – Experimento
Tipo de estudo em que se aplica determinado tratamento e observa-se seu efeito sobre os elementos a
serem pesquisados.
3 – VARIÁVEIS: qualitativa (ou categórica) e quantitativa; níveis de mensuração de variáveis.
3.1 – Variável qualitativa (ou categórica)

É expressa por atributos e pode ser separada em diferentes categorias, como por exemplo: sexo
(masculino feminino); cor da pele (branca, preta, amarela, parda); religião (católica, evangélica,
espírita...); etc.
3.2 – Variável quantitativa

É expressa por números que representam contagens ou medidas, como por exemplo: salários, altura, peso,
idade, etc.
3.2.1 – Variável quantitativa discreta

Resulta de um conjunto finito de valores possíveis, ou de um conjunto enumerável desses valores. (Ou
seja, o número de valores possíveis é 0, ou 1, ou 2, etc.)
3.2.2 – Variável quantitativa contínua

Resulta de um número infinito de valores possíveis que podem ser associados a pontos em uma escala
contínua de tal maneira que não haja lacunas ou interrupções.
3
Exemplos: o número de operários de uma grande construção é uma variável quantitativa discreta porque
representa uma contagem; já o peso desses operários é uma variável quantitativa contínua porque
representa mensurações que podem tomar qualquer valor em um intervalo contínuo.
3.3 – Níveis de mensuração de variáveis

É uma forma adicional de se classificarem os dados. Há quatro níveis de mensuração de variáveis:
nominal, ordinal, intervalar e razão.
3.3.1 – Nível nominal

Caracterizado por dados que consistem apenas de nomes, rótulos ou categorias. Os dados não podem ser
dispostos segundo um esquema ordenado (como de baixo para cima).
Exemplos:
 Respostas do tipo “sim”, “não” ou “indeciso”.
 O sexo dos estudantes em uma turma de matemática.
3.3.2 – Nível ordinal

Envolve dados que podem ser dispostos em alguma ordem, mas as diferenças entre os valores desses
dados não podem ser determinadas, ou não tem sentido.
Exemplos:
 Um editor classifica alguns originais como “excelentes”, alguns como “bons” e alguns como “maus”.
(Não podemos determinar uma diferença quantitativa entre “bom” e “mau”, por exemplo).
 Nas olimpíadas de matemática, João foi classificado em 3º; Carlos em 7º e Joana em 10º lugar.
(Podemos determinar a diferença entre os 3º e 7º lugares, mas a diferença de 4 não tem qualquer
significado).
3.3.3 – Nível intervalar

É análogo ao nível ordinal, com a propriedade adicional de que podemos determinar diferenças
significativas entre os dados. Todavia, não existe um ponto de partida zero inerente, ou natural (onde não
haja qualquer quantidade presente). As temperaturas 98,2°F e 98,6°F são exemplos de dados nesse nível
intervalar de mensuração. Os valores se apresentam ordenados, e podemos determinar diferenças entre
eles (em geral chamadas distancias entre os dois valores). Entretanto, não há ponto de partida natural. O
valor 0°F pode parecer um ponto de partida, mas é inteiramente arbitrário, e não representa “ausência de
calor”. É um erro dizer que 50°F é duas vezes mais quente que 25°F.
Exemplos:
 Os anos 1000, 2000, 1776 e 1944. (O tempo não começou no ano zero e, assim, o 0 é arbitrário, e não
um ponto de partida zero natural).
 As temperaturas anuais médias (em graus Celsius) das capitais brasileiras.
3.3.4 – Nível razão

É o nível de intervalo modificado de modo a incluir o ponto de partida zero inerente (onde o zero
significa nenhuma quantidade presente). Para valores nesse nível, tantos as diferenças como as razões têm
significado.
Exemplos:
 Pesos dos artigos de material plástico descartado pelas residências (0 kg indica que nenhum plástico
foi descartado, e 10 kg representa duas vezes 5 kg).
 Duração (em minutos) de filmes.
 Distâncias (em km) percorridas por carros em um teste de consumo de consumo de combustível.
4
4 – AMOSTRAGEM
São as técnicas utilizadas para se extrair a amostra da população. A amostragem pode ser probabilística ou
não probabilística. Na amostragem probabilística são realizados sorteios para alocação dos elementos da
amostra, já na amostragem não probabilística não se procede ao sorteio. O tamanho da população é,
geralmente, designado por N e o tamanho da amostra por n.
4.1 – Amostragem probabilística

Este tipo de amostragem garante o acaso na escolha. Assim, cada elemento da população tem a mesma
chance ser selecionado. Isto garante a representatividade da amostra e a validade das inferências que
serão feitas a partir dela. Serão discutidos aqui, sucintamente, quatro tipos de amostragem probabilística.
4.1.1 – Amostragem casual ou aleatória simples

Equivale a um sorteio dos indivíduos que farão parte da amostra
Procedimento:
 Enumera-se a população de 1 a N
 Sorteiam-se os indivíduos.
 Antigamente, os sorteios eram feitos por meio de tabelas de números aleatórios. Hoje em dia, utiliza-
se uma calculadora científica ou, o que é mais comum, um software estatístico.
Exemplo
Uma população é composta de 200 indivíduos. Retire uma amostra de tamanho 10, utilizando sua
calculadora científica.
Amostra: ____ ____ ____ ____ ____ ____ ____ ____ ____ ____
4.1.2 – Amostragem casual estratificada proporcional

Utilizada quando a população se subdivide em estratos (subpopulações).
Procedimento:
n
 Calcula-se a fração de amostragem dada por: f 
N
 Calcula-se o tamanho da amostra em cada estrato, fazendo-se: n i  f  N i
 Sorteiam-se os indivíduos em cada estrato.
Exemplo
Uma população é composta por 7820 indivíduos distribuídos em três estratos que apresentam as seguintes
quantidades de elementos: N1 = 3270; N2 = 2680 e N3 = 1870. Se se deve retirar uma amostra de tamanho
n = 1564, qual deve ser a quantidade de indivíduos a ser sorteada em cada estrato?
n 1564
f    0,20
N 7820
n1  f  N 1  0,20  3270  654

n 2  f  N 2  0,20  2680  536
n 3  f  N 3  0,20 1870  374
Sorteiam-se, em cada estrato, as quantidades de indivíduos calculadas acima.
4.1.3 – Amostragem sistemática

5
Utilizada preferencialmente quando a população já se encontra ordenada, como por exemplo: as casas de
uma rua, prontuários médicos, número de registros de matrícula, etc.
Procedimento:
N
 Calcula-se o fator de sistematização ou intervalo de seleção, dado por: F 
n
 Sorteia-se um indivíduo no intervalo [1 ; F], que será o primeiro elemento da amostra.
 Os demais elementos são obtidos somando-se sucessivamente o valor do intervalo de seleção
Exemplo
Retirar uma amostra de tamanho n = 10 de uma população ordenada composta de 80 elementos.
N 80
F  8
n 10
1º elemento = nº. aleatório multiplicado por 8.
Amostra: ____ ____ ____ ____ ____ ____ ____ ____ ____ ____
4.1.4 – Amostragem por conglomerado em 1 estágio

É semelhante à amostragem aleatória simples, porém, cada unidade de amostragem equivale a um grupo
ou conglomerado de elementos. Este tipo de amostragem é utilizado quando se encontram dificuldades
para obter uma lista dos indivíduos da população.
Procedimento:
 Especifica-se o sistema de referência (conglomerados)
 Sorteiam-se alguns conglomerados
 Pesquisam-se todos os indivíduos dos conglomerados sorteados.
Exemplo
Estimar o número médio de domicílios com aquecedor solar em uma grande cidade.
Como a amostragem aleatória simples, neste caso, necessita de uma listagem de todas as casas, ela se
torna inviável. A amostragem estratificada também é inviável, pois necessitaria da listagem dos
domicílios. A melhor escolha é a amostragem por conglomerado que pode ser realizada do seguinte
modo:
Sistema de referência (conglomerado): os quarteirões da cidade.

Extrai-se a amostra de conglomerados (quarteirões)
Pesquisa-se a existência de aquecedor solar em todos os domicílios dos conglomerados (quarteirões)
sorteados.
5 – ESTATÍSTICA DESCRITIVA E ANÁLISE EXPLORATÓRIA DE DADOS
5.1 -–Tratamento estatístico de variáveis quantitativas
A fim de descrever uma amostra (ou uma população), é conveniente o cálculo de algumas medidas que a
caracterizam. Estas medidas quando bem interpretadas fornecem informações valiosas sobre o conjunto
de dados.
A rigor, tais medidas são calculadas com o objetivo de produzir uma síntese numérica que represente o
conjunto de dados. Por exemplo, quando dizemos que a nota média de uma turma, em uma prova, foi 70
6
pontos; esta média, se consistente, equivale ao valor que sintetiza satisfatoriamente a nota da turma como
um todo.
Essas medidas se classificam em dois grandes grupos: as medidas de tendência central (média, mediana e
moda) e as medidas de dispersão ou variabilidade (variância, desvio padrão, coeficiente de variação).
Além destas, há o escore padronizado que é uma medida que tenta captar a posição relativa de um
indivíduo dentro de um grupo.
Cada uma dessas medidas será discutida aqui com mais detalhes.
5.2 – Medidas de tendência central
5.2.1 – Média aritmética simples ( x )

Para calcular a média aritmética simples ( x ) – lê-se: xis barra – de um conjunto de dados, basta somar
todos os valores e dividir pela quantidade deles, assim:
x
x i
Exemplo: amostra de pesos (kg) de 7 alunos de uma turma.
Pesos: 90 94 80 70 92 70 72
x
x i

90  94  80  70  92  70  72 568
  81 kg
n 7 7
5.2.2 – Mediana (Md)
A mediana é o valor que ocupa a posição central da amostra. Para calcular a mediana, os dados devem
estar ordenados (geralmente do menor para o maior valor). Para realizar o cálculo da mediana, é
necessário verificar se o tamanho da amostra (n) é par ou ímpar.
1º caso: n é ímpar
Neste caso, a mediana é o valor que ocupa exatamente a posição central. Em linguagem matemática, este

x n 1  n  1
valor pode ser designado por . Ou seja, a medida do indivíduo que ocupa a posição   . Para o
2  2 
exemplo anterior, como n = 7, tem-se:
Pesos: 70 70 72 80 90 92 94 (Observe que os dados estão ordenados) n = 7
x n1  x 71  x4
Termo central: Portanto, o valor da mediana é a medida do indivíduo que está
2 2
exatamente na quarta posição. Assim, a mediana é: Md = 80 kg.
Interpretação da mediana
Como a mediana ocupa a posição central, podemos no presente exemplo dizer que 50% dos alunos
tiveram pesos menores ou iguais a 80 kg e os outros 50% pesos maiores ou iguais a 80 kg.
2º caso: n é par
7
Neste caso, é preciso identificar os dois termos centrais e calcular a média entre eles. O valor obtido é
considerado a mediana. Matematicamente, as ordens (posições) dos dois termos centrais são dadas por: o
x
primeiro n e o segundo por x n . 1
2 2
Exemplo: amostra de pesos em kg de 6 alunos de uma turma.
Pesos: 70 72 80 90 92 94 (Observe que os dados estão ordenados) n=6
Primeiro termo central: x n  x 6  x3 que equivale ao valor 80

2 2
Segundo termo central: x n 1  x 6 1  x4 que equivale ao valor 90

2 2
80  90
Portando: Md =  Md = 85 kg
2
5.2.3 – Moda (Mo)

A moda é o valor que ocorre com maior freqüência no conjunto de dados. Retomando o exemplo da
amostra dos pesos de 7 alunos, tem-se:
Pesos: 70 70 72 80 90 92 94
Como o peso que mais se repete é 70, pode-se dizer que: Mo = 70 kg
Caso existissem dois valores distintos com maior freqüência (por exemplo: 70, 70 e 90, 90), dir-se-ia que
a série é bimodal com modas 70 e 90.
Quando cada valor da amostra ocorre com a mesma freqüência, dizemos que não há moda (a série é
amodal).
Breve comentário sobre as medidas de tendência central
Tabela resumo sobre as medidas de tendência central do exemplo
Pesos: 90 94 80 70 92 70 72
Medidas de tendência central da amostra do exemplo

Medida Valor
Média ( x ) 81 kg
Mediana (Md) 80 kg
Moda (Mo) 70 kg
A questão que se coloca aqui é a seguinte: qual das três medidas de tendência central deve ser utilizada
para sintetizar o conjunto de dados?
A medida mais utilizada é a média aritmética simples, principalmente porque o seu cálculo envolve todos
os valores do conjunto de dados; enquanto a mediana envolve um, no máximo dois, valores da amostra.
Assim, se não houver nenhuma assimetria acentuada nos dados, utiliza-se a média. Quando a assimetria é
muito forte, significa dizer que há alguns poucos indivíduos na amostra cujos valores são muito altos (ou
muito baixos) e a média tende a ficar superestimada (ou subestimada) e, portanto, não sintetizando ou
representando bem a amostra. Neste caso, é recomendável utilizar a mediana. Já a moda é uma medida
que capta um valor típico dos dados.
No exemplo em questão, há uma ligeira assimetria nos dados, pois, a moda é menor que a mediana que,
por sua vez, é menor que a média. Entretanto, como média e mediana são relativamente próximas (81 e
8
80, respectivamente), a princípio, pode-se optar por sintetizar a amostra de pesos dos alunos com a média
aritmética simples.
O tópico seguinte (medidas de dispersão) avalia melhor a representatividade da média.
5.3 – Medidas de dispersão ou variabilidade
As medidas de dispersão ou variabilidade servem para avaliar a concentração dos valores da amostra em
torno da média. Neste sentido, elas auxiliam no estudo sobre a representatividade da média aritmética
simples em um conjunto de dados, na medida em que quanto menor for a dispersão – aqui entendida
como o afastamento das medidas dos indivíduos tomando como referência a média –, maior é a
representatividade desta. Em outras palavras: se a medida de variabilidade for “pequena”, então realmente
a maioria dos valores da amostra se concentra em torno da média, fazendo com que esta represente ou
sintetize bem o conjunto de dados.
5.3.1 - variância amostral (s2)

É uma média das distâncias calculada a partir dos quadrados dos desvios em relação à média aritmética
simples. Ou seja, calculamos a diferença entre cada indivíduo da amostra e a média aritmética simples e
elevamos ao quadrado. Em seguida, somamos todos os valores obtidos e dividimos pelo tamanho da
amostra menos uma unidade. A fórmula matemática da variância é:
x  2
i x
s 2

n 1
A rigor, o denominador desta expressão deveria ser n. Entretanto, por razões relacionadas à inferência
estatística, pode-se mostrar que é conveniente dividir a soma dos quadrados das diferenças por n – 1.
Retomando o exemplo da amostra dos pesos de 7 alunos, e lembrando que x  81, a variância é:
Pesos: 90 94 80 70 92 70 72
 x  2
s 2

i x

 90  81 2   94  81 2   80  81 2   70  81 2   92  81 2   70  81 2   72  81 2
n 1 7 1
s 2

 9  13    1    11  11    11   9
2 2 2 2 2 2 2

81  169  1  121  121  121  81 695
  116 kg2
6 6 6
5.3.2 – Desvio padrão amostral (s)

É a raiz quadrada da variância. O desvio padrão possui a mesma unidade de medida dos dados e é a
medida que, efetivamente, é utilizada como síntese da dispersão ou variabilidade. É ela que mede a
concentração dos valores dos indivíduos da amostra em relação à média aritmética simples. Em outros
termos, pode-se dizer que quanto menor for o desvio padrão, mais representativa é a média aritmética
simples; pois, neste caso, a baixa dispersão indica que a maioria das medidas dos indivíduos da amostra
estão razoavelmente próximas da média e, portanto, esta representa bem o conjunto de dados. A fórmula
do desvio padrão é:
 x  2
i x
s
n 1
9
Para o exemplo anterior, como a expressão sob o radical já foi calculada, o desvio padrão é:
s 116 kg 2  10,8 kg
Conclusão: a amostra revelou uma média foi de 81 kg com um desvio padrão de 10,8 kg.
5.3.3 – Coeficiente de variação (CV)

Coeficiente de variação (CV): “... é conveniente exprimir a variabilidade em termos relativos, isto porque,
por exemplo, um desvio padrão de 10 pode ser insignificante se a observação típica é 10.000, mas
altamente significativo para uma observação típica 100. Toma-se então uma medida relativa da
variabilidade, comparando o desvio padrão com a média. Esta medida é o coeficiente de variação. Já
vimos que o desvio padrão tem a mesma unidade de medida que os dados, de modo que o coeficiente de
variação é adimensional. A grande utilidade do coeficiente de variação é permitir a comparação das
variabilidades de diferentes conjuntos de dados.” (SOARES, 1991).
s
O coeficiente de variação é dado por: CV  . Esta expressão pode ser multiplicada por 100 de modo
x
que o CV possa ser expresso em percentagem.
Exemplo 1: As turmas A e B do 1º período de Engenharia Civil apresentaram as estatísticas abaixo em

uma prova de Cálculo I (dados na tabela abaixo). Qual das duas turmas se mostrou mais homogênea na
prova?
Estatísticas das notas de uma prova de cálculo I

Estatísticas
Turmas s
x CV
A 78 8 ?
B 92 15 ?
Chamando de CVA e CVB os coeficientes de variação das turmas A e B, tem-se:
8 15
CV A   0,10 CV B   0,16 .
78 92
Estes valores, se multiplicados por 100, correspondem a 10% e 16%.

Conclusão: como o coeficiente de variação da turma A é menor que o da turma B, conclui-se que os
alunos da turma A mostraram notas mais homogêneas. Assim, embora a turma B possua uma média
maior, as notas dos alunos são mais heterogêneas. Isto pode ter ocorrido, por exemplo, devido a presença
de algumas notas altas que tendem a aumentar a média.
Comentário: o valor do coeficiente de variação, em termos de identificar alta ou baixa homogeneidade,

vai depender muito das características do estudo que está sendo desenvolvido. Entretanto, na maioria dos
casos, pode-se avaliar a dispersão do seguinte modo:
CV  0,10 : Baixa dispersão

0,10  CV  0,20 : Dispersão moderada
0,20  CV  0,30 : Dispersão alta
CV  0,30 : Dispersão muito alta
10
5.4 – Estudo do escore padronizado (Zi)
“No contexto de um único conjunto de dados, o desvio padrão pode ser interpretado intuitivamente como
unidade natural de dispersão dos dados. Essa interpretação é utilizada na construção de “escores
padronizados”, de larga aplicação em medidas educacionais. O problema é o seguinte: em uma escala de
0 a 10, a nota 6 em uma prova em que a nota máxima foi 6 é muito mais do que a mesma nota 6 em uma
prova em que a nota máxima foi 9. Uma forma de captar essa diferença é considerar a nota do aluno como
a sua posição relativa no grupo.” (SOARES, 1991)
Deste modo, enquanto o coeficiente de variação compara grupos, o escore padronizado capta a posição da
medida de um indivíduo dentro do grupo. O escore padronizado é dado por:
xi  x
Zi  . Onde x i é a medida do i-esimo indivíduo.
s
Retomando o exemplo das notas da prova de Cálculo I das turmas A e B do 1º período de Engenharia
Civil, suponha que o João é aluno da turma A e tirou 85 pontos na prova; já a Maria é aluna da turma B e
tirou 90 pontos no teste. A questão é: em termos relativos, qual dos dois alunos, João ou Maria, obteve
melhor desempenho?
Estatísticas das notas de um teste de língua portuguesa
Estatísticas
Turmas s
x
A 78 8
B 92 15
Chamando de ZJ o escore do João e ZM o escore da Maria, tem-se:
85  78 90  92
ZJ   0,875 ZM   0,133
8 15
Conclusão: embora Maria tenha uma nota superior à do João, em termos relativos a pontuação obtida por
João é melhor do que a de Maria, pois (0,875 > – 0,133).
5.5 – Distribuição de freqüência (variáveis quantitativas)

As distribuições de freqüências são tabelas que descrevem os dados estatísticos a fim de facilitar sua
compreensão. Hoje em dia, com a expansão dos softwares, essas tabelas são obtidas com muita facilidade
e, portanto, não são construídas manualmente.
5.5.1 – Distribuição de freqüência sem intervalos de classe
Notação:
i: são as classes
xi: valores assumidos pela variável
fi: freqüência simples ou absoluta
fri: freqüência relativa simples
Fi: freqüência acumulada
n: equivale ao Σ fi
Exemplo: amostra das idades (em anos) de uma amostra de alunos.
11
TABELA 1
Distribuição de freqüência das idades em anos de uma amostra de alunos
i xi fi fri Fi
1 19 8 0,121 8
2 20 12 0,182 20
3 22 17 0,258 37
4 25 13 0,197 50
5 27 12 0,182 62
6 30 4 0,060 66
Σ 66 1,000
5.5.2 – Distribuição de freqüência com intervalos de classe
Além da notação anterior, usa-se o símbolo | para designar o intervalo fechado à esquerda e aberto à
direita. Além disso, o xi é o ponto médio da classe.
Para determinar o número de classes, i, e a amplitude do intervalo não há um critério fixo. Entretanto, é
comum, para determinar o número de classes, usar-se a fórmula: i = 1 + 3,3(logn). E para determinar a
AA
amplitude do intervalo, h, pode se utilizar: h  , onde AA é a amplitude amostral e corresponde à
i
diferença entre o maior e o menor valor do rol (o rol são os dados ordenados).
Exemplo: Rol das estaturas (em cm) de 40 alunos do colégio A. (Retirado do livro “Estatística Fácil”)
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Determinação do número de classes e da amplitude do intervalo:
Classes: i = 1 + 3,3(logn) = 1 + 3,3log40 = 1 + 3,3(log40) = 1 + 3,3(1,602059991) = 6,286797971 = 6

Amplitude amostral: AA = 173 – 150 = 23
AA 23
Amplitude do intervalo: h    3,83333  4
i 6
A tabela de distribuição de freqüência será:
TABELA 2
Distribuição de freqüência das estaturas (em cm) de uma amostra de 40 alunos
i Intervalo xi fi fri Fi
1 150 | 154 152 4 0,100 4
2 154 | 158 156 9 0,225 13
3 158 | 162 160 11 0,275 24
4 162 | 166 164 8 0,200 32
5 166 | 170 168 5 0,125 37
6 170 | 174 172 3 0,075 40
Σ 40 1,000
5.6 – Estudo dos percentis (Pk)

12
Os percentis dividem o rol em 100 partes iguais. Os percentis são medidas de posição.
|__________|__________|____________________|____________________|__________|____________|
Min P1 P2 P50 P98 P99 Max
º
k  n
Para calcular um percentil qualquer, devemos encontrar a odem do percentil do seguinte modo:  
 100 
Exemplo - Altura (cm) de uma amostra de 40 estudantes.
150,2 154,2 155,9 157,4 160,2 161,0 162,1 164,2 166,8 169,5
151,3 154,6 156,1 158,5 160,5 161,2 162,9 164,4 167,9 170,7
152,4 155,3 156,5 158,9 160,7 161,5 163,3 164,9 168,1 172,4
153,5 155,7 156,8 160,1 160,9 161,9 163,8 165,0 168,8 173,5
Calcular:
a) P10
b) P25
c) P67
d) P97
13
Resolução
º º
k  n 10  40 
a)     4º termo. Portanto: P10 = 153,5
 100   100 
º º
 k n   25  40
b)      10º termo. Portanto: P25 = 156,1
 100   100
º º
k  n  67  40 
c)     26,8º . Portanto, o P67 será a média entre o 26º e 27º termos. Logo;
 100   100 
162,9  163,3 326,2
P67    163,1
2 2
º º
 k n
   97  40
d) 
100    100   38,8º . Portanto, o P97 será a média entre o 38º e 39º termos. Logo;
   
170,7  172,4 343,1
P97    171,55
2 2
5.6.1 – Percentis especiais: Quartis (Qk)
Os quartis dividem a série estatística em 4 partes iguais. São eles: primeiro quartil (Q 1), segundo quartil
(Q2) e terceiro quartil (Q3). O primeiro quartil corresponde ao percentil 25; o segundo quartil é o percentil
50 (que coincide com a mediana) e o terceiro quartil é o percentil 75.
|__________|__________|__________|__________|
Min Q1 Q2 Q3 Max
Para o exemplo Q1 = 156,1 (que corresponde ao P25) e Q3 = 164,4 (que equivale ao P75 – confira!).
5.7 – Média ponderada x p

A media pondera é utilizada quando se atribuem pesos distintos para os valores da variável. É dada por:
xp 
x p i i
p i
Onde xi são os valores da variável e pi são os pesos. A média aritmética simples é uma média ponderada
onde os pesos são iguais.
EXERCÍCIOS – LISTA 1
1) Para cada uma das descrições abaixo, indique o seu significado escolhendo um dos seguintes
conceitos: população, um parâmetro, censo, variáveis quantitativas, variáveis qualitativas, variáveis
discretas, experimento, uma estatística, estudo observacional.
a) Coleção completa de todos os elementos, com pelo menos uma característica comum, a serem
estudados.
b) Consistem em números que representam contagens ou medidas.
c) Medida numérica que descreve uma característica numérica de uma população.
d) Resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável desses valores.
e) Coleção de dados relativos a todos os elementos de uma população.
f) Medida que descreve uma característica numérica de uma amostra.
g) Dados que podem ser separados em diferentes categorias que se distinguem por alguma característica
não numérica.
h) Situação em que verificamos e medimos características específicas, mas não modificamos os
elementos a serem estudados.
i) Situação em que modificamos as características de elementos a fim de verificar o efeito desta
modificação.
2) Dê um exemplo para cada um dos seguintes níveis de mensuração de variáveis: nominal, ordinal e
razão.
3) Nos itens a, b, c, d abaixo, indique se a descrição dada corresponde a um estudo observacional ou a

um experimento.
a) Uma pesquisa tenta captar a opinião da população sobre sua preferência em morar em casa ou
apartamento. _______________________________________
b) Em uma turma de educação física, estuda-se o efeito dos exercícios físicos sobre a pressão sanguínea,
determinando-se que metade dos estudantes ande mil metros cada dia, enquanto a outra metade corra
mil metros diariamente. ______________________________________________________________
c) Em determinada cidade, faz-se um levantamento do número de pessoas contaminadas com o vírus

HIV, de acordo com o sexo. ___________________________________________________________
d) A fim de aumentar a produtividade de tomate de sua plantação, um produtor faz um rígido controle
sobre a irrigação (quantidade de água diária) e a luminosidade (incidência de raios solares) nos
tomateiros de sua produção. ___________________________________________________________
4) Deve-se extrair uma amostra de tamanho n=600 de uma população de tamanho N=5.000, que consiste
de quatro estratos com as seguintes quantidades de elementos: N 1=3.000, N2=1.000, N3=800 e
N4=200. Se a alocação deve ser proporcional, qual o tamanho da amostra em cada estrato?
5) Retire uma amostra de tamanho n=10 de uma população ordenada composta de 200 elementos,
utilizando o processo de amostragem sistemática. Explique todo o procedimento adotado.
6) Explique o que é amostragem por conglomerados e exemplifique.
7) Construir uma tabela de distribuição de freqüência com intervalos de classe para os dados abaixo que
representam uma amostra de pesos (kg) do curso de Engenharia (veja exemplo da tabela 2 acima).
Utilizar as fórmulas vistas no conteúdo para definir o número de classes (i) e a amplitude do intervalo
(h).
42,1 43,7 45,1 46,2 47,1 47,8 49,3 50,2 50,4 51,3
52,1 52,7 53,0 53,8 54,0 54,7 55,8 55,9 56,7 56,9
15
57,1 58,3 59,7 60,1 60,1 60,1 61,0 62,1 62,9 63,0
63,7 63,9 65,8 66,9 67,0 67,9 68,0 70,2 72,1 74,5
75,0 75,2 75,8 76,0 78,2 79,3 80,2 82,7 84,1 90,1
8) Nos itens de a até f abaixo, calcule a média, a mediana, a moda, o desvio-padrão e o coeficiente de
variação.
a) Medidas do diâmetro (em mm) interno de anéis forjados de pistão de um motor de automóvel. Os
dados são: 1; 3; 15; 0; 5; 2; 5 e 4.
b) Tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV. Os tempos em minutos são:
0,19; 0,78; 0,96; 1,31; 2,78; 3,16; 4,15; 4,67; 4,85; 6,50; 7,35; 8,01; 8,27; 12,06; 31,75; 32,52; 33,91;
36,71 e 72,89.
c) Medida da espessura de óxido em pastilhas que são estudas para verificar a qualidade em um processo
de fabricação de semicondutores. Os dados, em angstroms, são: 1264; 1280; 1301; 1300; 1292; 1307 e
1275.
d) Experimento para testar a resistência resultante em tubos circulares com calotas soldadas nas
extremidades. Os resultados em kN são: 96; 96; 102; 102; 102; 104; 104; 108; 126; 126; 128; 128;
140; 156; 160; 160; 164 e 170.
e) Dados sobre acomodação visual (uma função do movimento do olho), quando reconhecendo um
padrão de mancha em um vídeo CRT de alta resolução. Os dados são: 36,45; 67,90; 38,77; 42,18;
26,72; 50,77; 39,30 e 49,71.
f) Dados referentes a medidas de intensidade solar direta (watts/m 2), em dias diferentes, no sul da
Espanha: 562; 869; 708; 775; 704; 809; 856; 655; 806; 878; 909; 918; 558; 768; 870; 918; 940; 946;
661; 820; 898; 935; 952; 957; 693; 835; 905; 939; 955; 960; 498; 653; 730 e 753.
9) Abaixo se encontra uma amostra dos pesos (kg) de uma turma de matemática, ao final do 2º semestre
de 2006 e ao final do 1º semestre de 2007.
Número do aluno 01 02 03 04 05 06 07 08 09 10
Peso ao final do 2º semestre/2006 66 70 68 71 69 67 70 69 71 70
Peso ao final do 1º semestre/2007 64 66 68 63 66 67 62 64 63 68
Escore padronizado do 2º semestre
Escore padronizado do 1º semestre
a) Calcule os coeficientes de variação e diga em qual momento os pesos são mais homogêneos.
b) Complete a tabela com os escores padronizados de todos os alunos, nos dois momentos.
c) A partir dos escores padronizados, em que momento os alunos de números 01 e 08 apresentam maior
excesso relativo de peso?
10) Mostrar que se todos os valores de um conjunto de dados forem aumentados de b, a média e a
mediana também ficarão aumentadas de b. E o desvio padrão também ficará aumentado de b?
11) A contagem de bactérias numa cultura aumentou de 2.500 para 9.200 em três dias. Qual o acréscimo
percentual diário médio?
12) Tibúrcio prestou recentemente um concurso e obteve as notas nas disciplinas listadas na tabela abaixo.
Disciplinas Nota do Tibúrcio Peso

Português 72 3,6
16
Matemática 91 1,1
Técnicas Bancárias 85 2,1
Informática 70 2,5
Inglês 84 1,8
Contabilidade 92 1,6
a) Calcule a média aritmética simples  x  do Tibúrcio.

 
b) Calcule a média ponderada x p do Tibúrcio.
c) Considerando que a nota mínima para ser aprovado é 82 pontos, e que o concurso utiliza a média
ponderada para efeito de classificação, o Tibúrcio foi aprovado?
13) Os dados abaixo mostram a resistência à compressão de 80 corpos de prova da liga alumínio-lítio,
medidas em psi (medida de pressão ou libra por polegada quadrada).
76 123 145 154 163 172 181 200

87 131 146 156 163 174 183 201
97 133 148 157 165 174 184 207
101 133 149 158 167 175 186 208
105 134 149 158 167 176 190 218
110 135 150 158 168 176 193 221
115 135 150 158 169 178 194 228
118 141 151 160 170 180 196 229
120 142 153 160 171 180 199 237
121 143 154 160 171 181 199 245
II – PROBABILIDADE
1 – ESTUDO DAS PROBABILIDADES
1.1 – Experimento determinístico

São experimentos cuja repetição sob as mesmas condições conduz sempre ao mesmo resultado, podendo-
se determiná-lo antecipadamente.
Ex. em um corpo em queda livre é possível determinar antecipadamente, por exemplo, o tempo da queda,
a posição do corpo em um instante t0, a velocidade, etc..
1.2 – Experimento aleatório

São experimentos cuja repetição não conduz aos mesmos resultados. Não se pode determinar à priori um
resultado, mas pode-se calcular a probabilidade de ocorrência de um evento qualquer.
Ex. em um lançamento de um dado (cubo) com seis faces, não é possível dizer qual face estará voltada
para cima. Entretanto, é possível calcular a probabilidade de uma face em particular cair para cima.
1.3 – Probabilidade: conceitos básicos
Quando se fala em probabilidade está-se referindo à classe dos experimentos aleatórios. Tais
experimentos serão designados por: E.
- Espaço amostral (S): é o conjunto de todos os resultados possíveis do experimento.

- Evento: é qualquer subconjunto do espaço amostral. Designam-se os eventos por: A, B, C, D, etc.
17
Exemplo
E: lançamento de um dado (cubo)

S = {1, 2, 3, 4, 5, 6}
Eventos:
A: Sair nº par A = {2, 4, 6}
B: Sair nº ímpar B = {1, 3, 5}
C: Sair nº maior que 2 C = {3, 4, 5, 6}
D: Sair nº maior que 6 D=  “Evento impossível”
E: Sair nº de 1 a 6 E = {1, 2, 3, 4, 5, 6} “Evento certo”
1.4 – Definição de probabilidade
1.4.1 – Definição clássica
Seja A um evento de um espaço amostral S. Define-se a probabilidade de ocorrência deste evento como:
n A 
P  A 
n S 
Onde: n(A) é o número de casos favoráveis ao evento A e n(S) o número total de casos.
Exemplo: no lançamento de um dado (cubo), calcular a probabilidade de sair nº par.

S = {1, 2, 3, 4, 5, 6} A = {2, 4, 6}
3 1
P  A    0,5 ou 50%
6 2
1.4.2 – Definição frequencial
Considere que um experimento é repetido um grande número de vezes. A probabilidade de ocorrência do

evento A é a freqüência relativa dada por:
_ Nº de vezes que A ocorreu______

P(A) =
Nº total de repetições do experimento
Exemplo: lançou-se uma moeda 1.000 vezes e obteve-se 499 caras. Estimar a probabilidade de ocorrência
da face cara.
499
n(S) = 1.000 n(A) = 499 P  A   0,499 ou 49,9%
1000
1.5 – Tipos de eventos
Sejam A e B dois eventos de um espaço amostral S.
a) Evento Interseção: equivale à ocorrência de A e B ao mesmo tempo.

b) Evento Exclusão (mutuamente excludentes): a ocorrência de A impossibilita a ocorrência B.
c) Evento União: equivale à ocorrência de A, ou de B, ou de ambos.
d) Evento Negação: é o complementar de outro evento. O complementa de A denota-se por A .
1.6 – Regras básicas e axiomas de probabilidade

18
Considere A e B dois eventos de um espaço amostral S.
i) 0 ≤ P(A) ≤ 1
ii) P(S) = 1
iii) P A  B   P A  P B   P A  B 
iv) P A  B   P A  P B  , quando A e B são mutuamente excludentes.
v) P  A  1  P A
1.7 – Probabilidade condicional
Dados dois eventos A e B de um espaço amostral S, entende-se como probabilidade condicional a

probabilidade de ocorrência de um evento uma vez que outro já ocorreu. Assim, a ocorrência do segundo
evento fica restrita a um novo espaço amostral que corresponde ao evento já ocorrido. Denota-se a
probabilidade condicional por:
P A  B 
P A | B  
P B 
Onde P(A|B) se lê como: “probabilidade condicional de A, dado B”. Ou seja, uma vez que ocorreu o
evento B, qual é a probabilidade de ocorrência também de A?
Exemplo – cálculo de probabilidade e probabilidade condicional
Uma pesquisadora está estudando os rendimentos de pessoas que trabalham formal e informalmente. A
tabela abaixo corresponde a uma amostra de 634 pessoas.
Tabela 1 – Nº de pessoas de acordo com a renda e tipo de trabalho – Montes Claros- ano 2007
Renda
Trabalho Total
Baixa Média Alta
Formal 36 128 225 389
Informal 94 89 62 245
Total 130 217 287 634
Fonte: dados fictícios
Especificação dos eventos:

F: trabalho formal I: trabalho informal B: renda baixa M: renda média A: renda alta
Calcular a probabilidade de um indivíduo sorteado se encontrar:

a) Com trabalho formal. R: 0,614 ou 61,4%
b) Com renda alta. R: 0,453 ou 45,3%
c) Com trabalho informal. R: 0,386 ou 38,6%
d) Com renda média e trabalho formal. R: 0,202 ou 20,2%
e) Com renda alta e trabalho formal. R: 0,355 ou 35,5%
f) Com renda alta e trabalho informal. R: 0,098 ou 9,8%
19
Probabilidade condicional
g) Com renda alta, sabendo que é do trabalho formal. R: 0,578 ou 57,8%

h) Com renda alta, sabendo que é do trabalho informal. R: 0,253 ou 25,3%
i) Desenvolver trabalho formal, sabendo que possui renda baixa. R: 0,277 ou 27,7%
j) Desenvolver trabalho informal, sabendo que possui renda alta. R: 0,216 ou 21,6%
k) Dado que possui renda média, desenvolver trabalho informal. R: 0,410 ou 41,0%
l) Dado que é informal, possuir renda média. R: 0,363 ou 36,3%
1.8 – Independência de eventos
Definição: dois eventos A e B são independentes quando a ocorrência de um deles não modifica a
probabilidade de ocorrência do outro. Ou seja:
P(B|A) = P(B) e P(A|B) = P(A)
P A  B 
P A | B    P A  B   P ( A | B )  P ( B ) , mas se A e B são independentes, então: P(A|B) = P(A)
P B 
Logo: P( A  B)  P( A)  P( B)
20
Exemplo
Considere o lançamento de um dado (cubo), a observação da face superior e os eventos A e B abaixo.
S = {1, 2, 3, 4, 5, 6} A = {2, 3, 4, 5,} B = {1, 3, 4,}
a) Supondo que ocorreu o evento A, qual a probabilidade condicional de ocorrer B?
4 3
P ( A)  e P( B) 
6 6
P( A  B ) 2
P ( B | A)  
P( A) 4
P(B|A) = P(B), ou seja, a ocorrência de A não alterou a probabilidade de ocorrência de B.
b) Agora suponha que tenha ocorrido B. Qual a probabilidade condicional de ocorrência de A?
4 2 P( A  B) 2
P ( A)   e veja também que: P( A | B)  P( B)  3
6 3
P(A|B) = P(A), ou seja, a ocorrência de B não alterou a probabilidade de ocorrência A.
Assim, dizemos A e B são eventos independentes.
1.9 – Partição de um espaço amostral – teorema da probabilidade total
Suponha que o espaço amostral S de um experimento seja dividido em três eventos R1, R2 e R3 de modo
que:
S
R1 R2
B
R3
R1  R 2  
R 2  R3  
R1  R3  
R1  R 2  R3  S
e considere um evento B qualquer. O evento B pode ser escrito como:
B  BS .
Como S  R1  R 2  R3 , então B  B  ( R1  R 2  R3 ) ou
B  ( B  R1 )  ( B  R 2 )  ( B  R3 )
Pelo fato de ( B  R1 ), ( B  R 2 ), ( B  R3 ) serem eventos mutuamente excludentes, pode-se escrever;
P ( B )  P ( B  R1 )  P ( B  R 2 )  P ( B  R3 )
As interseções do segundo membro são do tipo: P A  B   P ( A | B )  P ( B ) . Assim:
P( B)  P( B | R1 )  P( R1 )  P( B | R 2 )  P( R 2 )  P( B | R3 )  P( R3 )
Este resultado é conhecido como teorema da probabilidade total e pode ser escrito na forma geral:
P ( B)  P( B | R1 )  P( R1 )  P ( B | R 2 )  P( R 2 )  ...  P ( B | R n )  P( R n )
Exemplo de aplicação 1
Uma fábrica tem três máquinas – A, B e C – que respondem, respectivamente, por 40%, 35% e 25% de
sua produção. A proporção de peças defeituosas produzidas pela máquina A é 2%; da máquina B é 1% e
da máquina C é 3%. O responsável pelo controle de qualidade que inspeciona a produção retira uma peça
ao acaso. Qual a probabilidade da peça ser defeituosa?
Especificação dos eventos:

A: produção da máquina A
B: produção da máquina B
C: produção da máquina C
D: peças defeituosas
Especificação das probabilidades:

P(A) = 0,40 P(B) = 0,35 P(C) = 0,25
P(D|A) = 0,02 P(D|B) = 0,01 P(D|C) = 0,03
P ( D)  P ( D  A)  P ( D  B )  P( D  C ) essa expressão pode ser escrita:
P( D)  P( D | A)  P( A)  P( D | B)  P ( B )  P( D | C )  P(C )
P ( D)  0,02  0,40  0,01  0,35  0,03  0,25  0,019
Portanto, a probabilidade de que a peça seja defeituosa é 0,019 ou 1,9%
1.10 – Teorema de Bayes
Considerando o mesmo contexto explicitado no teorema da probabilidade total, o teorema de Bayes

equivale a:
22
P ( B | Ri )  P ( Ri )
P ( Ri | B) 
P( B | R1 )  P( R1 )  P( B | R 2 )  P( R 2 )  ...  P( B | R n )  P( R n )
Exemplo de aplicação 2
Considerando o exemplo de aplicação 1, suponha que o responsável pelo controle de qualidade retira a
peça e verifica que ela é defeituosa. Qual a probabilidade de ter sido produzida pela máquina B?
P( D | B)  P ( B) P( D | B)  P( B)
P( B | D)  
P( D) P ( D | A)  P ( A)  P( D | B)  P( B )  P( D | C )  P (C )
0,01  0,35 0,0035

P( B | D)    0,184210526  0,184
0,02  0,40  0,01  0,35  0,03  0,25 0,019
Portanto, a peça defeituosa retirada para inspeção tem uma probabilidade de aproximadamente 0,184 ou
18,4%de ter sido produzida pela máquina B.
2 – VARIÁVEL ALEATÓRIA DISCRETA
“Muitos experimentos produzem resultados não-numéricos. Antes de analisá-los, é conveniente

transformar seus resultados em números, o que é feito através da variável aleatória, que é uma regra de
associação de um valor numérico a cada ponto do espaço amostral. (...) O passo fundamental para
entendermos uma variável aleatória é associar a cada valor a sua probabilidade, obtendo o que se chama
uma distribuição de probabilidades, que fica caracterizada pelos valores da variável aleatória X e pela
regra, ou função, que associa a cada valor uma probabilidade. Esta função chamada função de
probabilidade, é representada por f(x). Para estudar e tomar decisões em situações onde está presente a
incerteza, temos basicamente de identificar a variável aleatória de interesse e obter sua distribuição de
probabilidade, e a partir daí obter os elementos necessários para a tomada de decisão.” (SOARES, 1991).
2.1 – Distribuição de probabilidade
Exemplo 1
No lançamento de duas moedas (C=cara e K=coroa), defina a variável aleatória X como sendo o número
de caras e construa a distribuição de probabilidade.
S = {CC, CK, KC, KK}
Evento CC CK KC KK
X (Nº caras) 2 1 1 0
A distribuição de probabilidades será:
xi: 0 1 2
1 2 1
P(xi):
4 4 4
Exemplo 2
23
No lançamento de três moedas, defina a variável aleatória X como sendo o número de caras e construa a
distribuição de probabilidade.
S = {CCC, CCK, CKC, CKK, KCC, KCK, KKC, KKK}
A distribuição de probabilidades será:
xi: 0 1 2 3
P(xi): 1 3 3 1
8 8 8 8
ATENÇÃO! Para que tenhamos uma distribuição de probabilidade, duas condições precisam ser
satisfeitas. São elas:
i) 0  P ( x i )  1 ii)  P( x i )  1
2.2 – Valor esperado ou média µ de uma variável aleatória discreta
Quando estudamos as distribuições de freqüências, em Estatística Descritiva, procuramos caracterizar as

principais medidas das amostras como: média, variância, desvio padrão, etc.
Agora, a variável aleatória será utilizada para estabelecer modelos teóricos de probabilidade com a
finalidade de descrever populações. A média (µ), a variância (σ 2) e o desvio padrão (σ), representarão
parâmetros destas populações.
Notação
E(X): lê-se “valor esperado” ou “esperança” da variável aleatória X e equivale à média µ.
O valor esperado ou esperança de X é dado por:   E ( X )   x i P( x i )
2.3 – Variância (σ2) e desvio padrão (σ) de uma variável aleatória discreta
A variância [VAR(X)] ou σ2 é dada por:    ( x i   )  P( x i )

2 2
O desvio padrão é raiz quadrada da variância:    (x i   ) 2  P( x i )
Exemplo 1
No lançamento de dois dados, a variável aleatória X anota a soma dos pontos da face superior. Determine
a média, a variância e o desvio padrão da variável aleatória X.
O espaço amostral S é dado por:
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

S=
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
24
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
A distribuição de probabilidade é:
xi P( x i ) x i  P( x i ) ( xi   ) 2  P( xi )
2 1/36 2/36 25/36
3 2/36 6/36 32/36
4 3/36 12/36 27/36
5 4/36 20/36 16/36
6 5/36 30/36 5/36
7 6/36 42/36 0
8 5/36 40/36 5/36
9 4/36 36/36 16/36
10 3/36 30/36 27/36
11 2/36 22/36 32/36
12 1/36 12/36 25/36
Σ 1 252/36 210/36
252
A média será:   E ( X )   xi P( xi )  7
36
210
A variância será:    ( x i   )  P( x i )   5,83
2 2
36
O desvio padrão será:    (x i   ) 2  P( x i )  5,83  2,41
Exemplo 2
Um jogo consiste no lançamento de 3 moedas (não viciadas). Se der tudo cara ou tudo coroa, o ganho é
de R$ 5,00, mas dando uma ou duas caras, a perda é de R$ 3,00. Qual o resultado esperado para o jogo?
Lembrando que o espaço amostral no lançamento de três moedas é:

S = {CCC, CCK, CKC, CKK, KCC, KCK, KKC, KKK}
xi P( x i ) x i  P( x i )
R$ 5 2/8 10/8
– R$ 3 6/8 – 18/8
Σ 1 –1
Logo, o resultado esperado do jogo é a média ou valor esperado da variável aleatória, no caso:
10  18  8
  E ( X )   x i P( x i )         1
8  8 8
Ou seja: a longo prazo pode esperar, em média, uma perda de aproximadamente R$ 1,00.
25
Exemplo 3
Uma máquina produz um equipamento eletrônico que pode apresentar nenhum, um, dois, três ou quatro
defeitos, com probabilidades 90%, 4%, 3%, 2% e 1%, respectivamente. O preço de venda de um
equipamento perfeito é de R$ 20,00 e, à medida que apresente defeitos, o preço cai 50% para cada defeito
apresentado. Qual é a esperança do preço médio de venda desse equipamento?
A distribuição é:
Defeito xi P( x i ) x i  P( x i )
0 20,00 0,90 18
1 10,00 0,04 0,4
2 5,00 0,03 0,15
3 2,50 0,02 0,05
4 1,25 0,01 0,0125
Σ 1 18,6125
Logo o preço médio de venda será:

  E ( X )   x i P( x i )  18  0,4  0,15  0,05  0,0125  18,6125  R$18,61
2.4 – Comentário sobre o valor esperado e a variância
A diferença fundamental entre x e µ é que x , por depender das freqüências, só pode ser calculada após
a ocorrência de todos os valores da série estatística. É uma média calculada a posteriori. Já a média µ, por
estar baseada no conceito de probabilidade, pode ser estabelecida antes da ocorrência dos valores da
variável aleatória. É uma média calculada a priori. Neste sentido, µ é uma expectativa de média e é
também chamada de esperança matemática da variável aleatória X. A mesma analogia existe entre a
variância e o desvio padrão de uma distribuição de freqüência e a variância e o desvio padrão de uma
variável aleatória X.
2.5 – Propriedades do valor esperado e da variância
Seja X uma variável aleatória e a e b duas constantes quaisquer:
Propriedades do valor esperado:
P1) E(a) = a
P2) E(bX) = bE(X)
P3) E(X + a) = E(X) + a
P4) E(a + bX) = a + bE(X)
Propriedades da variância – VAR(X):
P5) VAR ( X )  0
P6) VAR(X + a) = VAR(X)

26
P7) VAR(bX) = b2VAR(X)
P8) VAR(a + bX) = b2VAR(X)
Exemplo
O consumo agregado é dado pela equação C = 1,5 + 0,8Y, onde a renda disponível, Y, é uma variável
aleatória com valor esperado 100 e variância 10. O valor esperado e a variância do consumo, C, seriam,
respectivamente:
a) 81,5 e 9,5
b) 85,1 e 6,4
c) 81,5 e 8,0
d) 81,5 e 7,9
e) 81,5 e 6,4
Resolução:
Cálculo do valor esperado:

E(C) = E(1,5 + 0,8Y) pela propriedade P4 temos:
E(C) = 1,5 + 0,8E(Y) como E(Y) é dado: E(Y) = 100, o valor esperado do consumo é:
E(C) = 1,5 + 0,8(100)
E(C) = 81,5
Cálculo da variância:
VAR(C) = VAR(1,5 + 0,8Y) pela propriedade P8 temos:
VAR (C )  (0,8)  VAR (Y )
2
como a VAR(Y) é dada: VAR(Y) = 10, a variância do consumo é:
VAR (C )  (0,8) 2 10  6,4
Portanto: E(C) = 81,5 e VAR(C) = 6,4 Resposta correta: letra e.
EXERCÍCIOS – LISTA 2
Parte I – Probabilidades
01) Duas bolas são retiradas, sem reposição, de uma urna que contém duas bolas brancas, três bolas pretas
e cinco bolas vermelhas. Determine a probabilidade de que:
a) ambas sejam pretas;

b) ambas sejam vermelhas;
c) ambas sejam da mesma cor;
d) ambas sejam de cores diferentes.
02) Resolva o problema anterior considerando as retiradas com reposição.
03) Se P(AUB) = 0,8; P(A) = 0,6 e P(B) = 0,5; os eventos A e B são independentes? Por quê?
04) No primeiro ano de uma faculdade, 25% dos estudantes são reprovados em Matemática, 15% são
reprovados em Estatística e 10% são reprovados em ambas. Um estudante é selecionado ao acaso nesta
faculdade. Calcule a probabilidade de que:
a) Ele seja reprovado em Matemática, sabendo-se que foi reprovado em Estatística.

27
b) Ele não seja reprovado em Estatística, sabendo-se que foi reprovado em Matemática.
05) Lança-se um par de dados não-viciados. Ache a probabilidade da soma ser igual ou maior que 10, se:
a) ocorrer 5 no primeiro dado;

b) ocorrer 5 em pelo menos um dos dados.
06) Três máquinas, A, B e C, produzem 50%, 30% e 20%, respectivamente, do total de peças de uma
fábrica. As percentagens de produção defeituosa destas máquinas são de 3%, 4% e 5%, respectivamente.
Se uma peça é selecionada aleatoriamente, ache a probabilidade de ela ser defeituosa.
07) Considerando a fábrica do exercício anterior, suponha que uma peça, selecionada aleatoriamente, seja
considerada defeituosa. Encontre a probabilidade de ela ter sido produzida pela máquina A.
08) Uma junta apuradora de votos recebe 50 urnas. Sabe-se que 5 urnas são de bairros habitados por
indivíduos da classe A, 15 urnas são de bairros habitados por indivíduos da classe B e 30 urnas são de
bairros habitados por indivíduos da classe C. A última pesquisa realizada mostrou o quadro de intenções
de votos:
Intenção de votos por bairro (%)

Candidato
Bairro A Bairro B Bairro C
H.C 40 30 25
LALU 20 25 25
VENTAROLA 10 5 5
Calcule a probabilidade de que:

a) Um voto qualquer anunciado seja do Ventarola; b) Um voto qualquer anunciado não seja do
H.C..
09) A tabela a seguir apresenta dados dos 1000 ingressantes de uma universidade, com informações sobre
área de estudo e classe sócio-econômica:
Classe Socioeconômica
Área Total
Alta Média Baixa
Exatas 120 156 68
Humanas 72 85 112
Biológicas 169 145 73
Total
Se um aluno ingressante é escolhido ao acaso, determine a probabilidade de:

a) Ser da classe econômica mais alta c) Estudar na área de humanas, sendo da classe média;
b) Estudar na área de exatas d) Ser da classe baixa, dado que estuda na área de biológicas.
10) Suponha que um fabricante de sorvetes recebe 20% de todo o leite que utiliza de uma fazenda A, 30%
de outra fazenda B e 50% de uma fazenda C. Um órgão de fiscalização inspecionou as fazendas de
surpresa e observou que 20% do leite produzido por A estava adulterado por adição de água, enquanto
que para B e C, essa proporção era de 5% e 2%, respectivamente. Na indústria de sorvetes os galões de
leite são armazenados em um refrigerador sem identificação das fazendas. Um galão é escolhido ao acaso
e verifica-se que o leite está adulterado. Qual a probabilidade de que tenha sido produzido pela fazenda
A?
11) A preferência de consumo da população de mil indivíduos é indicada no quadro abaixo.
28
Homem Mulher Total do Produto
Produto A 200 270 470
Produto B 300 100 400
Produto C 60 70 130
Total por Sexo 560 440 1000
Assim, a probabilidade de escolher-se uma consumidora do produto B e a probabilidade de uma mulher

selecionada aleatoriamente ser consumidora do produto B são, respectivamente:
a) 0,10 e 0,227 b) 0,10 e 0,614 c) 0,27 e 0,102 d) 0,30 e 0,227
12) Estudantes de três universidades diferentes, X, Y e Z, fazem um exame onde os resultados são
medidos pelos conceitos A, B e C. A tabela abaixo mostra as distribuições de freqüências relativas das
combinações de universidades e conceitos.
Conceitos
Universidades
A B C
X 0.20 0.10 0.00
Y 0.25 0.10 0.05
Z 0.15 0.10 0.05
Tal tabela mostra, por exemplo, que 20% do total dos alunos que fizeram o exame eram da universidade
X e tiveram conceito A; 5% eram da universidade Y e tiveram conceito C, e assim por diante. Sabendo-se
que um estudante qualquer teve conceito A, a probabilidade de que ele tenha estudado na universidade X
é:
a) 1/3 b) 1/4 c) 1/5 d) 2/3 e) 2/5
13) Para selecionar seus funcionários, uma empresa oferece aos candidatos um curso de treinamento
durante uma semana. Ao final, eles são submetidos a uma prova e 25% são classificados como bons (B),
50% como médios (M) e os restantes 25% como fracos (F). Como medida de economia, o departamento
de seleção pretende substituir o treinamento por um teste contendo perguntas envolvendo conhecimentos
gerais e específicos. Mas, para isso, gostaria de conhecer qual a probabilidade de que um individuo
aprovado no teste fosse considerado fraco, caso fizesse o curso. Assim, nesse ano, antes do início do
curso, os candidatos foram submetidos ao teste e, de acordo com os resultados receberam o conceito
aprovado (A) ou reprovado (R). Ao final do curso, obtiveram as seguintes probabilidades condicionais:
P(A|B) = 0,80; P(A|M) = 0,50 e P(A|F) = 0,20. Ajude a empresa a decidir sobre a substituição do
treinamento pelo teste, calculando a probabilidade de que um indivíduo aprovado no teste seja
considerado fraco.
Parte II – Variável Aleatória Discreta e Valor Esperado
01) Calcule a média μ ou E(X), a variância (2) e o desvio padrão () das distribuições de probabilidades
das variáveis aleatórias abaixo:
a) X: 2 4 7 9
P(X): 0,1 0,6 0,2 0,1
b) Y: -1 0 1 3
P(Y): 2/5 1/5 1/5 1/5
29
02) Um jogador lança três moedas não-viciadas. Ganha R$6,00 se aparecerem somente caras; perde
R$2,00 se aparecerem somente coroas; ganha R$2,00 se aparecerem duas caras e perde R$3,00 se
aparecerem duas coroas. Qual a esperança matemática do jogo?
03) Um jogador lança 2 moedas não-viciadas. Ele ganha R$5,00 se ocorrerem duas caras; R$2,00 se
ocorrer uma cara e R$1,00 se não ocorre cara.
a) Ache seu ganho esperado.

b) Qual o valor máximo deve pagar para jogar de modo que ele não tenha prejuízo?
04) Uma indústria fabrica rodas de carro que podem apresentar nenhum, um, dois, três ou quatro defeitos,
com probabilidades de 86%, 6%, 3%, 3% e 2%, respectivamente. O preço de venda de uma roda perfeita
é R$50,00 e, à medida que apresente defeitos, o preço cai 40% para cada defeito apresentado. Qual é a
esperança do preço médio de venda dessas rodas?
05) O tempo T, em minutos, necessário para um operário processar certa peça é uma variável aleatória
com a seguinte distribuição de probabilidade:
T: 2 3 4 5 6 7
P(T): 0,1 0,1 0,3 0,2 0,2 0,1
a) Calcule o tempo médio de processamento.

b) Para cada peça processada, o operário ganha um fixo de R$2,00. Mas, se ele processa a peça em
menos de 6 minutos, ganha R$0,50 por cada minuto poupado. Encontre a distribuição e a média da
variável aleatória G: quantia em R$ ganha por peça.
06) O consumo agregado é dado pela equação W = 1,7 + 0,6X, onde a renda disponível, X, é uma
variável aleatória com valor esperado de 80 e variância de 6. O valor esperado e a variância do consumo,
W, seriam respectivamente: (Faça os cálculos apropriados)
a) 49,7 e 2,16 b) 49,7 e 2,30 c) 49,7 e 3,86 d) 49,7 e 5,30 e) 49,7 e 17,18
07) Os pais de uma estudante prometeram-lhe uma recompensa de US$100 se ela obtiver conceito A em
Estatística, US$50 se obtiver B, mas nenhuma recompensa nos demais casos. Qual é a sua esperança
matemática se as probabilidades de ela obter A ou B são, respectivamente, 0,32 e 0,40?
08) As probabilidades das pessoas que entram em um supermercado para comprarem 0, 1, 2, 3, 4 ou 5

produtos são: 0,24; 0,31; 0,22; 0,15; 0,06 e 0,02, respectivamente. Qual a esperança matemática do
número de produtos comprados?
09) Uma máquina fabrica placas de aço que podem apresentar nenhum, um, dois, três ou quatro defeitos,
com probabilidades de 85%, 5%, 4%, 3% e 3%, respectivamente. O preço de venda de uma placa perfeita
é de R$20,00 e, à medida que apresenta defeitos, o preço cai 50% para cada defeito apresentado. Qual é a
esperança do preço médio de venda dessas placas?
10) Desenham-se círculos concêntricos de 1 e 3 centímetros de raio num alvo circular de 5 centímetros de
raio. Um homem ganha 10, 5 ou 3 pontos (veja a figura abaixo) conforme atinja o alvo no círculo menor,
no do meio ou no de fora, respectivamente. Suponha que atinja o alvo com probabilidade ½. Ache o
número esperado de pontos que esse homem obtém.
30
3 5 10
11) Uma amostra de 3 objetos é escolhida aleatoriamente de uma caixa contendo 12 objetos, dos quais 3
são defeituosos. Ache o número esperado de objetos defeituosos.
3 – MODELO DE DISTRIBUIÇÃO DISCRETA DE PROBABILIDADE: DISTRIBUIÇÃO

BINOMIAL
3.1 – Características do modelo
 Nº. fixo de ensaios ou prova

 Provas ou ensaios independentes
 Dicotomia: Sucesso (S) e Fracasso ou Falha (F). P(S) = p e P(F) = 1 – p = q. De modo que: p + q = 1.
 Probabilidade de sucesso (p) e falha (q) constantes.
3.2 – Função de distribuição de probabilidade
 n  x n x
f (x)  P(X  x)    p  q
 x
n n!
Onde: x = 0, 1, 2, 3, ... , n e   e onde n e p são os parâmetros da distribuição
x !( xnx )!
É comum a notação: X ~ b( n; p ) que quer dizer: X possui distribuição binomial com parâmetros n e p.
3.3 – Média, variância e desvio padrão de uma distribuição binomial

  n p
 2  n pq
  n pq
31
Exemplos
1) Uma prova tem 12 questões do tipo múltipla escolha com 5 alternativas de resposta das quais apenas
uma é correta. Um aluno responde ao acaso as questões (chuta). Determine a probabilidade de que
acerte:
a) No máximo duas questões.
b) Exatamente sete questões.
c) Pelo menos uma questão.
2) Os artigos produzidos por uma fábrica são defeituosos com probabilidade 0,05. a fábrica os vende em
pacotes de 10 e garante que um pacote contém, no máximo, um artigo defeituoso, caso contrário ela
troca o pacote vendido. Qual a probabilidade de que ela troque um determinado pacote.
EXERCÍCIOS – LISTA 3 – Distribuição Binomial
01) Uma amostra de 15 peças é extraída de um lote que contém 10% de peças defeituosas. Calcule a
probabilidade de que:
a) O lote não contenha peça defeituosa
b) O lote contenha exatamente três peças defeituosas
c) O lote contenha pelo menos uma peça defeituosa
d) O lote contenha de três a seis peças defeituosas.
02) Calcule o valor esperado e o desvio padrão para o número de peças defeituosas na amostra do
problema anterior.
03) Em determinada cidade, as despesas médicas são consideradas como responsáveis por 60% de todas
as falências pessoais. Qual é a probabilidade de as despesas médicas serem apontadas como responsáveis
por quatro das próximas seis falências pessoais naquela cidade?
04) Uma pessoa que subscreve certo tipo de apólice de seguro de vida tem 0,30 de probabilidade de
deixá-la caducar dentro de cinco anos. De oito pessoas que subscrevem esse tipo de apólice, qual é a
probabilidade de três delas deixarem-na caducar dentro de cinco anos?
05) Se é verdade que 80% de todos os acidentes industriais podem ser evitados dando-se estrita atenção às
normas de segurança, ache a probabilidade de que quatro entre sete acidentes industriais possam ser
evitados.
06) Prepara-se um exame para admissão no serviço público, de forma que 80% de todos que tenham um
diploma de curso secundário tenham chances de serem aprovados. Achar as probabilidades de que, dentre
14 pessoas com diploma de curso secundário:
a) no máximo 10 sejam aprovados c) exatamente 12 sejam aprovados

b) pelo menos 9 sejam aprovados d) sejam aprovadas de 8 a 12 pessoas
07) Um estudo mostra que 50% das famílias residentes em uma grande área metropolitana tem ao menos
dois carros. Determine as probabilidades de que, dentre 16 famílias selecionadas aleatoriamente naquela
área,
a) exatamente 9 tenham ao menos dois carros;

b) no máximo 6 tenham ao menos dois carros;
c) de 8 a 12 tenham ao menos dois carros.
08) Uma cooperativa agrícola afirma que 95% das melancias vendidas por ela estão maduras e prontas
para consumo. Determine as probabilidades de que, dentre 18 melancias despachadas,
32
a) todas as 18 estejam maduras e prontas para consumo;
b) ao menos 16 estejam maduras e prontas para consumo;
c) no máximo 14 estejam maduras e prontas para consumo.
09) Sabe-se que 20% das pessoas que tomam determinado remédio ficam sonolentas em 2 minutos.
Determine as probabilidades de que, dentre 14 pessoas que tomam o remédio,
a) no máximo duas fiquem sonolentas dentro de 2 minutos;

b) ao menos cinco fiquem sonolentas dentro de 2 minutos.
10) Admite-se que dois quintos dos adultos de certa região sejam alfabetizados. Nestas condições, qual é
a probabilidade de que, entre cinco adultos escolhidos ao acaso,
a) dois sejam alfabetizados b) mais de dois sejam alfabetizados?
11) Uma companhia de seguros vendeu apólices a cinco pessoas, todas da mesma idade e de boa saúde.
De acordo com as tábuas atuariais, a probabilidade de que uma pessoa da idade desses assegurados esteja
viva daí a 30 anos é 2/3. Calcular a probabilidade de que passados 30 anos:
a) todas as cinco estejam vivas b) pelo menos 3 pessoas estejam vivas.
12) Seja X uma variável aleatória com distribuição binominal com E(X) = μ = 1,2 e VAR(X) = 2 = 0,96.
Encontre a distribuição de probabilidade de X..
4 – VARIÁVEL ALEATÓRIA CONTÍNUA
Uma variável aleatória é contínua em R se existir uma função f(x), tal que:
1. f(x) ≥ 0 (não negativa)


2. 

f ( x ) dx  1
A função f(x) é chamada função densidade de probabilidade.

Definições:

a) E( X )   xf ( x)dx

  x  E ( X )
2
b) VAR ( X )   f ( x) dx

ou, equivalentemente: VAR ( X )  E ( X 2 )  E ( X )  2
onde: E( X 2 )  x  f ( x ) dx
2

5 – MODELO DE DISTRIBUIÇÃO CONTÍNUA DE PROBABILIDADE: DISTRIBUIÇÃO

NORMAL
5.1 – Características do modelo:
33
- A média μ (lê-se: mi) e o desvio padrão σ (lê-se: sigma) são os parâmetros da distribuição.
- A curva é SIMÉTRICA.
- A área total sob a curva é igual a UM.
5.2 – Ilustrações da curva normal:
Figura l
X
-3 -  + +3
-2 +2
X-

Z
-3 -2 -1 0 1 2 3
Figura 2
P(a<X<b)
a b
5.3 – Função densidade de probabilidade

2
1  x 
1   
f ( x)  e 2  
, para - ∞ < x < + ∞
 2
Para calcular a probabilidade da figura 2, ou seja, a área entre a e b, devemos fazer:
 x  2
1 
P a  X  b   
b
e 2 2
dx , que apresenta um grau relativo de dificuldade.
a
 2
5.4 – Variável normal padrão ou reduzida (Z)
Refere-se à variável aleatória X em uma nova escala. Ou seja, padroniza-se a variável X da seguinte
forma:
34
X  Onde μ é a média populacional e σ é o desvio padrão populacional.
Z Esta nova variável tem média 0 (zero) e desvio padrão 1 (um).

5.5 – Cálculo de probabilidade utilizando a tabela de distribuição normal
a) P(Z < 2,17) =

b) P(Z < - 1,96) =
c) P(Z > 1,63) =
d) P(Z > - 2,37) =
e) P(- 1,27 < z < 1,37) =
f) P(0,53 < Z < 1,56) =
g) P(Z < - 3, 47) =
h) P(Z > 3,89) =
5.6 – Exemplos sobre distribuição normal
1) Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10.
Determine a probabilidade de um indivíduo submetido ao teste ter nota:
a) menor que 70 b) Maior que 120 c) entre 85 e 115
2) A duração de um certo componente eletrônico tem média de 850 dias e desvio padrão 40 dias.
Supondo a distribuição normal, calcule a probabilidade de esse componente durar:
a) entre 700 e 1000 dias b) mais de 800 dias c) menos de 750 dias
3) Uma distribuição normal tem média =62,4. Determinar  se 0,33 da área sob a curva estão à direita
de 79,2.
4) Em um exame de estatística a nota média foi 70, com desvio padrão 4,5. Todos os alunos com notas
75 a 89 receberam conceito B. Se as notas possuem distribuição normal e se 10 alunos obtiveram
conceito B, quantos fizeram o exame?
5) Um exame apresenta distribuição normal. Sabe-se que as notas 70 e 82 correspondem aos valores
padronizados de 0,85 e 2,58, respectivamente. Caracterize essa distribuição, isto é, encontre  e .
35
EXERCÍCIOS – LISTA 4 – Distribuição Normal
01) O levantamento do custo unitário de produção de um item de uma empresa revelou que sua
distribuição é normal com média R$ 50,00 e desvio padrão R$ 4,00. Se o preço de venda unitário desse
produto é de R$ 60,00, qual a probabilidade de uma unidade desse item, escolhida ao acaso, ocasionar
prejuízo à empresa?
02) Uma empresa produz um equipamento cuja vida útil admite distribuição normal com média 300 horas
e desvio padrão 20 horas. Se a empresa garantiu uma vida útil de pelo menos 280 horas para uma das
unidades vendidas, qual a probabilidade de ela ter que repor essa unidade?
03) Uma variável aleatória distribui-se normalmente com média 80 e variância 9. Calcule o intervalo
central que contém:
a) 50% dos valores b) 95% dos valores c) 68% dos valores
04) Os balancetes semanais realizados em uma empresa mostraram que o lucro realizado distribui-se
normalmente com média R$ 48.000,00 e desvio padrão R$ 8.000,00. Qual a probabilidade de que:
a) Na próxima semana o lucro seja maior que R$ 50.000,00?

b) Na próxima semana o lucro esteja entre R$ 40.000,00 e R$ 45.000,00?
c) Na próxima semana haja prejuízo?
05) O departamento de Marketing de uma empresa resolve premiar 5% dos seus vendedores mais
eficientes. Um levantamento das vendas individuais por semana mostrou que elas se distribuíam
normalmente com média R$ 240.000,00 e desvio padrão R$ 30.000,00. Qual o volume mínimo de vendas
que um vendedor deve realizar para ser premiado?
06) Um fabricante sabe que a resistência dos resistores que produz tem distribuição normal com média
igual a 100 ohms e desvio padrão 2 ohms. Que percentagem de resistores terá resistência:
a) entre 98 e 102 ohms? b) maior do que 95 ohms?
07) O peso médio de 500 estudantes do sexo masculino é 75 kg. Admite-se que esta variável tem
distribuição normal e desvio padrão igual a 6 kg. Determine o número esperado de estudantes no grupo:
a) com mais de 81 kg b) cujo peso esteja entre 69 e 81 kg.
08) Uma máquina de ensacar determinado produto apresenta variações de peso com desvio padrão de 3
kg. Admite-se a distribuição normal nesta situação.
a) Se a máquina for regulada para um peso médio de 60 kg, qual a probabilidade de obter sacos com
menos de 55 kg?
b) Em quanto deve ser regulado o peso médio do saco para que apenas 10% tenham menos de 60 kg?
09) Uma máquina de ensacar determinado produto apresenta variações de peso com desvio padrão de 2
kg (admitir distribuição normal). Em quanto deve ser regulado o peso médio do saco para que apenas 5%
tenham menos de 60 kg?
10) Suponha que as notas de um exame são normalmente distribuídas com a média 76 e desvio padrão 15.
Sabe-se que 15% dos estudantes mais adiantados recebem a nota A e 10% dos mais atrasados recebem a
nota F. Encontre:
a) o grau mínimo para receber um A

b) o grau mínimo para passar (não receber um F).
11) Um exame apresenta distribuição normal. Sabe-se que as notas 75 e 88 correspondem aos valores
padronizados de -0,4 e 1,3, respectivamente. Caracterize essa distribuição. Isto é, determine a média () e
o desvio padrão ().

Estatística - Apostila 1 Curso de Engenharia Civil

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Estatística - Apostila 1 Curso de Engenharia Civil

Diunggah oleh

Hak Cipta:

Format Tersedia

ESTATÍSTICA – APOSTILA 1

CURSO DE ENGENHARIA CIVIL

Prof. Jorge Santana

“Todas as ciências têm suas raízes na história do homem.

2.5 – Uma estatística

2.6 – Estudo observacional

3 – VARIÁVEIS: qualitativa (ou categórica) e quantitativa; níveis de mensuração de variáveis.

3.1 – Variável qualitativa (ou categórica)

3.2 – Variável quantitativa

3.2.1 – Variável quantitativa discreta

3.2.2 – Variável quantitativa contínua

3.3 – Níveis de mensuração de variáveis

3.3.1 – Nível nominal

3.3.2 – Nível ordinal

3.3.3 – Nível intervalar

3.3.4 – Nível razão

4.1 – Amostragem probabilística

4.1.1 – Amostragem casual ou aleatória simples

4.1.2 – Amostragem casual estratificada proporcional

n1  f  N 1  0,20  3270  654

Sorteiam-se, em cada estrato, as quantidades de indivíduos calculadas acima.

4.1.3 – Amostragem sistemática

1º elemento = nº. aleatório multiplicado por 8.

4.1.4 – Amostragem por conglomerado em 1 estágio

Sistema de referência (conglomerado): os quarteirões da cidade.

5 – ESTATÍSTICA DESCRITIVA E ANÁLISE EXPLORATÓRIA DE DADOS

5.1 -–Tratamento estatístico de variáveis quantitativas

5.2 – Medidas de tendência central

5.2.1 – Média aritmética simples ( x )

Exemplo: amostra de pesos (kg) de 7 alunos de uma turma.

5.2.2 – Mediana (Md)

Pesos: 70 70 72 80 90 92 94 (Observe que os dados estão ordenados) n = 7

exatamente na quarta posição. Assim, a mediana é: Md = 80 kg.

Pesos: 70 72 80 90 92 94 (Observe que os dados estão ordenados) n=6

Primeiro termo central: x n  x 6  x3 que equivale ao valor 80

Segundo termo central: x n 1  x 6 1  x4 que equivale ao valor 90

5.2.3 – Moda (Mo)

Como o peso que mais se repete é 70, pode-se dizer que: Mo = 70 kg

Breve comentário sobre as medidas de tendência central

Tabela resumo sobre as medidas de tendência central do exemplo

Medidas de tendência central da amostra do exemplo

5.3 – Medidas de dispersão ou variabilidade

5.3.1 - variância amostral (s2)

5.3.2 – Desvio padrão amostral (s)

5.3.3 – Coeficiente de variação (CV)

Exemplo 1: As turmas A e B do 1º período de Engenharia Civil apresentaram as estatísticas abaixo em

Estatísticas das notas de uma prova de cálculo I

Chamando de CVA e CVB os coeficientes de variação das turmas A e B, tem-se:

Estes valores, se multiplicados por 100, correspondem a 10% e 16%.

Comentário: o valor do coeficiente de variação, em termos de identificar alta ou baixa homogeneidade,

CV  0,10 : Baixa dispersão

Chamando de ZJ o escore do João e ZM o escore da Maria, tem-se:

5.5 – Distribuição de freqüência (variáveis quantitativas)

5.5.1 – Distribuição de freqüência sem intervalos de classe

Exemplo: amostra das idades (em anos) de uma amostra de alunos.

5.5.2 – Distribuição de freqüência com intervalos de classe

Determinação do número de classes e da amplitude do intervalo:

Classes: i = 1 + 3,3(logn) = 1 + 3,3log40 = 1 + 3,3(log40) = 1 + 3,3(1,602059991) = 6,286797971 = 6

5.6 – Estudo dos percentis (Pk)

5.7 – Média ponderada x p

3) Nos itens a, b, c, d abaixo, indique se a descrição dada corresponde a um estudo observacional ou a

c) Em determinada cidade, faz-se um levantamento do número de pessoas contaminadas com o vírus