Anda di halaman 1dari 96

UNIVERSIDADE ESTADUAL DE MARING

DEPARTAMENTO DE ESTATSTICA
CURSO DE ENGENHARIA CIVIL

PROF: VALENTINA DE LOURDES MILANI CRAFT

2017
2

I - INTRODUO

1. OBJETIVOS DA DISCIPLINA: Capacitar o acadmico a:

-Coletar e organizar dados.


-Apresentar os dados por intermdio de tabelas e/ou grficos.
-Analisar dados aplicando os recursos estatsticos necessrios.
-Fazer inferncias e previses interpretando os resultados numricos fornecidos atravs dos recursos
estatsticos.
-Utilizar profissionalmente mtodos cientficos da teoria estatstica em seu campo de trabalho.
=Entender a literatura cientfica da rea.

2. DEFINIO:. A Estatstica uma coleo de mtodos para planejar experimentos, obter dados e
organiz-los, resumi-los, analis-los, interpret-los e deles extrair concluses (TRIOLA, 1998).Segundo
Levasseur: A estatstica o estudo numrico dos fatos sociais.

3. CLASSIFIO: Usualmente, a estatstica dividida em trs grandes reas que atuam em conjunto:
amostragem e planejamentos de experimentos, estatstica descritiva e estatstica inferencial.

3.1 PLANEJAMENTO DE EXPERIMENTOS E AMOSTRAGEM: a parte que tem por


objetivo planejar a pesquisa e se preocupa com o mecanismo da coleta de dados.

3.2 - ESTATSTICA DESCRITIVA: a parte da Estatstica que tem por objetivo organizar,
apresentar e sintetizar dados observados de determinada populao, sem pretender concluses de carter
extensivo.

3.3 - ESTATSTICA INDUTIVA OU INFERENCIAL: a parte da Estatstica que usa uma


amostra para fazer generalizaes a respeito de aspectos importantes de uma populao, procurando inferir,
induzir ou verificar leis de comportamento da populao da qual a amostra foi retirada. A estatstica
inferencial tem sua estrutura fundamentada na teoria matemtica das probabilidades. tambm definida
como um conjunto de mtodos para a tomada de decises.

Na estatstica indutiva ou inferencial destacamos:

a) Estimao de parmetros: Esta fase envolve a obteno da melhor estimativa possvel de um


parmetro da populao, a partir dos dados coletados. Ser necessrio estimar valores
desconhecidos quando eles so impossveis de serem conhecidos com exatido. Por exemplo: as
vendas dos produtos da empresa nos prximo ano, o vencedor na prxima eleio, a rentabilidade
das aes no prximo ms, etc. A qualidade da estimao est estreitamente ligada qualidade
dos dados coletados e, s vezes, pode estar errada.
b) Testes de hipteses: o uso dos dados para verificar afirmaes sobre parmetros da populao.
Por exemplo: o aumento das taxas de juros no est estimulando os investidores a investir no
mercado de aes; o erro cometido nos demonstrativos financeiros mensais menor que as
despesas mensais com Xerox, etc. Os testes de hipteses so um meio de decidir qual das
afirmaes correta, dentro de um erro tolervel.
3
4 - LEVANTAMENTO ESTATSTICO DE DADOS

Os dados so a matria prima da Estatstica. Definido o assunto de interesse, os dados so obtidos da


medio de determinada caracterstica ou propriedade desse objeto, pessoa ou coisa. O levantamento dos
dados deve ser feito com muito cuidado pois dele depender o sucesso da anlise estatstica.

- ETAPAS DE UM LEVANTAMENTO ESTATSTICO

4.1 - PLANEJAMENTO EXPERIMENTAL


Consiste no planejamento da pesquisa que ser realizada:
O Que? - Definir o problema. As etapas seguintes sero planejadas aps ter ficado claro qual o
problema a ser investigado.
Para que? - Definir claramente o(s) objetivo(s) da pesquisa.
Onde? Definir o espao fsico.
Em quem? - Definir as entidades que sero verificadas.
Em quantos? - O nmero de entidades a serem pesquisadas deve ser fixado segundo a
preciso desejada nos resultados que sero obtidos. As normas para a fixao deste nmero sero dadas no
decorrer desta disciplina.

4.2 - AVALIAO DE INFORMAES EXISTENTES


Inicialmente, deve-se realizar um levantamento bibliogrfico sobre o assunto para obter
subsdios que podem representar valiosa colaborao para o estudo e, tambm, serem aproveitados nas
discusses posteriores.

4.3 FORMULAO DE HIPTESES


Com exceo das pesquisas meramente descritivas, todas as pesquisas estatsticas comportam
a formulao de hipteses.
Com base nos dados observados, a hiptese ser rejeitada ou no.

4.4 - VERIFICAO DAS HIPTESES


A verificao das hipteses ser realizada no decorrer da pesquisa.

4.5 DELINEAMENTO DA PESQUISA


Compreende o estudo (planejamento) detalhado da coleta de dados, da realizao do trabalho
e da anlise dos dados.
Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados
retirados por outros indivduos.
Para o caso de dados retirados diretamente da fonte, existem 3 procedimentos: a observao, o
questionrio ou interrogatrio e a entrevista.
Observao: a observao direta dos fenmenos em laboratrios ou na natureza.
Questionrio: uma seqncia de perguntas previamente preparadas e aplicado por meio de
entrevista ou remetido pelo correio. Os valores observados podem ser complementados por observao.

4.6 EXECUO DA PESQUISA


Coleta dos dados.
Realizao da anlise estatstica.

4.7 ANLISE E APRESENTAO DOS RESULTADOS


Os dados coletados devem ser apresentados na forma de: grficos e/ou de tabelas.
A anlise dos dados deve ser realizada pelo pesquisador, com a ajuda de um estatstico,
aplicando os recursos estatsticos necessrios para refutar ou no as hipteses previamente formuladas.
4
II AMOSTRAGEM COLETA DE DADOS

A amostragem naturalmente usada na vida diria. Por exemplo, para verificar o tempero de um
alimento em preparao, pode-se provar (observar) uma pequena poro deste alimento. Desta forma, est se
fazendo uma amostragem, ou seja, extraindo do todo (populao) uma parte (amostra), com o propsito de
avaliar (inferir) a qualidade de tempero de todo o alimento.
Nas pesquisas cientficas em que se quer conhecer algumas caractersticas de uma populao,
tambm muito comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa
amostra, obter valores aproximados, ou estimativas, para as caractersticas populacionais de interesse. Este
tipo de pesquisa usualmente chamado de levantamento por amostragem.
Num levantamento por amostragem, a seleo dos elementos que sero observados, deve ser feita sob
uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar
caractersticas de toda a populao.
A populao pode ser formada por pessoas da famlia, indivduos de uma certa espcie,
estabelecimentos industriais, ou qualquer outro tipo de elementos, cujas variveis que se pretende estudar
sejam passveis de serem mensuradas.
Os elementos de uma populao diferem entre si com respeito a fatores tais como: sexo, idade,
medidas fsicas, cor, susceptibilidade a doena, agressividade, etc. Desta forma o padro de comportamento
no qual o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. Por
estas razes, muitos trabalhos tendem a ser de natureza comparativa, procurando lidar com estas variaes
inerentes. Alguns exemplos: pode-se estudar o nmero mdio de ovos de uma certa espcie de pssaros sob
uma condio ambiental particular, ou a proporo de sujeitos protegidos por uma certa vacina imunolgica,
etc.

2.1 DEFINIES

POPULAO: Qualquer conjunto de elementos que descreve algum fenmeno do nosso interesse .
Pesquisas utilizando todos os elementos da populao denominam-se censo.

AMOSTRA: Qualquer subconjunto da populao. Pesquisas utilizando amostras da populao


denominam-se pesquisa por amostragem.

PARMETROS: Medida numrica que descreve uma caracterstica de uma populao (Ex.: idade
mdia de toda a turma um parmetro). Genericamente representado por . exemplos Alguns exemplos so:
mdia (), a varincia ( 2 ), o coeficiente de correlao ( ).

INFERNCIA ESTATSTICA: refere-se ao uso apropriado dos dados da amostra, para se ter
conhecimento sobre os parmetros da populao.

ESTIMADOR, ESTATSTICA DE UM PARMETROS: Qualquer funo de uma amostra.


Genericamente representada por . Exemplos de estimador: mdia amostral ( x ), a varincia amostral ( S 2
), coeficiente de correlao (r).

ESTIMATIVA: o valor numrico determinado pelo estimador genericamente representado por : .


0 .
UNIDADE DE AMOSTRAGEM: a unidade a ser selecionada para se chegar aos elementos da
populao. Pode ser os prprios elementos da populao, ou outras unidades fceis de serem selecionadas e
que, de alguma forma, estejam associadas aos elementos da populao.

VARIVEIS: so as caractersticas, propriedades ou atributos de uma unidade da populao, cujo


valor pode variar de uma unidade para outra. Portanto, as variveis apresentam variabilidade dentro da
populao. Podem ser qualitativas ou quantitativas.
5
Variveis Qualitativas (so atributos) Ex.: sexo, religio, naturalidade, cor dos olhos, etc. Quantitativas (so numricas) Discretas
Conjunto finito de valores conjunto enumervel CONTAGEM (1,2,3,4...) Ex.: qtd. de estudantes em um uma disciplina; qtd.
de cmodos em uma residncia Contnuas Nmero infinito de valores possveis escala contnua MENSURAO (Ex.:
medidas de tempo: tempo de vo entre duas cidades; durao da bateria de um celular)

VARIVEIS QUALITATIVAS: quando seus valores forem expressos por atributos (no-
numricos). Podem ser:
- nominal quando tem nome (sexo, religio, cor dos olhos, nacionalidade, ...)
- ordinal quando tem ordem (primeiro, segundo,...).

VARIVEIS QUANTITATIVAS: quando seus valores podem ser descritos numericamente. Podem
ser:
- discreta quando seus valores resultam de contagem (nmero de vendas dirias,
nmero de filhos, nmero de peas com defeito na produo mensal, ...).
- contnua quando seus valores resultam de medies e podem assumir qualquer
valor em um intervalo da reta (durao da bateria de um celular, consumo mensal de energia eltrica, peso,
altura, temperatura, ...).

Abusos da Estatstica
Pequenas amostras
Pesquisou-se 10 dentistas. 7 entre 10 dentistas preferem dentifrcio X.
Porcentagens distorcidas
Tirei 1 na primeira prova. Tirei 2 na segunda prova. Melhorei 100%!
Perguntas tendenciosas
Voc a favor da suspenso do pagamento da dvida externa, sobrando assim mais dinheiro para ajudar as
criancinhas famintas?
Voc a favor da proibio de fabricao e venda de armas mortferas de fogo no Brasil?
Presso do pesquisador ou ambiente
Voc j traiu seu(a) companheiro (a)? Pergunta feita com o(a) companheiro (a) ao lado.

2.2 - POR QUE AMOSTRAGEM ?

-ECONOMIA. Em geral, torna-se bem mais econmico o levantamento de somente uma parte da
populao.

-TEMPO. Em geral a pesquisa por amostragem bem mais rpida que o censo. Numa pesquisa
eleitoral, a trs dias de uma eleio presidencial no haveria tempo suficiente para pesquisar a populao de
eleitores do pas, mesmo que houvesse recurso financeiro em abundncia.

-OPERACIONALIDADE. mais fcil realizar operaes de pequena escala. Um dos problemas


tpicos nos grandes censos o controle dos entrevistados.

2.3 - SITUAES EM QUE O USO DA AMOSTRAGEM NO INTERESSANTE

POPULAO PEQUENA. Sob o enfoque de amostragem aleatrias que ser estudado no prximo
item, se a populao for pequena (digamos de 50 elementos ou menos) para se ter uma amostra capaz de
gerar resultados precisos para os parmetros da populao, ser necessrio uma amostra relativamente
grande (em torno de 80% da populao).

CARACTERSTICA DE FCIL MENSURAO. Mesmo que a populao no seja to pequena,


a varivel que se quer observar pode ser de to fcil mensurao, que no compensa investir num plano de
amostragem. Por exemplo, para verificar a porcentagem de funcionrios favorveis mudana no horrio de
um turno de trabalho, pode-se entrevistar toda a populao no prprio local de trabalho.
6
NECESSIDADE DE ALTA PRECISO. A cada dez anos o IBGE realiza um censo demogrfico
para estudar diversas caractersticas da populao brasileira. Dentre estas caractersticas tm-se o parmetro
nmero de habitantes residentes no pas, que fundamental para o planejamento do pas. Desta forma este
parmetro precisa ser avaliado com grande preciso e, por isto, se pesquisa toda a populao.

2.4 - TCNICAS DE AMOSTRAGEM

Para se fazer um plano de amostragem necessrio ter bem definidos os objetivos da pesquisa, a
populao a ser amostrada, bem como os parmetros que precisam ser estimados para atingir os objetivos
da pesquisa. Num plano de amostragem deve constar as variveis, a definio da unidade de amostragem, a
forma de seleo dos elementos da populao e o tamanho da amostra.

2.5 - AMOSTRAS PROBABILSTICAS E NO PROBABILSTICAS

A seleo dos elementos que faro parte da amostra pode ser feita sob alguma forma de sorteio ou
por escolha deliberada. As amostras obtidas atravs de algum tipo de sorteio so chamadas amostras
probabilsticas ou aleatrias, sendo que cada elemento da populao tem a mesma chance de ser escolhido, e
cada elemento escolhido de forma independente dos outros.
Todas as amostras de tamanho n possveis de serem formadas e extradas de uma populao tm a
mesma chance de serem selecionadas.
Estes tipos de amostragens so particularmente interessante por permitirem a utilizao das tcnicas
clssicas de inferncia estatsticas, facilitando a anlise dos dados e fornecendo maior segurana ao
generalizar resultados da amostra para a populao.

As amostras no aleatrias ou no probabilsticas podem levar a resultados teis, no se prestam,


entretanto, utilizao de processos estatsticos infernciais.

Exemplos de casos de amostragens no probabilsticas:


- Amostragem sem critrio(escolha desordenada);
- Amostragem intencional (o pesquisador escolhe certos elementos para a amostra);
- Amostragem com desigualdade de acesso aos elementos da populao (h elementos com mais facilidade
de figurarem na amostra).

2.6 - ALGUNS TIPOS DE AMOSTRAGENS PROBABILSTICAS

2.6.1 - AMOSTRAGEM ALEATRIA SIMPLES.


Para a seleo de uma amostra aleatria simples necessrio ter uma lista completa dos elementos da
populao (ou de unidades de amostragens apropriadas). Este tipo de amostragem consiste em selecionar a
amostra atravs de um sorteio, sem restrio
Seja uma nica populao com N elementos. Uma forma de extrair uma amostra aleatria simples de
tamanho n, sendo n < N, identificar os elementos da populao em pequenos pedaos de papel e retirar, ao
acaso, n pedaos. Ser considerado sorteio realizado sem reposio.
A amostragem aleatria simples tem a seguinte propriedade: qualquer subconjunto da populao,
com o mesmo nmero de elementos, tem a mesma chance de fazer parte da amostra. Em particular tem-
se que cada elemento da populao tem a mesma probabilidade de pertencer amostra. impraticvel
quando a populao muito grande.

O USO DE TABELAS DE NMEROS ALEATRIOS


7

As tabelas de nmeros aleatrios facilitam o processo de seleo de uma amostra aleatria simples.
Tais tabelas so formadas por sucessivos sorteios de algarismos do conjunto {0, 1, 2, 3,..., 9}, com
reposio.

Procedimento:
1) Enumerar todos os elementos da populao.
2) Sortear uma linha ou coluna da tabela de nmeros aleatrios.
3) Ler os nmeros na tabela de nmeros aleatrios de modo que o nmero de algarismos em cada um seja
igual ao nmero de algarismos do ltimo da sua listagem. Assim, se o ltimo nmero 56, devem ser lidos
nmeros com dois algarismos.
4) Desprezar quaisquer nmeros que no correspondam a nmeros da lista. No caso de amostragem sem
reposio, despreze tambm os nmeros que sejam repeties de nmeros lidos anteriormente. Continue o
processo at obter o nmero desejado de observaes.
5) Usar os nmeros assim escolhidos para identificar os itens da lista a serem includos na amostra.

Exemplo 5 : Uma grande industria fabricante tinta, com diversas filiais no pas, passou a receber no ltimos
meses, diversas reclamaes sobre a qualidade de um de seus principais produtos. Na tarefa de escolher e
analisar causas mais provveis para o problema, a equipe tcnica da indstria desejava confirmar sua
hiptese de que a causa fundamental era a existncia de diferenas na qualidade da matria prima (cromita)
vendida pelos 35 fornecedores da empresa. Existia a suspeita de que os lotes de cromita vendidos diferiam
em relao ao teor mdio de Cr 2 O 3 que este fator estava comprometendo a qualidade do produto. Para
agilizar a anlise do problema a empresa realizou o estudo por amostragem usando apenas 10 fornecedores e
os resultados obtidos p/ teor de Cr 2 O 3 em 13 lotes entregue por cada um deles. Na tabela abaixo esto
representados os fornecedores e os resultados obtidos p/ o teor de Cr 2 O 3 do ltimo lote de matria prima
entregue por cada um respectivamente:
POPULAO
01-Cromix (46) 08-Cromil (45) 15-Sicrosul (47) 22-Incromit (51) 29-Cromilpa (47)
02-Incroeste (46) 09-Sicroval (43) 16-Macroval (47) 23-Cromisp (43) 30-Incropar (44)
03-Macrosul (43) 10-Cromitax (51) 17-Cromipar (51) 24-Incromar (48) 31-Cromisul (43)
04-Cromalt (48) 11-Cromixel (46) 18-Incrosul (42) 25-Cromipe (44) 32-Incrosc (49)
05-Incovalt (46) 12-Crominas (44) 19-Incruscrom (45) 26-Cromiba (46) 33-Crominor (44)
06-Sincroest (46) 13-Cromalesp (44) 20-Cromisc (49) 27-Macropar (52) 34-Sicropol (48)
07-Cromax (50) 14-Cromalesc (45) 21-Sicronor (50) 28-Cromice (42) 35-Cromival (43)
Para se utilizar uma tabela de nmeros aleatrios, preciso associar cada elemento da populao a
um nmero. Por simplicidade, ser considerado nmeros inteiros sucessivos, com a mesma quantidade de
algarismos iniciando-se por 01 (um).

Para se extrair uma amostra aleatria simples de tamanho n=5, basta tomar cinco nmeros aleatrios
do conjunto {01, 02, ..., 35}. As empresas associadas aos ns selecionados formaro a amostra. Neste
exemplo, suponha que foi sorteada a 1 linha. Desprezando os valores que estiverem fora do conjunto {01,
02, ..., 35} e os valores que se repetirem, tem-se:

Nmeros aleatrios extrados da tabela: 17 15 30 03 34

Amostra da populao de fornecedores:

Na prtica, interessa observar certas variveis associadas aos elementos da amostra. No exemplo em
questo, poderia se estar interessado na varivel Teor de Cr 2 O 3 . Esta varivel ser denominada de X. Para
cada fornecedor da amostra, tem-se um valor para a varivel X. O conjunto destes valores, observados na
amostra de fornecedores, chamado de amostra aleatria simples da varivel X.

Amostra aleatria simples dos fornecedores:


{ Cromipar, Sicrosul, Incromar, Macrosul, Sicropol}
8

X: {X1 , X2, X3, X4, X5 }


Amostra aleatria simples de onde X1 representa o Teor de Cr 2 O 3 da empresa Cromipar,,, X2 o teor de
Teor de Cr 2 O 3 da empresa Sicrosul, etc. Ou seja:

{17 15 30 03 34 }

2.6.2 - AMOSTRAGEM SISTEMTICA

Muitas vezes possvel obter uma amostra de caractersticas parecidas com a amostra aleatria
simples, por um processo bem mais rpido. Por exemplo, tirar uma amostra de 1.000 fichas, dentre uma
populao de 5.000 fichas, pode-se tirar, sistematicamente, uma ficha a cada cinco (5.000/1.000 = 5). Para
garantir que cada ficha da populao tenha a mesma probabilidade de pertencer amostra, a primeira ficha
deve ser sorteada, dentre as cinco primeiras.
Numa amostragem sistemtica a relao N/n chamada intervalo de seleo. No exemplo das
fichas o intervalo de seleo 5.000/1.000 = 5.

Exemplo 6 - Considerar a populao dos N=35 fornecedores do Exemplo 5. Realize uma amostragem
sistemtica para obter uma amostra de tamanho n=5. Inicialmente, o intervalo de seleo deve ser calculado:
N/n = 35/5 = 7. A seguir, um elemento deve ser sorteado dentre os sete primeiros. Suponha que o
nmero sorteado o 3, ou seja, o primeiro hotel da amostra o Macrosul. Os demais so obtidos pelo
intervalo de seleo 7(ou seja, de 7 em 7), a partir do Macrosul, resultando na seguinte amostra:

(03) (10) (17) (24) (31)


{Macrosul, Cromitax, Cromipar, Incromar, Cromisul }

2.6.3 - AMOSTRAGEM ESTRATIFICADA

A tcnica de amostragem estratificada consiste em dividir a populao em subgrupos, que so


denominados de estratos. Estes estratos devem ser internamente mais homogneos do que a populao toda,
com respeito s variveis em estudo. Por exemplo, para estudar alguns parmetros, de um conjunto de
hotis, pode-se estratificar esta populao por quantidade de estrelas, pelo tipo de acomodaes (quarto,
apartamento, chal etc), ou pela distncia at o centro da cidade. Deve-se escolher um critrio de
estratificao que fornea estratos bem homogneos, com respeito ao que se est estudando. Neste contexto,
um prvio conhecimento sobre a populao em estudo fundamental.
Sobre os diversos estratos da populao, so realizadas selees aleatrias, de forma independente. A
amostra completa obtida atravs da agregao das amostras de cada estrato. Ver figura 2:

Estrato 1 subgrupo 1 da amostra


selees
Estrato 2 subgrupo 2 da amostra Amostra
aleatrias
Estratificada
...
Estrato K subgrupo K da amostra
Figura 2 - O processo de amostragem estratificada.

Amostragem estratificada proporcional: neste caso particular de amostragem estratificada, a


proporcionalidade do tamanho de cada estrato da populao mantida na amostra. Por exemplo, se um
estrato corresponde a 20% do tamanho da populao ele tambm deve corresponder a 20% da amostra. Ver
figura 3:
POPULAO: espcie da floresta.
AMOSTRA: parte da comunidade da floresta
9

Figura 3 - Ilustrao de uma amostragem estratificada proporcional.

A amostragem estratificada proporcional garante que cada elemento da populao tem a mesma
probabilidade de pertencer a amostra.

Exemplo 7 Na populao do ex 5 os fornecedores esto distribudos em regio conforme mostra a tabela


abaixo:

Nordeste Cromax Cromape Cromiba Cromice Crominor Incromar Sicronor


Sudeste Cromix Incroeste Sicroeste Crominas Cromales Cromisp Sicropol
Sul Cromalt Cromil Macrosul Sicrosul Cromixel Cromales Cromipar
Cromisc Cromilpa Cromisul Incrosu Induscron Incromit Macropar
Incroval Cromitax Macroval Incrosc Sicroval Incropar Cromival

Supondo que o fornecedor possa ser relativamente homogneo dentro de cada regio, foi realizada
uma amostragem estratificada, proporcional por categoria, para obter uma amostra global de tamanho n=10.
A tabela seguinte mostra as relaes de proporcionalidade.

Tabela 1. Clculo do tamanho da amostra em cada estrato


ESTRATO Proporo na populao Tamanho do subgrupo na amostra
Nordeste 7/35= 0,2 (ou 20%) n1 = (0,20).10 =2
Sudeste 7/35= 0,2 (ou 20%) n2 = (0,20).10 = 2
Sul 21/35= 0,6 (ou 60%) n3 = (0,60).10 = 6

Observao: Note que a soma dos tamanhos dos subgrupos na amostra deve ser igual ou maior ao tamanho
da amostra. Isto , n = n1+n2+n3.
10

Para selecionar aleatoriamente 2 empresas do Nordeste, preciso extrair nmeros de dois algarismos.
Usando a prpria numerao da populao e iniciando pela terceira linha da tabela.
Neste caso, pode-se usar a tabela de nmeros aleatrios, tomando valores com um algarismo.
Usando, por exemplo, a primeira linha da tabela de nmeros aleatrios (03, 06), os seguintes foram
selecionados: { Cromiba, Incromar }, correspondentes aos dois primeiros nmeros desta linha.
Para o Sudeste, usando a segunda linha da tabela de nmeros aleatrios (01, 07), com o mesmo
processo de numerao, tem-se: { Cromix , Sicropol } (sem repetio).
Para o Sul, usando a terceira linha da tabela de nmeros aleatrios ( , , , , , ).

A amostra{ , , , , , , , , , } uma
amostra estratificada proporcional dos fornecedores. Cada elemento desta amostra dever ser pesquisado
para se levantar a caracterstica de interesse, ou seja, o preo das dirias.
Desde que no problema em estudo, os estratos formam subgrupos mais homogneos do que a
populao como um todo, uma amostra estratificada proporcional tende a gerar resultados mais precisos,
quando comparada com uma amostra aleatria simples.

2.7 - FONTES DE ERROS NOS LEVANTAMENTOS POR AMOSTRAGEM

O erro amostral, definido como a diferena entre uma estatstica (calculada a partir de uma amostra
de n elementos) e o verdadeiro valor do parmetro (caracterstica de uma populao de N elementos), tais
erros resultam das flutuaes amostrais devidas ao acaso. P arte do princpio de que as n observaes que
compem a amostra so obtidas sem erro. Na prtica, isso geralmente no acontece.

Havendo erros ou desvios nos dados da prpria amostra, a diferena entre a estatstica e o parmetro
pode ser maior que o limite tolervel, que ser usado para o clculo do tamanho da amostra. Por isso, o
planejamento e a execuo da pesquisa devem ser feitos com muita cautela, para evitar ou reduzir, os erros
nos prprios dados da amostra, conhecidos como erros no amostrais.
Alguns dos erros no amostrais so:
- populao acessvel diferente da populao alvo; - falta de resposta; - erros de mensurao.

Tabela de Nmeros Aleatrios

3761 7597 5378 6798 8615 9303 4489 9243 2000 8475 1217 5066
1358 3568 7270 1541 3419 5807 7685 8850 3347 0296 0190 0949
3046 1336 3254 1353 4771 4656 2115 8463 4688 6778 1731 2144
7881 7802 7887 9275 7898 9064 3612 9864 2515 9822 6783 6815
4560 1367 8954 7499 3318 7650 3514 2797 8964 7000 7832 2006
9422 6350 1984 2783 0504 1217 0211 6775 3732 7025 7437 5534
0917 4455 3076 9885 2674 7129 0525 5033 6971 9722 2959 8387
1939 3487 1980 1246 0919 9046 2114 6828 6254 7151 6104 4944
2792 8042 1126 2931 8598 0394 0886 7241 5897 9979 4844 7052
2962 5542 8505 9755 6208 4944 8321 1478 0755 8057 3851 5257
9248 3467 7508 2059 2035 4727 2333 6830 4731 5753 9859 4702
0329 5334 6031 8724 0822 4450 5539 3824 0472 1070 9729 7155
5702 9657 0439 9622 6492 2872 6059 2981 4418 8179 4362 7711
2170 2085 3552 2025 6077 3025 1443 4832 7518 6816 7253 6389
0727 4568 1093 1367 9717 1076 9226 8005 3348 3065 8040 9023
3232 1415 8109 1856 5130 4493 3084 1644 8218 0273 3703 3202
3284 8703 4462 5671 6097 9548 6945 7599 3282 4457 3269 7510
0450 6876 3869 9441 8455 8960 9966 2309 0166 8482 4710 7059
6059 8911 6548 6664 2302 3914 9627 4051 9509 0484 5517 3518
6812 5772 9975 4415 1847 7677 0189 9621 6712 2467 6984 5969
9501 0236 8889 6871 0264 0098 9478 0019 1213 9797 6906 3209
8771 5073 5423 7458 5108 6573 2546 3989 9280 7907 348 5817
1696 3076 7825 0866 6535 4011 0251 230 6308 5592 1875 6828
6694 8886 9289 5263 4103 0624 2571 3820 7183 9722 9759 0653
11
6186 8680 5778 9560 9345 1530 8557 8569 0012 6380 5229 2048
3845 4647 8861 0800 7999 7169 8137 9655 3392 7766 5009 9377
9122 3464 6255 3801 7526 1509 4450 5206 1589 5922 5904 4117
1786 8686 9974 9919 1762 8168 6603 1364 8540 4755 6369 2415
8895 2853 7826 1711 8914 2700 9595 5709 4503 4523 4463 1686
6025 7057 5325 4437 0934 0136 2360 6381 9848 3091 3297 0015
1414 9535 1899 6682 7805 8670 5290 4220 3672 0793 3362 7761
7345 2468 7056 1429 0627 8296 1651 0136 3889 7454 9946 1957
9391 9285 7156 9795 9544 9432 4787 2072 2051 9225 2783 5076
3873 1777 9000 7722 3113 5325 4640 8932 0990 9633 3240 9406
9986 0824 1117 8433 1654 9695 4286 0747 3446 1802 0497 4123
12

LISTA-AMOSTRAGEM

1) Em cada uma das seguintes alternativas especificar o que prefervel censo(c), amostragem(a).
durao da bateria de um celular populao muito grande
pesquisa com custo elevado
pesquisa que exige preciso exata
populao pequena
pesquisa onde os itens analisados so destrudos
pouco espao de tempo para a realizao da pesquisa
2) Classificar como varivel contnua ou discreta
( ) O altmetro de um avio indica uma altitude de 21.359 ps.
( ) Uma pesquisa efetuada com 1015 pessoas indica que 40 no possuem acesso internet.
( ) O radar indica uma velocidade de 81 km/.
( ) 1000 consumidores pesquisados, 930 moram em casa prpria
( ) Fazendo um regime, uma executiva perdeu 13,45kg
( ) A quantidade de cimento usado em um prdio
( ) Salrio inicial de um Engenheiro Civil
( ) Quantidade de funcionrio de uma Empresa

3) Extrair uma amostra aleatria simples de n=08, da populao de fornecedores de Cromita do Exemplo
5 (usando a 3 linha da tabela de n aleatrios).

4) Extrair uma amostra aleatria simples de n=08 da varivel teor de Cr 2 O 3 associada amostra de
fornecedores obtida no ex. anterior.

5) Selecionar uma amostra estratificada proporcional de tamanho 05, da populao do exemplo 5.

6) Selecionar uma amostra estratificada proporcional c/ n=8 do ex. 5 da seguinte forma:

Estrato 1: Fornecedores c/ teor de Cr 2 O 3 menor de 45


Estrato 2: Fornecedores c/ teor de Cr 2 O 3 igual ou maior de 45 e menor de 50
Estrato 3: Fornecedores c/ teor de Cr 2 O 3 maior ou igual a 50.

7) Os domiclios de uma determinada zona urbana foram enumeradas de 1 a 210. Desejando-se uma
amostra sistemtica de tamanho 15 dessa populao de domiclios, foi sorteado o comeo 9.
a) Qual o intervalo dessa amostragem?
b) Quais os ns correspondentes aos domiclios que compe essa amostra?
13
III - ESTATSTICA DESCRITIVA

Com o estudo da ESTATSTICA DESCRITIVA entendemos melhor um conjunto de dados.


.Coletados os dados, surgem ento questes do tipo: Como comunicar os dados obtidos? Como descrever e
caracterizar o conjunto de dados como um todo?
Pode-se tentar l-los e adquirir uma ideia subjetiva da informao nele contida. Porm em muitas
situaes isto no vivel devido ao grande nmero de dados. Alm disso, uma impresso subjetiva no s
difcil de ser transmitida como tambm pouco convincente. Assim, chegamos concluso de que so
necessrias tcnicas estatsticas que reduzam e descrevam uma grande quantidade de informao.
Para condensar e comunicar os dados so usados dois esquemas: as tabelas e as representaes
grficas. Estas estratgias se direcionam de forma diferente quando se trata de dados qualitativos ou
quantitativos, conforme veremos em seguida. Alm disso, os dados podem ser organizados para uma nica
varivel de cada vez, ou envolvendo duas ou mais variveis.
Para caracterizar o conjunto de dados como um todo, faz-se a anlise descritiva dos mesmos atravs
das medidas descritivas.

1 - RESUMO E APRESENTAO DE DADOS QUALITATIVOS

1.1 - TABELAS:

Ao se resumir os dados coletados, em uma tabela, algumas normas devem ser seguidas:

a)Toda tabela deve conter Ttulo e Fonte.

Ttulo: a indicao que precede a tabela e que contm a designao do fato observado, o local e a
poca em que foi registrado.
Fonte: a indicao da entidade responsvel pelo fornecimento dos dados ou pela sua elaborao.

b)Outros dois elementos primordiais na tabela so: o cabealho e a coluna indicadora. O primeiro
evidencia o contedo das colunas e fica na parte superior da tabela, o segundo mostra o contedo das linhas.

c)Cada cruzamento entre linha e coluna denominado clula ou casa.

d)Nenhuma clula ( casa ) deve ficar em branco.

e)Hfen ( - ) , indica que o valor numrico nulo.

f)Reticncia ( ... ) , indica que no se dispe do dado.

g)Interrogao ( ? ) , indica dvida quanto a exatido do valor numrico.

h)Zeros ( 0 ; 0,0 ; 0,00 ), indica valor muito pequeno em relao a unidade utilizada.

i)A tabela no fechada lateralmente por traos verticais.

j)No h obrigatoriedade de linha vertical entre as colunas, mas deve ser usada quando a tabela
apresenta muita informao (muitas colunas e/ou muitas linhas).

1.2 -TABELA SIMPLES: a representao dos valores de uma nica varivel.


14

Coluna OPERADORS QUE GERAM MAIS RECLAMAES


indicadora BRASIL - 2006 Ttulo
Cabealho
OPERADORA ASSINANTES (em 1000)
Telemar 0,532
Embratel 0,448
Brasil Telecom 0,382
GVT 0,275
TOTAL 1,637
Fonte: Revista: info (outubro de 2006) Corpo da tabela

1.3 - TABELAS DE DUPLA ENTRADA OU DE CONTINGNCIA: a representao, em uma


nica tabela, de valores de mais de uma varivel, isto , a conjugao de duas tabelas simples.

Tabela 2 - Evoluo do Indicador de Alfabetismo Funcional populao de 15 a 64 anos (%) - 2012


2001/2002 2002-2003 2003-2004 2004-2005 2007 2009 2011-2012
Analfabeto 12 13 12 11 9 7 6
Rudimentar 27 26 26 26 25 21 21
Bsico 34 36 37 38 38 47 47
Pleno 26 25 25 26 28 25 26
Analfabetos funcionais (analfabeto+rudimentar) 39 39 38 37 37 27 27
Alfabetizados funcionalmente (bsico+pleno) 61 61 62 63 66 73 73
BASE 2002 2002 2002 2002 2002 2002 2002
Fonte: INAF BRASIL 2001 a 2011

2. SRIES ESTATSTICAS. Sries estatsticas, num sentido mais amplo, um conjunto de dados
estatsticos em funo da poca, do local ou da espcie, que podem ser apresentados em forma de tabelas.

2.1. TIPOS DE SRIES ESTATSTICAS:

TEMPORAL - tambm conhecida como CRONOLGICA, EVOLUTIVA ou


HISTRICA. a srie em que os dados so observados segundo a poca de ocorrncia. Nesta srie o fator
varivel tempo e os fixos so: local e espcie.
15

Tabela 3- ndice Econmico- Paran- 2016


CUB
Ms

% ndice
Fevereiro/2015 0.36 181.027
Maro 0.18 181.354
Abril 0.45 182.166
Maio 0.41 182.909
Junho 0.56 183.939
Julho 4.60 192.396
Agosto 0.17 192.718
Setembro 0.20 193.097
Outubro 0.28 193.647
Novembro 0.26 194.143
Dezembro 0.15 194.426
Janeiro/2016 0.13 194.688
Fevereiro 0.23 195.130
Fonte: Siduscon-Pr

GEOGRFICA - tambm denominada TERRITORIAL ou ESPACIAL. a srie em que os dados so


observados segundo a localidade de ocorrncia. Nesta srie o fator varivel local e os fixos so: tempo e
espcie.
Tabela 4- N DE DIAS TRABALHADOS POR ANO PARA PAGAR
IMPOSTO DE RENDA 2006
PAS DIAS
Brasil 2191
Eua 1485
Argentina 1102
Chile 1097
Fonte: Revista Veja 2006

ESPECFICA - tambm conhecida por CATEGRICA. a srie em que os dados so agrupados


segundo a modalidade de ocorrncia.(os dados variam em funo do gnero especfico em estudo).

Tabela 5- ENCARGOS PREVIDENCIRIOS E TRABALHISTAS


Dados sem atualizao dos parmetros e sem considerar o Decreto n 6.727/2009.
16
DESCANSO SEMANAL REMUNERADO 17,64%
FRIAS 11,22%
1/3 CONSTITUCIONAL DE FRIAS 3,74%
FERIADOS 4,06%
AVISO PRVIO TRABALHADO 1,18%
ENFERMIDADE 1,48%
ACIDENTES DE TRABALHO 0,12%
ADICIONAL NOTURNO 0,49%
LICENA-PATERNIDADE 0,06%
13 SALRIO 11,22%
Fonte: CBIC - Cmara Brasileira da Industria da Construo-2009.

DISTRIBUIO DE FREQNCIA - Uma distribuio de frequncia um sumrio tabular de dados


que mostra a frequncia de cada valor ou classe de valor distinto aparece no conjunto de dados de uma
varivel.Muitas vezes, obtm-se informaes relevantes sobre uma varivel atravs de uma distribuio de
frequncias. A srie em que os dados so agrupados segundo suas respectivas frequncias absolutas.

TABELA 6-Teor de Cr2 O3 dos lotes de Cromita


dos fornecedores Industria X-Ano Y
TEOR Freqncia(Fi)
17
42|---44 4
44|---46 3
46 |--- 48 8
48 |--- 50 6
50 |--- 52 4
TOTAL 25
Fonte: Departamento Pessoal

3. GRFICOS

Os grficos so de grande utilidade na apresentao de dados estatsticos. Os nmeros so


considerados frios e de difcil interpretao, mas ganham vida quando so substitudos por figuras que
mostram, com uma simples olhadela, o significado global de um conjunto de dados. Os grficos mais usados
para dados qualitativos so: Barras ou Colunas, Setor e Linha.
Assim como as tabelas, os grficos tambm devem ter ttulo e fonte.

EXEMPLOS:

3.1 - GRFICO EM BARRAS (OU EM COLUNAS): So empregados para representar


informaes de qualquer tipo de varivel, inclusive o tempo (no caso em que o nmero de datas no muito
grande).

3.2. GRFICO EM SETORES: Aplicvel quando as categorias bsicas so quantificveis.


Toma-se um crculo (360 graus), que dividido em setores com reas proporcionais s frequncias das
diversas categorias.
18

3.3. GRFICO EM LINHA: um dos mais importantes grficos; representa observaes feitas ao
longo do tempo, em intervalos iguais ou no. Tais conjuntos de dados constituem as chamadas sries
histricas, ou sries temporais. Traduzem o comportamento de um fenmeno em certo intervalo de tempo.

Fonte:
19
3.4. GRFICO COMPARATIVO: um grfico utilizado quando se deseja comparar
variveis.

4 RESUMO E APRESENTAO DE DADOS QUANTITATIVOS

Quando nos proposta a anlise de um conjunto de dados sem caractersticas de sries cronolgicas,
geogrficas ou especficas, o tratamento descritivo desses dados estatsticos deve iniciar-se por um processo
de sintetizao. A sintetizao dos dados poder ser feita, adotando-se algum critrio de classificao
(subconjuntos ), que permita apresentar os dados em tabelas, de forma resumida. Tais tabelas so chamadas

DISTRIBUIO DE FREQUNCIAS.

4.1. CONSTRUO DE UMA DISTRIBUIO DE FREQNCIA DISCRETA

Para o desenvolvimento desse item, utilizaremos um exemplo.

EXEMPLO 1. Tempo, em segundos, entre carros que passam por um cruzamento de Maring em 02/98,
viajando na mesma direo:
6 3 5 6 4 3 5 4
4 2 3 2 5 4 3 4
Os dados foram obtidos pelo Departamento de Trnsito de Maring.

DADOS BRUTOS ( Xi ): o conjunto de dados numricos obtidos aps a crtica dos valores coletados,
como acima.
20
Representao: - x1,...,xn ( se amostrais )
- x1,...,xN (se populacionais )
ROL: o arranjo dos dados brutos em ordem crescente ou decrescente. O rol em geral, por ser trabalhoso
em sua elaborao, pode ser dispensado.

Organizando os dados brutos do exemplo 1 em ROL CRESCENTE obtemos:

ROL: 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6.

FREQNCIA ABSOLUTA (Fi): o nmero de observaes correspondente a cada classe.

FREQUNCIAS ABSOLUTAS ACUMULADAS ( Fa i ): o total acumulado (soma) de todas as Fi das


classes anteriores at a classe atual.No exemplo 1, a distribuio de frequncia ser:
TEMPO, EM SEGUNDOS, ENTRE CARROS QUE PASSAM
POR UM CRUZAMENTO DE MARING- 02/98
TEMPO (Segundos) Fi Fai
2 2 2
3 4 6
4 5 11
5 3 14
6 2 16
TOTAL 16
Fonte: Departamento de Trnsito.

OBS: Na tabela acima, a coluna dos Fai's uma coluna complementar da distribuio de frequncia. Veremos
no exemplo a seguir uma distribuio de frequncia completa.

GRFICO EM BASTO (ou em Colunas): Utilizado quando os dados consistem em


contagens e no de mensuraes em escala contnua . Os valores distintos Xi's so locados no eixo
horizontal, e em cada um deles traa-se um segmento vertical de altura proporcional respectiva frequncia.
TEMPO, EM SEGUNDOS, ENTRE CARROS QUE PASSAM
POR UM CRUZAMENTO DE MARING - 23/12/97
6

4
N DE CARROS

0
2 3 4 5 6
TEMPO
Fonte: Departamento de Trnsito.

4.2. AGRUPAMENTO DOS DADOS DISTRIBUIO DE FREQUNCIAS


21

Um grande conjunto de dados quantitativos necessita de um mtodo eficiente de agrupamento ou de


sumarizao, de forma que seu manuseio, visualizao e compreenso sejam simplificados. Para isto, os
dados devem ser agrupados em classes.

EXEMPLO 2: Considere uma amostra de 25 indstrias, da varivel nmero de funcionrios de indstrias


Qumicas no Paran em 31/01/2000. Suponha os dados fictcios.

46 47 51 47 43 47 43 44 51 49
48 43 48 46 42 49 46 45 46 44
46 49 51 48 50

Os dados, como apresentados acima, so chamados brutos, pois no foram ainda submetidos a
nenhum tipo de tratamento.

Inicialmente, os dados devem ser colocados em ordem crescente ou decrescente:


42 43 43 43 44 44 45 46 46 46
46 46 47 47 47 48 48 48 49 49
49 50 51 51 51

Pode-se observar agora que das 25 observaes o menor valor 42 e o maior 51.

Amplitude (AT): a diferena entre o maior e o menor valor do conjunto de dados observados.
Para os dados acima: AT = 51-42 = 9.

Observe que esse exemplo contm um nmero pequeno de observaes (n=25), quando h um grande
nmero de dados observados o processo de ordenao trabalhoso e a listagem final pouco representar.
Nesses casos, pode-se simplificar o processo agrupando os dados em certo nmero de classes, cujos limites
sero denominados limite inferior e limite superior.

A quantidade de classes e a amplitude destas devem ser obtidas observando as seguintes normas:
i)as classes devem cobrir a amplitude total;
ii)o extremo superior de uma classe o extremo inferior da classe seguinte;
iii)cada valor observado deve enquadrar-se em apenas uma classe;
iv)o nmero total de classes no deve ser inferior a 5 e nem superior a 25;
O nmero de classes, (k), pode ser obtido de uma das frmulas seguintes:
i) k = n ;
ii) k = 1 + 3,22 log n, (frmula de Sturges).

Para o conjunto de dados do exemplo: k = 25 = 5 ou k = 1 +3,22log(25) = 5,61.

No obrigatrio o uso de qualquer dessas frmulas. O nmero de classes pode ser estabelecido pelo
bom senso de quem vai construir a tabela.

Dividindo a amplitude total (AT) por 5 chega-se ao tamanho ou amplitude de cada uma das classes:
AT 9
h= 1,8 2.
k 5
Observao: quando os valores observados so nmeros inteiros, os limites das classes tambm
devem ser nmeros inteiros. Para isso, aconselha-se escolher o nmero mais prximo de AT que resulte h =
AT
em um nmero inteiro.
k

Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes:
i)o limite inferior da primeira classe o menor valor da srie;
22
ii)os demais limites sero obtidos somando aos limites inferiores o valor de h. Isto ,

42 |----- 42+h = 42 + 2=44


44 |----- 44+h = 46
46 |----- 46+h = 48
48 |----- 48+h = 50
50 |----- 50+h = 52.

Observe que a notao (|-----) significa que se est incluindo os valores iguais ao limite inferior e
excluindo os valores iguais ou superiores ao limite superior.
A partir da listagem ordenada das classes, pode-se construir os chamados quadros (ou tabelas) de
frequncia ou distribuies de frequncia, que permitem uma melhor visualizao dos dados.

Frequncia: o nmero de valores que aparecem no domnio de uma classe.

4.2.1 CONSTRUO DE DISTRIBUIO DE FREQNCIA CONTNUA

Utilizando os limites de classes obtidos acima para o exemplo, tabela abaixo:

Tabela 1 Nmero de funcionrios da Indstria Mecnica X no Paran em 31/01/2000


Classes Frequncia (Fi)
42 |----- 44 4
44 |----- 46 3
46 |----- 48 8
48 |----- 50 6
50 |----- 52 4
TOTAL 25
Fonte: Dados hipotticos

Um quadro de frequncias completo deve conter as seguintes informaes:

i) xi o ponto mdio da i-sima classe; representa a mdia dos pontos limites da classe;
ii) n o tamanho da amostra;
iii) ni o nmero de observaes, ou a freqncia, da i-sima classe;
iv) Fi a frequncia absoluta da i-sima classe;
F
v) fi a frequncia relativa da i-sima classe, fi = i ;
n
vi) Fac a frequncia acumulada;
F
vii) fac a frequncia relativa acumulada, fac = ac .
n

Tabela 2 Nmero de funcionrios da Construo Civil X no Paran em 31/01/2004


Classes xi Fi fi Fac fac
42 |----- 44 43 4 0,16 4 0,16
44 |----- 46 45 3 0,12 7 0,28
46 |----- 48 47 8 0,32 15 0,60
48 |----- 50 49 6 0,24 21 0,84
50 |----- 52 51 4 0,16 25 1
23
Total 25 1
Fonte: Dados hipotticos

4.3. GRFICOS
Os principais grficos utilizados na representao de distribuio de frequncias so:
i) histograma e polgono de frequncia;
ii) ogiva ou polgono de frequncia acumulada.

4.3.1. HISTOGRAMAS: um conjunto de retngulos com bases sobre um eixo dividido de acordo
com os tamanhos de classe, centro nos pontos mdio das classes e reas
proporcionais s frequncias.

Fonte: Dados hipotticos

4.3.2. POLGONOS DE FREQUNCIAS: um grfico que se obtm unindo por uma poligonal os
pontos correspondentes s frequncias das diversas classes, centradas nos respectivos pontos mdios (x i ).
Para obter as intersees do polgono com o eixo, cria-se em cada extremo do histograma uma classe com
freqncia nula.
NMERO DE FUNCIONRIOS DE UMA
CONSTRUTORA EM CURITIBA - 31/01/04
9
8
7
6
5
4
3
2
1
0
39 41 43 45 47 49 51 53 55
Ndeque
OBS: Suavizando a linha poligonal funcionrios
define o polgono obtm-se uma curva que visualiza a
tendncia de variao dos dados.
24
4.3.4. POLGONOS DE FREQNCIA ACUMULADA OU OGIVAS: o grfico representativo
de uma distribuio acumulada de frequncias. uma poligonal ascendente. No eixo horizontal colocam-se
as extremidades de classe e no eixo vertical as frequncias acumuladas.
Note que a frequncia acumulada relacionada com o limite inferior da primeira classe sempre zero.
Ao contrrio do polgono de frequncia, a ogiva de frequncias acumuladas utiliza os pontos
extremos

NMERO DE FUNCIONRIOS DE UMA


COSTRUTORA EM CURITIBA - 31/01/05
30

25
N de empresas

20

15

10

0
40 42 44 46 48 50 52
N de funcionrios
.
Fonte: Dados hipotticos

Exerccio: Construir os grficos p/ Teor de Cr 2O3 dos lotes de Cromita dos fornecedores da Indstria X-
1998.

5 - MEDIDAS DESCRITIVAS

5.1 - MEDIDAS DE TENDNCIA CENTRAL OU DE POSIO: So medidas que objetivam


representar o ponto central de equilbrio de uma distribuio de dados. Essas medidas representam
quantitativamente os dados, sendo as mais utilizadas em anlise:

5.1.1 - Mdia: Representa o ponto de equilbrio de um conjunto de dados. Seja ( x 1,...,xn ) um conjunto de
dados. A mdia dada por:


x i ( dados populacionais ), para dados no-agrupados
N

X
x i
( dados amostrais )
n
x i Fi
X , para dados agrupados em tabelas de frequncias.
Fi

Quando os dados so agrupados em intervalos de classes, xi corresponde ao ponto mdio do intervalo.

Propriedades da mdia:
1 - A soma algbrica dos desvios tomados em relao a mdia nula. Isto ,
k

di
i 1
=0
25
onde di = xi - x , i = 1, 2, ..., n e x a mdia do conjunto de dados.

2 - Somando-se ou subtraindo-se uma constante, k, a todos os valores de uma varivel, a mdia do conjunto
fica aumentada ou diminuda dessa constante.
yi = xi k y = x k

3 - Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante, k, a mdia do
conjunto fica multiplicada ou dividida por essa constante.
xi x
yi = xi . k y = x .k e yi y .
k k

Vantagens e desvantagens da mdia:


1- uma medida que, pr uniformizar os dados, no representa bem os conjuntos que revelam tendncias
extremas, uma vez que a mesma ser grandemente influenciada pr valores discrepantes.
Suponha por exemplo, que durante um ano letivo, um aluno as seguintes notas em uma disciplina: 30,
35, 25, 30, 25, 35, 35, 95, 90, 100.
Um clculo rpido nos mostra que sua mdia final foi 50. Como a mdia final deve traduzir o
aproveitamento do aluno durante o ano e a mdia 50 s foi conseguida custa das trs ltimas notas,
conclumos que 50 um valor falho para medir o aproveitamento do aluno.
2- A mdia nem sempre tem existncia real, isto , ela nem sempre faz parte do conjunto de dados.
3- a medida de posio mais conhecida e de maior emprego.
4- facilmente calculada.
5- Serve para compararmos conjuntos semelhantes.
6- Depende de todos os valores do conjunto de dados.
7- Em geral no ocupa a posio central do conjunto (ocupa a posio do centro de equilbrio).

Exerccio1: a)Calcule a mdia do conjunto de dados: do CUSTO UNITRIO BSICO POR R$m2 - (CUB)
2015 - GLOBAL, fornecido pelo CBIC-Abril 2016.

1154.51 1156.33 1165.96 1180.52 1187.98 1205.54 1206.92 1211.06 1212.59 1215.13 1217.98

5.1.2 - Moda ( Mo ): o valor que ocorre com maior frequncia em uma srie de dados.
Existem sries de dados em que nenhum valor aparece mais vezes que outros. Neste caso no
apresenta moda. So sries amodais.
Em outros casos, pode aparecer dois ou mais valores de concentrao. Diz-se, ento, que a srie tem
duas ou mais modas (bimodal, trimodal).
Quando os dados se apresentam agrupados em tabelas de frequncias necessrio utilizar a
expresso de Czuber , dada abaixo, para calcular o valor que representa a moda:

h.( Fi Fi 1 )
Mo li (onde i a ordem da classe de maior frequncia )
( Fi Fi 1 ) ( Fi Fi 1 )
Pode-se tambm, neste caso, tomar o ponto mdio da classe modal como sendo a moda

No exemplo 1 : Mo= 4 segundos.


Comentrio: O tempo mais frequente entre os carros que passam por um cruzamento de ruas
de Maring de 4 segundos.

No exemplo 2 : Mo= 47,42 funcionrios.


Comentrio: O nmero de funcionrios mais frequente entre as empresas de 47,42
funcionrios.
No exemplo 3: O conjunto de dados amodal pois no ocorreu preo repetido.
26

5.1.3 - Mediana ( Md ): A mediana de um conjunto de valores ordenados segundo uma ordem de grandeza,
o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos.
Quando o conjunto de observaes tem um nmero mpar de valores, no agrupados em classes,
ento a mediana dada pela expresso:
n 1
Md = xp onde p
2
Quando o conjunto de observaes tem um nmero par de valores, no agrupados em classes,
ento a mediana ser, a mdia aritmtica dos dois nmeros que ocuparem o meio da srie:
x p x p 1 n
Md onde p .
2 2
Quando o conjunto de observaes se apresenta agrupados em classes em uma tabela de
frequncias, ento a mediana dada pela expresso:

h.( p Fa i 1 ) n
Md li onde p
Fi 2

Vantagens e desvantagens da mediana:


1- No depende de todos os valores da srie, podendo mesmo no se alterar com a modificao de alguns
deles.
2- No influenciada por valores discrepantes.

No exemplo1: Md= 4 segundos.


Comentrio: 50% dos tempos entre os carros que passam por um cruzamento de ruas de
Maring esto abaixo de 4 segundos.
No exemplo2: Md= 47 funcionrios.
Comentrio: 50% do nmero de funcionrios das empresas esto abaixo de 47,38
funcionrios.
No exemplo3: Md= 0,78 reais.
Comentrio: 50% dos preos estiveram abaixo de 0,78 reais.

5.2 - MEDIDAS DE DISPERSO: So medidas estatsticas que indicam o grau de disperso, ou


variabilidade do conjunto de observaes pesquisados, em relao a uma medida de tendncia central. Elas
descrevem os dados qualitativamente
Uma nica medida no suficiente para descrever de modo satisfatrio um conjunto de observaes.
Por exemplo, dois conjuntos de dados podem ter a mesma mdia aritmtica e, no entanto, a disperso de um
pode ser muito maior que a disperso do outro.
As principais medidas de disperso so: amplitude total, varincia, desvio-padro e coeficiente de
variao.

5.2.1 - Amplitude total ( AT ): a diferena entre o maior e o menor valor observado

AT = x (mximo) - x ( mnimo ), para valores no agrupados,

AT = L(max) - l(min) para valores agrupados em classes em uma tabela de frequncias,


onde L o limite superior da ltima classe da tabela de frequncias
l o limite inferior da primeira classe da tabela de frequncias.

5.2.2 - Varincia: a medida que fornece o grau de disperso, ou variabilidade dos valores do conjunto de
observaes em torno da mdia. Ela calculada tomando-se a mdia dos quadrados dos desvios em relao
mdia:
27

x
2

2

i
para valores populacionais no agrupados,
N

x
2
x
2
s
i
para valores amostrais no agrupados,
n1

x Fi
2

2

i
para valores populacionais agrupados em classes em uma
N
tabela de frequncias,
x
2
x Fi
s2
i
para dados amostrais agrupados em classes em uma tabela
n1
de frequncias.

No exemplo1: s2=1,54.
No exemplo2: s2=6,77.
No exemplo3: s2=0,01.

5.2.3 - Desvio-padro. Como a varincia calculada a partir do quadrado dos desvios, sua unidade
quadrada em relao varivel estudada, o que, sob o ponto de vista prtico um inconveniente. Por isso
mesmo, imaginou-se uma nova medida que tem utilidade e interpretao prtica, denominada desvio
padro, definida como a raiz quadrada da varincia e representada por:
s s2 2 .
No exemplo1: s = 1,24.
No exemplo2: s = 2,60.
No exemplo3: s = 0,12.

5.2.4 - Coeficiente de variao. uma medida relativa da disperso ou variabilidade dos dados:

s
cv 100 ou cv 100
x

J foi visto que o desvio-padro tem a mesma unidade de medida que os dados, de modo que o coeficiente
de variao adimensional.

Critrios para interpretao. Quanto menor for o coeficiente de variao, melhor ser a representatividade
da mdia no conjunto de dados.
Se 0% cv%<30%, conclui-se pela baixa variabilidade dos dados e a mdia uma tima
medida para representar os dados
Se 30% cv%<50% , conclui-se pela mdia variabilidade dos dados e a mdia uma boa
medida para representar os dados
Se cv%50% , conclui-se pela alta variabilidade dos dados e a mdia no uma medida
apropriada para representar os dados. Neste caso, deve-se pensar na mediana
ou moda.

No exemplo1: cv% = 31,47%.


Comentrio: A mdia do tempo uma boa medida para representar todos os tempos entre carros
que passam por um cruzamento de Maring.

No exemplo2: cv% = 5,51%.


Comentrio: A mdia de funcionrios uma tima medida para representar todos os nmeros
de funcionrios das empresas.
28

No exemplo3: cv% = 13,78%.


Comentrio: A mdia de preo do macarro uma tima medida para representar o conjunto
de todos os preos de macarro.

LISTA DE ESTATSTICA DESCRITIVA

1)Assinalar a coluna a direita de acordo com a coluna a esquerda.


( 1 ) Parmetro ( ) Medidas Populacionais
( 2 ) Populao ( ) Coleta de dados de todos os elementos da populao
( 3 )Amostra ( ) Medidas Amostrais
( 4 ) Estatsticas ( ) Todo conjunto de indivduos ou objetos que possuam ao
( 5 ) Censo menos uma caracterstica comum
( ) Parte da Populao selecionada de acordo com certas
regras

2) Indicar se a varivel qualitativa ( Qual), quantitativa discreta ( QtD) ou quantitativa contnua(QtC)


Altura
Grau de Escolaridade
Esporte praticado
N de vizinhos
Cor de Olhos
N de dependncias em 2008.
Peso
Idade
Regio de procedncia
3) Na 1 classe de uma distribuio de frequncias deve conter:
terminar c/ o menor valor do conjunto de dados
incluir o menor valor do conjunto de dados
iniciar com o menor valor do conjunto de dados

4).Na srie: 215, 62, 33, 12, 9, 5, 1, o valor 12 representa:


mediana
moda
mdia
5) Na srie: 215, 62, 61, 33, 33, 12, 9, 9, 5, 1. qual n ser:
Mediana:
Moda:
Mdia:

6). Os valores a seguir correspondem ao custo mdio da Construo Civil (R$/m2 ) em 2015 nas Regies
Norte, Nordeste, Sudeste Sul, Centro-Oeste :
Regies Norte Nordeste Sudeste Sul Centro-Oeste
Custo Mdio 47.52166 54.68718 69.6081 90.71663 75.53119
FonteCBIC-Abril 2016.
29

a) Calcular as medidas de posio.


b) Calcular as medidas de disperso.

Com os dados dos Exs. 7, 8 e 9:


a) Construir a distribuio que melhor represente os dados.
b) Grafar esta distribuio.
c) Calcular as medidas descritivas de posio e disperso.
d) A mdia homognea? Justificar a sua resposta.

7. Os dados a seguir representam o rendimento de 50 bateladas consecutivas de um substrato de


cermica, no qual um revestimento de metal foi aplicado por um processo de decomposio a vapor
(Montgomery, 2003).

94,1 93,2 90,6 91,4 88,2 86,1 95,1 90,0 92,4 87,3 86,6 91,2 86,1 90,4 89,1 87,3 84,1 90,1
95,2 86,1 94,3 93,2 86,7 83 95,3 94,1 97,0 97,8 93,1 86,4 87,6 91,1 94,7 96,3 94,6 93,1 90,3
89,6 78,3 84,9 85,0 86,4 88,2 96,4 92,1 84,1 88,8 86,4 85,1 84,0.

8. A CIPA de uma Industria registrou o seguinte n de acidentes de trabalho nos ltimos 12 meses.

7 9 5 5 7 7 2 1 5 2 5 5

9. As variaes porcentuais (mensal) do indicador de custo mdio da construo civil em novembro de


2003 fornecido pela Sinapi na Revista CONSTRUO referente a 1m2 em vrias cidades brasileiras
esto a seguir:
14,57; 16,76; 18,04; 12,80; 12,65; 14,43; 11,86; 17,20; 18,83; 20,09; 14,63; 16,73; 17,40; 15,33; 14,41;
21,33; 16,72; 16,88; 22,98; 21,1,; 19,7; 16,47; 21,47; 18,77; 22,27; 15,41; 18,15; 18,04.

10. Construir os grficos e calcular as medidas descritivas de posio e de disperso p/ a distribuio de


frequncias abaixo:
RESISTNCIA COMPRESSO DE 80 CORPOS DE PROVA DA LIGA
DE ALUMNIO-LTIO 2003.
2
M Quantidade
70 |-- 90 2
90 |-- 110 3
110 |-- 130 6
130 |-- 150 14
150 |-- 170 22
170 |-- 190 17
190|-- 210 10
210|--230 4
230|--250 2
80
Fonte: Montgomery, 2003

IV - NOES DE PROBABILIDADE

1-INTRODUO

A estatstica teve por funo em suas origens, principalmente a organizao e a apresentao de


dados coletados empiricamente. O desenvolvimento da teoria das probabilidades permitiu, entretanto, a
criao de tcnicas mais adequadas de amostragem e formas de relacionar as amostras e as populaes de
onde provieram essas amostras.
30
Nos tpicos estudados nas aulas anteriores, foi visto que a distribuio das frequncias das
observaes de um fenmeno recurso poderoso para entender a variabilidade do mesmo. Com a teoria da
probabilidade pode-se criar um modelo terico que reproduza muito bem a distribuio das frequncias
quando o fenmeno observado diretamente. Tais modelos so chamados modelos de probabilidades ou
distribuies de probabilidades e so consideradas a espinha dorsal da teoria estatstica, pois todos os
processos inferncias so aplicaes de tais modelos ou distribuies.

Exemplo 1. Deseja-se estudar as propores de ocorrncia das faces de um dado. O procedimento


prtico seria lanar um dado certo nmero n de vezes e contar o nmero n i de vezes que ocorre a face i, i=1,
2,..., 6. As propores ni/n determinam a distribuio de frequncias do fenmeno.

Outra maneira de construir a distribuio de frequncias atravs das suposies tericas. A primeira
suposio que s podem ocorrer 6 faces; a segunda suposio admitir que o dado perfeitamente
equilibrado. Nestas condies, com as suposies feitas, tm-se o seguinte modelo terico de frequncias
para as faces dos dados:

Face 1 2 3 4 5 6 Total
Freqncia terica 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1

Desse exemplo, pode-se observar que todo experimento ou fenmeno que envolve um elemento
casual ter um modelo probabilstico.
Antes de estudarmos mais especificamente estes modelos vejamos alguns conceitos fundamentais
para tais estudos.

1.2) Experimentos probabilsticos: So os experimentos cujos resultados podem no ser os


mesmos, ainda que sejam repetidos sob condies idnticas. Por exemplo:
a)-Jogar um dado e observar o nmero mostrado na face de cima
b)-Jogar uma moeda 8 vezes e observar o nmero de caras obtido
c)-Contar o nmero de peas defeituosas produzidas num perodo de 24hs em uma linha de produo.
d)- Peas so produzidas at que 10 peas perfeitas sejam fabricadas. Contar o nmero de peas
fabricado.
e)-Jogar duas moedas e observar o resultado
f)-Retirar uma lmpada de um lote e medir seu tempo de vida antes que se queime.

1.3) Espao amostral: o conjunto de todos os resultados possveis de um experimento e


geralmente representado por S

Exemplo 2: Para os experimentos exemplificados acima, teremos, respectivamente, os seguintes


espaos amostrais:
a) S={1,2,3,4,5,6}
b) S={0,1,2,3,...,8}
c) S={0,1,2,3...,n}, onde n o nmero mximo de peas por dia.
d) S={10,11,12,...}
e) S={cc,ck,kc,kk}, onde C=cara e K=coroa
f) S={t;t0}, conjunto dos nmeros reais no negativos
Obs.: - Os espaos amostrais podem ser numricos ou no, finitos ou infinitos.
-Para um mesmo experimento pode-se ter vrios espaos amostrais, dependendo do objetivo do
problema.

1.4) Eventos: qualquer subconjunto de resultados possveis, ou seja, qualquer subconjunto do


espao amostral. Assim, o prprio S um evento, chamado evento certo e o conjunto vazio tambm um
evento, chamado evento impossvel.
31
Exemplo 3: Considerando o lanamento de um dado, pode-se ter interesse, por exemplo, nos
seguintes eventos:
-Ocorrncia de um nmero par, ou seja: A={2,4,6}
-Ocorrncia de um nmero menor que 4, ou seja: B={1,2,3}
-Ocorrncia de um nmero maior que 6, ou seja: C= (conjunto vazio)

Propriedades dos eventos: Seja S um espao amostral e sejam A e B subconjuntos ou eventos de S.


Assim teremos:
a) A B ocorre quando pelo menos um dos eventos ocorre, ou seja, quando ou A, ou B, ou ambos
ocorrem.
b) A B ocorre quando A e B ocorrem simultaneamente.
c) A o complementar do evento A, ou seja, A A = S. o evento que ocorre se A no ocorre.
d) Se A B= , ou seja, se A e B no tm elementos comuns, ento A e B so mutuamente
excludentes, exclusivos ou disjuntos.

1.5) Probabilidade: A cada evento A associado a um espao amostral S, associamos um nmero real
P(A) denominado probabilidade de A, tal que:
0P(A)1
P(S)=1

Esta definio no nos diz como calcular P(A). Apenas nos d algumas propriedades gerais que P(A)
deve ter. Antes de aprendermos como calcular P(A), vamos enunciar mais algumas propriedades decorrentes
destas propriedades mais gerais:

Propriedades relacionadas s probabilidades:


a) P()=0
b)P( A )=1-P(A)
c)P(AB)=P(A)+P(B)-P(AB). Se A e B forem mutuamente excludentes ento
P( A B) P( A ) P(B)
d)Se S for finito, ento a soma das probabilidades de todos os resultados possveis igual a 1.
e) P( A B ) P( A B) 1 P( A B) e P( A B ) P( A B) 1 P( A B)

1.6) Resultados igualmente provveis: A hiptese mais comumente feita para espaos amostrais
finitos a de que todos os resultados sejam igualmente provveis. Tais espaos so chamados equiprovveis.
Consideremos ento um espao equiprovvel S e seja AS um evento qualquer. Ento a
probabilidade de A ocorrer ser dada por:

P(A)= n(A)/n(S)

onde n(A), o nmero de elementos de A e n(S) o nmero de elementos de S

muito importante compreender que a expresso acima apenas uma conseqncia da suposio de
que todos os resultados sejam igualmente provveis e ela somente aplicvel quando essa suposio for
atendida.

Exemplo 4: Um dado lanado. Seja A o evento que ocorrer se, e somente se, um nmero maior que
4 aparecer, isto , A={5,6}. Consequentemente, P(A)=2/6 j que S={1,2,3,4,5,6}.

Exerccio: Seja E o experimento lanar dois dados e seja S o espao amostral associado a E.
Considerando os eventos a seguir, calcule a probabilidade de ocorrncia de cada um deles.
A={(x,y)S / x+y=10} ; B={(x,y)S / xy} ; C={(x,y)S / x=2y}
32
O mtodo para determinar probabilidades visto at aqui, est limitado, como sabemos, s situaes
em que os resultados so igualmente provveis. Uma forma de lidar com situaes onde isto no ocorre,
obter alguns dados empricos, numa tentativa de estimar as probabilidades.
Para isso, muitas vezes usamos o conceito de frequncia relativa como estimativa de probabilidade da
seguinte forma:
Seja E um experimento e A um evento. Se aps n realizaes do experimento E, com n
suficientemente grande, forem observados x resultados favorveis a A, ento um estimativa da probabilidade
P(A), dada pela frequncia relativa fA=x/n. Esta definio muitas vezes chamada de probabilidade
emprica e tem por base o princpio estatstico da regularidade, isto , medida que o nmero de repeties
do experimento cresce, a freqncia relativa, fA=x/n , se aproxima da probabilidade P(A).

Exemplo 5: Em 660 lanamentos de uma moeda, foram observados 310 caras. Assim, usando a
frequncia relativa como estimativa, a probabilidade de obter-se coroa no lanamento desta moeda, ser
P(A)=350/660=0,53 , onde A={aparece coroa}

muito importante saber que fA e P(A) no so a mesma coisa, que ns apenas utilizaremos f A para
aproximar P(A), ou seja, se ns identificarmos fA com P(A), deveremos compreender que estaremos to
somente substituindo o valor de P(A) por uma aproximao obtida experimentalmente.

Exemplo 6: Numa sala de aula com 18 meninas e 18 meninos, constatou-se que 10 meninos e 12
meninas tm olhos claros. Escolhendo-se ao acaso um dos alunos da turma, qual a probabilidade desse
elemento ser menina ou ter olhos claros?

Caracterizando os eventos do problema temos:


A={o elemento escolhido menina}
B={o elemento escolhido tem olhos claros}
AB={o elemento escolhido menina ou tem olhos claros)

Assim, como A e B no so mutuamente excludentes, segue que:


P(AB)=P(A)+P(B)-P(AB)=(18/36)+(22/36)-(12/36)=7/9

Note que, AB={o elemento escolhido menina com olhos claros}

Exemplo 7: Considere os dados a seguir

SEXO
CURSO Masculino Feminino TOTAL
Eng. Civil 70 40 110
Eng. Qumica 10 40 50
Farm. Bioqumica 20 20 40
Medicina 20 10 30
TOTAL 120 110 230

Sejam os eventos: A={aluno de Eng. Civil}


B={aluno de Eng.Qumica}
C={aluno de Farm. Bioqumica}
D={aluno de Medicina}
M={aluno do sexo masculino}
F={aluno do sexo feminino}

Considerando agora o sorteio de um destes alunos e usando a freqncia relativa como aproximao
da probabilidade, teremos:
P(A)=110/230 ; P(B)=50/230 ; P(C)=40/230 ; ...
33
P(CD)=P(C)+P(D)=70/30 , uma vez que C e D so mutuamente excludentes
P(CM)=20/230 ; P(AF)=40/230 ; ...
P(BM)=P(B)=P(M)-P(BM)=50/230+120/230-10/230=160/230, uma vez que B e M no so
mutuamente excludentes.

1.7) Probabilidade condicional: Se A e B so dois eventos quaisquer de um espao amostral S,


ento a probabilidade condicional do evento B dado o evento A ser:

P(B/A) = P(AB)/P(A)

Exemplo 8: Para os dados do exemplo 7, podemos agora calcular a probabilidade do estudante


sorteado ser mulher sabendo que est matriculado no curso de Eng. civil, da seguinte forma:
P(F/A)=P(FA)/P(A)=(40/230)/(110/230)=40/110
Ou ainda podemos calcular a probabilidade do aluno ser de Engenharia civil sabendo que homem:
P(A/M)= P(MA)/P(M)=(70/230)/(120/230)=70/120

Da definio de probabilidade condicional obtemos a regra do produto das probabilidades:

P(AB)=P(B)P(A/B) ou P(AB)=P(A)P(B/A)

1.8) Independncia: Um caso muito importante da regra do produto, ocorre quando os eventos so
independentes, pois se A e B so independentes ento P(A/B)=P(A). Assim, se A e B so independentes, da
regra do produto temos:

P(AB)=P(A)P(B)

Exemplo 9: Considere uma urna com duas bolas brancas e trs bolas pretas. Extrair casualmente duas
bolas, sendo uma aps a outra, tal que a primeira bola reposta antes de se extrair a segunda. Obtenha a
probabilidade dos seguintes eventos:
A={as duas bolas so brancas} B={a primeira branca e a segunda preta
C={a primeira preta e a segunda branca} D={nenhuma bola branca}

3/5 P P(A) =2/5.2/5=


P B
2/5

3/5 P
B B
2/5
Exemplo 10: Suponha que a extrao seja sem reposio.

1.9) Teorema da Probabilidade Total : Considere um espao amostral particionado em k eventos, C1, C2, ... Ck e
satisfazendo as seguintes propriedades:

a) CjCj) para todo i j;


b) C1C2 ... Ck = e
c) P(Cj) > 0 para todo i.
Seja E um evento de interesse do espao amostral. Ento:
F=(FC1)(FC2) ... (FCk). Onde os eventos (FCi) (i=1,...,n) so mutuamente exclusivos entre si.
A probabilidade de ocorrer o evento B dada por: P(F)== k i 1 i i P(C ).P(F/C ).
34
Exemplo: Supomos que uma caixa 1 tem duas bolas brancas e duas bolas pretas, a caixa 2 tem duas bolas brancas e uma bola preta
e a caixa 3 tem uma bola branca e trs bolas pretas. Se selecionarmos ao acaso uma bola, qual a probabilidade de ela ser branca?

Se soubermos de qual caixa a bola selecionada, a resposta seria simples. Como


voc no sabe qual a caixa, o teorema da probabilidade total permite solucionarmos esse
problema.
Sejam os eventos C1 , C2 e C3 (representando as caixas) e o evento B
(representando bola branca).
Os eventos Ci so mutuamente exclusivos.
O evento B tem interseco com todos os Ci.

Supomos a mesma probabilidade para todas as caixas: P(C1)= P(C2)= P(C3)=1/3.


A probabilidade de bola branca para cada caixa : P(B/C1)=1/2, P(B/C2)=2/3 e P(B/C3)=1/4.
A probabilidade de bola branca dada por: P(B)= P(C1) e P(B/C1) ou P(C2) e
P(B/C2) ou P(C3) e P(B/C3) = P(C1).P(B/C1) + P(C2).P(B/C2) + P(C3).P(B/C3)=
1/3.1/2 + 1/3.2/3 + 1/3.1/4=1/6+2/9+1/12=17/36.

Teorema da Bayes. O teorema de Bayes est relacionado com teorema da Probabilidade Total. As condies
so as mesmas, eventos mutuamente exclusivos e exaustivos e um evento qualquer.
O teorema de Bayes permite obter a probabilidade de um evento ocorrer sabendo-se que um outro evento
ocorreu. Para o caso das trs caixas possvel calcular: Qual a probabilidade da bola ser da caixa B sabendo-
se que ela branca?
Usando a expresso da probabilidade condicional

e a regra do produto P(AB) = P(B).P(A/B), pode-se escrever o teorema de Bayes:

Onde

Exemplo: Sabendo-se que a bola branca, qual a probabilidade dela ser da caixa 2?
Temos, calculado no exemplo anterior, que a probabilidade da bola ser branca : P(B)= P(C1) e P(B/C1) ou
P(C2) e P(B/C2) ou P(C3) e P(B/C3) = P(C1).P(B/C1) + P(C2).P(B/C2) + P(C3).P(B/C3)= 1/3.1/2 +
1/3.2/3+1/3.1/4=1/6+2/9+1/12=17/36.
Suponha a mesma probabilidade para todas as caixas, P(C1)= P(C2)= P(C3)=1/3.
A probabilidade de bola branca para a caixa 2 P(B/C2)=2/3.
Ento P(C2 ) P B / C2
P C 2 / B
P C1 P B / C1 P(C2 ) P B / C2 P (C3 ) P B / C3
=8/17

LISTA DE PROBABILIDADE
35
1) Em uma Universidade foram examinados 1204 universitrios acima de 17 anos para verificar se o curso
que faziam o que realmente queriam cursar.

SEXO CURSO TOTAL


SIM NO
Masculino 155 410 565
Feminino 165 474 639
320 884 1204

Selecionando ao acaso um desses alunos, qual a probabilidade de:


a) Cursar o curso que no queria.
b) Ser do sexo masculino.
c) Ser do sexo feminino ou cursar o curso que queria.
d) Sabendo que faz o curso que no queria qual a probabilidade de ser do sexo masculino
e) Ser do sexo masculino ou feminino.

2) Numa grande Construtora 90% dos funcionrios do sexo feminino submetido a um determinado teste foi
aprovado, enquanto s 80% dos funcionrios do sexo masculino foi aprovado. Qual a probabilidade de uma
mulher e um homem que esto fazendo o teste:
a) Ambos serem aprovados (R=0,72) b) S a mulher ser aprovada (R= 0,18)
c) Ao menos um ser aprovado (R= 0,98) d) Nenhum dos dois serem aprovados. (R= 0,02)

3) Numa localidade a populao tem a seguinte composio: ndios 60%, japoneses 30%, alemes 10%.
Tomando-se ao acaso um indivduo desta populao:
a) ndios ou japoneses (R=0,90) b) japoneses ou alemo ( R= 0,40)

4) Em uma sala de aula 35% dos alunos possuem olhos azuis, 60% possuem cabelos pretos e 12% possuem
cabelos pretos e olhos azuis. Um aluno escolhido ao acaso.
a) Qual a probabilidade de possuir olhos azuis ou cabelos pretos. (R=0,83)
b) Se a pessoa possuir olhos azuis, qual a probabilidade de cabelos pretos? (R= 0,34)

5) A probabilidade uma experincia de uma determinada argamassa dar certo de 0,8. Ao desenvolver duas
qualidades de argamassa, pede-se atravs do Diagrama da rvore:
a)ambas darem certas
b)ao menos uma dar certo
c) a 1 d certo e a 2 no.

6) Com os dados do exerccio anterior considere agora 3 experincias


a) as 3 darem certo
b) 1 d certo e a 2 no e a 3 d certo.
c) apenas 2 do certo.

2-VARIVEIS ALEATRIAS

2.1-INTRODUO

Quando realizamos um experimento, no temos obrigatoriamente, que obtermos um valor numrico.


Por exemplo, ao descrevermos uma pea manufaturada, podemos associar duas categorias: defeituosas e
no defeituosas- varivel qualitativa. Por um outro lado, ao estudarmos a descrio dos dados, vimos que
os recursos disponveis para anlise das variveis quantitativas so mais ricos do que para as variveis
36
qualitativas, portanto, buscaremos uma maneira de trabalharmos esta situao de uma maneira mais prtica e
facilitada associando sempre um nmero real a qualquer evento de um espao amostral, possibilitando
assim, a construo de modelos probabilsticos para tais variveis.

DEFINIO 1.1 - Varivel Aleatria: Sejam E um experimento e S um espao amostral associado a esse
experimento. Uma funo X que associe a cada elemento s S um nmero real X(s),
denomina-se Varivel Aleatria (v.a.).

S R

s.
X
. X(s)

Exemplo: Seja o experimento E: lanar duas moedas. O espao amostral associado a este experimento ser:
S= {CC, CK, KC, KK}
Podemos definir uma v.a. como sendo, X: nmero de caras obtidas nas duas moedas.
Para o evento s1 = {CC}, temos X(s1) = 2
Para o evento s2 = {CK}, temos X(s2) = 1
Para o evento s3 = {KC}, temos X(s3) = 1
Para o evento s4 = {KK}, temos X(s4) = 0
Portanto, os valores assumidos pela v.a. X so os elementos do conjunto { 0, 1, 2}.
Observaes:
1) Embora usemos o termo varivel, X uma funo cujo domnio S e contradomnio e R.
2) Para simplificar a notao, em geral, escrevemos X e no X(s).
3) Pode-se definir inmeras v.a. para um mesmo espao amostral S.
4) Se S numrico, ento X(s) = s.
5) As variveis aleatrias podem ser discretas ou contnuas.

Varivel aleatria discreta:

DEFINIO 2.1 Varivel Aleatria Discreta: Seja X uma v.a. Se o nmero de valores possveis de X for
finito ou infinito enumervel, denominaremos X de varivel aleatria discreta.

Ao trabalharmos com uma varivel aleatria discreta, a funo que descreve as probabilidades da varivel
aleatria X assumir valores particulares ser denominada Funo de Probabilidade.

DEFINIO 2.2 - Funo de Probabilidade. Seja X uma varivel aleatria discreta. A cada possvel
resultado xi associaremos um nmero p(xi) = P(X = xi) denominado probabilidade de xi. os
nmeros p(xi) e i= 1,2,3,...,n devem satisfazer:
37

p( x ) 0, i 1, 2, ... , n
i

n
p ( x i ) 1
i 1

Ento esta funo chamada de Funo de Probabilidade no ponto da varivel aleatria


X.

Os pares ordenados [xi , p(xi)], onde i= 1, 2, ..., n denominado de distribuio de probabilidade de


Exemplo: Seja o experimento E: lanar 2 dados; e a varivel aleatria Y: soma dos pontos obtidos na face
de cada dado. O espao amostral associado a este experimento ser:

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)


(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
S
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

de onde obtemos a seguinte distribuio de probabilidade:


Y 2 3 4 5 6 7 8 9 10 11 12
P(Y=yi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Distribuio ou Funo Densidade de Probabilidade Contnua: a funo f(x) que


satisfaz as seguintes condies:

Note que P(a X b) igual rea sob a curva f(x) do segmento horizontal (a , b):
b
a
f ( x ) dx 0

VALOR ESPERADO, ESPERANA MATEMTICA OU EXPECTNCIA - E(X)

DEFINIO 4.1 Seja X uma v.a.d. com possveis valores x 1, x2 , ..., xn. seja p(xi)=P(X=xi), com i=1, 2, ...,
n. Ento o valor esperado de X (ou esperana de X), denotado por E(X) ou X, definido
como:
38

PROPRIEDADES DA ESPERANA:

1) O valor esperado de uma constante a prpria constante.


E (K ) Kp( x i ) K p( x i ) K
i i

2) Multiplicando-se uma varivel aleatria X por uma constante, sua mdia fica multiplicada por essa
mesma constante.
E(KX) Kx i p( x i ) K x i p( x i ) KE( X )
i i

3) O valor esperado da soma ou diferena de duas variveis a soma ou a diferena das esperanas.
E[X Y] ( x
i IJ
i y j )p( x i , y j ) x p( x
i IJ
i i , y j ) y j p( x i , y j )
i IJ

E[X Y] x p( x
i
i
j
i , y j ) y j p( x i , y j )
i j

E[X Y] x i p( x i ) y j p( y j )
i

E[X Y] E[X ] E[Y]

4) Somando-se ou subtraindo-se uma constante a uma varivel aleatria, a sua esperana fica somada ou
subtrada da mesma constante.
E[XK] = E[X]E[K] = E[X] K

5) O valor esperado de uma varivel aleatria centrada zero. Diz-se que a v.a. est centrada quando se
calculam todos os desvios (xi - x). Assim:

E[X - x] = E[X] E[x] = x - x = 0

6) O valor esperado do produto de duas v.a. independentes o produto dos valores esperados.
E[ XY] xi j
i y j p( x i , y j )

E[ XY] xi j
i y j p( x i ) p( y j ), pois X e Y so variveis independentes

E[XY] x p( x ) y p ( y
i
i i
j
j j )

E[ XY] E[ X ] E[ Y ]

Exerccio: Se X e Y so v.a. independentes e E[X]=2 e E[Y]=3, determine: a) E[2X 2] b) E[2X+3Y-5]

VARINCIA DE UMA VARIVEL ALEATRIA

Embora o valor da esperana de v.a. nos d boas informaes sobre o seu comportamento, ainda no nos diz
tudo. Suponha que X represente o salrio dos funcionrios de uma determinada empresa e que E[X]=700,00.
Isto poderia significar que a maioria dos salrios deveria estar entre R$ 600,00 e R$ 800,00; poderia tambm
significar que cerca de metade dos salrios mais altos estejam prximos de R$ 1200,00, enquanto a outra
metade dos funcionrios teriam um salrio prximo a R$ 200,00. bvio que precisamos definir uma
medida que nos d o grau de disperso de probabilidade em torno da mdia; essa medida chamada de
varincia.
39
DEFINIO 4.2 Seja S uma varivel aleatria. Definamos a varincia de X denotada por V(X), ou 2X ,
da seguinte forma:

Onde:

Desenvolvendo a frmula anterior:


V[ X ] E{X 2 2XE( X ) [ E ( X )]2 }
V[ X ] E[ X ] 2 E[ 2XE( X )] E{[E ( X )] 2 }, mas E[X] uma constante
V[X] E[X]2 2E[X]]E[X] [ E (X )] 2
V[X[ E[ X ] 2 2[E ( X )]2 [ E (X )] 2

V[ X ] E[ X ] 2 { E[ X ]} 2

PROPRIEDADES DA VARINCIA:

1) A varincia de uma constante zero:


2k E[K k ]2 E[K K ] 2 0

2) Multiplicando-se uma v.a. por uma constante, sua varincia fica multiplicada pelo quadrado da constante.

(2kx ) E[ KX E ( KX)] 2 E[ KX KE( X )] 2


(2kx ) E{K[ X E ( X )]}2
(2kx ) K 2 E[ X E ( X )] 2
(2kx ) K 2 2x

3) Somando-se ou substituindo-se uma constante a uma v.a. sua varincia no se altera.


2 [X K ] E[(X K ) E (X K )]2
2 [X K ] E[X K E (X ) E (K )]2
2 [X K ] E[X K E (X ) K ] 2
2 [X K ] E[X E (X)]2
2 [X K ] 2X

4) A varincia da soma ou diferena de duas variveis aleatria independentes a soma das respectivas
varincias.
2 (X Y) 2x 2y .Apresentaremos a seguir, alguns modelos de distribuio de probabilidades.

LISTA DE VARIVEIS ALEATRIAS

1) As chamadas dirias do Corpo de Bombeiros apresentam a seguinte distribuio:

N de chamadas por dia (X) 0 1 2 3 4 5


40
Probabilidade de chamadas
0,10 0,15 0,30 0,25 0,15 0,05
p(xi)
a) Calcular o nmero mdio dirio de chamadas, bem como o desvio padro. 2,35; 1,31
b) Num ano de 365 dias, qual o nmero esperado do total de chamadas? 858
c) Calcular a probabilidade de haver no mximo duas chamadas por dia. 0,55

2) Uma Imobiliria determinou as probabilidades de fazer determinados nmeros de vendas por semana de
casa de mdio-padro,:
N de vendas (X) 1 2 3 4 5 6 7 8
Probab. p(xi) 0,04 0,15 0,20 0,25 0,19 0,10 0,05 0,02
a) Calcular o nmero esperado de vendas semanais e a varincia das vendas. 4,00 ; 2,52
b) Suponha que o vendedor da Imobiliria ganhe uma comisso de R$ 1500,00 por venda. Determine o seu
ganho esperado em comisses. 6000,00

3) Descobriu-se que a chegada de clientes a uma loja de materiais de construo, durante intervalos
aleatrios escolhidos de 10 minutos, segue a distribuio :
N de chegadas (X) 0 1 2 3 4 5
Probabilidade p(xi) 0,15 0,25 0,25 0,20 0,10 0,05
Calcular o nmero esperado de chegadas por intervalos de 10 minutos bem como sua varincia. 2,0 ; 1,9

4) Um processo de fabricao produz peas com peso mdio de 30 g e desvio padro de 0,7 g. Essas peas
so acondicionadas em pacotes de uma dezena cada. A embalagem pesa em mdia 40 g, com varincia 2,25
g2. Admitindo que as variveis em questo tenham distribuies normais, qual a mdia e o desvio padro do
peso total do pacote? 340 ; 2,67.

5) O lucro unitrio (L) de um produto dado por L= 1,2V 0,8C 3,5. Sabendo-se que o preo unitrio de
venda (V) tem mdia R$ 60,00 e desvio padro de R$ 5,00 e que o preo do custo unitrio (C) tem uma
distribuio de mdia R$ 50,00 e o desvio padro para R$ 2,00, qual a mdia e o desvio padro do lucro
unitrio? 28,5 ; 6,21

3 - Distribuio Binomial

Consideremos um experimento aleatrio ao qual associa-se a varivel aleatria X. A distribuio discreta de


probabilidade de X ser definida como Distribuio Binomial se atender s seguintes condies:
41
i) Em cada tentativa existem dois resultados possveis mutuamente exclusivos. Eles so
chamados de sucesso (se ocorrer o evento em que estamos interessados) e fracasso (se tal
evento no ocorre).
ii) As sries de tentativas (ou observaes) do experimento, so constitudas de n eventos
independentes.
iii) A probabilidade de sucesso p e a do fracasso q = 1-p.

Exemplo: Uma moeda lanada trs vezes. Qual a probabilidade de se obter duas caras?
P(sucesso) =P(cara)=1/2
Sejam: S: ocorre sucesso, ou seja, ocorre cara
F: ocorre fracasso, ou seja, ocorre cara
A= {SSF, SFS, FSS} o evento no qual estamos interessados

Temos P(A) = P(SSF)+P(SFS)+P(FSS) pois so eventos mutuamente exclusivos e pela independncia:


P(SSF) = (1/2).(1/2).1/2) = 1/8 = P(SFS) = P(FSS) P(A) = 3/8

Associando este exemplo definio da Distribuio Binomial, teremos:

Se P(S) = p, 0<p<1 e se P(F) = q = 1-p, ento P(A) = p.p.q = p2q = P(SFS) = P(FSS), de onde: P(A) = 3p2q
Observemos que estamos apenas interessados no nmero total de sucessos e no na ordem em que eles
ocorrem.
Para o exemplo anterior, podemos construir a seguinte tabela:

Nmero de Sucessos Probabilidade p=1/2


0 q3 1/8
1 pq2 3/8
2 p2q 3/8
3 p3 1/8

Os pares ordenados [x , p(x)] constituem a distribuio binomial.

DEFINIO 4.3 Seja uma varivel aleatria X o nmero de sucessos de n provas onde pode
ocorrer k sucessos (e portanto n-k fracassos), temos:
n
P( X k ) p k q n k
k

A distribuio que apresenta a funo de probabilidade acima chamada de Distribuio Binomial e ser
denotada por X~B(n,p) ou seja, X tem distribuio binomial com parmetros n e p, onde:

E[X] = np e V[X] = npq

Ex Determinar a probabilidade de obtermos um nico 6 em trs jogadas de um dado.


Em dezoito jogadas quantas vezes podemos esperar que saia o nmero 6?
X: sucesso obter o nmero 6;
n=3

O nmero mdio ou esperado de ocorrncia do nmero 6 em n=18 jogadas :


42
Ex.: Uma companhia de seguros vendeu aplices a cinco pessoas, todas da mesma idade e de apresentando boa sade.
De acordo com as tbuas aturias, a probabilidade de que uma pessoa da idade desses assegurados esteja viva da a 30
anos 2/3. Calcular a probabilidade de que passados 30 anos;
a) todas as cinco pessoas estejam vivas; (32/243)
b) pelo menos trs pessoas estejam vivas; (64/81).

4 - Distribuio de Poisson
Esta distribuio muito usada quando desejamos obter a probabilidade de
ocorrncia de eventos em intervalos de tempo, ou superfcie, ou volume, tais como:
a) nmero de chamadas telefnicas durante um intervalo de tempo.
b) nmero de falhas de um computador em um dia.
c) nmero de acidentes de trabalho em uma empresa num determinado ms.

De modo geral, dizemos que a varivel aleatria X tem uma distribuio de Poisson
com parmetro >0 se:

Mdia e Varincia da Distribuio de Poisson: Podemos facilmente demonstrar que:


E(X) = VAR(X) =
Assim, representa o nmero mdio de tais eventos ocorrendo no intervalo considerado.

Ex. Suponhamos que 10.000 bactrias movam-se independente e aleatoriamente


em um volume de 20000 cm3.
a) Qual a probabilidade de um cm3 escolhido ao acaso no conter bactrias?
b) Qual a probabilidade de um cm3 escolhido ao acaso conter mais de uma bactria?
c) qual a probabilidade de dois cm3 escolhidos ao acaso conterem duas bactrias?

Se X a v.a. que representa o nmero de bactrias presentes em um cm3, temos:


a) O nmero mdio de bactrias por cm3 : E(X) = = (10000/20000) = 0,5

P(X = 0) =

Assim, a probabilidade de um cm3 escolhido ao acaso no conter bactrias 60,65%.

b) P(X > 1) = 1 (P(X = 0) + P(X = 1)) = 1 (0,6065 + = 1 0,9097 = 0,0903.

Assim, a probabilidade de um cm3 escolhido ao acaso conter mais de uma bactria 9,03%.
Se Y a v.a. que representa o nmero de bactrias presentes em dois cm3, temos:
c) O nmero mdio de bactrias por 2cm3 : E(Y) = = 2(0,5) = 1 e, portanto: P(Y = 2) =

A probabilidade de dois cm3 escolhidos ao acaso conterem duas bactria 18,39%.


43
5- Aproximao da Binomial pela Poisson
Para n grande e p pequeno, podemos aproximar a distribuio Binomial pela distribuio de Poisson. Ou
seja, se X tem distribuio binomial, b(n,p), tal que np7, ento:

Exemplo 5.16: Se a probabilidade de um indivduo sofrer uma reao nociva, resultante da injeo de um
determinado soro 0,001, determinar a probabilidade de, entre 2000 indivduos, exatamente 3 sofrerem essa
reao.Se X a varivel que representa o nmero de indivduos que sofrem a reao, temos: n = 2000;
p = 0,001; np = 2. Assim, a aproximao pela Poisson pode ser usada:

P(X = 3) =
A probabilidade de, entre 2000 indivduos, exatamente 3 sofrerem essa reao 18,04%.

6- Distribuio Normal

DEFINIO Seja uma varivel aleatria contnua e independente X que apresenta a seguinte funo
densidade:
1 2
/ 2 2 ]
f (x) e[ ( x )
2

onde os parmetros e 2 so respectivamente a mdia e a varincia populacional que satisfaz as condies:


a a) - < <
b) 2 > 0
b c) - < x <
Ento a famlia de densidade definida como a funo anterior so chamadas de Distribuio Normais,
denotadas por:
c X ~ N( , 2)
d
ou seja, X tem distribuio Normal com mdia e varincia 2, cuja funo de distribuio :
b ( x ) 2
1
e P (a x b ) e 2 2 dx

a 2

Graficamente apresentar as seguintes caractersticas:


Como podemos observar, o grfico da funo densidade de uma varivel normal tem a forma de um sino e
simtrica em relao mdia . Fixando-se a mdia, verificamos que o achatamento est diretamente
ligado ao valor de ; um valor maior da varincia significa maior disperso da curva.
44

Distribuio Normal padro

X
f DEFINIO Se X ~ N( , 2) , a varivel aleatria Z definida como Z tem distribuio

normal com mdia 0 e varincia 1, ou seja, Z ~N(0, 1)
g
Demonstrao:
X 1 1 0
E[ Z] E E (X) 0

X 1 1 1
V Z V 2 V( X) V() 2 V (X ) 2 2 1

Logo, Z ~(0, 1)

LISTA DE: DISTRIBUIES BINOMIAL, POISSON e NORMAL .

1) Um time X tem 2/3 de probabilidade de vitria sempre que joga. Se jogar cinco partidas, calcule a
probabilidade de:

a) X vencer exatamente 3 partidas; 80/24 3


b) X vencer ao menos uma partida; 242/243
c) X vencer mais da metade das partida. 64/81
45
2) Cogita-se transferir um distrito de um certo municpio para um municpio vizinho. O distrito possui 5300
habitantes, dos quais 40 % so favorveis transferncia. Em uma amostra de 15 habitantes, qual a
probabilidade de que ao menos cinco serem favorveis transferncia. 0,78

3) Ao testar certo tipo de caminho em terreno acidentado, constatou-se que 20% dos caminhes no
conseguem terminar o teste sem ao menos um pneu furado. Qual a probabilidade de que, dentre os prximos
10 caminhes a serem testados, de 5 a 8 tenham um pneu furado? (3,3%)

4) A probabilidade de um paciente sobreviver a uma delicada interveno cirrgica de 0,75.


a) Qual a probabilidade de sobreviverem exatamente cinco dentre os prximos 10 pacientes a serem
submetidos a tal operao?
b) Qual a probabilidade de que 4 ou mais sobrevivam? 0,0584 ; 0,9965

5) A probabilidade de um atirador acertar o alvo 1/3. Se ele atirar 6 vezes, qual a probabilidade de: (a)
acertar exatamente 2 tiros? (b) no acerta nenhum tiro? 80/243 ; 64/729

6) Se 5% das peas produzidas por uma mquina so defeituosas, qual a probabilidade de que, em cinco
peas escolhidas aleatoriamente, (a) haja 0 defeituosas, (b) menos de trs defeituosas, (c) calcule a mdia e
o desvio padro para o nmero de defeituosas em um lote de 500 peas. (77,4%; 99,9%; 25 e 4,9)

8) Supomos que certo tipo de preservativo tem probabilidade de falha de 0,0002. Se 10.000 pessoas usaram
este preservativo, qual a probabilidade de falhar para trs pessoas?
Qual a probabilidade de no falhar?

9) Supomos que a probabilidade de um aluno de certa universidade contrair o vrus A1N1 de 0,001. Se a
universidade tem 20.000 alunos, qual a probabilidade de exatamente 5 contrarem o vrus? Qual a
probabilidade de no mximo 3 contrarem o vrus?

10) Um Indstria de baterias sabe, por experincia, que as baterias de sua fabricao tm vida mdia de 600
dias e desvio-padro de 100 dias, sendo que a durao tem aproximadamente distribuio normal. Oferece
uma garantia de 312 dias,. Fabrica 10.000 semanalmente.
a)Quantas sero trocadas pelo uso da garantia no final do ms?
b)As baterias 10% mais durveis duram quanto?

11) Uma Indstria Qumica recicla papis para ser vendido para o comrcio local. A classificao dos papis
feita conforme o peso: 10% dos menos pesados como leve- 25% seguintes como mdios, os 30% seguintes
como pesados e o restante 35% como extra. Sabendo-se que o peso dos papis segue uma distribuio
normal com mdia 5kg e desvio padro 2,1kg. Determinar os limites de peso para cada classificao.

12)Um produto pesa em mdia 10g com desvio-padro de 3g. Este embalado em caixas de 150 unidades. A
caixa vazia pesa, em mdia, 200g com desvio-padro de 9g. Admitindo que as variveis em questo tenham
distribuies normais e que as 150 unidades que so colocadas em uma caixa so tomadas ao acaso,
determine a probabilidade de uma caixa cheia pesar mais de 1610g.

13) Uma Industria de produtos alimentcios vende um de seus produtos em latas de 900g de contedo
lquido. Para embalar o produto adquiriu uma mquina que permite obter o peso desejado, c/ distribuio
normal e desvio-padro de 10g. O I.P.M. (Instituto de Peso e Medidas) exige que no mximo 5% das latas
contenham menos que o peso lquido nominal. .
a) Se a maquina for regulada para 910g, poder satisfazer esta exigncia?
46
b) Qual dever ser a regulagem da mquina para que a exigncia do I.P.M. seja observada?
a) Feita essa nova regulagem, as latas so remetidas ao comrcio. O I.P.M. examina ento uma amostra de
20 latas num supermercado. Qual a probabilidade de encontrar ao menos 3 c/ peso inferior ao
especificado na embalagem?

14) Os registros indicam que o tempo mdio para se fazer um teste aproximadamente N(80 ; 400)
minutos. Determinar: (a) a porcentagem de candidatos que levam menos de 80 minutos; (b)se o tempo mdio
concedido de 1h e 45 min, que porcentagem no conseguir no conseguir terminar o teste? (c) se 150
pessoas se submetem ao teste, quantas podemos esperar que terminem o teste dentro de uma hora? 50%;
10,56%; 24

15) Usa-se um aparelho de radar para medir a velocidade dos carros numa rodovia na hora do pico. As
velocidades dos carros tem distribuio normal com mdia de 79 km/h. Determinar: (a) o desvio padro das
velocidades, se 3% dos carros ultrapassam 90 km/h; (b) a porcentagem dos carros que trafegam a menos de
75 km/h. (5,85; 24,83%)

16) Um fabricante de baterias sabe, por experincia passada, que as baterias de sua fabricao tm vida
mdia de 600 dias e desvio-padro de 100 dias, sendo que a durao tem aproximadamente distribuio
normal. Oferece uma garantia de 312 dias, isto , troca as baterias que apresentarem falhas nesse perodo.
Fabrica 10.000 baterias mensalmente. Quantas dever trocar pelo uso da garantia, mensalmente? ( 20 )

V-INFERNCIA ESTATSTICA

A Inferncia Estatstica busca obter informaes de parmetros populacionais por intermdio das
caractersticas de uma amostra e de suas distribuies de probabilidade .
47

INTRODUO

Inferncia Estatstica ou Estatstica indutiva a parte da estatstica que utiliza mtodos cientficos
para fazer afirmaes e tirar concluses sobre caractersticas ou parmetros de uma populao, baseando-se
em resultados de uma amostra . O prprio termo indutiva decorre da existncia de um processo de
induo, isto , um processo de raciocnio em que, partindo-se do conhecimento de uma parte, procura-se
tirar concluses sobre a realidade no todo. Essas so decises baseadas em procedimentos amostrais.
Nosso objetivo procurar a conceituao formal desses princpios intuitivos do dia-a-dia para que
possam ser utilizados cientificamente em situaes mais complexas.
fcil perceber que um processo de induo ( em estatstica) no pode ser exato. Ao induzir,
portanto, estamos sempre sujeitos a erro. A Inferncia Estatstica, entretanto, ir nos dizer at que ponto
poderemos estar errando em nossas indues, e com que probabilidade. Esse fato fundamental para que
uma induo (ou inferncia) possa ser considerada estatstica, e faz parte dos objetivos da Inferncia
Estatstica.
Em suma, a Inferncia Estatstica busca obter resultados sobre as populaes a partir das amostras,
dizendo tambm, qual a preciso desses resultados e com que probabilidade se pode confiar nas concluses
obtidas. Evidentemente, a forma como as indues sero realizadas ir depender de cada tipo de problema,
conforme ser estudado posteriormente.

Estatsticas e Parmetros
Obtida uma amostra, muitas vezes desejamos us-la para produzir alguma caracterstica da amostra. Por
exemplo, se queremos calcular a mdia da amostra ( X1 , X2 , ...,Xn ), ser dada por:

X
X i

5.1 - Definio - Uma estatstica uma caracterstica da amostra, ou seja, uma estatstica T uma funo de
X1 + X2 + ..., + Xn , T = f (X1 + X2 + ..., + Xn ).

As estatsticas mais comum so:

Xi
X ; mdia da amostra
n
(X X ) 2
S2 = i ; varincia da amostra
n 1
X(1) = min(X1 , X2 ,..,Xn ) : o menor valor da amostra (minimo)
X(2) = max (X1 , X2 ,..,Xn ) : o maior valor da amostra (mximo)
48

At = Xn - X1 : amplitude total da amostra,

2
(X i X )
2 = ; varincia da populao
n
Para facilitar a linguagem usada em Inferncia Estatstica, iremos diferenciar as caractersticas
da amostra e da populao.

5.2 - Definio - Um parmetro uma medida usada para descrever uma caracterstica da populao.
Assim, se estamos colhendo amostras de uma populao identificada pela varivel aleatria X, ento, seriam
parmetros a mdia E(X) ou, ainda, sua varincia V(X).
Os smbolos mais comuns so dados na tabela a seguir:

Estatstica Populao
Mdia X
Varincia S2 2
N de elementos n N
Proporo f ou P p

ESTIMAO, ESTIMADOR E ESTIMATIVA

Conceito de estimao

O processo de induo que se pretende realizar sobre uma populao pode ser feito, a partir de uma amostra,
de duas maneiras.

a) Estimao: o processo que usa os resultados extrados da amostra para produzir inferncias sobre a
populao da qual foi extrada, aleatoriamente, a amostra .
Existem dois tipos de estimao:
I) por ponto : quando, a partir da amostra, procura-se obter um nico valor de um certo parmetro
populacional.
II) por intervalo: quando a partir da amostra procura-se construir um intervalo de variao ( 1 , 2 )
com uma certa probabilidade de conter o verdadeiro parmetro populacional .

Testes de Hipteses: o processo que usa os resultados extrados da amostra para testar valores de certos
parmetros da populao (testes paramtricos) ou para testar a natureza da distribuio da populao (testes
no paramtricos)

Conceito de estimador e estimativa

Estimador (( )de um parmetro populacional uma varivel aleatria funo dos elementos amostrais xi
( i = 1,2,..,n) , isto :
= f(x1 , x2 ,...,xn )

Por outro lado, estimativa o valor numrico obtido pelo estimador (ou estatstica) numa amostra.

Exemplos: a) o parmetro populacional pode ser estimado pelo estimador X (mdia da amostra).
b)O parmetro populacional 2 (varincia) pode ser estimado pelo estimador S2 (varincia
amostral).

ESTIMATIVA PONTUAL

Podemos estimar parmetros populacionais atravs de uma amostra. Suponhamos, por exemplo, que,
49
para estimar a renda familiar mdia, , em certa regio, tomamos uma amostra aleatria de 100 famlias.
Ento, certamente, a mdia amostral, X , um estimador razovel de . Porm, sabemos que X flutua em
redor de .: s vezes estando acima, outras vezes abaixo. A mdia X uma estimativa pontual de .
O objetivo deste tpico ser estudar uma outra forma de estimarmos os par^metros populacionais, ou
seja, buscaremos conceitos cientficos de estimativas por intervalos.

Distribuio Amostral dos Estimadores

O objetivo deste tpico estudar como se distribuem por amostragem os seguintes estimadores: o estimador
x da mdia populacional , o estimador p da proporo populacional p e o estimador ( x y ) da
diferena de mdias populacionais ( x y ). relevante lembrarmos o seguinte esquema:

POPULAO PARMETROS:

AMOSTRAS ESTIMADORES:

Distribuio amostral da mdia ( x )

De uma populao X, tira-se uma amostra de tamanho n formada pelos elementos x1, x2, ..., xn. O estimador
da mdia populacional :
1 n
x xi
n i 1

Para auxiliar a compreenso das concluses, consideremos o exemplo a seguir:


A populao finita: 1, 2, 3, 4, 5. ento N=5 ,
N
E(X)=x= x i p( x i ) e
i 1

(x ) p( xi ) E X 2 E X
2 2
VAR(X)= 2x = i x fazendo a funo de distribuio de probabilidade, tem-se:
i 1

X 1 2 3 4 5
p(x) 1/5 1/5 1/5 1/5 1/5 -
xp(x) 1/5 2/5 3/5 4/5 5/5 3
x2p(x) 1/5 4/5 9/5 16/5 25/5 11

1 15
E(X) = x = (1 2 3 4 5) 3 x = E(x) = 3
5 5

VAR(X)= 11-32 = 11-9 = 2 VAR ( X) 2

Buscando relacionar a caracterizao da populao com a amostra, pode-se por exemplo, tomar todas as
amostras com reposio (independncia) de tamanho 2. O nmero total de amostras ser 52 = 25, distribudas
50
da seguinte forma:
(1,1) (1,2) (1,3) (1,4) (1,5)
(2,1) (2,2) (2,3) (2,4) (2,5)
(3,1) (3,2) (3,3) (3,4) (3,5)
(4,1) (4,2) (4,3) (4,4) (4,5)
(5,1) (5,2) (5,3) (5,4) (5,5)

Calculando-se as respectivas mdias amostrais, tem-se:

1,0 1,5 2,0 2,5 3,0


1,5 2,0 2,5 3,0 3,5
2,0 2,5 3,0 3,5 4,0
2,5 3,0 3,5 4,0 4,5
3,0 3,5 4,0 4,5 5,0
O estimador x uma varivel aleatria discreta, e facilmente pode-se calcular sua esperana e varincia. A
distribuio de probabilidade da mdia :

x 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0


p( x ) 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25 -
x p( x ) 1/25 3/25 6/25 10/25 15/25 14/25 12/25 9/25 5/25 3,0
x 2 p( x 10,0
1,0/25 4,5/25 12,0/25 25,0/25 45,0/25 49,0/25 48,0/25 40,5/25 25,0/25
)

n
A esperana da mdia amostral, E( x ) = x p( x ) = 3
i 1
i i x E(X) 3

enquanto que a VAR ( X) E( X2 ) [E( X)]2 ser VAR ( X) 10 32 1 2x VAR ( X) 1


A partir destes resultados, temos as seguintes proposies:

Proposio 1) A mdia das mdias amostrais ou E( x ) igual mdia populacional, ou x E(X) 3

Proposio 2) A varincia da mdia amostral igual varincia populacional dividida pelo tamanho da
2
amostra, ou VAR ( X) 2x
n

Graficamente, podemos comparar a distribuio de probabilidade para a populao


P(x)

1/5

0
0 1 2 3 4 5X

e a distribuio das mdias amostrais


P( x )
1/5

3/20

1/10

1/20

0
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 x
51

Observe que a medida que o tamanho da amostra aumenta, independendo da distribuio da populao
original, a distribuio amostral de X aproxima-se cada vez mais de uma distribuio normal. Esse
resultado, fundamental na teoria de Inferncia Estatstica, conhecido como Teorema do Limite Central.

Teorema 3.2 - Para amostras aleatrias simples ( X1 , X2 ,.., Xn ), retiradas de uma populao com mdia
e varincia 2, a distribuio amostral da mdia X = (X1 + X2+..+Xn)/n aproxima-se de uma distribuio
normal com mdia e varincia 2/n , quando n .

Corolrio 3.1 - Se (X1 + X2+..+Xn) amostra aleatria simples da populao X com mdia e varincia
2 , e X = (X1 + X2+..+Xn)/n ento,
X
Z= N(0,1)
n
Note que usamos a transformao usual de reduzir a distribuio de X a uma distribuio normal padro.
Definio - Seja e a varivel aleatria que mede a diferena entre a estatstica X e o parmetro , isto , e
= X -.

Corolrio 3.2 - A distribuio de e aproxima-se de uma distribuio normal com mdia 0 e varincia 2/n ,
isto , e = N( 0, 2/n).
Teorema do Limite Central afirma que X aproxima-se de uma normal quando n . fcil verificar, que
a rapidez dessa convergncia depende da distribuio da populao da qual a amostra retirada. Se a
populao original prxima da normal, sua convergncia rpida; j, se a distribuio da populao tem
outra distribuio, essa convergncia mais demorada. Como regra prtica, aceita-se que para amostras com
mais de 30 elementos a aproximao j pode ser considerada muito boa.
Portanto, se X uma populao com distribuio normal de mdia e varincia 2, e se dessa populao
2
retirarmos amostras de tamanho n, ento x : N , isto : a distribuio da varivel x por amostragem
n
casual simples ser sempre normal com a mesma mdia da populao X e varincia n vezes menor. Isso
significa que quanto maior o tamanho da amostra, menor ser a varincia de x , ou o estimador x ser mais
preciso medida que o tamanho da amostra aumentar. Se a populao X no for normal, x ter distribuio
aproximadamente normal

2
x N ,
n

importante destacar que se a populao for finita e de tamanho N conhecido, e se a amostra de tamanho n
Nn
dela retirada for sem reposio, tem-se: x .
n N 1

Distribuio amostral das propores

Seja a populao X definida como uma varivel aleatria tal que:


X = 1 se o elemento da populao tem a caracterstica de interesse.
X = 0 se o elemento da populao no tem a caracterstica de interesse.
Sabe-se que P(X=1) = p, P(X=0) = q e p+q = 1, sem nos preocuparmos com demonstraes, podemos dizer
que se retirarmos uma amostra de tamanho n, x1, x2, ... xn, dessa populao, onde x ser o nmero de
sucessos na amostra, isto , o nmero de elementos da amostra com a caracterstica que se deseja estudar,
52
tem-se:
N
pq
p p ,
n

Se o tamanho da amostra for suficientemente grande a distribuio da proporo amostral segue uma
distribuio normal.

Logo:

. Assim a varivel normal padronizada dada por:

LISTA DE DISTRIBUIO AMOSTRAL

1) Certas vlvulas fabricadas por uma companhia tm uma vida mdia de 800 horas e desvio padro de 60
horas. Determinar a probabilidade de uma amostra aleatria de 16 vlvulas, retiradas do grupo, ter vida
mdia: (a) entre 790 e 810 horas; (b) inferior a 785 horas; (c) superior a 820 horas. R) a- 0,4950 b- 0,1587
c- 0,0912

2)Um Fiscal toma uma amostra de n= 36 obras de uma populao de obras a serem fiscalizadas. O desvio
padro da populao desconhecido, mas o dp da amostra de S= 43m2. Se o verdadeiro valor da mdia da
metragem das obras de 260m2 qual a probabilidade de que a mdia da amostra seja menor ou igual a
250m2? (0,0815)

3) A capacidade mxima de um elevador de 500 kg. Se a distribuio X dos pesos dos usurios suposta
N(70,100):
a- Qual a probabilidade de 7 passageiros ultrapassarem esse limite? (35,27%)
b- E seis passageiros? (0,02%)

4) Uma varivel X tem distribuio normal, com mdia 10 e desvio padro 4. Aos participantes de um jogo,
permitido observar uma amostra de qualquer tamanho e calcular a mdia amostral. Ganha o prmio aquele
cuja mdia amostral for maior que 12. a) Se um participante escolher uma amostra de tamanho 16, qual a
probabilidade de ele ganhar o prmio? b) se outro participante escolher uma amostra de tamanho 25, qual a
probabilidade de ele ganhar o prmio? a- 2,28% b- 0,62%
53
5) ) Determinar a probabilidade de, entre 300 candidatos inscritos para uma Multinacional: a) menos que
40% serem homens. ( 0,0003). b) entre 43% e 57% serem homens. ( 0,9847 )

Intervalos de Confiana

A estimativa de um parmetro por pontos (pontual) no possui uma medida do possvel erro cometido
na estimao.
Uma maneira de expressar a preciso da estimao estabelecer limites, que com certa
probabilidade incluam o verdadeiro valor do parmetro da populao. Esses limites so chamados limites
de confiana: determinam um intervalo de confiana no qual dever estar o verdadeiro valor do parmetro.
Logo, a estimativa por intervalo consiste na fixao de dois valores tais que (1-) seja a
probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parmetro.
: nvel de significncia
(1-) : coeficiente de confiana ou nvel de confiabilidade
Logo, a partir de informaes da amostra, devemos calcular os limites de um intervalo, valores
crticos, que em (1-)% dos casos inclua o valor do parmetro a estimar e em % dos casos no inclua o
valor do parmetro.


54

Intervalo de confiana para a mdia quando a varincia populacional 2 for


conhecida:

Deseja-se estimar a mdia da populao X conhecendo o valor da varincia 2, ou seja X:N (? , 2).
2
Com a utilizao das distribuies amostrais, x N , ,
n
Procedimentos para a construo do intervalo de confiana (IC):
Retira-se da populao uma amostra casual simples de n elementos.
Calcula-se a mdia da amostra x .
2
Calcula-se o desvio padro da mdia amostral x .
n n
Fixa-se o nvel de significncia e determina-se o valor de Z correspondente.

P( z z ) ou seja, P(z z ) e P(z -z )
2 2 2 2

(1-)
2 2
-z/2 z/2

Usando uma notao simplificada para o intervalo de confiana para a mdia populacional, temos:

IC[ , 1-] = x z ; x z
2 n 2 n
ou

x z x z , com (1-) de confiabilidade.
2 n 2 n

Ex.: Um engenheiro civil est analisando resistncia a compresso do concreto. A resistncia compresso
distribuda de forma aproximadamente normal, com uma varincia de 2 = 1.000 2. Uma amostra aleatria
de 30 copos de prova tem uma resistncia mdia compresso de X 3250 .
Construir o intervalo de confiana de 96% para a resistncia mdia compresso.
Soluo:
n = 30 x 3250 = 31,62 (desvio padro populacional conhecido)
(1-) = 0,96 (1-/2) = 0,98 z0,98= 2,05
Logo:

Intervalo: x z x z
2 n 2 n
31,62 31,62
3250 (2,05) 3250 ( 2,05)
30 30

3238,165 < < 3261,84


55

Conclumos que a resistncia mdia compresso est 3238,17 3261,84 com uma confiana de 96%.

Erro mximo da amostra para a estimativa:


Se o valor de n for suficientemente grande, n 30, e a populao for infinita (ou
significativamente grande para no ser preciso aplicar o fator de correo para populao finita), tem-se:


e z
2 n

Ex.: Um grupo de tcnicos em eficincia pretende utilizar a mdia de uma amostra aleatria de tamanho n =
150 para estimar a aptido mdia (avaliada por certo teste padronizado) dos operrios em uma grande
empresa de construo. Se, com base na experincia, os tcnicos admitem que = 6,2 para tais dados, o que
podem eles afirmar, com 0,99 de probabilidade, sobre o erro mximo de sua estimativa?
Soluo:
n= 150 = 6,2 z0,005 = 2,575
6,2
e 2,575 1,30
150
Assim, os tcnicos em eficincia podem afirmar com 99% de confiana, que o erro da estimativa ser no
mximo de 1,30.

Pela frmula do erro mximo definida anteriormente, pode-se determinar o tamanho da


amostra necessrio para atingir determinado grau de preciso na estimativa do parmetro.
2
z
n /2
e

Sabe-se que o erro na estimao da taxa mdia de queima do propelente de um foguete de 1,5, com uma
confiana de 95%, 2 e z0,025 = 1,96, definir o tamanho requerido na amostra.

Soluo:
z0,025 = 1,96 e = 1,25 =2
2
1,96 12
n 7
1,5
Quando estivermos trabalhando com o tamanho de amostras, o resultado final dever sempre
ser arredondado para o interiro imediatamente superior. Portanto, o tamanho da amostra de 139.

Distribuio de t de Student
x
A varivel Z tem distribuio normal. Quando no conhecemos a varincia 2, devemos usar seu
x
s2 s
estimador s2 e tem-se: s x .
n n
x
A varivel definida como t denominada varivel com distribuio de t de Student com graus
sx
de liberdade, onde = n-K (n o nmero de informaes independentes da amostra e K nmero de
parmetros da populao a serem estimados alm do parmetro inerente ao estudo).
Quando n grande, s2 se aproxima bastante de 2, o que faz com que a varivel t se aproxime
da varivel normal Z.
56
Intervalo de confiana para a mdia quando a varincia populacional for 2

desconhecida:
O procedimento padro o mesmo que o adotado para anteriormente.
Retira-se uma amostra de n elementos da populao.
- Se n > 30, usa-se a distribuio normal com s2.
- Se n 30, usa-se a distribuio t de Student, com - n-1 graus de liberdade.
1 n
Calcula-se a mdia da amostra x xi .
n i 1
Calcula-se a varincia amostral:
n
2

x i
1 1 n 2 i 1 1 n 2 2
s
2

n 1
( x x ) n 1
2
xi
n
ou s2 x nx
n 1 i 1
i 1


s2 s
Determina-se o desvio padro para a distribuio amostral da mdia s x .
n n
Observe que s x o estimador de x (estimador do erro padro).
Fixa-se o nvel de significncia e determina-se o valor de t correspondente.

1-

t/2 tt/2
Usando uma notao simplificada para o intervalo de confiana para a mdia populacional, temos:


S S
IC[ , 1-] = x t ; x t

2 n 2 n


ou
S S
x t x t , com (1-) de confiabilidade
2 n 2 n

Ex.: Querendo determinar o peso mdio de nicotina dos cigarros de sua produo, um fabricante recolheu
uma amostra de 25 cigarros, obtendoxi= 950 mg e xi 3610 mg2. Supondo a distribuio normal para
2

o peso de nicotina, construir um IC para ao nvel de confiabilidade de 95%.


Soluo:
950 1 950 2
n=25 x 38 s2 36106 0,25 s 0,25 0,5
25 24 25
s s
IC(,95%) = x t x t
n n
57
0. 5 0. 5
IC(,95%) = 38 2,06 38 2,06
25 25

IC(,95%) = 37,794 < < 38,206

Conclui-se que o peso mdio da nicotina encontra-se entre 37,794 e 38,206 mg com 95% de confiabilidade.

Intervalo de confiana para propores

Seja uma amostra de tamanho n > 30. Deseja-se construir um intervalo de confiana para a proporo
populacional p. o procedimento semelhante aos anteriores.
x
Calcula-se a proporo da amostra p , onde x o nmero de vezes que ocorre o
n
sucesso do experimento.
Como desconhecemos a verdadeira proporo, determina-se o desvio padro para a
pq

distribuio amostral da proporo utilizando sua estimativa sp .
n
Fixa-se o nvel de significncia e determina-se o valor de z correspondente.

1-

-z/2 z/2


p p
P z 1 , que desenvolvido determina o intervalo de confiana para a proporo.
q
p



n
pq pq
IC[ , 1-] = p z ; p z
2 n 2 n
ou

p z pq p p z pq , com (1-) de confiabilidade.
n n
2
2

Ex.: Para se estimar a porcentagem de alunos de um curso favorveis modificao do currculo escolar,
tomou-se uma amostra de 100 alunos, dos quais 80 foram favorveis mudana.
a) Qual o erro da estimativa admitindo-se 96% de confiana?
b) Para a situao anterior, qual ser o IC para a verdadeira porcentagem de alunos favorveis
mudana?
Soluo:
80
a) n=100 p 0,8 1-= 0,96
100
pq 0,8 0,2
erro= z erro= 2,05 0,082
2 n 100
O erro mximo cometido na estimativa de 0,082
pq pq
b) O IC ser: p z p p z
2 n
2 n
IC(p; 96%)= (0,8 0,082) < p < (0,8+0,082)

IC(p; 96%)= 0,7180 < p < 0,8820 ou 71,80% < p < 88,20%
58

Pode-se afirmar com 96% de confiabilidade que a proporo dos alunos da faculdade favorveis mudana
curricular est entre 71,80% e 88,20%.

Intervalo de confiana para a diferena de mdia quando as varincias


populacionais forem conhecidas:

A construo do Intervalo de confiana (IC) semelhante a realizada para a mdia quando conhecemos a
varincia populacional. Deve-se observar a distribuio para a diferena das mdias.
Sejam duas amostra de tamanho n e m retiradas respectivamente de populaes com distribuies normais
independentes X e Y com mdia x e y e desvios padres x e y. O IC para a diferena das mdias (x - y)
ser;
2x y
2
2x y
2

IC[x - y , 1-] = ( x y ) z ; ( x y ) z
2 n m 2 n m

ou
2
2 2
2
( x y ) z x y ( x y ) ( x y ) z x y com (1-) de confiabilidade.
2 n m 2 n m

Ex.:Testes de resistncia tenso foram feitos em duas estruturas contendo 2 teores de alumnio. Essas
estruturas foram usadas na fabricao das asas de um avio comercial. De experincias passadas c/ o
processo de fabricao dessas estruturas e com o procedimento de testes, os desvios-padro das resistncias
tenso so considerados conhecidos. Calcular o intervalo de confiana de 90% Os dados obtidos so?
Soluo: Temos:
X1: Resistncia Trao da Amostra 1
XB: Resistncia Trao da Amostra 2
1= 1,0 2 = 1,5 1- = 90%
n1 =10 n2 = 12 ( x A - xB ) =
x1 =87,6 y =74,5

2
2y 1 2,25
Erro = z x
Erro = 1,645 .0,88............
2 n m 10 12

O erro mximo da estimativa da diferena das mdias ......, logo o IC :


2
2 2
2
( x y ) z x y ( x y ) ( x y ) z x y
2 n1 n2
2 n1 n2

IC(%)= 12,22kg/mm2< ( A- B) < 13,98kg/mm2

Desse modo, o intervalo de confiana de 90% p/ diferena na resistncia mdia tenso de 12,22kg/mm2 a
13,98kg/mm2 .

Intervalo de confiana para a diferena de mdia quando as varincias


populacionais forem iguais e desconhecidas:
Para o caso de pequenas amostras, consideramos pequenas se (n+m-2) < 30, utilizada a distribuio de
59
Student.
s2 s2 s2 s2
IC[x - y , 1-] = ( x y ) t 2 ; (x y) t
n m 2 n m
(n 1)sn2 (m 1)sm2
onde s 2

nm2
s2 s2 s2 s 2
IC[x - y, 1-] = ( x y ) t ( x y ) ( x y ) t , com (1-) de confiabilidade.
2 n m 2 n m

Para o caso em que as amostras forem suficientemente grandes, (n+m-2) 30, a distribuio aproxima-se
da distribuio normal e o IC para a diferena de mdias ser:
s2 s2 s2 s2
IC[x - y , 1-] = ( x y ) z 2 ; ( x y) z
n m 2 n m
(n 1)sn2 (m 1)sm2
onde s2
nm2
s2 s 2 s2 s2
IC[x - y, 1-] = ( x y ) z ( x y ) ( x y ) z , com (1-) de confiabilidade.
2 n m 2 n m

Ex.: Para um particular produto da construo civil A, a mdia de vendas por estabelecimento no ltimo ano, em uma
amostra de n =10 estabelecimentos foi de x A R$3425,00 com sA= R$ 200,00. Para um segundo produto B, a
mdia de vendas por estabelecimento, em uma amostra de tamanho m = 12, foi de xB R$3250,00 , com sB= R$
175. Supondo-se que as amostras tenham sido retiradas de populaes normais, estimar a diferena entre o nvel mdio
de vendas por estabelecimento no ltimo ano, utilizando um intervalo de confiana de 90%.
Soluo:
XA: Vendas do produto A no ltimo ano. sA= 200,00 sB= 175 1- = 90%
XB: Vendas do produto B no ltimo ano. ( x A - xB ) =
n =10 n = 12
175,00
Erro =
x A = 3425,00 x B = 3250,00 t10%= 1,72
s2 s2 (n 1 -1)s2A ( n 2 1) sB2
t onde s 2

n1 n2 (n 1 n 2 -2)
9 2002 11 1752 34843,75 34843,75
s2 34843,75 , teremos: Erro = 1,72 137,85
(10 12 2) 10 12
O erro mximo da estimativa da diferena das mdias 137,85, logo o IC :
S2 S2 S2 S 2
( x y ) t ( x y ) ( x y ) t

2 n 1 n 2
2 n 1 n 2
(175,00 - 137,85) ( x y ) (175,00 137,85)

IC[( A- B); 90%]= 37,15 < ( A- B) < 312,85

Podemos afirmar, ao nvel de 95% de confiana, que a diferena entre a venda mdia dos dois produtos est
entre R$ 37,15 e R$ 312,85.
60

LISTA DE INTERVALO DE CONFIANA

1) De uma distribuio normal com = 1,96, obteve-se a seguinte amostra: 25,2 ; 26,0 ;26,4 ; 27,1 ; 28,2 ;
28,4. Determinar o intervalo de confiana para a mdia da populao, sendo = 0,05 e = 0,10. (1,57 ;
1,32)

2) Um analista do departamento pessoal de uma construtora seleciona aleatoriamente os registros de 16


empregados horistas que menos ganham, e acha que a mdia de salrio por hora R$ 2,00. Supe-se que os
salrios na firma sejam distribudos normalmente. Se o desvio padro dos salrios conhecido, e igual a R$
0,90, estimar a taxa mdia de salrio desses horistas na firma usando um intervalo de confiana de 80%.
(0,29)

3) Calcule o intervalo de confiana para a mdia em cada um dos casos abaixo: (2,94; 3,18; 2,07)
___________________________________________________________________________________

Mdia Amostral Tamanho da amostra Desvio Padro Coeficiente de


Populacional Confiana
_____________________________________________________________________________________
170 cm 100 15 cm 95%
165 cm 184 30 cm 85%
180 cm 225 30 cm 70%
_____________________________________________________________________________________

4) Colhida uma amostra de 30 peas, forneceu os seguintes pesos (kg):

250 265 267 269 271 275 277 281 283 284
287 289 291 293 293 298 301 303 306 307
307 309 311 315 319 322 324 328 335 339
Construir um intervalo de 95% de confiana para o peso Sugesto: adote = 5%.

5) De um grupo muito grande de Estatstica, extraram-se aleatoriamente 40 notas:


71 74 65 72 64 42 62 62 58 82
49 83 58 65 68 60 86 86 74 53
78 64 55 87 56 50 58 58 57 75
58 86 64 56 45 73 86 86 70 73

Construir um intervalo de 95% de confiana para a nota mdia de todo o grupo.

6) Da produo de vlvulas fabricadas por uma companhia retira-se uma amostra de 400 vlvulas, e obtm-
se a vida mdia de 800 horas e o desvio padro de 100 horas.
61
a) Qual o intervalo de confiana de 99% para a vida mdia da populao?
b) Com que confiana dir-se-ia que a vida mdia 800 0,98?
c) Que tamanho deve ter a amostra para que seja de 95% a confiana na estimativa 800 7,84?

7)Uma amostra de 300 habitantes de uma certa cidade mostrou que 180 desejavam a gua fluorada.
Encontrar os limites de confiana de 90% e 95% para a proporo da populao favorvel a fluorao.

8) Uma amostra aleatria de 625 donas-de-casa revela que 70% delas preferem a marca X de detergente.
Construir um intervalo de confiana para a proporo das donas-de-casa que preferem X com = 10%.

9)Suponha que estejamos interessados em estimar a porcentagem de consumidores de um certo produto. Se


uma amostra de tamanho 300 forneceu 100 indivduos que consomem o dado produto, determine: (a) o I.C.
de p, com coeficiente de confiana de 95% (b) o tamanho da amostra para que o erro da estimativa no
exceda a 0,02 unidades com probabilidade de 95%.

10) Em uma a.a. de 2500 pneus fabricados por determinada companhia, 20% fogem aos seus
padres.Construir um intervalo de 95% de confiana para a proporo populacional de pneus que no esto
dentro dos padres tcnicos estabelecidos. (0,0157)

11)Um artigo em Fire Tecnology investigou 2 agentes diferentes de expanso de espumas que podem ser
usados nos bocais de um equipamento spray contra incndio. Uma amostra de 5 observaes c/ uma espuma
formada por um filme aquoso (EFFA) teve a mdia de 4,7 e um desvio padro de 0,6. Uma amostra aleatria
de 5 obs. C/ uma espuma formada por concentrao alcolicas (EFSCA) teve uma mdia de 6,9 e um
desvio-padro de 0,8. Encontre o intervalo de confiana de 95% p/ a diferena na expanso mdia desses 2
agentes. Supor que ambas as populaes sejam dist. normalmente..

12) Uma amostra aleatria de 50 famlias de uma comunidade A apresenta uma renda mdia familiar de X =
R$ 13.800,00, com desvio padro s x = R$ 2.200,00. Uma amostra aleatria de 50 famlias da comunidade B

apresenta uma mdia Y = R$ 14.800,00 com desvio padro s y = R$ 2.800,00. Estimar a diferena na renda
familiar entre as duas comunidades, utilizando um IC de 95%.

13) Um artigo no jornal Hazardous Waste and Hazardous Materials (Vol. 6, 1989) reportou os resultados de
uma anlise do peso de clcio em cimento padro e em cimento contendo chumbo. Nveis reduzidos de
clcio indicaram que o mecanismo de hidratao no cimento foi bloqueado, permitindo a gua atacar em
vrias localizaes na estrutura do cimento. 10 amostras de cimento padro tiveram um teor mdio
percentual em peso de clcio de 90,0, com desvio padro de 5,0, enquanto 15 amostras do cimento c/
chumbo tiveram um teor percentual em peso de clcio de 87,0 c/ um desvio padro de 4,0. . Considerando o
teor percentual em peso de clcio seja normalmente distribudo encontrar o intervalo de confiana de 95% p/
os 2 tipos de cimento..
62

TESTES DE HIPTESES
Frequentemente devemos tomar decises sobre populaes com base em informaes amostrais das
mesmas. Tais decises, chamam-se decises estatsticas. Na tomada de decises til formular hipteses ou
suposies sobre as populaes em jogo. Tais hipteses, que podem ser verdadeiras ou no, chamam-se
hipteses estatsticas e, em geral, consistem de afirmaes sobre as distribuies de probabilidade das
populaes, como por exemplo:
a mdia populacional da altura dos brasileiros 1,65m;
a proporo de veculos com defeito de fbrica de uma determinada marca X 10% (p = 0,10);
a distribuio das idades dos alunos da UEM normal;
Os processos que nos permitem decidir aceitar ou rejeitar uma hiptese, ou determinar se amostras
observadas diferem significativamente dos resultados esperados so chamados Testes de Hipteses. O
objetivo fornecer ferramentas que nos permitam validar ou refutar uma hiptese, atravs de resultados da
amostra. Os Testes de Hipteses podem ser de dois tipos:

i) No Paramtricos: quando formulamos hipteses com respeito natureza da distribuio da


populao. Estes testes no dependem dos parmetros populacionais, nem de suas respectivas estimativas.

ii) Paramtricos: quando formulamos hipteses com respeito ao valor de um parmetro


populacional.
Neste tpico, vamos tratar dos testes ditos paramtricos, pois se referem a hipteses sobre
parmetros populacionais, isto , feita determinada afirmao sobre uma populao, usualmente sobre um
parmetro desta, desejamos saber se os resultados de uma amostra contrariam ou no tal afirmao.
Os testes de hiptese representam uma regra de deciso que permite aceitar ou rejeitar uma hiptese
formulada. Tem-se, ento, as duas seguintes hipteses iniciais:
1) Hiptese nula ( H0): aquela que ser testada; admite-se aqui que a diferena observada entre o
estatstico( estimador) amostral e o parmetro populacional devido apenas ao acaso, ou seja, essa diferena
no significativa .
2)Hiptese alternativa (H1): qualquer hiptese diferente da hiptese nula, isto , aquela que ser aceita
caso o teste indique que H0 deva ser rejeitada; aceitando essa hiptese, conclui-se que a diferena citada
significativa.
As hipteses estatsticas para o parmetro , podem ser formuladas como segue.

a)Teste Bilateral: quando utilizamos ambas as caudas da distribuio normal padronizada

H 0 : 0
a)
H1 : 0
63
b)Teste Unilateral Direita: quando utilizamos a cauda direita da distribuio normal padronizada.

H 0 : 0
b)
H 1 : 0
c)Teste Unilateral Esquerda: quando utilizamos a cauda esquerda da distribuio normal padronizada

H 0 : 0
c)
H1 : 0
O objetivo de se testar uma hiptese tomar uma deciso, se possvel correta. Devemos no rejeitar
ou rejeitar H0, que a hiptese usada como referncia.
Suponhamos que exista essa hiptese, a qual ser considerada vlida at prova em contrrio,
referente a um dado parmetro da populao. Essa hiptese ser testada com base em resultados amostrais,
sendo aceita ou rejeitada. Nos problemas de testes de hipteses, vamos basear nossas concluses em
variveis obtidas atravs da amostra ou amostras disponveis
Para melhor entendermos a regra de deciso adotada, interessante estudarmos os tipo de
erros que podemos cometer e as respectivas probabilidades de cometermos esses erros.
Podemos cometer dois tipos de erros, ou seja:

Erro Tipo I - rejeitar H0, quando H0 verdadeiro


A probabilidade desse erro ser simbolizada por ( nvel de significncia).

= P( cometer erro tipo I) = P(rejeitar H0 H0 verdadeiro)

Erro Tipo II Aceitar H0, quando H0 falso.


A probabilidade de cometer esse erro ser simbolizada por .

= P( cometer erro Tipo II) = P( aceitar H0 H0 falso)

Esquematicamente, o quadro abaixo mostra as diversas situaes que podem ocorrer num
teste de hiptese:

REALIDADE

DECISO H0 verdadeira H0 falsa

Aceitar H0 Deciso correta Erro tipo II

Rejeitar H0 Erro tipo I Deciso correta

PROCEDIMENTO GERAL DO TESTE DE HIPTESES

A construo de um teste de hiptese, para um parmetro populacional, consiste em dado uma


varivel X de uma populao normal e uma hiptese sobre determinado parmetro dessa populao. Por
exemplo, afirmamos que esse valor um nmero 0. Colhe-se uma amostra aleatria de n elementos dessa
populao, e atravs dela deseja-se comprovar ou refutar tal hiptese.
Construmos as hipteses nula e alternativas: H0: = 0 e H1 : < 0; ou H1 : > 0 ou H1: 0.
64

PASSO PARA CONSTRUO DE UM TESTE DE HIPTESE

Daremos a seguir uma seqncia que pode ser usada sistematicamente para qualquer teste de
hiptese.

Passo 1: Enunciar H0 e H1.


Passo 2: Usar a teoria estatstica e as informaes para decidir qual estatstica (estimador) ser usada no
julgamento de H0. Fixar
Passo 3: Construir a regio crtica (RA= Regio de Aceitao de H0 e RC= Regio de Rejeio de Ho ou
Regio Crtica.
Passo 4: Usar as informaes fornecidas pela amostra para encontrar o valor da estatstica que definir a
deciso.
Passo 5: Se o valor da estatstica observada na amostra no pertencer a RC, no rejeite H0. Caso contrrio,
rejeite-o.

Testes para a mdia de uma populao, com varincia conhecida

Passo 1: - Hipteses
Enunciar as hipteses (deve ser feito no incio da pesquisa, antes de se realizar a experincia
amostral)

caso (a) caso b) caso c

H 0 : 0 H 0 : 0 H 0 : 0

H1 : 0 H 1 : 0 H1 : 0
Passo 2 Fixar o erro e avaliar a varivel do Teste
2
Como X N ( , ) para qualquer tamanho de amostra, n, se a populao for normal e n 30 se a populao
n
no for normal, a estatstica (ou varivel) do teste : Z

Passo 3 - Regio Crtica


Fixar o limite do erro tipo I, , e determinar a regio crtica.

Caso(a) - Devemos determinar x1 e x2, tais que P(x1 X x2)=1- ou, equivalentemente, devemos
determinar z 2 , tais que P( z 2 Z z 2 ) 1 .

RA RA
RC
RC

x1 0 x2 z / 2 0 z / 2 RC

A regio de rejeio da hiptese H0 , ou regio crtica, ser:


65

RC= x / x x1 ou x x 2 ou

RC= z / z z 1 / ou z z 2

Caso (b) - Devemos determinar x , tal que P( X x ) 1 ou, equivalentemente, devemos determinar z
tal que P ( Z z ) 1 .

RA RA
RC RC
0 Z 0
A regio de rejeio da hiptese H0 , ou regio crtica, ser:
RC= x / x xc ou RC= z / z z

Caso (c) - Devemos determinar x , tal que P( X x ) 1 ou, equivalentemente, devemos determinar z ,
tal que P ( Z z ) 1 .

RA RA
RC RC

0 z
xc
A regio de rejeio da hiptese H0 , ou regio crtica, ser:
RC= x / x xc ou RC= z / z z

Passo 4 - Valor da Estatstica Teste (z)


Usando as informaes fornecidas pela amostra, determinar o valor da estatstica (ou varivel) que definir a
deciso
X 0
z
n
Passo 5 Concluso
Se o valor amostral x estiver na regio crtica, isto , x x 1 ou x x 2 , rejeita-se H0. Isto equivale a
dizer que se o valor z da varivel do teste, obtido no passo 4, estiver na regio de rejeio, ou seja,
z z 2 ou z - z , rejeita-se H0. Caso contrrio, no podemos rejeita H0.
2

EXEMPLO: Suponhamos que os cientistas tenham estabelecido que se os cigarros contm em mdia, 30
miligramas ou mais de nicotina, existe a certeza de se produzir cncer no pulmo. Um fumante est disposto
a se arriscar se a mdia de nicotina for menor que 30 miligramas. Ensaios sobre 100 cigarros da marca A
mostraram uma mdia de 26 miligramas de nicotina. Se = 8 miligramas e considerando um nvel de
significncia de 2%, qual a deciso que o fumante deve tomar?
Como, = 30, n = 100, x 26 , = 8 e = 2%, teremos:
Passo 1: Hipteses
66

H 0 : 30

H 1: 30
H0 (O contedo mdio de nicotina nos cigarros de 30 miligramas e o fumante no se arrisca a fumar)
H1 (O contedo mdio de nicotina nos cigarros significativamente inferior a 30 miligramas e o fumante
se arrisca a fumar)
Passo 2: Avaliar a varivel do teste e fixar o limite do erro . Como o teste unilateral esquerda e =
0,02. Da tabela obtemos z 2,05
X 0
Uma vez que conhecido, a estatstica do teste : Z
n
Passo 3: Regio crticae assim:

RA

RC

z= -2,05
RC= z / z 2,05
Passo 4: Valor da Estatstica Teste
x 0 26 30
zcal z cal 5
8
n 100

Passo 5: Concluso: Como z cal z (-5 < 2,05), rejeita-se H0, ou seja, com 98% de certeza, no h
evidncias de que o contedo mdio de nicotina nos cigarros seja de 30 miligramas e o fumante se arrisca a
fumar, ou, ao nvel de 2% de significncia, rejeitamos a hiptese H0, h evidncias de que o teor de nicotina
seja menor que 30.

Teste para com 2 desconhecido e n < 30

Seja X=N( ; 2 ) e X = N( ; 2 /n)


Suponhamos que desconhecemos a varincia populacional ( 2 ), o que geralmente acontece, na
maioria das vezes . Se n< 30, utilizamos a varincia amostral (S2 )como estimativa pontual da varincia
populacional.
A seguir vamos construir os procedimentos para fazermos o teste de hiptese.

Passo 1 Hipteses

Enunciar as hipteses (Deve ser feito no incio da pesquisa, antes de se realizar a experincia amostral.

Caso (a) caso (b) caso (c)

H 0 : 0 H 0 : 0 H 0 : 0

H 1 : 0 H1 : 0 H1 : 0
67
Passo 2: Avaliar a varivel do teste e fixar o limite do erro
Com 2 desconhecido devemos estim-lo. Assim a varivel do teste t com n-1 graus de liberdade.

Passo 3: Regio crtica


Caso (a) - Devemos determinar x1 e x2, tais que P( x1 x x 2 ) 1 ou, equivalentemente, devemos
determinar t 2 , tais que P( t 2 t t 2 ) 1 .

1 1

2
2 2 2
x1 0 x2 0
t t
A regio Crtica para o teste ser: 2 2

RC= x / x x1 ou x x2 ou RC= t / t t 1/ ou t t 2

Caso (b) - Devemos determinar x , tal que P( X x ) 1 ou, equivalentemente, devemos determinar t

tal que P( t t ) 1 .

1 1

0 xc 0 t
Cuja regio crtica pode ser definida:

RC= x / x x c ou RC= t / t t

Caso (c) - Devemos determinar x, tal que P( X x ) 1 ou, equivalentemente, devemos determinar t ,
tal que P( t t ) 1 .

1
RA
RC

xc 0 -t 0
Cuja regio crtica pode ser definida:
RC= x / x x c ou RC= t / t t

Passo 4: Valor da estatstica teste (t)


X 0
t
s n
68
Passo 5: Concluso
a) Se o valor amostral x estiver na regio de rejeio (caso a), isto , x x 1 ou x x 2 , rejeita-se H0.
Isto equivale a dizer que se o valor t da varivel do teste, obtido no passo 4, estiver na regio de rejeio ou
crtica, tc<-t/2 ou tc>t/2, rejeita-se H0. Caso contrrio no existe evidncias para se rejeitar H0.
Idem para os casos b) e c).

Obs.: no caso em que n 30, o procedimento o mesmo, podendo-se utilizar valores Z para aproximar
valores t na determinao das regies crticas.

EXEMPLO: Estamos desconfiados de que a mdia das receitas municipais per capita das cidades pequenas
(0 - 20.000 habitantes) maior do que a das receitas do estado, que de 1229 unidades. Para comprovar ou
no esta hiptese, sorteamos dez cidades pequenas, e obtivemos os seguintes resultados:
1230, 582, 576, 2093, 2621, 1045, 1439. 717, 1838, 1359
Utilize um nvel de significncia de 5%

Passo 1: Hipteses

H 0 : 1229

H 1 : 1229
H0: A mdia das receitas municipais per capita das cidades pequenas de 1229 unidades.
H1: A mdia das receitas municipais per capita das cidades pequenas significativamente superior a 1229
unidades.

Passo 2: Avaliar a varivel do teste e fixar o limite do erro .


Uma vez que desconhecido e n < 30, assim a varivel do teste t com n-1 graus de liberdade.
O teste unilateral direita, os graus de liberdade so dados por gl = n -1 = 10 - 1 = 9 e sendo = 0,05, da
tabela obtemos t = 1,83.

Passo 3: Regio crtica


Assim:


t = 1,83
RC= t / t 1,83

Passo 4: Valor da Estatstica Teste


Valor da estatstica da deciso :
X 0 1350 1229
t cal t cal 0,57
s n 675,8
10
Passo 5:Concluso: Como t cal t (0,57 1,83) , no rejeitamos, ou seja, com 95% de certeza, no h
evidncias de que a mdia das receitas municipais per capita das cidades pequenas seja significativamente
superior a 1229 unidades.
69
Teste de hiptese para a proporo de sucesso populacional (P).

Seja X uma varivel aleatria discreta com uma distribuio binomial de probabilidade, isto
, X = N(np; np(1-p)) e p = X/n ou p %= (X/n)100, a proporo de sucesso de uma amostra de tamanho n
extrada dessa populao, e sabemos que f N(p ; p(1-p)/n)
A seguir vamos utilizar os passos para fazer um teste de hiptese
Passo 1: Hipteses
caso (a) caso (b) caso (c)

H 0 : p p0 H 0 : p p 0 H 0 : p p 0

H1 : p p0 H 1 : p p 0 H 1 : p p 0
Passo 2: Avaliar a varivel do teste e fixar o limite do erro .
Como p para n 30, a estatstica (ou varivel) do teste : Z
Passo 3: Regio crtica: Determinar a regio crtica.
a) Devemos determinar f1 e f2, tais que P(f1 p f2) = 1 - ou, equivalentemente, devemos determinar
z 2 , tais que P( z 2 Z z 2 ) 1 .

1- 1-

2 2 2 2

f1 p0 f2 z 2 0 z 2
Cuja regio crtica ou regio de rejeio ser:
RC= p / p f1 ou p f2 ou RC= z / z z 1/ ou z z 2

b) Devemos determinar fc, tal que P(p f c ) 1 ou, equivalentemente, devemos determinar z tal que
P( Z z ) 1 .


1- 1-

p0 fc 0 z
Cuja regio crtica ou regio de rejeio ser:
RC= p / p f c ou RC= z / z z

Devemos determinar fc tal que P(p f c ) 1 ou, equivalentemente, devemos determinar z , tal que
P( Z z 2 ) 1 .

1- 1-
70
fc p0 z 0

Cuja regio crtica ou regio de rejeio ser:


RC= p / p f c ou RC= z / z z

Passo 4: Valor da Estatstica Teste (Zcal )


Usando as informaes fornecidas pela amostra determinar o valor da estatstica (ou varivel) que definir a
deciso:
p p 0
z cal
p 0 (1 - p 0 )/n
Passo 5: Concluso: Se o valor amostral <f1 ou p
estiver na regio de rejeio, isto , p
p >f2, rejeita-se
H0. Isto equivale a dizer que se o valor zcal da varivel do teste, obtido no passo 4, estiver na regio crtica, ou
seja, z cal z 2l ou z cal z 2 , rejeita-se H0. Em caso contrrio, no rejeitamos H0.
Idem para os casos b) e c).

EXEMPLO: Uma Empresa de construo acusou o fabricante de telhas, dizendo que mais de 20% das
unidades fabricadas apresentam defeito. Para confirmar sua acusao, ele usou uma amostra de tamanho 50,
onde 27% das telhas eram defeituosas. Mostre como o fabricante poderia refutar a acusao. Utilize um
nvel de significncia de 10%.
Passo 1: Hipteses

H 0 : p 0,20

H 1: p 0,20
H0: A proporo das unidades fabricadas que apresentam defeito 20%.
H1: A proporo das unidades fabricadas que apresentam defeito significativamente superior a 20%

Passo 2: Avaliar a varivel do teste e fixar o limite do erro . O Teste unilateral direita e sendo =
0,10, da tabela obtemos z 1,28 .
Passo 3: Regio crtica

z 1, 28

RC= z / z 1.28

Passo 4: Valor da estatstica teste


O valor da estatstica da deciso :
p p 0 0,27 0,20
zcal z cal 1,24
p 0 (1 - p 0 ) (0,20)(0,80)
Passo 5: n 50
Concluso:Como z cal z (1,24 1,28) , aceita-se H0, ou seja, com 90% de certeza, no h evidncias de
que a proporo das telhas fabricadas que apresentam defeitos seja significativamente superior a 20%.
71
Teste de hiptese para a diferena de duas mdias populacionais com varincias
conhecidas

Passo 1: Hipteses

Enunciar as hipteses (Deve ser feito no incio da pesquisa, antes de se realizar a experincia amostral).

caso (a) caso (b) caso (c)

H 0 : 1 2 (1 2 0) H 0 : 1 2 (1 2 0) H 0 : 1 2 (1 2 0)

H :
1 1 2 1 2 ( 0 ) H :
1 1 2 1 2 ( 0 ) H1 : 1 2 (1 2 0)
Passo 2: Avaliar a varivel do teste e fixar o limite do erro . Fixar o limite do erro e determinar a regio
crtica.
12 22
Como X1 X 2 N ( 1 2 , ), a estatstica (ou varivel) do teste : Z
n1 n 2

Passo 3: Regio crtica

a) -Determinar y1 e y2, tais que P(y1 X1 X 2 y2) = 1 - ou, equivalentemente, determinar

b)

z 2, tais que P( z 2 Z1 Z2 z 2 ) 1 .

1-
1
2
2 2
2
y1 1 2 y2
z 2 0 z 2

Sua regio crtica ser:


RC= ( x 1 x 2 ) /( x 1 x 2 ) y 1 ou ( x 1 x 2 ) y 2

z / z z
ou
RC= ou z z
2 2

c) - Devemos determinar x , tal que P(( X 1 X 2 ) y ) 1 ou, equivalentemente, devemos determinar


z tal que P( Z1 Z2 z ) 1 .

1-
1-
1 2 y 0
z
A regio crtica para este teste :
72
RC= ( x 1 x 2 ) /( x 1 x 2 ) y ou RC z / z z

d) - Devemos determinar x , tal que P( X 1 X 2 y ) 1 ou, equivalentemente, devemos determinar


z , tal que P( Z 1 Z 2 z ) 1 .

1-
1-

y 1 2 z 0

A regio crtica para este teste :


RC= ( x 1 x 2 ) /( x 1 x 2 ) y ou RC z / z z

Passo 4: Valor da Estatstica Teste (zcal )


Usando as informaes fornecidas pela amostra, determinar o valor da estatstica (ou variveis) que definir
a deciso:

( X1 X 2 ) (1 2 ) ( X1 X 2 ) 0
Z cal
2
2
12 22

1 2

n1 n 2 n1 n 2
Passo 5: Concluso
Caso (a) - Se o valor amostral X1 X 2 estiver na regio de rejeio, isto ( X1 X 2 ) y 2 ou ( X 1 X 2 ) y 1 ,
rejeita-se H0. Isto equivale a dizer que se o valor zcal da varivel do teste, obtido no passo 4, estiver na regio
de rejeio, ou seja, z z 2 ou z cal z 2 , rejeita-se H0. Caso contrrio no rejeita-se H0.
Idem para os casos (b) e (c).

EXEMPLO 5: Uma Empresa de concreto enche seus caminhes, com variabilidade praticamente constante
e independente dos ajustes na mdia, dada por um desvio padro de 50kg. Duas amostras retiradas em dois
perodos de trabalho consecutivos, de dez e de vinte caminhes forneceram pesos lquidos mdios de,
respectivamente, 2390kg e 2395kg. Desconfia-se quanto ao peso mdio fornecido possa ter sido modificada
entre a coleta das duas amostras. Qual a concluso, ao nvel de 5% de significncia?
Resoluo:
Temos que = 50g; x1 = 2390 g; x 2 = 2395 g; n1 = 10 e n2 = 20

Passo 1: Hipteses

H0 : O peso lquido mdio o mesmo nos dois perodos.


H1 :O peso lquido mdio significativamente diferente nos dois perodos

Passo 2: Fixar o limite do erro e avaliar a varivel do Teste.


Como 1 = 2 = conhecido, a estatstica do teste : Z. O teste bilateral e sendo = 0,05, da tabela
obtemos z 2 1, 96 .

Passo 3: Regio crtica

1-

/2
73
/2

-1,96 1,96

Passo 4: Valor da Estatstica do Teste

2390 2395
zcal 0,2582
O valor da estatstica da deciso : 1 1
50
10 20

Passo 5: Concluso: Como z cal z 2 (-0,2582 < 1,96), aceita-se H0, ou seja, com 95% de certeza, o peso
lquido mdio o mesmo nos dois perodos.

Teste de hipteses para a diferena de duas mdias com varincias desconhecidas e


iguais

No caso em que 12 e 22 so desconhecidos com n1 < 30 e n2 <30, mas supondo que 12 = 22 2 , o


procedimento anlogo, usando a distribuio t com n1+n2-2 graus de liberdade.

Passo 1: Hipteses
Enunciar as hipteses (Deve ser feito no incio da pesquisa, antes de se realizar a experincia amostral).

Caso(a) Caso(b) Caso(c)

H 0 : 1 2 H0 : 1 2 H 0 : 1 2

H1: 1 2 H1: 1 2 H 1 : 1 2
Passo 2: Fixar o limite do erro e avaliar a varivel do Teste.

Passo 3: Regio crtica:


a) - Determinar y1 e y2, tais que P(y1 X1 X 2 y2) = 1 - ou, equivalentemente determinar
t 2 , tais que P( t 2 t1 t 2 t 2 ) 1 .


2 1
2

2 1 2
y1 1 2 y2 t 2 0 t 2

RC= ( x 1 x 2 ) /( x 1 x 2 ) y 1 ou ( x 1 x 2 ) y 2

t / t z
ou
RC= ou t z
2 2
b) - Devemos determinar y, tal que P( X 1 X 2 y ) 1 ou, equivalentemente, devemos determinar t

tal que P( t t ) 1 .

1- 1-
74

1 2 y 0 t 2

Cuja regio crtica ser:


RC= ( x 1 x 2 ) / ( x 1 x 2 ) y ou RC t / t t

c) Devemos determinar y, tal que P( X 1 X 2 y ) 1 ou, equivalentemente, devemos determinar t ,


tal que P( t t ) 1 .


1- 1-

y 1 2 t 0

Cuja regio crtica ser:

RC= ( x 1 x 2 ) / ( x 1 x 2 ) y ou RC t / t t

Passo 4: A estatstica do Teste:

( X1 X 2 ) ( 1 2 ) ( X1 X 2 ) 0
t (n1 1)S12 (n2 1)S22
1 1 1 1 onde: Sc2
Sc Sc n1 n2 2
n1 n 2 n1 n 2

Passo 5: Concluso
Caso (a) - Se o valor amostral X1 X 2 estiver na regio de aceitao, isto ( x 1 x ) y 1 ou ( x 1 x ) y 2 ,
rejeita-se H0. Isto equivale a dizer que se o valor tcal da varivel do teste, obtido no passo 4, estiver na regio
de rejeio, ou seja, t cal t 2 ou t cal t 2 , rejeita-se H0. Caso contrrio, no se rejeita H0.
Idem para os casos (b) e (c).

EXEMPLO: Para verificar o grau de adeso de uma nova cola para vidros, preparam-se dois tipos de
montagem: cruzado (A), onde a cola posta em forma de X, e quadrado (B), onde a cola posta apenas nas
4 bordas. Os resultados da resistncia para duas amostras de 10 cada esto abaixo. Que tipo de concluso
poderia ser tirada? Utilize um nvel de significncia de 5%.
Mtodo A: 16, 14, 19, 18, 19, 20, 15, 18, 17, 18
Mtodo B: 13, 19, 14, 17, 21, 24, 10, 14, 13, 15
A partir dos resultados acima obtemos:
x A 17 , 40 ; x B 16 , 00
S A 1, 90 ; S B = 4, 24

Passo 1: Hipteses
H0 :O grau de adeso de uma nova cola para vidros a mesma para os dois tipos de montagem.
H1:O grau de adeso de uma nova cola para vidros significativamente diferente para os dois tipos de
montagem

Passo 2: Fixar o limite do erro e avaliar a varivel do Teste. Como 1, 2 so desconhecidos e n1 < 30, n2
< 30, a estatstica do teste : t. Teste bilateral, os graus de liberdade so dados por gl = n1 + n2 - 2 = 18 e
sendo = 0,05, da tabela obtemos t 2 = 2,10.

Passo 3: Regio crtica


75

/2 /2

-2,10 2,10

RC= t cal / t cal 2,10 ou t cal 2,10

Passo 4: Valor da Estatstica Teste


O valor da estatstica da deciso :

(n1 1)S12 (n2 1)S22 2 9(1,90 )2 9( 4,24 )2


Sc2 Sc 10,79 sc 3,29
n1 n2 2 18
( X1 X 2 ) 17,40 16
t t cal 0,95
Ento: 1 1 1 1
Sc 3,29
n1 n 2 10 10

Passo 5: Concluso
Como t 2 t cal t 2 (-2,10 < 0,95 < 2,10), no rejeita-se H0, ou seja, com 95% de certeza, no h
evidncias de que o grau de adeso de uma nova cola para vidros seja significativamente diferente para os
dois tipos de montagem.

Teste de hiptese para a diferena de duas mdias populacionais com varincias no so


conhecidas e so diferentes

a estatstica do teste :

S2 S2
1 + 2

n1 n 2
(X -X )-(1 - 2 )
t= 1 2 : t v , onde gl=v=

2
s1 s22
2 2 2 2
+ S n S n
n1 n 2 1 1 2 2
+
n -1 n -1
1 2

(X1 -X 2 )
t cal =
s12 s 22
+
n1 n 2

Exemplo- Supor duas turmas (T1 e T2) de Engenharia Civil. Deseja-se comparar as turmas com relao
mdia na disciplina. Uma amostra de tamanho 11, da turma 1, forneceu valores para a mdia e varincia
respectivamente 7,6 e 6,5. Uma amostra de tamanho 13, da turma 2, forneceu valores 7,0 para a mdia e 4,5
para a varincia. Supondo normalidade das populaes, podemos concluir com 5% de significncia, que a
turma 1 tem mdia maior que a turma 2?

Como devemos usar um teste de comparao de mdias com varincias populacionais desconhecidas, vamos
76
inicialmente testar se estas varincias so iguais ou no.

Os graus de liberdade:Numerador: gl=n1-1 e Denominador: gl=n2-1


F(10, 12) > F(10, 12, 0.025) = 3.37

3) R.C. corresponde aos valores de F(10, 12) tais que:

S12 6,5
4) Estatstica do teste Fcal 1,44
S 22 4,5

5) Concluso Como o Ftab (1,44) <Fcal(3,37) no rejeitamos a hiptese nula ao nvel de 5%, ou seja h
homogeneidade das varincias. Assim devemos realizar o teste para as mdias considerando varincias
populacionais iguais.

Soluo:
T1 x1 7.6 n1 11 S12 6,5
Dados:
T2 x2 7,0 n2 13 S 22 4,5

H 0 :1 = 2
1) Definio das hipteses:
H1:1 > 2
2) Identificar estatstica do teste da tabela T com =5% e gl=(n1+n2-2)=22, t0,05=1,72

3) RC e RA

4) Como as varincias populacionais no so conhecidas, porm iguais (homogeneidade de varincias) a


estatstica :

(X1 -X 2 )-(1 - 2 ) (n -1)S2 +(n -1)S2


t= : t (n1 +n 2 -2) , onde S = 1 1 2 2
1 1 p n +n -2
Sp . + 1 2
n1 n 2
77

(11-1)6,5+(13-1)4,5 (X1 -X 2 ) (7,6-7,0)


S = =2,326 t cal = 0, 63
p 11+13-2 1 1 1 1
Sp . + 2,326. +
n1 n 2 11 13

1. 5) Deciso ou Concluso: Como tcal=0,63<ttab=1,72 no pertence regio crtica, no rejeitamos a hiptese H0. Ou seja, pelos
dados amostrais, no existe evidncia de que a nota mdia dos alunos da turma 1 maior que a nota mdia da turma 2, a um
nvel de significncia de 5%.

Teste de hiptese para comparao de duas mdias populacionais para dados


emparelhados (amostras dependentes)

Em muitas situaes deseja-se comparar duas mdias populacionais em que as observaes ocorrem em pares. Um caso tpico
constitudo pelo teste antes e depois nos quais os integrantes das duas amostras so os mesmos

1) Definio das hipteses, que podem ser:


H : =0 H : =0 H : =0
a) 0 D b) 0 D c) 0 D
H1: D 0 H1 : D >0 H1: D <0

2) Identificao da estatstica do teste adequada: Varivel t com n-1gl

3) RC e RA

4) Estatstica do Teste n

D- D D i
d
t= , onde D= i=1
e assim, t cal =
s n n s n

5) Concluso:

Exemplo- Supor que dez produtos foram submetidas a um tratamento para expanso de peso. Os pesos,
em grama, no princpio e no fim de uma semana, esto abaixo. Ao nvel de 1% de significncia, podemos
concluir que o uso do produto contribuiu para a expanso do peso mdio do produto?

Soluo: Considerando a diferena D=Y-X, temos:

d
78
=28 e s=21,12

1) Definio das hipteses:

H0: D =0 ( No houve expanso do produto)


H1: D >0 ( Houve aumento significativo na expanso do produto)

2) Identificao da estatstica do teste adequada: t (n-1)=

3) RC e RA

4) Estatstica do Teste
d 28
t cal 4,19
s n 21,12 10

5) Concluso

LISTA DE EXERCCIOS - TESTE DE HIPTESE

1) Uma fbrica de automveis anuncia que seus carros consomem, em mdia 11 litros por 100 km, com
desvio padro de 0,8 litro. Uma revista decide testar essa afirmao e analisa 35 carros dessa marca,
obtendo 11,4 litros por 100 km, como consumo mdio. Admitindo que o consumo tenha distribuio
normal, ao nvel de 10% o que a revista concluir sobre o anncio da fbrica?
2) A durao em horas de trabalho de 5 rolo compressor foi de 9420, 8200, 9810, 9290 e 7030 horas.
Sabe-se que a durao dos rolos compressores dessa marca normal com desvio padro de 55 horas.
Ao nvel de 3%, testar:

H0 : 8700 H0 : 8700 H0 : 8700


a ) b) c)
H1 : 8700 H1 : 8700 H1 : 8700
3) O salrio dos empregados das indstrias de construo civil tem distribuio normal, com mdia 4,5
salrios mnimos, com desvio padro de 0,5 salrios mnimos. Uma indstria emprega 49
empregados, com um salrio mdio de 4,3 s.m. Ao nvel de 5% podemos afirmar quew essa indstria
paga salrios inferiores mdia?
4) A tenso de ruptura dos cabos produzidos por um fabricante apresenta a mdia de 1.800 kg e o desvio
padro de 100 kg. Mediante nova tcnica no processo de fabricao, proclamou-se que a tenso de
ruptura pode ter aumentado. Para testar essa declarao, ensaiou-se uma amostra de 50 cabos, tendo-
se determinado a tenso mdia de ruptura de 1.850 kg. Pode-se confirmar a declarao ao nvel de
significncia de 1%?

5) um comprador de blocos de cimento acredita que a qualidade dos produtos da marca A esteja
deteriorado. Sabe-se, por experincia passada, que a fora mdia de esmagamento desses blocos era
de 400 libras, com desvio padro de 20 libras. Uma amostra de 100 blocos da marca A forneceu uma
fora mdia de esmagamento de 390 libras. Verifique se a suspeita correta ao nvel de 2%.

6) Um metalrgico decide testar a pureza de um certo metal, que supe ser constitudo exclusivamente
de mangans. Adota para isso o critrio da verificao do ponto de fuso. Experincias anteriores
mostraram que esse ponto de fuso se distribua normalmente com mdia de 1260 e desvio padro
de 2. O metalrgico realizou 4 experincias, obtendo 1267, 1269, 1261 e 1263. Poder ele aceitar
que o metal puro ao nvel de 5%?
79
7) Uma amostra de 500 cermicas foram retiradas ao acaso sendo que 52% era o tipo de porcelanato A.
Poderia esta amostra ter sido retirada de uma populao que tivesse 50% do porcelanato A? (=
8%)

8) Um fabricante garante que, pelo menos 95% do equipamento que forneceu a uma fbrica est de
acordo com as especificaes. O exame de uma amostra de 200 peas desse equipamento revelou que
18 estavam defeituosas. Testar a afirmativa, nos nveis de significncia a) 1% e b) 5%.

9) A experincia tem mostrado que 40% dos estudantes so reprovados num exame de ESTATSTICA.
Se 40 de 90 estudantes fossem reprovados, poderamos concluir que esses estudantes so inferiores
em Estatstica? (= 5%)

10) Um crtico de televiso afirma que 80% de todos os espectadores consideram inconveniente o nvel
de rudo de certo comercial. Se uma amostra aleatria de 320 espectadores de TV inclui 245 que
acham inconveniente o nvel de rudo do comercial, teste, ao nvel de 5% de significncia, se ha
diferena significativa entre a proporo amostral e a definida pelo crtico.

11)Uma Empresa est em dvida se deve optar por uma fabrica A ou B de lmpadas para trabalhar em
um novo condomnio. Resolve ento testar 10 lmpadas, obtendo: da marca A mdia de 1160h e
desvio padro de 90, e da marca B: mdia de 1140h e desvio padro de 80h.. Pode se aceitar como
verdadeiro o teste feito com a amostra?

12)Em uma universidade um teste feito com seus alunos e conseguiram mdia 7,8 e desvio padro 0,6,
ao passo que alunos de outra Universidade do mesmo curso, conseguiram 7,4 com desvio padro de
0,8. O que se pode concluir ao = 5%?

13)O QI de 16 estudantes de um bairro menos nobre apresentou mdia de 107 pontos c/ desvio padro
de 10 pontos, enquanto que 14 estudantes de um bairro nobre apresentaram mdia de 112 pontos c/
desvio padro de 8 pontos. Os QIs apresentam ~N em ambas as regies. H diferena significativa
entre os QIs mdios dos 2 grupos?

14) Uma pesquisa feita nos EUA alega que o custo mdio dirio para refeies e alojamento no Texas
menor que no estado de Washington. Sabe se que no Texas o desvio padro de $15 e em
Washington $28. Tomou se ento 50 pessoas do Texas e a mdia de gasto foi de $208 e em 35
pessoas de Washington o gasto mdio foi $218. Sendo = 0,1, h evidncias suficientes para
confirmar a alegao?

15)Um engenheiro responsvel pela segurana anota a distncia percorrida aps a frenagem por dois
tipos de pneus. Do tipo A sabe se que o desvio padro de 4,7 ps, e do tipo B de 4,3 ps. Tomou se
ento 35 pneus de cada tipo resultando do tipo A 42 ps e do tipo B 45 ps. Sendo = 10% , o
engenheiro pode confirmar a alegao que a distncia mdia de frenagem do 2 tipos de pneus a
mesma?
80

VI-CORRELAO E REGRESSO LINEAR SIMPLES

I - INTRODUO

Nos mtodos estatsticos precedentes consideramos sempre a existncia de uma nica varivel de
interesse. Vrios problemas no trabalho estatstico, todavia, envolvem muitas variveis. Veremos agora dois
mtodos estatsticos para lidar com este tipo de problema. Faremos nosso estudo com o caso mais simples
em que temos apenas duas variveis de interesse. O emprego do mtodo pode ser estendido a mais de duas.

2 CORRELAO LINEAR ENTRE DUAS VARIVEIS


Avaliar se existe associao entre duas caractersticas quantitativas objetivo de muitos estudos em
biologia e cincias da sade. Um ecologista pode estar interessado em saber, por exemplo, se h associao
entre a quantidade de chumbo medida na gua e o volume de dejetos despejados em determinado rio; um
mdico pode querer avaliar se a presso arterial est relacionada idade das pessoas. Quando se pode
demonstrar que existe associao entre duas variveis quantitativas, isto , quando se constata que elas
variam juntas, diz-se que as variveis esto correlacionadas.

Exemplo 1: Um professor deseja saber se existe correlao entre o tempo dedicado ao estudo e o
desempenho dos alunos em determinada disciplina. Sorteados 8 estudantes dessa disciplina, so obtidas, por
exemplo, as informaes constantes da tabela 1, onde x representa o nmero de horas de estudo, e y, a nota
obtida em uma prova, para cada aluno. Fica difcil concluir alguma coisa observando diretamente os dados
na tabela, pois h grande variao nos resultados. Por isso, o primeiro passo tentar organiza-los em um
grfico, para melhor visualizar as relaes entre as variveis.

Tabela 1. N de horas de estudo e nota obtida por 8


alunos em uma prova.
Aluno x (horas) y (nota)
A 8 10
B 7 8
C 6 4
D 3 8
E 3 6
F 6 9
G 5 7
H 2 4
81
Nota: dados fictcios.

1. DIAGRAMA DE DISPERSO:

Consideremos uma amostra de n pares de dados (xi , yi) referentes a duas variveis X e Y.
Uma maneira de visualizar (avaliar) uma possvel correlao entre as observaes de X e de Y,
atravs do diagrama de disperso, em que os valores destas variveis so representadas por pontos, num
sistema cartesiano. Esta representao feita sob forma dos n pares ordenados (x i , yi), onde x um valor
observado da varivel X e y o correspondente valor da varivel Y. Atravs deste diagrama pode-se notar se
h uma tendncia dos pontos se disporem ou no em torno de uma reta.

Se a disposio dos pontos forem em torno de uma reta de inclinao positiva (figura a), isto indica a
existncia de dependncia entre as variveis, ou seja, h correlao linear positiva. Da mesma forma, o
diagrama pode indicar a existncia de uma dependncia inversa, isto , h uma correlao linear negativa
(figura b) se os pontos estiverem dispostos em torno de uma reta com inclinao negativa. Se nenhuma
destas duas tendncias se verificar, o diagrama indica a no existncia de dependncia linear entre as
variveis (figura c).

(a) (b) (c)


Figura 1. Diagrama de disperso para amostras correlacionadas positivamente (a), negativamente (b) e no
correlacionadas (c).

Exerccio. Construir o diagrama de disperso para o exemplo1.

2. COEFICIENTE DE CORRELAO:
Uma outra maneira de se avaliar a correlao usar um coeficiente, que tem a vantagem de ser um
nmero puro, isto , independente da unidade de medida das variveis. Isto interessa bastante, pois se pode
ter duas unidades de medida diferentes para as variveis (como nota e horas), o que dificultaria a
interpretao da associao. O coeficiente de correlao produto-momento (r) uma medida da
intensidade ("fora") de associao existente entre duas variveis quantitativas X e Y, e definido como

n ( xy) ( x )( y)
r
(n x 2 ( x ) 2 )(n y 2 ( y) 2 )

Este coeficiente uma medida que se situa no intervalo compreendido entre - 1 e + 1. Isto , -1 < r < 1.

r = - 1, indica uma correlao linear negativa perfeita, ou seja, os pontos experimentais esto
sobre uma reta de inclinao negativa.
r = + 1, indica uma correlao linear positiva perfeita, ou seja, os pontos experimentais esto
sobre uma reta de inclinao positiva.
r = 0 , indica ausncia de relao linear entre X e Y. Pode haver outro tipo de relao no linear.
82
Deve-se frisar, no entanto, que muitas vezes, um alto valor do coeficiente de correlao, embora
estatisticamente significativo, pode no implicar qualquer relao de causa e efeito, mas simplesmente a
tendncia que aquelas variveis apresentam quanto a sua variao conjunta.
Anlises estatsticas baseadas no coeficiente de correlao, em geral, so adequadas quando esto
envolvidas duas variveis entre as quais no h relao de dependncia funcional, embora possam ser
correlacionadas. O caso em que h dependncia funcional ser estudado mais adiante, no problema de
regresso.

Exemplo 2. Para os dados do exemplo 1 temos:


Quadro 1. Quadro auxiliar para o clculo do coeficiente de correlao
Aluno X (horas) Y (nota) X2 Y2 XY
A 8 10 64 100 80
B 7 8 49 64 56
C 6 4 36 16 24
D 3 8 9 64 24
E 3 6 9 36 18
F 6 9 36 81 54
G 5 7 25 49 35
H 2 4 4 16 8
Soma 40 56 232 426 299

n ( xy) ( x )( y) 8( 299) ( 40)(56)


r r 0,58
2 2 2 2
( n x ( x ) )( n y ( y) ) [8( 232) (40) 2 ][8( 426) (56) 2

3. TESTE DE HIPTESES

Quando se calcula o coeficiente r em uma amostra, necessrio ter em mente que se est, na
realidade, estimando a associao verdadeira entre x e y existente na populao. No exemplo anterior, foi
obtido o valor de r 0,58 . No entanto, no se pode ter certeza de que na populao de alunos haja,
efetivamente, correlao entre horas de estudo e nota da prova, pois foi estudada apenas uma parte da
populao. O valor obtido poderia ser casual, representando um erro devido amostragem. Para realizar um
teste de hipteses sobre a existncia de correlao na populao, usa-se um raciocnio anlogo ao visto nos
testes de hipteses sobre mdias.

Sendo r calculado com base em n elementos de uma amostra aleatria, ele representa apenas uma
estimativa do verdadeiro coeficiente de correlao populacional que representaremos por .
Por isso, muitas vezes desejamos saber se um dado valor de r, combinado com o respectivo tamanho
da amostra, permite concluir, a um dado nvel de significncia, que realmente existe correlao linear entre
as variveis. Realizamos ento um teste para o coeficiente de correlao populacional com base no
coeficiente amostral r.
A sequencia para a realizao do teste anloga seqncia apresentada para os testes paramtricos
vistos anteriormente, usando a distribuio "t" de Student com n - 2 grau de liberdade e com as mesmas
restries tericas.
83
Passo 1: Hipteses:

H0 : 0 (X e Y no so correlacionadas)
Teste bilateral:
H1 : 0 (X e Y so correlacionadas)
H0 : 0 (X e Y no so correlacionadas)
Teste unilateral direita:
H1 : 0 (X e Y so correlacionadas positivamente)
H0 : 0 (X e Y no so correlacionadas)
Teste unilateral esquerda:
H1 : 0 (X e Y so correlacionadas negativamente)
Passo 2: Fixar
Sob H0 e usando as informaes amostrais, o valor da estatstica do teste ser:

Passo 3: Construir a regio.


Passo 4: Calcular o valor da estatstica, atravs das informaes amostrais, que definir a deciso.
n2
tc r
1 r2
Passo 5: Concluso .
a) Se o valor amostral r estiver na regio de no rejeio, isto , x 1 r x 2 , no se rejeita H 0 . Isto
equivale a dizer que se o valor tc da varivel do teste, obtido no passo 4, estiver na regio de no rejeio, ou
seja, t 2 t c t 2 , no se rejeita H 0 . Caso contrrio rejeita-se H 0 .
Idem para os casos b) e c).

Exemplo 2: Realizemos um teste de hipteses para os dados do exemplo 1, ao nvel de 5% se significncia.


As hipteses so:

H 0 : 0

H 1 : 0
ou de outra forma : H 0 : O nmero de horas de estudo no est correlacionado com as notas.
H 1 : O nmero de horas de estudo est correlacionado com as notas.
Para 5% e gl 6 , da tabela t - Student temos t / 2 2,447 .
Da amostra temos r 0,58 . Assim,
6
t 0,58 1,74
1 (0,58) 2

Como 2,445 1,74 2,445 , no rejeitamos H 0 , ou seja , no existe evidncia de correlao entre o
tempo dedicado ao estudo e o desempenho obtido na prova.

Suponha, agora, que existam razes para se acreditar que essa concluso no espelha a realidade.
Como interpretar o resultado obtido?
O teste estatstico est indicando que os dados amostrais no apiam a existncia de correlao
populacional. Isto pode ser devido ao fato de que:
84
a) No existe realmente correlao entre X e Y na populao e o valor r 0,58
foi um resultado
esprio.
b) Existe correlao entre X e Y, mas neste experimento no foi possvel mostrar esta associao,
provavelmente por causa do pequeno tamanho da amostra.

Para decidir por uma destas alternativas, s h uma soluo: aumentar o tamanho da amostra. Se ,
efetivamente, existir correlao e se ela tiver a magnitude observada, um aumento em n ocasionar uma
reduo no erro padro de r, com consequente aumento no t calc, tornando-o, eventualmente, significante do
ponto de vista estatstico. Por outro lado, se realmente no existir correlao entre X e Y, medida que se
aumenta o tamanho amostral, o valor de r tender a zero. Com isso, o t calc tambm tender a zero, deixando
de ser estatisticamente significativo.

4. AVALIAO QUALITATIVA DE r QUANTO INTENSIDADE

Uma vez determinada a existncia de correlao na populao, pode-se avalia-la qualitativamente


quanto intensidade, usando-se o critrio apresentado na tabela 2.

Tabela 2. Avaliao qualitativa do grau de correlao entre duas variveis.


|r| A correlao dita
0 Nula
0|--- 0,3 Fraca
0,3 |----0,6 Regular
0,6 |----0,9 Forte
0,9 |----1 Muito forte
1 Perfeita

5. REQUISITOS AO ESTUDO DA CORRELAO

Embora no haja necessidade de satisfazer pressuposio alguma para calcular o coeficiente de


correlao entre duas variveis quantitativas, o teste de significncia da correlao somente ser realizado
corretamente se:

1. Tanto a varivel X como Y tm distribuio normal.


2. A variao dos valores de X para cada valor fixo de y sempre a mesma, isto , o valor de 2x o
mesmo nos vrios nveis de Y (homocedasticidade). No exemplo do tempo de estudo e nota na prova,
isto equivaleria a dizer que, embora a nota esperada (a mdia) seja diferente para cada tempo de
estudo, o grau de variao em torno dos diferentes valores esperados o mesmo.
3. Da mesma forma, a variao dos valores de Y ( 2y ) a mesma para todos os valores de X.

Se os dados satisfazem tais pressuposies, o coeficiente de correlao de Pearson o instrumento mais


adequado para medir a associao entre X e Y; se no satisfazem, no h nenhuma garantia de que esta seja a
medida mais correta de correlao. Da a importncia de se examinar o grfico de disperso dos pontos antes
de se efetuar uma anlise desta natureza.
No demais lembrar que o coeficiente de correlao mede uma associao, no uma relao de causa e
efeito. Assim, se a correlao observada entre X e Y de 0,44, isto no quer dizer que X determina Y, ou
vice-versa, mas apenas que X e Y esto variando juntos. Deve-se sempre considerar a possibilidade de que
haja outros fatores determinando os nveis tanto de uma quanto de outra varivel.
85
Finalmente, se a amostra for suficientemente grande (por exemplo, n 900 ), mesmo um coeficiente de
correlao muito baixo (como r 0,15 ) pode ser estatisticamente muito significativo ( t 4,55, p 0,001 ),
embora esteja representando uma associao bastante fraca entre as variveis. Isso mostra, mais uma vez,
que a significncia estatstica reflete um julgamento feito para verificar se os dados justificam ou no a
existncia de correlao, a qual poder ser forte, moderada ou fraca dependendo do valor de r.

Exerccio 2. Com o objetivo de se estudar a relao entre a temperatura e o tempo de uma reao qumica,
um certo experimento foi realizado 35 vezes, para 7 temperaturas diferentes e observou-se o tempo de
reao. A seguir apresenta-se os valores das temperaturas, em C, e os tempos obtidos, em segundos.
Temperatura Tempo
20 12,3 11,8 11,5 12,1 11,7
30 11,8 11,5 11,4 11,7 11,2
40 10,9 11,2 10,8 10,6 10,3
50 10,4 9,8 9,5 9,9 9,2
60 9,6 9,0 8,7 8,3 9,1
70 9,1 9,3 8,5 8,6 8,3
80 8,4 8,1 8,1 7,7 7,9
Construa um diagrama de disperso com estes dados, calcule o coeficiente de correlao e realize o teste
para a existncia de correlao linear ao nvel de 5% de significncia.

Exerccio 3. Um experimento foi conduzido para se verificar a existncia de correlao linear entre medidas
sensoriais da tonalidade da cor do suco de ma em uma escala de 1 a 12, desde a extremamente clara at
extremamente escura, com o teor de polifenis do suco.
Analise os resultados abaixo e determine se existe correlao linear significativa. Use = 10%.
Colorao (X) 2 3,5 5 7 11
Teor de polifenis g/100ml (Y) 0,02 0,04 0,07 0,09 1,2

REGRESSO LINEAR SIMPLES

Geralmente se estuda a relao entre duas ou mais variveis na esperana de que qualquer relao
encontrada possa ser usada no sentido de fazer estimativas ou predies de uma das variveis particulares. O
coeficiente de correlao s mede a fora do vnculo entre duas variveis aleatrias que se relacionam
linearmente e incapaz de resolver problemas de predio. Os mtodos destinados manipulao de
problemas de predio so conhecidos como mtodos de regresso.
O estudo da regresso se aplica quelas situaes em que h razes para supor uma relao de causa-
efeito entre duas variveis quantitativas e se deseja expressar matematicamente essa relao. Geralmente
chama-se a varivel dependente (ou varivel resposta) de Y e a independente (fator, varivel explicativa ou
varivel preditiva) de X. As expresses a seguir, utilizadas em diferentes linguagens, tm todas basicamente
o mesmo significado:
- Y depende de X (linguagem coloquial)
- Y funo de X (linguagem matemtica)
- existe regresso de Y sobre X (linguagem estatstica)
A anlise de regresso tem por objetivo descrever atravs de um modelo matemtico, a relao
existente entre uma varivel dependente Y e uma ou mais variveis independentes X i , a partir de n
observaes das mesmas. Como o nosso estudo est sendo feito apenas para o caso de duas variveis,
supondo ento X a varivel explicativa (independente) e Y a varivel explicada ou resposta (dependente),
diremos que Y = f(X).

Dado um conjunto de valores X e Y, construir um modelo de regresso de Y sobre X, consiste em


obter, a partir desses valores, uma equao que melhor represente a relao verdadeira (populacional) entre
essas variveis. A determinao dos parmetros dessa equao denominada ajustamento. O processo de
ajustamento deve partir da escolha da equao atravs da qual os valores de X explicaro os de Y. Para isso
86
recorre-se ao diagrama de disperso. A equao escolhida ser aquela que for sugerida pelo conjunto de
pontos dispostos nos diagrama (linear, polinomial, exponencial, etc.).

1. A RETA DE REGRESSO DE Y SOBRE X:

Muitas vezes o grfico de disperso sugere um relacionamento aproximadamente linear entre as duas
variveis o que nos leva a um problema de anlise de regresso linear simples. Para estabelecer uma lei
matemtica entre variveis que tm uma relao linear, o modelo indicado o prprio modelo da reta. Esta
reta, chamada de reta de regresso, representada pela equao

y = + x + e

onde e a varivel aleatria correspondente aos erros da variao de Y, e e so os parmetros da reta de


regresso.

O objetivo obter, a partir dos n pares de dados amostrais, os valores a e b que estimem os
parmetros e . Ou seja, queremos obter a partir de n pares amostrais, a equao de regresso


y =a+bx

que ser a estimativa da reta terica y = + x + e

As equaes para a obteno dos valores a e b so:

xy - n S
x y
xy
b a y bx

x
2
2 x S xx

Tais equaes so obtidas pelo mtodo dos mnimos quadrados, ou seja, sob a condio de minimizar
a soma dos quadrados dos desvios entre os valores observados e os respectivos valores projetados na reta.
Esse processo, no entanto, no garante que se tenha obtido a melhor reta ajustada, apenas uma
propriedade desejada de ajuste da reta.
A reta calculada desta forma chamada de reta de regresso de y sobre x e indica como X
influencia na variabilidade de Y.
O coeficiente linear (ponto onde a reta corta o eixo y) dado por a, e b o coeficiente angular da reta
estimada e indica o quanto varia a mdia de Y para o aumento de uma unidade da varivel X.

muito importante notar que a reta de regresso de x sobre y no a mesma reta de regresso de
y sobre x. Para perceber isso basta lembrar que apenas Y aleatria.

Exemplo 3. Suponha que um engenheiro esteja estudando a relao entre a quantidade (g / L) de


determinado poluente (S) despejado por uma fbrica em um riacho, e o dano ecolgico nesse curso dgua,
medido por um escore de dano. Os valores observados pelo pesquisador esto na tabela 3 e a figura 1,
apresenta o grfico de pontos correspondente.
Tabela 3. Escores de dano ecolgico medido para diferentes concentraes do
poluente S no riacho R.

Quantidade de poluente (g / L) Escore de dano ecolgico


1 3
2 6
87
3 7
4 10
5 10
6 12

Pelo grfico pode-se notar uma ntida dependncia entre o escore de dano e a concentrao do
poluente S na gua: tal dependncia poderia ser representada por uma linha, possivelmente uma reta,
admitindo-se como fruto do acaso os desvios existentes entre os pontos experimentais e a linha proposta.

Quadro 2. Quadro auxiliar para clculos.


N X X2 Y XY Y2
1 1 1 3 3 9
2 2 4 6 12 36
3 3 9 7 21 49
4 4 16 10 40 100
5 5 25 10 50 100
6 6 36 12 72 144
Total 21 91 48 198 48
Usando as frmulas acima teremos, a = 2,02 , b = 1,71

Assim, a reta de regresso estimada de y sobre x :


y = 2,02+1,71 x

Verificou-se, ento que b = 1,71 graus de dano por g / L , isto , para cada acrscimo positivo de um
g / L na concentrao de S parece haver um aumento de 1,7 no ndice de dano ecolgico. Por outro lado, o
escore de dano esperado quando a concentrao for zero igual a 2,02.

2. O COEFICIENTE DE EXPLICAO:

Para avaliar a "qualidade" do ajuste, podemos verificar o quanto as variaes da varivel dependente
Y, podem ser explicadas (ou justificadas) por variaes da varivel independente X, atravs da funo
ajustada. Fazemos isso, calculando o coeficiente de determinao ou explicao R2, dado pela equao:

x 2

x 2

n S
R b
2 2
b 2 xx
y 2
S yy
y 2

n

Esse coeficiente uma medida descritiva da proporo da variabilidade de Y que pode ser explicada
por X, segundo o modelo especificado, e particularmente importante se vamos usar a reta de regresso para
fazer previses.
O coeficiente de explicao R2 um nmero tal que 0 R2 1

Queremos que R2 seja to prximo de 1 quanto possvel. Quanto mais prximo de 1 estiver o valor de
R2, melhor ser a "qualidade" do ajuste. Quando R 2 = 1 temos o caso de ajuste perfeito, ou seja, os pontos
amostrais esto todos sobre a reta.

Exemplo 4: Para o exemplo anterior temos R2 = 0,95.


Isto significa que 95% da variabilidade do dano ecolgico est sendo explicada pela quantidade
(g / L) de determinado poluente (S).

3. TESTE DE HIPTESES
88
Devido variabilidade da amostra, o modelo de regresso = a + b x obtido com base nos n dados

y
amostrais, um dos modelos possveis para representar a relao existente entre as variveis na populao.

Como h erros aleatrios envolvidos, os valores de a e b obtidos da amostra, no sero iguais aos
parmetros e da populao. Assim, para continuar a avaliao do modelo, os mesmos problemas de
estimao e teste de hipteses sobre parmetros, podem ser considerados no problema de regresso, com
referncia aos parmetros e da reta terica. A regresso realizada na realidade, uma estimativa da
verdadeira relao (desconhecida) existente entre as variveis e, desta forma, a e b so estimativas pontuais
dos dois parmetros populacionais correspondentes e .

Por isso, de fundamental importncia a realizao de testes para os parmetro e a partir do valor
de a e b, indicando-nos se esses so ou no bons estimadores.

A seqncia do teste a mesma dos testes paramtricos j estudados, usando a distribuio "t" de
Student, com n - 2 grau de liberdade.

3.1 - TESTE PARA :

Passo 1: Hipteses:

H 0 : 0 (no h regresso linear, ou seja, X no ajuda a explicar a variabilidade de Y)



H1 : 0 (h regresso linear, ou seja, X contribui para a variabilidade de Y)
Passo 2: Fixar :
Sob H0 e usando as informaes amostrais o valor da estatstica do teste ser dado por:

S yy b 2 S xx
onde o denominador o erro padro do coeficiente b, e s2 =QMR e gl n 2 .
n2
b
tc
Passo 3: Construir a regio crtica. s
SXX

Passo 4: Calcular o valor da estatstica, atravs das informaes amostrais, que definir a deciso.

Passo 5: Concluso .
a) Se t 2 t c t 2 , no se rejeita H 0 . Caso contrrio rejeita-se H 0 .
Idem para os casos b) e c).

Exemplo 5: Para os dados do exemplo 3 teremos:

Teste para :
As hipteses sero:

H 0 : 0 (no h regresso linear, ou seja, X no ajuda a explicar a variabilidade de Y)



H1 : 0 (h regresso linear, ou seja, X contribui para a variabilidade de Y)
Sob H0 e usando as informaes amostrais o valor da estatstica do teste ser dado por:
89

b 1,71
tc 8,52
s 0,84
S XX 17,5

onde: SYY=54 ; SXX=17,5 ; s2=0,71 ; s=0,84

Pela tabela t- Student, para 1% de significncia e gl = 4, temos t / 2 4,60 . Como 8,52 > 4,60, rejeitamos
H 0 , ou seja o coeficiente de regresso populacional no deve ser zero; logo, admitimos que existe regresso
de Y sobre X ( 0,01 ). Pode-se ento concluir que o dano ecolgico depende da concentrao da
substncia S da seguinte foram: para cada acrscimo de um g / L na concentrao desse poluente na gua,
espera-se que o escore de dano ecolgico aumente 1,71 unidades.

Teste para :
Neste caso as hipteses sero:

H 0 : 0 (a reta passa pela origem)



H 1 : 0 (a reta no passa pela origem)
Sob H0 e usando as informaes amostrais o valor da estatstica do teste ser dado por:
a
tc
s
x 2
, onde o denominador o erro padro do coeficiente a, e
n (x x) 2

a
tc
Syy b Sxx
2

S . Assim,
s
x 2
= 2,58
n2 nS XX
Pela tabela t- Student, para 1% de significncia e gl = 4, temos t / 2 4,60 . Como 4,60 < 2,58 < 4,60, no
rejeitamos H 0 , ou seja, a reta passa pela origem.

4. INTERVALOS DE CONFIANA
Estabelecida a existncia de regresso, podemos obter uma estimativa por intervalo para os
parmetros e .
Usando a distribuio "t" de Student, com n-2 graus de liberdade, o intervalo para e so:

IC() = b t / 2
S
IC() = a t / 2 S
x 2

S XX nS XX
Exemplo 6: Continuando o exemplo 3, os intervalos e confiana, para 1% de significncia,sero:
IC() = 1,71 (4,60) 0,20 = (0,79;2,63)
IC() = 2,02 (4,60) 0,78 = (-1,57; 5,61)

5 REQUISITOS AO USO DA REGRESSO LINEAR

Certas exigncias devem ser satisfeitas para se realizarem inferncias vlidas sobre o coeficiente de
regresso linear, embora isso no seja necessrio para calcular a e b. Estas exigncias so:
1. A varivel Y deve ter distribuio normal ou aproximadamente normal.
2. A variao de Y deve ser a mesma em cada valor de x (homocedasticidade). Se no houver
homocedasticidade, ser necessrio transformar os dados.
90
3. Os pontos no grfico devem apresentar uma tendncia linear. Caso contrrio, a equao que melhor
representar o fenmeno no ser uma reta, mas outra linha qualquer. Se os pontos se apresentarem
em curva, pode-se tentar transformar os dados de forma a obter uma reta, ou ajustar uma curva.
4. Os valores de Y foram obtidos ao acaso da populao e so independentes uns dos outros.
5. A varivel X foi medida sem erro. Satisfazer esta exigncia, na prtica, muito difcil. Por isso, o que
se faz pressupor que os erros ocorridos ao se medir X so desprezveis ou, pelo menos, menores
dos que os que esto associados mensurao de Y.

Violaes das trs primeiras pressuposies podem ser contornadas pelo uso de uma transformao
dos dados. J problemas relacionados com as exigncias 4 e 5 so mais difceis de resolver.

LISTA DE CORRELAO E REGRESSO LINEAR

1. A resistncia do papel usado na fabricao de caixas de papelo, y, est relacionada percentagem da


concentrao de madeira de lei na polpa original, x. Sob condies controladas, uma planta pilota fabrica 16
amostras, cada uma sendo proveniente de uma batelada diferente de polpa. Mede se a resistncia trao.
Os dados so mostrados a seguir.

X Y
1,0 100
1,5 118
1,5 115
1,5 106,2
2,0 110
2,2 120
2,4 133,9
2,5 120
2,5 123
2,8 140
a) Grafar o2,8
diagrama145,2
de disperso
b) Testar a3,0
existncia140
da correlao em
= 5%. 3,0 144,5
c) Determinar
3,2 a equao
159 da reta ajustada
aos dados
3,3amostrais.
146,9
d) Grafar a reta no diagrama de disperso.
e) Calcular o coeficiente de
explicao.R= 83,62%
f) O modelo linear razovel para tal
estudo? Justificar sua resposta
g) Se a resistncia do papel de 121 qual
a concentrao de madeira de lei
necessria?
h) Se a concentrao da madeira de lei
de 2,7, qual ser a resistncia do
papel?
91
2. O seguintes dados so a sada de corrente contnua de um aerogerador, y, e a velocidade do vento, x.

Velocidade do vento(X) 5 6 3,4 2,7 10 9,7 9,55 3,05 8,15 6,2 2,9 6,35 4,6
Sada da Corrente 1,5 1,8 1,1 0,5 2,2 2,4 2,3 0,6 2,2 1,9 0,7 1,9 1,6
Contnua(Y)
a) Ajustar um modelo de regresso linear simples a esses dados.
b) Testar a existncia da regresso a 5% de significncia
c) Calcular o coeficiente de explicao R=0,8755
d) Avaliar a reta ajustada.
e) Grafar a reta ajustada no diagrama de disperso.
f) Se a velocidade do vento for de 7,2 qual ser a sada da corrente contnua.

3. Doses crescentes de calcrio foram adicionadas a um solo e depois determinou-se a percentagem de


anomalias encontradas em clulas germinativas de trigo plantado nesse solo. Obter uma reta de regresso da
percentagem de anomalias sobre a quantidade de calcrio no solo,. Considere 1%
Quantidade de Calcrio 0 1 2 3 4 5
% de anomalias celulares 30 27 22 23 18 16

4. Um artigo em Technometrics, de S.C. Narula e J.F. Wellington(Prediction, linear Regression Vol 19),
apresenta dados de preos de venda e txs anuais de casas.
Preo de Venda/1.000 25,9 29,5 17,9 25,9 29,9 29,9 30,9 28,9 35,9 31,9 31
Txs/1.000 4,9 5,0 4,5 4,6 5,1 3,9 5,9 5,6 5,8 5,3 6,2
a) Construir o diagrama de disperso.
b) O modelo linear razovel para tal estudo?
c) Determinar a equao da reta ajustada aos dados amostrais.
d) Avaliar a reta ajustada atravs da estatstica R2.
e) Testar os parmetros da regresso linear ao nvel de 5%
f) Sendo o preo de venda 18.5 qual seria a tx?
g) Estando a tx em 5,2 de quando seria a venda?

UNIVERSIDADE ESTADUAL DE MARING


PR-REITORIA DE ENSINO

PROGRAMA DE DISCIPLINA

Curso: Engenharia de Produo


Departamento: Estatstica
Centro: Cincias Exatas

COMPONENTE CURRICULAR

Nome: Estatstica Cdigo: 7259

Carga Horria: 68 horas Periodicidade: Semestral Ano de Implantao: 2012

1. EMENTA

Conceitos e mtodos estatsticos na anlise de dados.

2. OBJETIVOS

Proporcionar ao aluno os conhecimentos de estatstica aplicados a dados experimentais.


92

3. CONTEDO PROGRAMTICO

ESTATSTICA DESCRITIVA
. Tabelas e grficos para variveis qualitativas e quantitativas
. Medidas de posio: mdia, mediana, moda e percentis
. Medidas de disperso: varincia, desvio-padro, coeficiente de variao

NOES DE PROBABILIDADE
. Espao amostral e eventos
. Definio axiomtica de probabilidade
. Propriedades fundamentais
. Probabilidade condicional.
. Independncia estatstica
. Varivel aleatria: discreta e contnua
. Esperana matemtica e varincia de uma varivel aleatria

DISTRIBUIES DE PROBABILIDADE
. Binomial
. Poisson
. Normal
. Exponencial

NOES DE INFERNCIA ESTATSTICA


. Noes de amostragem
. Distribuio amostral: da mdia, da proporo e da diferena de mdias
. Intervalo de confiana e testes de hipteses para proporo, mdia e diferena de mdias com
varincia conhecida e desconhecida

. CORRELAO
. Grfico de disperso
. Coeficiente de correlao de Pearson

NOES DE ANLISE DE REGRESSO SIMPLES


. Conceitos
. Estimativa dos parmetros
. Coeficiente de determinao

4. REFERNCIAS
4.1- Bsicas (Disponibilizadas na Biblioteca ou aquisies recomendadas)

BUSSAB, W. O.; MORETTIN, P A. Estatstica bsica. So Paulo: Saraiva, 5. Ed., 2003.

DANTAS, C. A. B. Probabilidade: um curso introdutrio. So Paulo: Edusp, 3 edio, 2008

DEVORE, J. L. Probabilidade e estatstica para engenharia e cincias. So Paulo: Thomson


Pioneira, 2006.

HINES, W. W.; MONTGOMERY, D. C.; GOLDSMAN, D. M.; BORROR, C. M. Probabilidade


e estatstica na engenharia. Rio de Janeiro: LTC- Livros Tcnicos e Cientficos Editora S.A.,
2006.
93

MAGALHES, M. N.; LIMA, A;. C. P. Noes de Probabilidade e Estatstica. So Paulo: Ed.


Edusp, 7 Ed., 2010.

MORETTIN, Luiz Gonzaga. Estatstica Bsica Probabilidade e Inferncia. So Paulo:


Pearson, Volume nico, 2009.
DISTRIBUIO NORMAL PADRONIZADA

4.2- Complementares
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
Observao:
-2,6Aprovado
0,0047 em0,0045
reunio0,0044
departamental
0,0043 do0,0041
dia 09/11/2010,
0,0040 conforme
0,0039 ata n 0,0037
0,0038 404 do DES.
0,0036
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,1 0,0179 0,0174 0,0170
___________________________________ 0,0166 0,0162 0,0158 0,0154 0,0150
_______________________________ 0,0146 0,0143
-2,0 0,0228 0,0222
APROVAO DO DEPARTAMENTO 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192
APROVAO DO COLEGIADO 0,0188 0,0183
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
94

DISTRIBUIO T DE STUDENT

NVEL DE SIGNIFICNCIA PARA TESTE UNILATERAL


0,005 0,01 0,015 0,02 0,025 0,03 0,035 0,04 0,05 0,1 0,15 0,2 0,25
t
Graus de
Liberdad NVEL DE SIGNIFICNCIA PARA TESTE BILATERAL
e gl 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,10 0,20 0,30 0,40 0,50
1 63,66 31,82 21,20 15,89 12,71 10,58 9,06 7,92 6,31 3,08 1,96 1,38 1,00
2 9,92 6,96 5,64 4,85 4,30 3,90 3,58 3,32 2,92 1,89 1,39 1,06 0,82
3 5,84 4,54 3,90 3,48 3,18 2,95 2,76 2,61 2,35 1,64 1,25 0,98 0,76 -t t
4 4,60 3,75 3,30 3,00 2,78 2,60 2,46 2,33 2,13 1,53 1,19 0,94 0,74
5 4,03 3,36 3,00 2,76 2,57 2,42 2,30 2,19 2,02 1,48 1,16 0,92 0,73
6 3,71 3,14 2,83 2,61 2,45 2,31 2,20 2,10 1,94 1,44 1,13 0,91 0,72
7 3,50 3,00 2,71 2,52 2,36 2,24 2,14 2,05 1,89 1,41 1,12 0,90 0,71
8 3,36 2,90 2,63 2,45 2,31 2,19 2,09 2,00 1,86 1,40 1,11 0,89 0,71
9 3,25 2,82 2,57 2,40 2,26 2,15 2,06 1,97 1,83 1,38 1,10 0,88 0,70
10 3,17 2,76 2,53 2,36 2,23 2,12 2,03 1,95 1,81 1,37 1,09 0,88 0,70
11 3,11 2,72 2,49 2,33 2,20 2,10 2,01 1,93 1,80 1,36 1,09 0,88 0,70
12 3,05 2,68 2,46 2,30 2,18 2,08 1,99 1,91 1,78 1,36 1,08 0,87 0,70
13 3,01 2,65 2,44 2,28 2,16 2,06 1,97 1,90 1,77 1,35 1,08 0,87 0,69
14 2,98 2,62 2,41 2,26 2,14 2,05 1,96 1,89 1,76 1,35 1,08 0,87 0,69
15 2,95 2,60 2,40 2,25 2,13 2,03 1,95 1,88 1,75 1,34 1,07 0,87 0,69
16 2,92 2,58 2,38 2,24 2,12 2,02 1,94 1,87 1,75 1,34 1,07 0,86 0,69
17 2,90 2,57 2,37 2,22 2,11 2,02 1,93 1,86 1,74 1,33 1,07 0,86 0,69
18 2,88 2,55 2,36 2,21 2,10 2,01 1,93 1,86 1,73 1,33 1,07 0,86 0,69
19 2,86 2,54 2,35 2,20 2,09 2,00 1,92 1,85 1,73 1,33 1,07 0,86 0,69
20 2,85 2,53 2,34 2,20 2,09 1,99 1,91 1,84 1,72 1,33 1,06 0,86 0,69
21 2,83 2,52 2,33 2,19 2,08 1,99 1,91 1,84 1,72 1,32 1,06 0,86 0,69
22 2,82 2,51 2,32 2,18 2,07 1,98 1,90 1,84 1,72 1,32 1,06 0,86 0,69
23 2,81 2,50 2,31 2,18 2,07 1,98 1,90 1,83 1,71 1,32 1,06 0,86 0,69
24 2,80 2,49 2,31 2,17 2,06 1,97 1,90 1,83 1,71 1,32 1,06 0,86 0,68
25 2,79 2,49 2,30 2,17 2,06 1,97 1,89 1,82 1,71 1,32 1,06 0,86 0,68
26 2,78 2,48 2,30 2,16 2,06 1,97 1,89 1,82 1,71 1,31 1,06 0,86 0,68
27 2,77 2,47 2,29 2,16 2,05 1,96 1,89 1,82 1,70 1,31 1,06 0,86 0,68
28 2,76 2,47 2,29 2,15 2,05 1,96 1,88 1,82 1,70 1,31 1,06 0,85 0,68
29 2,76 2,46 2,28 2,15 2,05 1,96 1,88 1,81 1,70 1,31 1,06 0,85 0,68
30 2,75 2,46 2,28 2,15 2,04 1,95 1,88 1,81 1,70 1,31 1,05 0,85 0,68
40 2,70 2,42 2,25 2,12 2,02 1,94 1,86 1,80 1,68 1,30 1,05 0,85 0,68
50 2,68 2,40 2,23 2,11 2,01 1,92 1,85 1,79 1,68 1,30 1,05 0,85 0,68
60 2,66 2,39 2,22 2,10 2,00 1,92 1,84 1,78 1,67 1,30 1,05 0,85 0,68
120 2,62 2,36 2,20 2,08 1,98 1,90 1,83 1,77 1,66 1,29 1,04 0,84 0,68
2,58 2,33 2,17 2,05 1,96 1,88 1,81 1,75 1,64 1,28 1,04 0,84 0,67
95
96