Anda di halaman 1dari 135

FACULDADE DE TECNOLOGIA DE SOROCABA

APOSTILA DE ESTATSTICA CURSO: PROCESSAMENTO DE DADOS

Ao escrever esta Apostila no pretendi outra coisa, seno proporcionar aos alunos da disciplina ESTATSTICA , a facilidade de dispor de notas de aulas dos temas do Programa da Disciplina. O acompanhamento das aulas e a pesquisa em Bibliografia sobre o assunto, tornam-se necessrias para o adequado aproveitamento do curso.

PROF. OSNI PAULA LEITE

NDICE 1.0 Definies Estatsticas 1.1 Por que estudar Estatstica 1.2 Natureza dos Dados 1.3 Tipos de Dados 1.4 Tipos de Levantamentos 1.5 Planejamento de Experimentos 2.0 Amostragem 2.1 Definies 2.2 Amostragem Aleatria Baseada em Nmeros Aleatrios 2.3 Outros planos de Amostragem 2.4 Amostragem por Julgamento (No Probabilstica) 2.5 Amostragem Probabilstica 3.0 Anlise Exploratria de Dados 4.0 Distribuio de Freqncias 5.0 Apresentao Grfica 5.1 Diagrama de Ordenadas 5.2 Diagrama de Barras 5.3 Diagrama de Crculos 5.4 Diagrama de Setores Circulares 5.5 Diagrama Linear 6.0 Montagem de uma Distribuio de Freqncias 7.0 Apresentao Grfica das Variveis Quantitativas 7.1 Histogramas e Polgonos das Freqncias 7.2 Histogramas e Polgonos das Freqncias Relativas 7.3 Polgono de Freqncia Acumulada ou Ogiva 7.4 Polgono de Freqncia Acumulada Relativa 8.0 Tipos de Distribuio 8.1 Distribuio Simtrica ou em Forma de Sino 8.2 Distribuio assimtrica 8.3 Distribuio Modal, Amodal, Bimodal e Multimodal 8.4 Apresentao Tipo Ramo e Folhas 8.5 Pictograma 9.0 Medidas de posio ou Tendncia Central 9.1 Mdia Aritmtica Simples 9.2 Mdia Aritmtica Ponderada 9.3 Mediana 9.4 Moda 10.0 Medidas de Variabilidade (Disperso) 10.1 Amplitude 10.2 Desvio Padro 10.2.1 Desvio Padro Amostral 10.2.2 Desvio Padro da Populao

PGINA 01

05

13 13 17

23 26

31

37

41

10.2.3 Representao Grfica do Desvio Padro 10.2.4 Sistematizao Para o Clculo 10.3 Varincia 11.0 Probabilidade 11.1 Espao Amostral 11.2 Trs Origens da Probabilidade 11.3 Matemtica da Probabilidade 12.0 Tcnicas de Contagem 12.1 Princpios de Multiplicao 12.2 Permutao, Arranjo e Combinao 12.3 Regras de Contagem Exerccios 13.0 Distribuio de Probabilidades 13.1 Distribuio Binomial Exerccios 13.2 Distribuio de Poisson Exerccios 14.0 Distribuio Normal Exerccios 15.0 Correlao 15.1 Introduo 15.2 Relao Funcional e Relao Estatstica 15.3 Diagrama de Disperso 15.4 Correlao Linear 15.5 Coeficiente de Correlao Linear 15.6 Cuidados com os Erros na Interpretao de Correlao 16.0 Regresso 16.1 Ajustamento de curvas 16.2 Mtodo dos Mnimos Quadrados 1.0 Confiabilidade da Amostra 1.1 Planejamento da Amostra 1.2 Erros provenientes da Amostragem 1.3 Erros no provenientes da Amostragem 1.4 Planejamento geral da Pesquisa 1.5 Distribuies Amostrais 1.6 Erro Padro da Mdia 1.7 O Teorema Central do Limite 2.0 Estimativa e Tamanho de Amostras 2.1 Aspectos Gerais 2.2 Estimativa de uma Mdia Populacional: Grandes Amostras 2.3 Estimativa de uma Mdia Populacional: Pequenas Amostras 2.4.Estimativa de uma Proporo Populacional 2.5 Estimativa de uma Varincia Populacional

45 46

53

61

69 76 76 77 78 79 81 83 87 89 91

ESTATSTICA
1.0 DEFINIES DE ESTATSTICA
Etimologicamente a palavra estatstica vem de status expresso latina que significa, sensu lato, o estudo do estado. Os primeiros a empregarem esse termo foram os Alemes seguidos pela Itlia, Frana, Inglaterra e ainda por outros paises. Para Levasseur a estatstica : O estudo numrico dos fatos sociais. Yule define estatstica como: Dados quantitativos afetados marcadamente por uma multiplicidade de causas. Uma definio mais usual nos dias de hoje seria: Um mtodo cientifico que permite a anlise, em bases probabilstica, de dados coligados e condensados Ou ainda podemos dizer que : A coleta, o processamento, a interpretao e a apresentao de dados numricos que pertencem ao domnio da estatstica

1.1 POR QUE ESTUDAR ESTATSTICA?


Por hora podemos dizer que o raciocnio estatstico largamente utilizado no governo e na administrao; assim, possvel que, no futuro, um empregador venha a contratar ou promover um profissional por causa do seu conhecimento de estatstica.

1.2 A NATUREZA DOS DADOS


O dados estatsticos constituem a matria prima das pesquisas estatsticas, eles surgem quando se fazem mensuraes ou se restringem observaes. Estatstica descritiva: Trata-se da descrio e resumo dos dados. Probabilidade: um estudo que envolve o acaso. Interferncia: a analise e interpretao de dados amostrais (Amostragem). Modelo: So verses simplificadas (Abstraes) de algum problema ou situao real. -1-

1.3 TIPOS DE DADOS


Quantitativos Contnuos Discretos

Qualitativos Nominais Por postos

As variveis contnuas podem assumir qualquer valor num intervalo contnuo. Os dados referentes a tais variveis dizem-se dados contnuos. Ex. Peso, comprimento, espessura onde usa-se a mensurao. As variveis discretas assumem valores inteiros de dados discretos so os resultados da contagem de nmeros de itens. Ex. alunos da sala de aula, nmero de defeitos num carro novo, acidentes de uma fbrica.

Os dados nominais surgem quando se definem categorias e se conta o nmero de observaes pertencentes a cada categoria. Ex.: atuam dentro das variveis Qualitativas as quais devemos associar a valores numricos para que possamos processar estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e feminino), desempenho (excelente, bom, sofrvel, mau) etc. Os dados por postos consistem de valores relativos atribudos para denotar ordem: primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1,2,3 colocadas.

TABELA: 1 A mesma populao pode originar diferentes tipos de dados.

TIPOS DE DADOS
POPULAES CONTNUOS DISCRETOS NOMINAIS POR POSTO 3 grau

Alunos de administrao idade/peso N. De classes Homens/Mulheres -2-

1.4 TIPOS DE LEVANTAMENTOS

Os levantamentos podem ser classificados em contnuos, peridicos e ocasionais:

CONTNUO: Quando os eventos vo sendo registrados medida que ocorrem.Exemplos os registros civis dos fatos vitais (nascimento, bitos e casamentos).

PERIDICOS: Acontecem ciclicamente. Exemplo o rescenceamento, feito no Brasil a cada dez anos.

OCASIONAIS: So aqueles realizados sem a preocupao de continuidade ou periodicidade preestabelecidas, exemplos a maioria cientifica. dos trabalhos de investigao

DADOS PRIMRIOS: Quando o investigador no encontra dados publicados adequados ao seu estudo, parte para a realizao de um inqurito, isto , os dados so levantados diretamente na populao no momento da investigao.

DADOS SECUNDRIOS: Quando o investigador para verificar as sua hipteses de trabalho utiliza- se de dados j existentes, arquivados, registrados ou publicados. Podem ser at mesmo dados gerados pelo Departamento de Estatsticas de Populaes da Fundao Instituto Brasileiro de Geografia e Estatstica (IBGE).

-3-

1.5 PLANEJAMENTO DE EXPERIMENTOS

1- Definio do problema Um Estudo ou Uma Anlise 2- Formular plano para coleta de dados adequados 3- Coligir os dados 4- Analisar e interpretar os dados 5- Relatar as concluses

EXERCCIOS E-1
1- Identifique os seguintes exemplos em termos de tipos de dados: a- 17 gramas b- 3 certos, 2 errados c- 25 segundos d- 25 alunos na classe e- tamanho de camisa f- Km/litro g- O mais aprazvel h- O mais lento i- 5 acidentes no ms de maio

Responder as perguntas: 1- Defina o termo Estatstica 2- Responder a pergunta: Por que estudar estatstica? 3- Dar exemplos de como um administrador pode se beneficiar do conhecimento de Estatstica?

-4-

2.0 AMOSTRAGEM
AMOSTRAGEM VERSUS SENSO: Uma amostra usualmente envolve o estudo de uma parcela dos tens de uma os tens. estries ao enso: Custo opulaes infinitas Dificuldade nos critrios reciso) rodutos de testes Destrutivos f sforos, munies) empo despendido atualizao) ipos de informaes mais restritivas ua , enquanto que o censo requer o estudo de todos

asos de excesso: opulaes pequenas Amostras grandes em relao a populao e exige preciso completa e j so disponveis informaes completas

2.1 DEFINIES:
POPULAO: o conjunto de indivduos (ou objetos), que tem pelo menos uma varivel comum observvel. AMOSTRA: qualquer sub-conjunto da populao extrada para se realizar estudos estatsticos

. POPULAO

AMOSTRA

-5-

A estatstica indutiva a cincia que busca tirar concluses probabilsticas sobre a populao, com base em resultados verificados em amostras retiradas dessa populao.

Entretanto no basta que saibamos descrever convenientemente os dados da amostra para que possamos executar, com xito, um trabalho estatstico completo. Antes de tudo preciso garantir que a amostra ou amostras que sero utilizadas sejam obtidas por processos adequados. - O que necessrio garantir, em suma, que a amostra seja Re resentativa da populao.

Dois aspectos nas amostras so fundamentais, e que do a sua representatividade em termos:

- Qualitativos: Amostras que representem todas as sub-populaes, quando for o caso.

- Quantitativos: Que possua quantidade de dados suficientes para representar a Populao.

Na indstria onde amostras so freqentemente retiradas para efeito de Controle da Qualidade dos produtos e materiais, em geral os problemas de amostragem so mais simples de resolver.

Por outro lado, em pesquisas sociais, econmicas ou de opinio, a complexibilidade dos problemas de amostragem so normalmente bastante grandes. - Interferncia estatstica envolve a formulao de certos julgamentos sobre um todo aps examinar apenas uma parte, ou a amostra, dele.

A probabilidade e a amostragem esto estreitamente correlacionadas e juntas formam o fundamento da teoria de interferncia.

- Amostragem o ato de retirar amostra, isto , a ao.

- Amostra a quantidade de dados especificado para representar a populao. -6-

Amostragem aleatria permite estimar o valor do erro possvel, isto , dizer quo prxima est amostra da populao, em termos de representatividade.

Amostragem no aleatria no apresenta esta caracterstica. vrios mtodos para extrair uma amostra talvez o mais importante seja a amostragem aleatria de modo geral, a amostragem aleatria exige que cada elemento tenha a mesma oportunidade de ser includo na amostra.

Nas Populaes discretas uma amostra aleatria aquela em que cada item da populao tem a mesma chance de ser includo na amostra. Nas Populaes contnuas, uma amostra aleatria aquela em que a probabilidade de incluir na amostra qualquer intervalo de valores igual percentagem da populao que est naquele intervalo.

Populaes finitas:

quando, temos constitudo por nmeros finitos, ou fixos de

elementos, medidas ou observaes. Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produo.

Populaes infinitas: so aquelas que contm, pelo menos hipoteticamente, um nmero infinito de elementos. Ex. Produo de carros V.W. produzidos no Brasil e a serem produzidos (universo volkswagem), processo probabilstico.

2.2 AMOSTRAGEM ALEATRIA BASEADA EM NMEROS ALEATRIO (RANDMICOS)

As tabelas de nmeros aleatrios contm os dez algarismos 0,1,2,3,4,......,9. Esses nmeros podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem. A probabilidade de qualquer algarismo aparecer em Portanto todas as combinaes so igualmente provveis. qualquer ponto 1/10.

-7-

Conceitualmente, poderamos construir uma tabela de nmeros aleatrios numerando dez bolinhas com os algarismos de 0 a 9 , colocando-as numa urna, misturando bem e extraindo uma de cada vez, com reposio, anotando os valores obtidos.

A titulo de ilustrao poderamos querer selecionar aleatoriamente 15 clientes de uma lista de 830 de um grande magazine, a finalidade poderia ser : Estimar a freqncia de compras; Determinar o valor mdio de cada compra; Registrar as queixas contra o sistema.

2.3 OUTROS PLANOS DE AMOSTRAGEM


Amostragem probabilstica versus Amostragem no probabilstica

Os planos de amostragem probabilstica so delineados de tal modo que se conhece a probabilidade de todas as combinaes amostrais possveis. Em razo disso, pode-se determinar a quantidade de varivel amostral numa amostra aleatria e uma estimativa do erro amostral. A amostragem aleatria um exemplo da amostragem probabilstica.

A amostragem no probabilstica a amostragem subjetiva, ou por julgamento, onde a variabilidade amostral no pode ser estabelecida com preciso, conseqentemente, no possvel nenhuma estimativa do erro amostral.

A verdade que, sempre que possvel, deve-se usar a amostragem probabilstica.

2.4 AMOSTRAGEM POR JULGAMENTO (NO PROBABILSTICA)

Se o tamanho da amostra bem pequeno; digamos, de uns 5 itens, a amostragem aleatria pode dar resultados totalmente no representativos, ao passo que uma pessoa familiarizada com a populao pode especificar quais os itens mais representativos da populao. -8-

Exemplo: Uma equipe mdica deve trabalhar com pacientes que se apresentem com voluntrios para testar um novo medicamento. Nenhum desses grupos podem ser considerados como uma amostra aleatria do p blico em geral, e seria perigoso tentar tirar concluses gerais com base em tal estudo. Todavia, os resultados poderiam proporcionar uma base para a elaborao de um plano de amostragem aleatrio para validar os resultados bsicos. Os perigos inerentes pesquisa mdica , bem como outro tipo de pesquisa, freqentemente obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntrios.

Exemplo: A aplicao de hormnios em mulheres na menopausa, aps um perodo de tempo notou-se o aumento das chances de adquirirem cncer de mama, doenas cardacas etc.

2.5 AMOSTRAGEM PROBABILSTICA


SISTEMTICA ESTRATIFICADA CONGLOMERADO

AMOSTRAGEM SISTEMTICA
muito parecida com a amostragem aleatria simples. Podemos ter uma amostragem realmente aleatria, escolhendo-se cada K-sima amostra, onde K obtem-se dividindo o tamanho da populao pelo tamanho da amostra.

K= N n

onde: N= Tamanho da Populao n= Tamanho da Amostra

EX. N= 200 e n=10

ento K=200/10 = 20

Significa que ser escolhido um item a cada seqncia de 20 de uma lista. Para iniciar pode-se usar uma tabela de nmeros aleatrios de 0 a 9 para iniciar os grupos. Por exemplo se der o 9, escolhemos o 9, 29, 39 ,49 , etc.

-9-

AMOSTRAGEM ESTRATIFICADA

Pressupe a diviso da populao em sub-grupos Homogneos (Estratos), procedendo ento a amostragem de cada sub-grupo. Ex.: Para se fazer o inventrio do estoque, comum termos 10% dos itens representarem cerca de 60% do valor total em quanto que os 90% restantes representam s 40% do valor total (Curva A,B,C; Pareto; regra 80/20).

AMOSTRAGEM POR CONGLOMERADO

Pressupe a disposio dos itens de uma populao em sub-grupos heterogneos (sub-populaes) representativos da populao global. Neste caso cada conglomerado pode ser encarado como uma minipopulao. Ex.: Estudo pr-eleitoral para medir a preferncia dos eleitores. (Sub-grupos: sexo, educao, faixa etria, poder aquisitivo, regio da habitao,etc)

-10 -

RESUMO
A finalidade da amostra permitir fazer interferncia sobre a populao aps inspeo de apenas parte dela. Fatores com custo, ensaios destrutivos e populaes infinitas, tornam a amostragem prefervel a um estudo completo (Censo) da populao.

Naturalmente espera-se que a amostra seja representativa da populao da qual foi extrada.

Potencialmente, este objetivo atingido quando a amostragem aleatria. Para populaes discretas o termo A eatri significa que cada item da populao tem a mesma chance de participar na amostra.

No caso de populaes contnuas, significa que a probabilidade de incluir qualquer valor de um dado intervalo de valores igual proporo com valores naquele intervalo.

As amostras aleatrias podem ser obtidas:

- Atravs de um processo de mistura, com o embaralhamento de cartas;

- Pela utilizao de um processo mecnico (Misturadores);

- Utilizando-se uma tabela de nmeros aleatrios para proceder seleo de uma lista. Em certas condies, podem ser mais eficientes variantes da amostragem aleatria simples, tais como amostragem sistemtica (peridica), estratificada (sub-grupos Homogneos), heterogneos). ou amostragem por aglomerados (sub-grupos convenientes e

A principal vantagem da amostragem aleatria que se pode determinar o grau de variabilidade amostral, o que essencial na interferncia estatstica. amostragem no probabilstica falta esta caracterstica. -11-

QUESTES PARA RECAPITULAO

EXERCICIOS E-2

1- Em que circunstncia a amostragem prefervel a um censo completo?

2- Quando se deve preferir um censo a uma amostragem? 3- Defina Amostra Aleat ria.

4- Descreva os vrios mtodos de obteno de uma amostra aleatria. Como escolher o mtodo a ser usado em determinada situao?

6- Explique rapidamente as caractersticas:

a. da amostragem por conglomerado; b. da amostragem estratificada; c. da amostragem sistemtica.

6- Que amostragem por julgamento e em que circunstncia deve ser usada?

7- Que amostragem probabilstica e quando deve ser usada? 8- Explique o significado de Amostra Aleat ria quando a populao :

a. contnua

b. Discreta

-12-

3.0 ANLISE EXPLORATRIA DE DADOS

Em alguma fase de seu trabalho, o pesquisador se v s voltas com o problema de analisar e entender uma massa de dados, relevantes ao seu particular objeto de estudos.

De modo geral, podemos dizer que a essncia da cincia a observao e que seu objetivo bsico a interferncia. Esta parte da metodologia da cincia que tem por objetivos a coleta, reduo, anlise e modelagem dos dados, a partir do que, finalmente, faz-se a interferncia para uma populao, da qual os dados (amostras) foram obtidos.

4.0 DISTRIBUIO DE FREQNCIA

Para cada tipo de varivel existem

tcnicas mais apropriadas para resumir as

informaes. Porem podemos usar algumas tcnicas empregadas num caso, podemos adapt-las para outros.

Quando se estuda uma varivel, o maior interesse do pesquisador conhecer a distribuio dessa varivel atravs das possveis realizaes (valores) da mesma.

Exemplo: Dados relativos a uma amostra de 36 funcionrios de uma populao de 2000 funcionrios da empresa Milsa. Ver resultados anotados na tabela abaixo.

-13-

TABELA 1

N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

N DE SALRIO ESTADO GRAU DE IDADE REGIO DE CIVIL INSTRUO FILHOS (X SAL. MIN) ANOS MESES PROCEDNCIA
solteiro casado casado solteiro solteiro casado solteiro solteiro casado solteiro casado solteiro solteiro casado casado solteiro casado casado solteiro solteiro casado solteiro solteiro casado casado casado solteiro casado casado casado solteiro casado casado solteiro casado casado 1 grau 1 grau 1 grau 2 grau 1 grau 1 grau 1 grau 1 grau 2 grau 2 grau 2 grau 1 grau 2 grau 1 grau 2 grau 2 grau 2 grau 1 grau superior 2 grau 2 grau 2 grau 1 grau superior 2 grau 2 grau 1 grau 2 grau 2 grau 2 grau superior 2 grau superior superior 2 grau superior --1 2 ----0 ----1 --2 ----3 0 --1 2 ----1 ----0 2 2 --0 5 2 --1 3 --2 3 4 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59 7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,8 10,53 10,76 11,06 11,59 12,OO 12,79 13,23 13,6 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,4O 23,3O 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 29 40 35 31 36 43 33 48 42 03 10 05 10 07 00 00 04 10 06 06 11 05 02 05 08 07 07 08 04 09 02 00 01 05 00 07 08 06 10 05 04 07 07 11 02

interior capital capital outro outro interior interior capital capital outro interior capital outro outro interior outro capital outro interior interior outro capital outro outro interior outro outro interior interior capital outro interior capital capital capital interior

-14-

Freqncia e percentagem da amostra de 36 empregados da empresa Milsa segundo o grau de instruo.

TABELA 2

GRAU DE INSTRUO 1 grau 2 grau

TABULAO

FRQNCIA FREQ. RELATIVA F FR % 12 18 6 36 33,33 50,OO 16,67 100

IIIIIIIIIIII IIIIIIIIIIIIIIIIII

superior I I I I I I
TOTAL

Freqncia e percentagem dos 2000 empregados (Populao) da empresa Milsa (Censo x Probabilidade)

TABELA 3

GRAU DE INSTRUO 1 grau 2 grau

FRQNCIA F 650 1020 330 2000

FREQ. RELATIVA FR % Censo 32,50 51,00 15,50 100

FREQ. RELATIVA FR % Provvel 33,33 50,OO 16,67 100

superior
TOTAL

Freqncia e percentagens dos 36 empregados (Amostra) da empresa Milsa

-15-

TABELA 4

CLASSE DE SALRIOS

FRQNCIA FREQ. RELATIVA F FR % 27,78 33,33 22.22 13,89 2,78 100

4 I------- 8 8 I------- 12 12 I------- 16 16 I------- 20 20 I------- 24 TOTAL

10 12 8 5 1 36

Freqncias e percentagem dos empregados da empresa Milsa, segundo N de filhos

TABELA 5

NMERO DE FILHOS Xi 0 1 2 3 5 TOTAL

FREQNCIA FREQ. RELATIVA F 4 5 7 3 1 20 FR % 20 25 35 15 5 100

Exercicio -Representar a distribuicao de frequencia para Idade e a Regiao de procedencia dos funcionarios da Empresa Milsa. -16-

5.0 REPRESENTAO GRFICA DAS VARIVEIS QUANTITATIVAS


A representao grfica da distribuio de freqncias de uma varivel tem a vantagem de, rpida e concisamente, informar sobre a variabilidade da mesma. Podemos optar por vrios tipos de grficos, porem qualquer que seja ele, devemos especificar os elementos essenciais para a sua interpretao, que so: o ttulo; o corpo; o cabeario; as colunas indicadoras.

TTULO a indicao que, precedendo a tabela, colocado na parte superior da


mesma. Deve ser preciso, claro e conciso, indicando a natureza dos fatos estudados (o que), e a poca (quando) em que o mesmo foi observado.

CORPO da tabela o conjunto de linhas e colunas que contem respectivamente, as


sries Horizontais e verticais de informaes. Casa, cela ou clula o cruzamento de uma linha com uma coluna, onde se tem a freqncia com que a categoria (ou categorias) aparecem.

CABEARIO parte da tabela em que designada a natureza (as categorias, as


modalidades da varivel) do contedo de cada coluna.

COLUNA INDICADORA parte da tabela em que designada a natureza (as


categorias, as modalidades da varivel) do contedo de cada linha. Os elementos complementares de uma tabela so: Fontes; Notas.

FONTE o indicativo, no rodap da tabela, da entidade responsvel pela sua


organizao ou fornecedora dos dados primrios. A razo da presena da fonte no somente honestidade cientifica, mas tambm permitir ao leitor a possibilidade de consultar o trabalho original de onde procedem as informaes.

NOTAS so colocadas no rodap da tabela para esclarecimentos de ordem geral. E so


numeradas, podendo-se tambm usar smbolos grficos, sendo comum o asterisco.

-17-

6.0 APRESENTAO GRFICA


A apresentao grfica dos dados e respectivos resultados de sua anlise pode tambm ser feita sob forma de figuras, em geral grficos ou diagramas.

Grficos devem ser auto-explicativos e de fcil compreenso, de preferncia sem comentrios inseridos.Devem ser simples, atrair a ateno do leitor e inspirar confiana.

6.1 DIAGRAMA DE ORDENADAS


Para sua construo traada uma reta horizontal (ou vertical) de sustentao; a partir de pontos eqidistantes na reta, traa-se perpendiculares cujos comprimentos sejam proporcionais s freqncias.

freqncias

12

10

0 4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24

Salrios -18-

6.2 DIAGRAMA DE BARRAS

A mesma distribuio acima poderia ser representada por meio de diagrama que levasse em conta a magnitude da rea da figura geomtrica, j que a vista repousa melhor sobre uma superfcie do que sobre uma linha.

freqncias

12

10

0 4 I------8 8 I------12 12 I------16 16 I------20 20 I------24 salrios

-19 -

6.3 DIAGRAMA DE CRCULOS


Alem do retngulo, outra figura geomtrica utilizada o crculo ou conjunto de crculos. Lembrando que a rea do crculo o produto do nmero irracional = (3,1416) pelo quadrado do raio (r), isto ,

C= .r , e desde que as reas dos diversos crculos

devem ser proporcionais s magnitudes das freqncias, isto , C = . f onde o fator de proporcionalidade, segue-se que:

. f = . r , ou seja,

r = .f

Se chamar de `, tem-se

: r = `. f

portanto, os raios dos crculos devem ser proporcionais a raiz quadrada das freqncias das modalidades da varivel. Assim se quisermos representar graficamente a distribuio da tabela 1.4, os raios do crculo devero ser: r1 = 27,78 . `= 5,27 . ` 5,27. 3 = 15.8 mm r2 = 33,33 . `= 5.77 . ` 5,77. 3 = 17,3 mm r3 =

22.22. `=

4,71. ` 4,71. 3 = 14,1 mm 3.72. `

r4 = 13,89 . `= r5 =

3,72. 3 = 11,1 mm

2,78 . ` =

1,66 ` 1,66. 3 = 5,00 mm

A figura abaixo representa esta distribuio, com um ` adotado de 3 mm.

2,7 % %

13,89 %

22,22

27,78 %

33,33 %

-20-

6.4 DIAGRAMA DE SETORES CIRCULARES

Outra opo seria atravs de setores circulares, na qual se divide a rea total de um crculo em subreas (setores) proporcionais as freqncias. Lembrando que o crculo compreende setores cujas reas (S) so produto do raio (r) pelo tamanho do arco (a), isto , S = r.a, e com S deve ser proporcional a freqncia f, tem-se S= .f , onde o fator de proporcionalidade; ento:

.f = r. a a = .f r
Se chamarmos

de `, tem-se

= `. f , isto , os arcos e os respectivos

ngulos centrais de um crculo igual a 360, e sendo F a freqncia total, tem-se 360 = `. F ou seja: `= 360 Portanto a = 360. f

Assim, a distribuio de freqncia da tabela 4 representando faixas de salrios fica:

a1 = 360 x 27,78 = 100 100

a2 = 360 x 33,33 = 120 100

a3 = 360 x 22,22 = 80 100

a4 = 360 x 13,89 = 50 100

S5 = 360 x 2,78 = 10 100

-21Diagrama de Setores Circular

120 50 10
.

100

80

Diagrama de Setores Circular feito automaticamente pelo excel

-22-

6.5 DIAGRAMA LINEAR

No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de barras e em seguida unir esses pontos por semi-retas contituindo-se desta forma o diagrama linear.

freqncias

12

10

x 8

6 x 4

2 x

0 4 I-------8 8 I-------12 2 12 I-------16 16 I-------20 20 I-------24

salrios

-23-

6.6 O PICTOGRAMA

A figura abaixo temporais

mostra um exemplo de apresentao pictogrfica de dados

(comumente encontrada em jornais, revistas e relatrios de vrios tipos), no caso abaixo representa a populao dos Estados Unidos.

1920 1930

1940 1950 1960 1970 1980 1990

Cada smbolo = 10 milhes de pessoas Pictograma da populao dos Estados Unidos

-24-

7.0 MONTAGEM DE UMA DISTRIBUIO DE FREQNCIAS


A anlise estatstica de dados relativos a uma amostra de uma populao, requer uma

aglutinao organizada de informaes, conforme regras cuja prtica demonstrou serem eficientes. Consideremos uma relao de pesos de pacotes de manteiga, em gramas, de uma amostra de 100 pacotes extrados parcialmente de um processo automtico de empacotamento.
15

A especificao de fabricao 215

gramas (200 a 230 gramas)

TABELA 6

AMOSTR AMOSTR AMOSTR AMOSTR AMOSTR A PESO A PESO A PESO A PESO A PESO 1 207 21 220 41 210 61 210 81 217 2 213 22 204 42 214 62 220 82 211 3 210 23 213 43 219 63 213 83 213 4 215 24 211 44 215 64 217 84 218 5 201 25 214 45 217 65 214 85 213 6 210 26 217 46 213 66 219 86 216 7 212 27 224 47 218 67 214 87 218 8 204 28 211 48 214 68 215 88 216 9 209 29 220 49 215 69 223 89 206 10 212 30 209 50 212 70 217 90 212 11 215 31 214 51 221 71 213 91 207 12 216 32 208 52 211 72 218 92 213 13 221 33 217 53 218 73 207 93 215 14 219 34 214 54 205 74 210 94 212 15 222 35 209 55 220 75 208 95 223 16 225 36 212 56 203 76 214 96 210 17 215 37 208 57 216 77 211 97 226 18 218 38 215 58 222 78 205 98 224 19 213 39 211 59 206 79 215 99 214 20 216 40 216 60 221 80 207 100 215

O agrupamento destes dados em sub-grupos feito com base nos seguintes conceitos: -25Amplitude total ( R.T.): a diferena entre a medida mxima e a medida mnima. No caso da amostra de pacotes de manteiga acima, temos: R.T. = 226 201 = 25 gramas

Nmero de classes (d) : o nmero de divises que estipulamos para a Amplitude Total. Normalmente pode-se usar d = n onde n= n mero de itens na amostra para o

exerccio temos d = 100 10 classes, porem deve-se utilizar sempre que possvel nmero impar de classes no caso 9 classes.

Classe: o intervalo de variao das medidas.

Amplitude do intervalo de classe (R.I.): a diferena entre os valores mximos e mnimos de cada classe. Amplitude intervalo de cada classe R.I . = R.T Nmero de Classes No caso do exerccio temos: Amplitude intervalo de cada classe R.I . = 25 = 2,7 aprox. 3 7 RI adotado = 3 RT adotado = 27 diferenca 2 comeca uma antes do menor e termina um antes do maior valor. As classes devem ser mutuamente exclusivas, para que no haja duvida na localizao dos valores das variveis, podemos dai utilizar as seguintes simbologias para os intervalos: 0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende os valores da varivel maiores do que 0 (excludo) e at 10 (inclusive); 0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores da varivel a partir de 0 (inclusive) e at 10 (exclusive); 0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do que 0 e menores do que 10. 0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da varivel a partir de 0 (inclusive) e at 10 (inclusive). -26-

TABELA de DISTRIBUIO das FREQNCIAS

Para a facilidade e metodizao do processo de anlise estatstica, monta-se um tabela que agrupe as informaes obtidas, de forma de Tabela de Freqncias. Para os pacotes em pauta, teremos a seguinte tabela de freqncias: TABELA 7
VALOR COMPRIMENTO CLASSE CLASSE FREQ. FREQUENCIA FREQUENCIA FREQUENCIA

TABULAO

RELATIVA %

ACUM.

ACUM. REL.%

1 2 3 4 5 6 7 8 9

200 ---I 203 I I 203 ---I 206 I I I I I I 206 ---I 209 I I I I I I I I I I 209 ---I 212 I I I I I I I I I I I I I I I I I I 212 ---I 215 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 215 ---I 218 I I I I I I I I I I I I I I I I I I 218 ---I 221 I I I I I I I I I I 221 ---I 224 I I I I I I 224 ---I 227 I I

2 6 10 18 28 18 10 6 2

2 6 10 18 28 18 10 6 2

2 8 18 36 64 82 92 98 100

2 8 18 36 64 82 92 98 100

100 Onde:

100%

Freqncia (F) = o numero de vezes que as medidas ocorrem no intervalo de classes Freqncia relativa (FR) = a percentagem da freqncia de cada classe em relao ao total de elementos. F d x 100 n Freqncia acumulada (FA) = a soma das freqncias at o intervalo de classe considerado. Ex. Fa5 = F1+ F2 + F3 + F3 + F5 2+ 6+ 10+ 18+ 28 = 64 FR =

Freqncia acumulada relativa (FAR) = a soma das freqncias relativas at o intervalo considerado Far3 = Fr1 + Fr2 + Fr3 2 + 6 + 10 = 18 -27-

7.1 HISTOGRAMA E POLIGONO DAS FREQNCIAS

freqncias
28 POLIGONO DE FREQNCIAS

21

14

CLASSES

-28-

7.2 HISTOGRAMA E POLIGONO DAS FREQNCIAS RELATIVAS

%
28% POLIGONO DE FREQNCIA RELATIVA

21%

14%

7%

0 1 2 3 4 5 6 7 8 9 CLASSES

-29-

7.3 POLIGONO DE FREQNCIA ACUMULADA OU OGIVA

F.AC. 100 POLIGONO DE FREQNCIAS ACUMULADA 80

60

40

20

01

CLASSES

-30-

7.4 POLIGONO DA FREQNCIA ACUMULADA RELATIVA

%
100 %

F.AC REL.

80 %

POLIGONO DE FREQNCIAS ACUMULADA RELATIVA

60 %

40 %

20 %

0 %1

CLASSES

- 31 -

8.0 TIPOS DE DISTRIBUIO


As distribuies de freqncia podem se apresentar de diversas formas conforme as figuras a seguir:

8.1 DISTRIBUIO SIMTRICA OU EM FORMA DE SINO


A distribuio simtrica quando os valores se distribuem igualmente em torno da mdia (X) A) Normal

B) Alongada

-32-

C) Achatada

8.2 DISTRIBUIO ASSIMTRICA


aquela em que as freqncias dos valores medidos, se distribuem de forma desigual em torno da mdia.

A) Assimtrica Positiva

-33-

B) Assimtrica Negativa

8.3 DISTRIBUIO MODAL, AMODAL, BIMODAL E MULTIMODAL


Chamamos de moda numa distribuio, ao valor da medida ou classe que corresponde freqncia mxima. Sob o critrio da moda as distribuies classificam-se em: A) DISTRIBUIO MODAL Quando a distribuio tem freqncia mxima ela denominada modal.

mo

-34-

B) DISTRIBUIO AMODAL Quando a distribuio no tem moda

B) DISTRIBUIO BIMODAL Quando a distribuio tem duas modas.

mo

mo

C) DISTRIBUIO MULTIMODAL Quando a distribuio tem mais de duas modas

mo

mo

mo

-35-

8.4 APRESENTAO TIPO RAMO-E-FOLHAS


Uma alternativa para o uso da tabela de distribuio de freqncias usar o grfico do tipo ramo-e-folhas. Podermos estudar a partir de um exemplo prtico: Observamos os seguintes nmeros de passageiros em 50 viagens de um avio que faz ponte area Rio - So Paulo:

61 50 58 59 43

52 53 92 79 80

64 103 51 80 75

84 40 64 73 70

35 62 71 49 45

57 77 75 71 91

58 78 89 97 50

95 66 37 62 64

82 60 54 68 56

64 41 67 53 86

SOLUO: 3 4 5 6 7 8 9 10
5 0 0 0 0 0 1 3 7 1 0 1 1 0 2 3 1 2 1 2 5 5 2 2 3 4 7 9 3 4 5 6 3 4 5 9 4 4 7 6 4 8 7 6 9 8 7 8 8 9 F 2 5 12 11 9 6 4 1 F.A. 2 7 19 30 39 45 49 50

A MEDIANA NESTE CASO SER

= 64

-36-

9.0 MEDIDAS DE POSIO OU DE TENDNCIA CENTRAL


Como o prprio nome indica, a medida de tendncia central visa a determinar o centro da distribuio. Esta determinao, porem, no bem definida da parece razovel chamarmos de tendncia central.

So medidas de tendncia central:

MDIA ARITMTICA SIMPLES/PONDERADA;

MEDIANA;

MODA.

9.1 MDIA ARITMTICA SIMPLES

Dada uma distribuio de freqncias, chama-se de mdia aritmtica desta destituio, e representa-se por variveis n. a soma de todos os valores da varivel, dividida pelo nmero de

= Sendo:

x
n
n

x
i= 1

Exemplo: Calcular a mdia aritmtica simples de 8, 3, 5, 12, 10.

8 + 3 + 5 + 12 + 10 = 38 = 7,6 5 5

-37-

9.2 MDIA ARITMTICA PONDERADA

K xi .fi
i= 1

=
K

x
i= 1

fi

onde: f = freqncia dos nmeros

x = nmeros os quais ocorrem com as

Exemplo: Calcular a mdia ponderada dos nmeros 5, 8, 6, 2 freqncias 3, 2, 4 e 1, respectivamente

Nmeros Freqncias

x = 5, 8, 6, 2 f = 3, 4, 2, 1

= 3x5 + 4x8 + 2x6 + 1x2 3+4+2+1

= 57 = 5,7 10

9.3 MEDIANA x)

Se ordenarmos uma seqncia de nmeros do menor para o maior e se a quantidade desses nmeros for impar, ento a mediana ser o valor do meio, ou a mdia dos dois valores do meio caso a quantidade de nmeros seja par. O smbolo que usamos para representar a mediana x l-se x ti .

No caso de calculo da mediana quando estamos trabalhando com distribuio de freqncia determinamos o valor mais provvel dessa distribuio a partir de:

-38-

= Freqncia acumulada total = 2

FA 2

(para n

er s

ares)

Ou ainda A posio DA MEDIANA definida por

{ n+1 }
2

-simo elemento quando n

mpar temos um n mero inteiro e d a posiao da mediana; Exemplo: Determine a posio da mediana para a) n=15 b) n=45 c)n=88

a) b)

n+1 = 15+1 = 8, e a mediana o valor do 8 elemento; 2 2 n+1 = 45+1 = 23, e a mediana o valor do 23 elemento; 2 2 88 = 44 e a mediana o valor correspondente ao valor do 44elemento. 2

c) n 2

No caso do exerccio da distribuio dos 100 valores de peso de pacotes de manteiga temos: X = n 2 = 100 2 = 50, e a mediana o valor do 50 elemento

50 valor

FA 0 X 200

2 203

8 206

18 209

36 212

64 215

82 218

92 221

98 224

100 227

50
36 212 64 215

(64 36) (64 50) =

(215 212)

14 x 3 = 1,5 28 logo, X = 212 + 1,5 = 213,5 -39-

portanto a mediana ser 212 +

9.4 MODA

(X)

Em um conjunto de nmeros a moda o valor que ocorre com maior freqncia, isto , o valor mais comum. Exemplos: 1) 2, 2, 3, 7, 8, 8, 8, 9, 10 moda=8 2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 moda = no existe moda) 3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9 moda = 4 e 8

Para o exemplo do exerccio das distribuies de freqncias dos pacotes de manteiga temos que a moda o ponto mdio da classe modal, localiza-se a classe modal como sendo a classe com maior freqncia e em seguida determina-se seu ponto mdio.

Classe modal a 5 classe, portanto moda = 212 + 215 = 213,5 2

-40-

10.0 MEDIDAS DE VARIABILIDADE (DISPERSO)


As medidas de disperso indicam se os valores esto relativamente prximos uns dos outros, ou separados. Podemos dizer que disperso o grau com o qual os valores numricos de uma distribuio tendem a se distanciar em torno de um valor mdio.

Em todos os casos, o valor zero indica ausncia de disperso; a disperso aumenta proporo que aumenta o valor da medida (amplitude,desvio-padrao, varincia).

xx x x x x xxx xxx xx x x

a) pequena disperso
xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx

b) grande disperso

10.1 AMPLITUDE TOTAL (R.T.)

a medida mais simples de disperso. a diferena entre o maior e o menor valor das observaes. R.T. = Xmax Xmin Embora exista simplicidade de clculo, existem duas restries ao seu generalizado:

1- Utiliza apenas uma parcela das informaes contidas nas observaes. O seu valor no se modifica mesmo que os valores das observaes variem, desde que conservem os seus valores Mximo e mnimo. 2- Depende do n er e serva es na amostra. Em geral o valor da amplitude

cresce quando cresce o tamanho da amostra. -41-

X min.I

I x max.

R.T. = pequeno

X min.

I R.T. = Grande

I X max.

-42-

10.2 DESVIO PADRO


medida que determina a variao dos valores observados em torno da mdia da distribuio, e representa a distncia do ponto de inflexo da curva at a linha da mdia.

10.2.1 DESVIO PADRO AMOSTRAL (S)

O desvio padro da amostra representa a disperso da amostra e dada pela equao:

S=

(X1-

) + (X2-

) + (X3n

) + ..... +(Xn-

Onde: S=

Xi = Medidas individuais n = Nmero de elementos ou valores

( Xi n

10.2.2 DESVIO PADRO DA POPULAO )

O desvio padro da populao representa a o grau de disperso da populao em torno da mdia representado por , tambm representa a distncia do ponto de inflexo, e dado pela expresso:

(X1-

) + (X2-

) + (X3n-1

) + ..... +(Xn-

( Xi n-1

-43-

10.2.3 REPRESENTAO GRFICA DO DESVIO PADRO

10.2.4 SISTEMATIZAO PARA O CLCULO Para sistematizar o clculo do desvio padro de uma amostra utilizado o seguinte procedimento:

1- Calcular o valor da mdia; 2- Montar a tabela abaixo

observaes medidas
1 2 3

Xi

Xi -

(Xi -

X1 X2 X3

X1 X2 X3 -

(X1 (X2 (X3 -

) ) )

. . .
n

. . .
Xn Xn -

. . .
( Xn -

. . .
)

(Xi-

-44-

3-Aplicam-se as frmulas:

S=

( Xi n

( Xi n-1

10.3 VARINCA
Varincia da populao a soma dos quadrados dos desvios de cada observao em relao mdia de x, divide-se por n 1. Indica-se a Varincia da Populao por . Podemos fazer a mesma analogia com a Varincia da Amostra dada por S.

Frmula da varincia da Amostra


n

( Xi
S=
i=1

Frmula da varincia da Populao

( Xi
=
i=1

) onde n 1 = nmero de graus de liberdade

n-1

Como medida de disperso, a Varincia tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Se os dados esto em metros, a Varincia fica em metros quadrados. O desvio padro por sua vez, fica com valor na mesma da unidade da varivel. -45-

11.0 PROBABILIDADE
O problema fundamental da estatstica consiste em lidar com o acaso e a incerteza. Chama-se probabilidade de um acontecimento a razo entre o nmero de casos favorveis ao mesmo e o nmero total de acontecimentos possveis. Assim quando se considera uma populao limitada de P indivduos, a probabilidade de cada um ser escolhido, ao acaso, de 1/P. Laplace definiu probabilidade como: O quociente do n mero de casos favorveis sobre o nmero de casos igualmente possveis. or exemplo, se jogarmos uma moeda no viciada para o ar, de modo geral no podemos afirmar se vai dar cara ou coroa. Porm existem apenas dois eventos possveis: sair cara ou c r a Nesse exemplo existe um caso favorvel a esse evento em dois casos possveis. A P (K) = ou 50%. Considerando-se cara como sucesso e coroa como fracasso e representando-se o acontecimento favorvel como e o no favorvel como Q, temos as razes:

P= Sendo Ento

Q=

P+Q = 1 P= (1 - Q) e Q = (1 - P)

A probabilidade de um evento A, denotada por P (A), um nmero de 0 a 1, que indica a chance de ocorrncia do evento A. Quanto mais prxima de 1,00 P(A), maior a chance de ocorrncia do evento A, e quanto mais prxima de Zero, menor a chance de ocorrncia do evento A. Um evento impossvel atribui-se a probabilidade Zero. Um evento certo tem probabilidade de 1. As probabilidades podem ser expressas, inclusive por valores decimais, fraes e percentagem como: 20%; 2 em 10; 0,2; ou ainda 1/5. -46-

Alm do uso na interpretao de jogos de azar, usa-se ainda a probabilidade mediante determinada combinao de julgamento, experincia ou dados histricos, para predizer Quao Provvel a ocorrncia de determinado evento futuro.

H numerosos exemplos de tais situaes no campo dos Negcios e do Governo. A previso da aceitao de um novo produto, o clculo dos custos de produo, a contratao de um novo empregado, o preparo do oramento, a avaliao do impacto de uma reduo de impostos sobre a inflao tudo isso contm algum elemento de Acaso.

11.1 ESPAO AMOSTRAL E EVENTOS

onsideremos o experimento que consiste em extrair uma carta de um baralho de 52 cartas. 52 eventos elementares no espa o amostral. Quanto aos eventos podemos

classific-los em:

ESPAO AMOSTRAL

COMPLEMENTO

Cartas vermelhas e cartas pretas

No se interceptam cartas de MUTUAMENTE EXCLUDENTE

copas e cartas de paus

NAO SO MUTUAMENTE EXCLUDENTE

Cartas de copas e figuras, tem

elementos em comum.

Cartas de paus, ouro, copas e COLETIVAMENTE EXAUSTIVO A B C D espadas

-47-

11.2 TRS ORIGENS DA PROBABILIDADE


H trs maneiras diferentes de calcular ou estimar probabilidades, O mtodo Clssico, quando o espao amostral tem resultados igualmente provveis. O mtodo Emprico, que se baseia na freqncia relativa de ocorrncia de um evento num grande nmero de provas repetidas; e o mtodo Subjetivo, que utiliza estimativas pessoais baseadas num certo grau de crena.

OBJETIVO

SUBJETIVO

CLSSICO (resultados igualmente provveis)

EMPRICO (dados histricos)

Opinio Pessoal

O Mtodo Clssico
Os jogos de azar (lanamento de moedas, jogo de dados, extrao de cartas) usualmente apresentam resultados igualmente provveis. Nestes casos temos:

P(cada resultado) =

1 Nmero de resultados possveis

Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida, ento a probabilidade de extrair cada uma delas de 1/52 : P (A) = 1/52 1,92%.

Da mesma forma a probabilidade de termos uma cara no lanamento de uma moeda ou 50%. O mesmo ocorre com uma coroa, ou seja ou 50%.

No caso de um dado temos a probabilidade de dar qualquer nmero: 1,2,3,4,5,6 de 1/6 ou de 16,66%.

-48-

De forma geral vale tambm a expresso: P(A) = Nmero de resultados associados ao evento A Nmero total de resultados possveis Por exemplo, a probabilidade de extrao de uma dama, de acordo com esta definio, P (dama) = 4 damas = 4 52 cartas 52 = 1 = 7,69% 13

Analogamente, a probabilidade de obter nmero mpar no lance de um dado P(mpar) = 3 faces 6 faces possveis = 3 6 ou 50%

11.3 A MATEMTICA DA PROBABILIDADE

Muitas aplicaes de estatstica exigem a determinao

da probabilidade de

combinaes de eventos. H duas categorias de eventos de interesse, A e B, no espao amostral. Pode ser necessrio determinar P(A e B), isto ; a probabilidade de ocorrncia de ambos os eventos. Em outras situaes, podemos querer a probabilidade de ocorrncia de A ou B P(A ou B). C cu a Pr a i i a e a c rrncia e is event s independentes P A e B)

Se dois eventos so independentes, ento a probabilidade da ocorrncia de ambos igual ao produto de suas probabilidades individuais: P(A e B) = P(A) . P(B) Exemplo Jogam-se duas moedas equilibradas.Qual a probabilidade da ocorrncia de ambas darem cara? razovel admitir que os resultados das duas moedas sejam independentes um do outro. Alm disso, para moedas equilibradas, P(cara)= . Logo p(cara e cara) ser: 1 moeda x 2moeda = ou 25% -49-

C cu

a Pr

a i i a e a c rrncia e

is event s utua ente exc u ente

P(A ou B ocorrer)

Se dois eventos mutuamente excludentes, a probabilidade de ocorrncia de qualquer um deles a soma de suas probabilidades individuais. Para dois eventos A e B temos:

P(A ou B) = P(A) + P(B) Exemplo, qual a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado? P(cinco) ou P(seis) = P (5) + P(6) = 1 + 1 = 2 = 33,33% 6 6 6 C cu a Pr a ii a e a c rrncia ) e is event s n utua ente

exc u ente P A u B u a

s c rrer

Suponhamos a probabilidade de extrao de uma carta de paus ou um dez de um baralho de 52 cartas . omo possvel que uma carta seja simultaneamente de paus e um dez, os eventos no so mutuamente excludentes. Assim devemos excluir a probabilidade de interseo. Ento temos:

P(paus) = 13 , 52

P(dez)=

4 , P( dez de paus) = 1 52 52

P(paus ou dez,ou ambos) = P(paus) + P(dez) - P(dez de paus)

= 13 + 52

4 52

- 1 52

= 16 52

-50-

NAIPE
PAUS PRETA OUROS VERMELHA K Q J 10 9 8 7 6 5 4 3 2 A COPAS VERMELHA ESPADA PRETA

K Q J 10 9 8 7 6 5 4 3 2 A

K Q J 10 9 8 7 6 5 4 3 2 A

K
Q J 10 9 8 7 6 5 4 3 2 A a carta um dez

Carta de paus Os event s aus e ez se interce ta .

Regra de probabilidade
P (A e B), para eventos independentes (Multiplicao) P(A) x P(B)

P (A ou B), para eventos mutuamente excludentes (Soma) P(A) + P(B)

P (A ou B ou ambos ocorrero), para eventos no mutuamente excludentes P(A) + P(B) - P(A intercepta B)

-51-

EXERCCIOS 1- Extrai-se uma s carta de um baralho de 52. Determine a probabilidade de obter: a- Um valete b- Uma figura c- Uma carta vermelha d- Uma carta de ouros e- Um dez de paus f- Um nove vermelho ou um oito preto 2- Relacione os resultados possveis do lance de um s dado. Ache a probabilidade e adicione-as. 3- Joga-se uma vez um dado equilibrado; determine a probabilidade de obter: a- um seis b- cinco, seis ou sete c- um nmero par d- um nmero menor que quatro 4- Doze fichas so numeradas de 0 a 12 e colocadas numa urna. Escolhida uma aleatoriamente, determine a probabilidade de sair: a- o nmero 3 b- um nmero impar c- um nmero menor que quatro d- o nmero dez 5- Joga-se um par de dados equilibrados: a- Qual a probabilidade de ambas as faces serem seis? b- Qual a probabilidade de ambas as faces serem dois? c- Qual a probabilidade de ambas as faces serem pares? 6- Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15. a- A e B so mutuamente excludentes? Explique. b- Determine P(A ou B). 7- Sejam A e B mutuamente excludentes, P(A) = 0,31 e P(B) = 0,29. a- A e b so coletivamente exaustivos? Explique. b- Determine P(A ou B). c- Determine P (A e B) 8- Joga-se uma moeda trs vezes. Qual a probabilidade de aparecer coroa trs vezes? Qual a probabilidade de no aparecer coroa nas trs vezes? -52-

12.0 TECNICAS DE CONTAGEM


Para utilizar o mtodo clssico (A Priori) da probabilidade, preciso conhecer o nmero total de resultados possveis de um experimento.

Uma das possibilidades o uso das rvores de deciso, mas quando o numero de resultados grande, essa lista se torna muito trabalhosa; necessrio ento recorrer a formulas matemticas para determinar o numero total de resultados possveis.

Suponhamos que um estudante esteja fazendo um teste de 20 questes do tipo ver a eir -ou-fa s . Suponhamos ainda que ele, no tenha estudado nada, esteja dando todas as respostas na base do palpite. Qual a probabilidade de ele responder corretamente todo o teste?

A primeira coisa a fazer determinar o numero total de resultados possveis.

Em segundo lugar devemos explorar suas diversas verses. Imaginemos que o teste consista de apenas:

Uma questo

temos V ou F

Duas questes temos VV, VF, FV, FF Trs questes temos VVV, VVF, VFF, VFV, FVF, FVV, FFV, FFF

Conclue-se: Numero de questes : 1 2 3 4 2 4 8 16

Numero de resultados :

Nota-se que se, o numero de itens for grande, a listagem se tornara praticamente impossvel. Em seguida podemos ver um diagrama de rvore para determinar todos os arranjos possveis.

-53-

UES O

N2

N3 RESULTADOS

V V F

V F V F

VVV VVF VFV VFF FVV FVF FFV FFF

.
V F F

V F V F

Alem disso, o que realmente necessario determinar o numero total de resultados; nada se tem a ganhar identificando cada resultado.

12.1 O PRINCIPIO DA MULTIPLICAO


O diagrama mostra que cada questo dobra o numero total de resultados possveis.(com duas alternativas V ou F) temos:

NUMERO DE QUESTOES

TOTAL DE RESULTADOS

1 2 3 4

2=2 2 x 2 =4 2x2x2=8 2 x 2 x 2 x 2 = 16

-54-

Se fossem quatro escolha para cada questo:


ERO DE UES ES O AL DE RESUL ADOS

1 2 3 Para solucionar o exerccio do teste, teremos:


20

4=4 4 x 4 = 16 4 x 4 x 4 = 64

2x2x2x2x2x.......x2
1 2 3 4 5 . . . . . . . . . . 20

= 2

= 1.048.576 ou

1 . 1.048.576

De um modo geral, se ha n decises seqenciais, cada uma com m escolhas, o n numero total de resultados

m .

12.2 PERMUTAO, ARRANJO E COMBINAO.

Quando a ordem em que os elementos se dispem importante, o numero total de resultados possveis conhecido como Arranjo ou Permutao. Quando a ordem no interessa, o numero total de resultados possveis designado como Combinao.

Para o uso na analise combinatria usaremos o numero fatorial representado pelo smbolo ! como por exemplo

4!

le-se uatr Fat ria e significa 4 x 3 x 2 x 1 = 24.

Outros exemplos:

5! = 5 x 4 x 3 x 2 x 1 = 120 12! = 12 x 11 x 10 x 9 x 8 x 7 x ..............x 1 = 479.001.600


Os fatoriais crescem de modo extremamente rpido, medida que aumenta o numerobase. Felizmente, quase nunca necessrio utilizar-se completamente os fatoriais, pois eles aparecem em grupos, permitindo cancelamentos:

-55-

5! = 5x4x3x2x1 7! 7x6x5x4x3x2x1

= 5! 7 x 6 x 5!

1 7x6

1 42

4! = 2!

4 x 3 x 2 x 1 = 4 x 3 x 2! = 4 x 3 = 12 2x1 2!

5! 2! 3!

= 5 x 4 x 3! 2 x 1 x 3!

= 5 x 4 = 20 = 10 2x1 2

s vezes os fatoriais podem envolver soma e subtrao. Exemplos:

( 5 - 3 )! = 2 ! ( 9 - 2 )! = 7! ( 3 + 1)! = 4!

e no ( 5! - 3! )

8! = 8! 3 ( 8 3 )! 3! . 5!

8 x 7 x 6 x 5! = 8 x 7 x 6 3 x 2 x 5! 3x2

= 56

O fatorial de zero igual a um O fatorial de 1 igual a um

0! = 1. 1! = 1.

ARRANJOS

So agrupamentos que podem variar pela ordem ou natureza dos elementos. Quando se consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos eneri s que se podem formar com esses n elementos, dispomos de todas as formas possveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos elementos. Assim, os arranjos possveis com as letras A, B e C so A 3,2 (3 elementos dois a dois) A 3,2 = AB; BA; AC; CA, BC; CB. E com os nmeros: 2, 6 e 8 podem ser feitos os seguintes arranjos A 3,2 A 3,2 = 26; 28; 62; 68; 82; 86.

-56-

Outro exemplo: Se ha sete cavalos num preo, quantos arranjos ha considerando 1,2 e 3 lugares?

A n,x =

n! ( n x )!

Ou seja, 7 elementos tomados 3 a 3

A 7,3 =

7! ( 7 3 )!

7! 4!

7 x 6 x 5 x 4! = 7 x 6 x 5 = 210 4!

PERMUTAO

Denomina-se permutao aos arranjos de objetos tomados n a n. Neste caso cada objeto entra s uma vez em todos os grupos.

Em geral o numero de permutaes distintas com n itens, dos quais n1 so indistinguveis de um tipo, n2 de outro tipo, etc, : n1, n2, ....nK Pn = n! (n1!) (n2!) (n3!) ......(nk!)

Exemplo: Quantas permutaes distintas de 3 letras podemos formar com as letras: RRRR UUU N
4 3 1

Soluo Ha 8 letras : 4Rs 3Us 1N dai:


4, 3, 1

P8 =

8! (4!) (3!) (1!)

= 280

-57-

COMBINAO

Chama-se combinao quando no interessa a ordem para denotar o numero de agrupamentos distintos possveis.

Exemplo: a escolha de 2 tipos de vegetal de um cardpio com 5 tipos. A escolha de batata e cenoura a mesma que cenoura e batata.

De um modo geral, para agrupamentos de tamanho x extrados de uma lista de n itens, o numero de combinaes possveis :

C n,x =

n! x! (n - x )!

n x

Quantos comits distintos, de 3 pessoas cada um, podemos formar com um grupo de 10 pessoas?

C10,3 =

10! 7! 3!

= 10 x 9 x 8 x 7! = 120 3 x 2 x 7!

De quantas maneiras podemos formar um comit de 1 mulher e 2 homens, de um total de 4 mulheres e 6 homens.

Mulheres ( C 4,1 )

Homens ( 6,2 )

4! 3 ! 1!

6! 4! 2!

= 4 x 15

= 60

-58-

12.3 REGRAS DE CONTAGEM

REGRA DA MULTIPLICAO: o produto do numero de escolhas para uma seqncia de


n

decises

onde m = numero de escolhas n = decises seqenciais

ARRANJOS: numero de agrupamentos em que interfere a ordem

A n,x =

n! ( n x )!

PERMUTAO COM REPETIES (OU DISTINGUIVEIS): alguns itens so idnticos, e a ordem importante. n1, n2, ....nK Pn = n! (n1!) (n2!) (n3!) ......(nk!) COMBINAES: a ordem no importa. C n,x = n! x! (n - x )! n x

-59-

EXERCICIOS 1- Calcule: a- 2! 2- Calcule: b- 3! c- 10! d- 1! e- 0!

a-

3 2

b-

4 4

c-

5 1

d-

9 6

3- Determine o numero de arranjos: a- A 3,2 b- A 4,4 c- A 5,1 d- A 9,6 e- A 1,0

4- Um vendedor de automveis deseja impressionar os possveis compradores com o maior numero de combinaes diferentes possveis. Um modelo pode ser dotado de trs tipos de motor, dois tipos de transmisso, cinco cores externas e duas internas. Quantas so a escolhas possveis?

5- Em um determinado Estado, as placas de licena constam de trs letras e quatro algarismos. Quantas placas diferentes podemos formar admitindo-se o uso de todas as (26 letras) e os (10 algarismos)?

6- Quantas permutaes distintas podem ser feitas com as letras da palavra BLUEBEARD ?

7- Se um torneio de basquetebol consiste de 36 times, de quantas maneiras podem ser conquistados os trs primeiros lugares?

8- De quantas maneiras diferentes podemos escolher um comit de cinco pessoas dentre oito?

9- A Pizzaria do Joe oferece as seguintes escolhas de pizza: presunto, cogumelos, pimento, enchovas e muzzarella. De quantas maneiras podemos escolher dois tipos diferente de pizza?

-60-

13.0 DISTRIBUIO DE PROBABILIDADES


Introduzidas s noes fundamentais sobre a teoria das probabilidades, pode-se passar s chamadas Distribuies de Probabilidades. Uma distribuio de probabilidades uma distribuio de freqncia relativa para os resultados de um espao amostral (isto , para os resultados de uma varivel aleatria); que mostra a proporo das vezes em que a varivel aleatria tende a assumir cada um dos diversos valores. onsideremos a varivel aleat ria Numero de caras em duas jogadas de uma moeda eis a lista dos pontos do espao amostral e os valores correspondentes a v.a.: (K = cara e C = coroa) Resultados CC CK KC KK Valor da v.a. 0 1 1 2

Se a moeda equilibrada, P(K) = P(C) = .As probabilidades dos diversos resultados so:

RESULTADOS

PROBABILIDADE DO RESULTADO

NUMERO DE CARAS

P(X)

1 CC 2 1 CK 2 1 KC 2 1 KK 2

1 = 2

1 0 4 1 = 1 4 0,50 1 = 1 4 1 = 2 4 0,25 0,25 0,25 0,25

1 2

1 2

1 2

-61-

Assim, pois, a distribuio de probabilidades para o numero de caras em duas jogadas de uma moeda so: NUMERO DE CARAS 0 1 2 P(X) 0,25 0,50 0,25 1,00

Note-se que a soma de todas as probabilidades 1,00, como de esperar, pois os resultados apresentados so mutuamente excludentes e coletivamente exaustivos. A mesma distribuio pode ser apresentada em forma acumulada. NUMERO DE CARAS 0 1 2 P(X ou menos) 0,25 0,75 1,00

Graficamente, as distribuies de probabilidade e acumulada se apresentam:


1,00 P R 1,00 O B A B I 0,75 L I D A D 0,5 E A C U 0,25 M U L A D 0 A

1,OO

P R 0,75 O B A B I 0,5 L I D A D 0,25 E

0,75

0,5

0,25

0,25

0,25

0 0 1 2 NUMERO DE CARAS

0 1 2 NUMERO DE CARAS

-62-

13.1 DISTRIBUIO BINOMIAL

Suponhamos agora o experimento E4= Lanamento de 4 moedas. A tabela abaixo mostra todas as possibilidades de combinaes cara/coroa, os eventos que estas combinaes originam e os valores correspondentes da varivel aleatria X : Numero de vezes que sai Cara.

POSSIBILIDADE

MOEDA N

EVENTO

VALOR DE X

N 1 2a 2b 2c 2d 3a 3b 3c 3d 3e 3f 4a 4b 4c 4d 5

1, 2, 3, 4 CCCC CCCK CCKC CKCC KCCC CCKK CKKC KKCC CKCK KCKC KCCK KKKC KKCK KCKK CKKK KKKK 0K e 4C 1K e 3C

( N DE VEZ QUE SAI CARA) 0 1

2K e 2C

3K e 1C

4K e 0C

Utilizando as regras do produto para eventos independentes (e) e da adio para eventos mutuamente exclusivos (ou) possvel calcular as probabilidades associadas aos valores de X.

A probabilidade de X=0 obtida pelo conhecimento de termos 4 coroas, sabe-se que a probabilidade de sair coroa , a probabilidade final ser: 0,5x0,5x0,5x0,5 = 0,0625. -63-

Para o calculo da probabilidade X=1 deve-se trabalhar com o evento 1K e 3 como temos as opes a,b,c,d, que so mutuamente exclusiva, a regra da soma manda efetuar a adio 0,0625 +0,0625 +0,0625 +0,0625 ou, o que o mesmo de se efetuar o produto 4x 0,0625 = 0,25.

Desta forma analogamente temos:

X 0 1 2 3 4

EVENTO 0K e 4C 1K e 3C 2K e 2C 3K e 1C 4K e 0C

P(X = x)
0 4 0 4

O,0625 = 1 X 0,5 X 0,5


1 3

= 1p
1

q
3

O,2500 = 4 X 0,5 X 0,5


2 2

= 4p
2

q
2

O,3750 = 6 X 0,5 X 0,5


3 1

= 6p
3

q
1

O,0625 = 4 X 0,5 X 0,5


4 0

= 1p
4

q
0

O,0625 = 1 X 0,5 X 0,5

= 1p

TOTAL

1,00

n = numero de moedas p = probabilidade de K = P(K) = 0,5 q = 1 p = probabilidade de C = P(C) = 0,5

Podemos usar a formula: n! x! (n x)! = n x = combinaes de n individuais tomados x a x.

Generalizando temos;
x n-x

P(x) =

n! x! (n x)!

p . q

-64-

Distribuio binomial de x (numero de coroas) para n = 10

X Numero de C r as e 10 jogadas

n! x ! (n x) !

Distribuio Amostral

P(X) probabilidade % de encontrar a Amostra

10

p(10) =

10! 10! (10 10)! 10! 9! (10 9) ! 10! 8! (10 8) ! 10! 7! (10 7) ! 10! 6! (10 6) ! 10! 5! (10 5) ! 10! 4! (10 4) ! 10! 3! (10 3) ! 10! 2! (10 2) ! 10! 1! (10 1) ! 10! 0! (10 0) !

1/1024 = 0,000976

p(9) =

10

1/1024 = 0,009760

p(8) =

45

1/1024 = 0,043940

p(7) =

120

1/1024 = 0,117180

p(6) =

210

1/1024 = 0,205070

p(5) =

252

1/1024 = 0,246090

p(4) =

210

1/1024 = 0,205070

p(3) =

120

1/1024 = 0,117180

p(2) =

45

1/1024 = 0,043940

p(1) =

10

1/1024 = 0,009760

p(0) =

1
10

1/1024 = 0,000976

TOTAL = 2

= 1024

-65-

EXERCICIOS: Use a formula binomial para responder s questes abaixo: 1- Um fabricante de mesas de bilhar suspeita que 2% de seu produto apresenta algum defeito. Se tal suspeita correta, determine a probabilidade de que, numa amostra de nove mesas: a- Haja ao menos uma defeituosa b- No haja nenhuma defeituosa

2- Dos estudantes de um colgio, 41% FUMAM CIGARROS. Escolhem-se seis ao acaso para darem sua opinio sobre o fumo. a- Determine a probabilidade de nenhuma das seis ser fumante. b- Determine a probabilidade de todos os seis ser fumante. c- Qual a probabilidade de ao menos a metade dos seis serem fumantes.

3- Doze por cento dos que reservam lugar num vo sistematicamente faltam ao embarque. O avio comporta 15 passageiros. a- determine a probabilidade de que todos os 15 que reservaram lugar compaream ao embarque b- Se houve 16 pedidos de reserva, determine a probabilidade de uma pessoa ficar de fora.

4- Um revendedor de automveis novos constatou que 80% dos carros vendidos so devolvidos ao departamento mecnico para corrigir defeitos de fabricao, nos primeiros 25 dias apos a venda. De 11 carros vendidos num perodo de 5 dias, qual a probabilidade de que: a- Todos voltem dentro de 25 dias para reparo. b- S um no volte

5- Suponha que 8% dos cachorros-quentes vendidos num estdio de futebol sejam pedidos sem mostarda. Se sete pessoas pedem cachorro, determine a probabilidade de que: a- Todos queiram mostarda b- Apenas um no a queira. -66-

13.2 DISTRIBUIO DE POISSON


A chamada Distribuio de Poisson ou de Eventos Raros podem ser considerada um caso limite da distribuio binomial. Quando n grande e pequeno podemos usar a aproximao de Poisson para a distribuio Binomial. difcil dar condies precisas para que se possa usar a aproximao de Poisson, ou seja, o que significa quando n grande e pequeno. Como regra geral podemos usar:

> 100

n.p < 10

n = Elementos da Populao p = Probabilidade Exemplo: n = 150 p = 0,05

Temos a distribuio de Poisson com: n.p = 150 . (0,05) = 7,5 A formula a ser usada : x - n.p (n.p) . e x! e= 2,718 Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam defeitos de encadernao. Utilize a aproximao de Poisson da distribuio Binomial para achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam algum defeito de encadernao. Temos: n = 400 -8 e = 0,000335 temos ento: x - n.p (n.p) . e x!
5 -8

f (x) =

para x = 1, 2, 3, .......

p = 2% = 0,02

x=5

n.p = 400 . 0,02 = 8

f (x) =

8 . e 5!

= (32768). (0,000335) = 10,977 = 0,0915 120 -67120

Outro Exemplo: Supnhamos que os defeitos em fios para tear possam ser aproximados por um processo de Poisson com media de 0,2 defeitos por metro

(p = 0,2) .Inspecionando-se pedaos de fio de 6 metros de comprimento, determine a probabilidade de menos de 2 (isto 0 ,1) defeitos. Temos : n = 6 p = 0,2
0 -1,2

n . p = 6 . 0,2 = 1,2

x =1 e

X=2

f(0) =

1,2 0!
1

= 1 . 0,301 = 0,301 1 = 1,2 . 0,301 = 0,3612 1 (0,301 + 0,3612) = 0,6622

-1,2

f(1) =

1,2 1!

P(x< 1) = P(0) + P(1) EXERCICIOS:

1- Verifique, em cada caso, se os valores de n e p satisfazem as regras empricas para a utilizao de Poisson como aproximao da Binomial: abcn = 500 e n = 100 n = 60 e e p = 0,001 p = 0,12 p = 0,002

2- Se 0,6% dos detonadores fornecidos a um arsenal so defeituosos, utilize a aproximao de Poisson para a distribuio Binomial para determinar a probabilidade de que, em uma amostra aleatria de 500 detonadores, quatro sejam defeituosos. 3- Em uma certa cidade 3,2% dos habitantes se envolve em, ao menos, um acidente de carro em um ano. Com o auxilio da aproximao de Poisson para a distribuio Binomial, determine a probabilidade de que, dentre 200 motoristas escolhidos aleatoriamente nessa cidade. a- Exatamente seis se envolvam em ao menos um acidente em um ano; b- No Maximo oito se envolvam em ao menos um acidente em um ano; c- Cinco ou mais se envolvam em ao menos um acidente em um ano; 4- Suponha que, em media 2% das pessoas sejam canhotas. Encontre a probabilidade de 3 ou mais canhotos em 100 pessoas -68-

14.0 DISTRIBUIO NORMAL (ou de GAUSS, ou de LAPLACE, ou ainda, dos ERROS DAS OBSERVAES) uma distribuio contnua e simtrica, cujo grfico tem a forma de um sino. A distribuio normal o resultado da atuao conjunta de causas aleatrias.

F (x)

x- 3

x- 2

x- 1

x +1 x+ 2

x+ 3

Parmetros da Distribuio Normal Mdia da Populao Determinam o formato da curva Desvio padro da populao Equao da Funo de Probabilidade A equao da funo de probabilidade dada pela expresso: - ( x - ) 2 f(x) = 1 2 -69-

Do estudo de estatstica conclumos que:

- a varivel x pode assumir qualquer valor real no intervalo

- < x < +

- a varivel x obedecer a uma Distribuio Normal, se a probabilidade de que um valor x seja menor ou igual a outro xo for:

- ( x - ) x0 2 P( x < x0 ) = f(x0) = 1 2 -

dx

- a integral da expresso representa a rea compreendida entre

xo.

F (x)

-
X0

Portanto: A probabilidade de ocorrncia de um valor menor ou igual rea abaixo da curva, entre os valores -

x .

Os valores = 3,1416 e

e ( nmero

neperiano) = 2,718 so constantes numricas.

-70-

CARACTERISTICAS DA CURVA DE DISTRIBUIO NORMAL


A curva normal obedece necessariamente s seguintes caractersticas: a- A mdia o valor da varivel x para o qual a f(x) mxima. b- O desvio Padro , a distncia entre a mdia e o ponto de inflexo da curva.

c- A rea total sob a curva normal igual a 1, pela prpria equao da probabilidade. d- Em virtude da simetria as reas direita e esquerda do valor so iguais

DISTRIBUIO NORMAL PADRONIZADA

Se tomarmos a equao auxiliar:

Z=

-
e como unidade de

o que significa adotar como origem dos z o ponto em que x =

escalados z e o desvio padro , teremos transformado a expresso da funo das probabilidades na distribuio normal reduzida:

- z
2 f(z)= 1 2

Considerando, a partir da equao auxiliar: dz = dx dx 1

= . dz -71-

Portanto a funo da probabilidade, em funo de Z, ser dada pela expresso:

- z
z f(z)= 1 2 2

e
-

dz

As reas sob a curva permanecem as mesmas, mas agora podem ser tabuladas em funo dos valores de Z (Ver figura abaixo, eixo dos Z). Basta construir a tbua das reas para os valores I(z), na tbua 1.

Por exemplo, a rea desde Z=0, at Z= 1,0 I(1,0) = 0,3413 ou 34,13% da rea total da curva; conseqentemente, dentro do intervalo 1 temos 68,26% da rea total da curva. Se procurarmos a probabilidade de encontrarmos um valor de x dentro do intervalo 0,95 onde a media, o desvio padro da populao, teremos: 0,95 < Z < + 0,95 )

P(- Z0 < Z < Z0) = Iz1 = 0,3289

It= 0,6578 ou 65,78%.

Apresentamos na tabela abaixo alguns dos mais importantes intervalos de distribuio normal para aplicaes em exerccios de probabilidade na curva normal.

TBUAS DE REAS DA CURVA NORMAL

A partir da equao auxiliar

Z=

podemos transformar valores de x em

valores de z e em seguida construir uma tabela com resultados das integrais, que corresponde rea sob a curva xo intervalo de 0 a Z0 identificada por Iz0.

-72F (x)

x- 3

x- 2

x- 1

x +1

x+ 2

x+ 3

-3

-2

-1

Transformao de X em Z

Xo

Z=

Zo

+ 1 + 2 + 3 - 1 - 2 - 3

- + 1- + 2- + 3- -- - 2 - - 3 -

0 1 2 3 -1 -2 -3

-73-

I Zo

Zo

AREAS I ZO = I Z0

0 z Z0) para Z0= (x - )/


I Z0 I Z0 I Z0 I Z0 I Z0

Z0
0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,0000 0,0199 0,0398 0,0596 0,0793 0,0987 0,1179 0,1369 0,1554 0,1736 0,1915 0,2088

Z0
0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00 1,05 1,10 1,15 0,2257 0,2422 0,2580 0,2734 0,2881 0,3051 0,3159 0,3289 0,3413 0,3531 0,3643 0,3749

Z0
1,20 1,25 1,30 1,35 1,40 1,45 1,50 1,55 1,60 1,65 1,70 1,75 0,3849 0,3944 0,4032 0,4115 0,4192 0,4279 0,4332 0,4394 0,4452 0,4505 0,4554 0,4599

Z0
1,80 1,85 1,90 1,95 2,00 2,05 2,10 2,15 2,20 2,25 2,30 2,35 0,4641 0,4678 0,4713 0,4744 0,4772 0,4798 0,4821 0,4842 0,4861 0,4878 0,4893 0,4906

Z0
2,40 2,45 2,50 2,55 2,60 2,65 2,70 2,75 2,80 2,85 2,90 2,95 0,4918 0,4929 0,4938 0,4946 0,4953 0,4960 0,4965 0,4970 0,4974 0,4978 0,4981 0,4984

Z0
3,00 3,05 3,10 3,15 3,20 3,25 3,30 3,35 3,40 3,50 3,70 3,90 0,4987 0,4989 0,4990 0,4992 0,4993 0,4994 0,4995 0,4996 0,4997 0,4998 0,4999 0,5000

EXERCICIOS - E7

1- Trace uma curva normal e sombreie a rea desejada a partir das informaes:

a- rea direita de z=1,0 b- rea da esquerda de z= 1,0 c- rea entre z=0 e z=1,5 d- rea entre z=0 e z= - 2,9 e- rea entre z=1,0 e z= 2,0 f- rea entre z= -2,0 e z= 2,0 g- rea entre z= 2,5 e z=3,0 -74-

2- Ache os valores de z correspondentes as seguintes reas: a- rea esquerda de para Iz = 0,0505 b- rea esquerda de para Iz = 0,0228 c- rea esquerda Iz= 0,4505 e rea da direita Iz = 0,4861

3- Uma distribuio normal tem media 50 e desvio padro 5. Que percentagem da populao estaria provavelmente dentro dos intervalos: a- P ( x

60)

b- P ( 35 x 62) c- P ( 55 d- P ( x > x 65) 55)

e- P ( 35 x 45)

4- Suponha uma renda mdia de uma grande comunidade possa ser razoavelmente aproximada por uma distribuio normal com media anual de R$ 10.000,00 e desvio padro de R$ 2.000,00.

a- Que percentagem da populao ter renda superior a R$ 15.000,00? b- Numa amostra de 50 assalariados, quantos podemos esperar que tenham menos de R$ 8.000,00 de renda?

-75-

15.0 CORRELAO
15.1 INTRODUO
At agora nossa preocupao era descrever a distribuio de valores de uma nica varivel. Com esse objetivo, aprendemos a calcular medidas de tendncia central e variabilidade. Quando porem, consideramos observaes de duas ou mais variveis, surge um novo problema: as relaes que podem existir entre duas ou mais variveis estudadas.

Assim, quando consideramos variveis como peso e altura de um grupo de pessoas, uso do cigarro e incidncia do cncer, a potencia gasta e a temperatura da gua no chuveiro, Procuramos verificar se existe alguma relao entre as variveis de cada um dos pares e qual o grau dessa relao. Para isso, necessrio o conhecimento de novas medidas. Sendo a relao entre as variveis de natureza quantitativa, a correlao o instrumento adequado para descobrir e medir essa relao. Uma vez caracterizada a relao, procuramos descreve-la atravs de uma funo matemtica. A regresso o instrumento adequado par a determinao dos parmetros dessa funo.

15.2 RELAO FUNCIONAL E RELAO ESTATSTICA


Como sabemos, o permetro e o lado de um quadrado esto relacionados. A relao que liga perfeitamente definida e pode ser expressa por meio de uma sentena matemtica: P=4L P= PERIMETRO L= LADO DO QUADRADO

Atribuindo-se, ento, um valor qualquer de L, possvel determinar exatamente o valor do permetro. -76-

Considerando, agora a relao que existe entre o peso e a estatura de um grupo de pessoas. evidente que essa relao no do mesmo tipo da anterior, ela bem menos precisa. Assim, pode acontecer que a estaturas diferentes correspondam a pesos iguais ou que estaturas iguais correspondam a pesos diferentes.

Porem, em mdia, quanto maior a estatura, maior o peso.

As relaes do tipo perimetro-lado so conhecidas como relaes funcionais. As relaes do tipo peso-estatura, como relaes estatsticas.

Quando duas variveis esto ligadas por uma Relao Estatstica, dizemos que existe uma correlao entre elas.

15.3 DIAGRAMA DE DISPERSO


Consideremos uma amostra aleatria, formada por 98 alunos de uma classe da Uniso e pelas notas obtidas por eles em Matemtica e Estatstica:

NOTAS N MATEMATICA (xi) ESTATISTICA (yi)

01 08 24 38 44 58 59 72 80 92

5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0

6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0

-77-

Representando, em um sistema de coordenadas cartesiano ortogonal, os parmetros (xi ; yi), obtemos uma nuvem de pontos que denominamos DIAGRAMA DE DISPERSAO. Esse diagrama nos fornece uma idia grosseira, porem til, da correlao existente: yi 10 . .
o o

8 . . 6 . .
o

4 . . 2 . . . . 2
o

. 4

. 6

. 8

. 10 xi

15.4 CORRELAO LINEAR


Os pontos obtidos, vistos em conjunto formam uma elipse em diagonal. Podemos imaginar que, quanto mais fina for a elipse mais ela se aproximar de uma reta. Dizemos, ento, que a correlao de forma elptica tem como imagem uma reta, sendo, por isso denominada de Correlao Linear. -78-

possvel verificar que cada correlao esta associada como i age uma relao funcional. Por esse motivo, as relaes funcionais so chamadas Relaes Perfeitas.

yi 10 . .
o

RETA IMAGEM

8 . . 6 . .
o

4 . . 2 . . . . 2
o

. 4

. 6

. 8

. 10 xi

omo a correlao em estudo tem como imagem uma reta ascendente, ela chamada de Correlao Linear Positiva.

Assim uma correlao : a- Linear Positiva se os pontos do diagrama tem com imagem uma reta ascendente; b- Linear negativa se os pontos tem como imagem uma reta descendentes; c- Nao-linear se os pontos tem como imagem uma curva.

-79-

Se os pontos apresentam-se dispersos, no oferecendo uma i age definida, conclumos que no h relao alguma entre as variveis em estudo. Temos: Y
o oo ooo oo ooooo ooo ooooo oo o oo

correlao linear positiva

X Y
o oo ooo oo ooooo ooo ooooo oo o oo

correlao linear negativa

X
o o oo oo oooo ooo oo oo ooo ooooo o correlao no-linear ooo oooo ooooo ooo oo oo o oooo oo ooo

Y
oo o o o o o o o oooo ooo o ooo oo ooo oooo oooo oooo o o oo ooo ooooo o o ooo oo o ooooo

no h correlao

-80-

15.5 COEFICIENTE DE CORRELAO LINEAR


O instrumento empregado para a medida de Correlao Linear o Coeficiente de Correlao. Esse coeficiente deve indicar o grau de intensidade da correlao entre duas variveis e, ainda, o sentido dessa correlao (positivo ou negativo). Faremos uso do coeficiente de correlao de Person, que dado por : r= n xi yi xi ) yi)

Onde

[ n xi xi)] [ n yi yi)]

n = nmero de observaes Os valores limites de r so -1 e +1, isto , o valor de r pertence ao intervalo [ -1 e +1]. Assim: A- Se a correlao entre duas variveis perfeita e positiva, ento r = +1. B- Se a correlao perfeita e negativa, ento r = -1 C- Se no h correlao entre as variveis ou a relao por ventura no-linear, ento r = 0. NOTAS Para que uma relao possa ser descrita por meio do Coeficiente de Correlao de Person imprescindvel que ela se aproxime de uma funo Linear. Uma maneira pratica de verificarmos a linearidade da relao a inspeo do Diagrama de Disperso: se a elipse apresenta salincias ou reentrncias muito acentuadas, provavelmente trata-se de uma relao curvilnea. Para podermos tirar algumas concluses significativas sobre o comportamento simultneo das variveis analisadas, necessrio que: 0,6 Se Se 0,3 0 | r | 1 | r | < 0,6, h uma correlao relativamente fraca entre as variveis. < | r | < 0,3, a correlao muito fraca e, praticamente, nada podemos

concluir sobre a relao entre as variveis em estudo. -81-

Em seguida vamos calcular o coeficiente de correlao relativos ao exerccio anterior. O modo mais pratico para obtermos r abrir, na tabela, colunas correspondentes aos valores de xi yi, xi e yi. Assim:

MATEMATICA (xi)

ESTATISTICA (yi)

xi yi

xi

yi

5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 =65

6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 =65

30 72 56 100 30 49 72 12 48 04 =473

25 64 49 100 36 49 81 09 64 04 =481

36 81 64 100 25 49 64 16 36 04 =475

Logo: 10 x 473 65 x 65

r=

505

550 4.554,18

= 0,911

(4.810 4.225)

(4.750 4.225)

585 x 525

Dai: r = 0,91

Resultado que indica uma correlao linear positiva altamente significativa

entre as duas variveis.

-82-

15.6 CUDADOS COM OS ERROS COM A INTERPLETAO DE CORRELAO

Identificamos

a seguir trs dos erros mais comuns cometidos na interpretao de

resultados que envolvem correlao.

1- Devemos evitar a concluso de que a correlao implica em casualidade . Um estudo mostrou uma correlao entre salrios de professores de Estatstica e o consumo individual de cerveja. Porem essas duas variveis so afetadas pelas condies econmicas que envolvem no s o professor de Estatstica, aparece neste caso uma terceira varivel oculta.

2- Surge outra fonte de erro potencial quando os dados se baseiam em taxas ou mdias. Quando utilizamos taxas ou mdias para os dados, suprimimos a variao entre os indivduos ou elementos, e isto pode levar a um coeficiente de correlao inflacionado.

3- Um terceiro erro diz respeito propriedade de linearidade . A concluso de que no h correlao linear significativa no quer dizer que x e y no estejam relacionados de alguma forma provavelmente possa haver uma correlao no linear.

-83-

EXERCICIOS: E 8

1- Complete o esquema de clculo do coeficiente de correlao para os valores das variveis xi e yi :

xi yi

4 12

6 10

8 8

10 12

12 14

Temos:

(xi)

(yi)

xi yi

xi

yi

4,0 . . .... 12,0 = =

12,0 . 14,0 = = =

Logo: .... x ... .... x ...

r=

.........

........ .........

= ........

(..... .....) (..... ......)

..... x ......

ONDE: r =

-84-

2- Padronize cada conjunto de escores e calcule o coeficiente de correlao. A-

(xi) 34 30 40 34 39 35 42 45 43 = =

(yi) 21 22 25 28 15 24 24 22 17

xi yi

xi

yi

b-

(xi) 3,9 4,6 6,0 2,8 3,1 3,4 4,2 4,0 =

(yi) 46 46 52 50 48 40 42 44 =

xi yi

xi

yi

-85-

1- Determine o coeficiente de correlao para os dois conjuntos de valores abaixo:

1 AVALIAO 2 AVALIAO

estudante 1 2 3 4 5 6 7 8 9 10 11 =

(xi) 82 84 86 83 88 87 85 83 86 85 87

(yi) 92 91 90 92 87 86 89 90 92 90 91 =

xi yi

xi

yi

5- Com os dados abaixo, sobre crimes violentos e a temperatura mdia entre 21 e 2 horas das noites de sbado numa grande comunidade, monte o grfico para os dados e calcule o coeficiente de correlao.

Crimes Violentos/ 1000 residentes 5,0 2,2 4,1 5,4 2,8 3,0 3,6 4,9 4,1 4,2 2,0 2,7 3,1 -86-

temperatura mdia (F) 87 50 75 90 55 54 68 85 82 80 45 58 66

16.0 REGRESSO LINEAR


Sempre que desejamos estudar determinada varivel em funo de outra fazemos sempre uma anlise de regresso. Podemos dizer que a analise de regresso tem por objetivo descrever, atravs de um modelo matemtico, a relao entre duas variveis, partindo de n observaes das mesmas.

16.1 AJUSTAMENTO DE CURVAS


A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel dependente e a outra recebe o nome de varivel independente. Assim, supondo X a varivel independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta a relao entre essa variveis, ou seja, vamos obter uma funo definida por: Y = ax + b onde a e b so parmetros.

Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada, embora no perfeita, como, por exemplo, as do exerccio j apresentado:

MATEMATICA (xi) 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0

ESTATISTICA (yi) 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 -87-

Cujo Diagrama de Disperso dado por:

yi 10 . .
o

RETA IMAGEM

8 . . 6 . .
o

4 . . 2 . . . . 2
o

. 4

. 6

. 8

. 10 xi

Podemos concluir, pela forma do diagrama, que se trata de uma correlao retilnea, de modo a permitir o ajustamento de uma reta, imagem da funo definida por: Y = ax+ b

16.2 MTODO DOS MNIMOS QUADRADOS


Vamos ento, calcular os valores dos parmetros a e b com a ajuda das frmulas: -88-

a = n i Yi - xi . yi n i - xi) e

b = Y - a X
Onde : n o nmero de observaes

X mdia dos valores de Xi (X = i ) n Y mdia dos valores de Yi (Y = Yi ) n Nota: Como estamos fazendo uso de uma amostra para obtermos os valores dos parmetros, o resultado, na realidade, uma estimativa da verdadeira equao de regresso. Sendo assim, escrevemos: Y^ = a X + b Onde Y^ o Y estimado A tabela de valores: MATEMTICA (xi) ESTATSTICA (yi)

xi yi

xi

5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 =65

6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 =65

30 72 56 100 30 49 72 12 48 04 =473 -89-

25 64 49 100 36 49 81 09 64 04 =481

Temos assim a = 10 x 473 65 x 65 = 4730 - 4225 = 505 = 0,8632 10 x 481 (65) 4810 - 4225 585 Como: X = 65 = 6,5 10 Vem: b = 6,5 0,8632 x 6,5 = 6,5 - 5,6108 = 0,8892, Donde: a = 0,86 Logo: Y^ = 0,86 X + 0,89 Para traarmos a reta no grfico, basta determinar dois de seus pontos: X=0 X=5 Assim temos: yi
10 . . 8 . . 6 . 5,19 . 4 . . 2 . o o o o o o o o o o Y^ = 0,86 X + 0,89

Y = 56 = 6,5 10

b = 0,89

Y^ = 0,89 Y^ = 0,86 x 5 + 0,89 = 5,19

.
0,89

.
2

.
4

.
6

.
8

.
10

xi

- 90-

16.3 ANLISE DE REGRESSO

Quando recorremos a uma reta de mnimos quadrados, precisamos saber qual a preciso dos valores obtidos para a e b na equao de mnimos quadrados? Qual a preciso da estimativa Y^?

Os valores calculados so apenas estimativas baseadas em dados amostrais e, se fundamentarmos nosso trabalho em outra amostra de mesmo tamanho n o mtodo de mnimo quadrado poderia gerar valores diferentes de para a poderia gerar valores para Y^ diferentes. e b , como tambm

Para prever essas diferenas possvel estabelecermos um intervalo para o qual possamos afirmar, com certo grau de confiana valores de Y^.

O clculo desses intervalos segue os mesmos raciocnios visto anteriormente para as mdias , propores, varincias e desvio padro, e analisaremos a seguir.

-91-

EXERCICIOS: E 9
1- Aps 6 horas de treinamento, um cachorro cometeu 5 erros em uma exposio canina, outro cachorro aps 12 horas cometeu 6 erros, e

finalmente um outro cachorro, apos 18 horas, cometeu apenas 1 erro. Denotando por x o nmero de horas de treinamento e por y o nmero de erros cometidos, qual das duas retas se ajusta melhor aos trs pontos, no sentido de mnimos quadrados?

a- y = 10 - x b- y = 8 1/3

2- A tabela a seguir mostra quantas semanas seis pessoas trabalharam em um posto de inspeo de automveis e quantos carros foram inspecionados entre 12 e 14 horas, em determinado dia:

Nmero de semanas Trabalhadas 2 7 9 1 5 12 Para esses dados temos:

Nmero de carros inspecionados 13 21 23 14 15 21

x = 36, x = 304, y = 107, y = 2001 e 3040

x .y =721

a- Estabelea a equao da reta de mnimos quadrados que permite predizermos y em termos de x.

b- Com o auxilio da parte a, estime quantos carros uma pessoa que venha trabalhando no posto de inspeo ha 8 semanas poder inspecionar?

-92-

3- Os dados abaixo se referem ao resduo de cloro em uma piscina em vrios momentos, aps ter sido tratada com produtos qumicos: X Nmero de Horas 0 2 4 6 8 10 12 Y Resduo de cloro (P.P.M.) 2,2 1,8 1,5 1,4 1,1 1,1 0,9

Para esses dados temos: x = 42, x = 364, y = 10, y = 15,52 e x .y =48,6

A leitura de zero horas foi feita imediatamente aps completado o tratamento qumico. a- Ajuste uma reta de mnimos quadrados que nos permita predizer o resduo de cloro em termos do nmero de horas aps a piscina ter sido tratada com produtos qumicos.

b- Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 5 horas aps ter sido tratada.

c- Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 8 horas aps ter sido tratada. Por que razo o resultado diverge do valor 1,1 da tabela.

-93-

INTERFERNCIA ESTATSTICA
1.0 CONFIABILIDADE DA AMOSTRA
A estimativa do tamanho da amostra um dos fatores determinantes para o sucesso de uma Pesquisa Estatstica. Como j mencionado, o tamanho da amostra pode ser pequeno em relao populao geral. Ao longo do curso veremos formas especificas para o calculo da amostra mnima necessria para dar confiana aos resultados obtidos. Entretanto, existem dois fatores estatsticos que devem ser mantidos em mente: - Quanto maior o tamanho da amostra, mais precisas so as informaes sobre a populao; - Acima de determinado tamanho, poucas informaes extras sobre a populao podem ser obtidas, no entanto, os custos de tempo e dinheiro aumentam.

1.1 PLANEJAMENTO DA AMOSTRA


A amostragem ideal para todo o estudo estatstico e a Amostragem Aleatria. Em estatstica, um planejamento da amostra e um plano definido, completamente antes da coleta de quaisquer dados e que tem por objetivo a obteno de uma amostra de uma populao. Os mtodos mais usuais de amostragem j foram estudados no curso e so: Amostragem Sistemtica; Amostragem Estratificada; Amostragem por Conglomerados.

1.2 ERROS PROVENIENTES DA AMOSTRAGEM


Estes erros surgem do fato de a amostra no ser representativa em relao populao em questo. Eles geralmente so minimizados com a considerao cuidadosa do mtodo de amostragem a ser utilizado. Com amostras Aleatrias, o tamanho desses erros de amostragem podem ser utilmente estimados e o mtodo de clculos veremos nos captulos adiante. -94-

1.3 ERROS NO PROVENIENTES DA AMOSTRAGEM

Estes surgem devido a varias causas, incluindo:

Registros incorretos dos dados; Transferncia incorreta de dados para a calculadora ou computador para processamento;

Medies incorretas; Perguntas mal projetadas;

1.4 PLANEJAMENTO GERAL DA PESQUISA

Para resumir, aqui temos uma lista de verificao das principais etapas do projeto de uma pesquisa:

Defina as metas da pesquisa; Defina a populao; Identifique o esquema de Amostragem (definir a amostra e o tamanho que ela deve ter);

Decida que mtodo de coleta de dados utilizar (questionrio pessoal, entrevista, medies, etc);

Caso decida usar questionrio, preparar um apropriado para entrevistas pessoais; Selecione e treine qualquer pessoa envolvida no processo de coleta de dados.

-95-

1.5 DISTRIBUIES AMOSTRAIS


A distribuio Amostral provavelmente o conceito mais fundamental da interferncia estatstica, e est relacionado com a idia de variao aleatria que permite enfatizar a necessidade de medir a variabilidade de dados. Para ilustrar o conceito de distribuio amostral, vamos construir a da mdia de uma amostra aleatria de tamanho n=2 extradas sem reposio, de uma populao finita de tamanho N=5 cujos dados poderiam ser (3,5,7,9 e 11). Neste caso teremos:

= 3 + 5 + 7 +9 +11 = 7 5

e seu desvio padro :

(3 7) + (5 - 7)+ (7 - 7)+(9 - 7)+(11 - 7) = 8 5

Se tomarmos agora amostra n=2 neste caso temos 10 possibilidades, isto , a combinao 5,2, ou seja, 5! 2! 3! 3e5 3e7 3e9 3 e 11 5e7 5e9 5 e 11 7e9 7 e 11 9 e 11 = 10

e suas mdias so: 4 5 6 7 6 7 8 8 9 10

Como cada amostra tem probabilidade 1/10, obtemos a seguinte Distribuio Amostral da Mdia: Mdia X 4 5 6 7 8 9 10 -96Probabilidade 1/10 1/10 2/10 2/10 2/10 1/10 1/10

Desta forma o Histograma da Distribuio das Probabilidades fica:

2/10

1/10

1/10

Observa-se que para X = 6, 7, 8 h uma probabilidade de 6/10 de uma Mdia Amostral no ser diferente de 1 da Mdia Populacional = 7. Tambm para mdia X = 5, 6, 7, 8 ou 9 h uma probabilidade de 8/10 de uma Mdia Amostral no ser diferente de 2 da Mdia Populacional = 7 Assim, se no conhecssemos a Mdia da Populao dada e quisssemos estima-la com a mdia de uma Amostra Aleatria de tamanho n =2 o processo acima nos daria uma idia do tamanho possvel do erro envolvido.

Para obtermos outras informaes teis sobre a distribuio Amostral da Mdia Calculamos : x e

x .

x = 4 + 5 + 6 + 6 + 7 + 7 + 8 + 8 + 9 + 10 = 7
10

x x

= (4 7)+ (6 7)+ (6 7)+ (7 7)+ (7 7)+ (8 7)+ (8 7)+ (9 7)+ (10 7) 10 = 3 -97-

1.6 ERRO PADRO DA MDIA


Para amostras Aleatria de tamanho n extradas de uma populao com mdia e desvio padro

, a Distribuio Normal de x

tem mdia:

x=
e o Desvio Padro da Mdia

ou

N -n
N -1

Dependendo de a Populao ser Infinita ou Finita de Tamanho N, respectivamente. Costuma-se referir-se a como o Erro Padro da Mdia, se:

x e pequeno h uma boa chance que a Mdia da Amostra estar prximo da Mdia da

Populao.

x e Grande a Mdia Amostral e consideravelmente diferente da Mdia da Populao.


O Fator

N -n
N -1

e chamado de fator de Correo para Populao Finita

Exemplo Com referncia ao exerccio anterior, tnhamos n =2 e N =5 e segunda das formulas de Fazendo n = 2 ,N = 5 e

8 verifique que a

da

=8

para formula para populaes finitas temos:

N -n
N 1

= 8 2

5 2
5-1

8X3
2X4 -98-

=3

EXERCCIOS

1- Qual e o valor do erro de correo para a populao finita, Quando:

a - n = 10 e N = 200 b- n = 10 e N = 500 c- n = 10 e N = 2000 d- n = 20 e N = 200 e- n = 40 e N = 400 f- n = 400 e N = 4000

2- Uma populao Finita de N = 6 nmeros 6, 9, 12, 15, 18 e 21:

a- Calcule a Mdia Populacional e o Desvio Padro b- Relacione Quantas Amostras so possveis se n = 2 (combinao 6,2) c- Montar todas as amostras possveis e calcular os X d- Construa o Histograma da Distribuio Amostral da Mdia para amostras Aleatrias de tamanho n = 2 extradas, sem reposio, dessa Populao Finita. e- Determine o Desvio Padro da Distribuio Amostral da Mdia

x .

-99-

1.7 TEOREMA CENTRAL DO LIMITE


A capacidade de usar AMOSTRAS para se fazer interferncias sobre parmetros POPULACIONAIS depende do conhecimento da distribuio Amostral.

Sabemos j calcular a mdia e o desvio padro, mas temos tambm que saber a forma da Distribuio Amostral. Se temos uma distribuio individual normal A distribuio das mdias tambm ser normal para qualquer nmero de amostras

Se a distribuio individual no e normal

A distribuio

das mdias ser normal para

Amostras Grandes

Isso significa que para qualquer distribuio individual, podemos sempre que tenhamos a distribuio normal com a nica restrio que o tamanho da amostra seja grande, ou seja, acima de 30 amostras. Esses resultados so conhecidos como o Teorema Central do Limite.

O TEOREMA CENTRAL DO LIMITE

1- Se a populao sob amostragem tem distribuio normal, a distribuio das mdias tambm ser normal para todos os tamanhos de amostras. 2- Se a populao bsica no e normal, a distribuio das mdias amostrais ser aproximadamente normal para grandes amostras. Exemplo 1 Uma populao muito grande tem mdia = 20 e desvio padro = 1,4. Extrai-se uma amostra de 49 observaes .

Questes Resolvidas:

A- Qual a mdia da Distribuio Amostral? A mdia da distribuio Amostral e sempre igual a mdia da populao , logo x = 20. -100 -

A - Qual o desvio padro da distribuio amostral?

x = x
n

1,4 = 1,4 = 0,2 49 7

C - Qual a Percentagem das possveis mdias amostrais que diferiro por mais de 0,2 da mdia da populao ?

Como n > 30, podemos supor que a distribuio e normal.

TEMOS:

x = 0,2
x = 20 Portanto a curva normal seria
F (x)

0,3413

0,3413

x x-3 x x-2 x x - x x+ x x +2 x x+ 3 x

Z Z1 Z1 = 19,8 20 = - 0,2 = -1 0,2 0,2 Z1 = 20,2 20 = 0,2 0,2 = 0,2 1 Z2 Iz1= 0,3413

Iz1= 0,3413

IT= 0,5 0,3413 + 0,5 0,3413

0,1587 + 0,1587 = 0,3174

Mdias Inferiores a 19,8 e Superiores a 20,2 -101 -

EXERCICIOS

1- Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida esperada mdia de 50 meses. Sabe-se que o desvio padro correspondente de 4 meses. Que percentagem da amostra de 36 observaes acusara vida mdia no intervalo de 1 ms em torno de 50 meses, admitindo-se ser de 50 meses a verdadeira vida mdia das baterias? Qual ser a reposta para uma amostra de 64 observaes?

2- Se se extrai uma amostra de uma distribuio normal, qual a probabilidade de a mdia amostral estar compreendida em cada intervalo?

a - x 1,96 x b - x 2,00 x c - x 2,33 x

3- A mdia de uma distribuio amostral de mdias e 50 e seu desvio padro e de 10. Suponha normal a distribuio Amostral.

a - Que percentagem de mdias amostrais estar entre 45 e 55? b- Idem para 42,5 e 57,5 c - Que percentagem de mdias amostrais ser menor que a mdia populacional? d - Que percentagem de mdias amostrais ser igual mdia populacional?

4- Determine a mdia da distribuio de mdias amostrais, dada cada uma das seguintes mdias populacionais:

a- 5,01 b- 199,5 -102 -

5- Calcule o desvio padro da distribuio amostral de mdias para cada um dos casos seguintes: a- x = 5,0 e b- x = 6,2 e c- x = 1,0 e d- x = 3,2 e e- x = 2,0 e n=6 n = 100 n = 36 n = 44 n = 40

6- Deve-se extrair uma amostra de 36 observaes de uma mquina que cunha moedas comemorativas a espessura mdia das moedas e de 0,2 cm, com desvio padro de 0,01 cm.

a- preciso saber que a populao normal para determinar a percentagem de mdias amostrais que esto dentro de certos intervalos? Explique. b- Que percentagem de mdias amostrais estar no intervalo 0,20 0,004 cm? c- Qual a probabilidade de se obter uma mdia amostral que se afaste por mais de 0,005 cm da mdia do processo?

-103 -

2.0 ESTIMATIVAS E TAMANHO DE AMOSTRAS

2.1 ASPECTOS GERAIS

Quando decidimos usar mtodos de Amostragem para checar a uma deciso sobre a varivel investigada, devemos definir rigorosamente nossos conceitos e procedimentos. Em seguida, devemos assegurar que nossa A agregado no mximo grau possvel. stra reflita as caractersticas do

A principal vantagem de se adotar seleo aleatria de amostras em investigao cientifica a de que sabemos matematicamente alguma coisa sobre a natureza do comportamento destas Amostras Aleatrias.

Do ponto de vista do Estatstico as amostras devem ser to grandes quanto possveis. Quanto maior a amostra, maior a confiana que se tem nos resultados. Para entender as razoes desse ponto de vista, imagine que em uma cidade existem dois hospitais.

Em um deles nascem 120 bebes por dia e no outro 12. A razo de meninos e meninas , em mdia, 50% nos dois hospitais.

Uma vez nasceu, em um dos hospitais, duas vezes mais meninos do que meninas (67% meninos e 33% meninas). Em qual dos hospitais provvel que isso tenha ocorrido? claro que foi no menor.

A probabilidade de obter uma estimativa que se desvia muito do parmetro aumenta quando a amostra for pequena.

As amostras muito pequenas so inteis por que no do, em geral, boas estimativas.

No entanto amostras muito grandes, porem mal feitas, so piores porque do a iluso de conter a verdade. -104 -

2.2 ESTIMATIVAS DE UMA MDIA POPULACIONAL: GRANDES AMOSTRAS


Em geral a mdia amostral x a melhor estimativa de uma mdia populacional .

Um estimador uma estatstica amostral (como a mdia amostral x) utilizada para obter uma aproximao de um parmetro populacional.

Uma estimativa um valor especifico, ou um intervalo de valores, usado para aproximar um parmetro populacional.

H duas razoes para explicar por que uma mdia amostral x tende a centrar-se em torno da ia u aci na .

1- Para muitas populaes, a distribuio de mdias amostrais x tende a ser consistente (apresentar menor variao) do que as distribuies de outras estatsticas amostrais (mediana ou a moda). ia P u aci na .

2- A mdia amostral x tende a centrar-se em torno da

x1 x3 x4 x2 x5

x6 x8 x7

2.2.1 INTERVALOS DE CONFIANCA


Quando usamos a mdia x para estimar a mdia populacional e fazemos uma

estimativa pontual no temos qualquer indicao de quo boa e essa estimativa. Para isso foi desenvolvida outro tipo de estimativa, que efetivamente indica quo boa uma estimativa pontual. -105 -

Essa estimativa, chamada intervalo de confiana ou estimativa intervalar, consiste em uma amplitude (ou um intervalo) de valores, em lugar de um nico valor.

Um intervalo de confiana est associado a um grau de confiana que e a medida da nossa certeza de que o intervalo contem o parmetro populacional. Para tanto usa a probabilidade , que corresponde a rea na curva normal, a qual pela simetria da curva divide-se em duas partes como aprece sombreada na curva abaixo:

/2

z=0

/2

So escolhas comuns para o grau de confiana: 90% (com = 0,10) 95% (com = 0,05) 99% (com = 0,01) A opo mais comum e a opo 95%

EXEMPLOS
1- Ache os valores crticos z /2 correspondentes aos graus de confiana:

90% 95% 99%


-106 -

90%

= 0,10

10% DE INCERTEZA

/2=0.05
0,45

0,45

/2=0,05

/2=0.05

z=-1,645
95% = 0,0 5

z=0

z=1,645
5% DE INCERTEZA

0,475

0,475

/2=0.025

/2=0.025

z=-1,96
99% = 0,01

z=0

z=1,96
1% DE I CER EZA

0,495 0,495

/2=0.005 /2=0.005

z=-2,575

z=0
-107 -

z=2,575

z /2

z=0

z /2

AREAS SIMETRICAS NAS CAUDAS AREA 0,001 0,002 0,003 0,004 0,005 Z /2 3,291 3,090 2,968 2,878 2,807 AREA 0,01 0,02 0,03 0,04 0,05 Z /2 2,576 2,326 2,170 2,054 1,960 AREA 0,06 0,07 0,08 0,09 0,10 Z /2 1,881 1,812 1,751 1,695 1,645 AREA 0,20 0,30 0,40 0,50 0,60 Z /2 1,282 1,036 0,842 0,674 0,524

Quando utilizamos dados amostrais para estimar uma mdia

u aci na , a margem

de erro, denotada por E e a diferena mxima provvel (com probabilidade 1-) entre a mdia amostral observada a verdadeira E = erro mximo da estimativa FORMULA ia u aci na .

E = Z /2 x

Essa formula s pode ser usada quando conhecemos Desvi -108 -

a r

ua

Quando e desconhecido: Se n > 30, podemos substituir na frmula acima pelo Desvio padro Amostral S. Se n 30, a curva deve ser normal e devemos conhecer obrigatriamente o para aplicar a formula. Adiante daremos uma outra soluo quando n 30.

Com base na definio da margem de erro E, podemos agora identificar o intervalo de confiana para a mdia populacional . Intervalo de confiana ( ou estimativa Intervalar) para a mdia populacional (com base em grandes amostras: n > 30).

XE

-E

Onde RESUMO

E = Z /2 x

Processo de construo de um intervalo de confiana para a mdia n > 30). 2- Determinar o valor critico Z /2 correspondente ao grau de confiana desejado. Exemplo: 95% Z /2 = 1,96

2- Calcular a margem de erro E = Z /2 x

se o desvio padro da populao n no conhecido, utilizar o desvio padro da amostra S, desde que n > 30. 3- Com a margem de erro e o valor da mdia amostral X, calcular os valores X E e X+ E Levar esses valores na expresso do intervalo de confiana. XE E Ou = ou ( X E ;X E) -109 E

EXERCCIO: 1- Determine o intervalo de confiana 95% para a mdia populacional para os valores abaixo:

69,9 60,0 70,4 72,8 70,4

69,9 68,4 66,8 70,8 69,4

72,6 68,3 69,9 70,2 69,9

70,2 69,6 69,2 71,7 70,0

70,0 71,7 70,5 70,0 71,7

71,8 69,2 70,2 68,3 70,2

70,6 70,8 70,0 66,8 70,8

72,8 71,0 70,8 69,9 72,8

69,0 70,4 72,6 69,0 71,0

68,4 66,8 70,6 69,4 69,9

2- Determine o valor critico de Z /2 que corresponde ao grau de confiana indicado: a- 99% b- 94% c- 98% d- 92% e- 96% 3- Use o grau de confiana e os valores amostrais dados para achar a margem de erro e o intervalo de confiana para a ia u aci na .

a- Altura das alunas: 95% de confiana, n = 50, X = 164 b- Mdias das notas: 99% de confiana, n = 70, X = 7,0

S = 4,5 S = 0,88

c- Notas de um teste: 90% de confiana, n = 150, X = 77,6 S = 14,6 d- Salrio da Policia: 92% de confiana, n = 64, X = R$ 1200,00 S = R$ 80,00

4- A partir de uma amostra de 35 crnios de homens egpcios que viveram por volta de 1850 AC mede-se a largura mxima de cada crnio, obtendo-se:

X = 134,5 mm e S = 3,48 mm. Com esses dados amostrais construa um intervalo de 95% de confiana para a ia u aci na .

-110 -

2.2.2 DETERMINAO DO TAMANHO DA AMOSTRA

Suponha que estamos definindo um procedimento para uma pesquisa cientifica. Como sabemos quantos elementos da populao devem ser escolhidos?

Suponha por exemplo, que queiramos estimar a renda mdia de pessoas que concluram um curso superior, no primeiro ano aps a formatura. Quantas rendas devemos incluir em nossa amostra?

Partindo da expresso da margem de erro E e resolvendo em relao ao tamanho da amostra n temos:


2

n =

Z /2 x E

O nmero da amostra deve ser um nmero inteiro, quando isso no ocorre devemos arredondar usando o nmero inteiro mais prximo para cima.

EXEMPLO Um Economista deseja estimar a renda mdia para o primeiro ano de trabalho de um bacharel por uma faculdade, que teve a feliz idia de fazer um curso de Estatstica. Quantos valores de renda devem ser tomados, se o Economista deseja ter 95% de confiana que a mdia amostral esteja a menos de R$ 20,00 da verdadeira mdia Populacional? suponha que saibamos por um estudo prvio, que, para tais rendas o desvio padro = R$ 100,00. SOLUO: Queremos determinar o tamanho da amostra n dado que = 0,05 (95% de confiana). Desejamos que a mdia Amostral esteja a menos de R$ 20,00 da mdia populacional de forma que o Erro E = 20. Supondo que = R$ 100,00, aplicamos a Formula
2 2

n =

Z /2 x E

1,96 x 100 20 -111 -

= 96.04

97 a

stras

Devemos, portanto, obter uma amostra de 97 rendas de primeiro ano, selecionadas aleatoriamente, de Bacharis de Faculdades que tenham feito um curso de estatstica.

Com tal amostra teremos 95% de confiana em que a mdia amostral X difira em menos de R$ 20,00 da verdadeira mdia populacional, XE < < X 20 < < + 20

-E

Quando no conhecemos o valor de podemos estimar o valor a partir pelo menos de 31 valores amostrais selecionando aleatoriamente em um estudo piloto, no caso anterior poderamos encontrar o valor R$ 2300,00 como a maior renda e R$ 1900,00 como a menor renda, o pode ser estimado:

= RT
4

= 400 =
4

100

2.3

ESTIMATIVA

DE

UMA

MDIA

POPULACIONAL,

PEQUENAS

AMOSTRAS
Agora veremos a estimativa da mdia populacional quando o tamanho n da m amostra pequeno, ou seja, n 30.

Neste caso: A melhor estimativa continua sendo a partir de X Usaremos intervalo de confiana a partir da curva normal com a mesma margem de erro do capitulo anterior.

Usaremos a distribuio

de tudent

t= X -
S n -112 -

O nmero de graus de liberdade para um conjunto de dados corresponde ao nmero de valores que podem variar apos terem sido impostas certas restries a todos os valores.

EXEMPLO Se 10 estudantes tm em um teste mdia 80, podemos atribuir valores arbitrrios a nove delas, mas a dcima fica determinada univocamente. A soma das 10 notas deve ser 800, de modo que a 10 deve ser igual a 800 menos a soma das 9 primeiras. Como as nove primeiras podem ser escolhidas arbitrariamente, dizemos que h nove graus de liberdade (n 1 ).

Propriedades importantes da distribuio

t de Student

1- A distribuio t de Student diferente, conforme o tamanho da amostra; 2- A

de Student tem a mesma forma geral simtrica (forma de sino) que a

distribuio normal, mas reflete a maior variabilidade que esperada em pequenas amostras; 3- A distribuio

de Student tem mdia

= 0 igual a distribuio normal

padronizada que tem mdia Z = 0. 4- O desvio padro da distribuio

t de Student varia com o tamanho da amostra t de Student

n mas superior a 1, ao contrrio que a destruio normal onde = 1. 5- medida que aumenta o tamanho n da amostra a distribuio se aproxima mais e mais da distribuio normal Padronizada.

Condies para o uso da distribuio t de Student

1- O tamanho da amostra pequeno n 30) 2- desconhecido 3- A populao original tem distribuio Normal

-113 -

Margem de erro para a estimativa de para n 30

E = t /2 x S n

onde t /2 tem n-1 graus de liberdade

Intervalo de confiana para estimativa de XE < <

-E

Onde

E = t /2 x S n

EXEMPLO: Testes Destrutivos

teste

de

coliso

de

carros

um

exemplo

muito

dispendioso

de

teste

destrutivo.Dificilmente pode-se fazer colidir mais de 30 carros, a fim de poder utilizar uma distribuio normal. uponhamos que tenhamos feito teste de coliso de 12 carros de um tipo A cujo preo de venda seja R$ 59.000,00 sob diversas condies que simulam colises tpicas.

A analise do 12 carros danificados resulta em custos de conserto que parecem ter distribuio em forma de sino com mdia de $ 26.000,00 e desvio padro S= $ 15.000,00. Determine: a- A melhor estimativa da mdia populacional , do custo de conserto de cada carro danificado. b- A estimativa intervalar de 95% de .

-114 -

SOLUO: a- A melhor estimativa pontual de o valor X neste caso $ 26.000,00. b- Usamos t de Student porque as condies bsicas esto satisfeitas: - n 30 n=12 porem conhecemos S= $ 15.000,00

- desconhecido Ento: E = t /2 x S n

A curva tem a forma de Sino

2,201 x 15000 = 9.530,61 12

Podemos agora escrever a estimativa intervalar de 95% de confiana: XE < <

-E

26.000 9.530,61 < < 26.000 + 9.530,61 16.490 < < 35.530 ou 9.530 26.000 ou (16.490;35.530)

Com base nesse resultado, temos 95% de confiana de que os limites 16.490 e 35.530 contem o valor da mdia populacional .

Esse exemplo real e trata de um carro americano, dos mais caros para consertar em caso de coliso.

Esta informao de grande importncia para as companhias de seguros.

-115 -

EXERCICIOS:

1- Ache os valores crticos tamanho da amostra n

/2 que corresponde ao grau de confiana e ao

a- 98% b- 98% c- 95% d- 90%

n=10 n=21 n=16 n=8

2- Dados os graus de confiana e os elementos amostrais, determine: I- Margem de erro II-O intervalo de confiana para a mdia . Admita que a populao tenha distribuio normal. a- Altura das alunas: 95% de confiana; n=10; X= 164; S= 4,5cm. b- Mdia das Notas: 99% de confiana; n=15; X= 7,0; S= 0,88. c- Notas de um teste: 90% de confiana; n= 16 X= 77,6; S= 14,2 d- salrio da Policia: 98% de confiana, n=19, X=R$1200,00; S= R$80,00

3- Determine corretamente se os intervalos de confiana so calculados com a distribuio normal padronizada ou com a distribuio

de Student. Em

teste de coliso feitos em 15 minivans Honda, os custos de conserto apresentam distribuio em forma de sino, com mdia de $ 1786 e desvio padro de $937.Construa um intervalo de confiana de 99% para o custo mdio de conserto para esse tipo de veiculo.

4- Suponha que tenhamos apenas 10 temperaturas do corpo Humano, para esses valores a mdia X = 98,44F e S= 0,30F. Construa um intervalo de confiana de 95% para a mdia de todas as temperaturas do corpo humano. Sabendo-se que essa distribuio normal.

-116 -

2.4 ESTIMATIVA DE UMA PROPORCO POPULACIONAL

Neste capitulo vamos abordar os mesmos trs conceitos estudados nos captulos anteriores. (1) Estimativa pontual (2) Intervalo de confiana (3) Determinao do tamanho da Amostra n. Nos captulos anteriores aplicamos esses conceitos a estimativa de uma mdia populacional ; neste capitulo vamos aplica-lo a Proporo Populacional P.

EXEMPLO: Uma companhia de seguros poderia se interessar na estimativa da proporo de motoristas embriagados.

Vamos trabalhar com a denominao p^ ( l-se p chapu) para a proporo amostral. Sabemos j que Q=1-P; podemos associar que Q^= 1-P^, desta forma:

P= Proporo Populacional P^= proporo Amostral

FORMULAS Estimativa Pontual A proporo Amostral P^ a melhor estimativa pontual da proporo Populacional P.

Margem de Erro da Estimativa P E= Z /2 P^Q^ n Intervalo de confiana (ou estimativa intervalar de uma proporo Populacional P) P^ - E < P < P^+E Eventualmente podemos dizer:
E

P = P^ Ou ( P^- E; P^+E)

-117 -

EXEMPLO: Os pesquisadores de opinio publica so atormentados por uma diversidade de fatores de confuso, como secretrias eletrnicas. Em uma pesquisa junto a 1068 Americanos, 673 informaram ter secretaria eletrnica com esses resultados amostrais determine: a- A estimativa pontual da proporo populacional de todos os Americanos que possuem secretaria eletrnica. b- A estimativa intervalar 95% da proporo Populacional de todos os Americanos que tem secretaria eletrnica

SOLUCAO: A- A estimativa pontual de P e:

P^ = X n Dai

= 673 = 0,630 1068 1 0,63 = 0,37

Q^= 1 P^

B- A construo do intervalo de confiana exige primeiro o calculo da margem de erro E. E= Z /2 P^Q^ n


1,96 x

0,63 x 0,37
1068

= 0,029

Podemos agora achar o intervalo de confiana usando P^= 0,63 e E= 0,029 P^ - E < P < P^+E 0,63 0,029 < P < 0,63 + 0,029

0,601 < P < 0,659

ou

60,1% < P < 65,9%

O resultado costuma ser apresentado da seguinte forma:

Entre os Americanos, a percentagem dos que tem secretaria eletrnica e estimada em 63%, com uma margem de erro de 2,9 pontos percentuais -118 -

C- Determinao do tamanho da amostra Se E= Z /2 P^Q^ n Podemos definir:

Quando se conhece uma estimativa de P^ n = Z /2 x P^ x E ^

Quando no se conhece uma estimativa de P^ n = Z /2 x 0,25 E

EXEMPLO: As companhias de seguros esto preocupadas com o fato de que o nmero crescente de telefones celulares resulte em um maior nmero de colises de veculos. Ento, por isso, esto pensando em cobrar um prmio maior para motoristas que usam celulares. Desejamos estimar com uma margem de erro de trs pontos percentuais 3%, a percentagem de motoristas que falam ao celular enquanto esto dirigindo. Supondo que se pretende um nvel de confiana de 95% nos resultados, Quantos motoristas devem ser pesquisados?

A- Suponha que tenhamos uma estimativa de P^ com base em estudos anteriores que mostrou que 18% dos motoristas falam ao telefone dirigindo. B- Suponha que no tenhamos qualquer informao que possa sugerir um valor de P^

a- P^= 0,18 Ao nvel de 95%

Q^ = 0,82 Z /2 = 1,96 0,03 ^ 1,96 x 0,18 x 0,82 0,03 -119 = 631 (arredondado para cima)

Margem de erro 3% n = Z /2 x P^x E

b- Quando no sabemos P^ usamos P^xQ^= 0,25 n = Z /2 x 0,25 E 1,96 x 0,25 0,03 = 1068 (arredondado para cima)

No caso da pesquisa eleitoral Determine o tamanho da amostra necessria para saber a preferncia do eleitorado com um nvel de confiana de 95% e admitindo um erro de mais ou menos 2,2 pontos percentuais.

SOLUO:

Como desconhecemos as propores P^ dos candidatos usamos a frmula: n = Z /2 x 0,25 E 1,96 x 0,25 0,022 = 1985 (arredondado para cima)

a- Calcular o mesmo exerccio para um nvel de confiana de 99% com margem de erro de 2 pontos percentuais.

b- Calcular o mesmo exerccio para um nvel de confiana de 90% com margem de erro de 2 pontos percentuais.

Note que essas frmulas no incluem o tamanho da populao N, neste caso e irrelevante.

A maioria das pesquisas de opinio apresentadas em jornais, revistas e tv envolvem amostras com tamanho de 1000 a 2000 elementos.

-120 -

EXERCICIOS:
1- Usando uma amostra para estimar uma proporo populacional P. Determine a margem de erro que corresponde aos valores dados n, X, e o grau de confiana:

a- n= 800 b- n= 4275 c- n= 1400 d- n= 887

X=600 X=2576 X=420 X=209

grau de confiana grau de confiana grau de confiana grau de confiana

95% 98% 99% 90%

2- Utilize os dados amostrais e o grau de confiana para construir uma estimativa intervalar para a proporo populacional P:

a- n= 800 b- n= 2000 c- n= 2475 d- n= 5200

X=600 X=300 X=992 X=1024

grau de confiana grau de confiana grau de confiana grau de confiana

95% 99% 90% 98%

3- Utilize os dados abaixo para determinar o tamanho da amostra necessria para estimar uma proporo ou percentagem populacional?

a- Margem de erro 0,02, nvel de confiana 95% P^ e Q^ desconhecidos.

b- Margem de erro 0,01, nvel de confiana 90% P^ e Q^ desconhecidos

c- Margem de erro 4 pontos percentuais, nvel de confiana 99%, P^ estimado em 0,20 com base em estudos anteriores.

d- Margem de erro 2 pontos percentuais, nvel de confiana 97%, P^ estimado em 0,85 com base em estudos anteriores.

4- A Ita seguros deseja estimar a percentagem dos motoristas que trocam fita ou CD enquanto dirigem, uma amostra de 850 motoristas acusou 544 que trocam fitas ou CD quando dirigem. -121 -

a- Determine a estimativa pontual da percentagem de todos os motoristas que trocam fitas ou Cd quando dirigem. b- Determine uma estimativa intervalar de 90% da percentagem de todos os motoristas que trocam fitas ou Cd.

5- Selecionados aleatoriamente e pesquisados 500 estudantes universitrios verificou/se que 135 deles tem computadores pessoais.

A- Determine a estimativa pontual da verdadeira proporo populacional de todos os universitrios que tem computador pessoal. B- Determine um intervalo de confiana de 95% para a verdadeira proporo de todos os universitrios que tem computador pessoal.

-121 -

2.5 ESTIMATIVA DE UMA VARIANA POPULACIONAL


Neste capitulo mantendo a linha de estudos dos captulos anteriores usaremos agora a VARIANCA Populacional , uo ao desvio padro . Para isso usaremos a distribuio Qui-Quadrado = (n 1) S n= Tamanho da Amostra S = Variana Amostral = Variana da populao Denotamos Qui-Quadrado por . Para achar os valores crticos dos valores Qui-Quadrado recorremos Tabela 1 a seguir. A distribuio Qui-Quadrado e determinada pelo nmero de graus de liberdade< neste capitulo utilizamos (n-1) graus de liberdade. Propriedades da distribuio da estatstica Qui-Quadrado. 1- A distribuio Qui-Quadrado no e simtrica ao contrario das distribuies Normal e

de Student. Na medida que aumenta o nmero de graus de liberdade, a

distribuio vai se tornando menos assimtrica.

GL=10

GL=20

10

15

20

25 -122 -

30

40

45

2- Os valores podem ser zero ou positivos nunca negativos.

3- A uma distribuio Qui-Quadrado diferente para cada nmero de graus de liberdade. medida que eles aumentam a distribuio tende Normal. Tabela 1 Cada valor critico corresponde a uma rea dada na linh superior da Tabela, e essa rea representa a regio total localizada a direita do valor critico. EXEMPLO: Determine os valores crticos de que definem regies criticas contendo uma rea de 0,025 em cada cauda. Suponh que o tamanho da amostra seja 10, de modo que o nmero de graus de liberdade 10-1= 9. soluo: Conforme a figura abaixo, obtem-se o valor critico direita = 19,023) diretamente, localizando 9 na coluna de graus de liberdade a Esquerda e 0,025 na parte superior. O valor critico = 2,70 a esquerda mais uma vez correspondente a 9 na coluna de graus de liberdade mas devemos localizar 0,975 (1- 0,025) na parte superior, por que os valores no topo so sempre reas direita do valor critico. Verifique na figura abaixo, que a rea total a direita de = 2,70 e 0,975.

0,025

0,025

L=2,7 Este valor corresponde na coluna esquerda 9 graus de liberdade e 0,975 na linh superior GL=9) -123 -

R =19,023 Este valor corresponde na coluna esquerda 9 graus de liberdade e 0,025 na linh superior.

Estimadores de A variana Amostral S e a melhor estimativa pontual da variana populacional . Embora S seja a melhor estimativa de no podemos avaliar quo boa e essa

estimativa, portanto estabelecemos uma estimativa intervalar mais reveladora. Intervalo de confiana (ou estimativa Intervalar) para a variana populacional . (n-1) R < < n-1) L

Dessa expresso deferimos a estimativa Intervalar para o desvio padro Populacional atravs da raiz quadrada de cada componente.

(n-1) R

<

<

n-1) L

Com uma rea total dividida igualmente entre as extremidades de uma distribuio Qui-Quadrado, L denota o valor critico da extrema esquerda e R denota o valor critico da extrema direita. Outra conotao: L= R = 1 - /2 /2

EXEMPLO: Uma confeitaria fabrica bombons que so embalados em pacotes com 12 unidades pesando no total 420 g. Se a variao dos bombons e muito grande, algumas caixas tero peso a menos (prejudicando o consumidor) e outras tero peso a mais (diminuindo o lucro). Este problema pode ser evitado se os bombons tiverem um peso mdio de 35 gramas e um desvio padro de 0,60 gramas ou menos. Selecionam-se aleatoriamente, na linh de produo, doze bombons que so pesados, dando os resultados a seguir: 35,8 35,0 36,8 36,1 34,2 35,2 -124 36,6 35,0 33,6 34,2

Construa dois intervalos de confiana de 95%, um para e outro para , e determine se o processo esta com problemas.

Calcula-se: X = 35,25

n-1 = 1,070 superior ao desejado 0,60.

Passamos a construo do intervalo de confiana de Com uma amostra de 10 valores, temos 9 graus de liberdade. Com o grau de confiana de 95%, dividimos = 0,05 igualmente entre as duas caudas de distribuio e localizamos os valores 0,975 e 0,25 na linh superior. Os valores crticos de R e L na tabela so: L = 2,70 R = 19,023 X = 35,25

n-1 = 1,070
n = 10 Aplicamos a frmula (n-1) R < < n-1) L < (10 1) 1,07 2,70 3,816

(10 1) 1,07 < 19,023 0,5416 ou 0,736 < <

<

<

1,953

Com base nesses resultados parece que o desvio padro populacional e sempre superior ao desejado = 0,60 mostrando que o peso dos bombons deve ser mais consistente. Deve-se controlar melhor o processo.

-125 -

EXERCICIOS:
1- Ache os valores crticos tamanho da amostra dados: L e R que correspondem ao grau de confiana e ao

abaa-

95% 90% 99% 95%

n = 26 n = 60 n = 17 n = 50

2- Use o grau de confiana e os dados amostrais indicados para achr um intervalo de confiana para o desvio padro populacional . Em cada caso admita que a populao tenh distribuio normal.

a- Altura das alunas: 95% de confiana, n = 10, X = 164 b- Mdias das notas: 99% de confiana, n = 15, X = 7,0

S = 4,5 S = 0,88

c- Notas de um teste: 95% de confiana, n = 16, X = 77,6 S = 14,2 d- salrio da Policia: 92% de confiana, n = 19, X = R$ 1200,00 S= R$ 80,00

3- Suponh uma pesquisa na Uniso junto aos formandos do curso de Administrao, sobre o tempo gasto para se formarem. A mdia de 5,15 anos e o desvio padro 1,68 anos, Suponh que a amostra seja 100 alunos. Com base nesses dados amostrais, construa o intervalo de 99% de confiana para o desvio padro do tempo gasto por todos os formandos?

-126 -

Tabela 1

Distribuio Normal Padronizada: coeficiente z (rea de 0 a z)

Z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9

0,00 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,4999

0,01 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2611 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,4991 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,4999

0,02 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,4991 0,4994 0,4995 0,4997 0,4998 0,4999 0,4999 0,4999 0,4999

0,03 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,4991 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,4999

0,04 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2995 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,4999

0,05 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,4999

0,06 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,4999

0,07 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,4992 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,4999

0,08 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2518 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999

0,09 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999

Tabela 2
Graus de liberdade 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 0,10 (10%) 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,371 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,296 1,289 1,282 0,05 (5%) 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,658 1,645

Distribuio de Student (t)


(rea na cauda superior) 0,025 (2,5%) 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,980 1,960 0,01 (1%) 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326 0,005 0,0025 0,001 0,0005 (0,5%) (0,25%) (0,1%) (0,05%) 63,657 127,320 318,310 636,620 9,925 14,089 22,327 31,598 5,841 7,453 10,214 12,924 4,604 5,598 7,173 8,610 4,032 4,773 5,893 6,869 3,707 4,317 5,208 5,959 3,499 4,029 4,785 5,408 3,355 3,833 4,501 5,041 3,250 3,690 4,297 4,781 3,169 3,581 4,144 4,587 3,106 3,497 4,025 4,437 3,055 3,428 3,930 4,318 3,012 3,372 3,852 4,221 2,977 3,326 3,787 4,140 2,947 3,286 3,733 4,073 2,921 3,252 3,686 4,015 2,898 3,222 3,646 3,965 2,878 3,197 3,610 3,922 2,861 3,174 3,579 3,883 2,845 3,153 3,552 3,850 2,831 3,135 3,527 3,819 2,819 3,119 3,505 3,792 2,807 3,104 3,485 3,767 2,797 3,091 3,467 3,745 2,787 3,078 3,450 3,725 2,779 3,067 3,435 3,707 2,771 3,057 3,421 3,690 2,763 3,047 3,408 3,674 2,756 3,038 3,396 3,659 2,750 3,030 3,385 3,646 2,704 2,971 3,307 3,551 2,660 2,915 3,232 3,460 2,617 2,860 3,160 3,373 2,576 2,807 3,090 3,291

Tabela 3

Distribuio Qui Quadrado (rea direita do valor crtico) 99,5% 0,5% = 99% de confiana 99% 1% = 98% de confiana 97,5% 2,5% = 95% de confiana 90% de confiana 80 %

Graus de Liberdad e 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100

99,5% 0,995 0,010 0,072 0,207 0,412 0,676 0,989 1,344 1,735 2,156 2,603 3,074 3,565 4,075 4,601 5,142 5,697 6,265 6,844 7,434 8,034 8,643 9,260 9,886

99% 0,99 0,020 0,115 0,297 0,554 0,872 1,239 1,646 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542

97,5% 0,975 0,001 0,051 0,216 0,484 0,831 1,237 1,690 2,180 2,700 3,247 3,816 4,404 5,009 5,629 6,262 6,908 7,564 8,231 8,907 9,591 10,283 10,982

95% 0,95 0,004 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,892 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,338 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493 26,509 34,764 43,188 51,739 60,391 69,126 77,929

90% 0,90 0,016 0,211 0,584 1,064 1,610 2,204 2,833 3,490 4,168 4,865 5,578 6,304 7,042 7,790 8,547 9,312 10,085 10,865 11,651 12,443 13,240 14,042 14,848 15,659 16,473 17,292 18,114 18,938 19,768 20,559 29,051 37,689 46,459 55,329 64,278 73,291 82,358

10% 0,10 2,706 4,605 6,251 7,779 9,236 10,645 12,017 13,362 14,684 15,987 17,275 18,549 19,812 21,064 22,307 23,542 24,769 25,989 27,204 28,412 29,615 30,813 32,007 33,196 34,382 35,563 36,741 37,916 39,087 40,256 51,805 63,167 74,397 85,527 96,578 107,565 118,498

5% 0,05 3,801 5,991 7,815 9,488 11,071 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 26,296 27,587 28,869 30,144 31,410 32,671 33,924 35,172 36,415 37,652 38,885 40,113 41,337 42,557 43,773 55,758 67,505 79,082 90,531 101,879 113,145 124,342

2,5% 0,025 5,024 7,378 9,348 11,143 12,833 14,449 16,013 17,535 19,023 20,483 21,920 23,337 24,736 26,119 27,488 28,845 30,191 31,526 32,852 34,170 35,479 36,871 38,076 39,364 40,646 41,923 43,194 44,461 45,722 46,979 59,342 71,420 83,298 95,023 106,629 118,136 129,561

1% 0,01 6,635 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 38,932 40,289 41,638 42,980 44,314 45,642 46,963 48,278 49,588 50,892 63,691 76,154 88,379 100,425 112,329 124,116 135,807

0,5% 0,005 7,879 10,597 12,838 14,860 16,750 18,548 20,278 21,955 23,589 25,188 26,757 28,299 29,819 31,319 32,801 34,267 35,718 37,156 38,582 39,997 41,401 42,796 44,181 45,559 46,928 48,290 49,645 50,993 52,336 53,672 66,766 79,490 91,952 104,215 116,321 128,299 140,169

10,196 11,689 10,856 12,401

10,520 11,524 13,120 11,160 12,198 13,844 11,808 12,879 14,573 12,461 13,565 15,308 13,121 14,257 16,047 13,787 14,954 16,791 20,707 22,164 24,433 27,991 29,707 32,357 35,534 37,485 40,482 43,275 45,442 48,758 51,172 53,540 57,153 59,196 61,754 65,647 67,328 70,065 74,222

Bibliografia Bibliografia bsica FREUND, John E. e SIMON, Gary A. Estatstica aplicada economia, administrao e contabilidade. Porto Alegre: Bookman, 2000. TRIOLA, Mrio F. Introduo estatstica. Rio de Janeiro: LTC, 1999. Bibliografia complementar KUME, Hitoshi, Mtodos Estatsticos para a Melhoria da Qualidade. So Paulo:Gente,1993. RAMOS A.W., CEP para Processos Contnuos e em Bateladas. So Paulo:E.Blucher, 2000. BUSSAB, Wilton O e MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva,2002. DOWNING Douglas e CLARK Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2000. MILONE, Giuseppe e ANGELINI, Flvio. Estatstica aplicada. So Paulo: Atlas, 1995. KAZMIER, L.B. Estatstica aplicada Economia e Administrao . So Paulo: McGraw-Hill, 1982. SPIEGEL, Murray R. Estatstica. So Paulo: Makron Books, 1993. (519.5 S734e)

-130 -

Anda mungkin juga menyukai