Anda di halaman 1dari 48

ORIGEM, DESENVOLVIMENTO E CONCEITO DA ESTATSTICA.

Considerada como sendo o ramo da matemtica aplicada, a estatstica lida com os dados numricos relativos a fenmenos sociais ou naturais, com o objetivo de medir ou estimar a extenso desses fenmenos e verificar suas inter-relaes. A palavra estatstica usada em dois sentidos: estatstica e estatsticas, quando est sob a forma de plural, referem-se a dados numricos, mesmo aquele obtido por uma simples contagem. Quando dizemos, por exemplo, que temos muitas estatsticas sobre a cidade de Belm, significa que temos, em forma de nmeros, vrias informaes sobre a cidade. Quando empregada no singular, estatstica significa o conjunto de processos usados na condensao e anlise de dados numricos. A origem etimolgica de Estatstica vem do vocbulo latino Status e do seu desenvolvimento que germinou h mais de 40 sculos entre os povos orientais, mais especificamente na China de Confcio, em cujo livro sagrado CHOUKING se fizeram constar os dados estatsticos do grande imprio de outrora. Desde as administraes antigas, a estatstica sempre se faz presente a favor do estado, a ponto de herdar o nome do vocbulo Status, que quer dizer Estado, servindo de apoio, pelo seu aspecto quantitativo, para uma administrao consciente, quer fosse a estado de paz quer de guerra, em cujos campos ela prestava o seu trabalho, em consonncia com a imagem fria, mas verdadeira dos nmeros que sempre lhe coube analisar, no campo dos fenmenos coletivos, econmicos sociais ou cientficos, geralmente com a finalidade de controle fiscal ou de segurana nacional. Assim, reportando-nos a antiguidade, percebemos que em vrias civilizaes j se registravam o nmero de habitantes, nascimentos, bitos, faziam estimativas pertinentes s riquezas individuais e sociais, cobravam impostos etc.., podendo todas essas aes ser chamadas de estatsticas. A partir do sculo XVI, comearam a surgir sistematicamente as primeiras anlises de fatos sociais, como, por exemplo, batizados, casamentos, funerais, originando assim as primeiras tbuas e tabelas e, conseqentemente os primeiros nmeros relativos. Entretanto, a origem da estatstica cientifica teve inicio na metade do sculo XVII, quando passou a ser considerada como uma disciplina autnoma tendo como objetivo a descrio das coisas do Estado, e como fundador Herman Conring (16001681). Seus seguidores foram, dentre outros, M. Schymeitzel (16791767) e Godofredo Achenwall (17191782), chegando mais tarde este ltimo a superar a fama do prprio Coring. Foi graas a Godofredo Achenwall que a estatstica firmou-se como cincia determinando o seu objetivo e suas relaes com as demais. Paralelamente ao desenvolvimento da estatstica, como disciplina cientifica, mas de forma independente, desenvolveu-se ainda neste sculo, o clculo das probabilidades. Seus iniciadores foram os matemticos Fermat e Pascal, que iniciaram seus estudos com o objetivo de tentar resolver problemas relacionados a jogos de azar. Alm deles, outros matemticos, e posteriormente os do sculo XVIII, interessaram-se por este tipo de estudo, destacando-se principalmente Tiago Bernoulli (16541705), responsvel pelo teorema que leva o seu nome,

40

permitindo assim estruturar o calculo das probabilidades como disciplina orgnica. No final de sculo XVIII e inicio do XIX, o calculo das probabilidades definitivamente estruturado, graas ao incessante trabalho de Laplace, e a partir da duas disciplinas, clculo das probabilidades e estatsticas, que at ento se encontravam separadas, fundiram-se. Estatisticamente falando, o sculo XIX, marcado pela implantao do mtodo dos mnimos quadrados, processo matemtico que tinha como objetivo resolver fundamental da teoria dos erros, desenvolvido essencialmente alm de Laplace, por Gauss e Bessel. Ainda com relao era moderna, vale aqui ressaltar as teorias desenvolvidas por Galton e Pearson, cujos trabalhos marcam o ponto de partida das correntes de investigao que levaram a estatstica ao alto grau de desenvolvimento em que se encontraram at hoje. Os dois atuaram sucessivamente, onde o primeiro merece seu destaque por ter criado, entre outras teorias a de Regresso, que juntamente com a de Correlao (Inferncia Estatstica) criada Pearson constituram um dos campos de maior aplicabilidade dentro da estatstica. No decorrer do sculo XX, a obra de Karl Pearson teve destacados seguidores, entre os quais podemos destacar Ronald A Fisher, notadamente reconhecido como a figura mais proeminente da estatstica de todos os tempos, principalmente por ter deixado em seu legado, desenvolvida e estruturada a teoria das pequenas amostras e estimativas, como tambm, a formulao e aplicao do ndice de Fisher. Entretanto, no perodo de 19201940, que Fisher torna a estatstica extremamente fecunda, pois alm das contribuies anteriores, preocupou-se ainda com o fato de que em situaes experimentais, uma varivel era explicada por varias outras, correlacionadas entre si, o que tornava impossvel o estudo isolado de cada uma. Para contornar esse problema desenvolveu na Estao Experimental de Rothamstead, Inglaterra, esquemas experimentais de modo que os efeitos pudessem ser estudados independentemente e, no mesmo perodo, estendeu e deu idia mais precisa tcnica chamada Anlise de Variao, at hoje uma das mais poderosas utilizadas na Estatstica. No final do sculo XIX e meados do XX, um novo instrumento estatstico, denominado Nmeros-ndices, passa a ser de grande utilidade definida entre outros autores como sendo uma Expresso utilizada para medir a relao entre dois estados de uma varivel ou de um grupo de variveis suscetvel de variar no tempo ou no espao. Chega-se assim, a era contempornea, e nitidamente percebe-se que em todas as naes se trabalha intensamente nas reas de investigao e aplicao, o que faz com que a estatstica seja ampliada diariamente, aperfeioando-se cada vez mais nos seus diversos campos de atuao. Dessa forma, a estatstica hoje aplicada em diversas reas destacando-se principalmente nas seguintes: industrial, recursos humanos, demografia, Universidades e instituies de pesquisa, marketing e analise de mercado, e finalmente, na rea financeira. Na rea industrial, a estatstica pode ser utilizada no planejamento industrial, desde os estudos de implantao de fabrica at a avaliao das necessidades de expanso industrial; na pesquisa e desenvolvimento de tcnicas, produtos e equipamentos; nos testes de produtos; no controle de qualidade e da quantidade; no controle de estoques; na avaliao de desempenho das operaes; nas analises de investimentos operacionais; nos estudos de produtividade; na previso de acidentes de trabalho; no planejamento e manuteno de maquinas; etc.

40

Pertinente rea de recursos humanos, a estatstica encontra-se presente em pesquisas de compatibilizao entre os conhecimentos e habilidades dos empregados; nos estudos salariais e necessidades de treinamento; nas propostas de planos de avaliao de desempenho do quadro funcional, bem como na elaborao plano de previdncia complementar e de fundos de penso, etc. J na rea de demografia, pode-se atravs da estatstica, estudar a evoluo e as caractersticas da populao; estabelecer tbuas de mortalidade; analisar fluxos migratrios; estabelecer nveis e padres para testes clnicos; planejar e realizar experimentos com grupo de controle para avaliao de tratamentos; desenvolver estudos sobre a distribuio e incidncia de determinadas doenas, etc. Com relao universidade e instituies de pesquisas, a sua aplicao pode estar voltada a ministrar disciplina relacionada estatstica, pesquisando e desenvolvendo novas metodologias e analise estatstica para os mais variados problemas prticos e tericos, assessorando pesquisadores de outras reas, dando-lhes suporte cientifico para que consigam tomar decises acertadas dentro da variabilidade intrnseca de cada problema, auxiliando-os na escolha da metodologia cientifica a ser adotada, no planejamento da pesquisa, na escolha qualificada dos dados, na analise das respostas etc. Na rea de marketing e analise de mercado, a estatstica das condies de se poder traar um perfil adequado para trabalhar na monitorao e analise de mercado, no sistema de informaes de marketing, na prospeco e avaliao de oportunidades, na analise de desenvolvimento de produtos, nas decises relativas a preos, na previso de vendas, na logstica na distribuio e nas decises de canais, no desenvolvimento de campanhas publicitrias, etc. E, finalmente na rea financeira, onde por meio da estatstica pode-se realizar analises atuariais, na avaliao e na seleo de investimentos, no estudo e no desenvolvimento de modelos financeiros, no desenvolvimento de informaes gerenciais; na definio, na analise de fluxo de caixa; na avaliao e na projeo de indicadores financeiros; na anlise das demonstraes contbeis; no desenvolvimento e no acompanhamento de produtos e servios financeiros, etc. Considera-se para efeito didtico a diviso da estatstica em dois grupos: estatstica descritiva e estatstica indutiva. A Estatstica Descritiva tem como objeto descrever os dados observados, visando o registro atravs de tabelas e ou grficos. A Estatstica Indutiva visa estabelecer concluses sobre populaes baseando-se em suas amostras, atravs do clculo da probabilidade. Diante do exposto, definir estatstica no tarefa das mais fceis, pois os conceitos fundamentais no tm definio explcita ou, se tm, no suficientemente clara para dar-nos idia acabada de seu significado, assim, nos convm, pois em conceitu-la de forma generalizada, como sendo um mtodo de observao, descrio, mensurao e interpretao de fenmenos coletivamente tpicos, utilizados essencialmente para tomada de decises.

40

EXERCCIO (0,50 ponto) 12345Faa uma sntese da evoluo da estatstica Atualmente, quais so as reas em que a estatstica aplicada? Didaticamente, como podemos classificar a estatstica? O que voc entende por estatstica? Qual a diferena existente entre estatstica descritiva e estatstica indutiva?

METODO ESTATSTICO O MTODO CIENTFICO: Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por necessidades prticas, sem aplicao de um mtodo. Atualmente, quase todo acrscimo de conhecimento resulta da observao e do estudo. Se bem que muito desse conhecimento possa ter sido observado inicialmente por acaso, a verdade que desenvolvemos processos cientficos para seu estudo e para adquirirmos tais conhecimentos. Podemos dizer, ento, que Mtodo um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Dos mtodos cientficos, vamos destacar o mtodo experimental e o estatstico. O MTODO EXPERIMENTAL: O mtodo experimental consiste em manter constantes todas as causas (fatores), menos urna, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. o mtodo preferido no estudo da Fsica, da Qumica etc. O MTODO ESTATSTICO: Muitas vezes temos necessidade de descobrir fatos em um campo em que o mtodo experimental no se aplica (nas cincias sociais), j que os vrios fatores que afetam o fenmeno em estudo no podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Como exemplo, podemos citar a determinao das causas que definem o preo de uma mercadoria. Para aplicarmos o mtodo experimental, teramos de fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preo. Porm, seria necessrio que no houvesse alterao nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salrios, o gosto dos consumidores deveria permanecer constante, seria necessria a fixao do nvel geral dos preos das outras necessidades etc. Mas isso tudo impossvel. Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos preciso, denominado mtodo estatstico. O mtodo estatstico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variaes e procurando determinar, no resultado final, que influncias cabem a cada uma delas. A ESTATSTICA Exprimindo por meio de nmeros as observaes que se fazem de ele- mentos com, pelo menos, uma caracterstica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados referentes a esses elementos.

40

Podemos dizer, ento, que a Estatstica uma parte da Matemtica Aplicada que fornece mtodos para a coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A coleta, a organizao e a descrio dos dados esto a cargo da Estatstica Descritiva, enquanto a anlise e a interpretao desses dados ficam a cargo da Estatstica Indutiva ou Inferencial. Em geral, as pessoas, quando se referem ao termo estatstica, o fazem no sentido da organizao e descrio dos dados (estatstica do Ministrio da Educao, estatstica dos acidentes de trfego etc.), desconhecendo que o aspecto essencial da Estatstica o de proporcionar-mtodos inferenciais, que permitam concluses que transcendam os dados obtidos inicialmente. Assim, a anlise e a interpretao dos dados estatsticos tornam possvel o diagnstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condies de funcionamento, produtividade), a formulao de solues apropriadas e um planejamento objetivo de ao. PROCESSOS ESTATSTICOS DE ABORDAGEM Quando solicitados a estudar um fenmeno coletivo podemos optar entre os seguintes processos estatsticos: Estimao e censo. CENSO: uma avaliao direta de um parmetro, utilizando-se todos os componentes da populao. ESTIMAO: uma avaliao indireta de um parmetro, com base em um estimador atravs do clculo de probabilidades. Propriedades Principais do Censo: Admite erro processual zero e tem confiabilidade 100%. caro. lento. quase sempre desatualizado. Nem sempre vivel. Admite erro processual positivo e tem confiabilidade menor que 100%. barata. rpida. atualizada. sempre vivel.

Propriedades Principais da Estimao:

COMENTRIO: estatisticamente, a preciso de um valor numrico avaliada atravs do binmio: confiana e erro processual, se admitirmos que possam retirar do Censo todo tipo de erro de natureza humana (erro de clculo de avaliao, de anotao etc.), restar apenas outro tipo de erro devido ao procedimento empregado. Este erro chamado erro processual No caso de um Censo, o erro processual zero, pois avaliamos um por um, todos os elementos componentes da Populao.

40

Como o erro processual na avaliao zero, a confiabilidade no parmetro obtido 1 00%. A preciso, no Censo total. Na estimao, como avaliamos apenas parte e no todos os elementos que compem a populao admitirmos um erro processual positivo na avaliao do valor numrico e por conseqncia uma confiabilidade menor que 1 00%, sendo, portanto, menos precisa que o Censo. Como o nmero de elementos que compem uma amostra consideravelmente menor que o nmero de elementos que compem uma Populao, a Estimao sempre bem mais barata que o Censo, concluda mais rapidamente que o Censo e, portanto, mais atualizada.Se a maneira de avaliar um elemento um teste destrutivo, o Censo se torna um processo invivel, pois destruiria a populao objeto do estudo. Entretanto, na maioria das vezes em que o Censo considerado invivel por razes econmicas e de tempo. Na sociedade moderna, as maiorias dos problemas exigem decises de curto prazo. Por isso, as informaes estatsticas teis a resoluo destes problemas devem ser obtidas rapidamente. Pela rapidez e facilidade da obteno destas informaes, a estimao tem sido cada vez mais utilizada como procedimento estatstico. FASES DO MTODO ESTATSTICO Podemos distinguir no mtodo estatstico as seguintes fases: COLETA DE DADOS Aps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do fenmeno coletivamente tpico ( aquela que no apresenta regularidade na observao de casos isolados, mas na massa de observaes) que se quer pesquisar, damos incio coleta dos dados numricos necessrios sua descrio. A coleta pode ser direta e indireta. A coleta direta quando feita sobre elementos informativos de registro obrigatrio (nascimentos, casamentos e bitos, importao e exportao de mercadorias), elementos pertinentes aos pronturios dos alunos de uma escola ou, ainda, quando os dados so coletados pelo prprio pesquisador atravs de inquritos e questionrios, como o caso das notas de verificao e de exames, do censo demogrfico etc. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: -contnua (registro) - quando feita continuamente, tal como a de nascimentos e bitos e a de freqncia dos alunos s aulas; -peridica - quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliaes mensais dos alunos; -ocasional - quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergncia, como no caso de epidemias que as- solam ou dizimam rebanhos inteiros. A coleta se diz indireta quando inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos por uma coleta direta. CRTICA DOS DADOS

40

Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis falhas e imperfeies, a fim de no incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados. A crtica externa quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe foram feiras; interna quando visa observar os elementos originais dos dados da coleta. APURAO DOS DADOS O entendimento e compreenso de grande quantidade de dados atravs da simples leitura de seus valores individuais uma tarefa extremamente rdua e difcil mesmo para o mais experimentado pesquisador. A Estatstica descritiva apresenta duas formas bsicas para a reduo do nmero de dados com os quais devemos trabalhar, chamadas varivel discreta e varivel contnua. Nada mais do que a soma e o processamento dos dados obtidos e a disposio mediante critrios de classificao. Pode ser manual, eletromecnica ou eletrnica. EXPOSIO OU APRESENTAO DOS DADOS Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou grficos), tornando mais fcil o exame daquilo que est sendo objeto de tratamento estatstico e ulterior obteno de medidas tpicas. Uma representao grfica permite uma visualizao instantnea de todos os dados. Os grficos, quando bem representativos, tornam-se importantes instrumentos de trabalho. ANLISE DOS RESULTADOS Como j dissemos, o objetivo ltimo da Estatstica tirar concluses sobre o todo (populao) a partir de informaes fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatstica Descritiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Indutiva ou lnferencial, que tem por base a induo ou inferncia, e tiramos desses resultados concluses e previses. ainda atributo da Estatstica Descritiva a obteno de algumas informaes como mdias, propores, disperses, tendncias, ndices, taxas, coeficientes, que facilitam a descrio dos fenmenos observados. Isto encerra as atribuies da Estatstica Descritiva. Completando o processamento estatstico, no caso de uma Estimao, a Estatstica lndutiva estabelece parmetros a partir de estimadores usando o clculo de probabilidade. Esta ltima etapa ser desenvolvida posteriormente. A ESTATSTICA NAS EMPRESAS No mundo atual, a empresa unia das vigas-mestras da Economia dos povos. A direo de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decises, e o conhecimento e o uso da Estatstica facilitaro seu trplice trabalho de organizar, dirigir e controlar a empresa. Por meio de sondagem, de coleta de dados e de recenseamento de opinies, podemos conhecer a realidade geogrfica e social, os recursos naturais, humanos e financeiros disponveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcanados a curto, mdio ou longo prazos.

40

A Estatstica ajudar em tal trabalho, como tambm na seleo e organizao da estratgia a ser adotada no empreendimento e, ainda, na escolha das tcnicas de verificao e avaliao da quantidade e da qualidade do produto e mesmo dos possveis lucros e/ou perdas. Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho. O esquema do planejamento o plano, que pode ser resumido, com auxlio da Estatstica, em tabelas e grficos, que facilitaro a compreenso visual dos clculos matemtico-estatsticos que lhes deram origem. O homem de hoje, em suas mltiplas atividades, lana mo de processos e tcnicas estatsticos, e s estudando-os evitaremos o erro das generalizaes apressadas a respeito de tabelas e grficos apresentados em jornais, revistas e televiso, freqentemente cometido quando se conhece apenas "por cima" um pouco de Estatstica. EXERCCIOS (0,50 ponto)

1)
2) 3) 4) 5) 6) 7) 8) 9) 10) 11) 12) 13) 14) 15) 16) a. b. c. d. e.

Complete: O mtodo experimental o mais usado por cincias como: As cincias humanas e sociais, para obterem os dados que buscam, lanam mo de que mtodo? O que Estatstica? Quais so os processos estatsticos de abordagem para o estudo de um fenmeno coletivo? O que Censo? O que Estimao? Explique as propriedades principais do Censo Para voc, o que coletar dados? Para que serve a crtica dos dados? O que apurar dados? Como podem ser apresentados ou expostos os dados? O que Estatstica Descritiva e quais so suas tarefas? O que Estatstica lndutiva? As concluses, as inferncias pertencem a que parte da Estatstica? Cite trs ou mais atividades do planejamento empresarial em que a Estatstica se faz necessria. O mtodo estatstico tem como um de seus fins: estudar os fenmenos estatsticos. estudar qualidades concretas dos indivduos que formam grupos. determinar qualidades abstratas dos indivduos que formam grupos. determinar qualidades abstratas de grupos de indivduos. estudar fenmenos numricos.

VARIVEL Num estudo estatstico parte-se de um conjunto. Cada elemento desse conjunto (unidade estatstica) tem muitas caractersticas: as variveis ou caracteres estatsticos. Estas variveis podem ser qualitativas ou quantitativas (discretas ou contnuas). Varivel qualitativa- Representa a informao que identifica alguma qualidade, categoria ou caracterstica, no susceptvel de medida, mas de classificao, assumindo vrias modalidades. Ex.: Cor dos olhos de uma pessoa.

40

Varivel quantitativa- aquela a que possvel atribuir uma medida e que se apresenta com diferentes intensidades ou valores. Pode ser discreta ou contnua.

Varivel quantitativa discreta- Varivel cujos valores se podem ordenar de tal modo que entre dois valores consecutivos no possa existir um valor intermdio. Ex.: Nmero de irmos de uma pessoa. Varivel quantitativa contnua- varivel que pode tomar qualquer valor de um intervalo. Ex.: Altura de uma pessoa. POPULAO OU UNIVERSO ESTATSTICO qualquer conjunto que rena todos os elementos que tenham pelo menos uma caracterstica comum, objeto de estudo. o conjunto de entes portadores de, pelo menos, uma caracterstica comum denominamos populao estatstica ou universo estatstico. necessrio, existir um critrio de constituio da populao (universo estatstico), vlido para qualquer pessoa, no tempo ou no espao. Por isso, quando pretendemos fazer uma pesquisa entre os alunos das escolas de 1grau, precisamos definir quais so os alunos que formam o universo: os que atualmente ocupam as carteiras das escolas, ou devemos incluir tambm os que j passaram pela escola? claro que a soluo do problema vai depender de cada caso em particular. Na maioria das vezes, por impossibilidade ou inviabilidade econmica ou temporal, limitamos as observaes referentes uma determinada pesquisa a apenas uma parte da populao AMOSTRA qualquer subconjunto finito e no vazio de uma populao. A amostra deve possuir as mesmas caractersticas bsicas da populao, no que diz respeito ao fenmeno que desejamos pesquisar para garantir a representatividade da populao. AMOSTRAGEM: o mtodo de seleo dos elementos de uma populao, de modo a se obter uma amostra representativa da populao. Alguns aspectos da representatividade de uma amostra: a) b) c) A amostra no deve ter preconceito ou tendncia; Cada item da populao deve ter uma chance conhecida de ser selecionada; Seu tamanho deve ser grande o bastante de modo a minimizar o risco da amostra ser atpica.

EXERCCIOS(0,50 ponto) Variveis 1) Classifique as variveis em qualitativa e quantitativa(discreta ou contnua): a) P: alunos de uma escola V: cor de cabelos b) P: estao meteorolgica de uma cidade

40

V: precipitao pluviomtrica, durante um ano c) P: propriedades agrcolas do Brasil V: produo de soja d) P: habitantes do estado do Mato Grosso do Sul V: cor da pele e) P: peas produzidas por certa mquina V: nmero de peas produzidas por hora f) P: peas produzidas por certa mquina V: dimetro externo g) P: indstrias de uma cidade V: ndice de liquidez h) P: funcionrios do Banco do Brasil V: salrio 2) D dois exemplos de varivel qualitativa 3) D dois exemplos de varivel quantitativa discreta e dois de quantitativa contnua.

1) Em uma escola existem 250 alunos, sendo 35 na 1 srie, 32 na 2, 30 na 3, 28 na 4, 35 na 5, 32 na 6, 31 na 7 e


27 na 8. Obtenha uma amostra de 40 alunos e preencha o quadro seguinte: SRIES POPULAO CLCULO PROPORCIONAL 1 35 (35 x 40)/ 250 = 5,6 2 3 4 5 6 7 8 TOTAL 250 AMOSTRA 6

40

2) Uma populao encontra-se dividida em trs estratos, com tamanhos, respectivamente, n1 = 40, n2 = 100 e n3 = 60.
Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra foram retirados do 3 estrato, determine o nmero total de elementos da amostra. 3) Mostre como seria possvel retirar uma amostra de 32 elementos de uma populao ordenada formada por 2432 elementos. Na ordenao geral, qual dos elementos abaixo seria escolhido para pertencer amostra, sabendo-se que o elemento de ordem 1420 a ele pertence? 1648, 290, 725, 2025, 1120. SRIS ESTATSTICA TABELAS Um dos objetivos da Estatstica sintetizar os valores que uma ou mais variveis podem assumir, para que tenhamos uma viso global da variao dessa ou dessas variveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e grficos, que iro nos fornecer rpidas e seguras informaes a respeito das variveis em estudo, permitindo-nos determinaes administrativas e pedaggicas mais coerentes e cientficas. Tabela um quadro que resume um conjunto de observaes. Uma tabela compe-se de: a. corpo - conjunto de linhas e colunas que contm informaes sobre a varivel em estudo; B. cabealho - parte superior da tabela que especifica o contedo das colunas; c. coluna indicadora - parte da tabela que especifica o contedo das linhas; d. linhas - retas imaginrias que facilitam a leitura, no sentido horizontal,

40

de dados que se inscrevem nos seus cruzamentos com as colunas; e. casa ou clula - espao destinado a um s nmero; f. ttulo - conjunto de informaes, as mais completas possveis, respondendo s perguntas: O qu?, Quando?, Onde?, localizado no topo da tabela. H ainda a considerar os elementos complementares da tabela, que so a fonte, as notas e as chamadas, colocados, de preferncia, no seu rodap.
Srie Histrica, Cronolgica, Temporal ou Evolutiva a srie estatstica em que os dados so observados segundo a poca de ocorrncia. Srie Geogrfica ou de Localizao a srie estatstica em que os dados so observados segundo a localidade de ocorrncia.

Srie Especfica ou Categrica: a srie estatstica em que os dados so agrupados segundo a modalidade de ocorrncia. Distribuio de Freqncia: a srie estatstica em que os dados so agrupados com suas respectivas freqncias absolutas.

Srie Conjugada ou Tabela de Dupla Entrada : quando conjuga duas sries em uma nica tabela, ficam criadas ordens de classificao: uma horizontal e uma vertical.

40

2)

Montar uma srie cronolgica para representar os valores das exportaes de acar, fornecidas pelo Instituto do Acar e do lcool, nos anos de 1985 a 1991 em milhares de dlares: 160193 180114 1634825 212879 224064 - 252740 - 299548.

3)

Idealizar uma srie estatstica para representar o seguinte fato: populao da regio Norte do Brasil em 2000, sabendo que em Rondnia, Acre, Amazonas, Roraima, Par, Amap e Tocantins, temos, respectivamente: 1.377.792 557.337 2.840.889 - 324.152 6.188.685 475.843 e 1.155.251 habitantes, segundo dados do IBGE.

4)

Fazer uma tabela estatstica para representar a situao socioeconmica das regies do Brasil em 2000, sabendo

que a regio Norte, Nordeste, Centro-Oeste, Sudeste e Sul, temos respectivamente: rea:3.869.637,9 1.561.177,8 1.612.077,2 927.286,2 e 577.214,0km2; populao:12.919.949 47.679.381 11.611.491 72.262.411 e 25.070.380 habitantes; renda per capita (US$) :1.907 1.358 3.110 4.086 e 3.251, segundo dados do IBGE. GRFICOS ESTATSTICOS uma forma de apresentao dos dados estatsticos, cujo objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais rpida e viva do fenmeno em estudo.

40

Os principais so:

GRFICO EM LINHA OU EM CURVA: Utiliza-se da linha poligonal, ou seja, a mesma representao das funes no sistema de coordenadas cartesianas (x, y). GRFICO EM COLUNAS OU EM BARRAS: a representao de uma srie por meio de retngulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). GRFICO EM COLUNAS OU EM BARRAS MLTIPLAS: Representao simultnea de dois ou mais fenmenos estudados com o propsito de comparao. GRFICO DE SETORES: construdo com base em um crculo, para ressaltar a participao do dado no total. Os setores so tais que suas reas so respectivamente proporcionais aos dados da srie. PICTOGRAMA: O pictograma constitui-se de figuras. CARTOGRAMA: O cartograma a representao sobre uma carta geogrfica (mapa).

DISTRIBUIO DE FREQNCIAS a representao tabular utilizada para a apresentao dos dados estatsticos coletados na amostragem dada pelas variveis quantitativas. DADOS BRUTOS: O conjunto dos dados numricos obtidos aps a crtica dos valores coletados. ROL: o arranjo dos dados brutos em ordem de freqncia crescente ou decrescente. AMPLITUDE TOTAL(At ou R): a diferena entre o maior e menor valor observados. FREQNCIA ABSOLUTA(fi): o nmero de vezes que o elemento aparece na amostra, ou o nmero de elementos pertencentes a uma classe. Obs: Na tabela n =fi TABELA DO TIPO A: usa-se em geral para varivel discreta, ou quando sua amostra tem menos de 10 valores (xi). TABELA DO TIPO B: usa-se em geral para varivel contnua, ou quando sua amostra tem mais de 10 valores (xi). NMERO DE CLASSE(k): cada um dos grupos ou intervalos obtidos a partir do rol. Usaremos a frmula de Sturges: Se n 25, ento K = 5, onde n o tamanho da amostra; Se n > 25, ento K 1+ 3,22 log n. AMPLITUDE DAS CLASSES(h): h R:K REPRESENTAO DOS LIMITES DAS CLASSES: ou ou PONTOS MDIOS DAS CLASSES(xi): a mdia aritmtica entre o limite superior e o limite inferior da classe. FREQNCIA RELATIVA(fr ): Indica a proporo que cada xi ou classe representa em relao ao total(n) e obtido assim: fr = fi n Obs: Na tabela fr = 1,000 FREQNCIA PERCENTUAL (fp): Indica a porcentagem de cada xi ou classe e obtido assim: fp = fr * 100

40

Obs: Na tabela fp = 100% dado.

FREQNCIA ACUMULADA(Fi ou fa): a soma das freqncia absolutas dos valores inferiores ou iguais ao valor FREQNCIA ACUMULADA RELATIVA(Fr ou far): a soma das freqncia relativa de sua classe ou xi com as anteriores, se houver.Ou ainda: Fr = Fi n FREQNCIA ACUMULADA PERCENTUAL (Fp ou fap): a soma das freqncias percentuais de sua classe ou xi com as anteriores, se houver.Ou ainda: Fp = Fr * 100 GRFICOS DE DISTRIBUIO DE FREQNCIAS HISTOGRAMA(TABELA A): um conjunto de hastes, representadas em um sistema de coordenadas cartesianas que tem por base os valores distintos da srie(xi) e por altura, valores proporcionais as freqncias simples correspondentes destes elementos (fi, fr ou fp). HISTOGRAMA(TABELA B): um conjunto de retngulos justapostos, representadas em um sistema de coordenadas cartesianas, cujas base so os intervalos de classes e cujas altura so valores proporcionais as freqncias simples correspondentes destes elementos (fi, fr ou fp). POLGONO DE FREQNCIA: um grfico em linha para distribuio em classes, sendo as freqncias (fi, fr ou fp) marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de classe. POLGONO DE FREQNCIA ACUMULADA: um grfico em linha para distribuio em classes, traado marcando-se as freqncias acumuladas (Fi, Fr ou Fp) marcadas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. GRFICO DE FREQNCIA ACUMULADA: um grfico em linha descontnua para distribuio de tabela do tipo A com formato de plataforma de uma escada, traado marcando-se as freqncias acumuladas (F i, Fr ou Fp) marcadas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos valores distintos da srie(xi).

EXERCCIOS
1) Represente a srie abaixo usando o grfico de linhas 2) Represente as tabelas usando o grfico em colunas ou barras:

40

Produo brasileira de leo de dend 1987-92 Anos Quantidade (1.000 t) 1987 39,3 1988 39,1 1989 53,9 1990 65,1 1991 69,1 1992 59,5 FONTE: Agropalma 3) Represente a tabela por meio de grfico em setores: Produo de Ferro Brasil 1993 Unidades da Federao Produo (1.000 t) Minas Gerais 12.888 Esprito Santo 3.174 Rio de Janeiro 5.008 So Paulo 2.912 FONTE: Instituto Brasileiro de Siderurgia 4-Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculdade, revelou os seguintes valores: 18, 17, 18, 20, 21, 19, 20, 18, 17, 19 20, 18, 19, 18, 19, 21, 18, 19, 18, 18 19, 19, 21, 20, 17, 19, 19, 18, 18, 19 18, 21, 18, 19, 19, 20, 19, 18, 19, 20 18, 19, 19, 18, 20, 20, 18, 19, 18, 18 Agrupe, por freqncia estes dados.

Produo Brasileira de Petrleo Bruto 1991-93 Anos Quantidade (1.000 m3) 1991 36.180,4 1992 36.410,5 1993 37.164,3 FONTE: Petrobrs

Entrega de gasolina para consumo Brasil 1988-91 Anos Volume (1.000 m3) 1988 9.267,7 1989 9.723,1 1990 10.121,3 1991 12.345,4 FONTE: IBGE

5-Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidas durante um ms. Esta amostra apresentou os seguintes valores em dlares: Agrupe, por freqncia estes dados. 15.315,0 0 35.780,0 0 20.414,0 0 8.598,00 16.820,0 0 21.780,0 0 22.540,0 0 29.000,0 0 27.312,0 0 19.302,0 23.440,0 0 42.320,0 0 23.313,0 0 12.417,0 0 38.000,0 0 32.414,0 0 22.010,0 0 30.400,0 0 35.318,0 0 23.300,0 6.511,00 34.782,0 0 26.432,0 0 22.300,0 0 40.300,0 0 32.000,0 0 30.000,0 0 12.319,0 0 18.620,0 0 21.350,0 27.435,0 0 30.515,0 0 25.400,0 0 15.800,0 0 18.700,0 0 21.380,0 0 36.728,0 0 38.661,0 0 28.412,0 0 13.253,0 17.661,0 0 27.610,0 0 21.200,0 0 18.300,0 0 19.600,0 0 24.780,0 0 36.483,0 0 40.681,0 0 21.313,0 0 25.312,0

6-Uma empresa automobilstica selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado ms o nmero de unidades adquiridas por estes revendedores. Obteve os seguintes dados: 10 9 15 14 25 19 21 20 6 32 23 18 15 16 21 26 26 24 32 20

0 0 0 0 0 7-Uma indstria embala peas em caixas com 100 unidades. O controle de qualidade selecionou 48 caixas na linha de produo e anotou em cada caixa o nmero de peas defeituosas. Obteve os seguintes dados: 2 1 0 1 0 2 4 1 3 1 0 1 0 1 1 1 0 1 0 0

40

7 18 17 28 35 22 19 15 18 22 20 25 28 30 Agrupe, por freqncia estes dados.

39 16

18 12

21 20

8-Um banco selecionou ao acaso 25 contas de pessoas fsicas em uma agncia, em determinado dia, obtendo os seguintes saldos em dlares: Agrupe, por freqncia estes dados. 52.500,0 0 6.830,00 16.323,0 0 25.300,0 0 28.000,0 18.300,0 0 3.250,00 42.130,0 0 31.452,0 0 21.000,0 35.700,0 0 17.603,0 0 27.606,0 0 39.610,0 0 14.751,0 43.800,0 0 35.600,0 0 18.350,0 0 22.450,0 0 39.512,0 22.150,0 0 7.800,00 12.521,0 0 7.380,00 17.319,0

0 0 3 0 0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 1 0 Agrupe, por freqncia estes dados. 9-Os resultados do lanamento de um dado 50 vezes foram os seguintes: 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3 Forme uma distribuio de freqncia sem intervalos de classe.

0 0 0 0 0 10-Considerando as notas de um teste de inteligncia aplicado a 100 alunos: 6 4 7 3 7 8 8 6 7 6 8 2 6 8 7 1 9 5 9 7 8 9 5 8 6 8 4 8 0 9 0 9 6 7 3 9 4 7 6 6 8 2 7 8 8 6 9 2 8 3 8 6 6 3 8 8 6 82 89 10 1 76 10 2 81 70 10 5 62 95 7 4 7 3 8 5 7 6 7 3 8 5 7 2 7 4 9 1 9 7 8 9 2 9 8 8 3 8 7 7 2 7 4 9 8 8 3 7 8 6 8 5 7 5 8 6 7 0 8 1 8 4 7 8 9 8 9 8 7 8 0 7 3 8 4 8 5 9 6 9 9 7 8 9 3 7 2 10 3 81 90 85 79 81 81 83 83 73 103 90 86 103 93 85 89 96 76 108

11-A tabela abaixo apresenta as vendas dirias de um determinado aparelho eltrico, durante um ms, por uma firma comercial: 1 4 1 2 1 2 1 1 2 1 4 1 4 1 1 1 1 3 1 0 1 1 3 1 4 1 3 1 1 4 1 1 1 5 1 1 3 1 2 1 1 1

5 3 6 7 4 4 Forme uma distribuio de freqncia sem intervalos de classe.

4 5 7 8 1 2 Forme uma distribuio de freqncia. 12- Complete a tabela abaixo: i CLASSES 1 0 --- 8 2 8 --- 16 3 16 --- 24 fi 4 10 14

13- Dada a distribuio de freqncia: fr Fi Fr

xi fi

3 2

4 5

5 12

6 10

7 8

Determine: a). fi ; b)as freqncias percentuais; c)as

40

8 3

4 24 --- 32 5 32 --- 40

9 3 = 40 = 1,00

freqncias relativas; d)as freqncias acumuladas; e) as freqncias relativas acumuladas e f) as freqncias percentuais acumuladas.

14- Considerando as distribuies de freqncias seguintes, confeccione, para cada uma: a)


PPESOS(KG) 40 ---- 44 44 ---- 48 48 ---- 52 52 ---- 56 56 ---- 60 fi 2 5 9 6 4 2 6 b) REAS (m2) 300 ---- 400 400 ---- 500 500 ---- 600 600 ---- 700 700 ---- 800 800 ---- 900 900 ---- 1000 1000 ----1100 1100 ----1200 N DE LOTES 14 46 58 76 68 62 48 22 6 400

a) o histograma

b) o polgono de freqncia; c) o

polgono de freqncia acumulada .

15-Confeccione o histograma e o grfico de freqncia percentual acumulada da distribuio: xi fi 1 1 2 3 3 5 4 1

1)
a) b) c) d) e) f) g) h)

Examinando o histograma abaixo, que corresponde s notas relativas aplicao de um teste de inteligncia a um Qual o intervalo de classe que tem maior freqncia? Qual a amplitude total da distribuio? Qual o nmero total de alunos? Qual a freqncia do intervalo de classe 110 --- 120? Quais os dois intervalos de classe que tem, di a dois, a mesma freqncia? Quais so os dois intervalos de classe tais que a freqncia de um o dobro da freqncia do outro? Quantos alunos receberam notas de teste entre 90 (inclusive) e 110? Quantos alunos receberam notas no-inferior a 100?

grupo de alunos, responda:

MEDIDAS DE TENDNCIA CENTRAL O estudo que fizemos sobre distribuies de freqncias, at agora, permite-nos descrever, de modo geral, os grupos de valores que uma varivel pode assumir. Dessa forma, podemos localizar a maior concentrao de valores de uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final, ou ainda, se h uma distribuio por igual.

40

Porm, para ressaltar as tendncias caractersticas de cada distribuio, isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se expressem atravs de nmeros, que nos permitam traduzir essas tendncias. Esses conceitos so denominados elementos tpicos da distribuio e so as: a) medidas de posio; b) medidas de variabilidade ou disperso; c) medidas de assimetria; d) medidas de curtose. Dentre os elementos tpicos, estudaremos nessa unidade, as medidas de posio, que so estatsticas que representam uma srie de dados, orientando-nos quanto posio da distribuio em relao ao eixo horizontal. De um modo geral, qualquer conjunto de dados estatsticos - agrupados ou no - dependendo do estudo a que se prope, ocupam uma posio especfica dentro de uma distribuio. As medidas de posio mais importantes so as medidas de tendncia central, que recebem tal denominao pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. As principais medidas de tendncia central so: a) Mdia (aritmtica, geomtrica, harmnica, quadrtica) b) Moda c) Mediana d) Separatrizes MEDIDAS DE POSIO PARA DADOS NO AGRUPADOS EM CLASSES Mdia Aritmtica A mdia aritmtica de um conjunto de nmeros pode ser de dois tipos: simples ou ponderada.

Mdia Aritmtica Simples A mdia aritmtica simples de um conjunto de nmeros igual ao quociente entre a soma dos valores do conjunto e o nmero total de valores. onde: n xi x - mdia aritmtica simples; i =1 xi - valores da varivel; x= n - nmero de observaes. n Ex.: Sejam os valores abaixo correspondente aos salrios de 5 funcionrios de uma empresa. Calcular a mdia aritmtica simples.

8 0 0+ 7 8 0+ 8 2 0+ 8 1 0+ 7 9 0 x1 = 8 0 00 0; x 2 = 7 8 00 0; x 3 = 8 2 00 0; x 4 = 8 1 00 0; x5 = 7 9 00 0 , , , , , x= = 8 0 00 0 x = 800,00 , 5
A mdia aritmtica simples ser calculada sempre que os valores vierem representados individualmente.

Mdia Aritmtica Ponderada

40

A mdia aritmtica considerada ponderada quando os valores do conjunto tiverem pesos diferentes. No caso da mdia aritmtica simples, todos os valores possuem o mesmo peso. A mdia aritmtica ponderada o quociente entre o produto dos valores da varivel pelos respectivos pesos e a soma dos pesos.

onde:

xp =

i =1 k

x i pi pi

x p - mdia aritmtica ponderada; x i - valores da varivel; pi - pesos dos valores da varivel


ocorre);
i =1

(n de vezes que cada valor

i =1

pi = n - nmero de observaes;

k - nmero de classes ou de valores individuais diferentes da varivel.Os pesos dos valores da varivel correspondem ao nmero de vezes que cada valor ocorre.

Ex.:

Sejam os valores abaixo correspondentes aos salrios de 10 funcionrios de uma empresa:

x1 = 800,00; x 2 = 770,00; x 3 = 790,00; x 4 = 800,00; x 5 = 760,00; x 6 = 750,00; x 7 = 760,00; x 8 = 780,00; x 9 = 800,00; x10 = 770,00

xp =

(750,00x1) + (760,00 x 2) + (770,00 x 2) + (780,00 x1) + (790,00x1) + (800,00x 3) x p = 778,00 1+ 2 + 2 +1+ 3

Moda (Mo) A moda outra medida de tendncia central, definida como o valor mais frequente, quando comparado sua freqncia com a dos valores contguos de um conjunto ordenado. Considerando um conjunto ordenado de valores, a moda ser o valor predominante, o valor mais frequente desse conjunto. Esse conjunto de valores pode ser: - amodal: no apresenta uma moda, isto , todos os valores da varivel em estudo ocorreram com a mesma intensidade (freqncia). - plurimodal: quando houver mais de um valor predominante. Ex.: Calcular a moda dos seguintes conjuntos de valores: x = {4, 5, 5, 6, 6, 6, 7, 7, 8, y = {4, 4, 5, 5, 6, 6} Amodal, 8} Mo = 6 pois seus trs valores apareceram 2 vezes cada z = {1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6} Mo1 = 2 e Mo2 = 5, um.conjunto bimodal, pois tanto o valor 2 como o valor 5 apresentaram o maior nmero de ocorrncias. w = {1, 5}Amodal 2, 3, 4,

40

Mediana (Me) Mediana um valor central de um rol, ou seja, a mediana de um conjunto de valores ordenados (crescente ou decrescente) a medida que divide este conjunto em duas partes iguais, cujo valor est sucedido de 50% e antecedido de 50% desse conjunto de observaes. A mediana tambm considerada uma medida separatriz pois divide a distribuio (a srie) ou conjunto de dados em partes iguais. uma medida muito utilizada na anlise de dados estatsticos, especialmente quando se atribui pouca importncia aos valores extremos da varivel. A mediana um valor que ocupa uma determinada ordem ou posio na srie ordenada. Estando ordenados os valores de uma srie e sendo n o nmero de elementos da srie, o valor mediano ser: - Se n for mpar: a mediana ser o termo de ordem:

P=

n +1 2

onde: P elemento mediano (Posio); n nmero de elementos do conjunto.

- Se n for par: a mediana ser a mdia aritmtica dos termos de ordem n/2 e n/2 + 1:

P= 1
Exs.:

n 2

P2 =

n +1 2
P=
P= 1

Me =

P + P2 1 2

1) Para a srie {2, 5, 6, 9, 10, 13, 15, 16, 18} n = 9 A mediana ser o termo de ordem

Assim, Me = 10

9 +1 =5 2

2) Para a srie {2, 6, 7, 10, 12, 13, 18, 21} n = 8


A mediana ser o termo de ordem:

10 + 12 = 11 Me = 11 2 Obs.: a mediana depende da posio e no dos valores dos elementos na srie ordenada. Essa uma das diferenas marcantes entre a mediana e a mdia (que se deixa influenciar, e muito, pelos valores extremos). Me =
MEDIDAS DE POSIO PARA DADOS AGRUPADOS EM CLASSES Mdia Aritmtica Ponderada O valor de xi passa a ser o ponto mdio do intervalo. Ex.: k

n 8 = =4 2 2

P2 =

n 8 +1 = +1 = 5 2 2

xp =

i =1

Pmi pi
i =1

pi

Classes 10 | 20 20 | 30 30 | 40 40 | 50 50 | 60

pi 5 10 15 10 5

Pmi 15 25 35 45 55

Pmi . pi 75 250 525 450 275

x p = i =1 5 pi
i =1

Pmi pi

1575 = 35 45

x p = 35

40

i =1

pi = 45 = n

i =1

Pmi pi = 1575

Propriedades da Mdia 1) a soma algbrica dos afastamentos (ou desvios, ou resduos) de um conjunto de nmeros tomados em relao mdia aritmtica zero. Simbolicamente:

i =1

d i = ( xi x ) = 0

ou

i =1

d i pi = ( xi x ) pi = 0

2) se multiplicarmos ou dividirmos todas as informaes por uma constante, a mdia aritmtica tambm ficar multiplicada ou dividida por essa constante. 3) somando-se ou subtraindo-se uma constante a todos os valores de um conjunto de informaes, a mdia aritmtica ficar somada ou subtrada dessa constante. 4) a soma dos quadrados dos desvios tomados em relao mdia aritmtica um mnimo. Uso da Mdia: a mais utilizada dos valores mdios, pela simplicidade e rapidez de seu clculo. a) quando se deseja obter um valor mdio estvel e significativo que inclui no seu clculo todos os valores; b) usada na determinao de ndices de grande importncia estatstica; c) quando se deseja maior preciso na determinao de uma medida, realiza-se vrias indues e toma-se como resultado a mdia aritmtica. 5.3.5. Moda para Dados Agrupados Os valores da varivel dispostos em uma tabela de freqncias podem apresentar-se individualmente ou agrupados em classes. No primeiro caso, a determinao da moda imediata, bastando, para isso, consultar a tabela, localizando o valor que apresenta a maior freqncia. Esse valor ser a moda do conjunto. Assim, a moda do conjunto apresentado na tabela abaixo Mo = 3, indicando que a rejeio de 3 peas defeituosas por ms foi o resultado mais observado. Ex.: Nmero de Peas de Preciso Defeituosas devolvidas mensalmente pelo Controle de Qualidade
N de Peas com Defeito xi 0 1 2 3 4 5 6 N de meses pi 2 4 6 8 4 2 1
i=1

pi = 27

40

Tratando-se de uma tabela de freqncias com valores tabulados e agrupados em classes, o procedimento no imediato, sendo disponveis alguns mtodos de clculo distintos. Qualquer que seja o mtodo adotado, o primeiro passo para determinar a moda localizar a classe que apresenta a maior freqncia, comumente chamada de classe modal. Um dos mtodos para o clculo da Moda o Mtodo de Czuber. Mtodo de Czuber O mtodo de Czuber, para o clculo da moda elaborada, leva em considerao no apenas as freqncias das classes adjacentes, mas tambm a freqncia da classe modal. O ponto que corresponde moda divide o intervalo da classe modal em duas partes, as quais so proporcionais s diferenas entre a freqncia da classe modal e as das respectivas classes adjacentes. Assim: onde:

M o= L i + h

FM o F ant 2 FM o ( F ant+ F post )

Li - limite inferior da classe modal; h - amplitude do intervalo de classe; FMo - freqncia simples da classe modal; Fant - freqncia simples da classe anterior classe modal; Fpost - freqncia simples da classe posterior classe modal.

Ex.: Determinar a moda pelo mtodo de Czuber para os dados apresentados abaixo: 10 3 Classes pi ou Fi Classe Modal: 30 | 40 Mo = 30 + 10 = 38,75 2 h = 10 10 | 20 2 10 ( 3 + 9 ) FMo = 10 3 20 | 30 Mo = 38,75 10 Fant. = 3 30 | 40 Fpost. = 9 9 40 | 50 4 Li = 30 50 | 60 n = 28 Mediana Para o caso de uma distribuio, a ordem, a partir de qualquer um dos extremos, dada por:

1 passo: determina-se as freqncias acumuladas; 2 passo: calcula-se a posio da mediana; 3 passo: marca-se a classe correspondente freqncia acumulada imediatamente superior a Posio calculada e, em seguida, emprega-se a frmula: Ex.:

Fi 2

40

onde: Li o limite inferior da classe que contm a mediana;

Me = Li +

P ' Fa h F

Fa freqncia acumulada at a classe anterior classe mediana; F freqncia simples da classe mediana; h amplitude do intervalo da classe mediana.

Fi 40 = = 20 2 2

F a 1 150 | 154 4 4 2 154 | 158 9 1 3 158 | 162 11 3 4 162 | 166 8 2 5 166 | 170 5 4 6 3 3 170 | 174 2 3 Classe mediana de ordem 3 7 4 0 = 40

I Estaturas (cm)

Fi

Classe mediana

(i = 3)

Como h 24 valores includos nas trs primeiras classes da distribuio e como pretendemos determinar o valor que ocupa o 20 lugar, a partir do incio da srie, vemos que esse deve estar localizado na terceira classe (i = 3), supondo que as freqncias dessas classes estejam uniformemente distribudas. Como h 11 elementos nessa classe e o intervalo de classe igual a 4, devemos tomar, a partir do limite inferior, a distncia:

20 13 7 x4 = x4 11 11

E a mediana ser:

Me = 158 +

7 28 x 4 = 158 + = 158 + 2,54 = 160.54 11 11

Me = 160,5 cm Uso da Mediana: a) usada em fenmenos educacionais quando se quer tornar objetiva a avaliao de uma classe; b) quando se quer exatamente o valor que divide a metade da distribuio; c) quando a distribuio tem resultados discrepantes e pairam dvidas sobre sua validade e correo.

Comparao entre mdia aritmtica, mediana e moda. H um momento em que o pesquisador far a seguinte pergunta: Qual a medida de tendncia central que representa melhor o conjunto de dados em estudo? Assim, mostraremos as vantagens e desvantagens de cada uma das medidas de tendncia central.

A moda uma medida que requer apenas o conhecimento da freqncia absoluta e pode ser utilizada para qualquer tipo de variveis, tanto qualitativas, quanto quantitativas. A mediana uma medida que exige uma ordenao de categorias, da mais alta a mais baixa, assim ela s pode ser obtida para variveis qualitativas ordinais ou para as quantitativas, jamais para variveis qualitativas nominais. Alm disso, a mediana no influenciada por valores extremos. A mdia aritmtica trabalha com todos os elementos do conjunto de dados, enquanto a mediana utiliza apenas um ou dois valores. No entanto a mdia sofre influncia de valores extremos (muito alto ou baixo). A mdia uma medida que pode ser calculada apenas para variveis quantitativas. E embora a mdia seja um valor mais fcil de entender, tem o defeito de nos induzir em erro se a nossa amostra tiver valores muito extremos.

40

Assim, no caso das variveis quantitativas, quando o valor da Mediana muito diferente da Mdia, aconselhvel considerar sempre a Mediana como valor de referncia mais importante. Quando a distribuio dos dados considerada "normal", ento a melhor medida de localizao do centro, a mdia. Ora sendo a Distribuio Normal uma das distribuies mais importantes e que surge com mais freqncia em aplicaes, esse fato justifica a grande utilizao da mdia. Esquematicamente podemos posicionar a mdia da forma seguinte, tendo em conta a representao grfica na forma de histograma.

MEDIDAS DE DISPERSO OU MEDIDAS DE VARIABILIDADE Medidas de disperso ou de variabilidade so estatsticas que medem as oscilaes ou as variaes de uma varivel. Exemplo: Seja os quatro conjuntos abaixo, as notas de quatro turmas: Turma A: 4 4 5 6 6 Turma B: 5 5 5 5 5 Turma C: 2 3 6 6 8 Turma D: 0 0 5 10 10 Os conjuntos so iguais? Em qual das turmas h maior variao ou disperso dos dados em relao mdia? Para calcularmos esta disperso em relao mdia, utilizaremos algumas medidas: Varincia (para populao) Desvio Padro: (para populao) Desvio Mdio:

=
2

( x i x) 2
i =1

(x
i =1

x)

DV =

x
i =1

(para amostras)

(para amostras)

S2 =

(x
i =1

x) 2 S=

(x
i =1

x) 2

n 1

n 1

5 .5 - Coeficiente de Variao O coeficiente de variao mede a homogeneidade dos dados em conjunto, em relao a mdia, sua frmula expressa por:

40

CV =

S 100 x

O valor obtido ser dado em porcentagem. E acima de 30% o conjunto de dados considerado heterogneo e abaixo de 30% o conjunto considerado homogneo. MEDIDAS DE ASSIMETRIA E CURTOSE As medidas de assimetria e curtose so as que restam para completarmos o quadro das estatsticas descritivas, que proporcionam, juntamente com as medidas de posio e disperso, a descrio e compreenso completas da distribuio de freqncias estudadas. As distribuies de freqncias no diferem apenas quanto ao valor mdio e a variabilidade, como tambm quanto a sua forma. As medidas de assimetria referem-se forma da curva de uma distribuio de freqncias, mais especificamente do polgono de freqncia ou do histograma. Simetria: uma distribuio de freqncia simtrica quando a mdia, mediana e moda so iguais, ou seja, apresentam um mesmo valor, ou ainda, coincidem num mesmo ponto. Assimetria: quando a mdia, mediana e a moda recaem em pontos diferentes da distribuio, isto , apresentam valores diferentes, sendo que o deslocamento desses pontos podem ser para a direita ou para a esquerda. Quanto ao grau de deformao, as curvas de freqncia podem ser: a) Simtrica b) Assimtrica Positiva c) Assimtrica Negativa Principais Medidas de Assimetria Mtodo de Comparao entre Medidas de Tendncia Central Trata-se do mtodo mais rudimentar, o qual no permite estabelecer at que ponto a curva analisada se desvia da simetria. A comparao bem simples. x > Mo Assimetria Positiva x = Mo Simetria x < Mo Assimetria Negativa Critrio de Bowlley (Coeficiente Quartil de Assimetria) Numa distribuio simtrica Me = x = Mo = Q2 e os Quartis (Q1 ou inferior e Q3 ou superior) so equidistantes da Mediana Q3 Me = Me Q1. Numa distribuio assimtrica, qualquer das desigualdades abaixo pode ser utilizada como medida de assimetria que seria uma medida de assimetria absoluta, o que queremos evitar; e conseguiremos dividindo pelo Intervalo Interquartlico, logo: onde: Q3 Me Me Q1 Distribuio Assimtrica Q3 + Q1 2Me ou Q3 + Q1 - 2Me 0

40

As = 0 Distribuio Simtrica As > 0 Assimetria Positiva Q3Q1=IQ Intervalo Interquartlico. As < 0 Assimetria Negativa O coeficiente Quartil de Assimetria (As) assume valores entre +1 e 1. Assim: -1 As 1

As =

Q3 + Q1 2Me Q3 Q1

As Coeficiente Quartil de Assimetria

Esta medida muito til quando no for possvel empregar o desvio-padro como medida de disperso, mas apenas alguma medida que dependa dos Quartis. Critrio de Kelley Como vimos, o critrio de Bolley despreza 50% das ocorrncias (as inferiores ao primeiro quartil e as superiores ao terceiro quartil). Por este motivo, Kelley determinou um novo critrio que usa os percentis equidistantes da mediana que so os percentis 10 e 90, desprezando apenas 20% das ocorrncias. Assim: onde:

As =

C 90 + C10 2 Me C 90 C10

As = 0 Distribuio Simtrica; As > 0 Assimetria Positiva; As < 0 Assimetria Negativa.

-1 As 1

Critrio de Pearson Quando uma distribuio deixa de ser simtrica, a Mo, a Me e a mdia aritmtica vo se afastando, aumentando cada vez mais a diferena entre a x e a Mo ( x Mo). Podemos us-la para medir assimetria, porm melhor usarmos em termos relativos. a) Primeiro Coeficiente de Assimetria de Pearson As Coeficiente de Assimetria; x mdia aritmtica; x Mo As = Mo Moda; - desvio-padro.

b) Segundo Coeficiente de Assimetria de Pearson Quando a distribuio for quase simtrica ou moderadamente assimtrica, pode-se calcular mais facilmente seu grau de assimetria substituindo na frmula a MODA pelo seu valor em funo da mdia aritmtica e da mediana, segundo a relao emprica proposta por Pearson: (x Mo) 3 (x Me) Como essas relaes so aproximadas e no exatas, somente quando a distribuio for simtrica elas se equivalero. 3 As 3 3( x Me) x Mo 3( x Me)

As =

No comum o aparecimento de curvas de freqncias com deformao superior a 1.

As =

40

O primeiro coeficiente de Assimetria de Pearson tem o inconveniente de requerer a determinao prvia da moda. Assim, quando as distribuies no se apresentarem com forte assimetria, deve-se dar preferncia ao Segundo Coeficiente de Assimetria de Pearson. Curtose (k) A Curtose ou excesso indica at que ponto a curva de freqncias de uma distribuio se apresenta mais afilada ou mais achatada do que uma curva padro, denominada curva normal. De acordo com o grau de curtose, podemos ter trs tipos de curvas de freqncia. Curva ou Distribuio de Freqncias Leptocrtica Quando uma curva de freqncias apresenta um alto grau de afilamento, superior ao da normal. k < 0,263 Curva ou distribuio leptocrtica

Curva ou Distribuio de Freqncias Mesocrtica : Quando a curva de freqncias apresenta um grau de achatamento equivalente ou da curva normal k = 0,263 Curva ou distribuio mesocrtica Curva ou Distribuio de Freqncias Platicrtica Quando uma curva de freqncias apresenta um alto grau de achatamento, superior ao da normal. k > 0,263 Curva ou distribuio platicrtica

NOES DE CORRELAO E REGRESSO LINEAR SIMPLES Muitas vezes, na pratica, necessitamos estudar o relacionamento de duas variveis, coletadas como pares de valores, para resolver questes, como por exemplo: - O sucesso de um emprego pode ser predito com base no resultado de testes: - Quanto maior for a produo, maior ser o custo total. - Quanto maior for a idade de um imvel, menor ser seu preo de venda. Problemas como esses podem ser estudados atravs uma analise de correlao simples, onde podemos determinar a fora do relacionamento entre asa duas variveis estudadas. As variveis estudadas sero: X, denominada de varivel independente, e Y, denominada de varivel dependente. Se o relacionamento entre X e Y for consistente e

40

necessitamos fazer uma predio para o valor de Y, conhecido um valor de X, atravs de uma formula matemtica adequada, podemos aplicar a chamada anlise de regresso simples. DIAGRAMA DE DISPERSO E um grfico no qual cada ponto plotado representa um par observado de valores para as variveis estudadas (X ,Y), num sistema de eixos cartesianos. Atravs do diagrama de disperso podemos ter uma idia do tipo de relao entre as variveis estudadas. A seguir temos alguns exemplos de diagramas de disperso.

(a) Relao linear direta

(b) Relao linear inversa

(c) Relao curvilnea direta

(c) No h relao

COEFICIENTE DE CORRELAO LINEAR Mede o grau e o tipo do relacionamento entre as variveis estudadas Esta medida e tambm chamada de coeficiente de

correlao de Pearson, em homenagem ao seu criador. Simbologia: r (amostra) ou (populao). O valor de R, pode ser calculado por:

R=

nXY XY n(X 2 ) (X ) 2 n(Y 2 ) (Y ) 2

Onde n e o numero de pares de valores (X,Y) observados. Observe-se que -1,0 R 1,0. O mesmo ocorre com o valor de . A partir dos valores de R ou , podemos verificar o tipo da correlao existente entre as variveis estudadas, conforme tabela seguinte: Valor de R ou 0,0 0,0 ----| 0,3 0,3 ----| 0,6 0,6 ----| 0,9 0,9 ----| 0,99 1,0 COEFICIENTE DE DETERMINAO LINEAR Mede a proporo de variaes de Y que so explicadas direta ou indiretamente pelas correspondentes variaes de X. expresso em porcentagem. Simbologia r (amostra) ou (populao). R = (r) = ()

Correlao nula fraca media forte fortssima perfeita

40

EQUAO DE REGRESSO LINEAR SIMPLES a equao algbrica que nos possibilita predizer um valor para Y, conhecido um valor para X. A equao de regresso linear simples populacional dada por: Y = + X + u Onde u o componente aleatrio que representa a influncia de outros fatores, bem como os erros de medio da varivel Y. Este componente surge devido variabilidade dos valores de Y para cada valor de X.

Quanto ao componente aleatrio, so admitidas as seguintes hipteses: 1 A varivel aleatria u tm distribuio normal. 2 u uma varivel aleatria com mdia igual a zero, isto , E(u) = 0. 3 A varivel u tem varincia igual a

u2 para todos os valores de X.

ESTIMADORES DE E PARA O MODELO DE REGRESSO LINEAR Os estimadores dos coeficientes angular () e linear () sero designados respectivamente por b e a, se o modelo escolhido for uma forma linear. Ento a estimativa do modelo adotado, ser dada por:

Y = a + bX

Os valores de a e b sero determinados, atravs do Mtodo dos Mnimos Quadrados (MMQ), aplicado na amostra selecionada, utilizando-se as seguintes frmulas:

b=

XY nX .Y X 2 n( X ) 2

a = Y bX

PERIGOS E LIMITAES ASSOCIADOS COM AS ANLISES DE REGRESSO E DE CORRELAO - Na anlise de regresso, um valor de Y no poder ser legitimamente estimado, se o valor de X estiver fora do intervalo de valores que serviam de base para a equao de regresso.

40

- Se a predio de Y envolve um resultado que ainda no ocorreu, os dados histricos que serviram de base para a equao de regresso podem no ser relevantes para futuros eventos. - O uso de um intervalo de predio ou de confiana est baseado na hiptese de que as distribuies condicionais de Y so normais e possuem varincias iguais. - Um coeficiente de correlao significante no indica, necessariamente, causao, mas pode indicar isto sim, uma ligao comum a outros eventos. - Uma correlao significante no necessariamente uma correlao importante. Dada uma grande amostra, uma correlao de, digamos, R = +0,10 pode ser significantemente diferente de 0 a = 0,05. Usando O Excel Agora vamos praticar um pouco a anlise usando o Excel, primeiro vamos construir o grfico com a linha de tendncia a devida equao da reta de regresso.

Fig1: Excel 1 Primeiramente, devemos obter o diagrama de disperso. Os passos so os seguintes: - Digitar os dados do problema em uma planilha: primeiro, a coluna da varivel independente (X) ; depois, a coluna da varivel depende (Y); - Selecionar o menu inserir e clicar em grfico; - Selecionar o tipo de grfico, disperso e clicar em avanar; - Selecionar as clulas que contm os dados do problema e inseri-los no campo intervalo de dados; selecionar a seqncia colunas e clicar em avanar; para obter a reta de regresso e o coeficiente de determinao, devem ser seguintes as etapas: - Selecionar qualquer dos pontos do grfico de disperso com o boto esquerdo do mouse; - Clicar como o boto direito do mouse sobre o grfico e selecionar adicionar linha de tendncia; - Verificar se na aba tipo a opo linear est ativada; - Clicar na aba opes, selecionar as alternativas exibir equao no grfico e exibir o valor do R quadrado no grfico e clicar em ok. Essa opo til na avaliao de que modelo matemtico se ajusta melhor ao conjunto de dados (linear, potncia etc..). - Para gerar os relatrios sobre a regresso os passos so os seguintes:

40

- Selecionar o menu ferramentas e clicar em anlise de dados, Caso no esteja habilitada est funo clique em ferramentas e depois em suplementos e marque a opo anlise de dados; - Selecionar Regresso na caixa dilogo ferramentas anlise de dados e clicar em OK. mostrado na caixa de dilogo Regresso, como indica a figura abaixo; - Inserir as clulas que contm os valores das variveis X e Y nos campos intervalo Y de entrada e intervalo X de entrada; - Selecionar as seguintes caixas de verificao: Nvel de confiana de 95%, - Resduos, resduos padronizados e plotar resduos, plotar ajuste de linha, plotagem de probabilidade normal; - Clicar em OK para que o Excel gere os relatrios de anlise.

40

INFERNCIA ESTATSTICA O que ? Quando se utiliza? Para que serve? um processo de raciocnio indutivo, em que se procuram tirar concluses indo do particular, para o geral. um tipo de raciocnio contrrio ao tipo de raciocnio matemtico, essencialmente dedutivo. Utiliza-se quando se pretende estudar uma populao, estudando s alguns elementos dessa populao, ou seja, uma amostra. Em inferncia estatstica utilizam-se amostras para depois de estudadas, tirar concluses sobre as populaes de onde foram extradas. Populao o conjunto de todos os elementos de um estudo, com uma ou mais caractersticas em comum. Censo conjunto de dados relativos a todos os elementos da populao. Amostra subconjunto finito de elementos extrados da populao Cada elemento da populao constitui a unidade estatstica. Ao nmero de elementos da populao chamamos efetivo da populao. Qual a razo da utilizao de amostras e no de toda a populao? Natureza destrutiva de certos testes A impossibilidade fsica de testar todos os itens na populao. O custo de estudar todos os itens em uma populao frequentemente proibitivo. Muitas vezes as estimativas baseadas numa amostra so mais precisas do que os resultados obtidos atravs de um levantamento censitrio. Tempo muito longo para a apurar dos resultados de censos. Posteriormente veremos as tecnicas de amostragem, que podem ser: Amostragem Aleatria Sistemtica, Amostragem por conglomerado e Amostragem estratificada

40

DISTRIBUIES AMOSTRAIS Considerem-se todas as amostras possveis de tamanho n que podem ser retiradas de uma populao de tamanho N (com ou sem reposio). Para cada amostra pode-se calcular uma grandeza estatstica, como a mdia, o desvio padro etc., que varia de amostra para amostra. Com os valores obtidos para determinada grandeza, podemos construir uma distribuio de probabilidades, que ser denominada de distribuio amostral. Para cada distribuio amostral possvel calcular a sua expectncia, o seu desvio padro, etc. DISTRIBUIO AMOSTRAL DAS MDIAS Se os valores da mdia e do desvio padro de uma populao, de tamanho N, forem respectivamente e , e desta populao so retiradas todas as possveis amostras de tamanho n, sem reposio, os valores da expectncia e do desvio padro da distribuio amostral das mdias correspondente sero:

E ( x) =

N n N 1

Se a populao for infinita, ou se amostragem for tomada com reposio, os valores acima ficaro:

E ( x) =

DISTRIBUIO AMOSTRAL DAS PROPORES Se o valor da proporo de ocorrncia de em evento em uma populao, de tamanho N, for , e desta populao so retiradas todas as possveis amostras de tamanho n, sem reposio, os valores da expectncia e do desvio padro da distribuio amostral das propores correspondente sero:

E ( p) =

(1 ) N n n N 1

Se a populao for infinita, ou se amostragem for tomada com reposio, os valores acima ficaro:

E ( p) =
ERRO PADRO

p=

(1 ) n

O desvio padro da distribuio amostral de uma grandeza estatstica freqentemente denominado de seu erro padro. Ento temos que:

chamado de erro padro da mdia, e

chamado de erro padro da proporo.

40

TEOREMA DO LIMITE CENTRAL

Quanto maior o tamanho da amostra, a distribuio de amostragem da mdia mais se aproxima da forma da distribuio normal, qualquer que seja a forma da distribuio da populao. Na prtica, a distribuio de amostragem da mdia pode se considerada como normal sempre que n 30. Exemplo 2 Uma empresa tem 5 scios. Semanalmente, os scios relatam o nmero de horas de atendimento a clientes Scio 1 2 3 4 5 Horas 22 26 30 26 22

Dois scios so selecionados aleatoriamente. Quantas amostras distintas so possveis?

Scios 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Total 48 52 48 44 56 52 48 56 52 48

Mdia 24 26 24 22 28 26 24 28 26 24

Organize as mdias amostrais em uma distribuio de frequncias. Mdia Amostral 22 24 26 28 freqncia 1 4 3 2 Freqncia Relativa (Probabilidade) 1/10 4/10 3/10 2/10

40

Calcule a mdia das mdias amostrais e compare-a com a mdia da populao. mdia da populao :

A mdia das mdias amostrais :

Observe que a mdia das mdias amostrais igual a mdia populacional Qualquer que seja o mtodo de amostragem escolhido, para que a amostra seja representativa da populao indispensvel que: - Qualquer elemento da amostra tenha a mesma probabilidade de nela figurar. - Tenha um nmero de elementos que permita, com algum rigor, inferir para a populao as concluses a que chegamos - Estejam representadas, de forma proporcional, as caractersticas da populao quer qualitativas, quer quantitativas - Mesmo respeitando os mtodos de amostragem, a generalizao dos resultados populao (inferncia) tem sempre algum erro associado. AMOSTRAGEM E ESTIMAO TEORIA DA AMOSTRAGEM A teoria da amostragem um estudo das relaes existentes entre uma populao e as amostras dela extradas. de grande valor em muitas conjeturas. Podemos, por exemplo, avaliar grandezas desconhecidas da populao ( como sua mdia, sua varincia, etc.), freqentemente denominadas de parmetros, atravs das correspondentes grandezas amostrais, denominadas de estatsticas amostrais. POPULAO MEDIDAS Tamanho Total Mdia Aritmtica Varincia Absoluta Desvio Padro Proporo N T n t AMOSTRA

x
s s p

40

MEDIDAS ESTATSTICAS DA AMOSTRA


Medida Proporo Total Dados no agrupados Dados agrupados

f n t =X p=
X=

f n t = fX p=
X =

Mdia Aritmtica

x
n
2

f
n

Varincia Absoluta

S =
2

(x X )
n 1
2

S =
2

f (x X )
n 1

Varincia Absoluta (Frmula abreviada)

S2 =

nX

n 1
S = S2

S2 =

x2 nX n 1

Desvio Padro

S = S2

PLANEJAMENTO DE AMOSTRAS O planejamento da coleta da amostra define o tipo de amostragem a ser utilizado. Os tipos de planejamentos amostrais mais utilizados so: Amostragem sistemtica, Amostragem proporcional estratificada, Amostragem por conglomerado e Amostragem aleatria simples.

AMOSTRAGEM SISTEMTICA Quando os elementos da populao j esto ordenados, no h necessidade de construirmos um sistema de referncia, para selecionarmos a amostra. So exemplos os pronturios mdicos de um hospital, os prdios de uma rua, , uma linha de produo, os nomes em uma telefnica, etc. Nestes casos a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos de sistemtica. Consideremos uma populao, com elementos ordenados, de tamanho N e dela tiramos uma amostra de tamanho n, atravs de uma amostragem sistemtica, da seguinte maneira:

40

- Definimos FS como fator de sistematizao, dado por FS = N/n. - Sorteamos um nmero entre 1 e FS. Esse nmero simbolizado por m, que ser o primeiro elemento da amostra. - O segundo elemento da amostra o de nmero FS + m. - O terceiro elemento da amostra o de nmero 2FS + m. - O k-simo elemento da amostra o nmero ( k 1 ) FS + m Exemplo: Uma rua contm 1000 prdios, dos quais desejamos obter uma amostra sistemtica formada por 100 deles. FS = 1000/100 = 10 m ser um nmero entre 1 e 10. Vamos supor que m=7. Ento temos: 1 elemento da amostra = (1 1) 10 + 7 = 7 >>> 7 elemento da populao. 100 elemento da amostra = (100 1) 10 + 7 = 997 >>> 997 elemento da populao.

AMOSTRAGEM PROPORCIONAL ESTRATIFICADA Muitas vezes a populao se divide em subpopulaes >> estratos. Como provvel que a varivel em estudo apresente, de estrato em estrato, um comportamento heterogneo, convm que o sorteio dos elementos da amostra leve em considerao tais estratos. isso que fazemos quando empregamos a amostragem proporcional estratificada, que, alm de considerar a existncia dos estratos, obtm os elementos da amostra proporcional ao nmero de elementos dos mesmos. Exemplo; Dada a populao de 50.000 operrios da industria automobilstica, selecionar uma amostra proporcional estratificada de 5% de operrios para estimar seu salrio mdio. Usando a varivel critrio cargo para estratificar essa populao, e considerando amostras de 5% de cada estrato obtido, chegamos ao seguinte quadro: CARGO Chefes de seo Operrios especializados Operrios no especializados TOTAL POPULAO 5.000 15.000 30.000 50.000 5% 5(5.000)/100 = 250 5(15.000)/100 = 750 5(30.000)/100 = 1.500 5(50.000)/100 = 2.500 AMOSTRA 250 750 1.500 2.500

AMOSTRAGEM POR CONGLOMERADOS Neste tipo de amostragem a populao total subdividida em vrias partes relativamente pequenas (normalmente homogneas), e algumas dessas subdivises, ou conglomerados, so selecionadas ao acaso, para integrarem a amostra global. Exemplo: Suponhamos que o reitor de uma universidade deseja saber o que os membros dos centros acadmicos acham de um novo regulamento. Ele pode obter uma amostra por conglomerado entrevistando alguns ou todos os membros de alguns centros acadmicos escolhidos ao acaso.

40

AMOSTRAGEM ALEATRIA SIMPLES

um tipo de amostragem que utiliza uma tcnica probabilstica. tambm chamada de amostragem casual ou randmica. A caracterstica principal que todos os elementos da populao tm igual probabilidade de pertencer amostra. Na prtica a amostragem aleatria simples pode ser realizada numerando-se a populao de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, k nmeros dessa seqncia, os quais correspondero aos elementos pertencentes amostra. Exemplo: Vamos obter uma amostra representativa, de 10 % dos valores, para obtermos a estatura mdia de noventa alunos de uma escola: - Numeramos os alunos de 01 a 90 - Escrevemos os nmeros, de 01 a 90, em pedaos iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaos de papel e retiramos, um a um, nove nmeros que formaro a amostra. Quando o nmero de elementos grande, esse tipo de sorteio torna-se trabalhoso. A fim de facilit-lo, foi elaborada uma tabela chamada Tabela de nmeros aleatrios, constituda de modo que os dez algarismos (0 a 9) so distribudos ao acaso nas linhas e colunas. ESTIMAO Inicialmente precisamos de alguns conceitos importantes: Parmetros: so as medidas estatsticas calculadas para a populao, como por exemplo: mdia aritmtica (), desvio padro (), varincia absoluta (), proporo (), etc . Estatsticas amostrais: so as medidas estatsticas calculadas para a amostra, como por exemplo: mdia aritmtica ( x ),desvio padro (s), varincia absoluta (s), proporo (p), etc. Estimao: o processo que consiste em utilizar dados amostrais para obter valores de parmetros populacionais desconhecidos. Estimador: toda a estatstica amostral que tem um correspondente parmetro na populao. Por exemplo: estimador de ; s um estimador de ; e assim por diante. Estimador no tendencioso: Se um parmetro, e seu estimador, dizemos que um estimador no tendencioso de

se E( ) = . Estimativa: o valor numrico do estimador. ESTIMATIVAS As estatsticas amostrais so usadas como estimadores de parmetros populacionais. As estimativas obtidas podem ser pontuais ou intervalar: Estimativa pontual: O parmetro estimado unicamente pelo valor do estimador. Estimativa intervalar: O parmetro estimado atravs de um intervalo de valores, onde o estimador o seu valor central.

40

um

ALGUNS ESTIMADORES NO TENDENCIOSOS IMPORTANTES Estimador de total da populao (T) Estimador do erro padro da mdia (populao infinita) Estimador do erro padro da mdia (populao finita) Estimador do erro padro da proporo (populao infinita) Estimador do erro padro da proporo (populao finita)

T = Nx

s n

s n

N n N 1

p (1 p ) n

p (1 p ) n

N n N 1

INTERVALO DE CONFIANA PARA ESTIMAR A MDIA POPULACIONAL COM A UTILIZAO DA DISTRIBUIO NORMAL DE PROBABILIDADES A estimativa por ponto para a mdia populacional dada atravs da mdia da amostra. Um intervalo de estimao para a mdia populacional construdo, a partir do valor de

x , levando-se em conta ainda um erro de estimativa que considera a

probabilidade de que este intervalo inclua o valor real de , e a variabilidade dos dados. Definimos como Nvel de confiana (1 - ) a probabilidade de que o intervalo construdo contenha o verdadeiro valor da mdia populacional que est sendo estimada. A Distribuio normal pode ser utilizada, nesse caso, sempre que tivermos uma das seguintes situaes: 1 - se n 30, conforme o Teorema do Limite Central. 2 - se n < 30, sendo a populao estudada normalmente distribuda e o desvio padro populacional conhecido. Definimos Zc como coeficiente de confiana, que o valor obtido atravs da distribuio normal com o nvel de confiana especificado. A tabela seguinte apresenta os valores mais usados do nvel de confiana e seu respectivo coeficiente de confiana: Nvel de confiana (1 - ) 0,90 0,95 0,99 Zc 1,65 1,96 2,58

Ento o intervalo de estimao, ou confiana, para a mdia populacional, utilizando-se a distribuio normal, ser calculado por:

[x x ]

se for conhecido [ x x ]

se for desconhecido

40

Sendo

pelas frmulas seguintes:

x o erro de estimao da mdia e o estimador no tendencioso do erro de estimao da mdia, calculados x

x = Zc x

x = Zc x

INTERVALO DE CONFIANA PARA ESTIMAR O TOTAL POPULACIONAL Aps obtido o intervalo de estimao para a media populacional, basta multiplicarmos seus dois valores por N, que obteremos o intervalo do total populacional, pois a estimativa pontual do total populacional e feita por INTERVALO DE CONFIANA PARA ESTIMAR A PROPORCAO POPULACIONAL O intervalo de estimao, ou de confiana, para estimar a proporo populacional () determinado de maneira similar ao da mdia, ou seja, a partir do valor da proporo amostral (p), acrescentado ou diminudo de um erro de estimativa. Ento
p o erro de estimao da proporo e p o estimador no tendencioso do erro de estimao da proporo.

T = Nx

Utilizaremos a distribuio normal para construir este intervalo sempre que n 30. Ento o intervalo ser determinado por:

[p P ]

sendo :

p = Zc p

INTERVALO DE CONFIANA PARA ESTIMAR A MDIA POPULACIONAL UTILIZANDO-SE A DISTRIBUIO t DE STUDENT Quando o desvio padro da populao () no for conhecido, e o tamanho da amostra for inferior a 30 (n < 30), sendo a populao estudada normalmente distribuda, a distribuio normal no apropriada para determinao de intervalos de confiana para a mdia. Nesse caso usamos a distribuio de Student (t) para determinao desse intervalo. A distribuio de Student tem a forma semelhante a da distribuio Normal, e a principal diferena que a distribuio t tem maior rea nas caudas.. Ento, para um dado nvel de confiana, o valor de t ser um pouco maior que o correspondente valor de z. A determinao do valor de t na tabela depende no nvel de confiana e do n do grau de liberdade. O nmero do grau de liberdade , geralmente representado por gl, definido como o nmero de observaes independentes da amostra menos o nmero dos parmetros populacionais que devem ser estimados por meio das observaes amostrais. Ento nesse caso usamos: gl = n - 1

O intervalo para a mdia , com a distribuio t, ser dado por: [ x x ] DETERMINAO DO TAMANHO DA AMOSTRA

Sendo:

=c t x x

40

Na estimao da mdia populacional, podemos determinar o tamanho mnimo necessrio da amostra considerando-se um erro de estimao, e um nvel de confiana desejado, e conhecendo ou estimando um valor para , atravs das seguintes frmulas:

z 2 2 n= c 2 Se a populao for infinita. x NZ c2 2 Se a populao for finita. n = 2 x ( N 1) + Z c2 2


Na estimao da proporo populacional, determinamos o valor mnimo para n considerando um erro de estimao e um nvel de confiana desejado, e supondo um valor para , atravs das seguintes frmulas:

Se a populao for infinita.

Z c2 (1 ) n= 2 p
NZ c2 (1 ) 2 ( N 1) + Z c2 (1 ) p

Se a populao for finita

n=

OBSERVAES IMPORTANTES: (1) Ao determinarmos o tamanho da amostra, atravs dessas frmulas, qualquer resultado fracionrio sempre arredondado para o nmero inteiro imediatamente superior, pois essas frmulas nos do o tamanho mnimo necessrio. (2) Qualquer resultado obtido por essas frmulas que seja menor do que 30 deve ser aumentado para 30, pois as mesmas so baseadas no uso da distribuio Normal. Isso s no ser feito se a populao estudada for normalmente distribuda e o conhecido.

PROBABILIDADE E ESTATSTICA
Todas as vezes que citamos teoria da probabilidade, podemos nos referir aos estudos dos fenmenos de observao, que se cumpre distinguir o prprio fenmeno e o modelo matemtico (determinstico ou probabilstico) que melhor o explique. Porem os fenmenos estudados pela estatstica so fenmenos cujo resultado, mesmo em condies normais de experimentao variam de uma observao para outra, dificultando dessa maneira a previso de um resultado futuro. A observao de um fenmeno casual recurso poderoso para se entender a variabilidade do mesmo. Entretanto, com suposies adequadas e sem observar diretamente o fenmeno, podemos criar um modelo terico que reproduza muito bem a

40

distribuio das freqncias quando o fenmeno observado diretamente. Tais modelos so os chamados modelos de probabilidades. Os fenmenos determinsticos conduzem sempre a um mesmo resultado, quando as condies iniciais so as mesmas. Ex: tempo de queda livre de um corpo. Mantidas as mesmas condies, as variaes obtidas para o valor do tempo de queda livre de um corpo so extremamente pequenas (em alguns casos desprezveis). Os fenmenos aleatrios podem conduzir a diferentes resultados; mesmo quando as condies iniciais so as mesmas, existe a imprevisibilidade do resultado. Ex: lanamento de um dado. Podemos considerar os experimentos aleatrios como fenmenos produzidos pelo homem. Lanamento de uma moeda honesta; Lanamento de um dado; Lanamento de duas moedas; Retirada de uma carta de um baralho completo de 52 cartas; Determinao da vida til de um componente eletrnico. Para melhor entendimento desta unidade e dos fenmenos que iremos descrever em forma completa dos resultados, entretanto especificando ambas as denominaes no estudo das probabilidades, variveis aleatrias. VARIVEIS ALEATRIAS So fenmenos que, mesmo repetidas vrias vezes sob condies semelhantes, apresentam resultados imprevisveis. O resultado final depende do acaso. Espao Amostral (S) um conjunto que contm todos os resultados possveis de um experimento. Assim, no contexto desse experimento, ele considerado o conjunto universal e simbolizado por S. Porm, para entendermos melhor o espao amostral definimos conjunto como conceitos matemticos fundamentais utilizados no estudo das probabilidades. Um conjunto uma coleo de objetos ou itens que possuem caracterstica(s) comum(ns). importante definir cuidadosamente o que constitui o conjunto em que estamos interessados, a fim de podermos decidir se determinado elemento ou no membro do conjunto.

Conjunto uma coleo bem definida de objetos ou itens.


Vejamos um exemplo: No jogo de uma moeda, ao ser lanada a moeda, convencionamos C resultado cara e R resultado coroa, o espao amostral : S= {cara, coroa}.

40

No experimento aleatrio lanamento de um dado e estudar o resultado da face de um numeram voltados para cima, temos o espao amostral S= {1, 2, 3, 4, 5, 6}. No experimento aleatrio "dois lanamentos sucessivos de uma moeda" temos o espao amostral. {(ca,ca) , (co,co) , (ca,co) , (co,ca)} Obs.: cada elemento do espao amostral que corresponde a um resultado recebe o nome de ponto amostral. No primeiro exemplo: cara pertence ao espao amostral{cara, coroa}. O espao amostral de um experimento aleatrio o conjunto dos resultados do experimento. Os elementos do espao amostral tambm sero chamados de pontos amostrais. Representamos o espao amostral por . Nos exemplos dados acima, os espaos amostrais so: a) ={c,r} b) ={1,2,3,4,5,6} c) ={(ca,ca) , (co,co) , (ca,co) , (co,ca)} O evento aleatrio pode ser um nico ponto no espaco amostral como no exemplo a seguir: Ex.: Lanam-se dois dados, enumerando-se os seguintes eventos: A: sada de faces iguais; B: sada de faces cuja soma seja igual a 10; C: sada de faces cuja soma menor que 2; D: sada de faces cuja soma menor que 15; E: sada de faces onde uma face o dobro da outra. Determinao do espao amostral: podemos determin-lo por uma tabela (produto cartesiano).

Os eventos pedidos so: A = {(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)} B = {(4,6),(5,5),(6,4)} C = (evento impossvel)

40

D = (evento certo) E = {(1,2),(2,1),(2,4),(3,6),(6,3),(4,2)}

Outra maneira de determinar o espao amostral desse experimento usar o diagrama em arvore, que ser til para resoluo de problemas futuramente.

Eventos (E) qualquer subconjunto do espao amostral de um experimento aleatrio.Portanto, um evento pode representar mais de um resultado.

40

No jogo de dado, se o evento E significar resultado igual 2, temos A={2}. Se o evento B significar resultado par, temos B={2,4,6}. Desses resultados temos uma relao entre espao amostrais, evento e probabilidades. Porem muitas vezes til representar graficamente um espao amostral, porque isso torna mais fcil visualizar-lhe os elementos. Se considerarmos S como espao amostral e E como evento: Assim, qualquer que seja E, se E c S (E est contido em S), ento E um evento de S. Se E = S , E chamado de evento certo. Naturalmente, p(E)=1 ( a probabilidade do evento certo 1). Se E = , E chamado de evento impossvel. Portanto ,p(E)=0 ( a probabilidade do evento impossvel nula) J os eventos para a carta de copas e a carta uma figura no so mutuamente excludentes, porque algumas cartas de copas so tambm figuras. Representar graficamente um espao amostral, para torna mais fcil visualizar-lhe os elementos. Os eventos A e A so complementares
A A

Os eventos A e B so mutuamente excludentes, porque no se interceptam. Os eventos A e B no so mutuamente excludentes, pois tm alguns elementos em comum. Operaes com Eventos Aleatrios Sejam A e B dois eventos de S As seguintes operaes so definidas: A) Reunio A B O evento reunio formado pelos pontos amostrais que pertencem a pelo menos um dos eventos.
B

A B = { ( S / A ou B} ) 1 1 1
A

B S

o evento que ocorre se A ocorre ou B ocorre ou ambos ocorrem

B) Interseo A B O evento interseo formado pelos pontos amostrais que pertencem simultaneamente aos eventos A e B.

A B = { i S A e B} i i

o evento que ocorre se A e B ocorrem

40

Obs: Se A B = , A e B so eventos mutuamente exclusivos

C) Complementao S A = Ac o evento que ocorre se A no ocorre.

AC A

Ac = {i S i A}

2.2.3 Propriedades das operaes Sejam A,B, e C eventos associados a um espao amostral . As seguintes propriedades so validas.

40

2.3 Tipos de eventos Eventos Equiprovveis: Quando se associa a cada ponto amostral a mesma probabilidade, o espao amostral chama-se equiprovvel ou uniforme. Os eventos Ei,i=1,2,3......n so equiprovveis quando P(Ei)=P(E2)=P(En)=P, isto , quando todos tem a mesma probabilidade de ocorrer: P=1/n Se os n pontos amostrais ( eventos) so equiprovveis, a probabilidade de cada um dos pontos amostrais 1/n Exemplos:

r 1 P ( A ) =r ( A ) = P n n
1 Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei ou uma carta de espadas? Soluo:

P ( A B ) = P ( A) + P ( B ) P ( A B )
Eventos mutuamente exclusivos: Dois eventos A e B so denominados mutuamente exclusivos, se eles no puderem ocorrer simultaneamente, isto , A B = Ex: E = Jogar um dado e observar o resultado Sejam os eventos A= ocorrer n par e

S = {1,2,3,4,5,6}

B= ocorrer n mpar

40

Ento A e B so mutuamente exclusivos, pois a ocorrncia de um nmero par e mpar no pode ser verificada como decorrncia da mesma experincia. Eventos Complementares : Sabemos que um evento pode ocorrer ou no. Sendo p probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele no ocorra (insucesso), para um mesmo evento existe sempre a relao: p+q=1 Obs: Numa distribuio de probabilidades o somatrio das probabilidades atribudas a cada evento elementar igual a 1 onde p1 + p2 + p3 + ... + pn = 1. Eventos Independentes : Quando a realizao ou no realizao de um dos eventos no afeta a probabilidade da realizao do outro e vice-versa. Exemplo: Quando lanamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Ento qual seria a probabilidade de obtermos, simultaneamente, o n 4 no primeiro dado e o n 3 no segundo dado? Assim, sendo P1 a probabilidade de realizao do primeiro evento e P2 a probabilidade de realizao do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente dada pela frmula: P(1 n 2) = P(1 e 2) = P(1) x P(2)

P1 = P(4 dado1) = 1/6

P2 = P(3 dado2) = 1/6

P total = P (4 dado1) x P (3 dado2) = 1/6 x 1/6 = 1/36

Independncia Estatstica Um evento A considerado independente de um outro evento B se a probabilidade de A igual probabilidade condicional de O dado B. Exemplo: Em um lote de 12 peas, 4 so defeituosas, 2 peas so retiradas uma aps a outra sem reposio. Qual a probabilidade de que ambas sejam boas? A={a 1 pea boa} ; B={a 2 pea boa}; P(A B)= P(A). P(B/A)= 8/12.7/11=14/33 Isto , se: P(A)=P(A/B) evidente que, se A independente de B, B independente de A; P(B)=P(B/A). Se A e B so independentes ento P(A B)=P(A).P(B).

40