Anda di halaman 1dari 29

1

ESTATSTICA 1 Generalidades Por que estudar Estatstica ? O Desenvolvimento do raciocnio estatstico extremamente til em aplicaes de carter cientifico, comercial, etc . A estatstica um instrumento de grande utilidade na tomada de deciso. A estatstica excelente para quantificar dados. Usos da Estatstica As aplicaes da estatstica se desenvolveram de tal forma que, hoje, praticamente todo campo de pesquisa se beneficia da utilizao de mtodos estatsticos. Os fabricantes fornecem melhores produtos a custos menores atravs de tcnicas de controle de qualidade. Controlam-se doenas com auxilio de anlises que antecipam epidemias. Espcies ameaadas so protegidas por regulamentos e leis que reagem a estimativas estatsticas de modificao do tamanho das populaes. Visando reduzir as taxas de casos fatais, os legisladores tm melhor justificativa para leis como as que regem a poluio atmosfrica, inspees de automveis, utilizao do cinto de segurana e da bolsa de ar, e dirigir em estado de embriaguez. Citamos apenas esses exemplos, porque uma compilao completa das aplicaes da estatstica facilmente tomaria o resto deste polgrafo. Alguns estudantes escolhem um curso de estatstica porque exigido, mas um nmero cada vez maior o faz voluntariamente, porque reconhecem seu valor e aplicabilidade em qualquer campo em que pretendam trabalhar. Como os empregadores gostam de ver um curso de estatstica no currculo de um candidato, o profissional que tiver estudado estatstica levar vantagem ao procurar um emprego. Afora razes relacionadas com a obteno de emprego e com a disciplina, o estudo da estatstica pode tornar o profissional mais crtico em sua anlise de informaes, e menos sujeito a afirmaes enganosas, como as que se acham comumente associadas a pesquisas, grficos e mdias. Como membro educado e responsvel da sociedade, o leitor deve aguar sua capacidade reconhecer dados estatsticos distorcidos e de interpretar inteligentemente dados que se apresentem sem distoro. Exemplo de afirmaes estatsticas incorretas Os motoristas mais idosos so mais seguros do que os mais moos? A Americon Association of Retired People - AARP (Associao Americana de Aposentados) alega que os motoristas mais idosos se envolvem em menor nmero de acidentes do que os mais jovens. Nos ltimos anos, os motoristas com 16 a 19 anos de idade causaram cerca de 1,5 milho de acidentes, em comparao com apenas 540.000 causados por motoristas com 70 anos ou mais, de forma que a alegao do AARP parece vlida. Acontece, entretanto, que os motoristas mais idosos no dirigem tanto quanto os mais jovens. Em lugar de considerar apenas o nmero de acidentes, devemos examinar tambm as taxas de acidentes. Eis as taxas de acidentes por 100 milhes de milhas percorridas: 8,6 para os motoristas com idades de 1 6 a 19; 4,6 para os com idade de 75 a 79; 8,9 para os com idade de 80 a 84 e 20,3 para os motoristas com 85 anos de idade ou mais. Embora os motoristas mais jovens tenham de fato maior nmero de acidentes, os mais velhos apresentam as mais altas taxas de acidente. Existem vrias maneiras de se cometer erros ou abusos em Estatstica. Algumas por simples

2
distrao ou ignorncia; outras por m f. Eis alguns erros ou abusos Pequenas Amostras Embora as pequenas amostras no sejam necessariamente ms; entretanto, os resultados obtidos com elas podem por vezes ser usados como uma forma de "mentira" estatstica. As preferncias de apenas 10 dentistas por determinado creme dental no devem servir de base para uma afirmao generalizada como "O creme dental XYZ recomendada por 7 em cada 10 dentistas. Mesmo que a amostra seja grande, ela deve ser no-tendenciosa e representativa da populao de onde provm. s vezes uma amostra pode parecer realmente grande (como em uma pesquisa com "2000 adultos escolhidos aleatoriamente"), mas se forem formuladas concluses acerca de subgrupos, como gachos catlicos do sexo masculino, tais concluses podem estar baseadas em amostras pequenas e tendenciosas. Estimativas por Suposio Outra fonte de engano estatstico envolve estimativas que so, na verdade, suposies (ou, na linguagem popular, "palpites"), podendo apresentar erros substanciais. E preciso considerar a fonte da estimativa e a maneira como foi estabelecida. Quando o Papa visitou Miami, as fontes oficiais estimaram a multido em 250.000 pessoas, mas, utilizando fotos areas, o Miami Herald chegou a uma cifra mais precisa de apenas 150.000. Cifras Parciais "90% dos carros vendidos nos EUA nos ltimos 10 anos ainda esto rodando. Milhes de consumidores ouviram esta mensagem e ficaram com a impresso de que esses carros devem ter sido muito bem construdos para durarem tanto. O que o fabricante no mencionou foi que 90% dos carros por ele vendidos o foram nos ltimos trs anos. A alegao, embora tecnicamente correta, era enganosa, por no apresentar os resultados completos. Distores Deliberadas No livro Tainted Truth, Cynthia Crossen cita um exemplo da revista Corporate Travel que publicou dados mostrando que, entre as companhias locadoras de carros, a empresa Avis foi vencedora em uma pesquisa junto aos locatrios. Quando a empresa Hertz solicitou informaes detalhadas sobre a pesquisa, as respostas desapareceram e o coordenador da pesquisa se demitiu. A Hertz processou a Avis e a revista que divulgou a pesquisa por falsa propaganda . Perguntas Tendenciosas As perguntas em uma pesquisa podem ser formuladas de modo "sugerirem" uma resposta. Um caso a ser comentado da pesquisa levada a termo em que uma mesma pergunta foi feita de duas maneiras diferente. A primeira perguntava Voc apia a fabricao de armas atmicas que podem matar milhes de pessoas inocentes, sim ou no? e a segunda pergunta Voc apia a fabricao de armas atmicas como forma de auto defesa de um pas, sim ou no?. Quando feita a primeira pergunta o nmero de pessoas que respondeu sim foi muito pequeno (10%), quando feita segunda pergunta o nmero de sim foi muito grande (85%). s vezes as perguntas se apresentam involuntariamente tendenciosas em virtude de fatores como a ordem dos itens a serem considerados. Por exemplo, uma pesquisa alem formulou estas duas perguntas: O leitor diria que o trfego contribui em maior ou menor grau do que a indstria para a poluio atmosfrica?

3
O leitor diria que a indstria contribui em maior ou menor grau do que o trfego para a poluio atmosfrica? Quando o trfego foi mencionado em primeiro lugar, 45% acusaram o trfego e 32% acusaram a indstria; quando a indstria foi citada em primeiro lugar, as porcentagens se modificaram grandemente para 24% e 57%, respectivamente.

Grficos Enganosos Muitos dispositivos visuais - como grficos de barras e grficos em setores - podem ser utilizados para exagerar ou diminuir a verdadeira natureza de um conjunto dados. (assunto a ser visto melhor mais adiante no polgrafo) Os dois grficos da Figura 1.1 representam os mesmos dados do Bureau of Labor Statistics (Departamento de Estatstica do Trabalho), mas a parte (b) tem como objetivo exagerar a diferena entre ganhos dos homens e os das mulheres. No partindo do zero, eixo vertical, o grfico (b) tende a produzir uma impresso subjetiva errnea. A Figura 1.1 nos d uma lio importante. Devemos analisar as informaes numricas contidas em um grfico no nos deixando enganar por sua forma geral.

Presso do Pesquisador Quando se formulam perguntas a indivduos pesquisados, esses freqentemente do respostas favorveis sua auto-imagem. Em uma pesquisa telefnica 94% dos que responderam disseram que lavam suas mos aps usar um banheiro, mas a observao em lugares tais como estaes rodovirias e banheiros pblicos mostraram que o percentual efetivo de apenas 68%. Ms Amostras (pesquisa auto selecionvel) Outras fontes de estatstica enganosas so os mtodos inadequados de coleta de dados. comum um pesquisador analisar dados e formular concluses errneas porque o mtodo de coleta de dados foi deficiente. Um exemplo tpico a pesquisa feita pelo programa voc decide em que o nmero espectadores de televiso pagaram 27 centavos para discar um nmero de telefone dando sua opinio sobre o final do programa a cada semana. Os resultados mostravam o desejo dos que ligavam, que eram interpretados como o desejo da populao. Como os prprios espectadores que decidiram se seriam includos na pesquisa, temos um exemplo de pesquisa auto-selecionada, que se define como segue. Em tais pesquisas, o que freqentemente ocorre que participam apenas aqueles que tm uma opinio firmada, resultando da que a amostra dos que respondem no representativa da populao como um todo. Dessa forma, nada podemos concluir sobre a populao em geral, dada maneira como se obteve a amostra. 1.1. Introduo a Estatstica

4
Por ande quer que se olhe ou escute uma coleo de nmeros so normalmente enunciados como estatsticas. Estes nmeros referem-se aos mais diversos campos de atividades esportes, economia, finanas, etc. Como por exemplo. O nmero de carros vendidos no pas diminuiu em 30% A taxa de desemprego na Argentina atinge, hoje, 25%. As aes da PETROBRAS valorizaram R$ 1,5 hoje. Resultados do Carnaval no trnsito brasileiro: 145 mortos, 2430 feridos. Um nmero denominado uma estatstica (singular). No fechamento da bolsa as aes da Vale foram cotadas a R$ 45.50. As vendas de uma empresa no ms constituem uma estatstica. Por outro lado, uma coleo de nmeros ou fatos denominado de estatsticas (plural). Por exemplo, As vendas da empresa QUALQUER COISA totalizaram: 2,5 milhes em janeiro, 2,7 em fevereiro e 3.1 em maro. No entanto o termo Estatstica tem um sentido muito mais amplo, do que apenas nmeros ou coleo de nmeros. A Estatstica pode ser definida como: A cincia de coletar, organizar, apresentar, analisar e interpretar dados numricos com o objetivo de tomar melhores decises. Assim como advogados possuem 'regras de evidncia' e contabilistas possuem 'prticas comumente aceitas', pessoas que tratam com dados numricos seguem alguns procedimentos padres. Alguns destes mtodos sero vistos nesta disciplina. No esquecendo que uma nica disciplina de Estatstica no esgota o assunto, ou seja, esta disciplina dar apenas urna idia dos procedimentos e tcnicas existentes para se lidar com dados numricos. 1.2. Diviso da Estatstica A Estatstica que trata com a organizao, resumo e apresentao de dados numricos denominada Estatstica Descritiva. Assim pode-se resumir : Estatstica Descritiva: Os procedimentos usados para organizar, resumir e apresentar dados numricos Conjuntos de dados desorganizados so de pouco ou nenhum valor. Para que os dados se transformem em informao necessrio organiz-los, resumi-los e apresent-los. O resumo de conjuntos de dados feito atravs das medidas e a organizao e apresentao atravs das distribuies de freqncias e dos grficos ou diagramas. Muitas vezes, apesar dos recursos computacionais e da boa vontade no possvel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto. O principal motivo para se trabalhar com uma parte do conjunto ao invs do conjunto inteiro o custo mais baixo de lidar com uma parte. Estatstica inferencial: A coleo de mtodos e tcnicas utilizados para se estudar uma Populao baseada em amostras probabilstica desta mesma populao O conjunto de todos os elementos que se deseja estudar denominado de populao. Note-se que o termo populao usado num sentido amplo e no significa, em geral, conjunto de pessoas. Pode-se definir uma populao como sendo:

5
Populao: Uma coleo de todos os elementos, objetos ou medidas de interesse. Assim, so exemplos de populaes: Conjunto das rendas de todos os habitantes de Porto Alegre Conjunto de todos as notas dos alunos de Estatstica; Conjunto das alturas de todos os alunos da Universidade, etc. Quando se deseja trabalhar com toda a populao necessrio fazer um levantamento completo dos elementos desta populao. Para tanto se utiliza de um processo chamada Censo. Assim, podemos considerar: Censo ou levantamento censitrio: um levantamento efetuado sobre toda uma populao Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muito difcil. Isto se deve a vrios fatores. O principal o custo. Um censo custa muito caro e demanda um tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da populao denominadas de amostras. Uma amostra pode ser caracterizada como: Amostra: uma poro ou parte de uma populao de interesse Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na Agricultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver pelos seguintes exemplos: Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter urna idia do desempenho dos vrios candidatos nas futuras eleies (pesquisas eleitorais). Uma empresa metal mecnica toma uma amostra do produto fabricado em intervalos de tempo especificados para verificar se o processo est sob controle e evitar a fabricao de bens defeituosos. (controle de qualidade) O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc. (elaborao de ndices) Redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos programas para fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfatria. (pesquisa de audincia IBOPE) Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos. A escolha de amostras para estudo feita seguindo uma serie de procedimentos cientficos como forma de garantir que a amostra selecionada represente efetivamente a populao em estudo. Este processo de escolha de amostra chamado amostragem pode ser definido como: Amostragem: o processo de escolha de uma amostra da populao Riscos da amostragem. O processo de amostragem envolve riscos, pois se tomam decises sobre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser utilizada para fornecer uma idia do risco envolvido, ou seja, do erro que se comete ao utilizar uma amostra ao invs de toda a populao, desde que, claro, a amostra seja selecionada atravs de

6
critrios probabilsticos, isto , ao acaso. Exerccios da Introduo a) Uma pessoa encarregada de uma pesquisa sobre uma determinada marca de calcado, decide utilizar a lista telefnica para fazer a pesquisa. Esta escolha esta correta (sim ou no) ? diga porque? b) Um relatrio patrocinado pela Beer cervejas S.A. concluiu que os nveis de leos Omega 3, altamente benficos para o corpo aumentam com a ingesto de cerveja. Porque esta pesquisa pode ser suspeita? c) Uma pesquisa afirmou que 89% das pessoas acham que aumentou a procura pelo servio social no Brasil, nos ltimos anos. A questo foi apresentada numa revista e as respostas foram encaminhadas por e-mail. Ate que ponto e valido este resultado? d) Uma pesquisa feita incluiu o seguinte item a ser respondido pelos entrevistados informe sua altura?. Registre dois problemas nesta pesquisa. e) Uma pesquisa feita por um jornal perguntava Voc apia o desenvolvimento de armas nucleares que poderiam matar milhes de pessoas inocentes?. Os resultados mostraram que das 20 pessoas que ligaram e responderam 87% disseram no e 13% disseram sim. Pode-se aceitar este resultado, diga as razoes para aceitar ou no? f) Uma pesquisa afirma que mulheres grvidas podem aumentar suas chances de terem bebes saudveis comendo lagosta. A alegao baseia-se em um estudo que os filhos de mulheres que comeram lagosta na gravidez eram mais saudveis do que os filhos das que no comeram. Diga qual o erro na afirmao? Respostas a) no, as pessoas no listadas e sem telefone no sero ouvidas b) Um relatrio patrocinado por uma empresa de cervejas muito provavelmente chegara a resultados favorveis a seus produtos. c) Como os pesquisados so auto-selecionados , os resultados da pesquisa no so vlidos. d) Os pesquisados podem no saber exatamente sua altura ou por questes de auto-imagem informar errado. e) No, a pesquisa auto selecionvel. O numero de pesquisados pequeno. A pergunta induz a uma resposta no. Os resultados no so compatveis com o numero de pesquisados (87% de 20 pessoas= 17,4 pessoas) f) Mes que comem lagosta tendem a ser mais abastadas, e, portanto tem mais condies financeiras para pagar atendimento mdico para seus filhos.

2 Representao grfica de dados estatsticos Noes bsicas de grficos em Excel Criando Grficos Voc pode criar grficos de duas maneiras: na mesma planilha de seus dados ou numa planilha separada de grfico na mesma pasta de trabalho. Quando voc cria um grfico, na mesma planilha de seus dados, pode visualizar ao mesmo tempo tanto os dados como o grfico. Quando voc cria um grfico numa planilha de grfico separada, na mesma pasta de trabalho, ainda tem acesso fcil a ele, mas pode imprimi-lo separadamente. Criando Grficos numa Planilha Selecione os dados da planilha com os quais se deseja construir um grfico, selecione inclusive o ttulo, no se preocupe ainda com os valores do eixo X, e em seguida clique no cone

Ser aberta uma janela do Assistente Grfico para construo do mesmo, selecione o tipo de grfico desejado e clique em avanar:

Na etapa 2, confira se o intervalo de dados selecionado est correto, neste caso selecionamos da clula B4 at a clula D12, deveremos ento ter como Intervalo de Dados a seguinte sentena: =Plan1!$B$4:$D$12, que significa que estamos construindo um grfico com os valores da Planilha1 do intervalo de clulas compreendido entre a clula B4 e a clula D12:

9
Em seguida deveremos clicar na aba Seqncia, para conferirmos as sequncias de formao do grfico e inserirmos os valores do Eixo X:

Os valores referentes ao Eixo X esto em branco, deveremos entrar com os mesmos, =Plan1!$A$5:$A$12, clique no boto avanar:

10
Na etapa 3 verifique se o grfico est Ok e entre com os nomes que aparecero em seu grfico, no ttulo, no eixo X e no Eixo Y

Outros dados como os eixos, linhas de grade, legenda, tabela tambm podem ser formatados nesta etapa, clique em avanar:

11
Na etapa 4 ser perguntado se o grfico dever ser colocado em uma planilha nova ou como um objeto da planilha atual, neste caso usamos como objeto da planilha atual para que a tabela e o grfico apaream juntos, clique em Concluir:

Finalmente o seu grfico est concludo conforme abaixo, selecione e coloque-o na posio desejada, o tamanho do grfico tambm pode se alterado clicando na borda e arrastando:

12
Concluso: Vamos analisar como o Excel montou este grfico, pois a partir dele poderemos montar qualquer outro. Primeiro voc selecionou os dados que possibilitariam ao Excel montar o grfico, sem se preocupar com os valores dos eixos X e Y. De posse dos dados o Excel verificou qual o menor (13,40) e o maior valor (265,00), para definir a escala de valores do Eixo Y. Em seguida o Excel procura pela quantidade de variveis que iro compor o grfico, no nosso caso so 3 (gua, Rao, Peso), ou seja cada linha da tabela de dados ser feita uma comparao entre as 3 variveis. Para finalizar marcamos os valores que definiro o perodo de variao do grfico, que podero ser meses, dias, anos, percentuais, etc., no nosso caso dias. Com isto o Excel j tinha todos os dados para montar o grfico. Grficos Estatisticos Na maioria das vezes analisar um conjunto de dados, alm de cansativo e por vezes difcil, na medida em que o nmero de informaes demasiado ou difcil visualizar diferenas bsicas entre estas informaes. Para resolver esta situao sem necessariamente abandonar os dados numricos pode-se utilizar a representao grfica dos mesmos como forma de se ter um primeiro entendimento do problema e avaliar as concluses previas. Abaixo alguns exemplos ilustraro melhor esta afirmativa. Na tabela abaixo informada a populao de um determinado pais (em milhes de habitantes) para os anos de 1840,1850, ... , 1960. Anos Anos 1840 1850 1860 1870 1880 1890 1900 1910 1920 1930 Populao 17,1 23,2 31,4 39,8 50,2 62,9 76 92 105,7 122,8 (em milhes de hab) (fonte: Servio de Recenseamento federal) Para estes dados que embora aparecem em pequeno nmero, impossibilitam num primeiro momento uma anlise preliminar das informaes nela contidas, porm se forem analisados graficamente pode-se extrair facilmente vrias informaes qualitativas importantes. Para tanto diversos tipos de grficos podem ser construdos. 2.1 Grfico de Linha Ao longo do grfico marcamos cada ponto composto da coordenadas (anos, populao) por um smbolo e posteriormente unimos cada dois pontos por uma linha reta, pois nenhuma informao fornecida entre cada 2 pontos. Ademais num grfico sempre necessrio aparecer: TITULO, FONTE , LEGENDA (quando for o caso), TITULO DOS EIXOS. Os grficos em linha so muito indicados para mostrar taxas de variaes no dados. Exemplo

13

Obs.: Uma tabela ou grfico, que mostre uma distribuio de uma varivel em funo do tempo e denominada de Srie Temporal 2.2 Grfico de Barras O grfico de barras representado por barras com larguras sempre iguais, sem tamanho pr-definido, desde que ano se sobreponham. Pode-se colocar um nmero acima de cada barra para representar seu valor, porm isto facultativo. Este tipo de grfico e muito utilizado para evidenciar comparaes entre as variveis ao longo da varivel no eixo x. Exemplo

2.3 grficos ilustrativos

14
Os grficos ilustrativos tambm chamados pictogramas so freqentemente usados para apresentar dados estatsticos de modo a despertar ateno do pblico em geral. Muitos destes pictogramas apresentam grande dose de originalidade e arte. Os nmeros que representam cada quantidade podem ou no ser includos. Exemplo

Para os grficos em barra e linhas, podemos representar mais de uma varivel, conforme veremos a seguir usando a seguinte tabela:
Anos Milho (em milhes) Trigo (em milhes) Total 1950 200 75 275 1951 185 90 275 1952 225 100 325 1953 250 85 335 1954 240 80 320 1955 195 100 295 1956 210 110 320 1957 225 105 330 1958 250 95 345 1959 230 110 340 1960 235 100 335

Fonte: Ministrio da Agricultura

2.4 Grfico de linha Mltiplo Grfico til para evidenciar variaes de taxa.

15

2.5 Grfico de Barra Mltiplo Grfico til para evidenciar comparaes em valores absolutos entre as variveis.

2.6 Grfico de barras superpostas Grfico til para evidenciar comparaes e valores absolutos e facilitar verificao do valor total a cada perodo entre as variveis. Inclusive pode-se colocar a cima de cada barra o valor do total de forma facultativa.

16

2.7 Grfico de Percentagens Complementares em Barras Este tipo grfico e muito indicado para salientar comparao percentual entre a variveis em cada perodo apresentado, entretanto no muito til para comparaes entre perodo, pois no mostra o valor absoluto (real) de cada varivel ao longo dos perodos.

2.8 Grfico em barras para dados Nominais Este grfico e bastante utilizado para representar rotulados no por valores, mas por nomes, pois quando este grfico apresentado na horizontal (barras horizontais) a leitura fica favorecida . A tabela abaixo, apresenta a reas dos continentes mundiais em Km2

17

2.9 Grfico de Setores Circulares Tambm chamado comumente de grfico de Pizza. Que para os dados acima apresenta o seguinte grfico:

18
Exerccios de Grficos estatsticos Exerccio 1 A seguinte tabela mostra o nmero de trabalhadores Rurais e no Rurais dos Estados Unidos, nos anos de 1950 a 1960 . Representar graficamente os dados empregando : a) Grfico de Linha b) Grfico de Barras c) Grfico de Barras Complementares; d) Grfico de Barras Superpostas
Anos Trabalhador Rural Trabalhador no Rural Total 1950 3,7 1,7 5,4 1951 4,9 2,8 7,7 1952 6,2 4,3 10,5 1953 8,6 6,1 14,7 1954 9,9 8,8 18,7 1955 10,9 13,4 24,3 1956 11,6 18,2 29,8 1957 11,4 25,8 37,2 1958 10,5 31 41,5 1959 8,8 38,4 47,2 1960 6,8 42,9 49,7

Fonte : Ministrio da Agricultura Exerccio 2 Para a tabela abaixo , faa: a) grfico de Setores Circulares b) grfico de Barras Horizontais

Respostas

19

3 - Resumo de pequenos conjuntos de dados 3.1. Introduo Para se analisar um conjunto de valores necessrio primeiramente, para fins de notao, distinguir se este conjunto resultado de um censo ou de uma amostragem. A Estatstica Descritiva pode ser estudada considerando os conjuntos de valores analisados como sendo amostras ou ento populaes. Como o caso mais comum a obteno de amostras a notao apresentada ser feita considerando os valores como resultados de amostragens. No entanto, convm ficar atento, com a bibliografia, pois dependendo do autor a orientao pode ser outra. A diferena, considerada do ponto de vista da descrio dos dados, apenas notacional. Assim o tamanho de uma populao (quando finita) representado, normalmente por 'N', enquanto que o tamanho de amostra representado por 'n'. Afora algumas excees os valores calculados na amostra so representados por letras latinas, enquanto que os correspondentes na populao o so pelas mesmas letras s que gregas. Para facilitar o estudo da Estatstica Descritiva os conjuntos de valores sero considerados como pequenos e grandes. Assim se um conjunto tiver 30 ou menos valores a anlise ser feita sem o agrupamento. Caso o conjunto tenha mais do que 30 valores ento primeiramente ser feito o agrupamento de acordo com o tipo de varivel considerada. O valor 30 apenas um ponto de referncia escolhido arbitrariamente e dependendo da situao pode-se considerar o agrupamento com mais ou menos valores envolvidos. Um conjunto de dados, de qualquer tamanho, pode ser resumido de acordo com as seguintes medidas: Medidas de tendncia central ou posio Medidas de disperso ou variabilidade. Medidas de assimetria. Medidas de achatamento ou curtose. 3.2. Medidas de posio ou tendncia central Um conjunto de valores (amostra) ser representada por x 1 , x 2 , , x n , onde 'n' o nmero de elementos do conjunto, isto , o tamanho da amostra ou da populao. 3.2.1. As mdias (a) A mdia aritmtica

20
A mdia aritmtica do conjunto representada por x quando se refere a amostra e por quando se refere a populao e calculada em ambos os casos pela seguinte formula:

ou utilizando os recursos do Excel pela funo MDIA(nm1;nm2; ...) onde: Nm1; nm2;... so de 1 a 30 argumentos numricos para os quais voc deseja obter a mdia. Comentrios Os argumentos devem ser nmeros ou eles devem ser nomes, matrizes ou referncias que contenham nmeros. Se uma matriz ou argumento de referncia contiver texto, valores lgicos ou clulas vazias, estes valores sero ignorados; no entanto, clulas com valor zero sero includas. Dica Ao calcular a mdia de clulas, lembre-se da diferena entre clulas vazias e aquelas que contm o valor zero, principalmente se voc tiver desmarcado a caixa de seleo Valores zero na guia Exibir (comando Opes, menu Ferramentas). As clulas vazias no so contadas mas os valores zero so. Exemplo Talvez seja mais fcil compreender o exemplo se voc copi-lo para uma planilha em branco.

Como fazer ? Digite na clula escolhida a funo e seus parmetros Frmula =MDIA(A2:E2) ou = MDIA(10;3;4;5;8) Descrio (resultado) A mdia dos nmeros acima (6)

Ou use a funo inserir do Excel conforme o desenho abaixo

21

(b) A mdia geomtrica A mdia geomtrica dos valores positivos x 1 , x 2 , por:

, x n , representada por x g e calculada

ou utilizando os recursos do Excel atravs da funo MDIA.GEOMTRICA(nm1;nm2;...) Nm1, nm2,... so de 1 a 30 argumentos para os quais voc deseja calcular a mdia. Voc tambm pode usar uma nica matriz ou referncia a uma matriz em vez de argumentos separados por ponto-e-vrgulas. Comentrios Os argumentos devem ser nmeros, ou nomes, matrizes ou referncias que contenham nmeros. Se uma matriz ou argumento de referncia contiver texto, valores lgicos ou clulas vazias, estes valores sero ignorados; no entanto, clulas com valor zero sero includas. Se qualquer valor de dados 0, MDIA.GEOMTRICA retornar o valor de erro #NM!.

22

A equao para a mdia geomtrica :

Exemplo

Como fazer ? Digite na clula escolhida a funo e seus parmetros Frmula =MDIA.GEOMETRICA (A2:E2) ou = MDIA.GEOMETRICA (10;3;4;5;8) Descrio (resultado) A mdia geomtrica do conjunto de dados acima (5,4481)

(e) A mdia harmnica A mdia harmnica dos valores positivos x 1 , x 2 , por:

, x n , representada por x g e calculada

Observando a expresso do clculo da mdia harmnica pode-se verificar que ela definida como sendo: O inverso da mdia aritmtica dos inversos dos valores. ou utilizando o Excel atravs da funo

MDIA.HARMNICA(nm1;nm2;...) Nm1, nm2,... so de 1 a 30 argumentos para os quais voc deseja calcular a mdia. Voc tambm pode usar uma nica matriz ou referncia a uma matriz em vez de argumentos separados por ponto-e-vrgulas. Comentrios Os argumentos devem ser nmeros, ou nomes, matrizes ou referncias que contenham nmeros. Se uma matriz ou argumento de referncia contiver texto, valores lgicos ou clulas vazias, estes valores sero ignorados; no entanto, clulas com valor zero sero includas. Se qualquer ponto de dados 0, MDIA.HARMNICA retornar o valor de erro #NM!. A mdia harmnica sempre ser menor que a mdia geomtrica, que sempre ser menor que a mdia aritmtica. Exemplo

23

Como fazer ? Digite na clula escolhida a funo e seus parmetros


Frmula =MDIA.HARMNICA (A2:E2) ou = MDIA. HARMNICA (10;3;4;5;8) Descrio (resultado) A mdia harmnica do conjunto de dados acima (49586)

(d) Relao entre as trs mdias. As trs mdias mantm a seguinte relao entre elas, desde que os valores sejam positivos e diferentes entre si. (e) A mdia aritmtica ponderada A mdia aritmtica ponderada do conjunto x 1 , x 2 , , x n , com pesos w 1 , w 2 , , w n , onde a varivel x representa os valores e w o respectivos pesos de cada varivel esta mdia representada por x p e calculada por.

Infelizmente esta medida de tendncia no possui uma funo especifica no Excel, portanto devese estrutur-la na planilha conforme o exemplo abaixo

Exemplo A mdia da primeira prova de Estatstica da turma 135 foi de 6.0 e foi realizada por 55 alunos. Na segunda prova compareceram 50 alunos que tiveram uma mdia de 6,5. A terceira prova realizada por 40 alunos teve mdia de 5,5. Qual a mdia geral das trs provas? Soluo:

ou utilizando a planilha tem-se:

24

3.2.2. A mediana A mediana de um conjunto ordenado de valores, anotada por me, definida como sendo o valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se 'n' (nmero de elementos) mpar a mediana o valor central do conjunto. Caso contrrio a mediana a mdia dos valores centrais do conjunto. Tem-se:

Exemplo

Utilizando o Excel pode-se usar a funo MED(nm1;nm2;...) Nm1; nm2;... so de 1 a 30 nmeros dos quais voc deseja obter a mediana. Comentrios Os argumentos devem ser nmeros ou nomes, matrizes ou referncias que contenham nmeros. O Microsoft Excel examina todos os nmeros em cada argumento de referncia ou matriz.

25
Se uma matriz ou argumento de referncia contiver texto, valores lgicos ou clulas vazias, estes valores sero ignorados; no entanto, clulas com valor zero sero includas. Se houver uma quantidade par de nmeros no conjunto, MED calcular a mdia dos dois nmeros do meio. Consulte a segunda frmula no exemplo. Exemplo

Como fazer ? Digite na clula escolhida a funo e seus parmetros


Frmula =MED (A2:E2) ou = MED (10;3;4;5;8) Descrio (resultado) A mediana do conjunto de dados acima (5)

3.2.3. A moda A moda de um conjunto de valores, anotada por mo, definida como sendo o valor (ou os valores) do conjunto que mais se repete. Convm lembrar que a moda ao contrario da mediana e da mdia pode no ser nica, isto , um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem moda). Exemplo. Dado o conjunto: 1; 2; 2; 3; 3; 4; 4; 4; 7; 9; 15 A moda ser: mo = 4, Pois este valor se repete trs vezes no conjunto e qualquer outra se repete duas ou menos vezes.
ou utilizando o Excel atravs da funo MODO(nm1;nm2;...) Nm1, nm2,... so argumentos de 1 a 30 para os quais voc deseja calcular o modo. Voc tambm pode usar uma nica matriz ou referncia a uma matriz em vez de argumentos separados por pontos-e-vrgulas. Comentrios Os argumentos devem ser nmeros ou nomes, matrizes ou referncias que contenham nmeros. Se uma matriz ou argumento de referncia contiver texto, valores lgicos ou clulas vazias, estes valores sero ignorados; no entanto, clulas com valor zero sero includas. Se o conjunto de dados no contiver pontos de dados duplicados, MODO retornar o valor de erro #N/D. Em um conjunto de valores, o modo o valor com ocorrncia mais freqente, a mediana o valor do meio e a mdia o valor mdio. Nenhuma medida nica de tendncia central fornece um quadro completo dos dados. Suponha que os dados estejam agrupados em trs reas, metade em torno de um nico valor baixo e a outra metade em torno de dois valores altos. MDIA e MED podem retornar um valor no meio relativamente vazio, enquanto que MODO pode retornar o valor baixo dominante. Exemplo

26
Como fazer ? Digite na clula escolhida a funo e seus parmetros
Frmula =MED (A2:E2) ou = MED (1; 2; 2; 3; 3; 4; 4; 4; 7; 9; 15) Descrio (resultado) O modo ou o nmero que ocorre com mais freqncia acima (4)

3.3. Medidas de variabilidade ou disperso 3.3.1. A amplitude A mais simples das medidas de disperso a amplitude, anotada por 'h', e definida como sendo a diferena entre os valores extremos do conjunto, isto .

Exemplo A amplitude do conjunto: -5; 4; 0; 3; 8; 10 vale: 3.3.2. O desvio mdio (absoluto) A amplitude uma medida simples e fcil de calcular. Tem a virtude de dar uma idia da variabilidade do conjunto. No entanto ela no leva em considerao todos os valores do conjunto como seria desejvel. Assim prefere-se, em geral, trabalhar com medidas que utilizam toda a informao disponvel. Uma destas medidas o desvio mdio absoluto ou. simplesmente desvio mdio. O desvio mdio representado por 'DMA' e definido como sendo 'a mdia das distncias que os valores do conjunto se encontram da mdia'.

Exemplo. Utilizando a frmula acima . Calcular o DMA do conjunto: 1; 4; 1; 3; 7; 2 A mdia

Ento o desvio mdio ser:.

ou utilizando o Excel atravs da funo DESV.MDIO(nm1;nm2;...)

27
Nm1; nm2; ... so argumentos de 1 a 30 para os quais voc deseja obter a mdia aritmtica dos desvios absolutos. Voc tambm pode usar uma matriz nica ou uma referncia a matriz em vez dos argumentos separados por vrgulas. Comentrios Os argumentos devem ser nmeros ou eles devem ser nomes, matrizes ou referncias que contenham nmeros. Se uma matriz ou argumento de referncia contiver texto, valores lgicos ou clulas vazias, estes valores sero ignorados; no entanto, clulas com valor zero sero includas. DESV.MDIO influenciada pela unidade de medida nos dados de entrada.

Frmula
=DESV.MDIO(A2:F2) ou = DESV.MDIO(1; 4; 1; 3; 7; 2)

Descrio (resultado)
A mdia dos desvios absolutos dos nmeros acima de sua mdia (1,6666)

Obs.: Pode ser provado que a soma dos desvios no absolutos sempre Zero 3.3.3. A varincia O desvio mdio apesar de intuitivamente fcil de interpretar e simples de calcular no muito utilizado em Estatstica. O que de fato a medida de disperso usual a varincia e principalmente sua raiz quadrada que denominada de desvio padro. A varincia anotada por s2 quando usada em amostras e 2 quando usado para populao, em ambos os casos definida como sendo 'a mdia dos quadrados dos desvios em relao mdia aritmtica.' Por desvio entendese a diferena entre um valor do conjunto e a mdia aritmtica deste conjunto.

3.3.4. O desvio padro A varincia por ser um quadrado no permite comparaes com a unidade que se est trabalhando. Para se ter uma medida de variabilidade com a mesma unidade do conjunto utiliza-se a raiz quadrada da varincia, que denominada de desvio padro. Assim a expresso para o desvio :

Exemplo:

28

Podemos ainda utilizar as seguintes funes do Excel VAR(nm1;nm2; ...) Nm1;nm2;... so de 1 a 30 argumentos numricos correspondentes a uma amostra de populao. Comentrios VAR considera que os argumentos so uma amostra da populao. Se os dados representarem toda a populao, voc dever calcular a varincia usando VARP. Valores lgicos, como VERDADEIRO e FALSO, e o texto so ignorados. Se os valores lgicos e o texto no puderem ser ignorados, use a funo de planilha VARA.

3.3.5. A varincia relativa A varincia relativa, representada por g2 quadrado da mdia. Isto :

o quociente entre a varincia absoluta o

3.3.6. O coeficiente de variao O coeficiente de variao a raiz quadrada da varincia relativa. Isto :

Exemplo:

29
Exerccios de medidas de tendncia (dados no agrupados) 1. possvel encontrar a seguinte srie de desvios em relao mdia aritmtica (isto , diferena entre valores e mdia de um grupo de dados) , isto x-mdia dado por ( 4, -3, 2, -7 e 5) ? Justifique. 2. Dados dois grupos de pessoas, o grupo A com 10 elementos e o grupo B com 40 elementos. Se a nota mdia do grupo A for de 80 e o do grupo B for de 70 ento verdade que a nota mdia dos dois grupos considerados em conjunto de 75? Justifique. 3. Um concurso realizado simultaneamente nos locais A. B e C. apresentou as mdias : 70, 65 e 45. Obtidos por 30, 40 e 30 candidatos, nessa ordem. Qual foi a mdia geral do concurso? 4. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma mdia de 70 pontos em determinada prova. Sabendo-se que a mdia geral dos candidatos (independente de sexo) foi de 64 pontos, qual foi a mdia dos candidatos do sexo feminino? 5.Determinar a moda dos seguintes conjuntos 5.1. 1, 6, 9, 3, 2, 7, 4 e 11 5.2. 6, 5, 5, 7, 5, 6, 5, 6, 3, 4, e 5 5.3. 8, 4. 4, 4, 4, 6, 9, 10, 10, 15, 10, l6 e 10 5.4. 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28. 28 e 18 6. Determinar a mediana dos seguintes conjuntos: 6.1. 9 14 2 8 7 14 3 21 1 6.2. 0,02 0,25 0,47 0,01 -0,30 -0.5

7.Para os conjuntos abaixo, determinar com aproximao centesimal, as seguintes medidas: a)A amplitude b)desvio mdio c)A varincia d)desvio padro e)coeficiente de variao. 7.1. 0,04 ; 0,18; 0,45; 1,29; 2,35;

Respostas 1.No, pois a soma dos desvios diferente de zero 2. No, pois o clculo deve ser realizado atravs da mdia ponderada e no da mdia aritmtica Simples 3. 60.50 4. 55 5. (5.1.) Amodal (5.2.) 5 (5.3.) 4 e 10 (5.4.) 18 6. (6.1) 8 (6.2) 0,015 (6.3) 716 7. (7.1) (a) 2.31 (b) 0,77 (c) 0,74 (d) 0,86 (e) 99,90%