Anda di halaman 1dari 64

ESTATSTICA DESCRITIVA CAPTULO 1 - DISTRIBUIO DE FREQNCIAS

BIBLIOGRAFIA CONSULTADA: 1. ANDERSON, D.R.; SWEENEY, D.J. & WILLIAMS, T.A. Estatstica Aplicada Administrao e Economia. 2.ed. So Paulo: Pioneira Thomson Learning, 2002. 2. BUSSAB, W. O. & MORETIN, P. Mtodos Quantitativos: Estatstica Bsica. 5.ed. So Paulo: Saraiva, 2002. 3. MARTINS, G. A. Estatstica Geral e Aplicada. 2.ed. So Paulo: Atlas, 2002. 4. MARTINS, G. A. & DONAIRE, D. Princpios de Estatstica. 4.ed. So Paulo: Atlas, 1995. 5. MEDEIROS, E. S. e colaboradores. Estatstica para os Cursos de Economia, Administrao e Cincias Contbeis. vol. 1 e 2. 3.ed. So Paulo: Atlas, 1999. 6. STEVENSON, W. J. Estatstica Aplicada Administrao. 3.ed. So Paulo: Harbra Harper How do Brasil, 2001. 7. TRIOLA, M.F. Introduo Estatstica. 10.ed. Rio de Janeiro: LTC, 2008.

1. INTRODUO
DEFINIO: O QUE ESTATSTICA? a cincia que fornece mtodos e processos quantitativos para planejamento, coleta, organizao, descrio, anlise e interpretao de dados. Particularmente em administrao, economia e cincias contbeis, uma grande razo para entender estatstica dar aos tomadores de deciso um melhor entendimento/controle do ambiente administrativo, possibilitando decises objetivas, previses precisas e transmisso da mensagem desejada de forma eficaz. PARTE DA NOMENCLATURA UTILIZADA EM ESTATSTICA: Dados estatsticos so fatos ou nmeros que so coletados, organizados em tabelas e/ou grficos, analisados e interpretados. Dados brutos so uma seqncia de fatos ou valores numricos no organizados, obtidos diretamente da observao de um fenmeno. Rol uma seqncia ordenada (crescente ou decrescente) de dados brutos. Elementos so as entidades sobre as quais os dados so coletados. Varivel a caracterstica de interesse para os elementos. Dados qualitativos consistem em rtulos ou nomes para uma caracterstica de um elemento, podendo ser no-numricos ou numricos. Dados quantitativos consistem em nmeros que representam contagens ou medidas. Populao ou universo o conjunto de todos os elementos de interesse em um determinado estudo. Amostra um subconjunto da populao.
1

Exemplos:

Populao: dados estatsticos da populao brasileira levantados pelo IBGE no censo demogrfico realizado a cada 10 anos. Amostra: dados obtidos em testes aps a fabricao de um pequeno nmero de peas antes de se iniciar sua fabricao em grande escala.

Quando a populao muito grande, a Estatstica recorre a uma amostra. Entretanto, a AMOSTRA DEVE REPRESENTAR EFETIVAMENTE A POPULAO. ESTUDOS ESTATSTICOS Muitas vezes, os dados necessrios para uma aplicao particular no esto disponveis atravs de fontes existentes. Em tais casos, os dados freqentemente podem ser obtidos realizando-se um estudo estatstico. Os estudos estatsticos podem ser experimentais ou observacionais. Em um estudo experimental, identifica-se inicialmente o elemento de interesse. Ento, variveis relacionadas a esse elemento so identificadas e controladas de modo que os dados que influenciam a varivel possam ser obtidos. Por exemplo, uma empresa farmacutica quer entender como uma nova droga afeta a presso sangnea. A presso sangnea a varivel de interesse no estudo. O nvel de dosagem da nova droga outra varivel que se sabe ter efeito causal sobre a presso sangnea. Para obter os dados sobre o efeito da nova droga, seleciona-se uma amostra de indivduos. O nvel de dosagem controlado com diferentes grupos de indivduos recebendo diferentes dosagens. Os dados sobre a presso sangnea so coletados para cada grupo. A anlise estatstica dos dados experimentais pode ajudar a determinar como a nova droga afeta a presso sangnea. Nos estudos observacionais, no existe qualquer tentativa de controlar as variveis de interesse. Por exemplo, em um levantamento de entrevista pessoal, primeiro identificam-se as questes de pesquisa. Ento um questionrio concebido e ministrado amostra de indivduos. Alguns restaurantes usam estudos observacionais para obter dados sobre a opinio de seus clientes sobre a qualidade dos alimentos, do servio, do ambiente, da higiene, etc. As categorias de respostas como excelente, bom, satisfatrio e insatisfatrio, fornecem os dados que torna possvel aos analisadores avaliar a qualidade do restaurante. H DUAS REAS PRINCIPAIS NA ESTATSTICA Estatstica Descritiva: uma das etapas que tem por objetivos o planejamento, a coleta, a organizao e descrio de dados. Utiliza nmeros, tabelas ou grficos para descrever fatos (anlise exploratria de dados). Exemplo: pesquisa sobre a votao em cada candidato em poca de eleio - planejamento, coleta, organizao e descrio de somente 2% dos votos (amostra). Inferncia Estatstica: a etapa em que os dados amostrais so analisados e interpretados para se fazer estimativas e testar hipteses sobre as caractersticas da populao. Portanto, atravs da anlise de uma amostra da populao procura-se medir, inferir ou estimaras leis de comportamento da populao da qual a amostra foi retirada. Exemplo: a partir da organizao de 2% das intenes de voto da populao, infere-se a porcentagem de votos em cada candidato para toda a populao. A coleta, organizao e descrio dos dados esto a cargo da Estatstica Descritiva. A anlise e interpretao desses dados ficam a cargo da Estatstica Inferencial.

FASES DO MTODO ESTATSTICO 1.1 A coleta, a organizao e a descrio de dados Aps o planejamento e a devida determinao de caractersticas notveis ou mensurveis, ou seja, da varivel de interesse do elemento que se quer pesquisar, d-se incio coleta dos dados numricos necessria sua descrio. Por mais diversa que seja a finalidade, os dados devem ser apresentados sob a forma adequada de tabelas chamadas de tabelas de distribuies de freqncias ou por grficos, tornando mais fcil o exame daquilo que est sendo objeto de tratamento estatstico. 1.2 A anlise e a interpretao de dados O objetivo da anlise e a interpretao de dados tirar concluses sobre a populao, a partir de informaes fornecidas por parte representativa dessa populao (amostra), ou seja, consiste em obter-se e generalizar-se concluses, a partir de resultados particulares. VARIVEIS A anlise estatstica apropriada de uma determinada varivel depende de sua natureza. importante conhecer a natureza da varivel, pois para cada tipo de varivel, h uma tcnica mais apropriada para se resumir as informaes e otimizar a anlise. As variveis so classificadas como Variveis Qualitativas e Variveis Quantitativas. Variveis Qualitativas: apresentam uma qualidade ou atributo da varivel. Ex.: sexo (masculino, feminino), estado civil (solteiro, casado, vivo, divorciado), grau de escolaridade (1o grau, 2ograu, superior, etc). Dentre as variveis qualitativas existe uma segunda classificao: nominais variveis sem ordenao (sexo: masculino, feminino) e ordinais variveis que devem respeitar ordem estabelecida (grau de escolaridade: 1o grau, 2o grau, superior, etc). Variveis Quantitativas: apresentam nmeros resultantes de uma contagem ou de uma medida. Ex.: nmero de filhos, nvel salarial, idade, etc. As variveis quantitativas podem ser: discretas quando os possveis valores so provenientes de uma contagem, portanto, seus valores so expressos por nmeros inteiros (nmero de filhos, nmero de empregados de uma empresa, etc) e contnuas quando os possveis valores so provenientes de uma medio, portanto, essa varivel pode assumir qualquer valor em certo intervalo da reta real, ou seja, nmeros inteiros e decimais (peso, altura, idade, nota de alunos, lucro de empresas, etc).

Referindo-se ao conjunto de dados na Tabela 1, abaixo, como mais um exemplo, cada empresa um elemento. Como so 25 empresas, existem 25 elementos no conjunto de dados. Os dados relativos varivel Bolsa de Valores (NYSE, AMEX e OTC) so rtulos usados para identificar onde as aes so comercializadas. Assim, os dados so qualitativos e a Bolsa de Valores uma varivel qualitativa. O Smbolo no Painel Eletrnico tambm uma varivel qualitativa e os valores de dados AWRD, CHK, CRG, etc so os rtulos usados para identificar a empresa correspondente. A varivel Nmero de Negcios Realizados Anualmente uma varivel quantitativa discreta, pois essa varivel s pode assumir valores inteiros. As variveis Vendas Anuais, Preo da Ao e Relao Preo/Ganhos so variveis quantitativas contnuas j que podem assumir quaisquer valores do conjunto dos nmeros reais . Para propsitos de anlise estatstica, a diferena importante e relevante entre dados qualitativos e quantitativos que as operaes aritmticas comuns s tem significado com dados quantitativos. Por exemplo, com dados quantitativos, os valores de dados podem ser adicionados e divididos pelo nmero total de dados para calcular seu valor mdio. Essa mdia tem significado e, em geral, facilmente interpretada. No entanto, quando dados qualitativos so registrados como valores numricos, tais operaes aritmticas fornecem resultados sem nenhum significado.
3

Tabela 1 Conjunto de dados contendo informaes financeiras referentes a 25 empresas.


Bolsa de Valores Smbolo do Painel Eletrnico AWRD CHK CRG EDT FEP GNTIY GPO HOTT HGC ICUI J KNTK LARS LUMI MOIL MDII MKA NHHC TEAM OCAD OROA OVRL PIAM PLEN PRWW N de Negcios Realizados Anualmente 63.334 1.123.401 121.237 1.115.678 378.990 118.365 30.002 200.458 123.877 115.432 499.456 246.367 310.998 109.211 147.954 114.981 261.934 130.870 345.698 85.384 689.004 256.156 545.890 229.786 64.489
o

Vendas Anuais (US$ milhes) 15,7 255,3 29,4 254,6 88,7 27,7 7,2 48,3 30,2 26,5 90,6 60,5 71,1 23,7 38,2 26,0 67,2 34,9 78,1 21,9 164,8 66,5 123,1 52,5 16,5

Preo da Ao (US$) 11,500 7,880 17,000 9,688 12,880 5,750 6,563 15,750 39,750 8,500 10,875 9,500 10,313 7,375 10,750 6,688 15,250 5,130 10,875 11,375 5,125 7,000 7,500 44,000 8,250

Empresa

Relao Preo/Ganhos

Award Software Chesapeak Energy Craig Corporation Edisto Resources Franklin Elect. Pbls Gentia Software Giant Group Hot Topic Hudson General ICU Medical Jackpot Enterprises Kentek Information Larscom, Inc. Lumisys, Inc. Maynard Oil Mechanical Dynamics Metrika Systems National Home Health National Tech Team OrCad OroAmerica Overland Data PIA Merchandising Plenum Publishing Premier Research

OTC NYSE NYSE AMEX NYSE OTC NYSE OTC AMEX OTC NYSE OTC OTC OTC OTC OTC AMEX OTC OTC OTC OTC OTC OTC OTC OTC

22,5 12,7 7,5 6,0 15,7 27,4 2,1 27,2 11,2 15,7 17,0 11,4 24,6 14,2 4,8 17,1 15,7 7,7 32,0 18,3 16,0 13,5 28,8 10,7 28,4

Fonte: Stock Investor Pro, American Association of Individual Investors, 31 de agosto de 1997.

2. TABELA DE DISTRIBUIO DE FREQNCIAS Uma distribuio de freqncia um sumrio tabular de dados que mostra a freqncia (ou o nmero) de observaes em cada uma das diversas classes no sobrepostas. O objetivo da distribuio de freqncias reduzir a quantidade de dados.

2.1. A DISTRIBUIO DE FREQNCIAS Freqncia Absoluta (fi) nmero de vezes em que cada resultado aparece no conjunto de dados. Total de observaes (n) a soma das freqncias absolutas.

n = fi
i

Freqncia Relativa (ou proporo) (fri) proporo de cada realizao em relao ao total.

f ri =

fi n

mais usual exprimir a freqncia relativa em porcentagem (freqncia relativa percentual):

f ri =

fi 100 n

A freqncia absoluta no comparativa, pois um mesmo valor pode apresentar diferentes significados dependendo do nmero total de observaes. Exemplo para a varivel qualitativa grau de escolaridade: Na empresa ALFA, metade dos funcionrios, ou seja 20, possui o 1o grau. Na empresa BETA, a totalidade de seus 20 funcionrios tem o 1o grau. Apesar de a freqncia absoluta ser a mesma nas duas empresas, o significado desse nmero bem diferente. Para tornar os dados comparativos utiliza-se a proporo (freqncia relativa) ou a freqncia relativa percentual. Exemplos: Tabela 2 Freqncia absoluta e freqncia relativa percentual de 36 funcionrios do departamento de recursos humanos da empresa GAMA, segundo o grau de escolaridade. Grau de Freqncia Freqncia relativa escolaridade Absoluta fi percentual fri (%) 1o grau 12 33,33 2o grau 18 50,00 o 3 grau 6 16,67 Total 36 100,00
Fonte: Dados fictcios

Tabela 3 Freqncia absoluta e freqncia relativa percentual dos 2000 funcionrios da empresa GAMA, segundo o grau de escolaridade. Grau de Freqncia Freqncia relativa escolaridade Absoluta fi percentual fri (%) 1o grau 650 32,50 2o grau 1020 51,00 3o grau 330 16,50 Total 2000 100,00
Fonte: Dados fictcios

No podemos comparar diretamente as colunas das freqncias absolutas das tabelas 2 e 3, pois os totais de empregados so diferentes nos dois casos. Mas, as colunas de porcentagens so comparveis, pois reduzimos as freqncias a um mesmo total (no caso 100).
5

Alm das freqncias absoluta e relativa pode-se tabular a freqncia acumulada. Freqncia acumulada (Fi ou Fac) soma da freqncia absoluta de um elemento com as freqncias absolutas dos elementos que o antecedem.

Fi = f1 + f 2 + ... + f i
Freqncia acumulada relativa (FRi) diviso da freqncia acumulada de um elemento pelo nmero total de elementos da srie.

Fi =
Com esses dados a Tabela 2 se torna:

Fi n

Tabela 4 Freqncia absoluta, freqncia relativa percentual, freqncia acumulada e freqncia acumulada percentual dos 36 funcionrios do departamento de recursos humanos da empresa GAMA, segundo a varivel qualitativa Grau de Escolaridade. Grau de Freqncia Freqncia relativa Freqncia Freqncia Acumulada escolaridade Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa - FRi (%) 1o grau 12 33,33 12 33,33 2o grau 18 50,00 30 83,33 o 3 grau 6 16,67 36 100,00 Total 36 100,00 --------Fonte: Dados fictcios

Anlise de alguns valores provenientes da distribuio de frequncias, apresentados na Tabela 4, como exemplo: 12 funcionrios no possuem 2o e 3o graus; 50,00% dos funcionrios possuem 2o grau; 16,67% dos funcionrios possuem 3o grau; 30 funcionrios possuem at 2o grau; 33,33% dos funcionrios possuem somente o 1o grau; 83,33% dos funcionrios no possuem 3o grau.

2.2. DISTRIBUIO DE FREQNCIAS VARIVEL QUANTITATIVA DISCRETA Um conjunto de dados, freqentemente, difcil de interpretar diretamente na forma em que reunido. Para sintetizar dados, utiliza-se a distribuio de freqncias. No caso das variveis quantitativas discretas, a representao em tabelas muito til, pois fornece meios de organizar e resumir os dados de modo que padres sejam revelados e os dados sejam mais facilmente interpretados. Observe na Tabela 5, abaixo, na qual alm de outras informaes, apresentada a varivel quantitativa discreta Nmero de Filhos de 36 funcionrios do departamento de recursos humanos da empresa GAMA.

Tabela 5 Informaes sobre estado civil, grau de escolaridade, no de filhos, salrio, idade e procedncia de 36 funcionrios do departamento de recursos humanos da empresa GAMA, localizada na cidade de So Paulo. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Estado Civil Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Solteiro Casado Solteiro Solteiro Casado Casado Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Casado Casado Solteiro Casado Casado Casado Solteiro Casado Casado Solteiro Casado Casado Grau de escolaridade 1 Grau 1 Grau 1 Grau 2 Grau 1 Grau 1 Grau 1 Grau 1 Grau 2 Grau 2 Grau 2 Grau 1 Grau 2 Grau 1 Grau 2 Grau 2 Grau 2 Grau 1 Grau Superior 2 Grau 2 Grau 2 Grau 1 Grau Superior 2 Grau 2 Grau 1 Grau 2 Grau 2 Grau 2 Grau Superior 2 Grau Superior Superior 2 Grau Superior No de filhos 0 1 2 0 0 0 0 0 1 0 2 0 0 3 0 0 1 2 0 0 0 2 2 0 2 2 0 0 5 2 0 1 3 0 2 3 Salrio (x Sal. Min.) 4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59 7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 21,90 Idade (anos) 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 29 40 35 31 36 43 33 48 42 Regio de Procedncia Interior Capital Capital Outro Estado Outro Estado Interior Interior Capital Capital Outro Estado Interior Capital Outro Estado Outro Estado Interior Outro Estado Capital Outro Estado Interior Interior Outro Estado Capital Outro Estado Outro Estado Interior Outro Estado Outro Estado Interior Interior Capital Outro Estado Interior Capital Capital Capital Interior

Fonte: Dados fictcios

Para agrupar os dados da varivel quantitativa discreta Nmero de Filhos basta proceder contagem para cada um dos valores diferentes da varivel em estudo e construir a tabela de distribuio de freqncias.

Tabela 6 Freqncia absoluta, freqncia relativa percentual, freqncia acumulada e freqncia acumulada percentual dos 36 funcionrios do departamento de recursos humanos da empresa GAMA, segundo a varivel quantitativa discreta Nmero de Filhos. No de Freqncia Freqncia relativa Freqncia Freqncia Acumulada filhos Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa - FRi (%) 0 19 52,78 19 52,78 1 4 11,11 23 63,89 2 9 25,00 32 88,89 3 3 8,33 35 97,22 5 1 2,78 36 100,00 Total 36 100,00 ---------

2.3. DISTRIBUIO DE FREQNCIAS VARIVEL CONTNUA (COM INTERVALOS DE CLASSE) Um dos objetivos de se construir a distribuio de freqncias resumir o conjunto de dados. No caso de variveis contnuas, no se pode construir a distribuio de freqncias listando os resultados um a um, pois no havendo observaes iguais, no h reduo dos dados em uma tabela. Desta forma, interessante agrupar os resultados em classes no sobrepostas, calculadas de forma mais elaborada. Para agrupar os dados de uma varivel contnua em classes, necessrio adotar classes de mesma amplitude, sempre que possvel, e: 1. Determinar a extenso (amplitude) total dos dados a tabelar; 2. Determinar o nmero de classes no sobrepostas; 3. Determinar a extenso (amplitude) de cada classe; 4. Determinar os limites de classe. Amplitude total de uma seqncia (At) diferena entre o maior e o menor elemento de uma seqncia. Representa o comprimento total da seqncia.

A t = x max x min
Nmero de Classes (k) existem vrios critrios para se calcular o nmero de classes k. O mais utilizado a frmula emprica:

k = n , onde n o nmero de elementos observados.


Amplitude de classe (h) determinada por:

h=

At k

Neste ponto, importante observar que o nmero de classes deve ser determinado adequadamente. Quando se adota um grande nmero de classes no h reduo dos dados, enquanto que para um nmero pequeno de classes as informaes podem ser perdidas. Sugere-se o uso de 5 a 15 classes com a mesma amplitude. Exemplo: A partir da Tabela 5, computando as freqncias absolutas de cada classe para a varivel quantitativa contnua salrios, possvel construir a tabela de freqncias. Pode-se observar que esto tabelados 36 salrios que vo de 4,00 at 21,90 salrios mnimos. Portanto, calcula-se: Nmero de classes: Amplitude total:

k = n = 36 = 6 A t = x max x min = 21,90 4,00 = 17,90


8

Amplitude de cada classe:

h=

At k

17,90 = 2,98 3 6

Tabela 7 Freqncia absoluta, freqncia relativa percentual, freqncia acumulada e freqncia acumulada percentual dos 36 funcionrios do departamento de recursos humanos da empresa GAMA, segundo a varivel quantitativa contnua Salrio. Classes de salrio Freqncia Freqncia relativa Freqncia Freqncia Acumulada (x salrio mnimo) Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa - FRi (%) 4,00 a 7,00 7 19,44 7 19,44 7,00 a 10,00 11 30,56 18 50,00 10,00 a 13,00 6 16,67 24 66,67 13,00 a 16,00 6 16,67 30 83,34 16,00 a 19,00 4 11,11 34 94,45 19,00 a 22,00 2 5,55 36 100,00 Total 36 100,00

Anlise de alguns valores oriundos da distribuio de freqncias, apresentados na Tabela 7, como exemplo: 11 funcionrios recebem salrios entre 7,00 e 10,00 s.m. 16,67% dos funcionrios, o que equivale a 6 funcionrios, recebem salrios entre 10,00 e 13,00 s.m. 5,55% dos funcionrios, o que equivale a 2 funcionrios apenas, recebem os maiores salrios, que situam-se entre 19,00 e 22,00 s.m. 11,11% dos funcionrios recebem salrios entre 16,00 e 19,00 s.m. 30 funcionrios recebem menos que 16,00 s.m. ou salrios entre 4,00 e 16,00 s.m. 6 funcionrios recebem pelo menos 16,00 s.m. 66,67% dos funcionrios recebem menos que 13,00 s.m. 33,33% dos funcionrios recebem pelo menos 13,00 s.m..

LISTA 1 - Exerccios para fixao


1. Declare se cada uma das seguintes variveis qualitativa (nominal ou ordinal) ou quantitativa (discreta ou contnua): a) Idade b) Gnero c) Marca de Automveis d) Nmero de pessoas favorveis pena de morte e) Vendas anuais (em milhes de reais) de uma empresa brasileira f) Tamanho de camisetas (PP, P, M, G, GG) g) Lucro por ao de uma empresa h) Mtodo de pagamento ( vista, com cheque, com carto de crdito, etc) i) Vida til de lmpadas j) Sexo dos filhos de um casal k) Produo anual de automveis marca FORD em uma capital l) Nmero de aes negociadas na BOVESPA m) Salrio dos funcionrios de uma empresa pblica n) ndice de liquidez das indstrias da cidade de Bauru o) Classe social dos habitantes de um municpio p) Produo anual de caf do Estado de So Paulo q) Grau de escolaridade dos funcionrios de uma empresa privada r) Peso de lutadores de boxe na categoria Peso Pena s) Nmero de livros existentes na biblioteca de uma universidade t) Altura de jovens selecionados para se tornarem jogadores de vlei u) Consumo mensal de energia eltrica (em kWh) em um condomnio v) Patente militar w) Ocupao profissional x) Cargos hierrquicos em uma empresa y) Espessura de folhas de papel z) Nmero de acidentes de trnsito 2. Na tabela abaixo, mostrada a remunerao dos altos executivos CEOS (Chief Executive Officer), a classificao por setor, as vendas anuais e os dados de avaliao da remunerao dos CEOS versus o retorno dos acionistas para 10 empresas. Uma avaliao 1 da remunerao dos CEOS versus o retorno dos acionistas indica que a empresa est no grupo de empresas que tem a melhor relao. Uma avaliao 2 indica que a empresa similar s empresas que tem uma relao muito boa, mas no a melhor. Empresas com a pior relao tm uma avaliao 5. Remunerao dos Remunerao dos Vendas Empresa Setor Altos Executivos Altos Executivos vs. (US$ milhes) (US$ 1000) Retorno dos Acionistas Bankers Trust 8.925 Bancrio 9.565 3 Coca Cola General Mills LSI Logic Motorola Readers Digest Sears Sprint Walgreen Wells Fargo 2.437 1.410 696 1.847 1.490 3.414 3.344 1.490 2.861 Bebidas Alimentao Eletrnico Eletrnico Grfico Varejo Telecomunicaes Varejo Bancrio 18.546 5.567 1.239 27.973 2.968 38.236 14.045 12.140 8.723 5 1 2 4 3 4 4 2 3

Fonte: Business Week, 21 de abril de 1997.

10

a) b) c) d) e)

Quantos elementos existem nesse conjunto de dados? Quantas variveis existem nesse conjunto de dados? Quais variveis so qualitativas e quais variveis so quantitativas? Que porcentagem das empresas pertence ao setor bancrio? Que porcentagem das empresas recebeu um valor 3 na avaliao da remunerao dos CEOS versus o retorno dos acionistas?

4. A revista Fortune fornece dados sobre a classificao das 500 maiores corporaes industriais dos Estados Unidos em termos de vendas e de lucros. Os dados para uma amostra de empresas da Fortune 500 esto na tabela abaixo. Empresa Banc One CPC Intl. Tyson Foods Hewlett-Packard Intel Northrup Seagate Tech. Unisys Westvaco Woolworth a) b) c) d) e) f) Vendas (US$ milhes) 10.272 9.844 6.454 38.420 20.847 8.071 8.588 6.371 3.075 8.092 Lucros (US$ milhes) 1.427,0 580,0 87,0 2.586,0 5.157,0 234,0 213,3 49,7 212,2 168,7 Cdigo do Setor 8 19 19 12 15 2 11 10 22 48

Fonte: Fortune, 28 de abril de 1997.

Quantos elementos existem nesse conjunto de dados? Qual a populao? Quantas variveis existem no conjunto de dados? Quais variveis so qualitativas e quais so quantitativas? Que porcentagem de empresas teve um lucro acima de US$ 100 milhes? Que porcentagem de empresas tem cdigo de setor 8?

5. Suponha que um psiclogo queira fazer uma pesquisa sobre o comportamento do jovem de 11 a 14 anos em quatro escolas: A, B, C e D. A escola A tem 1500 alunos; a escola B, 4000 alunos; a escola C, 2000 alunos e a escola D, 2500 alunos; todos nessa faixa etria. A pesquisa foi aplicada a 200 jovens, escolhidos ao acaso. a) Construa uma distribuio de freqncia adotando essa amostra de 200 alunos de todas as escolas aleatoriamente. b) Qual a escola com menor freqncia absoluta? Quantos alunos foram pesquisados nessa escola? c) Qual a escola com maior freqncia relativa? Qual a porcentagem de alunos pesquisados nessa escola? d) Qual o nmero de alunos pesquisados na escola D? 6. Complete as tabelas: a) xi 0 1 2 3 4 5 6 7 Total

b) fi 1 4 3 2 1 25 15 fri (%) 15 xi 20 25 30 35 40 45 50 Total fi 45 30 60 30 10 300


11

fri (%) 5

7. Contou-se o nmero de erros de impresso de um jornal durante 40 dias, obtendo-se os seguintes resultados: 8 10 10 5 12 11 14 12 12 10 12 6 8 7 7 5 14 12 16 15 7 10 12 18 15 6 12 8 9 11 16 15 5 12 6 7 14 10 12 8 a) b) c) d) e) f) g) h) i) Classifique o tipo de varivel que se quer analisar estatisticamente. Elabore o rol. Resuma os dados em uma tabela de freqncias. Qual a porcentagem de dias em que ocorreram menos que 10 erros? Qual a porcentagem de dias em que ocorreram pelo menos 15 erros? Qual a porcentagem de dias em que ocorreram mais que 12 erros? Qual o nmero de dias em que ocorreram 11 erros? Qual o nmero de dias em que ocorreram menos que 7 erros? Qual o nmero de dias em que ocorreram pelo menos 7 erros?

8. Uma pesquisa sobre a idade completa (cheia) dos alunos de uma classe de calouros de uma faculdade, revelou os seguintes valores: 18 17 18 20 21 19 20 18 17 19 20 18 19 18 19 21 18 19 18 18 19 19 21 20 17 19 19 18 18 19 18 21 18 19 19 20 19 18 19 20 18 19 19 18 20 20 18 19 18 18 a) Agrupe por freqncia estes dados para varivel quantitativa discreta idade completa dos calouros. b) Qual a porcentagem de calouros com pelo menos 20 anos? c) Quantos calouros tm menos que 20 anos? d) Quantos calouros tm mais que 18 anos? 9. Uma indstria embala peas em caixas com 100 unidades. O controle de qualidade selecionou 50 caixas na linha de produo e anotou em cada caixa o nmero de peas defeituosas. Obteve os seguintes dados: 2 0 0 4 3 0 0 1 0 0 1 1 2 1 1 1 1 1 1 0 0 0 3 0 0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 1 4 1 2 Agrupe estes dados por freqncia, construa a distribuio de freqncias para varivel discreta e responda: a) Qual a porcentagem de caixas com 2 peas defeituosas? b) Qual a porcentagem de caixas com menos que 2 peas defeituosas? c) Qual a porcentagem de caixas com pelo menos 2 peas defeituosas? d) Qual a porcentagem de caixas com mais que 2 peas defeituosas? e) Qual o nmero de caixas com 3 peas defeituosas? f) Qual o nmero de caixas com pelo menos 3 peas defeituosas? g) Qual o nmero de caixas com menos que 3 peas defeituosas? h) Qual o nmero de caixas em que no h peas defeituosas? 10. Os resultados do lanamento de um dado 50 vezes foram os seguintes: 6 1 5 2 5 5 6 4 2 6 2 3 3 5 2 6 3 1 2 4 4 5 3 5 6 3 1 5 1 1 6 3 4 3 5 2 6 4 6 2 6 3 2 5 4 5 4 6 1 3
12

a) Construa uma distribuio de freqncias para a varivel discreta. b) Qual a porcentagem de vezes que ocorreu face par? c) Qual a porcentagem de vezes que ocorreu a face 5? d) Qual o nmero de vezes que ocorreu face mpar? e) Qual o nmero de vezes em que ocorreram nmeros primos*? * Definio de nmero primo = nmeros que possuem apenas dois divisores: o prprio nmero e o nmero 1. (Exceo: nmero 1). 11. A tabela abaixo apresenta as vendas dirias de um determinado aparelho por uma empresa comercial: 14 12 11 13 14 12 14 13 14 11 12 14 10 13 15 15 13 16 17 14 a) Construa a distribuio de freqncias para a varivel discreta. b) Em quantos dias as vendas foram superiores a 13 unidades? c) Qual a porcentagem de dias com vendas inferiores a 12 unidades? d) Em quantos dias as vendas foram inferiores a 15 unidades? e) Qual a porcentagem de dias com vendas de no mnimo 10 unidades? eltrico, durante um ms, 13 12 11 14

12. A distribuio abaixo indica o nmero de acidentes ocorridos com 70 motoristas de uma empresa de nibus: No de acidentes 0 1 2 3 4 5 6 7 No de motoristas 20 10 16 9 6 5 3 1 Determine: a) O nmero de motoristas que no sofreram acidentes; b) O nmero de motoristas que sofreram pelo menos 4 acidentes; c) O nmero de motoristas que sofreram menos de 3 acidentes; d) O nmero de motoristas que sofreram no mnimo 3 e no mximo 5 acidentes; e) A porcentagem de motoristas que sofreram no mximo 2 acidentes. 13. Complete os dados que faltam na distribuio de freqncias: a) b) fi fri (%) Classes Classes 0a 8 10 0 a 2 8 a 16 10 2 a 4 16 a 24 14 4 a 6 24 a 32 9 32 a 40 8 a 10 Total 40 10 a 12 14 a 16 Total

fi 2 9 13

fri (%) 4 8

16 12 3

14. A SP Transportes Areos aceita reservas de vo por telefone. Os seguintes dados mostram a durao das chamadas (em minutos) para uma amostra de 30 reservas feitas por telefone. 2,1 9,5 7,8 4,8 4,6 10,5 5,5 5,3 11,0 10,4 5,5 4,7 7,5 2,8 7,5 8,9 3,6 6,0 3,3 2,4 4,5 3,5 10,9 4,8 5,8 5,9 11,2 4,8 6,6 4,3

Determinar: a) A amplitude total At, o nmero de classes k e a amplitude de cada classe h; b) A distribuio de freqncias para a varivel contnua; c) A porcentagem de ligaes com durao menor que 8,0 minutos.
13

d) O nmero de ligaes com pelo menos 4,0 minutos de durao. e) A porcentagem de ligaes com durao entre 4,0 (inclusive) e 8,0 (exclusive) minutos. f) O nmero de ligaes com durao maior ou igual a 8,0 minutos. 15. As notas de 32 estudantes de uma classe so dadas abaixo: 6,0 8,0 2,0 4,0 0,0 7,0 5,0 4,5 2,0 8,5 5,5 4,0 6,5 6,0 5,0 1,0 5,0 4,5 7,0 5,5 3,5 0,0 1,5 3,5 4,0 6,5 5,0 2,5 7,0 6,0 5,0 4,5

Determinar: a) A amplitude total At, o nmero de classes k e a amplitude de cada classe h; b) A distribuio de freqncias para a varivel contnua; c) A porcentagem de alunos que tiraram nota menor que 4,5; d) O nmero de alunos que tiraram nota menor que 7,5; e) O nmero de alunos que tiraram nota maior ou igual a 6,0; f) A porcentagem de alunos que tiraram nota entre 4,5 (inclusive) e 7,5 (exclusive); g) O limite superior da 2a classe; h) O limite inferior da 4a classe; i) O ponto mdio da 3a classe. 16. O departamento de pessoal de certa empresa fez um levantamento dos salrios dos 80 funcionrios do setor administrativo, obtendo os resultados da tabela de distribuio de freqncias dada abaixo: Faixa salarial (em no de salrios mnimos) 0 a 2 2 a 4 4 a 6 6 a 8 TOTAL Freqncia absoluta - fi 25 30 13 12 80

Determinar: a) A porcentagem de funcionrios que ganham menos que 4 salrios mnimos. b) A porcentagem de funcionrios que ganham pelo menos 4 salrios mnimos. c) A porcentagem de funcionrios que ganham 2 ou mais salrios mnimos. d) A porcentagem de funcionrios que ganham entre 2 (inclusive) e 6 (exclusive) salrios mnimos. e) A amplitude da 4 classe. f) O limite superior da 2 classe. g) O limite inferior da 4 classe. 17. Os dados abaixo referem-se ao consumo residencial: 9520 8720 7760 8720 7440 7920 7200 8880 6880 7520 7200 7760 7680 7680 7440 7760 8880 8240 8240 7840 6640 6960 8480 8880 6720 7760 6880 7760 7120 7120 7360 9360 mensal de energia eltrica (kWh) em um condomnio 7840 8880 8480 8480 8880 8880 8320 8240 8560 7920 8320 9440 8480 8320 8560 8480 8480 10320 8560 8560 8800 8560 8560 13840 9360 9360 9600 12960 13280 13200 12800 8960 12480 11200 11360 12960 14560 13200 12480 14000

Construa a distribuio de freqncias para esses dados, adotando 9 classes com amplitudes idnticas e responda: a) Qual a porcentagem de meses em que o consumo foi pelo menos 10.000 kWh? b) Qual a porcentagem de meses em que o consumo ficou entre 9.000 e 11.000 kWh (exclusive)? c) Qual a porcentagem de meses em que o consumo foi inferior a 13.000 kWh?
14

d) Qual o nmero de meses em que o consumo foi igual ou superior a 8.000 kWh? e) Qual o nmero de meses em que o consumo foi inferior a 10.000 kWh? 18. Construa a distribuio de freqncias para a srie abaixo, que representa uma amostra dos salrios (em R$) de 25 funcionrios selecionados em uma empresa. fr i (%) Fac FR i (%) Classe 1 2 3 4 5 Salrios R$ (xi) 1.000,00 1.200,00 1.400,00 1.600,00 1.800,00
a a a a a

No de funcionrios (fi) 2 6 10 5 2

1.200,00 1.400,00 1.600,00 1.800,00 2.000,00

a) b) c) d) e)

Determine o salrio mdio de cada uma das 5 classes. Calcule a porcentagem de funcionrios que ganham salrios pelo menos de R$1.600,00. Determine o nmero de funcionrios que recebem salrios inferiores a R$ 1.400,00. Determine o nmero de funcionrios que recebem salrios iguais ou superiores a R$ 1.800,00. Calcule a porcentagem de funcionrios que recebem salrio no mnimo de R$ 1.200,00.

19. Os pesos (em kg) dos 40 alunos de uma classe so dados abaixo: 69 65 60 95 57 76 81 49 72 60 71 53 54 49 67 65 92 74 63 62 68 59 64 60 72 66 53 55 58 83 73 74 64 70 81 96 62 45 50 75

Coloque os dados numa tabela de freqncias que contenha as freqncias absolutas, freqncias relativas, porcentagens acumuladas crescentes e pontos mdios das classes. 20. A tabela abaixo representa a distribuio das espessuras (em mm) de 100 folhas de tabaco: 2,01 2,59 2,43 2,22 1,87 1,89 2,40 1,91 1,72 2,36 2,08 1,96 1,56 2,34 2,49 1,71 1,96 2,11 1,62 1,82 1,96 2,29 1,94 2,24 3,12 2,42 3,01 1,78 1,99 2,02 3,04 3,18 3,15 1,95 2,24 1,62 2,19 2,36 1,64 2,25 2,01 2,09 2,35 2,01 1,76 1,97 2,25 2,33 1,54 1,75 3,18 1,96 2,08 3,12 3,20 2,18 1,45 3,17 2,26 3,15 1,94 2,06 2,56 3,03 2,38 1,69 1,93 2,03 1,86 3,18 2,19 2,18 2,17 3,12 1,58 3,14 2,06 1,87 2,09 1,99 2,24 2,05 1,96 2,04 1,89 2,18 1,83 3,11 1,74 1,76 2,18 2,04 1,59 1,66 1,98 3,06 1,84 2,17 1,92 2,51

Pede-se: A amplitude total, o nmero recomendado de classes, a amplitude das classes, a freqncia absoluta das classes, a freqncia relativa das classes e a freqncia acumulada das classes. Depois, calcule: a) Qual a porcentagem de folhas com espessuras iguais ou superiores a 2,00 mm? b) Qual o nmero de folhas com espessuras inferiores a 2,00 mm? c) Qual o nmero de folhas com espessuras entre 1,80 mm (inclusive) e 2,20 mm (exclusive)? d) Qual a porcentagem de folhas com espessuras inferiores a 2,60 mm? 21. O Aedes aegypti vetor transmissor da dengue. Uma pesquisa feita em So Lus MA, de 2000 a 2002, mapeou os tipos de reservatrio onde esse mosquito era encontrado. A tabela abaixo mostra parte dos dados coletados nessa pesquisa.
15

Se mantido o percentual de reduo da populao total de Aedes aegypti observada de 2001 para 2002, teria sido encontrado, em 2003, um nmero total de mosquitos: a) menor que 5.000. b) maior que 5.000 e menor que 10.000. c) maior que 10.000 e menor que 15.000. d) maior que 15.000 e menor que 20.000. e) maior que 20.000. 22. Os principais motivos alegados por 30.000 devedores, pesquisados em uma regio metropolitana, ao justificarem atrasos no pagamento do credirio, esto listados na tabela abaixo: JUSTIFICATIVAS PARA ATRASO NO PAGAMENTO DO CREDIRIO A compra era para outra pessoa 18% Salrio atrasado 17% Estar sem dinheiro 12% Perda do emprego 12% Gastou o dinheiro com outras coisas 8% Esquecimento ou falta de tempo 5% a) Qual a frequncia relativa das pessoas que apresentaram outras justificativas? b) Quais as frequncias absolutas para cada tipo de devedor? 23. Os brasileiros tiveram, em junho, o maior tempo de navegao residencial na internet entre onze pases monitorados pelo Ibope/NetRatings: mdia mensal de 16 horas e 54 minutos por pessoa. O pas ficou frente de naes como a Frana, Japo, Estados Unidos e Espanha. (Adaptado. Folha de S.Paulo, 2005) 2005 -

Com base na tabela e no texto acima, analise os possveis motivos para a liderana do Brasil no tempo de uso da internet. I - O pas tem uma estrutura populacional com maior percentual de jovens do que os pases da Europa e os EUA. II - O uso de internet em casa se distribui igualmente entre as classes A, B e C, o que demonstra iniciativas de incluso digital. III - A adeso ao sistema de internet por banda larga ocorre, porque essa tecnologia promove a mudana de comportamento dos usurios. Est correto, apenas, o que se afirma em: a) I b) II c) III

d) I e II

e) II e III
16

CAPTULO 2 - REPRESENTAO GRFICA DAS SRIES ESTATSTICAS


BIBLIOGRAFIA CONSULTADA: 1. ANDERSON, D.R.; SWEENEY, D.J. & WILLIAMS, T.A. Estatstica Aplicada Administrao e Economia. 2.ed. So Paulo: Pioneira Thomson Learning, 2002. 2. LAPPONI, J.C. Estatstica usando o Excel. 4.ed. So Paulo: Campus, 2005. 3. MARTINS, G. A. Estatstica Geral e Aplicada. 2.ed. So Paulo: Atlas, 2002. 4. MARTINS, G. A. & DONAIRE D. Princpios de Estatstica. 4a ed. So Paulo: Atlas, 1995. 5. MEDEIROS, E. Silva e colaboradores. Estatstica para os Cursos de Economia, Administrao e Cincias Contbeis. vol.1. 3.ed. So Paulo: Atlas,1999. 6. TRIOLA, M.F. Introduo Estatstica. 10.ed. Rio de Janeiro: LTC, 2008. INTRODUO No item anterior mostrou-se a utilidade das tabelas como instrumento de apresentao e anlise de dados estatsticos. A apresentao grfica um complemento importante da apresentao tabular. Uma das maneiras mais concisas de se apresentar os dados estatsticos de uma tabela atravs de grficos. A principal vantagem de um grfico sobre uma tabela que ele permite conseguir uma visualizao imediata da distribuio dos valores observados. Os grficos propiciam uma idia preliminar mais satisfatria da concentrao e disperso de valores, uma vez que atravs deles, os dados estatsticos se apresentam em termos de grandezas visualmente interpretveis. Alm disso, os fatos essenciais e as relaes que poderiam ser difceis de reconhecer em massas de dados estatsticos podem ser observados mais claramente atravs dos grficos. DIFERENTES TIPOS DE REPRESENTAES GRFICAS DE SRIES ESTATSTICAS A distribuio de freqncias, tanto de variveis discretas como de variveis contnuas, pode ser interpretada mais facilmente quando os valores dessas variveis so apresentados em forma de grficos. A estatstica utiliza vrios tipos de grficos: de barras, de colunas, de linhas, de setores, histogramas e polgonos de freqncia. A) GRFICO DE COLUNAS OU BARRAS SIMPLES Um grfico de colunas um dispositivo grfico para retratar os dados qualitativos ou quantitativos discretos que foram sintetizados em uma distribuio de freqncias absolutas, freqncias relativas ou freqncias relativas percentuais. No eixo horizontal do grfico so especificados os rtulos usados para cada classe. A escala de freqncias colocada no eixo vertical. Exemplo: Na tabela abaixo, so apresentados dados de uma distribuio ocupacional na regio amaznica de uma amostra de 180 trabalhadores. Ocupao Trabalho no qualificado Artesanato Servios burocrticos Gerencial Freqncia Absoluta 65 52 34 29

Fonte: Hanan, H.S. & Batalha, B.H.L. Amaznia: contradies no paraso ecolgico. So Paulo: Cultura, 1999.

17

Representando-se, graficamente, com colunas simples, a varivel qualitativa Ocupao na regio amaznica, tm-se:
80

FREQNCIA ABSOLUTA

70 60 Artesanato 50 40 30 20 10 0

Trabalho No Qualificado

Servios Burocrticos Gerencial

OCUPAO
Um grfico de barras simples serve para retratar o mesmo tipo de varivel que o grfico de colunas simples, ou seja, variveis qualitativas ou quantitativas discretas. A diferena entre o grfico de colunas e de barras que no eixo vertical do grfico de barras so especificados os rtulos usados para cada classe e a escala de freqncias colocada no eixo horizontal. Exemplo: Na tabela abaixo, so apresentados dados da produo nacional de madeira por regio brasileira em porcentagem. Regio Freqncia Relativa (%) Sudeste 4 Centro-Oeste 7 Norte 20 Sul 69
Fonte: Revista de Silvicultura, dez 1999.

Representando-se, graficamente, com barras simples, a varivel quantitativa Produo de Madeira por regio brasileira, tm-se:
SUL

REGIO BRASILEIRA

NORTE

CENTRO-OESTE

SUDESTE

10

20

30

40

50

60

70

80

PRODUO DE MADEIRA Freqncia Relativa (%)

18

B) GRFICO DE COLUNAS OU BARRAS MLTIPLAS a representao grfica em que os retngulos referentes a determinado dado so dispostos um ao lado do outro, evidenciando suas diferenas, para facilitar a comparao entre eles. Serve para retratar os dados qualitativos ou quantitativos discretos. Exemplo: Na tabela abaixo est indicada a quantidade de lixo gerado em dois bairros da periferia da cidade de So Paulo. Quantidade de Lixo (freqncia absoluta) Anos Bairro A (1000 ton) Bairro B (1000 ton) 2001 8.000 6.000 2002 12.000 11.000 2003 13.000 11.000 2004 15.000 12.000 2005 15.000 14.000
Fonte: Envolverde - Revista Digital de Ambiente, Educao e Cidadania, abr 2006.

Representando-se, graficamente, com colunas duplas, a varivel quantitativa Quantidade de Lixo em dois bairros da cidade de So Paulo, tm-se:
16.000

QUANTIDADE DE LIXO (1000 ton)

14.000 12.000 10.000 8.000 6.000 4.000 2.000 0

2001

2002

2003

2004

2005

ANOS

C) GRFICO DE SETORES O grfico de setores ou pizza um dispositivo grfico comumente usado para apresentar as distribuies de freqncia relativa. Sua construo feita com base em um crculo que dividido em setores com reas proporcionais s freqncias das diversas categorias. Este grfico serve para retratar, principalmente, dados qualitativos. Exemplo: Na tabela abaixo, apresentada a distribuio dos cinco refrigerantes mais vendidos no pas. Refrigerante Mais Vendido Freqncia Relativa fri (%) ngulo (graus) Coca-cola 38 136,80 Guaran Antarctica 26 93,60 Pepsi-cola 16 57,60 Coca-cola light 11 39,60 Sprite 9 32,40 Total 100 360,00
Fonte: Revista Bares e Restaurantes, edio 51, Brasil, set 2006.

19

Para que o ngulo correspondente a cada setor seja determinado, utiliza-se regra de trs simples: 100 38 3600 x

x=

38.360 = 136,80 100

Determina-se, analogamente, os ngulos dos outros setores. Representando-se, graficamente, com um grfico de setores, a varivel qualitativa Refrigerante Mais Vendido no pas, tm-se:
SPRITE 9%

COCA-COLA LIGHT 11%

COCA-COLA 38%

PEPSI-COLA 16%

GUARAN ANTARCTICA 26%

D) GRFICO DE LINHA uma aplicao do processo de representao das funes num sistema de coordenadas cartesianas. Neste tipo de grfico se utiliza uma linha poligonal para representar a srie estatstica. til para se visualizar a variao de uma grandeza em relao outra. Este grfico serve para retratar dados quantitativos. Exemplo: Na tabela abaixo, est indicada a varivel quantitativa discreta Produo Brasileira de Petrleo de 2000 a 2004. Anos 1997 1998 1999 2000 2001 2002 2003 2004 2005 Produo Brasileira de Petrleo (milhes de litros) (freqncia absoluta) 65920 66845 69738 71844 75014 84434 87024 86197 89587

Fonte: Ministrio de Minas e Energia, 2007.

20

Determinados, graficamente, todos os pontos da srie usando os pares ordenados, o ano no eixo horizontal e as quantidades no eixo vertical, ligam-se esses pontos, dois a dois, por segmentos de reta, o que gera uma linha poligonal, que o grfico em linha correspondente srie em estudo.

92 PRODUO DE PETRLEO NO BRASIL (bilhes de litros) 88 84 80 76 72 68 64 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

ANO

E) GRFICO DE LINHAS MLTIPLAS uma aplicao do processo de representao das funes num sistema de coordenadas cartesianas. Neste tipo de grfico se utiliza linhas poligonais para representar as sries estatsticas. til para comparar a variao de uma grandeza em relao outra. Este grfico serve para retratar dados quantitativos. Exemplo: Na tabela abaixo, esto indicadas as variveis quantitativas Oferta e Demanda de Etanol no Brasil de 1997 a 2005. Anos Oferta e Demanda de Etanol no Brasil (bilhes de litros) (freqncia absoluta) Oferta Demanda 15,49 7,51 14,12 3,38 12,98 3,02 10,61 2,81 11,50 5,56 12,62 8,75 14,73 12,23 15,10 13,53 16,05 15,02

1997 1998 1999 2000 2001 2002 2003 2004 2005

Fonte: Embrapa - Ministrio da Agricultura, Pecuria e Abastecimento, 2007.

Determinados, graficamente, todos os pontos das sries usando os pares ordenados, o ano no eixo horizontal e as quantidades no eixo vertical, ligam-se esses pontos, dois a dois, por segmentos de reta, para cada uma das variveis, gerando, nesse caso, duas linhas poligonais (podem ser mltiplas), que o grfico em linhas correspondente s sries em estudo.
21

OFERTA e DEMANDA DE ETANOL NO BRASIL (bilhes de litros)

16 14 12 10 8 6 4 2 0 1996

OFERTA DEMANDA

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

ANO

F) HISTOGRAMAS Representao grfica da distribuio de freqncias somente de varivel contnua. Os dados agrupados em intervalos de classe podem ser representados graficamente por meio de um histograma. O histograma uma representao grfica formada por retngulos justapostos, cujas bases se apiam no eixo horizontal. A altura de cada retngulo deve ser proporcional freqncia correspondente a cada classe e o ponto mdio da base de cada retngulo deve coincidir com o ponto mdio do respectivo intervalo de classe. Exemplo: Na tabela abaixo est indicado o nmero de famlias brasileiras de acordo com o nmero de salrios mnimos que cada uma delas tem como renda familiar mensal. Renda Familiar Mensal Nmero de Salrios Mnimos Nmero de Famlias (milhes) (freqncia absoluta) 13200 15000 6900 3800 4000 3250 1560 1300 900 500

0 a1 1a 2 2a3 3a 4
4a5

5a6 6a7 7a8 8a9 9 a 10


Fonte: IBGE, 2005.

22

Representando-se, graficamente, por meio de um histograma, a varivel quantitativa contnua Renda Familiar Mensal no pas, tm-se:
16000
NMERO DE FAMLIAS (MILHES)

14000 12000 10000 8000 6000 4000 2000 0


1 2 3 4 5 6 7 8 RENDA FAMILIAR MENSAL (SALRIOS MNIMOS) 9 10

23

LISTA 2 - Exerccios para fixao


1. Estes quatro grficos, na ordem em que so apresentados (1, 2, 3, 4), denominam-se: GRFICO 1
16000
80

GRFICO 2
FREQNCIA ABSOLUTA
70 60 50 40 30 20 10 0 Gerencial Servios Burocrticos Artesanato Trabalho No Qualificado

NMERO DE FAMLIAS (MILHES)

14000 12000 10000 8000 6000 4000 2000 0


1 2 3 4 5 6 7 8 RENDA FAMILIAR MENSAL (SALRIOS MNIMOS) 9 10

OCUPAO

GRFICO 3
100000

GRFICO 4
SUL

PRODUO DE PETRLEO (mil m )

80000

REGIO BRASILEIRA

NORTE

60000

40000

CENTRO-OESTE

20000

SUDESTE

0
2000 2001 2002 2003 2004

10

20

30

40

50

60

70

80

ANO

PRODUO DE MADEIRA Freqncia Relativa (%)

a) Colunas simples, colunas simples, polgono de freqncia, barras simples. b) Colunas mltiplas, histograma, linha, barras mltiplas. c) Histograma, colunas simples, linha, barras simples. d) Histograma, colunas simples, polgono de freqncia, barras simples. e) Colunas mltiplas, colunas simples, diagrama de disperso, barras simples. 2. Representar graficamente a distribuio de freqncias da empresa Delta, segundo o nmero de faltas mensais, como um grfico de colunas simples para varivel discreta. No de faltas do ms No de operrios (freqncia absoluta)
Fonte: Dados hipotticos.

0 160

1 120

2 90

3 70

4 40

5 20

6 10

3. Construir um grfico de colunas simples segundo os dados abaixo: Nmero de alunos matriculados de 5a a 8a sries em 2002 por regio brasileira Regio No de Alunos Norte 1.187.917 Nordeste 5.147.767 Centro-Oeste 1.271.778 Sudeste 6.045.132 Sul 2.117.381
Fonte: www.inep.gov.br

24

4. Construir um grfico de barras simples segundo os dados abaixo: Turistas estrangeiros no Brasil - Cidades mais visitadas em 2003 Cidade Porcentagem (freqncia relativa) Rio de Janeiro 22,60 So Paulo 3,00 Salvador 17,20 Fortaleza 48,60 Recife 8,10 Outras 0,60
Fonte: Embratur, 2005.

5. Construir um grfico de setores para os dados tabelados em cada um dos itens abaixo. a) Estimativa da safra de gros em 2004 por regio brasileira Regio Porcentagem (freqncia relativa) Norte 3 Nordeste 8 Sudeste 15 Centro-Oeste 33 Sul 41
Fonte: IBGE, 2004.

b) Profisso preferida no vestibular 2003 em universidades particulares Profisso Porcentagem (freqncia relativa) Administrao 21,1 Direito 18,4 Odontologia 14,8 Engenharia 13,8 Medicina 10,5 Pedagogia 3,0 Outros 18,4
Fonte: Centro de Pesquisas Confiana, 2005.

c) Nmero de veculos motorizados registrados em Santa Vitria/MG Tipo de Veculo Quantidade (freqncia absoluta) Carro de passageiro 585 Minivan 75 Caminho de 2 eixos 60 Caminho de Multieixo 30 Moto 315 Barco a motor 15
Fonte: Dados hipotticos.

25

6. Construir um grfico de barras mltiplas para representar a evoluo ao longo das dcadas da populao urbana e rural brasileira. Populao (%) Anos 1950 1960 1970 1980 1990 2000 2005
Fonte: www.ibge.gov.br

Urbana 36,16 45,08 55,94 67,59 75,59 81,25 83,01

Rural 63,84 54,92 44,06 32,41 24,41 18,75 16,99

7. Em todas as Olimpadas que participou at 2004, o Brasil conquistou medalhas em apenas 11 modalidades. Construir um grfico de colunas mltiplas para representar essas modalidades e o nmero de medalhas conquistadas em cada uma delas. MEDALHAS Prata 2 3 3 1 1 4 3 3 1 0 0

Modalidades Vela Atletismo Jud Vlei Tiro Esportivo Vlei de Praia Natao Futebol Basquete Boxe Hipismo
Fonte: COB, 2005.

Ouro 6 3 2 2 1 2 0 0 0 0 1

Bronze 6 7 7 2 1 1 6 1 4 1 2

8. Construir um grfico de linha segundo os dados abaixo: Anos 2000 2001 2002 2003 2004 2005 Produo de Feijo (milhes de toneladas) 4,3 3,9 4,3 4,4 4,3 3,9

Fonte: www.conab.gov.br

9. Construir um grfico de linhas duplas segundo os dados abaixo: Participao de homens e mulheres no mercado de trabalho (%) Homens Mulheres 71,2 28,8 66,5 33,5 59,6 40,4 57,6 42,4

Anos 1975 1985 1995 2005

Fonte: www.fcc.org.br

26

10. Os dados abaixo representam a massa, em quilogramas, de uma amostra de 50 bebs nascidos na Maternidade So Bento no perodo de 30 dias. Construa o histograma que represente os valores da freqncia relativa. Massa (kg) No de bebs % de bebs 2 4 1,0 a 1,5 2 4 1,5 a 2,0 4 8 2,0 a 2,5 14 28 2,5 a 3,0 23 46 3,0 a 3,5 5 10 3,5 a 4,0 Total 50 100
Fonte: Registro da Maternidade So Bento, 2003.

11. Os dados abaixo representam a vida til, em horas, de 260 lmpadas de certa indstria na cidade de Jacare. Construir o histograma correspondente a essa distribuio. Durao (horas) 300 a 400 400 a 500 500 a 600 600 a 700 700 a 800 800 a 900 900 a 1000 Total
Fonte: Dados hipotticos.

No de lmpadas 12 28 36 48 60 50 26 260

12. O histograma abaixo representa a distribuio das notas de portugus dos 600 alunos de uma escola num determinado ms.

fri (%)
38%

20%

20%

12% 10%

10

notas

a) Construa a tabela de distribuio de freqncias para as notas representadas no histograma acima (com fi, fri (%), Fac, FRi (%) e pontos mdios das classes). b) Qual o nmero de alunos com notas menores que 4,0? c) Qual o nmero de alunos com notas entre 8,0 e 10,0?

27

13. Do lixo produzido no Brasil, diariamente, 60.000 toneladas so de papel, 7.200 toneladas de plstico, 19.200 toneladas de metais, 4.800 toneladas de vidro e 148.800 toneladas so provenientes de outros materiais, totalizando 240.000 toneladas de lixo por dia (www.cempre.org.br). Observe os grficos de setores abaixo e indique qual o mais adequado para representar essas informaes.

14. Um grupo de estudantes de enfermagem fez uma pesquisa sobre o tipo de sangue contido nos 540 frascos de um banco de sangue de certo hospital. Para resumirem os dados encontrados, os estudantes construram um grfico de setores e, no lugar das porcentagens, indicaram os ngulos de alguns desses setores circulares, como mostrado na figura abaixo (Hospital So Bento). Calcule o nmero de frascos que contm sangue tipo B.
Tipo A 108
o

Tipo B X
o

Tipo AB 36
o

Tipo O 162
o

15. O grfico abaixo representa, em milhares de toneladas, a produo de soja do estado de So Paulo entre os anos de 1997 e 2005 (Brasil Pesquisas, 2006). Calcule o decrscimo percentual entre os anos de 2000 e 2001 e o acrscimo percentual entre os anos de 2001 e 2002.
70

Produo de Soja no Estado de So Paulo (mil toneladas)

60

50

40

30

20 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

ANO

28

16. Um estudo caracterizou cinco ambientes aquticos, nomeados de A a E, em uma regio, medindo parmetros fsico-qumicos de cada um deles, incluindo o pH nos ambientes. O Grfico I representa os valores de pH dos cinco ambientes. Grfico I Grfico II

Utilizando o Grfico II, que representa a distribuio estatstica de espcies em diferentes faixas de pH, pode-se esperar um maior nmero de espcies no ambiente: a) A b) B c) C d) D e) E 17. A escolaridade dos jogadores de futebol nos grandes centros maior do que se imagina, como mostra a pesquisa abaixo, realizada com os jogadores profissionais dos quatro principais clubes de futebol do Rio de Janeiro.

De acordo com esses dados, o percentual dos jogadores dos quatro clubes que concluram o Ensino Mdio de aproximadamente: a) 14% b) 48% c) 54% d) 60% e) 68% 18. No grfico abaixo pode-se observar como so divididos os 188 bilhes de reais do oramento da Unio entre os setores de sade, educao, previdncia e outros.

29

Se os 46 bilhes gastos com a previdncia fossem totalmente repassados aos demais setores de modo que 50% fossem destinados sade, 40% educao e 10% aos outros setores, o aumento percentual para o setor de sade seria igual, aproximadamente, a: a) 121% b) 69% c) 65% d) 61% e) 50% 19. Moradores de trs cidades, aqui chamadas de X, Y e Z, foram indagados quanto aos tipos de poluio que mais afligiam as suas reas urbanas. Nos grficos de setores abaixo esto representadas as porcentagens de reclamaes sobre cada tipo de poluio ambiental.

Considerando a queixa principal dos cidados de cada cidade, a primeira medida de combate poluio em cada uma delas seria, respectivamente: X Manejamento de lixo Controle de despejo industrial Manejamento de lixo Controle de emisso de gases Controle de despejo industrial Y Esgotamento sanitrio Manejamento de lixo Esgotamento sanitrio Controle de despejo industrial Manejamento de lixo Z Controle de emisso de gases Controle de emisso de gases Controle de despejo industrial Esgotamento sanitrio Esgotamento sanitrio

a) b) c) d) e)

20. O grfico abaixo mostra uma triste realidade brasileira: a desigualdade racial associada renda do trabalhador.

De acordo com o grfico, julgue as sentenas abaixo como verdadeiras (V) ou falsas (F): a) Alm da desigualdade racial, h uma desigualdade salarial entre os sexos. ( ) b) A desigualdade salarial entre os sexos maior entre os negros. ( )
30

c) Em mdia, o salrio dos negros metade do salrio dos no-negros, independentemente do sexo. ( ) d) Para que um homem negro recebesse, por hora, o mesmo valor que uma mulher no-negra, seu rendimento por hora deveria aumentar 50%. ( ) e) Para que uma mulher negra recebesse, por hora, o mesmo valor que uma mulher no-negra, seu rendimento por hora deveria aumentar aproximadamente 100%. ( ) 21. Com base no grfico abaixo, correto afirmar que: No total de pousos e decolagens em alguns aeroportos do pas entre 2003 e setembro de 2006

Dados: Infraero

a) At setembro de 2006, houve mais de 300 mil pousos e decolagens em aeroportos de So Paulo. b) O aeroporto do Galeo registrou acrscimo de mais de 40% nos pousos e decolagens de 2004 a setembro de 2006. c) Houve, no aeroporto de Braslia, reduo de mais de 6 mil pousos e decolagens de 2004 a 2005. d) Se a mdia mensal de pousos e decolagens registrada em Congonhas at setembro de 2006 se mantivesse at o final do ano, o total anual de 2006 ultrapassaria 220 mil vos. e) O aeroporto de Congonhas registrou uma taxa de variao percentual menor que 2% nos pousos e decolagens no perodo de 2003 a 2005. 22. No grfico de colunas abaixo, est representado o nmero de rdio emissoras por regio brasileira no ano 2000. Analisando-o, classifique em V ou F cada sentena seguinte:

31

a) Se esse conjunto de dados fosse representado em um grfico de setores, o ngulo correspondente regio Sul seria menor que 90. ( ) b) Na regio Centro-Oeste h 2,27% das rdios emissoras brasileiras. ( ) c) O nmero de rdio emissoras na regio Sudeste 60% maior que na regio Nordeste. ( ) d) Na regio Norte h, apenas, 5,73% das rdio emissoras de todo o pas. ( ) e) Nas regies Sul e Sudeste esto mais de 60% das rdio emissoras de todo o pas. ( ) 23. Para o clculo da inflao, utiliza-se, entre outros, o ndice Nacional de Preos ao Consumidor Amplo (IPCA), que toma como base os gastos das famlias residentes nas reas urbanas, com rendimentos mensais compreendidos entre um e quarenta salrios mnimos. O grfico a seguir mostra as variaes do IPCA de quatro capitais brasileiras no ms de maio de 2008.

Com base no grfico qual foi o item determinante para a inflao de maio de 2008? a) Alimentao e bebidas. b) Artigos de residncia. c) Transportes. d) Vesturio. e) Habitao.

24. A Contagem da Populao, iniciada no dia 16 de abril, cobriu 5.435 municpios com at 170 mil habitantes, o correspondente a 97% dos municpios brasileiros, recenseando 108,7 milhes de pessoas. Esse nmero equivale a 60% da populao estimada, residente em 30 milhes de domiclios (57% do existente no pas). A grande inovao tecnolgica dos Censos 2007 foi a utilizao de 82 mil computadores de mo (PDA`s), em substituio aos tradicionais questionrios de papel. Essa operao envolveu mais de 90 mil pessoas em todo o pas. Dotados de equipamentos de GPS (Sistema de Posicionamento Global, em portugus), eles possibilitaram a exata localizao dos recenseadores nas reas de coleta (setores censitrios). As vantagens foram inmeras, principalmente no que diz respeito rapidez e agilidade nas entrevistas, processamento das informaes recolhidas e comunicao dos resultados sociedade. Fonte: IBGE. Os resultados da pesquisa esto representados no grfico de setores a seguir:

32

Observando o grfico de setores podemos afirmar que: a) a maior populao se concentra na regio sul. b) a menor populao se concentra na regio centro-oeste. c) a menor populao se concentra na regio sudeste. d) a menor populao se concentra na regio nordeste. e) a maior populao se concentra na regio norte. 25. Em um estudo feito pelo Instituto Florestal, foi possvel acompanhar a evoluo de ecossistemas paulistas desde 1962. Desse estudo publicou-se o Inventrio Florestal de So Paulo, que mostrou resultados de dcadas de transformaes da Mata Atlntica.

Examinando o grfico da rea de vegetao natural remanescente (em mil km2) pode-se inferir que: a) a Mata Atlntica teve sua rea devastada em 50% entre 1963 e 1973. b) a vegetao natural da Mata Atlntica aumentou antes da dcada de 60, mas reduziu nas dcadas posteriores. c) a devastao da Mata Atlntica remanescente vem sendo contida desde a dcada de 60. d) nos anos 2000-2001, a rea de Mata Atlntica preservada em relao ao perodo de 1990-1992 foi de 34,6%. e) nos anos 2000-2001, a rea preservada da Mata Atlntica maior do que a registrada no perodo de 1990-1992. 26. O analfabetismo um problema social que atinge parte da populao brasileira. Observe o grfico de colunas abaixo, obtido pelo IBGE em 2003, que mostra o nmero de pessoas com 5 anos ou mais de idade no-alfabetizadas nas cinco regies do Brasil.

Considerando que, segundo o ltimo censo, a populao brasileira era de, aproximadamente, 180.762.400 habitantes, a porcentagem de pessoas no-alfabetizadas no Brasil igual a: a) 88% b) 78 % c) 68% d) 12% e) 10%
33

CAPTULO 3 - MEDIDAS QUANTITATIVAS


BIBLIOGRAFIA CONSULTADA: 1. ANDERSON, D.R.; SWEENEY, D.J. & WILLIAMS, T.A. Estatstica Aplicada Administrao e Economia. 2.ed. So Paulo: Pioneira Thomson Learning, 2002. 2. BUSSAB, W. O. & MORETIN, P. Mtodos Quantitativos: Estatstica Bsica. 5.ed. So Paulo: Saraiva, 2002. 3. DOWNING, D. & CLARK, J. Estatstica Aplicada. So Paulo: Saraiva, 2002. 4. LAPPONI, J.C. Estatstica usando o Excel. 4.ed. So Paulo: Campus, 2005. 5. MARTINS, G. A. Estatstica Geral e Aplicada. 2.ed. So Paulo: Atlas, 2002. 6. MARTINS, G. A. & DONAIRE, D. Princpios de Estatstica. 4.ed. So Paulo: Atlas, 1995. 7. MEDEIROS, E. S. e colaboradores. Estatstica para os Cursos de Economia, Administrao e Cincias Contbeis. Vol. 1 e 2. 3.ed. So Paulo: Atlas, 1999. 8. STEVENSON, W. J. Estatstica Aplicada Administrao. 3.ed. So Paulo: Harbra Harper How do Brasil, 2001. 9. TRIOLA, M.F. Introduo Estatstica. 10.ed. Rio de Janeiro: LTC, 2008.

1. INTRODUO
Os mtodos estatsticos envolvem a anlise e a interpretao de dados numricos. Para interpretar os dados corretamente necessrio, primeiramente, organizar e sumarizar os nmeros. Um conjunto de nmeros pode reduzir-se a uma ou a algumas medidas numricas que resumem todo o conjunto. Usualmente, empregam-se as seguintes medidas: 1.1 Medidas de posio (tendncia central) = mdia aritmtica simples e ponderada, mediana e moda. 1.2 Medidas Separatrizes = quartis, decis, percentis, etc. 1.3 Medidas de disperso (disperso de nmeros) = amplitude total, varincia, desvio padro e coeficiente de variao.

1.1 MEDIDAS DE POSIO (TENDNCIA CENTRAL)


A) DADOS BRUTOS OU ROL A.1 Mdia Aritmtica Notao:

Calcula-se a mdia aritmtica efetuando-se a soma das observaes dividida pelo nmero total de observaes.

x = i =1 n

xi

Exemplo 1: Durante um determinado ms de vero, os quinze vendedores de uma empresa de calefao central e ar condicionado venderam os seguintes nmeros de ar condicionado central: 8, 11, 12, 5, 14, 12, 8, 11, 16, 12, 12, 17, 7, 9, 11. Considerando este ms como uma populao estatstica de interesse, o nmero mdio de unidades vendidas :

x=

8 + 11 + 12 + 5 + 14 + 12 + 8 + 11 + 16 + 12 + 12 + 17 + 7 + 9 + 11 = 11 15

34

A.2 Mdia Aritmtica Ponderada Notao:

Exemplo 2: Considere a situao em que um professor informe que os pesos das notas bimestrais, so: 1o bimestre - peso 2; 2o bimestre - peso 2; 3o bimestre - peso 3; 4o bimestre - peso 3. O aluno obteve as seguintes notas em Estatstica: 6,0; 8,0; 9,0 e 5,0, em cada bimestre, respectivamente. O clculo da mdia ponderada deve levar em conta os pesos desiguais dos bimestres. A frmula para o clculo :

x = i =1n fi
i =1

x i .f i

onde xi a observao de ordem i e fi o peso da observao de ordem i. Portanto, para o exemplo 2:

x=
A.3 Mediana Notao:

2 6,0 + 2 8,0 + 3 9,0 + 3 5,0 70 = = 7,0 2+ 2+3+3 10

~ x

Colocados os dados brutos em ordem crescente ou decrescente (ROL), a mediana o elemento que ocupa a posio central. Sua caracterstica principal dividir um conjunto ordenado de dados em dois grupos iguais; a metade ter valores inferiores mediana e a outra metade ter valores superiores mediana. Para se calcular a mediana, determina-se o nmero n de elementos do rol, utilizando o seguinte critrio: Se n mpar O rol admite um termo central que ocupa a posio

n +1 . 2

Exemplo 3: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de aparelhos de ar condicionado, colocadas em ordem crescente (rol): 5, 7, 8, 8, 9, 11, 11, 11, 12, 12, 12, 12, 14, 16, 17. O elemento central desse conjunto de dados ocupa a posio seja, a 8a posio. Portanto, a mediana desse conjunto de dados igual a 11.

n + 1 15 + 1 = = 8 , ou 2 2

~ x = 11

Se n par Utiliza-se como mediana, a mdia aritmtica das duas observaes centrais, ou seja, a mdia dos elementos que ocupam no rol as posies

n 2

n + 1. 2

Exemplo 4: O gerente de uma pizzaria mantm o controle das vendas dos diversos tipos de pizza. Suponha que ele tenha observado os seguintes valores de vendas dirias em ordem crescente (rol) do tipo calabresa durante o perodo de quatorze dias: 37, 38, 38, 39, 40, 43, 44, 46, 48, 51, 56, 59, 61, 64. As posies centrais desse conjunto de dados so:

n 14 = = 7 (7a 2 2

posio) 44

n 14 +1= +1= 8 2 2
elementos:

(8a posio) 46. A mediana , portanto, a mdia aritmtica desses dois

44 + 46 ~ x= = 45 2
35

Portanto, o procedimento para se determinar a mediana o seguinte: 1. Ordenar os valores (Rol); 2. Verificar se h um nmero mpar ou par de observaes; 3. a) Para um nmero mpar n de observaes, a mediana o valor central. b) Para um nmero par n de observaes, a mediana a mdia aritmtica das duas observaes centrais. A.4 Moda Notao: x*. o valor (observao) que ocorre com maior freqncia num conjunto de dados. Exemplo 5: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de aparelhos de ar condicionado: 8, 11, 12, 5, 14, 12, 8, 11, 16, 12, 12, 17, 7, 9, 11. A moda para esse conjunto de dados o valor que ocorre com maior freqncia, ou seja, x* = 12. OBSERVAES: Se mais de um valor ocorre com maior, mas igual, freqncia, todos eles so chamados de moda. Muitas distribuies que surgem na prtica so razoavelmente simtricas com a maioria dos valores concentrada prximo ao centro. Em tal caso, mdia, moda e mediana esto muito prximas umas das outras ou so at coincidentes. Uma distribuio com duas modas chamada de distribuio bimodal.

B) VARIVEIS DISCRETAS

B.1 Mdia

de uma distribuio de freqncias

Se os dados so provenientes de uma varivel discreta, deve-se utilizar a mdia aritmtica ponderada, considerando as freqncias absolutas fi como sendo as ponderaes dos elementos xi correspondentes. Deve-se, portanto, utilizar a frmula da mdia ponderada para determinar a mdia de uma distribuio de freqncias:

x=

i =1 n

x i .f i
i =1
n

i =1

x i .f i n

fi

com fi sendo a freqncia da i-sima classe e

i =1

f i = n , onde n o nmero total de observaes.

Exemplo 6: Sem perda de informao. O departamento de trnsito da cidade de So Paulo coletou o nmero de acidentes ocorridos em certo cruzamento de ruas na zona oeste, por 25 dias teis do ms de maro, com o objetivo de estudar a possibilidade de colocao de um semforo no citado cruzamento. A seguir, foi determinado o nmero mdio de acidentes, com os dados apresentados na tabela abaixo:

36

No de acidentes xi 0 5 10 15 20 25 30 Total Soluo:

No de dias fi 2 4 5 10 2 1 1 n = 25

xi. fi 0 20 50 150 40 25 30 315

x = i =1

x i .f i n

315 = 12,6 13 acidentes/dia 25

B.2 Mediana

~ x

de uma distribuio de freqncias

Se os dados, provenientes de uma varivel discreta, esto apresentados em tabelas, eles j esto naturalmente ordenados. Como a mediana o elemento que ocupa a posio central do conjunto ordenado de dados, basta verificar se o nmero de elementos da srie mpar ou par. n = mpar a mediana ser o elemento central, ordem =

n +1 2 n 2
e

n = par a mediana ser a mdia aritmtica entre os elementos centrais, ordem =

n +1 2

Exemplo 7: Determinando a mediana do conjunto de dados do Exemplo 6. No de acidentes xi 0 5 10 15 20 25 30 Total Soluo: Como n = 25 (mpar), o elemento central No de dias fi 2 4 5 10 2 1 1 n = 25 Freqncia Acumulada Fac=Fi 2 6 11 21 (13o elemento) 23 24 25 --------------------------------

n + 1 25 + 1 = = 13 2 2

(13o elemento).

Aps calcular a posio da mediana, abre-se a coluna de Fac e, pelas freqncias acumuladas, encontra-se a posio da mediana. O valor xi que o elemento central corresponde mediana. Neste exemplo, portanto: ~ x = 15 acidentes/dia
37

Exemplo 8: Uma indstria metalrgica embala peas em caixas com 100 unidades. O controle de qualidade selecionou 50 caixas na linha de produo e anotou em cada caixa o nmero de peas defeituosas. A seguir, obteve a seguinte distribuio de freqncias: No de peas defeituosas xi 0 1 2 3 4 Total No de caixas fi 15 10 12 8 5 n = 50 Freqncia Acumulada Fac=Fi 15 25 (25o elemento) 37 (26o elemento) 45 50 --------------------------------

Soluo: Observando a coluna das freqncias acumuladas, sendo n = 50 (par), os elementos centrais so:

n 50 = = 25 (25o elemento) 1 pea defeituosa/caixa 2 2 n 50 +1= + 1 = 26 (26o elemento) 2 peas defeituosas/caixa 2 2


A mediana , nesse caso, a mdia aritmtica desses dois elementos:

1+ 2 ~ x= = 1,5 2

peas defeituosas/caixa

B.3 Moda x* de uma distribuio de freqncias o valor que ocorre com maior freqncia na distribuio. Para distribuies sem agrupamento de classes, a identificao da moda facilitada pela simples observao do elemento que se apresenta com maior freqncia. Exemplo 9: Determinando a moda do conjunto de dados do Exemplo 6. No de acidentes xi 0 5 10 15 20 25 30 Total Soluo: Por observao, a moda 15, ou seja, x* = 15, pois esse valor aparece com maior freqncia nesta distribuio (10 vezes). No de dias fi 2 4 5 10 2 1 1 n = 25

38

C) VARIVEL CONTNUA C.1 Mdia

de uma distribuio de freqncias

Se os dados apresentados so classificados como varivel contnua, deve-se utilizar para o clculo da mdia, a mdia aritmtica ponderada. Nesse caso, consideram-se as freqncias absolutas das classes como sendo as ponderaes dos pontos mdios destas classes. Exemplo 10: Com perda de informao. Os salrios (em R$) de 25 funcionrios selecionados em uma empresa esto representados na tabela abaixo. Determinando o salrio mdio dessa distribuio, obtem-se: Classe 1 2 3 4 5 Salrios (em R$) 1.000,00 1.200,00 1.400,00 1.600,00 1.800,00
a a a a a

1.200,00 1.400,00 1.600,00 1.800,00 2.000,00 Total

Ponto mdio da classe No de funcionrios xi fi 1.100,00 2 1.300,00 6 1.500,00 10 1.700,00 5 1.900,00 2 n = 25

xi.fi 2.200,00 7.800,00 15.000,00 8.500,00 3.800,00 37.300,00

Obs.: Os pontos mdios das classes (xi) so determinados tomando-se a mdia aritmtica entre o extremo inferior e superior de cada classe. Soluo:

x = i =1
~ x

x i .f i n

37.300 = 1.492,00 reais/funcionrio 25

C.2 Mediana

de uma distribuio de freqncias

Se os dados apresentados so classificados como varivel contnua, deve-se utilizar para o clculo da mediana, o procedimento a seguir. 1. Calcula-se a ordem

n 2

(como a varivel contnua, no se preocupe se n par ou mpar);

2. Pela freqncia acumulada Fac, identifica-se a classe que contm a mediana (classe da 3. Ento, utiliza-se a frmula:

~ x );

~ x = I Md
onde:

n Fac, ant .h 2 + f Md

IMd = limite inferior da classe da mediana;


n = nmero total de elementos; Fac, ant = soma das freqncias anteriores classe da mediana; h = amplitude da classe da mediana;

fMd = freqncia absoluta da classe da mediana.


39

Exemplo 11: Determinando a mediana da situao apresentada no Exemplo 10. Classe 1 2 3 4 5 Salrios (em R$) 1.000,00 1.200,00 1.400,00 1.600,00 1.800,00 Total
a a a a a

1.200,00 1.400,00 1.600,00 1.800,00 2.000,00

No de funcionrios fi 2 6 10 5 2 25

Fac 2 8 18 (classe da ~ x) 23 25 --------------------------

Soluo: 1o passo: Calcula-se

n 25 . Como n = 25, tm-se = 12,5 13 2 2

(13a posio);

2o passo: Identifica-se a classe da mediana pela Fac. Neste caso, a classe da mediana a 3a classe, ou seja, 1.400,00 a 1.600,00; 3o passo: Aplica-se a frmula:

~ x = I Md
Neste caso:

n Fac, ant .h 2 + f Md

IMd = limite inferior da classe da mediana = 1.400,00 n = nmero total de elementos = 25 Fac, ant = soma das freqncias anteriores classe da mediana = 8
h = amplitude da classe da mediana = 200,00 fMd = freqncia absoluta da classe da mediana = 10

Ou seja:

25 8 .200,00 2 ~ x = 1400,00 + = 1.490,00 10

reais/funcionrio

C.3 Moda x* de uma distribuio de freqncias Se os dados apresentados so classificados como varivel contnua, pode-se optar por vrios procedimentos, como moda de Pearson, moda de King, moda de Czuber, entre outros, para se determinar a moda. Ser dado destaque moda de Czuber. MODA DE CZUBER CZUBER levou em considerao, em sua frmula, a freqncia absoluta da classe anterior, a freqncia absoluta da classe posterior, alm da freqncia absoluta da classe modal, o que leva a um valor mais preciso para a moda de uma varivel contnua. A frmula de Czuber a seguinte:

x* = I Mo +

(f Mo f ant ).h
2f Mo (f ant + f post )
40

onde:

IMo = limite inferior da classe modal; fMo = freqncia absoluta da classe modal; fant = freqncia absoluta da classe anterior classe modal; fpost = freqncia absoluta da classe posterior classe modal;
h = amplitude do intervalo de classe.

Exemplo 12: Determinando a moda de Czuber para a situao apresentada no Exemplo 10. Classe 1 2 3 4 5 Salrios (em R$) 1.000,00 1.200,00 1.400,00 1.600,00 1.800,00 Total
a a a a a

1.200,00 1.400,00 1.600,00 1.800,00 2.000,00

No de funcionrios fi 2 6 10 5 2 25

Soluo: Por observao, a classe modal a terceira classe, j que esta a classe de maior freqncia. Neste caso,

IMo = limite inferior da classe modal = 1.400,00 fMo = freqncia absoluta da classe modal = 10 fant = freqncia absoluta da classe anterior classe modal = 6 fpost = freqncia absoluta da classe posterior classe modal = 5
h = amplitude do intervalo de classe = 200,00 Ou seja:

x* = 1.400,00 +

(10 6).200,00 = 1.488,89 reais/funcionrio


2.10 (6 + 5)

Observao Importante: Ocorrem, algumas vezes, dois ou mais picos distintos de igual freqncia nos dados. Nesses casos, a distribuio bimodal (duas modas) ou de modas mltiplas, respectivamente.

41

1.2 MEDIDAS SEPARATRIZES


So nmeros reais que dividem a seqncia ordenada de dados em partes que contm a mesma quantidade de elementos da srie. A mediana, por exemplo, que divide a seqncia ordenada em dois grupos, cada um deles contendo 50% dos valores da seqncia, tambm uma medida separatriz. Alm da mediana, neste captulo, sero destacadas outras medidas separatrizes, ou seja, quartis, decis e percentis.

D.1 Quartis Os quartis dividem um conjunto de dados em quatro partes iguais, como pode ser visto esquematicamente: 0% 25% 50% 75% 100%

Q1

Q2 =

~ x

Q3

Q1 = 1o quartil, composto por 25% dos elementos. Q2 = 2o quartil, coincide com a mediana, composto por 50% dos elementos. Q3 = 3o quartil, composto por 75% dos elementos. Os quartis sero utilizados, apenas, para dados agrupados em classes. As frmulas para a determinao dos quartis Q1 e Q3 so semelhantes quelas usadas para o clculo da mediana. Determinao de Q1: 1o Passo: Calcula-se a posio Determinao de Q3:

2o Passo: Identifica-se a classe de Q1 pela Fac 3o Passo: Aplica-se a frmula:

n 4

1o Passo: Calcula-se a posio

2o Passo: Identifica-se a classe de Q3 pela Fac 3o Passo: Aplica-se a frmula:

3n 4

Q1 = I Q1
onde:

n Fac, ant .h 4 + f Q1

Q3 = IQ3

3n Fac, ant .h 4 + f Q3

lQi = limite inferior da classe Qi n = nmero total de elementos h = amplitude de classe fQi = freqncia absoluta da classe Qi Fac, ant = soma das freqncias anteriores classe Qi.

42

Exemplo 13: Em conjunto com uma auditoria anual, uma empresa de contabilidade pblica anota o tempo necessrio para realizar a auditoria de 52 balanos contbeis, tal como indicado na tabela abaixo. Determinando os valores do 1o e 3o quartis (Q1 e Q3), obtem-se: Classe Tempo de auditoria No de balanos (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 32 52 (classe de Q3) ----------------------Fac

18 (classe de Q1)

Soluo: Q1 = ? 1o Passo: Q3 = ?

n 52 = = 13 4 4

(13a posio)

3n 3.52 = = 39 4 4

(39a posio)

2o Passo: Pela Fac, identifica-se as classes de Q1 e Q3 3o Passo: Uso das frmulas:

Q1 = I Q1

n Fac, ant .h 4 + f Q1

52 8 .10 4 = 34 minutos/balano Q1 = 29 + 10
3.52 32 .10 4 = 52,5 minutos/balano Q 3 = 49 + 20
50% 75% 100%

Q3 = IQ3

3n Fac, ant .h 4 + f Q3
25%

0%

10

34

~ x

52,5

59

Interpretao: 25% dos balanos so realizados em at 34 minutos e 75% dos balanos so realizados em at 52,5 minutos.

D.2 DECIS Os decis dividem um conjunto de dados em dez partes iguais. Os decis sero utilizados, apenas, para dados agrupados em classes. O procedimento para a determinao dos decis semelhante quele usados para o clculo dos quartis. 1o Passo: Calcula-se a posio

i.n , onde i =1, 2, 3, 4, 5, 6, 7, 8, 9 10


43

2o Passo: Identifica-se a classe de Di pela Fac

3o Passo: Aplica-se a frmula:

Di = I Di

i.n Fac, ant .h 10 + f Di

onde:

lDi = limite inferior da classe Di n = nmero total de elementos h = amplitude de classe fDi = freqncia absoluta da classe Di Fac,ant = soma das freqncias anteriores classe Di

Exemplo 14: Determinando o valor do 4o decil (D4) para a situao apresentada no Exemplo 13. Classe Tempo de auditoria No de balanos (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 18 32 (classe de D4) 52 ----------------------Fac

Soluo: 1o Passo: Calcula-se a posio

4.52 = 20,80 21 (21a posio) 10

2o Passo: Identifica-se a classe de D4 pela Fac 3o Passo: Aplica-se a frmula:

D4 = ID 4

4.n Fac, ant .h 10 + f D4

4.52 18 .10 10 = 41 minutos/balano D 4 = 39 + 14

Interpretao: 40% dos balanos so realizados em at 41 minutos e 60% dos balanos, portanto, so realizados em tempos acima de 41 minutos.

D.3 PERCENTIS Os percentis dividem um conjunto de dados em cem partes iguais. Os decis sero utilizados, apenas, para dados agrupados em classes. O procedimento para a determinao dos decis semelhante quele usados para o clculo dos quartis. 1o Passo: Calcula-se a posio

i.n , onde i = 1, 2, 3, 4, 5, ..., 97, 98, 99 100


44

2o Passo: Identifica-se a classe Pi pela Fac 3o Passo: Aplica-se a frmula:

Pi = I Pi
onde:

i.n Fac, ant .h 100 + f Pi

lPi = limite inferior da classe Pi n = nmero total de elementos h = amplitude de classe fPi = freqncia absoluta da classe Pi Fac,ant = soma das freqncias anteriores classe Pi

Exemplo 15: Determinando o valor do 82o percentil (P33) para a situao apresentada no Exemplo 13. Classe Tempo de auditoria No de balanos (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 18 32 52 (classe de P82) ----------------------Fac

Soluo: 1o Passo: Calcula-se a posio

82.52 = 42,64 43 100

(43a posio)

2o Passo: Identifica-se a classe de P82 pela Fac 3o Passo: Aplica-se a frmula:

P82 = I P82

82.n Fac, ant .h 100 + f P82

82.52 32 .10 100 = 54,32 P82 = 49 + 20

minutos/balano

Interpretao: 82% dos balanos so realizados em at 54,32 minutos e 18% dos balanos, portanto, so realizados em tempos acima de 54,32 minutos.

45

1.3 MEDIDAS DE DISPERSO Considere as seguintes sries de dados: X : 10, 10, 10, 10, 10, 10, 10, 10, 10, 10 Y : 7, 8, 9, 9, 10, 10, 11, 11, 12, 13 Z : 3, 4, 5, 6, 10, 10, 14, 15, 16, 17 As trs sries tm uma caracterstica comum, que o valor da mdia. Essa mdia 10 para as trs sries. Entretanto, elas diferem entre si com relao ao agrupamento dos dados em torno dessa mdia. Na srie X todos os dados so iguais a 10 e, portanto, a mdia representa muito bem essa srie. Na seqncia Y v-se que vrios dados diferem da mdia, mas esto prximos dela, ou seja, apresentam grande concentrao em torno de 10. A mdia 10 representa razoavelmente bem a srie. Na seqncia Z existem muitos valores muito afastados do valor 10 e, portanto, a mdia 10 no representa muito bem a srie. Chamando de disperso ou variabilidade a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central tomado como ponto de comparao, pode-se dizer que o conjunto X apresenta uma disperso ou variabilidade nula e que o conjunto Y apresenta uma disperso ou variabilidade menor que o conjunto Z. Em resumo, em X os dados esto totalmente concentrados na mdia 10 e, portanto, no h disperso de dados. Em Y existe forte concentrao de dados em torno da mdia e fraca disperso. Em Z h fraca concentrao de valores em torno da mdia e grande disperso de dados. Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor disperso ou variabilidade entre esses valores e sua medida de posio, a Estatstica recorre s medidas de disperso ou de variabilidade. Dessas medidas, sero estudadas a amplitude total, a varincia, o desvio padro e o coeficiente de variao. E.1 AMPLITUDE TOTAL A amplitude total a diferena entre o maior e o menor valor observado:

A T = x mx x mn
A amplitude total tem o inconveniente de s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios, o que quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao aproximada da disperso ou variabilidade. Exemplo 16: Determinando a amplitude total para a varivel discreta (no de acidentes) descrita no Exemplo 6. Soluo:

A T = 30 0 = 30

acidentes

Exemplo 17: Determinando a amplitude total para a varivel contnua (salrios) descrita no Exemplo 10. Soluo:

A T = 2000 1000 = 1000


E.2 VARINCIA E DESVIO PADRO

reais

Como comentado, a amplitude total instvel por ser influenciada por valores extremos, que so, na sua maioria, devidos ao acaso. A varincia e o desvio padro so medidas que no possuem essa falha, pois levam em considerao a totalidade dos valores da varivel em estudo, o que faz dessas medidas, ndices de disperso bastante estveis, e por isso mesmo, os mais empregados.
46

A varincia baseia-se nos desvios em torno da mdia, determinando, porm, a mdia dos quadrados dos desvios. Assim, para o clculo da varincia mais interessante o uso das frmulas:

2 ( x) =

( x i x ) 2 .fi
n

Varincia populacional

s2 (x) =
onde n = fi .

( x i x )2 .fi
n 1

Varincia amostral

Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico um inconveniente. Por isso mesmo, imaginou-se uma medida que tem utilidade e interpretao prticas, denominada desvio padro, definido como a raiz quadrada do valor da varincia, ou seja:

( x ) = 2 s( x ) = s 2

Desvio padro populacional Desvio padro amostral

Tanto o desvio padro como a varincia so usados como medidas de disperso ou variabilidade. O uso de uma ou de outra depender da finalidade que se tenha em vista. A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras.

Exemplo 18: Determinando a varincia amostral e o respectivo desvio padro para a varivel discreta descrita no Exemplo 6. Soluo: Para facilitar o clculo da varincia e do desvio padro, monta-se a tabela abaixo, usando x = 12,60 acidentes/dia: No de acidentes xi 0 5 10 15 20 25 30 Total No de dias fi 2 4 5 10 2 1 1 25
(x i x ) 2 .fi

317,52 231,04 33,80 57,60 109,52 153,76 302,76 1206,00

s2 (x) =

2 ( x i x ) .fi 1.206 = = 50,25 25 1 fi 1

Portanto a varincia amostral 50,25.

s = s 2 , logo s = 50,25 = 7,09


Portanto, o desvio padro amostral 7,09 acidentes/dia.
47

Exemplo 19: Determinando a varincia amostral e o respectivo desvio padro para a varivel contnua descrita no Exemplo 10. Soluo: Para facilitar o clculo da varincia e do desvio padro, monta-se a tabela abaixo, usando x = 1.492,00 reais/funcionrio: Classe
1 2 3 4 5

Salrios (em R$)


1.000,00 1.200,00 1.400,00 1.600,00 1.800,00

a a a a a

1.200,00 1.400,00 1.600,00 1.800,00 2.000,00 Total

Ponto mdio da classe (xi) 1.100,00 1.300,00 1.500,00 1.700,00 1.900,00

No de funcionrios fi 2 6 10 5 2 25

(x i x ) 2 .fi

307.328 221.184 640 216.320 332.928 1.078.400

2 ( x i x ) .fi 1.078.400 2 s (x) = = = 44.933,33 25 1 fi 1

Portanto a varincia amostral 44.933,33.

s = s 2 , logo s = 44.933,33 = 211,97


Portanto, o desvio padro amostral R$ 211,97 por funcionrio.

E.3 COEFICIENTE DE VARIAO

O desvio padro por si s no representa muita coisa. Assim, um desvio padro de 2 unidades pode ser considerado pequeno para uma srie de valores cuja mdia 200, mas, se a mdia for 20, o mesmo no pode ser dito. Para contornar essa limitao, pode-se caracterizar o desvio padro dos dados em termos relativos a sua mdia, medida essa denominada coeficiente de variao (CV):

CV = .100 x

ou

s CV = .100 x

Exemplo 20: Determinando o coeficiente de variao para a varivel contnua descrita no Exemplo 10, cuja mdia calculada igual a R$ 1.492,00 e o respectivo desvio padro calculado no exemplo acima igual a R$ 211,97. Soluo:

CV =

211,97 .100 = 14,21% 1.492,00

Interpretao: Esse resultado indica que o desvio padro representa 14,21% do valor mdio e que, portanto, h uma grande disperso de valores salariais em torno do salrio mdio dos funcionrios dessa empresa.

48

LISTA 3 Exerccios para fixao


1. Considere uma amostra com os valores de 53, 55, 70, 58, 64, 57, 53, 69, 57, 68 e 53. Calcule a mdia, a mediana e a moda. 2. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Calcule a nota mdia, a nota mediana e a nota modal. 3. Para uma amostra de 15 clientes de um pequeno mercado, foram observados os seguintes montantes de vendas, ordenados em ordem crescente: R$ 5,10; 5,10; 6,25; 6,25; 6,25; 7,45; 8,40; 8,53; 9,90; 10,25; 10,35, 12,55; 12,71; 13,09 e 14,10. Determinar a mdia, a mediana e a moda para esses valores de vendas. 4. Uma amostra de 20 operrios de uma companhia apresentou os seguintes salrios recebidos durante certa semana, arredondados para o valor do real mais prximo e apresentados em ordem crescente: R$ 140; 140; 140; 140; 140; 140; 140; 140; 155; 155; 165; 165; 180; 180; 190; 200; 205; 225; 230; 240. Calcular a mdia, a mediana e a moda para esse grupo de salrios. 5. As taxas de juros recebidas por 10 aes escolhidas ao acaso na BOVESPA durante um trimestre foram (em porcentagem): 2,59; 2,64; 2,60; 2,62; 2,61; 2,50; 2,63; 2,64; 2,55; 2,57. Calcule a taxa de juros mdia e a taxa de juros mediana. 6. Numa turma com 20 moas e 50 rapazes foi aplicada uma prova de Estatstica. A mdia aritmtica das moas foi 9,2 e a dos rapazes foi 7,8. Qual foi a mdia de toda a turma nessa prova? 7. Um grupo de 64 pessoas, que trabalha em uma empresa, formado por sub-grupos que tem salrios dirios com as seguintes caractersticas: 12 pessoas ganham R$ 50,00; 10 ganham R$ 60,00; 20 ganham R$ 25,00; 15 ganham R$ 90,00 e 7 ganham R$ 120,00. Qual a mdia salarial diria de todo o grupo? 8. Para se estimar o nmero de peas defeituosas de um veculo, escolheu-se uma amostra de 50 veculos, encontrando-se o seguinte nmero de peas defeituosas por veculo: No de peas defeituosas 0 1 2 3 4 No de veculos (fi) 25 20 3 1 1

Construa um grfico de colunas simples para esta distribuio e calcule o nmero mdio de peas defeituosas por veculo, o nmero mediano e o nmero modal. 9. Para se estimar o nmero de acidentes dirios em um grande estacionamento durante um perodo de um ms, escolheu-se o ms de setembro, encontrando-se os seguintes nmeros: No de acidentes 0 1 2 3 4 No de dias (fi) 5 9 12 3 1

Construa um grfico de barras simples para esta distribuio e calcule o nmero mdio dirio de acidentes em setembro, o nmero mediano e o nmero modal.
49

10. Em um levantamento entre os assinantes da revista "Fortune", foi feita a seguinte pergunta: "Quantas das ltimas quatro edies voc leu ou folheou?" A seguinte distribuio de freqncias sintetiza uma amostra de 500 respostas: Edio lida 0 1 2 3 4 No de assinantes (fi) 15 10 40 85 350

a) Qual o nmero mdio de edies lidas por um assinante da revista "Fortune"? b) Qual o nmero mediano? c) Qual o nmero modal? d) Compare os trs valores obtidos nos itens anteriores e discuta esses resultados. 11. Na tabela abaixo se observa o nmero de dias necessrios para entregas de pedidos de compra para a Dawson Supply Distribuidores em relao ao nmero mdio de produtos comprados. No de dias para entrega de pedidos de compra 7 10 12 15 20 30 45 No de produtos comprados (fi) 50 150 200 400 1.200 2.000 4.000

Calcule o nmero mdio de dias para entregas de pedidos de compra, o nmero mediano e o nmero modal. Compare os trs valores obtidos e discuta esses resultados. 12. Os dados abaixo representam uma amostra das vendas semanais, em classes de salrios mnimos, de vendedores de gneros alimentcios. Vendas semanais (em salrios mnimos) 30 a 35 35 a 40 40 a 45 45 a 50 50 a 55 55 a 60 60 a 65 65 a 70 No de vendedores (fi) 2 10 18 50 70 30 18 2

Calcule a mdia, a mediana e a moda de Czuber para esse conjunto de dados.

50

13. A tabela abaixo apresenta os resultados de 30 anlises de uma substncia qumica (em porcentagem) presente em amostras de gua coletadas num rio de So Paulo. Substncia Qumica (%) No de anlises (fi) 3 0 a 16 5 16 a 32 7 32 a 48 9 48 a 64 4 64 a 80 2 80 a 96 Calcule a mdia, a mediana e a moda de Czuber para esse conjunto de dados e interprete os resultados obtidos. 14. Uma pesquisa para determinar a eficincia de uma nova rao para animais, em termos de ganho de peso, mostrou que aps um ms em que a rao normal foi substituda pela nova rao, os animais apresentaram um aumento de peso, segundo a distribuio, dada na tabela abaixo: Aumento de peso (em kg) 0 2 4 6 8 10 a a a a a a 2 4 6 8 10 12 N o de animais (fi) 5 7 20 16 7 5

Calcule o aumento mdio de peso por animal, o aumento mediano e o aumento modal. Interprete os resultados obtidos. 15. Calcule a mdia, a mediana e a moda para uma amostra das alturas de 70 alunos de uma escola. Interprete os resultados obtidos. Alturas (cm) 150 a 160 160 a 170 170 a 180 180 a 190 190 a 200 200 a 210 No de alunos ( f i ) 2 15 18 18 16 1

16. Uma empresa de mbito nacional, fornecedora de supermercados, fez um levantamento do consumo de seu principal produto em vrios supermercados, obtendo em determinado ms, a tabela: No de unidades consumidas 0 1.000 1.000 2.000 2.000 3.000 3.000 4.000 4.000 5.000 5.000 6.000 No de supermercados ( f i ) 10 50 200 320 150 30

Determine o consumo mdio, mediano e modal deste produto por supermercado pesquisado. Interprete os resultados obtidos.
51

17. O departamento de recursos humanos de uma empresa fez um levantamento dos salrios de uma amostra de 120 funcionrios do setor de logstica, obtendo os seguintes resultados: Salrios (R$) 400,00 500,00 500,00 600,00 700,00 800,00 a) b) c) d) e) 600,00 700,00 800,00 900,00 No de funcionrios (fi) 12 30 42 24 6

900,00 1.000,00 6 Calcule o salrio mdio dos funcionrios do setor de logstica. Calcule o salrio mediano. Calcule a moda de Czuber. Calcule a amplitude total. Calcule a varincia dos salrios do setor de logstica e o desvio padro correspondente, interpretando os resultados obtidos em termos de coeficiente de variao.

18. Para a srie 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9. a) Construa a distribuio de freqncias. b) Calcule a varincia populacional. c) Determine o desvio padro populacional. 19. A varivel x, que representa uma amostra das notas de Estatstica dos alunos de uma classe de certa universidade, tem distribuio dada pela tabela abaixo: Notas de Estatstica No de alunos xi (ponto mdio) xi.fi
(x i x ) 2 (x i x ) 2 .fi

Fac

3 0 a2 12 2 a4 18 4a6 12 6a8 3 8 a 10 Total a) Complete a tabela. b) Calcule a mdia, a mediana, a moda e o desvio padro de x. Interprete os resultados obtidos. c) Todo aluno que tiver nota situada entre as 10% mais altas receber um prmio. A partir de que nota o aluno far jus ao prmio? d) Todo aluno que tiver nota situada entre as 45% mais baixas far recuperao. A partir de que nota o aluno no necessitar de recuperao? 20. Estudando-se o consumo dirio de leite em certa regio, verificou-se que 20% das famlias consomem at 1 litro de leite por dia; 50% das famlias consomem entre 1 e 2 litros; 20% consomem entre 2 e 3 litros e o restante das famlias consome entre 3 e 4 litros. Para uma amostra de 100 famlias: a) Escreva estas informaes na forma de uma distribuio de freqncias. b) Construa o histograma para essa situao. c) Qual o consumo mdio dirio de leite por famlia? d) E o consumo mediano? e) Qual o desvio padro? Interprete o resultado obtido em relao mdia. f) Se o distribuidor de leite da regio deseja oferecer um desconto no preo do litro de leite para 25% das famlias que consomem o maior nmero de litros, a partir de que nmero de litros, a famlia ser beneficiada?
52

21. Um posto de gasolina registrou a seguinte distribuio de freqncias para o nmero de litros de gasolina vendido por carro em uma amostra de 680 carros. Gasolina (em litros) 0 a 8 8 a 16 16 a 24 24 a 32 32 a 40 40 a 48 TOTAL No de carros (fi) 74 192 280 105 23 6 680

a) Calcule a mdia e o desvio padro para esses dados agrupados. Interprete o resultado obtido. b) Se o posto de gasolina espera atender cerca de 120 carros em determinado dia, qual a estimativa do nmero total de litros de gasolina que sero vendidos? c) Calcule a mediana e a moda. d) Se o proprietrio do posto de gasolina deseja oferecer um brinde para 5% dos clientes que colocarem o maior nmero de litros de gasolina em seu tanque, a partir de que nmero de litros o cliente ser premiado? 22. A tabela abaixo apresenta a distribuio das exportaes de empresas de equipamentos eletrnicos em 2004. Volume Exportado (em US$ milhes) 50.000 a 60.000 60.000 a 70.000 70.000 a 80.000 80.000 a 90.000 90.000 a 100.000 No de empresas (fi) 5 10 20 10 5

Para essa distribuio de freqncias, analise e responda: a) Se o governo, para incrementar as exportaes, der incentivos fiscais metade das empresas que tenham melhor desempenho em relao ao volume exportado, a partir de que valor exportado as empresas tero esses incentivos? b) Se o governo, para incrementar as exportaes, der iseno fiscal s empresas que estejam entre as 7% com melhor desempenho em relao ao volume exportado, a partir de que valor exportado as empresas tero iseno? 23. Um banco decidiu diminuir as taxas bancrias para 10% de seus correntistas (pessoas fsicas) que tenham os maiores saldos em uma de suas agncias bancrias no interior do Paran. Para isto, fez um levantamento desses saldos, por correntista, obtendo a tabela: Saldos (R$) 0 10.000 10.000 20.000 20.000 30.000 30.000 40.000 40.000 50.000 No de contas correntes ( f i ) 50 100 80 10 10

Pergunta-se: A partir de que saldo o correntista ter reduo de taxas bancrias?

53

24. Uma amostra do tempo de vida til de uma pea automotiva forneceu a seguinte distribuio: Vida til (horas) 0 1.000 1.000 2.000 2.000 3.000 3.000 4.000 4.000 5.000 5.000 6.000 No de peas ( f i ) 6 42 86 127 74 15

Se o fabricante deseja estabelecer uma garantia mnima para o nmero de horas de vida til dessa pea, trocando a pea que no apresentar este nmero mnimo de horas, qual a garantia, se ele est disposto a trocar 4% das peas? 25. O relatrio Nielsen de Tecnologia Domstica (20/02/2003) relatou o uso de tecnologia domstica por pessoas com 12 anos ou mais. Os dados abaixo so as horas de uso do computador pessoal durante uma semana para uma amostra de 50 pessoas. 8,2 6,2 8,2 21,6 14,4 3,0 9,6 8,2 5,6 12,2 20,8 4,0 17,6 19,0 11,4 11,8 27,9 11,2 25,8 11,8 6,8 10,8 8,6 24,2 9,4 11,4 8,4 6,6 0,8 7,9 3,2 7,9 14,1 8,1 7,4 12,2 8,3 20,5 18,5 6,2 6,0 22,3 12,4 8,8 12,2 7,5 7,0 15,3 11,4 6,2

a) Sintetize os dados construindo uma tabela de distribuio de freqncias freqncia absoluta, freqncia relativa (%), freqncia acumulada e freqncia acumulada relativa (%) Calcule a amplitude de classe ideal para responder s prximas questes iniciando de 0,0. b) Responda: b1) Qual a % de pessoas que utilizam o computador pessoal por menos de 12,0 horas? b2) Qual o nmero de pessoas que utilizam o computador pessoal pelo menos por 20,0 horas? b3) Qual a % de pessoas que utilizam o computador pessoal no mximo por 24,0 horas (exclusive)? b4) Qual o nmero de pessoas que utilizam o computador pessoal por mais de 8,0 horas (inclusive)? c) Construa um histograma de freqncias absolutas para esta distribuio. d) Qual o tempo mdio de utilizao do computador pessoal? e) Qual o desvio padro? Interprete o resultado obtido em termos de coeficiente de variao. f) Qual o tempo mediano de utilizao do computador pessoal? Interprete o resultado obtido. g) Qual o tempo modal de utilizao do computador pessoal? h) Se determinado site der um prmio a 2% dos usurios que o visitarem por mais vezes, a partir de quantas horas esses usurios sero premiados?

54

CAPTULO 4 - REGRESSO LINEAR E CORRELAO


BIBLIOGRAFIA CONSULTADA: 1. ANDERSON, D.R.; SWEENEY, D.J. & WILLIAMS, T.A. Estatstica Aplicada Administrao e Economia. 2.ed. So Paulo: Pioneira Thomson Learning, 2002. 2. DOWNING, D. & CLARK, J. Estatstica Aplicada. So Paulo: Saraiva, 2002. 3. MARTINS, G. A. & DONAIRE D. Princpios de Estatstica. 4.ed. So Paulo: Atlas, 1995. 4. NOBRE, J.S.M. Apostila de Estatstica. So Paulo: Universidade Paulista, 2007. 5. STEVENSON, W. J. Estatstica Aplicada Administrao. 3.ed. So Paulo: Harbra Harper How do Brasil, 2001.

REGRESSO LINEAR E CORRELAO


REGRESSO LINEAR SIMPLES: Mtodo de anlise da relao entre uma varivel independente e uma varivel dependente. uma equao que descreve a relao em termos matemticos. CORRELAO: Mede o grau de relao entre as duas variveis. Na REGRESSO a varivel y chamada de varivel dependente e a varivel x de varivel independente. Seja y uma varivel de interesse e cujo comportamento futuro deseja-se prever. fcil identificar uma srie de variveis xi (x1, x2, x3,..., xn) que influenciam o comportamento de y, a varivel dependente do modelo. A Estatstica oferece meios de se chegar relao entre a varivel dependente (y) e as variveis independentes (x1, x2, x3,..., xn) atravs da anlise de regresso. Ser estudado o modelo: y = ax +b (ajuste de uma reta).

DIAGRAMA DE DISPERSO
Exemplo 1: Suponha que um analista toma uma amostra aleatria de 10 carregamentos por caminho feitos por uma companhia e anota a distncia em quilmetros e o tempo de entrega em dias (arredondado para o meio dia mais prximo), conforme a tabela abaixo. Carregamento Distncia Rodoviria (km) x 1 825 2 215 3 1070 4 550 5 480 6 920 7 1350 8 325 9 670 10 1215 Tempo de entrega (dias) y 3,5 1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0

Uma boa maneira de determinar se h relao entre a distncia rodoviria percorrida e o tempo de entrega do carregamento traar um grfico. interessante plotar um diagrama, no qual cada ponto plotado representa um par observado de valores para as variveis dependente e independente. O valor da varivel independente, x, no caso a distncia rodoviria, plotado no eixo horizontal, enquanto que,
55

o valor da varivel dependente, y, no caso o tempo de entrega, plotado no eixo vertical. Para cada observao ser marcado um ponto. Este tipo de grfico chamado diagrama de disperso (ver figura abaixo).
6 5 Tempo de Entrega (dias) 4

3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 Distncia Rodoviria (km)

Pelo diagrama acima, parece que os pontos seguem uma relao linear. Assim, apropriado ao caso, a anlise de regresso linear.

AJUSTE DE UMA RETA - MTODO DOS MNIMOS QUADRADOS


Estabelecido o modelo y = a.x + b, necessrio calcular-se os valores de a e b de forma que a reta passe, to prxima quanto possvel, dos pontos assinalados no diagrama de disperso. Isto , deseja-se minimizar a discrepncia total entre os pontos marcados e a reta, cujos coeficientes, a e b, sero determinados. O melhor mtodo para a determinao dos parmetros a e b o Mtodo dos Mnimos Quadrados. Segundo esse mtodo, possvel calcular os parmetros a e b pela aplicao das seguintes frmulas:

a=

n xy x. y n x 2 ( x ) 2
x y = mdia dos xi; y = = mdia dos yi n n

b = y a.x ,
Portanto,

onde n = nmero de observaes;

x=

b=

y x a. n n

A equao ajustada y = a.x + b permite predizer o valor de y a partir de um determinado valor de x. Exemplo 2: Determinando a equao de regresso de mnimos quadrados para os dados apresentados no Exemplo 1.
56

Neste caso, necessrio calcular a e b. Para isso, conveniente a construo da tabela: Carregamento amostrado 1 2 3 4 5 6 7 8 9 10 Total Soluo: Distncia (km) x 825 215 1070 550 480 920 1350 325 670 1215 7.620 Tempo de entrega (dias) y 3,5 1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0 28,5 x2 680.625 46.225 1.144.900 302.500 230.400 846.400 1.822.500 105.625 448.900 1.476.225 7.104.300

x.y 2.887,5 215,0 4.280,0 1.100,0 480,0 2.760,0 6.075,0 487,5 2.010,0 6.075,0 26.370,0

n = 10 x.y = 26370,0

x = 7620

y = 28,5
a= n. xy x. y n. x 2 ( x )
2

x 2 = 7104300
=

10 26370,0 7620 28,5 10 7104300 (7620 )2

= 0,0035851

x 7620 = = 762,0 n 10 y 28,5 y= = = 2,85 n 10 b = y a.x , logo b = 2,85 0,0035851 762,0 = 0,1182 0,12 x=
Portanto, y = a.x + b y = 0,0036.x + 0,12 a reta ajustada, que est traada no diagrama de disperso do Exemplo 1, conforme a figura abaixo.
6 5 Tempo de Entrega (dias) 4

3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 Distncia Rodoviria (km)

57

Usando a equao de regresso desenvolvida acima, pode-se estimar o tempo de entrega de um carregamento para qualquer distncia, desde que as viagens no ultrapassem 1.350 km, que a distncia mxima para a qual essa equao de regresso foi estimada. Para a distncia de 1.000 km, por exemplo, o clculo o seguinte:

y = 0,0036.x + 0,12 = 0,0036.1000 + 0,12 = 3,72 dias


Logo, o tempo de entrega para um carregamento pela distncia rodoviria de 1.000 km igual a 3,72 dias.

COEFICIENTE DE CORRELAO
a medida que descreve o grau da associao linear entre duas variveis aleatrias contnuas, por exemplo, x e y. Para avaliar o coeficiente de correlao linear entre duas variveis, ou seja, medir o grau de ajuste dos valores em torno de uma reta, utilizado o coeficiente de correlao de Pearson. Este coeficiente de correlao dado por:

r=

n xy ( x )( y) [n x 2 ( x ) 2 ][n y 2 ( y) 2 ]

, onde n o nmero de observaes.

Os valores do coeficiente de correlao r esto sempre entre 1 e +1. Um valor +1 indica que as duas variveis x e y esto perfeitamente relacionadas de forma linear positiva. Isto , todos os pontos dados esto numa linha reta que tem inclinao positiva (funo linear crescente). Um valor -1 indica que as duas variveis x e y esto perfeitamente relacionadas de forma linear negativa. Isto , todos os pontos dados esto numa linha reta que tem inclinao negativa (funo linear decrescente). Valores do coeficiente de correlao prximos a zero indicam que x e y no esto linearmente relacionados. Estas afirmaes podem ser observadas abaixo, pelas configuraes dos diagramas de disperso para diferentes valores de r.

80 70 60 50 40 30 20 10 0 0 5 10 15 20 25 30 35 40

r = +1,00 Relacionamento linear positivo, perfeito.

58

80 70 60 50 40

30 20 10 0 -10 0 5 10 15 20 25 30 35

r 0,70 Relacionamento linear positivo, moderado.

100

80

60

y
40 20 0 0 5 10 15 20 25 30 35 40

r = 0 Ausncia de relacionamento linear

50 40 30 20 10 0 -10 -20 -30 0 5 10 15 20 25 30 35 40

r = -1,00 Relacionamento linear negativo, perfeito

59

Exemplo 3: Determinando o coeficiente de correlao linear de Pearson para os dados apresentados no Exemplo 1. Reapresentando a tabela com o clculo de y2, necessrio neste caso, para o clculo de r: Carregamento amostrado 1 2 3 4 5 6 7 8 9 10 Total Soluo: Distncia (km) x 825 215 1070 550 480 920 1350 325 670 1215 7.620 Tempo de entrega (dias) y 3,5 1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0 28,5 x2 680.625 46.225 1.144.900 302.500 230.400 846.400 1.822.500 105.625 448.900 1.476.225 7.104.300 y2 12,25 1,0 16,00 4,00 1,00 9,00 20,25 2,25 9,00 25,00 99,75

x.y 2.887,5 215,0 4.280,0 1.100,0 480,0 2.760,0 6.075,0 487,5 2.010,0 6.075,0 26.370,0

n = 10 x.y = 26370,0

x = 7620
2 y = 99,75

x 2 = 7104300

y = 28,5

r=

n xy ( x )( y ) [n x 2 ( x )2 ].[n y 2 ( y )2 ] 46530 = 0,9489 0,95 49033,67


ou

10 26370,0 7620 28,5 [10 7104300 (7620) 2 ] [10 99,75 (28,5)2 ]


r = 95%

r=

A equao da reta ajustada, como visto no Exemplo 2, y = 0,0036.x + 0,12 , com coeficiente de correlao igual a 95%, o que representa uma excelente relao linear entre as variveis x e y.

Lembrete: HP-12C (Regresso Linear):


y enter x +

,r y ajustado x >< y r (coeficiente de correlao linear) g y


RCL 1 RCL 2 RCL 3 n x x2 RCL 4 RCL 5 RCL 6 y y2 x.y

60

LISTA 4 Exerccios para fixao


1. Na tabela abaixo esto indicados o valor y do aluguel (em mil reais) e a idade x (em anos, desde a construo) de cinco casas. Tempo aps construo (anos) x 5 7 10 13 20 Valor do aluguel (mil reais) y 6 5 4 3 2 a) Para esse conjunto de dados, faa o diagrama de disperso. b) Se uma reta parecer apropriada, determine os coeficientes a e b da reta pelo mtodo dos mnimos quadrados e escreva a equao da reta. c) Represente graficamente a reta obtida no diagrama de disperso. d) Calcule o coeficiente de correlao e interprete seu significado. e) Qual ser o valor do aluguel para uma casa com 16 anos de idade? f) Qual ser a idade de uma casa cujo aluguel 4,52 mil reais? 2. Na tabela abaixo so apresentados os custos de manuteno por hora classificados pela idade da mquina em meses. Idade x (meses) 6 15 24 Custos y ($) 9,70 16,50 19,30 a) Determinar a reta de regresso; b) Calcular o coeficiente de correlao e interpretar seu significado; c) Fazer uma previso de custo para uma mquina de 20 meses. 33 19,20 42 26,90

3. Numa amostra de cinco operrios de uma dada empresa, foram observadas duas variveis: X: anos de experincia em um dado cargo e Y: tempo gasto na execuo de certa tarefa relacionada com esse cargo. Discuta a correlao dessas variveis se: a) O coeficiente de correlao linear determinado foi de 0,9865. b) O coeficiente de correlao linear determinado foi de 0,5734. 4. Na tabela abaixo est representado o valor total de vendas (em milhes de reais) de uma companhia por 10 meses consecutivos. x y 1 5,0 2 6,7 3 6,0 4 8,7 5 6,2 6 8,6 7 11,0 8 11,9 9 10,6 10 10,8

a) Faa o diagrama de disperso. Se uma reta parecer apropriada, determine a equao da reta pelo mtodo dos mnimos quadrados e plote-a no diagrama de disperso. b) Qual a previso de vendas dessa companhia para o 11o ms? 5. O diretor de vendas de uma rede de varejo com vendas a nvel nacional, est querendo analisar a relao que existe entre o investimento em propaganda e o valor das vendas da empresa. O objetivo ter uma equao matemtica que permita realizar projees e estimativas de vendas entre a varivel dependente vendas e a varivel independente investimento em propaganda. O departamento de vendas da rede relacionou os dados levantados na tabela abaixo: Investimento anual (milhes de reais) Vendas anuais (milhes de reais) 32 430 21 330 37 470 12 190 17 270 24 480

a) Construa o diagrama de disperso; b) Determine a equao da reta; c) Determine o coeficiente de correlao e interprete o seu significado. d) Faa uma projeo dos valores de vendas para investimento de 600 milhes de reais.

61

6. Na tabela abaixo apresentada a produo de ao de uma indstria no perodo de 2000 a 2004: Ano (x) Produo de Ao (y) (toneladas) 2000 17,5 2001 19,0 2002 23,3 2003 28,7 2004 35,0

a) Ajustar uma reta aos dados (ateno: modificar a varivel x para x = 0, 1, 2,...). b) Calcular o coeficiente de correlao. c) Estimar a produo de ao para 2005. 7. Os dados abaixo correspondem s variveis renda familiar (em salrios mnimos) e gasto com alimentao (em salrios mnimos) em amostra de 10 famlias. Renda familiar (salrios mnimos) 3 5 10 20 30 50 70 100 150 200 Gasto com alimentao (salrios mnimos) 1,5 2,0 6,0 10,0 15,0 20,0 25,0 40,0 60,0 80,0

a) Construa o diagrama de disperso. O que ele sugere? b) Calcule o coeficiente de correlao e interprete seu significado. c) Ajuste a reta de regresso e interprete o significado dos coeficientes. d) Qual a previso do gasto com alimentao para uma famlia com renda de 17 salrios mnimos? e) Qual a previso do gasto com alimentao para uma famlia com excepcional renda, como por exemplo, 1.000 salrios mnimos? Voc acha este valor razovel? Por qu? 8. Um jornal quer verificar a eficcia de seus anncios na venda de carros usados. Na tabela abaixo esto apresentados o nmero de anncios publicados e o correspondente nmero de carros vendidos por 6 companhias, que usaram apenas este jornal como veculo de propaganda. Companhia Anncios Vendas A 74 139 B 45 108 C 48 98 D 36 76 E 27 62 F 16 57

a) Construa o diagrama de disperso. O que ele sugere? b) Calcule o coeficiente de correlao e interprete seu significado. c) Ajuste a reta de regresso e interprete o significado dos coeficientes. d) Com base nos resultados anteriores, como voc argumentaria com a Companhia F para que ela aumentasse o nmero de anncios, aumentando, portanto, suas vendas? 9. Na tabela seguinte esto indicadas as porcentagens de mulheres que trabalham em cada companhia e as porcentagens de cargos de gerncia ocupados por mulheres nessas companhias. Companhia Federated Department Stores Kroger Marriot McDonald's Sears Porcentagem de mulheres 72 47 51 57 55 Porcentagem de mulheres gerentes 61 16 32 46 36
62

a) Construa o diagrama de disperso. b) Calcule o coeficiente de correlao e interprete seu significado. c) Ajuste uma reta aos dados pelo mtodo dos mnimos quadrados e trace a reta no diagrama de disperso. d) Faa uma previso da porcentagem de cargos de gerncia ocupados por mulheres em uma companhia que tem 60% de funcionrios do sexo feminino. e) Faa uma previso da porcentagem de cargos de gerncia ocupados por mulheres em uma companhia onde 55% so mulheres. Como esse valor previsto se compara aos 36% da Sears, uma companhia onde 55% dos funcionrios so mulheres? 10. Os dados abaixo se referem s variveis gastos com publicidade (em mil reais) e faturamento (em mil reais) para o Kuriuwa Hotel na cidade de Monte Verde, MG. Gastos com publicidade (mil reais) 1 2 4 6 10 14 Faturamento (mil reais) 20 32 40 44 52 54

a) Ajuste uma reta aos dados pelo mtodo dos mnimos quadrados. b) Qual a previso de faturamento do hotel se forem gastos R$ 8 mil em publicidade? c) Qual a previso de gastos com publicidade no caso de se pretender um faturamento de R$ 50 mil? d) Calcule o coeficiente de correlao e interprete seu significado.

11. A tabela abaixo indica a quantidade de bolas de futebol de salo produzidas mensalmente e os respectivos custos totais de produo. Quantidade produzida Custo Total (R$) 10 100 11 112 12 119 13 130 14 139 15 142

a) Construir o diagrama de disperso; b) Analisando o grfico obtido, possvel afirmar que o sistema se comporta de forma aproximadamente linear? c) Os pontos apresentam um comportamento crescente ou decrescente? d) Determine a equao da reta que melhor se ajusta a esses dados, utilizando Anlise de Regresso; e) Determine o valor mais provvel dos custos fixos; f) Determine o custo estimado para a produo de 16 bolas.

12. Na tabela a seguir esto indicadas as quantidades produzidas mensalmente de televisores da marca SHAWN e os respectivos custos totais de produo. Quantidade produzida Custo Total (R$) 1 100 2 120 3 130 4 140 5 150 6 160 7 170 8 180 9 190 10 200

Pede-se estabelecer pela Anlise de Regresso: a) A reta que melhor se ajusta a esses dados; b) O valor mais provvel dos custos fixos; c) O valor do custo estimado para a produo de 12 televisores.

63

13. Uma pesquisa sobre a demanda de mercado de um produto X levou seguinte escala de demanda: Preo p (R$/unidade) Quantidade demandada q (unidades) 20 3.550 30 2.600 40 1.800 50 1.000 60 500

a) representar graficamente os dados apresentados; b) identificar o modelo linear (ou seja, determinar a equao da reta) que melhor se ajusta escala de demanda do produto X. c) representar graficamente a reta de regresso no mesmo sistema de coordenadas do item a.

14. Uma pesquisa sobre a oferta de mercado de um produto Y levou seguinte escala de demanda: Preo p (R$/unidade) Quantidade ofertada q (unidades) 47 34 65 75 80 120 100 130 120 170

a) Representar graficamente os dados apresentados; b) identificar o modelo linear (ou seja, determinar a equao da reta) que melhor se ajusta escala de oferta do produto Y. c) representar graficamente a reta de regresso no mesmo sistema de coordenadas do item a.

15. O coeficiente de correlao, como medida da relao entre sries de nmeros que representam qualquer tipo de dados, pode ser utilizada tambm para medir a diversificao de uma carteira de ativos. O risco de uma carteira de ativos pode ser reduzido pela combinao de ativos negativamente correlacionados ou de baixa correlao positiva. Considere uma carteira AB, composta de 50% de ativos A e 50% de ativos B. Um levantamento das taxas de retorno desses ativos nos ltimos quatro meses apresentado na tabela abaixo: Ativo A B Janeiro 2,4% 1,5% Taxa de Retorno (%) Fevereiro Maro 3,7% 1,8% 1,1% 2,1%

Abril 2,0% 1,9%

Determine o coeficiente de correlao linear. O que pode ser comentado a respeito do risco dessa carteira de ativos?

16. Considere a carteira XY, composta de 50% dos ativos X e 50% dos ativos Y. Um levantamento das taxas de retorno desses ativos nos ltimos quatro meses apresentado na tabela abaixo: Ativo X Y Janeiro 6,4% 4,6% Taxa de Retorno (%) Fevereiro Maro 4,7% 3,8% 3,1% 2,8%

Abril 5,5% 3,6%

Com base no coeficiente de correlao linear, faa um comentrio a respeito do risco dessa carteira de ativos.

64

Anda mungkin juga menyukai