Anda di halaman 1dari 80

PCO PROGRAMA DE CERTIFICAO OPERACIONAL CST

ESTATSTICA II

ELABORAO: DEZEMBRO/04

CST - Companhia Siderrgica de Tubaro FDH - Departamento de Recursos Humanos FHD - Diviso de Desenvolvimento e Remunerao Av. Brigadeiro Eduardo Gomes, 930, Jardim Limoeiro - Serra - ES. CEP: 29163-970 Telefone: 0 XX (27) 3348-1420 Fax: 0 XX (27) 3348-1077

Sumrio
1. 2. 3. 4. INTRODUO...................................................................................................................................... 6 DEFINIES DE TERMOS USADOS EM ESTATSTICA............................................................ 7 VARIVEIS DISCRETAS E CONTNUAS..................................................................................... 12 POPULAES E AMOSTRAS ......................................................................................................... 13 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 5. 5.1. 5.2. 5.3. 5.4. 5.5. 5.6. 6. 6.1. 6.2. 7. 7.1. 7.2. 7.3. 7.4. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. TCNICAS DE AMOSTRAGEM ......................................................................................................... 14 AMOSTRA ALEATRIA SIMPLES ..................................................................................................... 15 AMOSTRA SISTEMTICA ................................................................................................................ 15 AMOSTRA ESTRATIFICADA ............................................................................................................ 15 AMOSTRA DE CONVENINCIA (GRUPO).......................................................................................... 16 ERROS DE AMOSTRAGEM............................................................................................................... 16 PRIMEIRA ETAPA: CLCULO DA AMPLITUDE (R) .......................................................................... 17 SEGUNDA ETAPA: DETERMINAO DO INTERVALO DE CLASSE .................................................... 18 TERCEIRA ETAPA: PREPARAO DO FORMULRIO DA TABELA DE FREQNCIA .......................... 19 QUARTA ETAPA: DETERMINAO DAS CLASSES .......................................................................... 19 QUINTA ETAPA: CLCULO DO PONTO MDIO DE CADA CLASSE .................................................. 20 SEXTA ETAPA: OBTENO DAS FREQNCIAS.............................................................................. 20 POLGONO DE FREQNCIAS ......................................................................................................... 21 ESTRATIFICAO DE HISTOGRAMAS ............................................................................................. 22 TENDNCIA CENTRAL ................................................................................................................... 25 DISPERSO .................................................................................................................................... 25 ASSIMETRIA .................................................................................................................................. 25 CURTOSE ....................................................................................................................................... 25

HISTOGRAMAS DE FREQNCIA............................................................................................... 16

DESENHANDO UM HISTOGRAMA DE FREQNCIA ............................................................ 20

PARMETROS DA DISTRIBUIO DE FREQNCIA............................................................ 24

MDIA ARITMTICA ...................................................................................................................... 26 MDIA PONDERADA ....................................................................................................................... 27 MDIA DA RAIZ DA MDIA DOS QUADRADOS .................................................................. 29 MEDIA HARMNICA .................................................................................................................. 30 MEDIANA ....................................................................................................................................... 30 MODA.............................................................................................................................................. 31 MEDIDAS DE DISPERSO.......................................................................................................... 32 AMPLITUDE .................................................................................................................................. 32 VARINCIA ................................................................................................................................... 33 DESVIO PADRO ......................................................................................................................... 34 COEFICIENTE DE VARIAO ................................................................................................. 36

Estatstica

19. 20. 20.1. 20.2. 20.3. 21. 22. 23. 23.1. 23.2. 23.3. 23.4. 23.5. 23.6. 23.7. 23.8. 24. 25. 26. 27. 28. 29. 30.

FORMATO...................................................................................................................................... 37 DISTRIBUIO DE PROBABILIDADES.................................................................................. 37 INTRODUO AO CLCULO DE PROBABILIDADES ......................................................................... 38 REGRA DA ADIO ........................................................................................................................ 41 REGRA DO PRODUTO ..................................................................................................................... 42 DISTRIBUIO BINOMIAL ....................................................................................................... 43 DISTRIBUIO DE POISSON .................................................................................................... 45 DISTRIBUIO NORMAL.......................................................................................................... 47 PROPRIEDADES DA DISTRIBUIO NORMAL ................................................................................. 47 CARACTERSTICAS ........................................................................................................................ 48 MODELO MATEMTICO ................................................................................................................ 49 DISTRIBUIO NORMAL PADRO ................................................................................................. 50 APLICAES.................................................................................................................................. 54 DISTRIBUIO DE AMOSTRAGEM DA MDIA ARITMTICA............................................................ 56 ERRO PADRO DA MDIA ARITMTICA ........................................................................................ 58 TEOREMA DO LIMITE CENTRAL .................................................................................................... 59 DISTRIBUIO UNIFORME (OU RETANGULAR) ............................................................... 60 DISTRIBUIO TRIANGULAR................................................................................................. 62 DISTRIBUIO T (STUDENT) ................................................................................................... 65 GRAUS DE LIBERDADE ............................................................................................................. 67 INTERVALO DE CONFIANA................................................................................................... 67 EXERCCIOS DE ESTATSTICA ............................................................................................... 70 RESPOSTAS DOS EXERCCIOS DE ESTATSTICA.............................................................. 78

Estatstica

Apresentao
Muitas pessoas ainda pensam que Metrologia se refere apenas a Dimenso e Comprimento, que se trata de paqumetros, micrmetros, calibres e similares. Este conceito deve ser corrigido, pois Metrologia a Cincia da Medio e se refere medio de qualquer grandeza fsica. Segundo a norma 1 NBR ISO 10012, Comprovao Metrolgica um conjunto de operaes necessrias para assegurar-se de que um dado equipamento de medio est em condies de conformidade com os requisitos para o uso pretendido. Quando se relata o resultado de medio de uma grandeza fsica, obrigatrio que seja dada alguma indicao quantitativa da qualidade do resultado, de forma tal que aqueles que o utilizam possam avaliar sua confiabilidade. Sem essa indicao, resultados de medio no podem ser comparados, seja entre eles mesmos ou com valores de referncia fornecidos numa especificao tcnica ou numa norma. A avaliao da qualidade de medidas fundamental para a prtica gerencial. Segundo o Dr. William Edwards Deming, o que se registra ao final de uma determinada operao de medio o ltimo produto de uma longa srie de operaes, desde a matria-prima at a operao de medio propriamente dita. A medio , pois, a parte final deste processo. Assim, do mesmo modo como vital controlar estatisticamente as outras partes deste processo, vital controlar-se estatisticamente o processo de medio; caso contrrio, no h medida que tenha significado comunicvel. Estas palavras de Deming mostram a importncia do conhecimento e do uso sistemtico, por parte das empresas, da comprovao metrolgica, a qual utiliza as tcnicas estatsticas para avaliao da capacidade de sistemas de medio. O pressuposto bsico da metrologia que toda medida possui erros. Como conseqncia, nem o valor verdadeiro e nem o valor do erro so conhecidos com exatido. Como em outras reas cientficas, por exemplo, a fsica, na metrologia temos que conviver com a incerteza e os erros de medio. Convm, portanto, que a incerteza e os erros de medio sejam tratados de tal modo que as medies possam ter alguma utilidade. Uma das razes mais comuns de dados com baixa qualidade a grande variao dos dados. Por exemplo, um sistema de medio usado para medir a vazo de um gs em uma tubulao, pode ser sensvel temperatura do gs medido. Neste caso, a variao nos dados pode ser devida ou a mudanas na vazo ou a mudanas na temperatura do gs. Isto torna a interpretao dos dados mais difcil e o sistema de medio, conseqentemente, menos conveniente ou at mesmo inadequado. Alm disso, outros fatores tambm influem na medio, por exemplo: o operador, os equipamentos auxiliares, as condies ambientais, o instrumento de medio etc. Esta apostila pretende tratar com mais nfase os componentes de um Sistema de Comprovao Metrolgica, fazendo, contudo, uma breve explanao dos conceitos bsicos de Estatstica, necessrios aplicao da metrologia.
1

Norma NBR ISO 10012/2004 Sistemas de Gesto de Medio Requisitos para os processos de medio e equipamento de medio.

Estatstica

1. INTRODUO
A Estatstica pode ser dividida em duas partes: descritiva e inferencial. A estatstica descritiva cuida dos mtodos que envolvem a coleta, a apresentao e a caracterizao de um conjunto de dados de modo a descrever apropriadamente as vrias caractersticas deste conjunto. Utiliza-se de tabelas, grficos e mtodos numricos para resumir conjuntos de dados da populao total ou de amostras. A estatstica inferencial cuida dos mtodos que tornam possveis a estimativa de uma caracterstica de uma populao ou a tomada de uma deciso referente populao com base somente em resultados de amostras. A estatstica inferencial uma tcnica usada para coletar, descrever, analisar e interpretar os dados numricos. Ela trata das variaes aleatrias contidas nos dados. conveniente deixar claro que a estatstica inferencial mostra apenas as informaes j contidas nos dados. Nenhuma informao nova criada por ela. O tratamento estatstico dos dados permite fazer julgamentos objetivos relacionados com a validade dos resultados, permitindo v-los de modos diferentes e a tomada de decises objetivas e inteligentes quanto qualidade e aplicao. Em metrologia a estatstica inferencial amplamente usada, pois o objetivo obter concluses provveis, em condies de incerteza, sobre determinado sistema de medio baseando-se em uma pequena amostra de uma populao estatstica. Usando a estatstica podemos determinar o valor mais provvel de uma grandeza, partindo de um conjunto de dados de medio, bem como determinar o erro provvel e o valor da incerteza. Quando se faz apenas uma medio dizemos que a mesma imprevisvel e aleatria. Entretanto uma srie de medies previsvel e determinada. A base da estatstica a repetio das medies. Com apenas uma medio obtm-se pouca informao do mensurando, sujeita a erros. Com mltiplas medies os erros aleatrios aparecem como um espalhamento em torno da mdia das medies.

Estatstica

Este espalhamento causado pelas variaes da medio e pelas variaes das caractersticas do sistema de medio. Dentro do possvel, as variaes da medio devem ser consideradas nos clculos estatsticos e as variaes do sistema de medio devem ser eliminadas. Como sabido, devido ao alto custo das medies, torna-se impeditivo realizar muitas medies para caracterizar uma populao, da serem usadas algumas poucas amostras (medies) para inferir (tirar concluses) sobre as populaes. Por conseqncia, este processo tem suas limitaes, no exato, podendo estar sujeito a erros. A estatstica inferencial poder avaliar e controlar o tamanho do erro cometido ao se fazer estas dedues. Ou seja: a incerteza e o grau de confiana do sistema de medio. A qualidade dos dados de medio est relacionada com as propriedades estatsticas de medies mltiplas obtidas com um sistema de medio operando em condies estveis 2.

2. DEFINIES DE TERMOS USADOS EM ESTATSTICA


A seguir so apresentados alguns termos usados em estatstica, extrados do Guia 3 para a Expresso da Incerteza de Medio, que os extraiu da Norma 4 ISO 3534-1. Esta norma deve ser a primeira fonte a ser consultada para a definio de termos estatsticos no includos nesta apostila. Amostra: uma parcela representativa da populao que escolhida para anlise com o propsito de tirarmos concluses sobre a essa populao. Atributo: quando os dados estatsticos apresentam um carter qualitativo, o levantamento e os estudos necessrios ao tratamento desses dados so designados genericamente de estatstica de atributo.

2 3

Anlise dos Sistemas de Medio (MAS), 2a Edio Fev/ 95. Guia Para a Expresso da Incerteza de Medio 2a Edio ABNT INMETRO SBM 1998. 4 ISO 3535-1: 1993 Statistics Vocabulary and Symbols Part 1: Probability and general statistical terms.

Estatstica

Caracterstica: propriedade que ajuda a identificar ou diferenciar itens de uma dada populao. Nota: a caracterstica pode ser ou quantitativa (por variveis) ou qualitativa (por atributos). Coeficiente de confiana; nvel de confiana: o valor (1 - ) da probabilidade associada com um intervalo de confiana ou um intervalo estatstico de abrangncia. Nota: (1- ) freqentemente expresso como uma porcentagem. Dado Estatstico: dado numrico considerado a matria-prima sobre a qual iremos aplicar os mtodos estatsticos. Desvio padro: a raiz quadrada positiva da varincia. Nota: o desvio padro da amostra um estimador 5 no-tendencioso do desvio padro da populao. No texto original, o estimador consta como "biased", que no corresponde traduo "notendencioso. Distribuio de freqncia: relao emprica entre valores de uma caracterstica e suas freqncias ou suas freqncias relativas. Nota: a distribuio pode ser apresentada graficamente como um histograma, grficos de barras, polgono de freqncia cumulativa ou como uma tabela de dupla entrada. Distribuio de Probabilidade (de uma varivel aleatria): funo que determina a probabilidade de uma varivel aleatria assumir qualquer valor dado ou pertencer a um dado conjunto de valores. Nota: a probabilidade do conjunto inteiro de valores da varivel aleatria igual a 1. Esperana (de uma varivel aleatria ou de uma distribuio de probabilidade); valor esperado; mdia.

No texto original, o estimador consta como "biased", que no corresponde traduo "no-tendencioso.

Estatstica

Estatstica: funo de variveis aleatrias da amostra. Nota: Estatstica, como uma funo de variveis aleatrias, tambm uma varivel aleatria e, como tal, assume diferentes valores de uma amostra para outra. O valor da estatstica obtida, usando-se os valores observados nesta funo, pode ser utilizado num teste estatstico ou como estimativa de um parmetro de populao, tal como uma mdia ou um desvio padro. Estimao: a operao que designa, atravs de observaes numa amostra, valores numricos para os parmetros de uma distribuio escolhida, como o modelo estatstico da populao da qual a amostra extrada. Nota: um resultado desta operao pode ser expresso como um valor nico singular (estimativa pontual) ou como uma estimativa de intervalo. Estimador: estatstica utilizada para estimar um parmetro de populao. Estimativa: valor de um estimador obtido como um resultado de uma estimao. Fenmeno Estatstico: qualquer evento que se pretenda analisar, cujo estudo seja possvel da aplicao do mtodo estatstico. Freqncia: o nmero de ocorrncias de um dado tipo de evento ou o nmero de observaes que se enquadram em uma classe especificada. Funo densidade de probabilidade (para uma varivel aleatria contnua): derivada (quando existe) da funo distribuio: f(x) = dF(x)/dx Nota: f(x)dx = Pr(x < X < x + dx) Funo distribuio: funo que determina, para cada valor x, a probabilidade de que a varivel aleatria X seja menor ou igual a x: F(x) = Pr(X x). Graus de liberdade: em geral, o nmero de termos em uma soma menos o nmero de restries aos termos da soma.

Estatstica

10

Intervalo de confiana bilateral: quando T1 e T2 so duas funes dos valores observados, tais que, sendo um parmetro de populao a ser estimado, a probabilidade Pr (T1 T2) , pelo menos, igual a (1- ) [onde (1- ) um nmero fixo, positivo e menor que 1], o intervalo entre T1 e T2 um intervalo de confiana (1- ) bilateral para . Notas: 1) Os limites T1 e T2 do intervalo de confiana so estatsticas e, como tais, geralmente assumem diferentes valores de amostra para amostra. 2) Em uma longa srie de amostras, a freqncia relativa dos casos nos quais o valor verdadeiro do parmetro de populao coberto pelo intervalo de confiana, maior ou igual a (1- ). Intervalo de confiana unilateral: quando T uma funo dos valores observados, tais que, sendo um parmetro de populao a ser estimado, a probabilidade Pr (T theta) [ou a probabilidade Pr (T1 )] pelo menos igual a (1 - ) [onde (1 - ) um nmero fixo, positivo e menor do que 1], o intervalo do menor valor possvel de at T (ou o intervalo de T at o maior valor possvel de ) um intervalo de confiana (1 - ) unilateral para . Nota: o limite T do intervalo de confiana uma estatstica e, como tal, geralmente ir supor diferentes valores de amostra para amostra. Intervalo estatstico de abrangncia: intervalo para o qual pode-se dizer que, com um dado nvel da confiana, ele contm pelo menos uma proporo especificada da populao. Notas: 1) Quando ambos os limites so definidos por estatsticas, o intervalo bilateral. Quando um dos dois limites no finito ou consiste do limite absoluto da varivel, o intervalo unilateral. 2) Tambm denominado "intervalo estatstico de tolerncia". Este termo no deve ser usado porque pode ser confundido com intervalo de tolerncia", que definido na ISO 3534-2.

Estatstica

11

Mdia aritmtica; mdia: a soma de valores dividida pelo nmero de valores. Notas: 1) O termo "mdia" (mean) , geralmente, utilizado quando se refere a um parmetro de populao (mdia da populao) e o termo "mdia" (average) quando se refere ao resultado de um clculo sobre dados obtidos de uma amostra (mdia da amostra). 2) A mdia (average) de uma amostra aleatria simples tomada de uma populao um estimador no-tendencioso da mdia (mean) desta populao. Entretanto, outros estimadores, tais como a mdia geomtrica ou harmnica, ou a mediana ou a moda, so por vezes utilizados. Parmetro - uma grandeza utilizada na descrio da distribuio de probabilidade de uma varivel aleatria. Populao: totalidade de itens sob considerao. Nota: no caso de uma varivel aleatria, considera-se que a distribuio de probabilidade defina a populao daquela varivel. Probabilidade: um nmero real na escala de 0 a 1 associado a um evento aleatrio. Varincia: uma medida de disperso, que a soma dos desvios quadrticos das observaes de sua mdia aritmtica dividida pelo nmero de observaes menos um. Varivel Aleatria: uma varivel que pode assumir qualquer um dos valores de um conjunto especificado de valores e com a qual est associada uma distribuio de probabilidade. Nota: Uma varivel aleatria que s pode assumir valores isolados chamada discreta. Uma varivel aleatria que pode assumir qualquer valor dentro de um intervalo finito ou infinito chamada contnua. Varivel aleatria centrada: uma varivel aleatria cuja esperana se iguala a zero.

Estatstica

12

3. VARIVEIS DISCRETAS E CONTNUAS


As variveis podem ser caracterizadas como qualitativas ou quantitativas. A varivel qualitativa resulta de uma classificao por tipo ou por atributo, enquanto que a quantitativa por seus valores expressos em nmeros. As variveis quantitativas podem ser agrupadas em discretas e contnuas. chamada discreta quando pode assumir apenas valores isolados ao longo de uma escala. Por exemplo: o nmero de altos fornos existentes na CST uma varivel discreta, enquanto que a temperatura deles uma varivel contnua. Pode-se concluir tambm que os valores das variveis discretas so obtidas mediante alguma forma de contagem enquanto que as variveis contnuas advm de um processo de medio, freqentemente fornecidos em alguma unidade de medida. Por outro lado a interpretao de um valor de uma varivel discreta dada exatamente pelo seu valor numrico. Quando dizemos que a CST possui dois altos fornos (em 2004), temos a noo exata do seu significado. Entretanto, no podemos dizer o mesmo da temperatura, pois a interpretao de uma varivel contnua a de que se trata de um valor aproximado. Isso decorre do fato de no existirem instrumentos de medida capazes de oferecer preciso absoluta, alm do fato de que existem outros fatores de influncia que afetam o resultado da medida, como, por exemplo, a variabilidade do processo, reajuste do equipamento, troca de operador, entre outros. Ao medirmos uma varivel contnua, estamos sempre fazendo uma aproximao, cujo resultado deve ser interpretado como sendo uma aproximao compatvel com o nvel de preciso e com o critrio utilizado para medir.

Estatstica

13

4. POPULAES E AMOSTRAS
Por definio, populao conjunto total de elementos portadores de, pelo menos, uma caracterstica comum. Ento, qualquer subconjunto no vazio e com menor nmero de elementos do que a populao constitui uma amostra dessa populao. A figura 1 ilustra este conceito.
Populao Amostra

Figura 1 - Ilustrao do conceito de populao e amostra As populaes podem ser finitas, como o conjunto dos habitantes de um pas ou infinitas como o nmero de vezes em que se pode tirar a carta de 7 de paus de um baralho. De um modo geral, considera-se como se fossem infinitas as populaes finitas muito grandes. Como exemplo, o nmero de torcedores do Flamengo. Este nmero matematicamente finito, mas to grande que um pesquisador, ao analisar uma mostra de 1000 pessoas, pode considerar a populao como infinita. Entretanto, se as informaes de toda a populao so coletadas, diz-se que houve um recenseamento. Pois Censo o conjunto de dados obtidos atravs de recenseamento. Por outro lado, se as informaes so provenientes de apenas parte da populao, dito que foi feita uma amostragem. A amostra tanto a parte retirada da populao para estudo como, tambm, o conjunto de dados obtidos nessa parte da populao. Convm, contudo, ressaltar que mesmo que o pesquisador trabalhasse com a populao, o que seria impossvel, mesmo assim, poderia ter um trabalho astronmico para estud-la e na maioria dos casos os resultados seriam sempre falhos. Imagine o nmero de nascimentos e mortes dirios em nosso pas. Portanto, vai sempre existir uma impreciso no resultado do trabalho. Nesses casos, o estatstico recorre a uma amostra, que basicamente, constitui uma reduo da populao a dimenses menores, sem perda das caractersticas essenciais.

Estatstica

14

Na metrologia, ocorre o mesmo, pois mesmo que algum se disponha a fazer, digamos, 100 medies da corrente eltrica de um motor, o resultado ser sempre uma amostra porque, teoricamente, a corrente eltrica pode ser medida um nmero infinito de vezes. Alm disso, o estudo cuidadoso de uma amostra tem mais valor cientfico do que o estudo sumrio de toda a populao.

4.1. TCNICAS DE AMOSTRAGEM Uma amostra para ser boa tem de ser representativa, ou seja, deve conter em proporo tudo o que a populao possui, tanto qualitativa quanto quantitativamente. Tambm tem que ser imparcial, isto , todos os elementos da populao devem ter igual oportunidade de fazer parte da amostra. Imagine algum pesquisando que time tem a maior torcida, no Esprito Santo, na sada do estdio, aps o jogo, Desportiva e Estrela, realizado em Cariacica! Conforme a tcnica utilizada, tem-se um tipo de amostra. Existem basicamente dois tipos de amostras: amostra no-probalstica e amostra probabilstica, as quais de dividem em: Amostra no-probalstica pode ser: a) amostra de julgamento; b) amostra por quota; c) fatia. Amostra probabilstica pode ser: a) amostra aleatria simples; b) amostra sistemtica; c) amostra estratificada; d) amostra de convenincia (grupo). Em muitos casos, somente a amostra no-probalstica est disponvel, como por exemplo, em um julgamento. Nesse caso a opinio de um perito no assunto estudado fundamental para que se possa utilizar os resultados obtidos a fim de realizar modificaes em um processo.

Estatstica

15

Existem outros casos de amostragem no-probalstica, que so: a amostragem de quota e a amostragem de fatia. Por no serem utilizadas em metrologia, no vamos estud-las. As inferncias estatsticas de uma amostra para uma populao feita atravs de uma amostra probabilstica.

4.2. AMOSTRA ALEATRIA SIMPLES Neste tipo de amostragem, os elementos so retirados ao acaso da populao, logo, cada elemento tem a mesma chance de todos os demais componentes da amostra de ser escolhido.

4.3. AMOSTRA SISTEMTICA Neste caso, os elementos so escolhidos, no por acaso, mas por um sistema. Quando a populao est organizada mais fcil obter uma amostra sistemtica do que uma amostra aleatria simples. Vejamos um exemplo. Para obter uma amostra de 4% de certificados de calibrao de um laboratrio, mais fcil pegar o ltimo de cada 25 certificados do que fazer um sorteio at conseguir 4% do total de certificados emitidos.

4.4. AMOSTRA ESTRATIFICADA composta por elementos provenientes de todos os extratos da populao. Por exemplo, numa pesquisa de nvel de satisfao com o governo do Estado do ES necessrio coletar amostras em um nmero maior de municpios do Estado e no somente na regio chamada de Grande Vitria. Sempre que a populao for constituda de por diferentes extratos, devem ser obtidas amostras estratificadas.

Estatstica

16

4.5. AMOSTRA DE CONVENINCIA (GRUPO) formada pelos elementos que se dispe. Logo, se algum toma os certificados de calibrao de que dispe como amostra de todos os certificados emitidos pelo laboratrio, estar usando uma amostra de convenincia. Como regra geral, h muitas restries ao uso de mostras por convenincia. Entretanto, elas so comuns, em vrias reas, principalmente quando constituem a nica maneira de estudar determinado problema.

4.6. ERROS DE AMOSTRAGEM A importncia da amostragem no pode ser deixada de lado. Se a amostra no for representativa da populao que se quer analisar, de nada vai adiantar o esmerado cuidado nas medies, na coleta e anlise dos dados. Entretanto, convm frisar que a amostragem sempre contribui para a incerteza de medio. Cabe ao metrologista avaliar previamente todas as fontes de erro oriundos da amostragem e tentar minimiz-las, pois uma vez cometidos eles so irreversveis. Por exemplo, se ao fazer uma medio de baixo sinal DC, o equipamento no for aterrado conveniente, todas as medies podero ser afetadas por rudos intermitentes presentes no circuito.

5. HISTOGRAMAS DE FREQNCIA
uma ferramenta estatstica apropriada para apresentao de grandes massas de dados numa forma que torna mais clara a tendncia central e a disperso dos valores ao longo da escala de medio, bem como a freqncia relativa de ocorrncia dos diferentes valores. A tabela 1 apresenta dados brutos, isto , dados que ainda no foram numericamente organizados, de medidas de comprimento de 100 eixos fabricados numa Usinagem. Observe que interpretar essa massa de dados bastante trabalhoso. Por isso fazemos uso de alguns recursos para facilitar a anlise dos dados. O histograma um dos mtodos usados que vamos aplicar agora. Siga as seis etapas do mtodo.

Estatstica

17

5.1. PRIMEIRA ETAPA: CLCULO DA AMPLITUDE (R) A frmula para clculo da Amplitude (R) a seguinte: R = Vmax Vmin, Sendo: R = amplitude Vmax = maior valor entre os 100 valores Vmin = menor valor entre os 100 valores
No. da Amostra 1 a 10 11 a 20 21 a 30 31 a 40 41 a 50 51 a 60 61 a 70 71 a 80 81 a 90 91 a 100 4162 4157 4154 4169 4186 4163 4167 4162 4169 4185 4168 4158 4168 4169 4171 4169 4177 4163 4178 4171 4178 4173 4178 4165 4174 4173 4172 4182 4169 4177 4165 4183 4169 4171 4164 4169 4179 4169 4173 4169 Medidas (em mm) 4167 4189 4177 4169 4165 4182 4171 4177 4174 4171 4168 4167 4173 4167 4167 4165 4157 4156 4173 4151 4157 4172 4176 4173 4158 4169 4159 4160 4177 4168 4161 4171 4166 4172 4172 4170 4178 4178 4169 4177 4164 4173 4171 4181 4183 4175 4173 4173 4182 4169 4165 4176 4165 4171 4187 4174 4176 4175 4184 4169

Tabela 1 - Dados brutos medidas de comprimento de 100 eixos fabricados (em mm). Encontrar tanto o menor valor, quanto o maior deles, percorrendo visualmente a lista de 100 valores. Este mtodo passvel de erro quando se tem muitos valores a comparar. melhor acrescentar duas colunas direita da tabela 1 e nome-las como Menor Valor e Maior Valor. Veja a Tabela 2. Percorrer visualmente cada linha e anotar na coluna correspondente o Menor Valor de cada linha. Percorrer visualmente a coluna Menor Valor e anotar qual o Menor Valor. Repetir o mesmo procedimento para o Maior Valor. Feito isso, s aplicar a frmula de clculo da amplitude e obter: R = Vmax Vmin = 4189 mm 4151 mm = 38 mm Portanto, R = 38 mm.

Estatstica

18

5.2. SEGUNDA ETAPA: DETERMINAO DO INTERVALO DE CLASSE O intervalo de classe pode ser determinado dividindo a amplitude (R) por 1, 2, ou 5 (ou 10, 20, 50 ou por 0, 1, 0, 2, 0,5 etc) de modo a se obter de 5 a 20 intervalos de classe, de igual amplitude. No conveniente ter muitos intervalos, pois isto tornam trabalhosas as etapas seguintes. Neste caso vamos dividir 38 por 1, por 2 e por 5. Logo obtemos: a) 38 / 1 = 38 b) 38 / 2 = 19 c) 38 / 5 = 7,6 que deve ser arredondado para 8. Ento vamos optar pela letra c, que nos permitir 8 classes com intervalo de 5 mm.
No. da Amostra 1 a 10 11 a 20 21 a 30 31 a 40 41 a 50 51 a 60 61 a 70 71 a 80 81 a 90 91 a 100 Medidas (em mm) 4167 4168 4189 4167 4177 4173 4169 4167 4165 4167 4182 4165 4171 4157 4177 4156 4174 4173 4171 4151 Menor Valor 4162 4157 4154 4165 4158 4163 4157 4156 4169 4151 4151 Maior Valor 4178 4189 4178 4181 4187 4182 4179 4182 4184 4185 4189

4162 4157 4154 4169 4186 4163 4167 4162 4169 4185

4168 4158 4168 4169 4171 4169 4177 4163 4178 4171

4178 4173 4178 4165 4174 4173 4172 4182 4169 4177

4165 4183 4169 4171 4164 4169 4179 4169 4173 4169

4157 4161 4164 4165 4172 4171 4173 4176 4176 4166 4171 4165 4173 4172 4181 4171 4158 4172 4183 4187 4169 4170 4175 4174 4159 4178 4173 4176 4160 4178 4173 4175 4177 4169 4182 4184 4168 4177 4169 4169 Menor Valor da Tabela Maior Valor da Tabela

Tabela 2 - Como encontrar o maior e o menor valor numa tabela de dados

Estatstica

19

5.3. TERCEIRA ETAPA: PREPARAO DO FORMULRIO DA TABELA DE FREQNCIA Preparar um formulrio conforme mostrado na tabela 3, de modo que a classe, o intervalo de classe, o ponto mdio da classe, as marcas de freqncia, a freqncia (f) e a freqncia relativa possam ser registradas.
Classe no Intervalo de Classe Ponto Mdio da Classe Freqncias (Marcas) Freqncia f Freqncia Relativa

Total

100

0,01

Tabela 3 - Formulrio para Tabela de Freqncia. Observe que: a) a soma das freqncias (f) tem que ser igual quantidade (n) de dados levantados (neste caso: 100); b) a freqncia relativa, quando desejada, obtida pela diviso de f por n.

5.4. QUARTA ETAPA: DETERMINAO DAS CLASSES Determinar os limites dos intervalos de forma que incluam o menor e o maior valores levantados e anotar no formulrio para Tabela de Freqncia. Determinar o limite inferior da primeira classe e acrescentar a amplitude do intervalo a ele, para obter o limite entre a primeira e a segunda classe. Assegurar-se de que a primeira classe contenha o menor valor observado. Os limites de classe devem ter um decimal a mais que os dados reais, sendo o ltimo dgito igual a 5. Continuar a adicionar a amplitude do intervalo ao valor anterior para obter o segundo limite, o terceiro etc at alcanar a ltima classe. Conferir se a ltima classe contm o valor mximo observado. Preencher o formulrio adequadamente com estes valores.

Estatstica

20

5.5. QUINTA ETAPA: CLCULO DO PONTO MDIO DE CADA CLASSE Calcular o ponto mdio da primeira classe, somando os valores dos limites superior e inferior da primeira classe e dividindo o resultado por 2. Anotar no formulrio da tabela de freqncia. Prosseguir com o mesmo mtodo para as outras classes. Alternativamente, os pontos mdios da segunda, terceira e demais classes tambm podem ser obtidos somandose ao ponto mdio da primeira classe o intervalo de classe e assim sucessivamente.

5.6. SEXTA ETAPA: OBTENO DAS FREQNCIAS Ler todos os valores contidos na tabela 1 e colocar uma marca ( | ) para cada valor, agrupando-as de 5 em 5, de acordo com as classes a que pertenam. Veja exemplo na tabela 4. Contar quantas marcas foram registradas e anotar na coluna Freqncia (f). Calcular a freqncia relativa, dividindo f por n.
Classe no 1 2 3 4 5 6 7 8 Intervalo de Classe 4150,5 a 4155,5 4155,5 a 4160,5 4160,5 a 4165,5 4165,5 a 4170,5 4170,5 a 4175,5 4175,5 a 4180,5 4180,5 a 4185,5 4185,5 a 4190,5 Ponto Mdio da Classe 4153,5 4158,5 4163,5 4168,5 4173,5 4178,5 4183,5 4188,5 Total Freqncias (Marcas) || ||||| ||||| ||||| ||||| ||||| ||||| ||| ||| ||||| ||||| ||||| ||||| ||| ||| ||||| ||||| ||||| ||||| ||||| ||||| | ||||| Freqncia Freqncia (f) Relativa 002 0,002 008 0,008 013 0,013 025 0,025 026 0,026 015 0,015 008 0,008 003 0,003 100 0,010

Tabela 4 - Tabela de Freqncia.

6. DESENHANDO UM HISTOGRAMA DE FREQNCIA


a) Usando uma folha de papel quadriculado, marcar o eixo horizontal com uma escala (mm). A escala deve ser baseada na unidade de medida dos dados (kg, oC, mm); b) Deixar um espao aproximadamente igual ao intervalo de classe no eixo horizontal antes da primeira e aps a ltima classe; c) Marcar o eixo vertical da esquerda com a escala de freqncia. Traar o eixo vertical da direita, marcando nele a escala de freqncia relativa;

Estatstica

21

d) Marcar o eixo horizontal com os valores limites das classes; e) Usando o intervalo de classe como base, traar retngulos cuja altura corresponda freqncia daquela classe; f) Traar uma linha (trao-ponto) para representar a mdia e, se houver, traar linhas verticais representando os limites da especificao; g) Anotar a quantidade de dados (n), a mdia ( x ) e o desvio padro (s) e quando foi feita a coleta de dados etc. Veja o exemplo da figura 2 para os dados da tabela 1. 6.1. POLGONO DE FREQNCIAS A construo de um polgono de freqncias feita marcando o ponto mdio (central) no topo de cada coluna do grfico de histograma e freqncia e unindo estes pontos com uma linha cheia.

Figura 2 - Histograma baseado nos dados da tabela 1. Nota: Esta linha sinuosa ( ) que comea no zero serve para economizar espao. Com este recurso o valor 4151 pode ficar perto do zero.

Estatstica

22

Por exemplo, na tabela 4 calculamos o ponto mdio de cada classe. Vamos repetir o histograma da figura 2, construindo a figura 3, e vamos marcar neste histograma o ponto mdio de cada classe e em seguida vamos unir os pontos marcados. E para concluir o grfico, imaginamos duas classes tericas, de ponto mdio = 0, nos dois extremos do histograma.

Figura 3 - Polgono de Freqncias com os dados da tabela 3. 6.2. ESTRATIFICAO DE HISTOGRAMAS De forma geral, a maioria dos estudos voltados deteco das causas de defeitos envolve a associao dos dados de causas com os dados dos correspondentes efeitos. Neste caso, a disposio dos dados numa ordem tal que mostre claramente esta correspondncia, e mais tarde, a anlise dos dados atravs da estratificao por causas ou da construo de histogramas de disperso em funo dessas causas podem facilitar a identificao das fontes do problema. Considere os dados da tabela 5. Foram coletados da medio de temperatura em duas posies do forno, a saber: lado direito (A) e lado esquerdo (B). Foi feito o histograma de todos os dados figura 4 - e posteriormente os dados foram estratificados em dois histogramas (uma para o lado A e outro para o lado B) figura 5 - visando identificar se h variaes de temperatura entre os lados do forno. Estatstica

23

Foram identificadas diferenas nas temperaturas entre os dois sensores. Este mtodo pode ser usado para melhorar a qualidade do produto, reduzindo a variao e melhorando a mdia do processo. A estratificao geralmente feita de acordo com a metodologia 6M 6 (tambm conhecida como diagrama de Ishikawa, diagrama de causa-e-efeito ou ainda espinha de peixe). Os 6M so: mtodo, mquina, mo-de-obra, meio-ambiente, matria prima e medida.
Medio N Forno
o

Temp. em C

Medio N Forno

Temp. em C

Medio N Forno

Temp. em C

Medio N Forno

Temp. em C

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

A A B B A B B B A B B A A A B B A B B A B A A A

184,9 183,8 186,2 185,7 183,9 186,4 186,8 187,0 183,8 186,0 186,3 183,0 183,5 182,7 185,2 186,7 183,1 185,9 187,5 183,8 187,5 184,4 183,4 184,3

26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49

B B A B A A B B A A A B A A B A A A B B A B B B

186,2 187,2 183,0 186,3 183,9 183,5 184,1 184,7 185,3 184,5 184,5 186,2 184,1 183,2 186,2 182,9 183,8 183,7 186,6 185,7 182,9 186,9 186,1 186,0

51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74

B B B A A B A B A A B A A A B B B A B A B A A A

186,6 187,0 186,7 184,9 183,7 184,7 185,1 185,4 184,4 184,2 185,8 185,1 184,4 183,8 187,0 186,9 185,5 183,7 186,0 184,5 187,9 182,7 184,2 183,9

76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99

B B A A B B A B A B A B A B B A A A B B A A B B

185,4 184,6 183,9 183,2 185,7 186,9 184,0 185,7 184,3 186,0 183,6 186,0 183,6 186,5 187,6 184,7 185,1 183,8 186,6 186,7 184,3 183,7 184,9 185,8

25

B 186,1 50 A 183,8 75 B 185,5 100 B 184,1 Tabela 5 - Dados da medio de temperatura do forno Lados A e B.

As Ferramentas da Qualidade no Gerenciamento de Processos Werkema, Maria C. Catarino

Estatstica

24

25 20 15 10 5 0 1 2 3 4 5 6 7

Figura 4 - Histograma de Freqncia da Medio de Temperatura nos lados A e B


16 14 12

14 12 10

10

8
8 6 4 2 0 1 2 3 4 5 6 7

6 4 2 0

Figura 5 - Histogramas Estratificadas da Temperatura do Forno a) lado direito: posio A; b) lado esquerdo: posio B.

7. PARMETROS DA DISTRIBUIO DE FREQNCIA


A distribuio de freqncias mostra os dados em formas e formatos comuns. Os nmeros tm uma tendncia de se agrupar e mostrar padres semelhantes. Estes padres podem ser identificados, medidos e analisados. Na anlise dos dados de uma distribuio de freqncias h quatro parmetros importantes: tendncia central, disperso, desvio e curtose.

Estatstica

25

7.1. TENDNCIA CENTRAL A maioria das distribuies de freqncia exibe uma tendncia central, isto , uma forma tal que a maior parte das observaes se acumula na rea entre os dois extremos. Tendncia Central um dos conceitos fundamentais em toda a anlise estatstica. a mdia dos pontos. As curvas podem ter diferentes simetrias e disperses, mas a mesma tendncia central. Tambm possvel ter curvas com a mesma simetria e mesma disperso, mas com diferente tendncia central.

7.2. DISPERSO a caracterstica que indica o grau de espalhamento dos dados. Tambm chamada de variao.

7.3. ASSIMETRIA Indica o grau de distoro em uma curva simtrica ou o grau de assimetria. Uma curva simtrica possui os lados direito e esquerdo da lei de centro iguais. Os dois lados de uma curva simtrica so imagens de cada lado. Uma curva se distorce para direita quando a maioria dos valores est agrupada no lado direito da distribuio.

7.4. CURTOSE a caracterstica que descreve o pico em uma distribuio. uma medida relativa para comparar o pico de duas distribuies. Uma maior curtose significa um pico maior de freqncia relativa, no maior quantidade de dados. H trs classes de curtose: platicrtica (curva plana e esparramada), leptocrtica (curva com pico estreito e alto) e mesocrtica (intermediria entre as duas outras).

Estatstica

26

8. MDIA ARITMTICA
Os dados podem ser reduzidos a um nico nmero, para fins de comparao. A mdia ou valor mdio o mais representativo de um conjunto de dados ou medies. Quanto maior o nmero de medies feitas, melhor ser o resultado. O valor mdio a expectativa matemtica do conjunto de dados. A mdia aritmtica a mdia mais usada e calculada como sendo a soma de todas as medidas de um conjunto dividida pelo nmero total de medidas. Se uma varivel x possui os n valores: x1 , x2 , ...., xn , a mdia aritmtica, x , (leia-se: xis barra) : x= x1 + x2 + ... + xn n

Simplificando esta frmula podemos usar Onde:


x

x=

x
i =1

= mdia aritmtica = letra grega Sigma = somatrio de todos os valores xi na amostra (i varia de 1 at n) = tamanho da amostra

x
i =1

Exemplo: Calcular a mdia de: 25, 36, 45 e 72. Usando a frmula, temos:

x=

25 + 36 + 45 + 72 = 44,5 4

Logo, a mdia aritmtica, ou simplesmente, a mdia : 44,5. importante observar que a mdia baseia-se em todas os elementos do conjunto de dados, por isso ela altamente afetada pelos valores extremos. Por isso, s vezes, a mdia aritmtica apresenta uma representao distorcida daquilo que os dados esto transmitindo; assim sendo, a mdia aritmtica no seria, sozinha, a melhor medida a ser utilizada para descrever ou resumir tal conjunto de dados.
Estatstica

27

Quando se tem uma populao muito grande de dados (n tende para o infinito), o smbolo da mdia expresso como:

=
Sendo = smbolo da mdia (para n grande).

x
i =1

Deve-se sempre fazer de trs a cinco replicaes de uma medio. Os resultados individuais de um conjunto de medies so raramente os mesmos e usa-se a mdia como melhor valor para o conjunto, pois a mdia sempre mais confivel do que qualquer resultado individual. A variao nos dados deve fornecer uma medida da incerteza associada com o resultado.

9. MDIA PONDERADA
s vezes as medies x1 , x2 , ...., xn , esto associadas com certos fatores de peso, como

p1 , p2 , ....,

pn, respectivamente, dependendo da importncia associada a estes

nmeros. Neste caso, define-se a mdia aritmtica ponderada como:


xp = x1 p1 + x2 p2 + ... + xn pn p1 + p2 + ... + pn

A mdia ponderada muito usada nas mdias escolares, onde se pode atribuir importncias (pesos) diferentes ao exame final, trabalhos de casa, aulas prticas e provas mensais. Em metrologia, a mdia ponderada mais comum usa as freqncias das medies como seus respectivos pesos. Freqncia o nmero de vezes que um dado observado. Freqncia relativa a percentagem de vezes que um dado observado. Considere a Figura 6, de distribuio de freqncias com k classes. Sejam x1 , x2 , ...., xk , os valores dos pontos mdios de classe e sejam f1 , f 2 , ...., respectivas freqncias, como mostra a Figura 6. f k , as

Estatstica

28

Ponto Mdio

Freqncia

x1 x2
. . .

f1 f2
. . .

xk fk Figura 6 - Distribuio de freqncias com k classes. x p = x1 f1 + x2 f 2 + ... + xk f k

xp =

fx
i =1 k

i i

f
i =1

Onde f i a freqncia relativa da ocorrncia da medio xi . Nota: A expresso

f
i =1

ser sempre igual a n (neste caso: 100).

Vejamos um exemplo. Considere os dados da tabela 6 (esta tabela a mesma j estudada anteriormente). E que desejssemos calcular a mdia, baseando-nos apenas nos dados desta tabela.
Classe no 1 2 3 4 5 6 7 8 Intervalo de Classe 4151,5 a 4156,5 4156,5 a 4161,5 4161,5 a 4166,5 4166,5 a 4171,5 4171,5 a 4176,5 4176,5 a 4181,5 4181,5 a 4186,5 4186,5 a 4191,5 Ponto Mdio da Classe 4153,5 4158,5 4163,5 4168,5 4173,5 4178,5 4183,5 4188,5 Total Mdia Freqncias (Marcas) || ||||| ||| ||||| ||||| ||| ||||| ||||| ||||| ||||| ||||| ||||| ||||| ||||| ||||| ||||| | ||||| ||||| ||||| ||||| ||| ||| Freqncia Freqncia (f) Relativa 002 008 013 025 026 015 008 003 100 0,002 0,008 0,013 0,025 0,026 0,015 0,008 0,003 0,010 (Ponto Mdio Classe) x (Freqncia) 8307,00 33268,00 54125,50 104212,50 108511,00 62677,50 33468,00 12565,50 417135,00 4171,35

Tabela 6 - Tabela de Freqncia.

Estatstica

29

Podemos observar que a soma da coluna Freqncia (f) 100 (total de elementos que compem esta amostra). Para obtermos a mdia do dimetro dos 100 eixos desta tabela, multiplica-se o ponto mdio de cada classe (2a coluna) pela respectiva freqncia, somamse os produtos e divide-se a soma por n (neste caso, k =8, pois so 8 classes de freqncia). Ento a mdia :

xp

f x ( f x + f x + ... + f x ) 2 * 4153,5 + 8 * 4158,5 + ... + 3 * 4188,5 = = = f + f + ... + f 2 + 8 + ... + 3 f


i =1 k i i
1 1 2 2 2 8 8

i =1

xp =

417135 = 4171,35 100

10.

MDIA DA RAIZ DA MDIA DOS QUADRADOS

Quando temos dados positivos e negativos e as suas influncias se somam, no podemos tirar a mdia aritmtica, pois a soma algbrica dos dados cancelam seus valores. Ento se utiliza a frmula:
x rms =

(x

2 1

2 2 + x2 + ... + x n

Esta frmula tambm usada em metrologia, quando se quer combinar diversos erros, por exemplo, numa malha de medio. Neste caso, x1 , x2 , ...., xn , seriam os erros de cada componente da malha de medio e x rms seria o erro mdio da malha.

Estatstica

30

11.

MEDIA HARMNICA

A mdia harmnica dada pela frmula:


xh = n
n

x
i =1

1
i

usada quando se deseja calcular a mdia de grandezas inversas. Por exemplo: Suponha que um tanque esteja alimentando trs clientes, com vazes individuais de 100, 120 e 140 litros por minuto. Deseja-se saber qual a vazo mdia. Aplicando a frmula da mdia harmnica, temos:
xh = n
n

x
i =1

1
i

3 = 117,76 1 1 1 + + 100 120 140

A vazo mdia de 118 litros por minuto.

12.

MEDIANA

A Mediana o valor central quando os dados esto ordenados por valor e a amostra possui nmero mpar de dados. Por exemplo: 4, 6, 8 12 e 18, a mediana 8. Se a amostra contm um nmero par de dados, a mediana a mdia aritmtica dos dois valores que ficam na posio central dos dados ordenados. Por exemplo: 25, 30, 35, 40, 60, 80, 90 e 100. Os dois valores que ficam na posio central so 40 e 60, logo a mediana ser:

40 + 60 = 50 2 Veja que no grfico da Figura 7 os dados esto representados ao longo do eixo e que a posio da mediana (linha pontilhada) est assinalada (50) e divide a amostra em dois conjuntos com igual nmero de dados (4 dados para cada lado).
Estatstica

31

Figura 7 - Distribuio dos dados sobre o eixo e a respectiva mediana.

A mediana usada para reduzir o efeito dos valores extremos ou para dados que possam ser ordenados, mas que no sejam economicamente mensurveis (tons de cor, aparncia visual, odores). Na curva percentil, o valor da escala horizontal onde a curva alcana a altura 50%.

13.

MODA

A Moda o valor que ocorre com maior freqncia. Por exemplo: 12, 14, 15, 15, 15, 18, 29, 29, e 30. A moda 15, pois este o nmero que ocorre maior nmero de vezes. Existem conjuntos de dados que no possuem moda, porque nenhum valor se repete maior nmero de vezes e existem conjuntos de dados com mais de uma moda. Por exemplo: 7, 8, 9, 10, 11, 12 e 18 no tem moda e o conjunto de nmeros 7, 8, 8, 9, 10, 11, 11, 12 e 18 tem duas modas, a saber, 8 e 11. A moda, diferentemente das outras medidas de tendncia central, pode ser obtida mesmo que a varivel seja qualitativa. Veja os dados apresentados na tabela 7. O sangue tipo A ocorreu com maior freqncia entre os doadores de sangue no ms de junho.
Tipo de Sangue O A B AB Freqncia 680 735 246 97

Tabela 7 - Doadores de sangue, segundo o tipo de sangue.

A moda tambm usada para distribuies extremamente assimtricas, situaes irregulares onde dois picos so encontrados, ou para eliminar os efeitos dos valores extremos.

Estatstica

32

14.

MEDIDAS DE DISPERSO

Os dados esto sempre dispersos ao redor da zona de tendncia central, e a extenso dessa disperso chamada disperso ou variao. Uma medida de disperso a segunda das duas medidas mais fundamentais em toda a anlise estatstica. Dentre as medidas de disperso, vamos estudar a amplitude, a varincia, o desvio padro e o coeficiente de variao.

15.

AMPLITUDE

Dentre as vrias medidas de disperso, a mais simples a Amplitude, que a diferena entre os valores mximo e mnimo dos dados. Por exemplo, calcular a amplitude entre os dados: 5, 8, 12, 17 e 32 a amplitude 32 5 = 27 Como a amplitude baseada em dois nmeros, mais til quando o nmero de observaes pequeno (cerca de 10 ou menos). Entretanto a amplitude nem sempre nos mostra certas diferenas contidas nos dados. Sua deficincia reside no fato de que usa apenas os valores extremos e no todos os dados. Mesmo assim, ela muito usada, principalmente pela facilidade com que calculada e interpretada.

Estatstica

33

16.

VARINCIA

Embora a amplitude seja uma medida de disperso, como vimos anteriormente, ela no leva em conta como os dados se distribuem ou se agrupam. Duas maneiras utilizadas para medir a variao que realmente considera como os dados se distribuem em torno da mdia so a varincia e o desvio padro. Para um conjunto de dados composto de: x1 , x2 , ...., xn , a varincia calculada usando a frmula:
s2 =

(x x ) + (x
2 1 2

x + ... + xn x n 1

ou, simplificando

s2 =

(x x )
n i =1 i

n 1

ou podemos usar tambm s 2 =

x
i =1

2 i

n x2

n 1

Esta segunda frmula facilita o clculo, quando usamos calculadora simples. Onde:

s 2 = varincia
x = mdia aritmtica n = tamanho da amostra

xi = encimo valor da varivel aleatria x

(x
n i =1

= somatrio de todas as diferenas ao quadrado entre os valores xi e

Aqui convm explicar o uso de n 1 ao invs de n . Isto se deve a certas propriedades matemticas desejveis possudas pela estatstica s 2 (varincia), que a tornam apropriada para inferncia estatstica. medida que cresce o tamanho da amostra, n , a diferena na diviso por n ou por n 1 vai se tornando cada vez menor.

Estatstica

34

Os estatsticos chamam a expresso n 1 de graus de liberdade. Quando calculamos a mdia, x , utilizamos todos os n dados que compunham a amostra. Dizemos ento que no clculo da mdia temos n valores de xi
livres que devem ser considerados para

podermos calcular o valor desta estatstica. Ou seja, se qualquer dos valores de xi livres da amostra for desconhecido, no poderemos determinar o valor desta estatstica, pois todos os valores da amostra so livres, podendo variar aleatoriamente. Por outro lado, a estatstica da varincia expressa pela equao acima, por usar a mdia, x , ao invs do parmetro populacional , tem um grau de liberdade a menos. Isso ocorre porque o clculo dessa estatstica pressupe que anteriormente j se tenha usado todos os valores da amostra no clculo da mdia, x , os quais estariam sendo usados uma segunda vez no clculo da varincia. Ou seja, ao usarmos o mesmo conjunto de dados para determinar a mdia, x , e a varincia que faz uso do valor da mdia, perdemos um grau de liberdade para a determinao da mdia.

17.

DESVIO PADRO

O desvio-padro, s, a medida mais importante de variao. Ele determina a disperso dos valores em relao mdia. O desvio-padro da amostra a raiz quadrada da varincia, ou seja:
s = s 2 ou substituindo s 2 , temos:

s=

(x + x )
n i =1 i

n 1

Estatstica

35

Exemplo: Calcular o desvio padro de: 10, 12, 9, e 14. A mdia ser: x = x1 + x2 + ... + xn n

x=

10 + 12 + 11 + 15 = 12 4

A varincia ser: s 2 =

(x
n i =1

n 1

2 2 ( 10 12) + (12 12 ) + (11 12) 2 + (15 12) 2 =

4 1

s2 =

(2) 2 + (0) 2 + (1) 2 + (3) 2 14 = = 4,666 3 3

O desvio padro ser: s = s 2

s = 4,666 = 2,160

Convm ressaltar que a varincia e o desvio padro nunca podem ser negativos. Entretanto podem ser zero, o que ocorre quando todos os valores so exatamente iguais. Neste caso, a amplitude tambm ser zero. A varincia e o desvio padro medem a disperso mdia em torno da mdia aritmtica ou seja, como os valores maiores e menores se distribuem acima e abaixo da mdia, respectivamente.

Estatstica

36

18.

COEFICIENTE DE VARIAO

O coeficiente de variao, cv( x) , definido como o quociente entre o desvio padro e a


mdia. Ele mede a disperso em torno da mdia aritmtica. Freqentemente expresso em porcentagem. Sua frmula :

cv( x) =
Onde:

s 100 % x

cv( x) = coeficiente de variao s


x

= desvio padro = mdia aritmtica

A vantagem do coeficiente de variao como uma medida relativa devido ao fato de que ele nos permite comparar a variabilidade de dois ou mais conjuntos de dados expressos em diferentes unidades de medio. Ou ento quando comparamos dois ou mais conjuntos de dados nas mesmas unidades, porm com diferenas entre si de tal monta que no permita comparao direta entre suas mdias e seus desvios padres. Por exemplo, imagine que em dois grupos de pessoas tenham sido calculadas a idade mdia e o desvio padro, conforme abaixo: Grupo 1: x1 = 20 e s1 = 4 Grupo 2: x2 = 50 e s2 = 4 Se ambos os grupos tm o mesmo desvio padro, a priori, comparar a disperso de suas idades um pouco difcil. Fazendo uso do coeficiente de variao, temos: Grupo 1: cv1 = s1 / x1 * 100 = 4/20*100 = 20 % Grupo 2: cv2 = s2 / x2 * 100 = 4/50*100 = 8 %

Estatstica

37

Podemos agora concluir que, mesmo tendo desvio padro igual, o grupo 1 apresenta uma variao relativa muito maior (20 %) do que o grupo 2 (8 %). Alm disso, por ser adimensional, o coeficiente de variao permite que se comparem as disperses de variveis cujas unidades sejam irredutveis.

19.

FORMATO

A terceira propriedade importante em um conjunto de dados o seu formato, ou seja: a maneira como os dados esto distribudos. Esta distribuio pode ser simtrica ou assimtrica. Para saber o formato de um conjunto de dados, basta comparar sua mdia com sua mediana, ou seja:

Se a mdia > mediana: assimetria direita (ou positiva). Se a mdia = mediana: assimetria em zero (ou simetria). Se a mdia < mediana: assimetria esquerda (ou negativa).

20.

DISTRIBUIO DE PROBABILIDADES

Por causa de suas caractersticas, a distribuio da probabilidade est relacionada com as distribuies de freqncia. Mas, na distribuio de freqncia, as freqncias so nmeros observados de eventos ocorridos e a na distribuio da probabilidade, a freqncia derivada da probabilidade de eventos que podem ocorrer. H diversas distribuies de probabilidades, entre elas: a) distribuio binomial; b) distribuio de Poisson; c) distribuio normal

Estatstica

38

d) distribuio uniforme (ou retangular) e) distribuio triangular f) distribuio t (Student) As duas primeiras distribuies so distribuies de probabilidades discretas, ou seja, so distribuies de probabilidade para uma varivel discreta. Varivel discreta aquela que pode assumir apenas valores isolados ao longo de uma escala. Por exemplo: o nmero de altos fornos existentes na CST uma varivel discreta. As outras distribuies so funes de densidade de probabilidades contnuas. Essas distribuies encontram importantes aplicaes na engenharia, nas cincias fsicas, bem como na rea financeira e em cincias sociais.

20.1. INTRODUO AO CLCULO DE PROBABILIDADES

Os elementos bsicos da teoria da probabilidade so os resultados do processo (ou fenmeno) em estudo. Cada tipo possvel de ocorrncia relacionado como um evento. Probabilidade , portanto, a possibilidade ou a chance de que um evento em particular venha a ocorrer. Pode ser a chance de acertar uma das faces da moeda atirada ao ar, ou de se encontrar uma carta num baralho ou mesmo de acertar na sena. Em cada um desses eventos a probabilidade a proporo ou a frao cujos valores variam entre 0 e 1, inclusive. bom frisar que um evento que no tem chance de ocorrer, o evento
nulo, tem uma probabilidade 0 e um evento que certamente ir acontecer, evento certo,

tem a probabilidade 1. Examine as duas frases seguintes: a) provvel que Pedro no venha aula amanh. b) provvel que a Atlntica tenha existido.

Estatstica

39

Em ambas as frases esto presentes as idias de incerteza e grau de confiana que depositamos naquilo que afirmamos. Embora a palavra provvel tambm nos d a idia de futuro, na segunda frase estamos afirmando algo que deve ter ocorrido no passado se que ocorreu, pois neste caso a probabilidade no est ligada ao tempo, mas sim eventual veracidade da prpria afirmao. Em um dado experimento um evento deve ocorrer ou no ocorrer, como por exemplo, ao jogar uma moeda ao ar, a probabilidade da ocorrncia de cara mais a probabilidade da no ocorrncia de cara ser sempre igual a 1. Ento: P(X) = P(X) + P (X) = 1 Ou seja, o complemento de um evento X inclui todos os eventos que no fazem parte de X, e representado por X. Lanando-se uma moeda um nmero grande de vezes, dever aparecer cara em metade dos lanamentos e coroa no restante. A freqncia relativa de caras se aproxima de 0,5 conforme aumentado o nmero de lanamentos da moeda. Portanto a freqncia relativa de um ponto amostral pode ser tomada, aproximadamente, como a sua probabilidade. Por definio, probabilidade o nmero de resultados da diviso do nmero de casos favorveis a um evento pelo nmero total de casos possveis. Por exemplo: ao jogar a moeda uma nica vez, a probabilidade de sair cara de 0,5 (50% de chance de acertar). Logo a frmula : (nmero de vezes que o evento CARA pode sair numa jogada) (Probabilidade de sair cara) = ---------------------------------------------(Nmero total de casos possveis) Uma moeda honesta s tem uma cara e uma coroa, logo, o nmero total de eventos possveis so 2 (1 cara + l coroa). Ento, Probabilidade de CARA = 1 = 0,5 2

Estatstica

40

O smbolo P usado para designar a probabilidade de um evento. Ento P(X) denota a probabilidade de o evento X ocorrer em uma s observao ou experimento. A frmula resumida para a probabilidade : P(X) = Onde: P(X) = probabilidade de ocorrer o evento X

f p

f p

= nmero de eventos favorveis ocorrncia de X = nmero de casos possveis

No exemplo anterior, diramos:

P( X ) =

f 1 = = 0,5 p 2

Observe que a probabilidade sempre expressa por um nmero adimensional, isto , sem unidade de medida. Veja este exemplo: Qual a probabilidade de sair a face 3 ao lanar um dado uma vez? Casos possveis: Face 1, Face 2, Face 3, Face 4, Face 5, Face 6. Ou seja, temos 6 casos possveis. Casos favorveis: somente uma face 3. Logo, usando a frmula. P(de sair Face 3) =

Face 3 Face 1 + Face 2 + Face 3 + Face 4 + Face 5 + Face 6


= 1 = 0,1666... 6

Estatstica

41

20.2. REGRA DA ADIO

Outro exemplo: Qual a probabilidade de sair face impar numa nica jogada? Temos como nmero de casos favorveis trs eventos: Face 1 ou Face 3 ou Face 5. E como nmero total de casos possveis 6 eventos: Face 1, Face 2, Face 3, Face 4, Face 5, Face 6. Aplicando a frmula, temos:
P(de sair Face 1 ou Face 3 ou Face 5) =

Face 1 + Face 3 + Face 5 Face 1 + Face 2 + Face 3 + Face 4 + Face 5 + Face 6


3 Faces 3 1 = = = 0,5 6 Faces 6 2

Observando este exemplo, conclui-se que em probabilidade a palavra ou significao adio. Por definio, f p, sendo que f pode ser zero. Veja o seguinte exemplo: Numa nica jogada, qual a possibilidade de sair a face 7. Observe que o dado no possui a face 7. Logo, P(7) =

Zero casos favorveis 6 casos possveis

P(7) =

0 = 0 e dizemos que esta a menor probabilidade que existe. 6

Em um dado experimento um evento deve ocorrer ou no ocorrer, como por exemplo, ao jogar uma moeda ao ar, a probabilidade da ocorrncia de cara mais a probabilidade da no ocorrncia de cara ser sempre igual a 1. Ento: P(X) = P(X) + P (X) = 1 Ou seja, o complemento de um evento X inclui todos os eventos que no fazem parte de A, e representado por X. Lanando-se uma moeda um nmero grande de vezes, dever aparecer cara em metade dos lanamentos e coroa no restante. A freqncia relativa de caras se aproxima de 0,5 conforme aumentado o nmero de lanamentos da moeda. Portanto a freqncia relativa de um ponto amostral pode ser tomada, aproximadamente, como a sua probabilidade.

Estatstica

42

Se dois eventos, de um mesmo espao amostral, no tm pontos em comum, a probabilidade de ocorrer um ou o outro a soma de suas probabilidades. Se a probabilidade do primeiro no depende da probabilidade do segundo e vice-versa, a probabilidade desses dois eventos ocorrerem simultaneamente o produto de suas probabilidades individuais.

P (2 ou 5) =

1 1 2 1 + = = = 0,333 6 6 6 3

20.3. REGRA DO PRODUTO

Uma moeda ser jogada duas vezes. Qual a probabilidade de ocorrer cara nas duas jogadas? A probabilidade de ocorrer cara na primeira jogada : P(ACARA) = 1 = 0,5 2

A probabilidade de ocorrer cara na segunda jogada P(BCARA) = 1 = 0,5 2

Porque o fato de ocorrer cara na primeira jogada no modifica a probabilidade de ocorrer cara na segunda jogada (eventos independentes). Para obter a probabilidade de ocorrer cara nas duas jogadas (primeira e segunda), faz-se o produto: 1 1 1 {P(ACARA) e P(BCARA) }= 2 * 2 = 4 = 0,25 Suponha que numa urna tenha 3 bolas: duas brancas e uma vermelha. Retirando-se ao acaso, uma bola e em seguida a outra (sem que a primeira tenha sido recolocada na urna), qual a probabilidade de que as duas bolas sejam brancas: A probabilidade de a primeira bola ser branca : 2 P(branca) = 3 = 0,6666...

Estatstica

43

A probabilidade de a segunda bola ser branca depende do que ocorreu na primeira retirada. Se sair bola branca, a probabilidade de a segunda tambm ser branca : P(branca) = 1 = 0,5 2

Para obter a probabilidade de as duas bolas retiradas serem brancas, faz-se o produto P(A e B) = P(A) * P(B) 2 1 2 1 = = 3 * 2 = 6 3 = 0,3333... Se A e B so independentes, a probabilidade de ocorrer A e B dada pela probabilidade de ocorrer A, multiplicada pela probabilidade condicional de ocorrer B, dado que A ocorreu. A frmula expressa assim: P(A e B) = P(A) * P(B A) Nota: P(B A) L-se: probabilidade de ocorrer B, dado que A j ocorreu (probabilidade de sair bola branca j que bola branca j saiu).

21.

DISTRIBUIO BINOMIAL

extremamente til para descrever muitos fenmenos. A distribuio binomial se aplica, principalmente, contagem de eventos, onde as duas sadas possveis podem ser sucesso ou falha, pea normal ou defeituosa. A formula :

P ( x) =

n! p x (1 p) n x x!(n x)!

Estatstica

44

Onde: P(x) = probabilidade de x sucessos

N = nmero de sucessos na amostra (x = 0, 1, 2, 3, ..., n) n! = fatorial de n (ou seja: se n = 5, n! = 5*4 *3*2*1 = 120 p = probabilidade de sucesso 1-p = probabilidade de fracasso
Observe que a varivel aleatria x pode ser qualquer valor inteiro de 0 at n e que na frmula acima o produto do termo p x (1 p) n x nos informa a probabilidade de obtermos exatamente x sucessos entre n observaes numa determinada seqncia. Por outro lado, o termo

n! nos mostra quantas combinaes de x sucessos entre n x!(n x)!

observaes so possveis. Por isso, toda vez que um conjunto de parmetros n e p especificado, uma distribuio binomial pode ser gerada. Vejamos um exemplo. Jogando um dado trs vezes, qual a probabilidade de se obterem exatamente duas faces 3? Os valores deste problema so: n = 3; x = 2. Vamos primeiramente calcular p. Como o dado tem 6 faces, temos 6 casos possveis: Face 1, Face 2, Face 3, Face 4, Face 5 e Face 6. Casos favorveis: somente uma face 3. Logo, usando a frmula: P(de sair Face 3) =

Face 3 1 = Face 1 + Face 2 + Face 3 + Face 4 + Face 5 + Face 6 6

Estatstica

45

Logo, p = 1/6. Aplicando a frmula, temos:

P ( x) =

n! p x (1 p) n x x!(n x)!
2 3 2

3! 1 1 1 2 ! ( 3 2 )! 6 6 P(x = 2) =

3 * 2 *1 1 1 5 2 *1(1) 6 6 6

6 5 5 * = 3* = 0,0694 2 6 216

Ou seja, a probabilidade de 6,94% de chance de em 3 lances, obter duas faces 3. Para evitar enfadonhos clculos, principalmente para n grande, pode-se usar tabelas disponveis na literatura tcnica, onde se determina P(x) a partir de n e x.

22.

DISTRIBUIO DE POISSON

Esta distribuio um caso limite da distribuio binomial, que d o nmero de ocorrncias de um evento num intervalo de tempo. Ela se aplica quando se tem um numero muito grande de eventos e quando a probabilidade de sucesso de cada tentativa e muito pequena e por isso e tambm chamada de distribuio de eventos raros. Na pratica a distribuio de Poisson se aplica anlise de controle da qualidade para estabelecer o nmero de itens defeituosos ou o nmero de paradas da mquina, em um dado intervalo de tempo. Tendo x como varivel aleatria representando o nmero de eventos raros, ento a probabilidade destes x eventos ocorrerem em algum intervalo de tempo especificado (ou espao) dado pela frmula: (e ) x P( x) = x!

Estatstica

46

Onde: P(x) = probabilidade de x sucessos, dado o conhecimento de


e = 2,7182818284590... (nmero de Euler)

= nmero esperado de sucessos

x = nmero de sucessos
Veja o exemplo a seguir: Qual a probabilidade de que, num determinado minuto, exatamente dois clientes iro chegar na agncia bancria, sabendo que: no horrio de almoo, de 12 s 13 horas, chegam em mdia 180 clientes? Soluo: A mdia de clientes por minuto = 3 e x = 2. Aplicando a frmula P ( x) = (e ) x , temos, x!

e 3 * 32 9 = = 0,2240 P(x = 2) = 2! (2,71828)3 * 2

Neste mesmo problema, qual seria a chance de que mais de dois clientes iro chegar em um dado minuto? Soluo: P(x > 2) = P(x = 3) + P(x = 4) + ... + P(x = )

Como porm a soma de todas as probabilidades em uma distribuio sempre 1, os termos no lado direito da equao P(x > 2), tambm representam o complemento da probabilidade de que x sejam menor ou igual a 2, ou seja: 1 - P(x 2). Portanto, P(x > 2) = 1 - P(x 2) = 1 - [P(x = 0) + P(x = 1) + P(x = 2)] E utilizando a equao P ( x) = (e ) x , temos x!
+

e 3 * (3)0 e 3 * (3)1 e 3 * (3) 2 P(x > 2) = 1 + + 0 ! 1 ! 2!

= 1 - [0,0498 + 0,1494 + 0,2240] = 1 - 0,4232 = 0,5768

Estatstica

47

Deste modo, vemos que existe uma chance de aproximadamente 42,3 % de que dois ou menos clientes iro chegar ao banco a cada minuto e que existe uma chance de 57,7 % de que trs ou mais clientes iro chegar.

23.

DISTRIBUIO NORMAL

A distribuio normal uma distribuio contnua de probabilidade, fundamental para a inferncia estatstica e anlise de dados. Os modelos contnuos so importantes nas aplicaes de engenharia, cincias fsicas, cincias sociais e em finanas. Uma forma abreviada de indicar que a varivel x se distribui normalmente (ou tem distribuio normal) escrever:

x N ( ; 2 )
Onde e 2 so os parmetros fundamentais da distribuio normal.

23.1. PROPRIEDADES DA DISTRIBUIO NORMAL

Esta distribuio muito importante na estatstica pois: a) Muitos fenmenos fsicos e muitos conjuntos de dados seguem uma distribuio normal; b) A distribuio normal possui propriedades matemticas precisas e idnticas para todas as distribuies normais; c) possvel provar que vrias estatsticas de amostras, principalmente a mdia, seguem a distribuio normal, mesmo que a populao de onde foram retiradas as amostras no seja normal; d) Podemos utiliz-la para aproximar vrias distribuies de probabilidade discreta. e) Ela oferece bases para a inferncia estatstica devido sua afinidade com o teorema do limite central.

Estatstica

48

23.2. CARACTERSTICAS

A curva de distribuio deve ter as seguintes caractersticas: a) simtrica em relao mdia, indicando que os erros negativos de determinado valor so igualmente freqentes quanto os positivos; b) O formato de uma curva de distribuio de probabilidade normal simtrico e se parece com um sino (figura 8);

Figura 8 - Formato da Curva Normal.

c) O ponto mximo de f(x) o ponto ; d) Os pontos de inflexo da funo so: x = + e x = - ; e) Os parmetros so indicadores populacionais: mdia aritmtica () e varincia (2); f) Existem infinitas curvas, basta que seja diferente um dos parmetros: ou 2. Veja a figura 9;

Figura 9 - Trs distribuies normais com parmetros diferentes e .

Estatstica

49

g) A curva assinttica em relao ao eixo horizontal, isto , suas caudas aproximam-se dele, mas no o tocam jamais; h) A rea total sob a curva vale 1, porque essa rea corresponde probabilidade de a varivel aleatria assumir qualquer valor real.

23.3. MODELO MATEMTICO

A expresso matemtica que representa a funo densidade da probabilidade representada pelo smbolo f(x). Para a distribuio normal, o modelo empregado para obter as probabilidades :

F ( x) =
onde:

1 x 2 1 exp 2 2

exp = 2,7182818284590... (nmero de Euler) = constante matemtica aproximada por 3,14159 = mdia aritmtica da populao

= desvio padro da populao x = qualquer valor da varivel aleatria contnua, onde - < x < + Avaliando os componentes da frmula padro para a funo de densidade da probabilidade normal, podemos observar que e e so constantes matemticas. Logo as probabilidades da varivel aleatria x so dependentes somente dos dois parmetros da distribuio normal a mdia aritmtica da populao () e o desvio padro da populao (). Isto significa que para cada par de valores de e , teremos uma distribuio de probabilidade diferente.

Estatstica

50

23.4. DISTRIBUIO NORMAL PADRO

Para evitar os clculos exaustivos quando se usa a frmula acima, foi estabelecida uma padronizao de dados, de modo que com a utilizao de apenas uma tabela Veja Anexo
A, seja possvel calcular os parmetros desejados.

Observe a figura 10(a). Imagine uma varivel x que tenha distribuio normal com media aritmtica e desvio padro , pois se trata de uma populao (e no de uma amostra), e o eixo vertical (das freqncias), for deslocado at o ponto , onde se localiza a mdia aritmtica da populao. Esta operao pode ser chamada de mudana de origem, em que o zero mudou de lugar. A nova curva ficou como mostrada na figura 10(b). A frmula de converso passa a ser a seguinte:

Z=
Onde:

Z = varivel normal padronizada = mdia aritmtica da populao = desvio padro da populao x = qualquer valor da varivel aleatria contnua, onde - < x < +
Freqncia

Z
(a) Figura 10 - Converso de X em Z . (b)

Estatstica

51

Assim, usando a frmula de converso, qualquer varivel aleatria normal x pode ser convertida para uma varivel normal padronizada Z . Vejamos um exemplo: O Supervisor de Inspeo de uma fbrica de tubos est interessado em conhecer melhor o tempo que os inspetores levam para a calibrao de um medidor de presso. Aps realizar a pesquisa, ele verificou que o tempo, em minutos, para calibrar o medidor distribudo de maneira normal com mdia aritmtica () de 30 minutos e desvio padro () de 5 minutos. A figura 11 mostra as curvas normais de x e de Z, juntas.

Figura 11 - Transformao da Escala X em Z .

A figura 11 nos mostra que possvel obter uma medida padronizada Z para qualquer medida x, usando a formula de converso acima. Esta nova curva chamada de distribuio normal reduzida ou ainda distribuio normal padronizada. Observe que nesta nova curva, os parmetros mudaram: =0 =1 Estas operaes e esses dados so muito importantes pelo seguinte:

Estatstica

52

As infinitas distribuies normais reduzem-se a apenas uma: x N(;2), ou x N(0; 1), onde:
2 = 0 e 2= = 1 = 1

A varivel Z no tem unidade de medida, ou seja, um nmero puro. Esta notao abreviada, x N(0;1), muito prtica e significa que a varivel x se distribui normalmente (ou tem distribuio normal) e 0 a mdia aritmtica da populao e 1 a unidade de medida, ou seja, o desvio padro. Veja este exemplo. Suponha que um inspetor tenha feita uma calibrao em 45 minutos. Pela figura 12 podemos concluir que este tempo est a uma unidade padronizada (ou seja, a um desvio padro, 1) acima da mdia aritmtica. Veja os clculos utilizando a frmula de converso:

Z=

Z=

substituindo, temos: 45 40 =1 5

Figura 12 - A rea hachurada corresponde a 1 desvio padro (1 ).

e no caso de um inspetor que faa a mesma tarefa em 25 minutos, dizemos que este tempo est a 3 unidades padronizadas (ou seja, 3 desvios padres, 3) abaixo da mdia, pois:

Z=
Estatstica

25 40 = 3 5

53

Vemos assim que o desvio padro se tornou uma unidade de medida. Ou seja: 45 minutos 5 minutos mais demorado (ou seja, 1 desvio padro) do que o tempo mdio de 40 minutos, assim como o tempo de 25 minutos 15 minutos (3 desvios padres) mais rpido do que a mdia observada. A figura 13 nos permite ainda observar mais uma caracterstica da curva normal. Por ser simtrica, a rea total abaixo da curva vale 1, ou seja 100%, entre os limites - < x < + pois todos os resultados caem dentro dela. Os traos verticais perpendiculares ao eixo de x esto graduados em -3, -2, -1, , +1, +2 e +3. Alm disso, a rea coberta por 1, 2, 3 vale, respectivamente, 68,26 %, 95,44 % e 99,74% independente de sua largura.

Figura 13 - Graduao do eixo X. A rea hachurada vale 68,26 % (1).

Estatstica

54

23.5. APLICAES

Vamos agora aprender a usar a tabela de probabilidades (Anexo A). Esta tabela nos permite resolver diversos problemas que envolvem uma varivel x normalmente distribuda. Suponha x com os seguintes parmetros: N(45; 4). Qual ser o valor de Z para

x = 49,5? Aplicando a frmula de converso, temos: Z= x

e, substituindo:

49,5 45 = 2,25 2

Isto significa que Z est 2,25 desvios padres direita da mdia . Agora vamos localizar este valor na tabela do Anexo A. Para consultar este valor preciso decompor Z em duas parcelas, a saber: a) Primeira parcela: parte inteira + a 1 casa decimal = 2,2 b) Segunda parcela: 0,0 + 2 casa decimal = 0,05 Em seguida, localiza-se a primeira parcela (2,2) na margem esquerda da tabela (na vertical) e a segunda parcela (0,05) na margem superior (na horizontal). Ler o valor da clula correspondente ao cruzamento destes valores (0,4878), o qual a probabilidade correspondente rea da curva entre Zero e o Z calculado. A figura 14 mostra a curva desta probabilidade.

Estatstica

55

Figura 14 - Probabilidade calculada para x= 49,5 e N(45/4).

No exemplo anterior, onde a mdia aritmtica da populao = 40, e o desvio padro da populao = 5, e usando a notao N(0;1), temos: N(40;25), x = 45. O Z correspondente foi calculado como sendo 1. A figura 15 ilustra este exemplo.

xN(40;25) x = 45 Z=1

Figura 15 - A rea hachurada mostra a probabilidade para xN(40;25); x = 45; Z =1.

Estatstica

56

23.6. DISTRIBUIO DE AMOSTRAGEM DA MDIA ARITMTICA

A mdia aritmtica a medida de tendncia central mais utilizada. Ela tambm a melhor medida quando se supe que a populao est normalmente distribuda. Do ponto de vista de uma distribuio normal, podemos dizer que a mdia aritmtica possui trs propriedades importantes: a) ausncia de vis b) eficincia c) consistncia. Com respeito primeira propriedade, podemos dizer que a mdia das mdias aritmticas de todas as amostras possveis (de um dado tamanho de amostra n) ser igual mdia aritmtica da populao . Suponha que voc tenha uma populao Beta composta de (N = 5) valores: 1, 2, 3, 4 e 5. Vamos retirar amostras de tamanho n = 2, com reposio e calcular a mdia obtida. Construindo a tabela 8 com a mdia, temos:
SORTEIO NO 1 1 2 3 4 5 1 1 1,5 2 2,5 3 2 1,5 2 2,5 3 3,5 SORTEIO NO 2 3 2 2,5 3 3,5 4 4 2,5 3 3,5 4 4,5 5 3 3,5 4 4,5 5

Tabela 8 - Mdia aritmtica das amostras.

Esta tabela mostra que a mdia uma varivel, pois tambm assumiu valores de 1 a 5. Alm disso, existem grupos de dados em que a mdia ( x ) constante, por exemplo: 1 e 4, 2 e 3, 3 e 2 e 4 e 1, cuja mdia 2,5. Entretanto, verificamos que da populao Beta com 5 elementos, tiramos 25 amostras de tamanho n = 2. Podemos calcular a mdia aritmtica da populao e a mdia das mdias aritmticas ( x ) e comparar os resultados.

Estatstica

57

a) Clculo da mdia aritmtica da populao

N =5; x = 1, 2, 3, 4, 5

x
i =1

1 + 2 + 3 + 4 + 5 15 = =3 5 5

b) Calculo da mdia das mdias aritmticas (amostrais) Amostra A

n =2 (tamanho = 2)
x =1; 1,5;2;2,5;...; 5

Veja os dados na tabela 9.


xi
1 1,5 2 2,5 3 3,5 4 4,5 5 Soma

ni
1 2 3 4 5 4 3 2 1 25

xi * ni
1 3 6 10 15 14 12 9 5 75

Tabela 9 - Calculando a mdia das medias aritmticas.


x=

xn n
i

i i

75 =3 25

c) Comparao entre as mdias da populao e mdia das mdias amostrais Comparando, temos x = .

Estatstica

58

23.7. ERRO PADRO DA MDIA ARITMTICA

As flutuaes das mdias aritmticas so pequenas quando comparadas com as flutuaes dos elementos contidos na populao. Isto decorre diretamente da lei dos grandes
nmeros. A mdia aritmtica de uma determinada amostra comprova a mdia de todos os

valores da amostra. Mesmo em populaes com grandes variaes nos seus elementos, quando estes so usados no clculo da mdia, seus impactos tendem a ser reduzidos, pois no clculo so levados em conta todos os valores contidos na amostra. Quanto maior o nmero de elementos na amostragem, menor ser o efeito dos extremos, tanto acima quanto abaixo da mdia. Esta caracterstica expressa estatisticamente no valor do desvio padro da mdia aritmtica da amostra. Esta a medida de variabilidade da mdia aritmtica de amostra para amostra e chamada de erro padro da mdia
aritmtica, x . Considerando a amostragem com reposio, o erro padro da mdia

definido como sendo o desvio padro da populao dividido pela raiz quadrada do tamanho da amostra n.

x =

Logo, medida que cresce o nmero de elementos (n) na amostra, o erro padro da mdia vai decrescendo a um fator igual raiz quadrada do tamanho da amostra. Quando no conhecemos a varincia (ou o desvio padro) da populao, usamos a frmula:

sx =
onde sx = desvio padro amostral. Neste caso, n 30.

sx n

Estatstica

59

23.8. TEOREMA DO LIMITE CENTRAL

O teorema do Limite Central muito importante, tanto na estatstica como na Comprovao Metrolgica. Seu postulado o seguinte: medida que n cresce, as mdias amostrais vo progressivamente tendendo a uma distribuio limite que a distribuio normal, independentemente do formato da distribuio dos valores individuais na populao. Neste caso, n significa nmero de observaes em cada amostra. Qual deve ser o tamanho da amostra? Como regra geral, se o tamanho da amostra for pelo menos igual a 30, a distribuio de amostras da mdia aritmtica ser muito prxima da normal. Mas se temos alguma informao sobre a populao podemos aplicar o teorema do limite central para tamanhos de populao ainda menores. Se a distribuio da populao for relativamente simtrica, recomenda-se pelo menos 15 elementos, mas se a populao for normal, a distribuio de amostragem da mdia ser normal, independentemente do tamanho da amostra. Do Teorema do Limite Central segue-se que a distribuio de probabilidade da mdia aritmtica q de n observaes qk de uma varivel aleatria q, com expectativa
q

e desvio

padro finito se aproxima de uma distribuio normal com mdia q e desvio padro

/ n quando n , qualquer que possa ser a distribuio de probabilidade de q.

Estatstica

60

24.

DISTRIBUIO UNIFORME (OU RETANGULAR)

Numa distribuio de probabilidade retangular a probabilidade de que um valor de t esteja dentro do intervalo [a - , a + ] igual a 1, para todos os pontos, e a probabilidade de que t esteja fora deste intervalo essencialmente zero. A figura 16 mostra a curva da funo densidade de probabilidade retangular.

Figura 16 - Distribuio retangular.

Como a rea total do retngulo vale 1 (100%), temos que: rea = (a + a) * h = 1

h=
e para a varincia:

1 2a

2 (t ) =
e calculando o desvio padro:

a2 3

a2 a (t ) = = 3 3

Estatstica

61

Por exemplo, as especificaes do fabricante para um voltmetro digital estabelecem que a resoluo do mesmo na faixa de 10 V 0,000 1 V = 100 V. Se o instrumento for usado para medir uma diferena de potencial V, e que a mdia aritmtica de um nmero de observaes repetidas independentes de V encontrada como sendo V = 9,928 571 V. Pode-se calcular a probabilidade de que o valor da diferena de potencial seja tal que a -
V a +, supondo que a resoluo declarada fornece fronteiras simtricas para uma

correo aditiva a V , V , de esperana igual a zero e com igual probabilidade de estar em qualquer parte dentro das fronteiras [a - , a +]. A meia-largura a, mostrada na figura 16, da distribuio retangular simtrica de valores possveis de V , ento,
a = 100/2 V a = 50 V

cuja varincia 2 (t ) =

a2 3

a 2 (50) 2 = = 833,3 V ( V ) = 3 3

( V ) = 833,3 V
a2 a e o desvio padro (t ) = = 3 3

( V ) =

50 a2 a = = = 28,86 28,9 V 3 3 3

( V ) = 28,9 V Outro exemplo, as especificaes do fabricante para um voltmetro digital estabelecem que entre um e dois anos depois que o instrumento calibrado, sua exatido na faixa de 1 V 14 x 10-6 vezes a leitura mais 2 x 10-6 vezes a faixa. Considere que o instrumento usado 20 meses aps a calibrao para medir em sua faixa de 1 V uma diferena de potencial V, e que a mdia aritmtica de um nmero de observaes repetidas independentes de V encontrada como sendo V = 0,928 571 V. Estatstica

62

Baseando-se na especificao do fabricante, pode-se calcular a probabilidade de que o valor da diferena de potencial seja tal que a - V a +, supondo que a exatido declarada fornece fronteiras simtricas para uma correo aditiva a V , V , de esperana igual a zero e com igual probabilidade de estar em qualquer parte dentro das fronteiras [a - , a +]. A meia-largura a, mostrada na figura 17, da distribuio retangular simtrica de valores possveis de V , ento,
a = (14 x 10-6) X (0,928 571 V) + (2 x 10-6) X (1 V) = 15 V, a = 15 V a2 3 a 2 (15) 2 = = 75 V 3 3

cuja varincia 2 (t ) =

( V ) =

( V ) = 75 V e o desvio padro (t ) =
a2 a = 3 3

( V ) =

a2 a 15 = = = 8,66 8,7 V 3 3 3

( V ) = 8,7 V

25.

DISTRIBUIO TRIANGULAR

Acabamos de ver que no caso da distribuio retangular, por no haver conhecimento especfico sobre os possveis valores de xi dentro de seus limites estimados [a - , a
+

] foi

considerado que somente se poderia supor que seria igualmente provvel, para xi, tomar qualquer valor entre esses limites, com probabilidade zero de estar fora deles. Em muitos casos, mais realista esperar que valores perto dos limites sejam menos provveis do que os que estejam perto do ponto mdio. , ento razovel substituir a distribuio retangular simtrica, por uma distribuio trapezoidal simtrica, tendo lados inclinados iguais (um trapezide issceles), uma base de largura a + - a - = 2a e um topo de largura 2a, Onde 0 1. Estatstica

63

Na medida em que 1, esta distribuio trapezoidal se aproxima da distribuio retangular, vista anteriormente, enquanto que, para = 0, torna-se uma distribuio triangular. Numa distribuio de probabilidade triangular a probabilidade de que um valor de t esteja dentro do intervalo [a - , a + ] igual a 1, para todos os pontos, e a probabilidade de que t esteja fora deste intervalo essencialmente zero. A figura 17 mostra a curva da funo densidade de probabilidade triangular.

Figura 17 - Distribuio triangular

Como a rea total do tringulo vale 1 (100%), temos que: rea = b * h (a + a ) * h = =1 2 2 h= 2 1 = 2a a

a2 e para a varincia: (t ) = 6
2

Estatstica

64

e calculando o desvio padro: (t ) =

a2 a = 6 6

Por exemplo, suponha que se disponha poucas informaes sobre uma medio, a no ser estas: Resultado das n = 20 medies, mdia aritmtica t = 200 psi e que t descrito como uma distribuio triangular de limite inferior, a superior a
+ + -

= 194 psi, e de mesmo limite

= 206 psi. Logo, a meia-largura a = [a - a ]/2 = (206-194)/2 = 12/2 = 6 psi.

A funo densidade de probabilidade de t , ento: p(t) = (t - a - )/a2, p(t) = (a + - t )/a2, p(t) = 0 Logo, p(t) = (t - a - )/a2 = (200-194)/36 = 0,1666... p(t) = 0,1666... A figura 18 Ilustra graficamente a probabilidade triangular para o exemplo dado. A esperana de t = [a + + a - ]/2 = (206 +194)/2 = 200 Co. para a - t (a + + a - )/2 para (a + + a - )/2 t a + para outros valores de t

Figura 18 - Ilustrao grfica da probabilidade triangular para o exemplo dado.

Estatstica

65

26.

DISTRIBUIO T (STUDENT)

Pelo que vimos at agora, se n 30, podemos usar a distribuio normal na estimao da mdia da populao mesmo no conhecendo bem a populao. Para n < 30 somente se a populao for normalmente distribuda e se for conhecido. A distribuio t de Student utilizada quando a varivel x normalmente distribuda mas o no for conhecido. Se uma populao normalmente distribuda, a distribuio de amostragem da mdia, para qualquer tamanho de amostra, ser tambm normalmente distribuda. Isto verdade, quer seja conhecido, quer no. Contudo, no processo de inferncia, cada valor da mdia convertido para um valor normal padronizado. A frmula :
t= x sx n

Onde,
x = mdia aritmtica de uma amostra (pequena, n < 30)

= mdia aritmtica (presumida) da populao medida que aumenta o tamanho da amostra (n), a distribuio t aproxima-se da forma da distribuio normal, ou seja, a distribuio t pode ser aproximada pela distribuio normal quando n 30, para uma nica amostra. Isso acontece porque, medida que o tamanho da amostra fica maior, sx se torna uma melhor estimativa de . Os valores de t para os graus apropriados de liberdade podem ser obtidos a partir da
Tabela 10 Tabela t (resumida) da distribuio t. A parte superior de cada coluna da

tabela t indica a rea na cauda direita da distribuio t (como so fornecidas entradas positivas para t, os valores referem-se cauda superior) cada linha representa o valor t especfico para cada grau de liberdade determinado. Exemplo: com 40 graus de liberdade e 95% de confiana, a cauda seria 1-/2, ou seja, para 95% de confiana significa que sobrariam 5 % para as duas caudas, ou 2,5 % para cada cauda.

Estatstica

66

Como normalmente estes valores vem dividido por 100, temos 2,5/100 = 0,025. No cruzamento da linha de 40 graus de liberdade com a coluna 0,025 encontramos o valor de t = 2,0211. Uma vez que t uma distribuio simtrica, com uma mdia aritmtica 0, se o valor da cauda superior + 2,0211, o valor da cauda inferior ser -2,0211. Um valor de t = 2,0211 significa que a probabilidade de t exceder a + 2,0211 igual a 0,025 ou 2,5%, conforme ilustrado na figura 20. Aparentemente, a distribuio t muito parecida com a distribuio normal. Ambas tm curvas em formato de sino e so simtricas. A distribuio t tem maior rea nas caudas e menor rea do centro do que a distribuio normal. Isto se deve pelo fato de que desconhecido e utiliza-se s para fazer sua estimativa. Como no estamos certos quanto ao valor de , os valores de t sero mais variveis do que aqueles referentes a Z . Notas: a) O uso da estatstica t pressupe que a varivel tenha na populao de onde foi retirada uma distribuio normal. b) medida que n cresce, t tende a Z , principalmente quando n > 30 c) No existe uma nica distribuio t, mas uma famlia, ou seja, para cada n existe uma distribuio e uma curva especfica.

Figura 19 - Distribuio t para 40 graus de liberdade.

Estatstica

67

27.

GRAUS DE LIBERDADE

Os estatsticos chamam a expresso n 1 de graus de liberdade. Quando calculamos a mdia, x , utilizamos todos os n dados que compem a amostra. Dizemos ento que no clculo da mdia temos n valores de xi livres que devem ser considerados para podermos calcular o valor desta estatstica. Ou seja, se qualquer dos valores de xi livres da amostra for desconhecido, no poderemos determinar o valor desta estatstica, pois todos os valores da amostra so livres, podendo variar aleatoriamente. Por outro lado, a estatstica da varincia por usar a mdia, x , ao invs do parmetro populacional , tem um grau de liberdade a menos. Isso ocorre porque o clculo dessa estatstica pressupe que anteriormente j se tenha usado todos os valores da amostra no clculo da mdia, x , os quais estariam sendo usados uma segunda vez no clculo da varincia. Ou seja, ao usarmos o mesmo conjunto de dados para determinar a mdia, x , e a varincia que faz uso do valor da mdia, perdemos um grau de liberdade para a determinao da mdia.

28.

INTERVALO DE CONFIANA

Na verdade, nunca conhecemos o valor exato da mdia, , de uma populao de dados porque seria necessrio um nmero infinito de medies. Entretanto, a teoria estatstica permite estabelecer limites em torno da mdia obtida de uma amostra, x , e ento a mdia verdadeira, , cai dentro destes limites com um dado grau de probabilidade. A esses limites chamamos de limites de confiana e o intervalo que eles definem chamado de intervalo de confiana. O tamanho do intervalo de confiana, o qual derivado do desvio padro da amostra, depende da certeza com que o desvio padro, , conhecido. Se h uma razo para acreditar que o desvio padro amostral, sx , uma boa aproximao de , ento o intervalo de confiana pode ser significativamente mais estreito do que o intervalo para baseado em apenas duas ou trs medies.

Estatstica

68

A estimativa do intervalo de confiana comumente usada para fazer afirmaes de probabilidade acerca de amostras retiradas de populao ou para prever os resultados de uma futura amostra da mesma populao. Um mtodo comum determinar os limites de confiana para um parmetro, de modo que se possa ter um determinado grau de confiana de que o parmetro est dentro deste intervalo. Por exemplo: se for determinado um limite de confiana de 95 %, ento, em longo prazo a mdia verdadeira (mdia das mdias) da populao ir cair dentro dos limites em 95% das vezes em que for medida. Os limites de confiana definem um intervalo em torno da mdia da amostra que provavelmente contem a mdia da populao total. O intervalo de confiana da mdia d os limites que podem ser reclamados, com um grau de confiana dado por (1-)%, para conter o valor desconhecido da mdia da populao. Quando o desvio padro da populao, , conhecido, o intervalo simtrico vale:
x z / 2

< < x + z /2

Quando o desvio padro da populao, , no conhecido, mas se tem o desvio da amostra, sx , usamos a distribuio t, com n-1 graus de liberdade.
x t /2 s sx < < x + t /2 x n n

Onde,
t / 2 = coeficiente de confiana, obtido na tabela x, a partir do grau de liberdade

() e do nvel de significncia () desejado. O grau de liberdade () dado por n-1, onde n o nmero de dados da amostra (medies). O nvel de significncia () igual a um menos o coeficiente de confiana, que multiplicado por 100, d o intervalo de confiana (em %). Exemplo: Para 95% de confiana, significa que se admite que 5% dos valores podem estar fora do intervalo de confiana. Como na tabela t estes valores esto em probabilidade (0 a 1), logo 5% valem 0,05, ento = 0,05, ou seja: 1- ) = 0,95 que corresponde a 95%.

Estatstica

69

Para n = 2 temos n-1 grau de liberdade ( = n-1). Ento se voc consultar a tabela 9 da distribuio t ver que t / 2 vale 12,71 para 95% de confiana, quando se faz apenas 2 medies. E t / 2 vale 4,30 e 3,18 quando se faz 3 e 4 medies respectivamente. Isto significa uma reduo do intervalo de confiana de cerca de 12,71/3,18 = 3,9968 4 vezes, quando se opta por fazer quatro medies ao invs de duas medies. A rpida melhoria na confiabilidade de sx quando n aumenta sugere que se deva fazer muitas medies, quando isso no consumir tempo excessivo e houver amostras disponveis.
= (n-1) 1 2 3 4 5 6 7 8 9 10 15 20 30 60 00

= 0,20
3,08 1,89 1,64 1,53 1,48 1,44 1,42 1,40 1,38 1,37 1,34 1,32 1,31 1,30 1,29

= 0,10
6,31 2,92 2,35 2,13 2,02 1,94 1,90 1,86 1,83 1,81 1,75 1,72 1,70 1,67 1,64

= 0,05
12,71 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,13 2,09 2,04 2,00 1,96

= 0,01
63,66 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 2,95 2,84 2,75 2,66 2,58

= (n-1), grau de liberdade = (1 - intervalo de confiana)


Tabela 10 - Tabela t (resumida).

Estatstica

70

29.

EXERCCIOS DE ESTATSTICA
Estatstica Bsica

1. As fichas de 60 alunos da 2. Srie de uma escola pblica esto arquivados em ordem alfabtica. Qual a maneira mais rpida de amostrar um dcimo dos alunos 2. Uma amostra no-probalstica pode ser: a) amostra de julgamento; amostra por quota; fatia b) amostra de julgamento; fatia, amostra cheia c) amostra por quota; fatia amostra cheia d) amostra de julgamento; amostra por quota, amostra cheia 3. Amostra probabilstica pode ser: a) amostra aleatria simples; por cota; amostra sistemtica; amostra de julgamento b) amostra por quota; amostra sistemtica; amostra estratificada; amostra cheia c) amostra aleatria simples; amostra sistemtica; amostra estratificada; amostra de convenincia (grupo). d) amostra por cota; amostra sistemtica; amostra estratificada; amostra cheia 4. Numa amostragem simples, a) os elementos so divididos em grupos e sorteado um grupo que deve fornecer a amostra b) os elementos so retirados ao acaso da populao c) os elementos so classificados por ordem de grandeza e em seguida so escolhidos 2 de cada extremo da lista. d) Todos os elementos da populao so escolhidos. 5. Na anlise dos dados de uma distribuio de freqncias h quatro parmetros importantes: a) mdia, tendncia central, disperso e desvio b) mdia, disperso, desvio e curtose c) tendncia central, disperso, desvio e curtose d) disperso, mdia, desvio e curtose

Estatstica

71

6. Disperso a caracterstica que indica: a) o grau de espalhamento dos dados. b) o grau de distoro em uma curva c) o pico em uma distribuio d) a mdia aritmtica dos dados 7. Se os pesos das notas forem p1 = 2, p2 = 4 , p3 = 1 e p4 = 3, a mdia ponderada de 8, 10, 6 e 7 : a) 7,25 b) 8,3 c) 16,155 d) 7,75 8. A mdia harmnica dos nmeros 8, 9, 10 e 11 ? a) 9,4 b) 9,5 c) 9,555 d) 9,367 9. A mediana dos nmeros 100, 20, 70, 40 e 60 ? a) 58 b) 59 c) 60 d) 70 10. A mediana dos nmeros 4, 8, 6, 5, 10 e 7 ? a) 6.666 b) 6,5 c) 7 d) 7,5 11. A moda dos nmeros 5, 7, 6, 6, 7, 8, 9, 10, 5, 7 ? e) 5 f) 6 g) 10 h) 7 Estatstica

72

12. A amplitude dos nmeros 5, 7, 6, 6, 7, 8, 9, 10, 5, 7 ? a) 5 b) 6 c) 7 d) 8 13. A varincia dos nmeros 8, 6, 7 e 9 : a) 7,5 b) 1,118 c) 5,477 d) 1,29 14. O desvio padro de 8, 6, 7 e 9 ? a) 1,136 b) 2,340 c) 1,057 d) 2,739 15. Dados a mdia = 5 e a varincia = 3,2, calcular o coeficiente de variao. a) 64 % b) 156,25 % c) 35,78 % d) 69,88 %

Estatstica

73

Probabilidades

16. As distribuies abaixo so distribuies discretas: a) distribuio binomial e de Poisson b) distribuio de Poisson e distribuio triangular c) distribuio retangular e distribuio triangular d) distribuio uniforme e distribuio t 17. Qual a probabilidade de sair a face 5 ao lanar um dado uma vez? a) 5 b) 1.333 c) 1,6666 d) 2 18. Qual a probabilidade de sair face impar numa nica jogada? a) 1,333 b) 0,5 c) 1,666 d) 3 19. Jogando-se uma moeda duas vezes, qual a probabilidade de ocorrer cara nas duas jogadas? a) 1,333 b) 1,666 c) 0,25 d) 2 20. Numa urna tem 3 bolas: duas brancas e uma vermelha. Retirando-se ao acaso, uma bola e em seguida a outra (sem que a primeira tenha sido recolocada na urna), qual a probabilidade de que as duas bolas sejam brancas? a) 0,5 b) 1,3333 c) 1,6666 d) 0,3333

Estatstica

74

Distribuio Binomial

21. Jogando um dado 3 vezes, qual a probabilidade de se obterem exatamente 2 faces 5? a) 6,94% b) 10,94 % c) 12,333 % d) 1,666 % 22. Jogando uma moeda quatro vezes, quais so as chances de se obter duas caras? a) 23/16 b) 2/3 c) 11/16 d) 15/32
Distribuio de Poisson

23. Se um telefone recebe em mdia duas chamadas por hora, qual a probabilidade deste telefone no receber nenhuma chamada em uma hora? a) 0,15 b) 0,1353 c) 0,2325 d) 0,4 24. Qual a probabilidade do telefone acima receber no mximo duas chamadas em 30 minutos? a) 0,9197 b) 0,8133 c) 0,3333 d) 0,7156 25. Os parmetros da distribuio normal so: a) e x b) 2 e s2 c) e 2 d) s2 e

Estatstica

75

26. Numa fbrica, o tempo mdio para fabricar um eixo de 35 minutos (distribuio normal), com desvio padro de 5 minutos. Qual a probabilidade de um trabalhador escolhido aleatoriamente fabricar um eixo em menos de 25 minutos? Consultar a tabela de distribuio normal padronizada (Anexo A). a) 0,4772 b) 0,0228 c) 0,0456 d) 0,73,47 27. Usando os dados do problema anterior, qual seria a probabilidade de que um trabalhador possa concluir o eixo entre 18 e 22 minutos? a) 0,2345 b) 0,0482 c) 0,4735 d) 0,1935
Erro Padro da Mdia Aritmtica

28. Suponha que uma empacotadora esteja ajustada para encher pacotes de caf de 400 gramas. Dados anteriores confirmam uma distribuio normal, com mdia aritmtica de 400 gramas. O desvio padro da populao conhecido como sendo igual a 12 gramas. Qual o erro padro da mdia aritmtica para uma amostra de 8 pacotes? a) 1,50 b) 4,24 c) 4,35 d) 1,48

Estatstica

76

29. Suponha que uma empacotadora esteja ajustada para encher pacotes de caf de 400 gramas. Dados anteriores confirmam uma distribuio normal, com mdia aritmtica de 400 gramas. O desvio padro da populao conhecido como sendo igual a 12 gramas. Qual a probabilidade percentual de que uma amostra de 15 pacotes, escolhida aleatoriamente das centenas de pacotes, tenha uma mdia entre 380 e 390 gramas? a) 40,15 % b) 45,50 % c) 12,93 % d) 10,25 % 30. Considerando os dados do problema anterior, qual a probabilidade percentual de que os pacotes tenham entre 396 e 400 gramas? a) 46 % b) 44,97 % c) 13,35 % d) 12,93 % 31. O certificado de calibrao de um peso padro de referncia fornece o valor de 1kg, com incerteza de 5 mg, para um fator de abrangncia k = 2. Consultando o histrico de um peso padro de valor nominal de 1 kg foi possvel estimar a deriva do seu valor, entre duas calibraes, como sendo 1,5 mg. Considerando esta deriva como uma funo de distribuio retangular, qual o valor da funo de densidade de probabilidade? a) 0,3000 mg b) 0,3333 mg c) 3,3333 mg d) 0,8660 mg 32. Considerando os dados do exerccio anterior, qual a varincia da deriva? a) 1,2990 mg b) 0,70 mg c) 0,75 mg d) 3 mg

Estatstica

77

33. Supondo haver pouca informao sobre os dados, exceto que se trata de uma distribuio triangular e que a melhor estimativa de t seja 300 oC, com os valores limites de a - = a + = 4 oC. Qual seria a funo densidade de probabilidade de t? a) 0,25 oC b) 0,30 oC c) 2,256 oC d) 2,828 oC 34. Considerando os dados do exerccio anterior, qual a varincia desta funo? a) 2,555 oC b) 2 oC c) 16 oC d) 2,666 oC 35. Para uma distribuio t de Student, qual o valor crtico de t para (1- ) = 0,95 e n = 10? a) 2,26 b) 2,22 c) 2,82 d) 1,83
Intervalo de Confiana

36. Sabe-se, pelas especificaes do fabricante, que o desvio padro da quantidade de leo de soja nas latas de 1 litro igual a 0,02 litros. Uma amostra aleatria de 50 latas selecionada e a quantidade mdia de leo por lata de l litro igual a 0,995 litros. Calcular o intervalo de confiana de 99 % da verdadeira mdia da populao da quantidade de leo de soja contida em uma lata de 1 litro. a) 0,9877 1,0023 b) 0,9834 1,0065 c) 0,9945 1,0123 d) 0,9845 1,0043

Estatstica

78

37. Um novo suco de pssego testado para o mercado durante 3 meses, em filiais de uma grande cadeira de supermercados. Os resultados para uma amostra de 21 filiais indicam vendas mdias de R$ 8.600,00 com um desvio padro da amostra de R$ 240,00. Calcular o intervalo de confiana para 99 % de vendas desse novo suco. a) 8.460,89 8.739,11 b) 8.464,89 8.735,11 c) 8.467,60 8.732,40 d) 8.450,99 8.749,01

30.

RESPOSTAS DOS EXERCCIOS DE ESTATSTICA


Estatstica Bsica

1. Resposta: Escolher como amostra uma ficha em cada 6, por exemplo, o 6 , o 12, o 18, etc. 2. Resposta: letra A. 3. Resposta: letra C 4. Reposta: letra B 5. Resposta: letra C 6. Resposta: letra A 7. Reposta: letra B 8. Resposta: letra D 9. Resposta: letra C 10. Resposta: letra B 11. Resposta: letra D 12. Resposta: letra A 13. Resposta: Letra D 14. Resposta: letra A 15. Resposta: letra C

Estatstica

79

Probabilidades

16. Resposta: letra A 17. Resposta: letra C 18. Resposta: letra B 19. Resposta: letra C 20. Resposta: letra D
Distribuio Binomial

21. Resposta: letra A 22. Resposta: letra C


Distribuio de Poisson

23. Resposta: letra B 24. Resposta: letra A 25. Resposta: letra C 26. Resposta: letra B 27. Reposta letra D
Erro Padro da Mdia Aritmtica

28. Resposta: letra B 29. Resposta: letra A. 30. Resposta: letra D 31. Resposta: letra B 32. Resposta: letra C 33. Resposta: letra A 34. Resposta: letra D 35. Resposta: letra A
Intervalo de Confiana

36. Resposta: letra A 37. Resposta: letra Dom

Estatstica

80

Anexo A Tabela de Distribuio Normal Padronizada

Estatstica

Anda mungkin juga menyukai