Anda di halaman 1dari 32

FSBA Faculdade Social da Bahia Estatstica Aplicada

ROTEIRO DE LEITURA
CONSIDERAES INICIAIS O levantamento e registro de dados so feitos desde as civilizaes mais antigas com o objetivo de recolherem impostos e recenseamento, de modo geral. Na Idade Mdia, a Igreja mantinha registros de nascimentos, casamentos e mortes e tambm no perodo colonial. Nos Estados Unidos, a Constituio de 1790 exigia um censo a cada 10 anos. No Brasil isso acontece com a mesma periodicidade. Mais adiante, com a evoluo do mtodo, surgiram a representao grfica e o estudo das probabilidades. A partir de ento, a estatstica passa a se tornar o estudo de chegar a concluses sobre o todo, a partir de partes desse todo, as amostras. SEC. XVIII: a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as primeiras representaes grficas e os clculos de probabilidades. A estatstica deixa de ser uma simples tabulao de dados numricos para se tornar O estudo de como se chegar concluso sobre uma populao, partindo da observao de partes dessa populao (amostra)". A ESTATSTICA uma parte da matemtica aplicada que fornece mtodos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A coleta, a organizao, a descrio dos dados, o clculo e a interpretao de coeficientes pertencem ESTATSTICA DESCRITIVA, enquanto a anlise e a interpretao dos dados, associada a uma margem de incerteza, ficam a cargo da ESTATSTICA INDUTIVA ou INFERENCIAL, tambm chamada como a medida da incerteza ou mtodos que se fundamentam na teoria da probabilidade. ESTATSTICA = Cincia dos dados (vem do latim Status = Estado); ramo da matemtica aplicada. Investigao dos processos de obteno, organizao e anlise de dados sobre uma populao ou uma coleo de seres quaisquer, e dos mtodos de tirar concluses e fazer predies com base nesses dados. Conjunto de elementos numricos sobre um fato social. MTODO ESTATSTICO MTODO: um meio mais eficaz para atingir determinada meta. MTODOS CIENTFICOS: destacamos o mtodo experimental e o mtodo estatstico. MTODO EXPERIMENTAL: Consiste em manter constante todas as variveis, menos uma que sofre variao, para se observar seus efeitos, caso existam. Ex: Estudos da Qumica, Fsica, etc. MTODO ESTATSTICO: Diante da impossibilidade de manter as variveis constantes (nas cincias sociais), admitem-se todas essas variveis presentes e variando, registrando-se essas

FSBA Faculdade Social da Bahia Estatstica Aplicada variaes e procurando determinar no resultado final, que influncias cabem a cada uma delas. Ex: Quais as causas que definem o preo de uma mercadoria quando a sua oferta diminui? Seria impossvel, no momento da pesquisa, manter constantes a uniformidade dos salrios, o gosto dos consumidores, nvel geral de preos de outros produtos, etc. FASES DO MTODO ESTATSTICO 1 - DEFINIO DO PROBLEMA: Saber exatamente aquilo que se pretende pesquisar o mesmo que definir corretamente o problema. 2 - PLANEJAMENTO: Como levantar informaes? Que dados devero ser obtidos? Qual levantamento a ser utilizado? Censitrio? Por amostragem? E o cronograma de atividades? Os custos envolvidos? Etc. 3 - COLETA DE DADOS: Fase operacional. o registro sistemtico de dados, com um objetivo determinado. Dados primrios: quando so publicados pela prpria pessoa ou organizao que os haja recolhido. Ex: tabelas do censo demogrfico do IBGE. Dados secundrios: quando so publicados pro outra organizao. Ex: quando determinado jornal publica estatsticas referentes ao censo demogrfico extradas do IBGE. OBS: mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz o grande risco de erros de transcrio. Coleta Direta: quando obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferncia dos consumidores pela sua marca. A coleta direta pode ser: contnua (registros de nascimento, bitos, casamentos, etc.), peridica (recenseamento demogrfico, censo industrial) e ocasional (registro de casos de dengue). Coleta Indireta: feita por dedues a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliao, indcios ou proporcionalizao. 4 - APURAO DOS DADOS: Resumo dos dados atravs de sua contagem e agrupamento. a condensao e tabulao de dados. 5 - APRESENTAO DOS DADOS: H duas formas de apresentao, que no se excluem mutuamente. A apresentao tabular, ou seja, uma apresentao numrica dos dados em linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de Estatstica. A apresentao grfica dos dados numricos constitui uma apresentao geomtrica permitindo uma viso rpida e clara do fenmeno. 6 - ANLISE E INTERPRETAO DOS DADOS: A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o fenmeno (estatstica descritiva). Na estatstica indutiva a interpretao dos dados se fundamenta na teoria da probabilidade.

FSBA Faculdade Social da Bahia Estatstica Aplicada

DEFINIES BSICAS DA ESTATSTICA FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudo seja possvel da aplicao do mtodo estatstico. So divididos em trs grupos: Fenmenos de massa ou coletivo: so aqueles que no podem ser definidos por uma simples observao. A estatstica dedica-se ao estudo desses fenmenos. Ex: A natalidade na RMS, O preo mdio da cesta bsica, etc. Fenmenos individuais: so aqueles que iro compor os fenmenos de massa. Ex: cada nascimento na RMS, cada preo de cesta bsica, etc. Fenmenos de multido: quando as caractersticas observadas para a massa no se verificam para o particular. DADO ESTATSTICO: um dado numrico, considerado a matria-prima sobre a qual aplicamos os mtodos estatsticos. POPULAO: o conjunto total de elementos portadores de, pelo menos, uma caracterstica comum. AMOSTRA: uma parcela representativa da populao que examinada com o propsito de tirarmos concluses sobre a essa populao. PARMETROS: So valores singulares que existem na populao e que servem para caracteriz-la.Para definirmos um parmetro devemos examinar toda a populao.Ex: Os alunos da FSBA tm em mdia 1,70 metros de estatura. ESTIMATIVA: um valor aproximado do parmetro, calculado com o uso da amostra. ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, o levantamento e os estudos necessrios ao tratamento desses dados so designados genericamente de estatstica de atributo. Exemplo de classificao dicotmica do atributo: A classificao dos alunos da FSBA quanto ao sexo. atributo: sexo..........................classe: alunos da FSBA dicotomia: duas subclasses ( masculino e feminino) Exemplo de classificao policotmica do atributo: Alunos da FSBA quanto ao estado civil. atributo: estado civil...............classe: alunos da FSBA Mais de duas subclasses ( solteiro, casado, divorciado, vivo, etc.). VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno.

FSBA Faculdade Social da Bahia Estatstica Aplicada VARIVEL QUALITATIVA: Quando os valores so expressos por atributos: sexo, cor da pele, etc. VARIVEL QUANTITATIVA: Quando os dados so de carter quantitativo e o conjunto dos resultados possui uma estrutura numrica, trata-se, portanto da estatstica de varivel e se dividem em: VARIVEL DISCRETA OU DESCONTNUA: Seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente de contagens.Ex: N de alunos presentes s aulas de estatstica aplicada no 1 semestre de 2005: mar = 18, abr = 30, mai = 35, jun = 36. VARIVEL CONTNUA: Resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex: Quando voc vai medir a temperatura de seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura atual do seu corpo. EXERCCIO - Classifique as variveis em qualitativas ou quantitativas (contnuas ou discretas): . Cor dos olhos das alunas... Resp: qualitativa . ndice de liquidez nas indstrias baianas... Resp: quantitativa contnua . Produo de caf no Brasil... Resp: quantitativa contnua . Nmero de defeitos em aparelhos de TV... Resp: quantitativa discreta . Comprimento dos pregos produzidos por uma empresa... Resp: quantitativa contnua . O ponto obtido em cada jogada de um dado... Resp: quantitativa discreta AMOSTRAGEM MTODOS PROBABILSTICOS Exige que cada elemento da populao possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da populao, a probabilidade de cada elemento ser 1/N. trata-se do mtodo que garante cientificamente a aplicao das tcnicas estatsticas de inferncias. Somente com base em amostragens probabilsticas que se podem realizar inferncias ou indues sobre a populao a partir do conhecimento da amostra. uma tcnica especial para recolher amostras, que garantem, tanto quanto possvel, o acaso na escolha. AMOSTRAGEM CASUAL OU ALEATRIA SIMPLES:

FSBA Faculdade Social da Bahia Estatstica Aplicada o processo mais elementar e freqentemente utilizado. equivalente a um sorteio lotrico. Pode ser realizada numerando-se a populao de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa seqncia, os quais correspondero aos elementos pertencentes amostra. Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1 - numeramos os alunos de 1 a 90. 2 - escrevemos os nmeros dos alunos, de 1 a 90, em pedaos iguais de papel, colocamos na urna e aps mistura retiramos, um a um, nove nmeros que formaro a amostra. OBS: quando o nmero de elementos da amostra muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de nmeros aleatrios, construda de modo que os algarismos de 0 a 9 so distribudos ao acaso nas linhas e colunas. .AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: Quando a populao se divide em estratos (sub-populaes), convm que o sorteio dos elementos da amostra leve em considerao tais estratos, da obtemos os elementos da amostra proporcional ao nmero de elementos desses estratos. Exemplo: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. So, portanto, dois estratos (sexo masculino e sexo feminino). Logo, temos: SEXO POPULACO 10 % AMOSTRA MASC. 54 5,4 5 FEMIN. 36 3,6 4 Total 90 9,0 9 Numeramos ento os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos ao sorteio casual com urna ou tabela de nmeros aleatrios. AMOSTRAGEM SISTEMTICA: Quando os elementos da populao j se acham ordenados, no h necessidade de construir o sistema de referncia. So exemplos os pronturios mdicos de um hospital, os prdios de uma rua, etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. Exemplo: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinio. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18 escolhemos por sorteio casual um nmero de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o nmero sorteado fosse 4 a amostra seria: 4 casa, 22 casa, 40 casa, 58 casa, 76 casa, etc.

FSBA Faculdade Social da Bahia Estatstica Aplicada MTODOS NO PROBABILSITCOS So amostragens em que h uma escolha deliberada dos elementos da amostra. No possvel generalizar os resultados das pesquisas para a populao, pois as amostras no-probabilsticas no garantem a representatividade da populao. AMOSTRAGEM ACIDENTAL Trata-se de uma amostra formada por aqueles elementos que vo aparecendo, que so possveis de se obter at completar o nmero de elementos da amostra. Geralmente utilizada em pesquisas de opinio, em que os entrevistados so acidentalmente escolhidos. Exemplos: Pesquisas de opinio em praas pblicas, ruas movimentadas de grandes cidades etc. AMOSTRAGEM INTENCIONAL De acordo com determinado critrio, escolhido intencionalmente um grupo de elementos que iro compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinio. Exemplo: Numa pesquisa sobre preferncia por determinado cosmtico, o pesquisador se dirige a um grande salo de beleza e entrevista as pessoas que ali se encontram. EXERCCIOS: 1- Uma escola de 1 grau abriga 124 alunos. Obtenha uma amostra representativa correspondente a 15% da populao, utilizando a partir do incio da 5 linha da Tabela de nmeros aleatrios. 2- Tenho 80 lmpadas numeradas numa caixa. Como obtemos uma amostra de 12 lmpadas? 3- Uma populao encontra-se dividida em trs estratos, com tamanhos, respectivamente, n1= 40, n2= 100 e n3= 60. Sabendo que, ao realizar uma amostragem estratificada proporcional, 9 elementos da amostra foram retirados do 3 estrato, determine o nmero de elementos da amostra. 4- Mostre como seria possvel retirar uma amostra de 32 elementos de uma populao ordenada formada por 2.432 elementos. Na ordenao geral, qual dos elementos abaixo seria escolhido para pertencer amostra, sabendo-se que o elemento 1.420 a ela pertence? 1.648 , 290, 725, 2.025 ou 1.120. SRIES ESTATSTICAS TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemtica. De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar:

um trao horizontal ( - ) quando o valor zero;

FSBA Faculdade Social da Bahia Estatstica Aplicada


trs pontos (... ) quando no temos os dados; zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogao (? ) quando temos dvida quanto exatido de determinado valor.

Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. SRIE ESTATSTICA: qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, do local ou da espcie. DISTRIBUIO DE FREQUNCIA um tipo de tabela que condensa uma coleo de dados conforme as freqncias (repeties de seus valores). Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir de dados no ordenados. Ex: 45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51. ROL: a tabela obtida aps a ordenao dos dados (crescente ou decrescente). Ex: 41, 41, 41, 42, 42 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60. Distribuio de frequncia sem intervalos de classe: a simples condensao dos dados conforme as repeties de seu valores. Para um ROL de tamanho razovel esta distribuio de frequncia inconveniente, j que exige muito espao. Veja exemplo abaixo: Dados Frequncia 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2

FSBA Faculdade Social da Bahia Estatstica Aplicada Total 20

Distribuio de frequncia com intervalos de classe: Quando o tamanho da amostra elevado mais racional efetuar o agrupamento dos valores em vrios intervalos de classe. Classes Freqncias

41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20

ELEMENTOS DE UMA DISTRIBUIO DE FREQUNCIA (com intervalos de classe): CLASSE: so os intervalos de variao da varivel e simbolizada por i e o nmero total de classes simbolizada por k. Ex: na tabela anterior k=5 e 49 |------- 53 a 3 classe, onde i=3. LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limite inferior de classe (li) e o maior nmero, limite superior de classe(Li). Ex: em 49 |------- 53... l3= 49 e L3= 53. O smbolo |------- representa um intervalo fechado esquerda e aberto direita. O dado 53 do ROL no pertence classe 3 e sim a classe 4 representada por 53 |------- 57. AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da diferena entre o limite superior e inferior da classe e simbolizada por hi = Li - li. Ex: na tabela anterior hi= 53 - 49 = 4. Obs: Na distribuio de frequncia c/ classe o hi ser igual em todas as classes. AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 61 - 41= 20. AMPLITUDE TOTAL DA AMOSTRA (ROL): a diferena entre o valor mximo e o valor mnimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 60 - 41 = 19. Obs: AT sempre ser maior que AA. PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partes iguais. .......Ex: em 49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja, x3=(l3+L3)/2. MTODO PRTICO PARA CONSTRUO DE UMA DIST. DE FREQUNCIAS C/ CLASSE: 1 - Organize os dados brutos em um ROL. 2 - Calcule a amplitude amostral AA.

FSBA Faculdade Social da Bahia Estatstica Aplicada No nosso esmolo: AA =60 - 41 =19 3 - Calcule o nmero de classes atravs da "Regra de Sturges": n 3 |-----| 5 6 |-----| 11 12 |-----| 22 23 |-----| 46 47 |-----| 90 i= n de classes 3 4 5 6 7

91 |-----| 181 8 182 |-----| 362 9 Obs: Qualquer regra para determinao do n de classes da tabela no nos levam a uma deciso final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado natureza dos dados. No nosso exemplo: n = 20 dados, ento, a princpio, a regra sugere a adoo de 5 classes. 4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe h > AA/i. No nosso exemplo: AA/i = 19/5 = 3,8. Obs: Como h > AA/i um valor ligeiramente superior para haver folga na ltima classe. Utilizaremos ento h = 4 5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes com frequncia = 0 (zero). No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a primeira classe ser representada por ...... 41 |------- 45. As classes seguintes respeitaro o mesmo procedimento. O primeiro elemento das classes seguintes sempre sero formadas pelo ltimo elemento da classe anterior.

REPRESENTAO GRFICA DE UMA DISTRIBUIO .Histograma, Polgono de frequncia e Polgono de frequncia acumulada. Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as frequncias. . Histograma: formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios

FSBA Faculdade Social da Bahia Estatstica Aplicada dos intervalos de classe. A rea de um histograma proporcional soma das frequncias simples ou absolutas. Frequncias simples ou absolutas: so os valores que realmente representam o nmero de dados de cada classe. A soma das frequncias simples igual ao nmero total dos dados da distribuio. Frequncias relativas: so os valores das razes entre as frequncias absolutas de cada classe e a frequncia total da distribuio. A soma das frequncias relativas igual a 1 (100 %). .MEDIDAS DE POSIO Introduo So as estatsticas que representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixo horizontal do grfico da curva de frequncia. As medidas de posies mais importantes so as medidas de tendncia central ou promdias (verifica-se uma tendncia dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana. Outros promdios menos usados so as mdias: geomtrica, harmnica, quadrtica, cbica e biquadrtica. As outras medidas de posio so as separatrizes, que englobam: a prpria mediana, os decis, os quartis e os percentis. MDIA ARITMTICA igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores. ......onde xi so os valores da varivel e n o nmero de valores. . Dados no-agrupados: Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de frequncias, determinamos a mdia aritmtica simples. Exemplo: Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de: .= (10+14+13+15+16+18+12) / 7 = 14 kilos Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e a mdia aritmtica, ou seja:.. di = Xi -

FSBA Faculdade Social da Bahia Estatstica Aplicada No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 , ...d3 = 13 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e... d7 = 12 - 14 = - 2. .Propriedades da mdia 1 propriedade: A soma algbrica dos desvios em relao mdia nula. No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0 2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma varivel, a mdia do conjunto fica aumentada ( ou diminuda) dessa constante. Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel temos: Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou Y= .+ 2 = 14 +2 = 16 kilos

3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada ( ou dividida) por essa constante. Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da varivel temos: Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou Y= x 3 = 14 x 3 = 42 kilos

.Dados agrupados: Sem intervalos de classe Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o nmero de filhos do sexo masculino. Calcularemos a quantidade mdia de meninos por famlia: N de meninos frequncia = fi 0 1 2 3 4 total 2 6 10 12 4 34

Como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada, dada pela frmula:

FSBA Faculdade Social da Bahia Estatstica Aplicada

.xi. 0 1 2 3 4

.fi. .xi.fi . 2 0 6 6 10 20 12 36 4 16

total 34 78 onde 78 / 34 = 2,3 meninos por famlia Com intervalos de classe Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio da frmula: .onde Xi o ponto mdio da classe. Exemplo: Calcular a estatura mdia de bebs conforme a tabela abaixo. Estaturas (cm) frequncia = fi ponto mdio = xi ..xi.fi. 52 56 60 64 68 72 208 504 660 512 340 216 2.440 = 61 cm

50 |------------ 54 4 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 70 |------------ 74 3 Total 40

Aplicando a frmula acima temos: 2.440 / 40.= 61. logo... MODA

o valor que ocorre com maior frequncia em uma srie de valores. Mo o smbolo da moda. Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o salrio recebido pelo maior nmero de empregados dessa fbrica. .

FSBA Faculdade Social da Bahia Estatstica Aplicada A Moda quando os dados no esto agrupados

A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor que mais se repete.

Exemplo: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.

H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.

.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a srie tem dois ou mais valores modais.

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie bimodal. . A Moda quando os dados esto agrupados a) Sem intervalos de classe Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o valor da varivel de maior frequncia. Exemplo: Qual a temperatura mais comum medida no ms abaixo: Temperaturas Frequncia 0 C 1 C 2 C 3 9 12

3 C 6 Resp: 2 C a temperatura modal, poi a de maior frequncia. . b) Com intervalos de classe A classe que apresenta a maior frequncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta. Mo = ( l* + L* ) / 2 onde l* = limite inferior da classe modal e L*= limite superior da classe modal. Exemplo: Calcule a estatura modal conforme a tabela abaixo. Classes (em cm) Frequncia 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 Resp: a classe modal 58|-------- 62, pois a de maior frequncia. l*=58 e L*=62 Mo = (58+62) / 2 = 60 cm ( este valor estimado, pois no conhecemos o valor real da moda).

FSBA Faculdade Social da Bahia Estatstica Aplicada . Mtodo mais elaborado pela frmula de CZUBER: Mo = l* + (d1/(d1+d2)) x h* l*= limite inferior da classe modal..... e..... L*= limite superior da classe modal d1= frequncia da classe modal - frequncia da classe anterior da classe modal d2= frequncia da classe modal - frequncia da classe posterior da classe modal h*= amplitude da classe modal Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a mdia aritmtica a medida de posio que possui a maior estabilidade. MEDIANA A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos. Smbolo da mediana: Md A mediana em dados no-agrupados Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9. .Mtodo prtico para o clculo da Mediana Se a srie dada tiver nmero mpar de termos: O valor mediano ser o termo de ordem dado pela frmula : .( n + 1 ) / 2 Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser a mediana A mediana ser o 5 elemento = 2 .Se a srie dada tiver nmero par de termos: O valor mediano ser o termo de ordem dado pela frmula :.... .[( n/2 ) +( n/2+ 1 )] / 2

FSBA Faculdade Social da Bahia Estatstica Aplicada Obs: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor correspondente. Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2 5 termo = 2 6 termo = 3 A mediana ser = (2+3) / 2, ou seja, Md = 2,5 . A mediana no exemplo ser a mdia aritmtica do 5 e 6 termos da srie. Notas:

Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie. Em um srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. A mediana depende da posio e no dos valores dos elementos na srie ordenada. Essa uma da diferenas marcantes entre mediana e mdia ( que se deixa influenciar, e muito, pelos valores extremos). Vejamos:

Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10 isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma. . A mediana em dados agrupados a) Sem intervalos de classe Neste caso, o bastante identificar a frequncia acumulada imediatamente superior metade da soma das frequncias. A mediana ser aquele valor da varivel que corresponde a tal frequncia acumulada. Exemplo conforme tabela abaixo: Varivel xi Frequncia fi Frequncia acumulada 0 1 2 3 4 total 2 6 9 13 5 35 2 8 17 30 35

FSBA Faculdade Social da Bahia Estatstica Aplicada Quando o somatrio das frequncias for mpar o valor mediano ser o termo de ordem dado pela frmula :.

Como o somatrio das frequncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3.. .. Quando o somatrio das frequncias for par o valor mediano ser o termo de ordem dado ela frmula: .

Exemplo - Calcule Mediana da tabela abaixo: Varivel xi Frequncia fi Frequncia acumulada 12 1 1 14 15 16 17 20 2 1 2 1 1 3 4 6 7 8

total 8 Aplicando frmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe Devemos seguir os seguintes passos: 1) Determinamos as frequncias acumuladas ; 2) Calculamos ; 3) Marcamos a classe correspondente frequncia acumulada . Tal classe ser a classe mediana ;

imediatamente superior

4) Calculamos a Mediana pela seguinte frmula:..... l* + [( - FAA ) x h*] / f* l* = o limite inferior da classe mediana. FAA = a frequncia acumulada da classe anterior classe mediana. f* = a frequncia simples da classe mediana. h* = a amplitude do intervalo da classe mediana.

FSBA Faculdade Social da Bahia Estatstica Aplicada Exemplo: classes frequncia = fi Frequncia acumulada 50 |------------ 54 4 4 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 70 |------------ 74 3 total 40 13 24 32 37 40

= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62 l* = 58........... FAA = 13........... f* = 11........... h* = 4 Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio. Emprego da Mediana

Quando desejamos obter o ponto que divide a distribuio em duas partes iguais. Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica. Quando a varivel em estudo salrio.

SEPARATRIZES Alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores. Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes. .QUARTIS Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Precisamos, portanto de 3 quartis (Q1 , Q2 e Q3 ) para dividir a srie em quatro partes iguais. Obs: O quartil 2 ( Q2 ) sempre ser igual mediana da srie. Quartis em dados no agrupados O mtodo mais prtico utilizar o princpio do calculo da mediana para os 3 quartis. Na realidade sero calculadas " 3 medianas " em uma mesma srie. Exemplo1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 } O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores:

FSBA Faculdade Social da Bahia Estatstica Aplicada { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9 que ser = Q2. Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela mediana ( quartil 2). Para o calculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da srie (quartil 2). Logo em { 2, 5, 6 } a mediana = 5 . Ou seja: ser o quartil 1 em {10, 13, 15 } a mediana =13 . Ou seja: ser o quartil 3 Exemplo2: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } A srie j est ordenada, ento calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5 O quartil 1 ser a mediana da srie esquerda de Md : { 1, 1, 2, 3, 5, 5 } Q1 = (2+3)/2 = 2,5 O quartil 3 ser a mediana da srie direita de Md : {6, 7, 9, 9, 10, 13 } Q3 = (9+9)/2 = 9 Quartis para dados agrupados em classes Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana, E fi / 2.... por ... k . E fi / 4 ... sendo k o nmero de ordem do quartil. Assim, temos: Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f* Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f* Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f* Exemplo3 - Calcule os quartis da tabela abaixo: classes frequncia = fi Frequncia acumulada 4 13 24 32 37 40

50 |------------ 54 4 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 70 |------------ 74 3

FSBA Faculdade Social da Bahia Estatstica Aplicada total O quartil 2 = Md , logo: = 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62 l* = 58........... FAA = 13........... f* = 11........... h* = 4 Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 O quartil 1 : E fi / 4 = 10 Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 .O quartil 3 : 3.E fi / 4 = 30 Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 PERCENTIL ou CENTIL Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente que P50 = Md ; P25 = Q1 e P75 = Q3. O clculo de um centil segue a mesma tcnica do clculo da mediana, porm a frmula ser : k .E fi / 100 onde k o nmero de ordem do centil a ser calculado. Exemplo: Calcule o 8 centil da tabela anterior com classes . k= 8 onde 8 .E fi / 100 = 8x40/100 = 3,2. Este resultado corresponde a 1 classe. P8 = 50 + [ (3,2 -0) x 4] / 4 = 50 + 3,2 = 53,2 Disperso ou Variabilidade: a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central ( mdia ou mediana ) tomado como ponto de comparao. A mdia - ainda que considerada como um nmero que tem a faculdade de representar uma srie de valores - no pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compem o conjunto. Consideremos os seguintes conjuntos de valores das variveis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } 40

FSBA Faculdade Social da Bahia Estatstica Aplicada Z = { 5, 15, 50, 120, 160 } Observamos ento que os trs conjuntos apresentam a mesma mdia aritmtica = 350/5 = 70 Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa. Conclumos ento que o conjunto X apresenta disperso nula e que o conjunto Y apresenta uma disperso menor que o conjunto Z. MEDIDAS DE DISPERSO ABSOLUTA Amplitude total: a nica medida de disperso que no tem na mdia o ponto de referncia. Quando os dados no esto agrupados a amplitude total a diferena entre o maior e o menor valor observado: AT = X mximo - X mnimo. Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total ser: AT = 70 - 40 = 30 Quando os dados esto agrupados sem intervalos de classe ainda temos : AT = X mximo - X mnimo.

Exemplo: xi 0 1 3 4 AT = 4 - 0 = 4 Com intervalos de classe a amplitude total a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. Ento AT = L mximo - l mnimo Exemplo: Classes 4 |------------- 6 6 |------------- 8 6 2 fi 2 6 5 3 fi

8 |------------- 10 3

FSBA Faculdade Social da Bahia Estatstica Aplicada AT = 10 - 4 = 6 A amplitude total tem o inconveniente e s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de clculo rpido sem muita exatido. DESVIO PADRO a medida de disperso mais geralmente empregada, pois leva em considerao a totalidade dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida como : a raiz quadrada da mdia aritmtica dos quadrados dos desvios e representada por S .

A frmula acima empregada quando tratamos de uma populao de dados no-agrupados. Exemplo: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5 Xi -4 -3 -2 3 5 - 0,2 - 0,2 - 0,2 - 0,2 - 0,2 - 3,8 - 2,8 - 1,8 3,2 5,2 E= Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 o desvio padro = 3,54 Obs: Quando nosso interesse no se restringe descrio dos dados, mas, partindo da amostra, visamos tirar inferncias vlidas para a respectiva populao, convm efetuar uma modificao, que consiste em usar o divisor n - 1 em lugar de n. A frmula ficar ento: 14,44 7,84 3,24 10,24 27,04 62,8

FSBA Faculdade Social da Bahia Estatstica Aplicada

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padro amostral seria a raiz quadrada de 62,8 / (5 -1) = 3,96 O desvio padro goza de algumas propriedades, dentre as quais destacamos: 1 = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera. 2 = Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padro fica multiplicado ( ou dividido) por essa constante.

Quando os dados esto agrupados (temos a presena de frequncias) a frmula do desvio padro ficar :

ou Exemplo: Calcule o desvio padro populacional da tabela abaixo: Xi 0 1 2 3 4 2 6 12 7 3 f i Xi . f i 0 6 24 21 12 63 2,1 2,1 2,1 2,1 2,1 -2,1 -1,1 -0,1 0,9 1,9 4,41 1,21 0,01 0,81 3,61 E=

quando se trata de uma amostra

.fi 8,82 7,26 0,12 5,67 10,83 32,70

Total 30

Sabemos que E fi = 30 e 32,7 / 30 = 1,09. A raiz quadrada de 1,09 o desvio padro = 1,044

FSBA Faculdade Social da Bahia Estatstica Aplicada Se considerarmos os dados como sendo de uma amostra o desvio padro seria : quadrada de 32,7 / (30 -1) = 1,062 a raiz

Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior. VARINCIA o desvio padro elevado ao quadrado e simbolizado por S2 A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. * EXERCCIOS * 1- Considere os seguintes conjuntos de nmeros: A = { 10, 20, 30, 40, 50 } B = { 100, 200, 300, 400, 500 }

Que relao existe entre os desvios padres dos dois conjuntos de nmeros ? 2- Dados os conjuntos de nmeros: A = { 220, 230, 240, 250, 260 } B = { 20, 30, 40, 50, 60 }

Que relao existe entre os desvios padres dos dois conjuntos de nmeros ? 3- Dados os conjuntos de nmeros: A = { -2, -1, 0, 1, 2 } B = { 220, 225, 230, 235, 240 }

Podemos afirmar, de acordo com as propriedades do desvio padro, que o desvio padro de B igual: a) ao desvio padro de A; b) ao desvio padro de A, multiplicado pela constante 5; c) ao desvio padro de A, multiplicado pela constante 5, e esse resultado somado a 230; d) ao desvio padro de A mais a constante 230. MEDIDAS DE DISPERSO RELATIVA CVP: Coeficiente de Variao de Pearson Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito.

FSBA Faculdade Social da Bahia Estatstica Aplicada Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada de CVP: Coeficiente de Variao de Pearson ( a razo entre o desvio padro e a mdia referentes a dados de uma mesma srie). A frmula do CVP = (S / ) x 100 ( o resultado neste caso expresso em percentual, entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor 100 da frmula). Exemplo: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos: Discriminao PESOS MDIA 68 kg DESVIO PADRO 5,0 cm 2,0 kg

ESTATURAS 175 cm

Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor ser o de maior homogeneidade ( menor disperso ou variabilidade). CVPestatura = ( 5 / 175 ) x 100 = 2,85 % CVPpeso = ( 2 / 68 ) x 100 = 2,94 %. Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os pesos. MEDIDAS DE ASSIMETRIA Introduo: Uma distribuio com classes simtrica quando : Mdia = Mediana = Moda Uma distribuio com classes : Assimtrica esquerda ou negativa quando : Mdia < Mediana < Moda Assimtrica direita ou positiva quando : Mdia > Mediana > Moda

FSBA Faculdade Social da Bahia Estatstica Aplicada Exerccio - a) Determine os tipos de assimetria das distribuies abaixo: Distribuio A Classes 2 |------------ 6 fi 6 Distribuio B Classes 2 |------------ 6 fi 6 Distribuio C Classes 2 |------------ 6 fi 6

6 |------------ 10 12 10 |------------ 14 24 14 |------------ 18 12 18 |------------ 22 6 Total = 60

6 |------------ 10 12 10 |------------ 14 24 14 |------------ 18 30 18 |------------ 22 6 Total = 78

6 |------------ 10 30 10 |------------ 14 24 14 |------------ 18 12 18 |------------ 22 6 Total = 78

Exerccio - b) Demonstre graficamente as os resultados obtidos no exerccio anterior: Coeficiente de assimetria A medida anterior, por ser absoluta, apresenta a mesma deficincia do desvio padro, isto , no permite a possibilidade de comparao entre as medidas de duas distribuies. Por esse motivo, daremos preferncia ao coeficiente de assimetria de Pearson: As = 3 ( Mdia - Mediana ) / Desvio Padro Escalas de assimetria: | AS | < 0,15 => assimetria pequena 0,15 < | AS | < 1 => assimetria moderada | AS | > 1 => assimetria elevada Obs: Suponhamos AS = - 0,49 => a assimetria considerada moderada e negativa Suponhamos AS = 0,75 => a assimetria considerada moderada e positiva

CORRELAO SIMPLES E REGRESSO LINEAR


Quando estamos trabalhando com um problema que envolve dois tipos de variveis diferentes, pode em certo momento existir a necessidade de se verificar se existe algum tipo de relao entre elas. Ou seja, se o comportamento de uma delas afeta o resultado da outra. Por exemplo: -Se estivermos interessados em estudar a relao que existe entre a quantidade de picols vendidos por uma indstria, por ms, com a variao da temperatura local.

FSBA Faculdade Social da Bahia Estatstica Aplicada - Descobrir se existe relao entre a quantidade de acessos a um determinado site de uma loja, com o volume de vendas da mesma. - Descobrir se existe relao entre o poder aquisitivo de uma populao e a incidncia de doenas na mesma. Para conhecermos se existe a relao entre as variveis e qual o grau dessa relao, necessrio lanar mo de uma ferramenta matemtica chamada correlao. Quando estamos trabalhando com variveis quantitativas (do tipo enumervel), a correlao o instrumento adequado para avaliar a relao entre elas. Para o caso de nosso estudo, onde estaremos trabalhando apenas com um par de variveis em cada anlise, chamamos de correlao simples. Relao Funcional Quando a relao entre duas variveis perfeitamente definida e atravs de uma sentena matemtica podemos definir exatamente o valor das variveis envolvidas, esta se caracteriza como uma relao funcional. Ex.: - O permetro e o lado de um quadrado, so definidos pela frmula: p = 4l; onde p o permetro e l o lado. - A corrente e a tenso de um circuito eltrico, so definidas pela frmula: V = R . I; onde V a tenso, R a resistncia do circuito (cte) e I a corrente eltrica. Podemos observar que ao usarmos as equaes acima, sempre que introduzirmos na frmula do permetro o lado do quadrado de valor 2 cm, obteremos um permetro de 8 cm. Tambm no clculo da tenso, sempre que uma mesma corrente for introduzida na frmula, obteremos o mesmo valor para a tenso, uma vez que a resistncia seja a mesma. Os valores nestes casos so determinados de maneira exata. Relao Estatstica Mas se agora analisarmos a relao existente entre o peso e a altura de um grupo de pessoas, podemos chegar a concluso de que existe alguma relao entre estas duas medidas, embora que, quando eu verificar uma altura especfica, por exemplo 1,6m, esta pode corresponder a vrios valores diferentes de peso. No sendo por esta razo, uma relao perfeita. Esta situao caracteriza uma relao estatstica entre as variveis. Quando duas ou mais variveis so ligadas por uma relao estatstica, dizemos que existe uma correlao entre elas. Diagramas de disperso Para estudar a relao entre duas variveis devemos partir da coleta de uma amostra de pares de observaes. Para isto, necessrio realizar um experimento em que se faz simultaneamente medidas de duas variveis x e y. Sejam (x1,y1), (x2,y2), ... , (xn,yn) os n pares de observaes. Um procedimento para visualizarmos a forma da relao entre as variveis x e y o diagrama de disperso, que nada mais do que a representao dos pares de valores num sistema

FSBA Faculdade Social da Bahia Estatstica Aplicada cartesiano. Ou seja, o diagrama de disperso a forma grfica (qualitativa) de representar a correlao existente entre um par de variveis. Esta representao feita num sistema coordenado cartesiano ortogonal, onde os pares ordenados (xi, yi) so plotados, obtendo-se uma nuvem de pontos. A nuvem de pontos nos fornece uma idia de maneira grosseira da correlao existente entre as variveis. Ex.: Considerando uma amostra de dez alunos de uma classe de uma faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica, podemos representar estes pares de notas num diagrama com segue: N do aluno Matemtica (xi) Estatstica (yi) 01 5,0 6,0 08 8,0 9,0 24 7,0 8,0 38 10,0 10,0 44 6,0 5,0 58 7,0 7,0 59 9,0 8,0 72 3,0 4,0 80 8,0 6,0 92 2,0 2,0
10

Y
4 2 0 0 2 4 X 6 8 10

A maneira de se verificar a existncia de uma correlao entre duas variveis atravs de um diagrama tentar visualizar se os pontos dos pares de variveis esto prximos a curva de alguma funo. Ou seja se os pontos formam a imagem desta curva. Ento poderia dizer-se que a relao entre as duas variveis em questo seria explicada pela equao matemtica daquela funo. Ento, uma correlao pode ser linear, quando os pontos se aproximam de uma reta (fig 1a, 1b e 1c) ou no linear quando os pontos no se aproximam de uma reta ou quando no se aproximam de nenhuma curva (fig. 1d e 1e).

FSBA Faculdade Social da Bahia Estatstica Aplicada

a) r > 0
32

26

20

14

-4 0 2 4 6 8 10 12 14 16

Figura 1a - Correlao linear positiva reta ascendente;


b) r=1
32

28

24

20

Y
16 12 8 4 0 2 4 6 8 10 12 14 16

Figura 1c relao perfeita (funcional)

FSBA Faculdade Social da Bahia Estatstica Aplicada


c) r < 0

Figura 1c correlao linear negativa reta descendente

Figura 1d correlao no linear imagem de curva

FSBA Faculdade Social da Bahia Estatstica Aplicada


e) r

Figura 1e Dados no correlacionados sem imagem

COEFICIENTE DE CORRELAO LINEAR O coeficiente de correlao a maneira quantitativa de se verificar a existncia de correlao linear entre duas variveis. Este coeficiente indica o grau de intensidade que duas variveis se correlacionam, bem como em que sentido estas se relacionam (positivo ou negativo). O coeficiente de correlao de Pearson um mtodo, entre vrios existentes, simples que avalia a existncia de correlao linear entre duas variveis X e Y, e dado por: r= n . xi yi ( xi) . ( yi) {[n . xi - (xi)] . [n . yi - (yi)]}1/2

Onde n o nmero de pares de observaes. Os limites de r so 1 e +1, ou seja 1 r 1, isto r pertence ao intervalo [-1, +1]. Se: r = +1 r = -1 r=0 A correlao linear entre X e Y perfeita positiva (figura 1c) A correlao linear entre X e Y perfeita negativa. No existe correlao linear entre X e Y. (figura 1d e 1e)

FSBA Faculdade Social da Bahia Estatstica Aplicada Quanto a intensidade da correlao linear, ou seja o quo bem os dados se ajustam a reta, temos: 0,6 r <1 0,3 r < 0,6 0 < r < 0,3 Dados fortemente correlacionados. Correlao relativamente fraca entre as variveis. Correlao muito fraca, pouco se pode concluir sobre esta relao.

Ex.2 Para o exemplo aplicado acima das notas dos alunos temos:

N do aluno 01 08 24 38 44 58 59 72 80 92

Matemtica (xi) 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 65

Estatstica (yi) 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 65

xi . yi 30 72 56 100 30 49 72 12 48 4 473

xi 25 64 49 100 36 49 81 9 64 4 481

yi 36 81 64 100 25 49 64 16 36 4 475

r = (10 . 473 65 . 65) / [(10 . 481 65) . (10 . 475 65)]1/2 r = 0,91 correlao altamente significativa entre X e Y. REGRESSO LINEAR Encontrada uma relao entre duas variveis (as variveis esto correlacionadas), o prximo passo definir uma funo, de modo que uma varivel independente explique uma varivel dependente. Ou seja, se duas variveis X e Y, esto sendo estudadas, e deseja-se definir uma funo para explicar (estimar, calcular) Y de acordo com X , Y = f(X), faz-se uma regresso de Y para X. Da mesma forma para explicar X em funo de Y, faz-se uma regresso de X para Y. Numa regresso de Y para X, dizemos que X a varivel independente e Y a varivel dependente. A anlise de regresso simples descreve, atravs de um modelo matemtico (funo) a relao entre duas variveis, utilizando para isso n pares de observaes das mesmas. Quando falamos de regresso linear, o que estamos fazendo e tentar adequar a equao de uma reta aos pares de valores que temos registros. Ou ajustar uma reta sobre os pontos do diagrama de disperso, de modo que a partir de ento esta reta represente a variao dos valores de X em relao a Y. Sabemos que a equao da reta dada por: Y = AX + B
Calcula-se os valores dos parmetros a e b, definidos por:

FSBA Faculdade Social da Bahia Estatstica Aplicada a= e b = Ymed a Xmed onde: n o nmero de pares de observaes, Xmed a mdia dos valoes de xi, e Ymed a mdia dos valores de yi. Quando estamos trabalhando com uma amostra de dados dizemos que a funo dada pela reta permite calcular um valor estimado de Y. Ex.: Utilizando nosso exemplo acima, INTERPOLAO E EXTRAPOLAO Quando estamos estimando o valor de Y atravs de um valor de x que no pertence ao intervalo de dados que foi utilizado para o clculo da funo, dizemos que estamos fazendo uma extrapolao do valor. Quando o valor de x pertence ao intervalo embora que no exista nas observaes feitas, estamos interpolando o valor. Ex.: No exemplo das notas dos alunos, temos: a = 0,86 e b = 0,89 e a equao da reta fica: Yest = 0,86x + 0,89 P/ x = 5 P/ x = 4 P/ x = 1 Yest = 5,19 Yest = 4,33 Yest = 1,75 foi feita interpolao. foi feita extrapolao. n . xi yi ( xi) . ( yi) [n . xi - (xi)]

A norma fundamental da regresso que nunca se deve extrapolar, exceto quando consideraes tericas ou experimentais demonstrem a possibilidade de extrapolao. Referncias: - Crespo, A. A., Estatstica Fcil, editora Saraiva. - Spiegel, M. R., Estatstica, Mc Graw Hill