Anda di halaman 1dari 134

I NDICE

UNIDADE 1- ANLlSI~ DE nADOS ESTATSTICOS ~ OI OI 07


10

1. CONCEITOS FUNDAMENTAIS DE ESTATSTICA 2. FASES DO MTODO OU TRABALHO ESTATSTICO 3. DISTRIBUIES DE FREQUNCIAS 4. REPRESENTAES GRFICAS DAS DISTRIBlJlES 5. MEDIDAS DE POSiO 6. MEDIDAS DE DISPERSO 7. REFERNCIAS BII3L10GRFICAS

D[~ FREQUNCIAS

15 18 24 27

UNIDADE

11 - INTRODUO

I)RO nA UI LI DAD E .............................................

28 28 29 31 32 34 38 39 41 42 44

1. INTRODUO 2. ESPAO AMOSTRAL E EVENTOS 3. NOES FUNDAMENTAIS DE PROBABILIDADE 4. PROBABILIDADE EM ESPAOS AMOSTRAIS FINITOS E EQUIPROV VEIS 5. PROBABILIDADE CONDICIONADA 6. TEOREMA DE BA YES 7. EVENTOS INDEPENDENTES 8. REFERNCIAS BIBLIOGRFiCAS APNDICE A - ALGUMAS NOES DA TEORIA DOS CONJUNTOS APNDICE B - TCNICAS DE CONTAGEM

UNIDADE 111- DISTRIBUiO 1. 2. 3. 4. 5. 6.

DE I)ROBABILlDADE , "

47 47 49 52 54 57 64

INTRODUO VARIVEIS ALEATRIAS DISCRETAS VARl VEIS ALEATRIAS CONTNUAS ESPERANA MATEMTICA E V ARINCIA ALGUMAS DISTRIBUIES DE PROBABILIDADE REFERNCIAS BIBLIOGRFiCAS

UNIDADE IV - ESTATSTICA

INFERENCIAL

65 65 69 70 74 75 76

1. NOES ELEMENTARES DE AMOSTRAGEM 2. DISTRIBUIO AMOSTRAL 2.1. DISTRIBUIO AMOSTRAL DA MDIA 2.2. DISTRIBUIO AMOSTRAL DA PROPORO 2.3. DISTRIBUIO AMOSTRAL DA VARINCIA 3. REFERNCIAS BIBLIOGRFICAS

UN IDA D E V - ESTIMA

.............................................77 77 77 78 80 81 82 85 86

1. INTTtODUO , 2. ESTIMAO PONTUAL 2.1. PROPRIEDADES DOS ESTIMADORES , 2.2. ESTIMADORES PONTUAI S 3. ESTIMAO POR INTERVALO 3. I. INTERVALO DE CONFIANA PARA A MDIA DA POPULAO 3.2. INTERVALO DE CONFIANA PARA A PROPORO DA POPULAO 4. REFERNCIAS lJlI3L10GRFI CAS

UN lDAD E VI - TESTES 1. 2. 3. 4. 5. 6.

DE 111 PTES ES ...;................................. 87 87 87 . 88 89 93 95

INTRODUO CONCEITOS fUNDAMENTA IS PASSOS PARA CONSTRUO DE UM TESTE DE HIPTESES TESTES. SOBRE A MDIA DA POPULAO TESTES SOBRE A PROPORO DA POPULAO REFERNCIAS BIBLIOGRFl CAS

UNIDADE 1. 2. 3. 4.

VII - REGRESSO

E CORRELAO

96 96 96 99
104

INT'RODUO C O ItRELA O REGRESSO REFERNCIAS BIBLlOG RFICAS

TA

nE LAS

.....................................................

... .........................................

..... 105

li..-

--------,

IUNIDADE l. ANLISE DE DADOS ESTATSTlCOSj


J. CONCEITOS FUNDAMENTAIS DE ESTATSTICA

-ESTATSTICA "Podemos considerar a Estatstica como 11m cmrjllllto ele mtodos e processos qllaJltitaJil'oS qlle sen'e para e.'itlldar e medir os fenmellos coletl'os". A estatstica teve acelerado desenvolvimento a partir do sculo XVII, atravs dos estudos de BERNOULLI, FERMAT, PASCAL. LAPLACE. GAUSS, GALTON, PEARSON, FISHER, POISSON, KOLMOGOROV e outros que estabeleceram suas caractersticas essenciais. Ela no alcanou ainda um estado definitivo. Continua a progredir na ao direta do desejo de investigao dos fenmenos coletivos. A Estatstica considerada como Cincia no sentido do estudo de uma populao. Mantm com a Matemtica uma relao de dependncia, solicitando-lhe auxlio, sem o qual no poderia desenvolver-se. Com as outras Cincias mantm a relao de complemento, quando utilizada como instrumento de pesquisa. Em especial a relao de complemento a forma que a Estatstica, atravs de seus MTODOS ESTATSTICOS, mantm com as reas Tecnolgicas, as Cincias Exatas e outras, servindo como instrumento auxiliar na tomada de decises. A Estatstica tem como OBJETIVO o estudo dos fenmenos coletivos. Objetivando o estudo quantitativo e qualitativo dos dados (ou informaes), obtidos nos vrios campos da atividade cientlica, a Estatstica manipula dois conjuntos de dados fundamentais: a "pop"lao" e a "amostra".

POPULAO ( ou Universo) o conjunto dos seres, objetos ou informaes que interessam ao estudo de um fenmeno coletivo segundo alguma(s} caracterstica(.'l). , portanto, u~ conjunto definido de informaes relativas a qualquer rea de interesse, podendo, quanto ao nmero de elementos, ser: finita (tamanho N) ou infinita. Na maioria das vezes, no conveniente, ou mesmo possvel realizar o levantamento dos dados referentes a todos os elementos de uma populao. Portanto, analisamos parte da populao, isto amo,stramos. AMOSTRA

um subconjunto no vazio ou parte da populao. Duas consideraes devem ser


feitas sobre o estudo amostrai dos fenmenos. Uma diz respeito aos cuidados que se deve tomar para assegurar que a amostra seja representativa da populao. Para atender a essa exigncia, deve-se selecionar os elementos de forma aleatria, de modo que todo e qualquer elemento da populao tenha a mesma chance de participar da amostra. A outra exigncia diz respeito preciso dos dados coletados, buscando minimizar os erros que poderiam induzir a concluses equivocadas. O nmero de elementos de uma amostra chamado o tamanho da amostra, e denotado por n.

..,

085: Parmetro. Estimador e Estimativa a) Uma caracterstica numrica estabelecida para toda uma populao denominada parmetro. b) Uma caracterstica numrica estabelecida para uma amostra denominada estimeu/or. c) O valor numrico assumido pelo estimador numa determinada amostra denominada estimatiJ'a. Por exemplo: no fenmeno coletivo eleio para prefeito do municpio de Joo Pessoa, a populao o conjunto de todos os eleitores habilitados na respectiva cidade. Um parmetro a proporo de votos do candidato A. Uma amostra pode ser um grupo de 1.000 eleitores selecionados em todo o municpio. Um cstimador a proporo de votos do candidato A obtida na amostra. O valor resultante do estimador, a proporo amostrai, a estimativa. Em. aplicaes efetivas, onde aplica-se o processo de amostragem, o nmero de elementos componentes de uma amostra , geralmente, bastante reduzido em relao ao nm~ro de elementos componentes da populao. _ PROCESSOS ESTATSTICOS DE ABORDAGEM

Quando solicitados a estudar um fenmeno coletivo podemos optar entre os seguintes processos estatsticos: .a) CENSO - avaliao direta de um parmetro, utilizando-se todos os componentes da populao. Propriedades Principais do Censo: Admite ~rro processual zero e tem confiabilidade 100% - E caro. lento - quase semp'rc desatualizado - Nem sempre vivel. b) AMOSTRAGEM Propriedades (Inferncia) - avaliao indireta de um parmetro, com base em um estimador atravs do clculo das probabilidades. Principais da Estimao: Admite erro processual positivo e tem confiabilidade menor que 100% - barata rpida - atualizada - sempre vivel.

No sentido de disciplimi, a Estatstica ensina mtodos racionais para a obteno de informaes a respeito de um fenmeno coletivo, alm de obter concluses vlidas para o fenmeno e tambm permitir tomada de decises, atravs de alguma(s) caracterstica(s) de valores numricos observados. Desta forma, a Estatstica. pode ser dividida em duas grandes lnfcrcncial. I) ESTATSTICA DESC1UTIVA - a parte da Estatstica que tem por objetivo descrever os dados observados. So atribuies da Estatstica Descritiva: a) A organizao dos dados. b) A reduo dos dados. c) A representao dos dados. reas: DCSCI'itiv:l c

d) A obteno de algumas informaes que auxiliam a descrio do fenmeno observado . A organizao dos dados consiste na ordenao e crtica quanto correo dos valores observados, falhas humanas, omisses, abandono de dados duvidosos, etc . Reduo dos dados - O entendimento e compreenso de grande quantidade de dados atravs de simples leitura de seus valores individuais uma tarefa extremamente rdua e dificil mesmo para o mais experimentado pesquisador, portanto deveremos tabular os dados . A representao dos dados - Os dados estatsticos podem ser mais faclmente compreendidos quando apresentados atravs de uma representao grfica, a qual permite uma visualizao instantnea de todos os dados. Os grficos quando bem representativos, tornam-se importantes instrumentos de trabalho. A obteno de algumas informaes que sumarizam os dados, facilitando a descrio dos fenmenos observados. Isto encerra as atribuies da Estatstica Descritiva. 11) K,)TA 1iSTlCA lNl'1~RI';NCIAL (ou II/dufiva) - a parte da Estatstica que tem por objetivo obter e generalizar concluses para a populao a partr de uma amostra. Complementando o processamento estatstico, no caso de uma estimao, a Estatstica Indutiva estuda os parmetros. a partir do uso de estimadores usando o clculo das probabilidades, elemento este que viabiliza a inferncia estatstica. Em resumo, um estudo estatstico completo que recorra s tcnicas de Estatstica Inferencial ir envolver tambm, direta ou indiretamente, tpicos de Estatstica Descritiva, Clculo das Probabilidades e Amostragem. Logo, para se desenvolver um curso completo e razovel de Estatstica, todos esses assuntos devem ser abordados. No diagrama abaixo est indicado como essas reas esto j-c1acionadas.

~
Estatstica Descritiva ~IE

I Amostragem I ~

,. ~statlstlca lnferencial

Clculo das Probabilidades I L"

"0

"

Figura 1: Esquema Geral de um Curso de Estatstica DADOS

e VARIVEIS

ESTATSTICAS

Normalmente, no trabalho estatstico o pesquisador se v obrigado a lidar com grande quantidade de valores numricos resultantes de um censo ou de uma amostragem. Estes valores numricos so chamados dadm; estatsticos.

As informaes ou dados caractersticos dos fenmcnos ou populacs so denominados varil'ei.'i e.'ttat.'itica.'i ou simplesmcnte l'arth'ei.'i. Conforme suas caractersticas particulares, podem ser classificadas como: QUlultitatl'll.'i c Qu.alitativlls. QUANTIT ATl VAS - So aquelas que podem ser expressas em termos numricos. Em geral so as resultantes de medies, enumeraes ou contagens. So subdivididas em cOlltllUas e discretas. conforme abaixo. ContnuD.'i - so aquelas que podem assumir qualquer valor num certo intervalo de medida, podendo ser associados ao conjunto dos nmeros reais, ou seja, seus valores possveis formam um conjunto no enumervel. Entre outras, enquadram-se nesta categoria as medidas de tempo, comprimento, espessura, rea, volume, peso e velocidade. Discretas (ou desc{mtmlD.'.) - quando s podem assumir determinados valores num certo intervalo, podendo ser associadas ao conjunto dos nmcros inteiros, ou seja, seus possveis valores formam um conjunto finito ou enumervel. Em geral, representam nmcros inteiros resultantes do processo de contagem, como o nmero de alunos por sala, de crditos por disciplinas, de pacientes atendidos diariamente num hospital, etc. De modo geral, as medies do origem as variveis contnuas e as contagens ou enumeraes, as variveis discretas. Designamos estas variveis por letras latinas, em geral , as ltimas: X, Y, Z. QUALITATIVAS - Nem sempre os elementos de uma populao so exclusivamente contveis. Muitas vezes, eles podem ser qualificados tambm segundo algumas de suas caractersticas tpicas. Nesses casos, as variveis podcm ser agrupadas em lIomillais ou ordil,ais( por postos ). Nominais - quando puderem ser reunidas em categorias ou espcies com idnticos atributos. Aqui se incluem os agrupamentos por sexo, rea de estudo, desempenho, cor, raa, nacionalidade e religio. Ordillais - quando os elcmentos forem reunidos segundo a ordem em quc aparecem dispostos numa lista ou rol. So tpicos desta forma de agrupamento, as listas classificatrias de concursos e as tabelas de campeonatos. . Em geral, uma mesma populao pode scr caracterizada por mais de um tipo. de varivel. Assim os inscritos num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser agrupados segundo o sexo ou rea de estudo e podcm ainda ser classificados segundo a,s notas obtidas nas provas prestadas .
.

-.

1-

NVEIS DE MENSURAO

o objetivo de estudarmos os nveis de mensurao das variveis cstatsticas consiste em determinar a complexidade da anlise das variveis (caractersticas de interesse) envolvidas no estudo de uma populao ou de uma amostra. As pessoas de uma comunidade podem ser estudadas sob diversos ngulos. Por exemplo, podem ser classificadas quanto ao SEXO (masculino/feminino), quanto

4 ...

-~

ESTATURA (baixa/mdia/alta), quanto REN DA (pobres/ricas) etc. SEXO, ESTATURA, RENDA so varivcs, isto , so caractersticas s quais podemos associar conceitos ou nmeros e assim expressar, de certa maneira, informaes sob a forma de medidas. 1". nvel: _ o nvel de mensurao mais baixo, mais rudimentar possvel. A escala de medida desse nvel chama-se NOMINAL. O fundamento para a atribuio dos nmeros de natureza qualitativa. Exemplos: VAIUVEL QUALITATIVA NOlvflNAL - 1 Nvel - Escala Nominal (classificao por tipos ou atributos). a) Populao: moradores de um cidade

Va,rive/: cor dos olhos (pretos, castanhos, azuis, etc.)


b) Populao: funcionrios da empresa X

Varivel: sexo (masculino, feminino)


20. nvel: _ Este nvel j um pouco mais elaborado que o anterior e corresponde ao que popularmente se designa por ordellllo; a escala de medida chama-s.e ORDINAL. As grandezas de 20 nvel podem ser avaliadas em termos de 11lai.~ lJue ou I1U!IWS lJue, embora a quantificao precisa seja impossvel. Exemplos: VAJUVEL QUALITATIVA OlWINAL

- 2 Nvel - Escala Ordinal


3 3 3

( ordenao ou postos).

c) Populao: estudantes de uma escola de 2". grau

Varivel: grau de escolaridade ( 1 srie, 2 srie, 3 srie)


d) Populao: pessoas adultas economicamente ativas

Varivel: renda (baixa, mdia, alta)


30. nvel: _ no 30. nvel que surge, pela primeira vez, uma escala de medida propriamente dita. a escala INTERVALAR, onde a contagem rcsulta nmeros inteiros e com eIes so possveis algumas das operaes aritmticas ( adio, subtrao e multiplicao). Neste nvel o ZERO da escala relativo. Exemplos: As Esca~.~sTermomtric:ls, fuso horrio.

4". nvcl: O 40 nvel define a c1lmada escala das raztJes ou RACIONAL. Essa escala muito parecida com a de 3". nveI, exccto quanto origem. O ZCIOO absoluto, isto , zero mesmo. No 40 nvel todas as operaes aritmticas so possveis, isto , adio, subtrao, multiplicao c diviso.

"j

Exemplos: VAIUA VEL QUANTITA TlVA f)/,SCR/~TA - 4 Nvel - Escala das Razes (processo de
contagem e ordenao). e) Populao: casais residentes em uma cidade Varivel: nmero de filhos (O, 1,2, 3,4 ou mais filhos) f) POjJulalio: peas produzidas por uma mquina Varivel: nmero de defeituosas da produo diria (O, 1,2,3,4,5, ." )

VA1UA Vr-L QUANTITA TIVA CONJiNUA - 4 Nvel - Escala das Razes (processo de
medio). g) POjJula{io: peas produzidas por uma mquina Varivel: dimetro externo (p. ex., 0,96 cm) h) Populalio: estudantes de uma escola Varivel: tempo de estudo dirio em certa disciplina (p. ex., 2,30 h) A Complexidade da anlise das variveis aumenta quanto maior for o nvel desta
140. NVELI

varivel, como indicado no diagrama abaixo.

130. Nvr::L I
120. NVELI 110. NVELI Escala Nominal Escala Inter\'alar

Escala das Razes

:=J Escala Ordinal

Figura 2: Grau de complexidade da anlise dos dados


"

(,

2. FASES DO MTODO OUTRAUALHOESTATSTICO


Em linhas gerais, podemos distinguir na anlise estatstica as seguintes etapas: Planejamento, Coleta, Crtica, Apurao e Exposio dos dados, alm da anlise dos dados. PLANEJAMENTO

o trabalho inicial de coordenao no qual define-se a populao a ser estudada


estatisticamente, formulando-se o trabalho de pesquisa atravs da elaborao de questionrio, entrevistas, etc. A organizao do plano geral, implica em obter respostas para uma srie tradicional de perguntas, antes mesmo do exame das informaes disponveis sobre o assunto, perguntas que procuram justificar a necessidade efetiva da pesquisa, a saber: _ "quem", "o que", "sempre", "por que", "para que", "para quando".

Imaginemos, por exemplo, que a Biblioteca Central da UFPb tenha necessidade de .obter informaes acerca dos usurios em potencial que utilizam-na. O primeiro trabalho da equipe encarregada -da pesquisa, ser evidentemente, o de obter resposta para aquelas perguntas. Seriam ento: - Quem deseja as informaes? _ O que devemos perguntar no questionrio? _ Ser executada sempre? A pesquisa ser peridica ou ocasional? - Por que desejam as informaes? - Para que desejam as informaes? _ Quando dever estar concluda a pesquisa? _ Qual a poca oportuna-para a aplicao dos questionrios? Ainda na fase do planejamento, temos: EXAME DAS INFORMAES DISPONVEIS, ou seja, anlise da reunio de tudo que foi publicado sobre o assunto, obtendo-se relatrios sobre atividades semelhantes ou correlatas. A DEFINIO DO UNIVERSO, isto , saber qual o conjunto a ser pesquisado, distribuindo, classificando ou agrupando os elementos desse conjunto em populaes, para permitir um trabalho mais fcil, mais lgico, mais racional. O tipo de levantamento, CENSO ou AMOSTRAGEM, dever ser decidido com a devida antecedncia c-a necessria anlise das vantagens e desvantagens de um e de outro, em virtude do custo financeiro e .do prazo determinado para a concluso do trabalho. COLETA DE DADOS Aps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos incio coleta dos dados numricos necessrios sua descrio.

A coleta dos dados poder ser feita de diversas formas. A ideal aquela que maximiza os recursos disponveis, dados os objetivos e a preciso previamente estipulados. No seu planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se manifestar, a frequncia de sua ocorrncia, e outras particularidades julgadas importantes. Quando os dados se referirem ou estiverem em poder de pessoas, sua coleta poder ser realizada mediante respostas a questionrios previamente' elaborados. Esses questionrios podem ser enviados aos entrevistados para devoluo posterior ou podem ser .aplicados pelos prprios pesquisadores ou por- entrevistadores externos ou contratados, devidamente treinados. Os dados ou informaes representativas dos fenmenos ou problema em estudo podem ser obtidos de duas formas: por via direta ou por l'ia i"direta,

Por via direta - quando feita sobre elementos informativos de registro obrigatrio
(p. ex.: nascimentos, casamentos, bitos, matrculas de alunos etc.) ou, ainda, quando os dados so coletados pelo prprio pesquisador atravs de cntrevistas ou questionrios. A coleta direta de dados, com relao ao fator tempo, pode ser classificada em: a) contnua, tambm denominada registro, feita continuamente, tal como a de nascimentos, bitos, etc.; b) peridica, quando feita em intervalos constantes de tempo, como os censos( de 10 em 1O anos), os balanos de uma empresa comercial, etc.; . c) ocasional, quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergncia, como no caso de epidemias que assolam ou dizimam seres humanos

Por l'ia i"direta - quando inferida de elementos conhecidos (coleta direta) e/ou
conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos via coleta direta.

CITICA DOS DADOS


Os dados colhidos por qualquer via ou forma e no previamente organizados so chamados de dados brutos. Esses dados brutos, antes de serem submetidos ao processamento estatstico propriamente dito, devem ser "criticados", visando eliminar valores imprprios e erros grosseiros que possam interferir nos resultados finais do estudo. A crtica exter"a quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe foram feitas; illterlla quando se observa o material constitudo pelos dados coletados. o caso, por exemplo, da verificao de somas de valores anotados.

APURAO OU PROCESSAMENTO

DOS DADOS

Uma vez assegurado que os dados brutos so consistentes, devemos submet-los ao processamento adequado aos fins pretendidos. A apurao ou processamento dos dados pode ser manual ou clctr-nica. Os processos e mtodos estatsticos a que um conjunto de dados pode ser submetido sero nosso objeto de estudo nas sees seguintes.

8
l

EXI)OSIO

ou AI)RESENTAO

DOS DADOS

Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (abclas ali gl"ficos), tornando niais fcil o exame daquilo que est sendo objeto de tratamento estatstico e ulterior obteno de medidas tpicas. No caso particular da estatstica descritiva, objetivo do estudo se limita, na maioria dos casos, simples apresentao dos dados, assim entendida a exposio organizada e resumida das informaes coletadas atravs de tabelas ou quadro . bem como dos grficos , resultantes. ANLISE DOS RESULTADOS Como j dissemos, o objetivo ltimo da Estatstica tirar concluses sobre o todo (populao) a partir de informaes fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatstica dcscl"itiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Infcrcncial, que tem por base a induo ou inferncia, e tiramos desses resultados concluses e previses.

3. DISTJUnUICES J)E FIU~Q(JI~NCIAS Os dados numricos, aps coletados suo colocados em srie e apresentados em

tabelas ou quadros. Quando se estuda orna varivel (qualitativa ou quantitativa), o maior interesse do pesquisador eonhecer a distribuio dessa varivel atravs das 'possveis realizaes (valores) da mesma. Iremos, pois, ver uma maneira de se dispor um cOI~unto de valores, de modo a se ter uma boa idia global subre esses valores, ou seja, de sua distribuio. Consideremos,
TABELA

para efeito de estudo, o qmuln

(hanco de dados) apresentado abaixo:

1.1 - Infonnaes sobre sexo, curso, idade (anos), pr(}(.:edncia, renda .fmiliar, nlmero de disciplinas malriclIiado(a), peso (kg) e allllra (cm) de 31 alunos matriculados na . disciplina CLC. das PROBo e ESTATSTICA I, perodo 97.1 - turma: 04 - tumo da manh.

lO

SEXO

CURSO

lDAlJE
(anos)

PROCEDf~NClJ\

RENDA FAMIIJAR

NU. DISCIP MATRIC

PESO
(kg)

ALTURA
(em)

Capital 27 Cincias Masc Interior 18 Eng Civil Masc Capital 21 Cincias Fem Interior Eng Mec 23 Masc Interior Eng Mec 23 Masc O.Re.gio 21 Cincias Fcm Capital 21 Cincias Fem Interior 27 Eng Mec Masc Capital 21 Eng Civil Masc Capital 19 Eng Civil Fem O.Regio 18 Eng Civil Masc II O.Regio 18 Eng Civil Masc 12 Capital Eng Mec 22 Fem 13 Capital 19 Ellg Civil Fem 14 Capital 19 Eng Civil 15 Masc Capital 18 Eng Civil 16 Masc Capital 19 Eng Civil 17 Masc Capital 23 Ellg Civil 18 Masc O.Re~io 19 Eng Civil 19 Masc Capital 18 Eng Civil Fem 20 Capital 18 Eng Civil Masc 21 Capital 20 Eng Civil Masc 22 Capital 19 Eng Civil' 23 N.lnf .. Capital 24 Ellg Civil Masc 24 Capital 20 Eng Civil Fem 25 Capital 21 Eng Civil Fem 26 Capital 20 Eng Civil Masc 27 Interior 21 Eng Civil Masc 28 Interior 20 Eng Civil Masc 29 Capital Eng Civil N.1nf Masc 30 Capital 21 Eng Civil Fem 31 FONTE: Questionrio aplicado - aula 18/03/97

OI 02 03 04 05 06 07 08 09 10

Baixa Mdia Mdia Baixa Baixa Mdia Mdi Mdia Alta Mdia Mdia Alta Mdia Mdia Mdia Alta Mdia Mdia Mdia Mdia Mdia Mdia Mdia. Mdia Mdia Mdia Mdia Mdia Baixa Mdia Mdia

3 7
6

5 5 7 8 4 5 6 5 6
6

5 5
6

68 60 57 54 54 47 46 90 51 43 73 69 70 57 73 55
82

170 175 168


N.lnf N.lnf

5 4 5 5 5
5 7

7
6

5
5
6

6 3
6

65 71 68 70 67 68 70 58 51 84 65 62 84 62

153 162 174 172 158 177 175 172 165 183 167 181 175 170 170 170 177 170 170 161 158 180 167 164 170 173

10

Uma distribuio de frequncias pode ser apresentada nas seguintes maneiras:


_ DISTRIBUIO DE FREQUNCIAS POR VALORES

(varivel qualitativa ou

quantitativa discreta)

construda considerando-se todos os diferentes valores ou categorias, levando em


considerao suas respectivas repeties EXEMPLO . da varivel

1 _ A tabela 1.2 apresenta a distribuio de frequncia PROCEDNCIA, usando-se os dados da tabela 1.1 .

Tabela 1.2 _ Frequncias e Percentuais dos 31 estudantes de Calco Probo Est 1 Turno: Manh, Turma: 04, Perodo: 97.1 - segundo a Regio de Procedncia PUOCI'.:J)NC1A Capital Interior O. Regio Total
FONTE: Tabela 1.1

,..p

ele 1',:,illllolJles

1'ercellllllll

L
21

f, I}/l

C>7,7
19,4 129 -' 100

4 31

EXEMPLO 2 _ A tabela 1.3 apresenta a distribuio de frequncia da varivel N DE DISCIPLINAS MATRlCULADO(A), usando-se os dados da tabela 1.1 - ( DADOS NO -AGRUPADOS) Tabela 1.3 _ Distribuio de frequncias e percentuais do N de Disciplinas Matriculado(a) dos 31 estudantes de Cale. Probo Est 1- Turno: Manh, Turma: 04, Periodo: 97.1. lf2 DisC MA TIUC

N dc Estudalltcs
(;

Percclltua!

(;%
6,5 6,5 41,9 29,0 12,9 3,2
\00

193 4 5

2
2 13 9 4 1

7 8 Total ou

3\

FONTE: Tabela 1.1

OBS.:

L =>

letra grega "SIGMA", indica total ou somatrio.


DE FREQUNCIAS rOR INTERVALOS OU CLASSES (varivel

DISTRIBUIO quantitativa).

Constri-se classes de valores, quando a variabilidade dos dados grande, levando em considerao o nmero de valores que pertencem a cada classe. A construo de tabelas de frequncias para variveis cntnuas necessita de certos cuidados.

1I

EXEMPLO 3 - A tabela 1.4 apresenta a distribuio de frequncias da varivel ALTURA (medida em cm), usando-se os dados da tabela 1.1 - (DADOS AGRUPADOS)
Tabela 1.4 - Frequncias e percentuais das ALTURAS dos 31 estudantes de CALe. PROBo EST I Percenlual

_ _ I~E!!<?:~.~~!~l ..T.~ ..9~.!..~~r~~().:. .. .f]~~.l.: . ,9.?:.1.:,


ALTURAS ......_........._..(~'.?~)o , _
ISO

N de l:"~\'//ldallles
.00

1--

f;
I

.f,~oo
3,4 13,8 41,5 31,0

157

1--.................. .. 85 P~.J:~== 1
Total
OUL

157 164 171

1---1-

164 171 178

4 12 9 .. 3
29

.1,3
JOO,O

FONTE: Tabchl 1.I NOTA: Dos 31 respondentes,

2 no informaram a altura.

OBSERVAO:

1) De um modo geral tem-se a destacar cm uma t:abcln (disposio escrita que se obtm referindo-se a uma coleo de dados numricos a uma determinada ordem de classificao ): i) Elementos essenciais: Ttlllo: Indicao que precede a tabela e que contm a designao do fato observado, o local e a poca em foi registrado. Cabealho: Parte superior da tabela que especifica o contedo das colunas. Col'llla Indicadora: Parte da tabela que especifica o contedo das linhas. Corpo da tabela: Conjunto de colunas e linhas que contm as informaes sobre a varivel em estudo. ii) Elementos complementares: Fonte: Indicao da entidade responsvel pelo fornecimento dos dados 'ou pela sua elaborao. Notas: Informaes de natureza geral destinadas a conceituar ou esclarecer o contedo das tabelas ou a indicar a metodologia adotada no levantamento ou na elaborao dos dados. Chamadas: Informaes de natureza especifica sobre determinada parte da tabela, destinada a conceituar ou a esclarecer dados 2) As tabelas apresentadas oficialmente devem atender s normas do IBGE.

_ REGRAS BSICAS PARA ELABORAO DE UMA DISTRIBUIO FREQUNCIAS POR INTERVALOS - (DADOS AGRUPADOS)

DE

1. Efetua-se um ROL ESTATSTICO (ordenao crescente ou decrescente de grandeza) nos Dados Brutos (aqueles ainda no organizados numericamente).

12
L

2. Determina-se a AMI)LITUDE TOTAL dos dados Ar = Xmx - Xmn ,onde Xmx : maior valor observado e Xmn observado 3. Escolhe-se convenientemente

menor valor

o nmero de classes K (n". intero) , 5::;;K::;; 15 onde

podemos tomar K ou a frmula de Slurges K == 1+ 3,3. iogJl, 1I ~ 25 (totai de observaes). Se possvel determina-se, ou seja, constri-se classes de mesma amplitude, tomando 4. Efetua-se h == --.

=...r;;

AT K

o AGRUI)AMHNTO l~M CLAS,)'/~'S e, a seguir, toma-se as i'1~EQUJ~'NCIAS SIMPLES DE CLASSES, elaborando-se, portanto, a tabela de distribuio de frequncias.

EXEMPLO 4 _ Elabore uma tabela de distribuio c)e /i'equncias (dados agrupados) da varivcllDADE (em anos) dos 30 estudantes de Cale. probo Est I, Turno: Manh, Turma 04, Perodo: 97.1, conforme
DADOS BRUTOS

U:ulos Bmlos

abaixo:
HOL [STATSTlCO (crcsccntc)

27 18 21 19 19 23 20 21

21 23 23 21 21 27 18 18 22 19 19 18 19 18 18 20 19 24 20 21 20 21

18 18 18 19 19 19 21 2 I 21 23 23 23

18 19 21 24

18 20 21 27

18 19 19 20 20 20 21 21 22 27

Passo 1: Efetuar o Rol Estatstico Passo 2: Amplitude TotaI----> AI' = 27 - 18 = 9

Passo 3: Nmero de classes ---> k

= J3 ~ 5 (aproximao
9
anos

por falta)

e Amplitude de classe

c:)

h~

k = 5" = 1,8 == 2

AT

Passo 4: AGRUPAMENTO

EM CLASSES

+ FREQUNCIAS

SIMPLES DE CLASSES

Tabela 1.5 _ DISTRIBUiO DE FREQUNCIAS DAS IDADES (em GIIO.\) DE 30 ESTUDANTES DE CALCo PROBo ESTATSTICA 1- TURNO: MANH, TURMA: 04,
PERODO: 97.1
i

IDADES
(allo.\) 18

W-

Estudanles

.
20

1--"""'--

20 \------ 22 22 1------' 24
24 1------ 26 ~\-----28 Total ou L
FONTE: Tabela 1.1 NOTA: Dos 31 respondentes,

12 11 4 1
2 30

1 no informou a idade.

J]

A seguir, analisaremos alguns CONCEITOS Frequncia por Intervalos ou Classes.


I.

ESSENCIAIS

numa Distribuio

de

LIMITES DE CLASSES: Li : Limite inferior de classe ~ Ls : Limite superior de classe

Classe ou Intervalo de classe -------> Li (incluir) Por exemplo, distribuio das Idades, tabela 1.5: 1 classe -----> Li = ii. AMPLITUDE

1------ Ls

(excluir)

181-----

Ls = 20

2 classe -----> Li = 20

1----- Ls = 22,

etc.

DE CLASSE: Iti

= Ls - Li,

amplitude da i-sima classe.

Por exemplo, distribuio das Idades, tabela 1.5: 1 classe --> It 1 = 20 - I 8 = 2 2 classe --> "2
=

22 - 20 = 2 ,

... ,

s classe

--> 115 = 28 - 26

=2

Como as classes tm mesma amplitude denominamos, simplesmente, por PONTO MEDIO DE CLASSE: X ,=

,,= Li - Ls

11I.

L +L 2 S,
I

ponto mdio da i-sima classe.

Por exemplo, distribuio das Idades, tabela 1.5: 1- classe ---> XI


a

18 + 20 2'

19 .

2- classe ---> Xl

20 = --- + 22 = 21 2 +17 , ou seja por ex.:

No caso de classes com mesma amplitude It, tomamos: 2 classe -----> Xl + Iz = 19 + 2 = 21 3 classe

x,.. = Xi

-----> Xl + It = 21

+ 2 = 23 etc.

I:';i':'u:",,',','um'
IV.

;-TI~S'I)E:F1U1QUNCIAS,SIMPLES OU ABSOLUTA DE CLASSE

I
de observaes)

FREQUNCIA

fi : frequncia simples da i-sima classe (nmero


k

L/;
i=1

L/;
=

= 11 (hmero total de observaes)

Por ex.~ /1

12

/2 = 11

/]=4

/4= I

/5=2

L.I; = /I = 30

14

--

5.

FREQUNCIA

RELATIVA

E PERCENTlJAL

DE CLASSE

FREQUNClA UELATIVA (i-sima classe ou valor) :

Lfli

fiJ~ = -n

,1;

(Razao cntrc a fi ~" 1 -') Tcquencla Slll1Pes e o to ta Id e o bservaoes

= 1 (soma das frequncias relativas)

FREQUNCIA PERCENTUAL (i-sima classe ou valor) :

f/lo

= fli ' 100

ou

,I; % = .1: , 100


11

L.I: % = 100
6. FREQUNCIA

(soma das frequncias percentuais) SIMPL~S ACUMlJLADA (do tipo "abaixo de")

F; = /1 + /2 + /3 +'" +.1: ,
7. FREQUNCIA RELATIVA

frequncia simples acumulada da i-sima classe ou valor


E PERCENTlJAL ACUMULADA

Fr;

= /r
J

+ fr2 + fr3 +'" + fi~ , frequncia relativa acumulada da i-sima classe ou valor
frequncia percentual acumulada classe ou valor .__._ .
Freq.Perc.
.

P~% = /1%+ /2 % + /3%+---+,1;%

da i-sima

___

T_a._b_c~~.ie..~te~ldida) - !?J.~T~1B l:!~S.~_Q.~~.~q.~~.~~9.~D ..o._~ . AS.:~~T~ R..i\~


ALTURAS (cm) P. Mdio
Xi

Freq. Simples

fi
1 4 12 9 3 __ ................... 29

Freq. Relativa fr;


......

Freq. Percentual fi %
..

Freq.Simples

ACUI11. Acum. .......I'i....................F;OJo

150 1157 1----164 \-171 1-178 L --_.[-

........

157 164 171 178 185

_~_
~

153,5 160,5 167,5 174,5 181,5

0,034 0,138 0,415 0,310

3,4 13,8 41;5 31,0


.__ .__

1 5 1-7 26
29

3,4 17,2 58,7 89,7


100,0

0,103, __ .. _ ..... _.IO,}


....

Total ouL

1,000

100,0

4 _ REPRESENTACES

GRFICAS DAS DISTRlllUlCES

DE FREOUNCIAS

grfico csttstico uma forma de apresentao dos dados estatisticos, cujo objetivo o de produzir, no investigador ou no pblico em geral, uma impresso rpida e viva do fenmeno em estudo, j que os grficos falam mais rpidos que as sries ( tabelas ). Para tornarmos possvel uma representao grfica, estabelecemos uma correspondncia entre os termos da srie e determinada figura geomtrica, de tal modo que cada elemento da srie seja representado por uma figura proporcional.

15

- REQUISITOS
A representao grfica de um fcnmcno dcve ohcdcccr aos seguintcs rcquisitos primurdiais: a) Simplicidade - indispensvel devido neccssidade de levar a uma rpida apreenso do scntido geral du fcnmcno aprcscntado a fim dc no 110S perdcrlllos na observao de mincias de importncia secundria. b) Clarcza - o grfico deve possibilitar uma correta interpretao dos valores represcntativos do fcnmeno cm cstudo. c) Veroacidadc - indispensvel qualqucr cOlllcntilrio, posto que, sc no reprcsenta uma realidade, o grfico perdc sua linalidade. Os principais tipos de grficos cstatsticos para as distribuics de frequncias so os DIAGRAMAS, os quais so grficos geomtricos de, no mximo duas dimenses. Para sua construo, em geral, fazemos uso do sistema cartesiano. Dentre os principais tipos de diagramas destacamos, segundo a varivel em estudo: Varivel Qualitativa"
GRFICOS EM BARRAS OU COLUNAS, GRFICOS EM SETORES rDistribuio por Valores to) GRFICO EM COLUNAS (ou Basto)

Varivel Quantitativa ~ . lDistribuio

por Intervalos "') HISTOGRAMA,


FREQUNClAS

POLGONO

DE

GRFICO

EM COLUNAS

OU BARRAS

- a representao

retngulos,
GRFICO

dispostos ho,oizontalrnente

(em barras) ou

de uma srie por meio dc vCloticalrncntc (cm colunas).

Exemplo: Grfico 1.
POR SETORES - o grfico que representa as partes de um todo, por setores de um crculo, visando justamente comparar estas partes entre si e em relao ao todo.

Excmplo: Grfico 2. Procedncia dos Estudantes ele Calco Probo Estatstica I Turno: Manh, Turma: 04, Pcrodo: 97.] . Grfico]
30

Grfico 2

O,Regio

' c: c<ll :J t:r

lU

Inlerior

Capilal

Li: o
Capital

<Il

Interior

O.Regio

Procedncia

16

HISTOGRAMA _ a representao grlica de ullIa distrihuio de fj'equncias de uma varivel quantitativa (dados agrupados) por meio de retflngulos justapostos centrados nos pontos mdios das classes e cujas reas so propoll.:ionais s li'clJuncias das c1asscs. Exemplo: Grlico 3 Grfico 3:

Alturas dos estudantes de Cale. Probo Estatstica I Turno: Manh, Turma: 04, Perodo: 97.1

~. 14 F requenCla .

12 10

__ ._-_ --~ ..
I

-----

ll

r=.-::.:::::::::::::

...._.

8
6 4

:=;':=':=:::t-:::::=:::=.... ----~E.....~ _.----- ... ~.,._ -_ ......... --,,--.t===.;~E~. -----... E--.


r.::::=::: ... --.:::--=...-=: .. ................ ............... _ ...::::=;===t::::::::::~:-:='

-_

_ --

2 O

=:,~E:;:::-==F.~= .. ::=:=:=:;t:-..::.:.::.:..:-==E:'=-=.::~-_.-=~ .._._.. .. _ ... . _ _ ~::-':::E:?:;:::::"::-:'E==.:: ..=:"00;=:' ---====r:: :~~:-:=t::~::~r.:::--~


146,5153,5160.5 167,5174,5181,5188,5

Altura
POLGONO. DE FREQUNCIAS - a representao grfica de uma distribuio de frequncias por meio de uma linha poligonal fechada ou polgono, cuja rea total igual a do histograma. Exemplo: Grfico 4. Grfico 4:

Alturas dos estudantes de Calc. Probo Est I Turno: Manh, Turma: 04, Perodo: 97.1

14
Frequncia

12
10

Polgono de frequncia

8
6 4 2 O
146,5 153,5 160,5 167,5 174,5 181,5 188,5

Altura

17

15 -

MEDIDAS

DE POSiO

Vimos anteriormente a sintetizao dos dados sob a forma de tabelas, grficos e distribuies de frequncias. Aqui, vamos aprender o clculo de medidas que possibilitem representar um conjunto de dados (valores de uma varivel quantitativa, isto , informaes numricas), relativos observao de determinado fenmeno de forma reduzida. Estes ndices estatsticos so as MEDIDAS DE POSiO e, dentre as mais importantes, citamos as Mcdidas dc Tcndncia Ccnh"al, que recebem tal denominao pelo fato dos dados observados tenderem, em geral, a se concentrar em torno de valores centrais. Dentre as medidas de tendncia central, destacamos: a Mdia aritmtica ou Mdia; :1 Mod:l; a Mcdi:lna. As outras medidas de posio so as SEIlARATRIZES, a prpria I11cdian:l; os q uar.tis; os pCI'ccntis. 1. MDIA ARITMTICA (ou simplesmente MDIA) que englobam:

Dcfinio 5.1: (a) Dada uma populao constituda de N elementos, Xl, X2, ..., XN sua mdia, denotada por ~ , mede o valor mdio do cOl~unto de dados, sendo expressa na mesma unidade, e definida por: XI + X2+. ..+X N
N

fl=-----

ou

J1=}j

:LX;

( Mdia populacional).

Eg. (I)

(b) Dada uma amostra consttuda de n elementos, X" X2, ..., XIl denotada

sua mdia,

X, ser definida por: XI +X2 +"""+X"


11

x=

ou

- = --' LX X
11

(Mdia amostrai)

Eq. (2)

Exemplo: Determinar a mdia do seguinte conjunto (amostra) de valores Xi: 3, 7,8, 10, I]

Logo, X

L _ = -- X; - 3 + 7 + 85+ 10 + 11 =>
11

= 7,8

18

----

(c) MDIA ARITMTICA PARA DISTRIBUIES

DE FREQUNCIA
11

Seja um conjunto de dados ( uma amostra) constituda de , X Z, X2, ..., Xk ocorrendo com respectivas n.equnciasll'

valores da varivcl X, isto de modo que

12, ...,Ik

~fi".

li .

A mdia aritmtica (ou simplesmente mdia) de X, dcnotada X, definida por:

- = 2:X. .r
X
I

L.r

ou simplcsmcnte

-~; _ '" X 1.'. ./\ _ L-J


li

r.

El).

(J)

onde

"O~ ~/i

o IIlllCIO dClllclllos do COlljlllllo. de

013S.: A expresso acima usada tanto no caso dc distrihui~:lo dc lIcqulll.:ias por vallllcs, como para dados agrupados CllI dasscs. No scgulldo caso, os X 'i. ' rcprcsclltalllos pontos mdios de classes. Exemplo: Determinar a mdia do scguinlc conjunto de valorcs, 2, 8, 5, 3, 8, 2, 2, 5, 8, 2, 5, 8 e 2 Xi 2
3 5 8

Xi: 2, 3, 8, 8, 5, 2, 2,

ti
8 2
4 6

Xi*~
16 6

20
48

20

90

Portanto, aplicando a Eq. (3), vem:

= "X.f L. i.;

Li; = 20

90

=>

= -1,5

11

L/i = 20

OB5.: A Equao (3) uma adequao da equao (2) no caso de um conjunto de valores

X' is com elementos repetidos.


VANTAGENS E DESVANTAGENS DA MDIA

1. uma medida de tendncia central que por uniformizar os valores de um cOI~unto de dados, no representa bem os conjuntos que revelam tendncias extremas. Ou seja, grandemente influenciada pelos valores extremos (grandes) do COI~unto. 2. No pode ser calculada para distribuies de frequncias com limites indeterminados (indefinidos).

19

Excmplo:

impossvel

calcular

a IIIl~dia da dislribui(,:;'lo abaixo,

reprcsclllaliva

das id;l<les

dc um grupo de 300 pessoas.

IJ.JAIJ/';S (AI/fJ.\) Mcnos dc 33 33 1------- 35 35 1------- 37 37 1------- 3 <)


3 <) 4I

NJ

de /Jesso(JS

~ I 21

52 I XC>

1------011

4I

JX
2

mais

Desprezando as classes aherlas, islo , com limites indeterminadus, a sim, poderi.1I110S calcular a rclc.ida lIIdia.

TolnJ ou

JOO
e de lIIaior elllprego.

3. o promdio

mais cOllhccido

4. facilmcntc calculvcl. 5. Pode ser tratada algebricamcnte (ver propricdadcs). 6. Serve para compararmos cOI~untos semelhantes. 7. particularmente indicada para sries (conjuntos) que possucm os valores simtricos cm relao a um valor mdio e de frequncia mxima. 8. Dcpendc de todos os valores do cOltiunto de dados. Propriedades: " L(X; - x) = O.
;~ I

1 - A soma dos desvios tomados em relao mdia nula, isto ,

2 - Somando-se ou subtraindo-se uma constantc (c) a todos os valorcs de uma varivel, a mdia do conjunto fica aumentada ou diminuda dessa constante, isto ,

1'; = Xi

:t c=> Y

=X
-

:f: c

3 - Multplicando-sc ou dividindo-se todos os valores de lima varivel por uma constante (c), a mdia do conjunto fica multiplicada ou dividida por essa constante, isto ,

= X * c => Y =
I

X'" c ou Y

=X

-;-c => Y

=X

-;-c,

I)ara

c:;t:O.

2. MODA Definio 5.2: Dado m conjunto de valores, a moda, denotada A/o, o valor que ocorre com maior frecjuncia, ou seja, o valor mais frequente do conjunto de dados.

20

OBS.:
i) A moda de um conjunto de dados pode no existir (figura (a) ) ii) A moda de um conjunto de dados pode no ser nica (figura (c) )
f f f'

(a)

(b)

~(C)

(no existe moda)

(unmodal)

(bimodal)

Exemplo: Determine a moda dos seguintes conjuntos de dados abaixo a) 2, 2, 3, 3, 5, 5, 8, 8 b) 2,2,3, 5,5,5,8,8 c) 2,2,2, 3, 3, 5, 5, 5,8

=> No existe moda.


=> }\.t/o => Mo
=

5 = 2 e Alo = 5

_ CLCULO DA MODA PARA DADOS AGRUPADOS Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe modal que possui a maior frequncia, e, conseqentemente, ser esta classe que conter a moda. FRMULA de CZUBER (il1terpreta~~o geomtrica atravs de Histograma)

Mo ~ L., +

C" ~'l1J."..

onde: Lmo : limite inferior da classe modal hmo : amplitude da classe modal Mo classe modal Exemplo: Utilizando os dados apresentados na tabela 1.4, determine a ALTURA MODAL dos 29 estudantes de Clc~lo das. Probabilidades. e Estatstica I - Turno: Manh, Turma: 04, Perodo: 97.1 Classe modal (2 .) 164
a

Classes

!J.l = [moda/ - [allterior !J.2 = hll(J(lal-fpo.'iterior

1-----

171 ,

Ll110

164 ,

h1l0

12,'

hmo = 7

21

______________________________

.11 = /'mx
Logo, Mo

fwll

= 12 -

4 = 8;

L1.z

= /,IUX ou

~}arJ

= 12 - 9 = 3
Mo
=

164+(_8_)*7 = 8+3

169,lcl1l

169cI11

VANTAGENS E DESVANTAGENS DA MODA 1. No depende de todos os valores do conjunto de dados, podendo mesmo no se alterar com a modificao de alguns dcles. 2. No influenciada por valores extremos (grandes) do cOI~unto de dados. 3. Pode ser calculada para distrtbuies com limites indetcrminados (indefinidos) na maioria dos casos.

3. MEDIANA

Definio 5.3: Considere uma srie (conjunto de dados) ordenada, constitudo de li valores. A mediana, denotada Me , o valor que divide o conjunto em duas partes iguais ( isto , em duas partes de 50% cada). Exemplos: a) Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13 Me = 8 (termo de ordem central) (n = 7 mpar)

b) Calcular a mediana do segunte cOI~unto de dados: 2, 3, 5, 8, 9, 11, 13, 15 (n = 8 par) Me

. (8-2-+ 9) = 8,5 (Mdia aritmtica dos termos de ordens centrais)

Verificamos que, estando ordenados os valores de uma srie (conjunto de dados) e sendo 11 o nmero de elementos da srie, o valor mediano ser: - o termo de ordem central
11

+1
2

Me

XliiI 1

se

11

for mpar;

X +X
11

. ,. - a me'd.la antmetlca d os termos d e or d em

-+1

11

11

e -

11

+ I,

}\I

hj

e=

].

se

11

for par.

22

'---------'

CLCULO DA MEDIANA NUMA DISTR.lI3UIO DE FREQUNCIAS a) Dados No-agrllpados Neste caso, para a srie de valores ordenados em ordem crescente de grandeza (i. e., em um rol), a mediana o valor mdio ou a mdia aritmtica dos valores centrais, caso tenhamos um nmero mpar ou par de valores na srie. b) Dados Agrupados em Clas.'.es No caso de dados agrupados, rc1embramos que uma distribuio de frequncias pode ser representada por meio de um Histograma. Dizemos ento que a mediana ser o valor de X (abscissa) cuja ordenada divide a rea total do Histograma em duas partes iguais. Assim, para dados agrupados, a mediana obtida atravs de interpolao de acordo eom a seguinte frmula:

li. 2

---i' flui
Ime

Me

= Ln,.

J
17m

onde:

Lme o limite inferior da classe mediana; fme a frcquncia simples da classe mediana;
Fali!

a frequncia acumulada da classe anterior

50%

50%

ou nJ2

ou nJ2

classe mediana; hme a amplitude da classe mediana; n o total de observaes.

Md

classes

Exemplo: Determinar a ALTURA MEDIANA dos 29 estudantes da turma de Cal. Probo Est I, Turno: Manh, Turma: 04, Perodo: 97.1 - Turno da tarde, conforme os dados agrupados na tabela 1.4 (estendida).

1';2 = 29/2 = 14,5 (50%) ==> Classe mediana (2.) : 164 1----- 171 (Classe mediana:
primeira classe que ultrapassar 50% (n/2) ou mais das observaes) Lme = 164 , .
flfle =

12;

hme=7 ;

F1lI1t

=>

Md == 164+ (

14,5-5J12 *7 == 164+5,5 == 169,5cl1l

ou

Md

170clIl

2]

PROPRIEDADES

DA MEDIANA

i) A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto de dados. ii) A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser calculada.

16.

MEDIDAS

DE DISPEJ{Sol

Na seo anterior, aprendemos a calcular e entender convenientemente as medidas de 'posio representativas de um determinado conjunto de dados, onde destacamos a mdia, a moda e a mediana. Sejam quatro conjuntos A, B, C e O com os seguintes valores: Conjunto A => 7, 7, 7, 7, 7 Conjunto B ==> 5, 6, 7, 8, 9 Conjunto C ==> 4, 5, 7, 9, 10 Conjunto D ==> O, 5, 10, 10, la Para representarmos cada conjunto, podemos calcular a sua respectiva mdia (Eq.( 1,encontrando
-

XA = XIJ = Xc = X D = 7.

Vemos assim que apesar de constituidos de valores diferentes, os grupos revelam uma mesma mdia aritmtica. Observando-os mais detalhadamente, notamos que em cada grupo os valores se distribuem diferentemente em relao mdia 7. Necessitamos assim de uma medida estatstica complementar para melhor caracterizar cada COI~unto apresentado. As medidas estatsticas responsveis pela variao ou disperso dos valores de um conjunto so as medidas de disperso ou de variabilidade, onde se destacam a' amplitude total, a l'ar;llcia, (} desl';o padro e o coeficiente de l'ariao. Em princpio, diremos que entre dois ou mais conjuntos de dados, o mais disperso ( ou menos homogneo ) aquele que tem a maior medida de disperso. 1 - A AMPLITUDE TOTAL Medida j apresentada na elaborao de uma distribuio de frequncias com dados agrupados em classes, denotamos AT. ~

AT = Xn,A' - Xn"."
w.4 ,

onde X nlQX = maior valor do conjunto .

e X.nu" = menor valor do

conjunto. 2- A VARlNCIA A varincia de Um conjunto de dados ( amostra ou populao) mede a variabilidade do conjunto em termos de desvios quadrados em relao mdia aritmtica do conjunto. uma

24

_quantidade sempre no negativa e expressa em unidades quadradas do conjunto de dados, sendo de dificil interpretao. Definio 6.1: a) Seja um conjunto ( populao) varincia denotada constitudo de N elementos XI, X2 .... , XN Sua

cl, definida
=

por:

(52

L:(X/

-)Ir
xf
1

Eq (5) , onde

= k_XI
N
Il

a mdia populacional

b) Seja um conjunto ( amostra ) constitudo de varincia, denotada S2, definida por:

elementos X I, X2, ...

, Xn. Sua

S2 =

L:(X; 11-

Eq (6) , onde

- = --' LX X
/1

a mdia amostrai

OBS.:

A equao (6) utilizada quando -nosso interesse no se restringe descrio dos dados mas, partindo da amostra, visamos tirar inferncias vlidas para sua respectiva populao. No caso de estarmos interessados apenas na descrio dos dados, podemos usar no divisor "em lugar de " - J

Exemplo 2: petermine a varincia do seguinte conjunto (amostra) De acordo com a equao (6)temos:

Xi : 2, 3, 5, 7, 8

.2 (2_5)2 +(3_5)2 +(5_5)2 .5 =-------------. S'2 _ (_3)2 +(_2)2 .. -

+(7_5)2

+(8_5)2

onde

X= LX;
11

5-1 +9 = 26 ==> 4

=5=
S2
=

25

+(0)2 +(2)2 +(3)2 = 9+4+0+4


4 4

6,5

CLCULO DA VARINCIA EM UMA DISTRIBUIO ( Caso de amostra)

DE FREQUNCIAS

Analogamente, a definio apresentada na Equao (6), temos

S2

L(X; /1-

Xr ..1;
1

Eq. ( 7 ) ,

onde fj: frequencias de classes

/1

= 2: f

013S.: No caso de dados ag.-upados os

X'i.>

so os pontos mdios de classes.

25

FRMULA ALTERNATIVA

derivada da Equao ( 7 ) :

s' = LX,' -i. - (LX, -f.)'


/1

ou

S2 =

/1

,.1; L X'.
2

(LX

. .1;)2

/1-1

1/

(/1-1)

Eq. ( 8 )

3 - O DESVIO PADRo urna outra medida de disperso mais comumente empregada do que a varincia, por ser expresso na mesma unidade do conjunto de dados. Mede a "DISPERSO ABSOLUTA" de um conjunto de valores e obtida a partir da varincia. Desvio Padro = + .JVaric./1cia ( Raiz quadrada positiva da Varincia )

Conforme, o conjunto de dados, trate-se de uma populao ou uma amostra, teremos o desvio padro dado por:

Populao =->cr =.tI


. V

L(X; - PY
N

Amostra =--> S ='

L(X -xf
j

/1-1

Do exemplo 2 , dado acima, temos o desvio padro dado por S

= J6:5

=:;===>

S = 2,55

Exemplo 3: Calcular a varincia e o desvio padro para a distribuio de frequncias das ALTURAS dos 29 estudantes de Clculo das Probabilidades e Estatistica I Turno: Manh, Turma: 04, Perodo: 97.1. ALTURAS (cm) 150 1---- 157 1571---- 164 ]64 1---- I 71 171 178 ] 781---- 185 Total ou L; No. Est fi 1 4 ]2 9 3 29 P. Mdio Xi 153,5 ]60,5 167,5 174,5 18],5

Xl
J

X.
J

.,

I;

X.
'

t:
I

T----

23562,25 25760,25 28056,25 30450,25 32942,25

153,5 642 2010 1570,5 544,5 4920,5

23562,5 10304] ,0 336675,0 274052,25 98826,75 836157,5

Varincia .
==>

2
=

11' L; X.
I

2*.f. -t[.X/.f )2 i I
11*(11-])

29*836157,25-(4920,5)2
----------_

_ 37239,95 _ 4586.
_,

29*28

812

Portanto, a varincia das alturas ser: S2


"

= 45,86cm2

Desvio Padro ==> S

= ~Varil1cia = ~45,86cm2 = 6,77cl1l

26

4 - O COEFICiENTE DE VARIAO uma quantidade adimensional e selVe para comparar dois ou mais conjuntos de dados de unidades diferentes. Mede a "DISPERSO RELATIVA" de um conjunto de dados. expresso, usualmente, em percentagem (% ).
Populao Amostra
====> CV

= -11 x 100, = = x 100,


X
S

(Y

sendo que . sendo que

~l :j:;

O
=f:.

=>

CV

O.

Exemplo 4: Calcule o coeficiente de variao (disperso relativa) das ALTURAS dos 29 estudantes da Turma 04 - Turno da Manh de Calc. Probo Est 1 - Perodo: 97.1 Tabela 1.4 Da distribuio das alturas, (tabela 1.4), temos: Altura mdia => X = 169 '67 cm . e o Desvio Padro ===> .\' = 6,77c11l

Cv =

S 6,77cl11 = x 100 = ----

I69,67cm

x 100 = 3 99
"

ou seja. CV = 3 99%
.. '

7. REFERNCIAS

BIBLIOGRFICAS

1. Costa Neto, P.L.O. Estatstica. Editora Edgar Dlucher. 2. Mendenhall, W. Probabilidade e E'sta/slica. Editora Campus, VaI. I e 11.

27

UN1DADEll- INTRODUO PIlOBABILIDADE


11.INTRODUCO das probabilidades pertence ao campo da Matemtica. Sua incluso, neste curso, cujo objetivo essencialmente a Estatstica, encontra explicao no fato de que a maioria dos fenmenos de que trata a Estatstica de natureza aleatria ou. nodeterminstica. Consequentemente, o conhecimento dos aspectos mais fundamentais do clculo da probabilidades uma necessidade essencial para o estudo da Estatstica Inferencial ou Indutiva. Vamos examinar, inicialmente, o que se pode adequadamente denominar modelo determinstico. Por essa expresso pretendemos nos referir a um modelo que estipule as condies sob as quais um experimento executado delerminem exatamente; ou com um erro que pode ser considerado desprezvel, o seu resultado. Por exemplo, se introduzirmos uma bateria em um circuito simples, o modelo matemtico que descreveria o Ouxo de corrente eltrica seria I = E/R, isto , a Lei de Ohm. O modelo determina com exatido o valor de I ao fornecermos os valores de E eR, diferena de potencial e resistncia, respectivamente. Para um grande nmero. de situaes, o modelo matemtico determinstico apresentado acima suficiente. Contudo, existem tambm muitos fenmenos que requerem um modelo matemtico diferente para sua investigao. Existem experimentos em que, mesmo considerando todos os fatores que influenciam no resultado, existe algum fator casual que no consegue-se controlar. Tais experimentos so, frequentemente, denominados no-determinsticos ou aleatrios. De fato, estamos falando de um modelo no-determinstico para um experimento. As principais caractersticas de um experimento aleatrio so: a) Pode-se repetir indefinidamente sob as mesmas condies. b) Pode-se descrever todos os possveis resultados do experimento. c) Depois de um grande nmero de repeties do experimento, surge uma configurao definida ou uma regularidade. esta regularidade que torna possvel construir um modelo matemtico preciso, com o qual se analisar o experimento. EXEMPLOS: 1. 2. 3. 4. Jogar Jogar Jogar Peas um dado e observar o nmero mostrado na face de cima. uma moeda duas vezes e observar a sequncia de caras e coroas obtidas. uma moeda duas vezes e observar o nmero de caras obtidas. so produzidas at que 10 peas perfeitas sejam produzidas. O nmero total de

o clculo

peas fabricadas contado. 5. Uma lmpada fabricada e em seguida ensaida quanto durao de vida, pela colocao em um soquete. O tempo decorrido (em horas) at queimar anotado.

objetivo

bsico da teoria das probabilidades

criar um modelo terico

que

represente estes experimentos.

28

12. ESPAO

AMOSTRALEEVENTOS

Definio 2.1: Definiremos e.\pao amostraI, para cada experimento aleatrio E, como o
conjunto de todos os possveis resultados do experimento, e o denotaremos porO. EXEMPLO 2.1: Determine os espaos amostrais associados aos cxperimentos dos excmplos anteriores.

SOLUO: {I ,2,3,4,5,6} .02 = {(Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co)}, onde Ca c Co reprcsentam a ocorrncia de cara e coroa, respectivamente. E3 ~ .03= {O,1,2} E4 ~ .04= {IO,11,12, .... } Es ~ .os = {t E ~H t ~O) /
~

E1

.o) =

2 ~

A fim de descrever um espao amostrai associado a um experimento, devemos ter bastante claro o que estamos mensurando ou observando. Por isso, devemos falar de "um" espao amostrai e no de "o",espao amostraI. Vcja a diferena entre .o2e fh Saliente-se, tambm, que o rcsultado de um cxperimcnto no nccessariamente, um nmero. Por exemplo, em E2, cada resultado .um sequncia de Caras (Ca) e Coroas (Co).

Definio 2.2: Um evento A (relativo a um particular espao amostrai

.o, associado a um experimento E) um conjunto de resultados do experimento, isto , qualquer subconjunto do espao amostrai um evento.

Diz-se que "ocorre o evento A", quando o resultado do experimeno aleatrio for um elemento de A. Em particular, o conjunto universo, .o, e o conjunto vazio, ~, so tambm eventos, onde .o denominado de evento certo e q, evento impossvel. Se A contm apenas um elemento, dizemos que A um evento elementar ou simples. A partir das operaes entre cOI~untos (Apndice A) podemos formar novos eventos, tais como:

* *
*

A u B o evento que ocorrer se e somente se A ou B ou ambos ocorrerem. A (1 B o evento que ocorrer se e somente se A .. B ocorrerem simultancamcntc.
A ocorrer se e somente se no ocorrer A.

A - B ocorrer se.e somente se ocorrer A e no ocorrer

n.

Definio 2.3: Dois eventos A e B, so ditos mutuamente excludentes (M.E.), se eles no puderem ocorrer simultaneamente, isto , A (1 B = ljJ .

29

EXEMPLO 2.2: Lanar um dado e observar a face voltada para Cima. Considere os
seguintes cventos: A: B: C: D: o nmero o nmero o nmero o nmero par. impar. maior que 4. menor ou igual a 2.

Determine os eventos: . a) n, A, B, C e D. b) A u B, A n B, A u 13, A n B c) A, B, A u B, A n H d) Quais os eventos mutuamentc excludentes? SOLUO: a)


-

n=

{1,2,3,4,5,6}, A = {2,4,6}, B = {l,3,5}, C = {5,6}, 0=

{l,2}

b) A u B = {1,2,3,4,5,6} = o evento certo A n B = <I> o evento impossvel :

n:

AuB

=<1>

AnB=n
c) A = {l,3,5} AnB

B - AuB = {1,2,3,4,5,6} =.Q= - -=<1>= AuIJ

--

12,4,6}

AnB

AnD=(2} d) A n C = {6} : cvcnto elcmentar BnD={I} BnC= {5} CnD=<I> Os eventos A e B, assim como os eventos C e O, so mutuamente excludentes. Obs: Note que o item c) exemplifica as leis de "De Morgan". (ver Apndice A)

30

3. NOCESFUNDAMENTAJS DE rl{OBAllILlDADE

Definio

3.1: Seja E um experimento

e D. um espao amostrai associado a E. Probabilidade uma funo P que associa a cada evento A E F(D.) a um nmero real representada por P(A) e denominada probabilidade do evento A, satisfazendo aos seguintes axiomas:

1. O::;;P(A) ::;;1. 2. P(D.) = 1. .3. Se A e B forem evento.s mutuamente excludentes, P(A u 13) = P(A) + P(B) Se AI, A2, ... , An, . forem, dois a dois, eventos mutuamente excludentes, ento, P(u:1AJ

= P(A,)

+ P(Az )+ ... +P(A,,)+ ... = L P(A;)


kl

'"

Por enquanto, no sabemos como calcular P(A). Ns apenas arrolamos algumas propriedades gerais que P(A) possui. Vamos, inicialmente, enunciar e demonstrar algumas consequncias relacionadas a P(A) que decorrem das condies acima e que no dependem da maneira pela qual ns relmente calculamos P(A).

PROPRIEDADES

FUNDAMENTAIS

Propriedade j.1: Se ~ for o cOI~unto vazio, ento P(4,)=O. Demonstrao: Para qualquer evento A, sabemos que
A=Au~ e
A n<p=~

Ento, A e 4> so eventos mutuamente cxcludentes. De 3. temos P(A) = P(A u <fi) Portanto, P( 4 = O
=

= P(A)

+ P(<fi), logo P(A)

P(A) + P(~)

Propriedade 3.2: Se A for o evcnto complcmcntar dc A, cnto P( A) Demonstrao: Para qualquer evento A, sabemos que
D.=AuA

I - P(A).

<fi=AnA

Ento, A c A so eventos mutuamente excludcntes. De 3. tcmos

p(n)=p(Au

A) = P(A) + P( A ).

De 2. Temos

31

----,

1 = P(A) + P( A) . Logo, P(A)

1- P(A).

Propriedade 3.3:Se A e B forem eventos quaisquer tais que A c B ento P(A) ~ P(B). Demollstrao: Sabemos que
B = A u (B nA) , onde A e (8 nA) Consequentemente, P(B) so eventos mutuamente excludentes.

= P(A)

+ P(B nA) ~ P(A), porque P(B nA) ;::O, pelo axioma 1.

Propriedade 3.4: Se 'A e B so dois eventos quaisquer, ento


P(A u B) = P(A) + P(B) - P(A n B)

Denumstrao: Podemos escrever


A u B = A u (Bn A ) , onde A e (B nA) so eventos mutuamente excludentes e B = (A n B) u (B nA), onde (A tl B) e (B nA) so eventos mutuamente excludentes Do axioma 3. temos, P(A u B) = P(A) + P(B nA) P(B) = P(A n B) + P(B nA).

Assim, P(B nA) = P(I3) - P(A

e-

tl

B)

Ento, P(A u B) = P(A) + P(B) - P(A n I3) Como exerccio pode-se facilmente provar a propriedade acima para trs eventos. Se A, B e C so trs eventos quaisquer, ento

P(A uB uC) = P(A) + P(B) + P(C) - P(A nI3) - P(A nC) - P(B nC) + P(A nBne)

4.PROBABJLIDADE

EM 'ESPAOS AMOSTRAIS FINITOS EEQUIPROV VEIS

Definio 4.1:Seja

espao amostrai associado a um experimento aleatrio E com um nmero finito de resultados possiveis, Ento, .n pode ser escrito da seguinte forma:-, .n = {a\,a2,...,a e seja Ai = {ad i=I,2, ...,n todos os eventos elementares de Q. A cada evento elementar {ai} associaremos um nmero pi, denominado de probabilidade de {ai}, que satisfaa s seguintes condies:
ll }

.n um

]2

1. Pi ~ o, i = 1,2, ... , n. 2. PI + P2 + ... + p" = I Como {ad um evento, essas condies so coerentes com aquelas postuladas para as probabilidades dos eventos em geral, isto , com os axiomas da definio 3.1. Suponha, agora, que um evento I3 seja constitudo de k resultados, I S; k S; n, a saber,
B= {a l,a2, ... ,al;},

onde 1,2, ... ,k representam qualquer dos k ndices, de I at n. Consequentemente, do axioma 3 da definio de probabilidade (3. I) que
P(B)

conclui-se

= 1'1 -I- Pl + ... + 1'1;

EXEMPLO

4.1: Trs cavalos, A, I3 e C, esto numa corrida; A duas vezes mais provvel de ganhar que B e I3 duas vezes mais do que C. Quais so as probabilidades de vitria de cada um, isto , P(A), P(B) e P(C) ? Seja P(C) = P; como B duas vezes mais provvel de ganhar do que C, P(B)=2p; e como A duas vezes mais provvel do que B, P(A) = 2P(B) = . 2(2p) = 4p. Como a soma das probabilidades tem que ser I; ento p+2p-l-4p=1 Logo, P(A) = 4/7; ou 7p=1 P(B) = 2/7 ou e 1'=1/7. P(C) = 1/7

SOLUO:

Pergunta: Qual a probabilidade de que B ou C ganhe? Por definio, P(B u C) = P(B) + P(C) = 2/7 + 1/7 = 3/7

Definio 4.2: Seja um espao amostrai


consideremos amostrai

{a\,a2,...,an} associado a um experimento E e Ai = {ad i= I ,2, ... ,n os eventos elementares de .0.. O espao equiprovve! se

.o. =

.o. dito

P(Ai) = p, i = 1,2, ..., n, ou seja, se todos os eventos elementares so igualmente provveis. Consequentemente, das condies 1. e 2. da definio 4.1, vem:

1. pi=P~O, i=1,2, ...,n. 2. Pi + P2 + ... + pn':: P + P + ... + p = 1 De 2. tem-se que np = 1 e consequentemcnte, p = 1/n.

33
I

Logo, se o espao amostrai equiprovvcl, a probabilidade de cada um dos pontos 1/n. Disto decorre que, para qualquer evento B formado de k resultados, I ~ k ~
k . l1(lJ) ou seja, P(B) =--= /1(0)
11,

tem-se

P(B)

= -,

11

n' de casos favoravcis . . n' de casos pOSSlvels

EXEM PLO 4.2: Selecione aleatoriamente uma carta de um baralho comum de 52 cartas. Sejam A: a carta uma espada e B: a carta uma figura. Calcule P(A), P(B) e P(A n 13) SOLUO: Como temos um espao cquiprovvel,
/10' de e.\fJadas 13 P(A)=----=-=/10' de carlas 52

P(B) =

/lO'de fi~lIras
11'"

de cartas

<

12. 3 =-=-

52

13

P(A n B)

= /I'"

defigllras de e.\]Jadas 3 lI'"~de carlas = 52

IS.PROBABILlDADECONDICIONADA

EXEMPLO

5.1: Um lote formado pelos seguintes artigos: 80 no defeituosos e 20 defeituosos. Dois artigos so retirados do lote. Sejam A= {o 10 artigo defeituoso} e B={ o 2 artigo defeituoso}. Calcule P(A) e 1'(13),a) com reposio; b) scm reposio.

SOLUO: a) Se extrairmos com reposio, P(A)

= PC}]) = 29{00

X, pois cada vez que estivermos

extraindo do lote, existiro 20 peas defeituosas no total de 100. b) Se estivermos extraindo sem reposio, ainda verdade que P(A) =

X. Mas e sobre

P(B)?

evidente que, a fim de calcularmos P(B) necessrio conhecer a composio do

lote no momento de se extrair a segunda pea. Isto , devemos saber se A ocorreu ou nao. Estl? ex.emplo mostra a necessiuade de se introduzir o seguinte conceito. Sejam A e B dois eventos associados ao experimento E. Denotaremos por P(BI A) a

probabilidade condicionada do evento B, qua/ldo A tiver ocorrido.

34

Sempre que calcularmos P(I3/A), estaremos essencialmente calculando P(B) em relao ao espao amoslral reduzido A, em lugar de faz-lo em relao ao espao original n. EXEMPLO 5.2: Dois dados onde Xi eventos: Determine: honestos so lanados, registrando-se o resultado como (XI,X2), o resultado do i-simo dado, i= 1,2. Considere os seguintes A={(xI,xz)/ XI + X2= lO} e 13={(xl,x2)1 XI> X2}. P(A), P(B), P(A n B), P(B/A) e I>(NB).

SOLUO:

O espao amostraI .o pode ser representado pela seguinte lista de 36 resultados igualmente provveis.

(1,1),(1,2),

, (1,6), , (2 :6),
. ~,

.o =

(2,1), (2,2),
~.

..................... .
(6,1), (6,2), ... , (6,6)

11(.0)=36,

A= {(5,5),( 4,6),(6,4)}, n(A) = 3 Portanto, P(A)=-, 36 3


3

B= {(2, 1),(3, I),(3,2), ... ,( 6,5)}

A n 13={(6,4)}

n(B) = 15 P(B)=-, 36
15

n(A n B) = 1

P(AnH)=-, 36

P(B I A) =..!., uma vez que o espao amostrai , agora, formado por A.
De modo equivalente, ternos P( A / B)

= _1 .
15

Se fizermos um exame cuidadoso dos vrios nmeros calculados, concluiremos que P(B / A)= P(A nB) . P(A) e
P(A / 13)

= f}(A

n B)

P(B)

Essas relaes no surgiram apenas neste caso particular. Ao contrrio, so bastante gerais, e nos do caminho para definir a probabilidade condicionada. Defi"io 5.1: Sejam A e B dois eventos quaisquer de um mesmo espao amostrai Q. Chamamos probabilidade do evento A, dado que o evento 13 ocorreu, ao seguinte quociente: P(A / li) = _P_(A_n_IJ_) se P(B) > O P(J-J) , Obsen'aes: 1. Se P(B)

= O, nada

podemos afirmar a respeito da probabilidade condicional.

35

. . P(t/J) 2. Se A e B forem mutuamcntc excludentcs, cnto P(A / H) = -I/(A

P(H) = O.
_ n(A n H) n(/1)

n H)/
In(D.)
H)/ /1/(0.)

3. No espao amostrai finito equiprovvel,

l'(A / H)

=
1/(

EXEMPLO 5.3: Um laboratrio de pesquisa possui 10 terminais d computadores. Algumas


dessas mquinas so micro-computadores (M) e outras so estaes de trabalho (E); algumas so novas (N) enquanto outras so muito usadas (U), de acordo com a tabela abaixo. Uma pessoa entra no laboratrio, pega uma 'mquina ao acaso, e descobre que nova. Qual a probabilidade de que seja um micro-computador?

Me uinas
Tempo de uso N lJ Total
M

4
2

E 3
I

Total

7
3 10

SOLUO: Considerando-se somente o espao amostrai reduzido N (isto , as 7 mquinas


novas), temos P(M / N) = 4 / 7. Empregando a definio de probabilidade condicional, temos
P(M / N)

P(M n N) = 4/ 10_ 4 P(N) 7 /l0-7

A mais importante consequncia da definio de probabilidade condicional acima, o seguinte teorema. Teorema 5.1 (Teorema da Multiplicao de Probabilidade.\):

Sejam A e B dois eventos quaisquer de um mesmo espao amostrai P(A n B) Obsen'ao:

.o, ento:
P(lJ / A)

= P(B)*

P(A / B)

ou

P(A n H)

= P(A)*

O teorema da multiplicao de probabilidades pode ser generalizado

para mais

de dois eventos. Sejam AI, A2, . , Ao eventos quaisquer de um mesmo probabilidade da ocorrncia simultnea de AI, A2, .. , Ao dada por: espao amostrai 0., a

P(AI n A2 n... An) = P(AI)*P(A2/At)* ... *P(A,,/At n A2 n

(\ ... (\

Ao-I)

](,

EXEMPLO .

5.4: Uma caixa contm 4 lmpadas boas e 2 queimadas. Retira-se ao acaso 3 . lmpadas, sem reposio. Calcule a probabilidade dessas 3 lmpadas serem boas.

SOLUO:

Seja Ai: a i-sima lmpada boa, ento P(A1 n A2 n A3) = P(A1)*P(A2/A1)*P(A"/A1


4 3 2 n A2) = - * - * -

= -. 4 5

At aqui, empregamos o conceito de probabilidade condicional a lim de avaliar a probabilidade de ocorrncia conjunta de dois ou mais eventos. Veremos, no prximo teorema, como aplicar esse conceito para calcular, de outra maneira, ti probabilidade de um evento qualquer A. Teorema 5.2 (Teorema da Probabilidade Total):Sejam A um evento qualquer do espao amostraI n e BI, B2, ... , Bk uma partio do mesmo espao amostrai n, ento: P(A) =.P(N B1)P(BJ) Demonstrao:

+ P(AI B2)P(132) + ... + P(AI UdP(Bd =

L P(A ;=.

/ H; )P(H

j)

Como A = (A l B1) u (A n B2) u u (A l Bk) e (A n B.), (A (A n I3k) so eventos mutuall'n"fn " r-I"ri,-.'ltes,temos P(A) = P(A
l

B2),

... ,

B1) + P(A n B2) + ." + P(A n Bk).

Pelo teorema da multiplicao de probabilidades, temos P(A) = P(N B1)P(31)

+ P(N B2)P(B2) + ...+ l(AI 3k)P(Uk)

EXEMI)LO

5.5: Voltando ao exemplo 5.1, calcule a P(U) se as retiradas dos artigos so feitas sem reposio. Comoj vimos P(A) =~. Logo, pela propriedade 3.2, temos que F(A) =~.

SOLUO:

Agora, P(B / A) = ~, porque se A tiver ocorrido, ento na segunda extrao 99 restaro somente 99 peas, das quais 19 delas sero defeituosas. De modo similar, temos que P(JJ / A) = 20 . Pelo teorema da probabilidade total, temos

99
P(Bp= P(B / A)P(A)

::

+ P(/J / A)P(A)

= -*- + -*- = -. 99 5 99 5 5

19

20

37

EXEMPLO 5.6: Uma determinada pea manufatura por trs fbricas, digamos A, B e C.
Sabe-se que A. produz o dobro de peas que 13, e que fi e C produzem o mesmo nmero de peas. Sabe-se tambm que 2% de peas produzidas por A assim como por fi so defeituosas, enquanto que 4% daquelas produzidas por C so defeituosas. Todas as peas so colocadas em um depsito, e depois uma pea extrada ao acaso. Qual a probabilidade de que essa pea seja defeituosa? SOLUO: Seja os eventos A={a pea provm da fbrica A}, B={a pea provm da fbrica B}, C= {a pea provm da fbrica C} e D= {a pea defeituosa} . Temos que P(A)=2P(B), e P(B)=P(C). Substituindo essas P(A)+P(B)+P(C)=l, temos que 2P(B)+P(il)+P(B) = 1, logo, . P(B)=P(C)= 1/4, enqualito que 1'(1\) = 1/2. relaes em

Como queremos determinar P(D) e os eventos A, B e C formam uma partio do espao amostraI, podemos aplicar o teorema da probabilidade total, o qual escreveremos como P(D) = P(D/A)P(A) + P(D/B)P(B) + P(D/C)P(C). Pelo enunciado do problema, temos que P(D/A) = P(DIB) = 0,02, enquanto P(D/C) = 0,04. Levando-se esses valores expresso acima, encontraremos
1 1 P(D) = O 02* - + O 02* -

2'

4'

+ O 04* - == O 025
4'

16 TEOREMADEBAYES

Poderemos empregar o Exemplo 5.6 para sugerir outro importante resultado. Suponha-se que uma pea seja retirada do depsito e se verifique ser ela defeituosa. Qual a probabilidade de que tenha sido produzida na fbrica A ? Poderemos calcular esta probabilidade pelo seguinte teorema. Teorema 6.1 (Teorema de Bayes): Sejam BI, B2, ... , Bk uma partio do espao amostrai A um evento qualquer associado a .Q , ento:

ne

PC A I Ri) PC B
P(B; I A)

i )

= 'L:=1 P(A

, i = 1,2, ... , k

/ B)P(B)

38

P(B; / A) = P(H; () A) ~ P(A / R, )P(H,)


1JemOltstra(}:

P (A )

P(A)

. .
I

= 1,2, ... , k

Pelo teorema da probabilidade total,

P (A)=

L P (A
./=\

/ B) P ( B ./ ) . Logo, ./

P(B
j

A)

'Ll

I'(A / U; )I'(IJ,)
./)

P(A / J3)P(J-')
j

, i

1,2, ... ,k

}=1

EXEMPLO obtcmos

6.1:Voltando

ao problema proposto acima, e agora aplicando o teorema 6.1, .

P(A / D) =

(0,02)* (I /2) = 040 (0,02)* (1/2) + (0,02)* (1 / 4) + (0,04)* (1/4) ,

EXEMPLO

6.2: Numa certa turma, 1% dos homcns e 4% das mulheres tm menos que 1,60m. de altura. Alm disso, 60% dos estudantes so homens. Ora, se um estudante selecionado aleatoriamente e tem menos que 1,60m. de altura, qual a probabilidade do estudante ser um homem? Sejam A={estudantes de menos de 1,60m. de altura}

SOLUO:

M={ estudantes do sexo feminino} e H={ estudantcs do sexo masculino}. Pelo teorema de Baycs, P H/A = I'(A / II)I'(I/) ( ) P(A / H)P(H) + P(A / M)P(M)

=_

(0,01)*(0.(,0)

=~
1i

(0,01)* (0,60) + (0,04)* (0,40)

17 EVENTOS

INDEPENDENTES

Consideremos dois eventos A e B quaisquer de um mesmo espao amostrai O. Dizemos que A e B so dois eventos independentes se a probabilidade de ocorrncia do evento A no altera a probabilidade de ocorrncia do evento B, isto , P(B) = P(B/A). Pelo Teorema de Multiplicao de Probabilidades, temos:

P(A () B) = P(A) * P(B/A) = P(A) Podemos, ento, formaliz,ar a seguinte definio.

* P(B)

39

Definio

7.1:

Dois eventos A P(A nB)= P(A)*P(Il)


P(NB)

so

il1depel1dentes

se

somente

se

Consequentemente,

= P(A) e P(B/A) = P(B), se P(A) e P(B) so no-nulos.

EXEMPLO 7.1: Suponha que um dado equilibrado seja jogado duas vezes. Definamos os eventos A e B, da seguinte forma: A={o primeiro dado mostra um nmero par}, B= {o segundo dado mostra um 5 oU um 6} . Determine P(A), P(B), P(A n 13), P(A/13) e P(131A).

SOLUO: Temos o seguinte espao amostrai,


(1,1), (1,2), .. ', (1,6), .0= (2,1), (2,2),.", (6,1), (6,2),'.', (2,6),

1
J'

. ........................
(6,6)

(2,1), (2,2),"', (2,6)} A= (4,1),(4,2), ... ,(4,6) , { (6,1), (6,2),.':, (6,6)

B= {(I,5), (2,5),'" (6,5) } e A n IJ (1,6), (2,6),. .. , (6,6)

= {(2,5), (2,6), (4,5), (4,6), (6,5), (6,6)} ..

Entao

P(A)

= -36 = -2'

18

PC/)~

= -36 = -3'

12

enquanto P(A n13) =

-36 = -6 .

Consequentemcnte, P(A I B)

= P(A n B) P(B)

_ 1I 6 1 --=-= 1/3 2

P(A)

'

P(JJ I A)

P(A nH) =~=2=p(lJ) P(A) l/2 3

Podemos estender este conceito para

11

eventos.

Definio 7.2: Sejam AI, A2, ... ,


que AI, A2,... , P(A
,

Ali,

n evenlos de um mesmo espao amostrai


1= 1",2 .,. n
j:t:..i:t:. k

.o.

Dizemos

Ali

so eventos illdependentes, se:


'

nA.) = P(A J
)

)* f)(A P(A;)*

)'

:t:.

P(A; nA J n Ak

I)(A J)* P(Ak),

= 1,2,... ,1/

P(A. nA J.n ...nA " ) =


I ".

n
"
;=1

P(A),

Ob.~en'ao:No caso de n eventos tcramos 2" - li -I relacs a serem verificadas.

40

...

EXEMPLO

'7.2: Suponha que um par de moedas no viciadas seja jogada. Definamos os eventos: A= {cara na primeira moeda l, B= {cara na segunda moeda} e C= {cara em exatamente uma moeda} .

Determine 1'(A), 1'(B), 1'(C), 1'(A SOLUO:

(l

B), P(A

(l

C), 1'(B

(1 C)

c P(A

(l

(l

C).

Temos o seguinte espao amostraI, onde Ca cara c Co coroa, ento },


2

n=

{(Ca,Ca),(Ca,Co),(Co,Ca),(Co,Co)},

A={(Ca,Ca),(Ca,Co)

B= {(Ca,Ca),(Co,Ca)} = 4' ="2


I I

C= {(Ca,Co ),(Co,Ca)} I'

Logo, P(A)

= P(H) = P(C)

P(A n/J)=

P({Ca,Cil})=~,

P(A(l

",. .)=P({.l,CO})=-, C C
B

/)(IJ

(l

C) = /)( {Cu, Cl}) = ~

4
P(B)* P(C)

P(A

(l

(l

C) = P(ljJ)

= O:t: P(A)*

Este exemplo mostra que os eventos so dois a dois independentes, eventos no so independentes.

mas os trs

8. REFERNCIAS

DIBLIOGRFICAS aplicai'Jes estatstica. Livros Tcnicos Cientficos

1. Meyer, r.L. (1984). Probabilidade: Editora S.A. 2. Lipschutz, S. (1972). Prohahilidade.

Editora I\!IcGraw Ilill do 13rasil Ltda.

41

APNDICEA :'ALGUMAS NOES DA TEORIA DOS CONJUNTOS


Este apndice apresenta alguns conceitos elementares da Teoria dos Conjuntos que

so fundamentais Teoria das Probabilidades. Um C()/~ill11to uma colco de objetos. Gcralmcntc os conjuntos so reprcscntados por letras maiscula: A, B, .... Os objetos que formam o conjunto A so denominados elementos de A. Quando a for um elemento de A denotaremos a E A c quando a no for um elemento de A escrevemos a ~ A. Definiremos o conjunto vazio como sendo o conjunto que no contenha qualquer elemento e o conjunto universal como aquele que formado por todos os objetos que estejam em estudo. A partir do conjunto vazio (~) e do conjunto universal (U), podemos enumerar as duas seguintes propriedades: 1. <p c A, para qualquer A. 2. A c U, desde que j se tenha definido o conjunto universal.

Consideremos, agora, a importncia de combinar conjuntos a fim de formar novos conjuntos. No que segue, consideramos A e.B dois conjuntos arbitrrios. 1. Unio: A u B ={x: x E A 011 X E B}. o conjunto dos elementos que pertencem a A ou a B

(}II

a ambos.

2. Interseo: A n B = {x: x E A e x E B} o conjunto dos elementos que pertencem simultaneamente

a A e a B.

42

3. Complementao:

Sejam A e B dois conjuntos tais que A c B, A = {x: x fi A e x E B I. A

EXEMPLO:

Seja U = { 1,2,3,4,5,6}, A = { 1,2,3}, B = { 2,3,4}. (l,2,3,4) e Anl3= {2,3)

Ento, A = {4,5,6},AuB=

Enunciaremos abaixo algumas propriedades importantes: Sejam A, B e C trs conjuntos quaisquer. 1. 2. 3. 4. ldcmpotncia: A u A = A ~ A n A = A. Comutativa: A u B = B u A ~ A n B = B n A. Associativa: A n (B n C) = (A n B) n C ~ A u (B u C) = (A u B) u C. Distributiva: A u (B n C) = (A u B) n (A u C) ~ A n (B u C) = (A n B) u (A n C).

5. Absoro: A u (A n B) = A ~ A n (A u 13) = A. 6. Identidade: A nU = A~ A n cP = cP~ A u U = U~ A u cP= A. 7. Complementar:

U = ifJ;

r/J= (j ;

A n A = ifJ;

A u A =U.

8. Leis da dualidade ou Leis de "De Morgan": (A n li) = (A v B) (AvH)=(AnB).

A partir dessas identidades podemos enunciar as seguintes definies. 1Jefi o A.I: D-se o nome de CUl~iulIl() das classes de A, e denota-se por F(A), classe ni de todos os possivcis subconjuntos de A. Para efcito de exemplo, considerc A = {a,b,c}, ento F(A) ={cP, {a}, {b}, {c}, {a,b}, {a,c}, {b,c}, {a,b,c}=A} Em geral, se A finito c tem
11

elemcntos, ento F(A) tcm 2/1clementos.

1Jefi o A.2: Uma partio de um conjunto A uma subdiviso de A cm subconjuntos Ai,

ni

i=1,2, ... n, tal que: 1.


A;:j:.

ifJ,
=A

Vi = 1,2, ... , 11

2. Ai n Ai
/I

= ifJ,

Vi:j:. j

3. UA;
;=\

43

EXEMPLO: Seja A = {a,b,c}, ento . AI = {a} e A2 = {b,c} representam uma partio, enquanto que AI

{a}, A2

{a,b} e A3

{b} no representaria.

APNDICE

B- TCNICAS

DE CONTAGEJtf

Nem sempre possvel enumerar de forma simples o espao amostraI e o evento. Por esta razo, so necessrios alguns procedimentos de contagem qu~ so estudados pela anlise combinatria. Existem vrias maneiras de dispor os objetos de uma coleo em grupos. Esses grupos denominam-se agrupamentos e os objetos que os constituem chama-se de elementos. Em qualquer das maneiras de disposio dos elementos, existem dois casos: 1. Em cada agrupamento todos os elementos so distintos - agrupamento simples. 2. Em cada agrupamento pode haver repeties dos elementos - agrupamento com repetio. Os agrupamentos, quanto ao modo de formao, podem ser classificados em :

Arralljos, Perm.llta(ies e COl1lbillaijes. Os agrupamentos simples diferem pela ordem ou pela l1atureza de seus elementos. Diferem pela natureza quando pelo menos, um dos elementos de um dos agrupamentos no for elemento do outro. Defillio B.l: Sendo 11 um inteiro positivo, definimos 11! = (11)(11-1)(11-2) f .... denominamos de/atorial de 11.Tambm definimos O! = 1. e o

1. PERMUTAES A. PERN[UTAES SIMPLES DE OBJETOS DISTINTOS


So os agrupamentos simples de 11 elementos que podemos formar com eles. Diferem um do outro pela ordem dos elementos. O nmero de permutaes Pn = n ! EXEMPLO

B.l: Com as. primeiras quatro letras do alfabeto, quantos agrupamentos de 4


elementos podemos formar?

SOLUO:

P4 = 41 = 4.3.2.1 = 24. A saber, temos, o seguinte conjunto, {abcd, abdc, acbd, acdb, adbc,adcb, baed, bade, bead, beda, bdae, bdea, eabd,cadb, cbad,cbda,cdab, cdba, dabe,dacb,dbac,dbca,dcab,dcba}

44

B. PERMUTAES COM OBJETO."; REPETIDO,";


So as permtaes que podcmos formar com 11 elementos, dos quais nl so iguais, n2 so iguais, nr so iguais. Diferem pela ordem. O nmcro de permutaes
o ,

li!
} '

11'''1 ,"2 ...

1I,

- 11.. I'1

1.' I... 11,. .

EXEMPLO SOLUO:

B.2:Quantos anagramas podemos formar com as letras da palavra CARCARA? Temos 2 letras C, 3 letras A c 2 letras R, num total de 7 letras. Ento, teremos,

P72
o

' 1
o,"

7! - 2 IO anagramas difercntes. 2!3!2!

2. ARRANJOS A. ARRANJOS . \'It.1PLE.\' DE OBJETOS DISTINTOS So os agrupamentos de r elementos dentre 11 elementos distintos. Difcrem m agrupamento do outro, pela natureza ou pela ordem de seus elementos. O nmero de arranjos -AI'
A(II,,) 11

= (11 li! r)! __


dc 2

EXEMPLO

D.3: Com as quatro primciras Ictras do alfabeto, quantos agrupamentos

elementos podemos formar? SOLUO:Podemos formar A~

= ~ = 12 agrupamentos
2!

diferentes, a saber, temos

{ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, de} . B. ARRANJOS COjt,f REPOSIO DO OBJETO SELECIONADO So os agrupamentos de r elementos que podemos formar com /I elementos (O<r<II). Diferem um do outro pela ordem, pela natureza ou pela repetio de r c1emcntos dentro do mesmo agrupamento. O nmero de agrupamentos :

A (1I,r)
EXEMPLO

= /I

DA: Com as quatro primeiras letras do alfabeto, quantos agrupamentos de 2 elementos podcmos formar se a cscolha for feita sucessivamcnte e com reposio do elemento cscolhido ?

45

SOLUO:

Teremos A(:.2)

= 42 = 16 agrupamentos,

a saber, teremos,

{aa, ab, ac, ad, ba, bb, be, bd, ca, eb, cc, cd, da, db, de, dd}

3. COMBINAES A. COMBINAES SIMPLES DE OBJETO.')'DISTINTOS


So os agrupamentos simples de I" c1ementos que podemos formar com 11 elementos (O<r<J1). Diferem um do outro pc1a natureza dos c1ementoso O nmero de agrupamentos

C",r =.C,. 11 -

I. 1(11 .

li! _
I"

)1

EXEMPLO 8.5: Com as quatro primeiras letras do alfabeto, quantas combinaes de dois elementos podemos formar? SOLUA0:

Teremos

C:

4' _0- = 6 agrupamentos, a saber, teremos,


2!2!

{ab, ac, ad, bc, bd, cd}

OBSERVAES:
I I

1. A: = _1_'_=
(/l-li)!

_11.

01
.1*

= 11\ = 1'"
---=1.
li!

2. A "

r __

---=1.

111

'1* ('r
11

(l1-r)!

r!(l1-r)!
r
11

3. Cr=
11

n! -C"--_.= (11- 1") ! I" , +C


r

Cr

(/_,_-_1 )_,_ 1I-1-(I"-1)!(11-1")!

+ _(_11_-_1_),
I"!(I1-I"-I)'-

r(_I_l-_I )_! +_(1_1 )_(_1I_-_1_)! ('_I -_I )_,_1"_+_1_1 -_I" __ ( -_'_.) I"!(II-I")! I"!(II-r)!

11-1
11\

4.

- I"!(II-I")!

C;,

46

IUNIDADEIlI -DISTRIBUIO DE PROBABILIDADE I

11. INTRODUO
que pretendemos, nesta unidade, apresentar alguns modelos tericos de distribuio de probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo de grande nmero de problemas prticos.

Definio 1.1: Sejam E um experimento e

espao amostrai associado a E. Um funo X, que associe a cada elemento <OE n um nmero real, X(<o), denominada varivel alealria.
Q wl
y

n UI11

'2

,Rx X( w ) X( w;) X(wd

EXEMPLO

1.1: Suponha que duas moedas sejam lanadas e observamos a sequncia de caras e coroas obtidas. Considere o espao amostrai associado a esse experimento. Isto ,

n=
onde

{(Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co)}, Ca e Co representam a ocorrncia

de

cara

coroa,

respectivamente. Definamos a varivel aleatria da seguinte forma: X o nmero de caras obtidas nas duas moedas. Da, X(Ca,Ca) = 2; X(Ca,Co) = X(Co,Ca) = 1 ; X(Co,Co) = O. uma exigncia fundamental de uma funo unvoca: A cada <O n corresponder exatamente um valor X(w). Diferentes valores de w E podem levar ao mesmo valor de X. Como pode ser visto no exemplo acima, onde vimos que X(Ca,Co) = X(Co,Ca) = 1. espao Rx, conjunto de todos os valores possveis de X, algumas vezes denominado contradomll/l1o. De certo modo, poderemos considerar Rx como um outro espao amostraI. O espao amostrai (original) n corresponde ao resultado ( possivelmente no numrico) do experimento, enquanto Rx o espao amostrai associado varivel aleatria X, representando a caracterstica numrica de interesse. Se tivermos X( <O)= <o, teremos

muito importante compreender

.o. = Rx .
47

Defillio 1.2: Sejam um experimento E e seu espao amostrai

n. Seja X uma varivel aleatria definida em n e seja Rx seu contradomnio. Seja B um evento definido em relao a Rx, isto , B c Rx. Ento, define-se A como
A

{co

E D..

1 X ( (O)

E H}

Assim, A ser constitudo por todos os rcsultados em .o, para os quais X (liJ) E B. Neste caso, diz-se que A e B so eveutus equivalentes. Como pode ser visualizado na seguinte figura: Q

X(wti
n

importante compreender que, em nossa definio de eventos equivalentes, A e B


so associados a espaos amostrais difcreutes.

EXEMPLO 1.2: Considere o exemplo 1.1. Se B = {I} em Rx. Qual o evento A,


equivalente a Bem SOLUO:

n?

J que X(Ca,Co) = X(Co,Ca) = I se, e somente se, X(ro)=I, temos que A = {(Ca,Co),(Co,Ca)} equivalente a B.

Agora, daremos a seguinte importante definio.

Definio 1.3: Seja B um evento no contradomnio Rx. Define-se P(B) da seguinte forma 1'(B) = P(A), onde A = {w E.oI X(o) EH}.
Em outras palavras, como B equivalcntc a A em igual probabilidade de A.

n, a probabilidade

de B

EXEMPLO 1.3: Considere as moedas do excmplo 1.1 como equilibradas. Calcule a


probabilidadc P(X=O), P(X=l) e P(X=2) SOLUO: P(X=O) = 1'(Co,Co) = 1/4, e P(X=I) = pC,Co), (Co,Ca P(X=2) = P(Ca,Ca) = 1/4 = 1/4 + 1/4 = 112.

Uma vez que as probabilidades associadas aos vrios resultados (ou eventos) no contradomnio Rx tcnham sido determinadas (mais precisamente, induzidas), ignoraremos frequentemente o espao amostrai original .o, que deu origem a essas probabilidades. O

48

-----,

fato, de que essas probabilidades sejam determinadas por uma funo de probabilidade definida sobre o espao amostrai original n, passa desapercebido' quando eslamos interessados em estudar os valores da varivel alealria X.

2.V ARI VEIS ALEA T RIAS D ISCIU~T AS

Definio 2.1: A varivel X dita discreta se o nmero de valores possveis de X, isto , o contradomnio Rx , for um conjunto finto ou enumervel. EXEM PLO 2.1: Consideremos um lole Colll 4 peas, das quais 2 so defeituosas, retiremos ao acaso duas peas, com reposio. Seja Ento, D e

= a pea

defeituosa,

P = a pea perfeita.

n ={DD,

DP, PD, PP}

Definindo X como sendo o nmero de peas perfeitas, temos:


(j)

X(ffi)

{DD} O

{OP,PD} 1

{PP} 2

Definio 2.2: Seja X uma varivel aleatria discreta, ento X pode assumir os valores XI, X2, .... Chamaremos de fuulo de probabilidade da varivel aleatria X a funo que a cada Xi associa sua probabilidade de ocorrncia, ou seja, P(X = Xi) = P(X(r'v) = X;) = p(X;), tal que: a) O S; p(X; ) S; 1
u.

.\

b) LP(x,)
;=1

=1
2.2: Consideremos a varivel aleatria do exemplo anterior, ento: P(X = O) = 1/4, P(X = 1) = 1/2, P(X = 2) = 1/4, P(X S; 2) = per!) = I e P(X < O)=P(I\I) = O
2

EXEMPLO

Podemos observar que O ~ P(X

= i)

~ 1, para i = 0,1,2 e

L P(X
;=0

= i) = 1

41)

A funo de probabilidade pode ser representada por tabela, grfico ou frmula. Para o exemplo anterior, temos: Tabela: P(X= Grfico:
p(x 1
X; Xi)

O 1/4

I 1/2

2 1/4

1/2 1/4

o
Frmula: p(xi)

= (2 ) .!.,
Xi

Xi

= 0,1,2

EXEMPLO

2.3: {j"mpar de dados lanado. Seja X a varivel aleatria que associa a cada ponto (a,b) de n a soma de desses nmeros, isto , X(a,b) = a + b. Determine a funo de probabilidade de X. O espao amostrai Q formado de 36 pares ordenados de nmeros entre I e6: Q= {(1,1),(1,2), ..... ,(6,6)} X

SOLUO:

Ento,

uma

varivel

aleatria

em

com

o contradomnio

Rx

{2,3,4,5,6,7,8,9,IO,11,12} A funo de probabilidade de X a seguinte:


Xi

p(Xj)

1136T2136

~~

4 ... ~ 3i36T4/36

6~

8_~

10.~

5i36T6/36

5i3614/36

3136l2/36

12 1/36

Obtemos, por exemplo, p( 4) = 3/36, pois (1,3), (2,2) e (3,1) so os pontos de cuja soma das componentes 4~ ento p(4) = P(X = 4) = P({(l,3),(2,2),(3,1)})
=

236

50

Defillio 2.3: Definimosjimclo de dis{rilwilio de probabilidade aleatria X corno sendo:


F(x)

acumulada da varivel

P(X ~ x)

Para o caso discreto, tratado acima, temos:


F(x)

= Lp(xJ
x,~.l'

EXEMPLO

2.4: Considerando
acumulada.

o exemplo 2.2, obtcnha

a funo

dc distribuio

SOLUO:
F(O) = P(X ~ O) = 1/4 F(l)
F(2)

= P( X = J)(X

~ 1) = 3/4

~ 2)

ento,
O, se x < O F(x)

1/4, se O ~ x < )
3 / 4, se 1 ~ x < 2

1, se x 2:: 2

F(xY 1 3i4 1/2 1/4

.
e

(.

O Obsen'aes: 1. O domnio de F a reta real. 2. lim F(x) = O e lim F(x)


x-,.-eo
X-)CO

1
~ F(x2)

3. F no decrescente, isto , se

XI ~

xl' teremos F(x)

51

4. A magnitude F(x_)

de cada

salto

p(xD, isto , P(X = x) = F(x) - F(x_),

onde

= y-.x- P(y) lim


:t;

5. F( x _)
6. F(x+)

F( x), isto , F descontnua esquerda. F(x), isto , F contnua direita.

3. VARIVEIS ALEATRIAS CONTNUAS


Uma varivel aleatria dita contnua se o seu contradomnio unio de subintervalos. for um intervalo ou

Definio 3.1: Uma varivel aleatria X contnua se existir uma funo f, denominada
fUllo de densidade seguintes condies:
1. f(x)
2

de probabilidade

(fdp) de X, que satisfaa as

O, para todo x
=I

Rx

2.

r:f(;'ptx

3. para quaisquer, a,b, com

-00

< a < b < +00, teremos P(a ~ X ~ h) = J:f(x)dr

Ob.'ien'alies:
1. P(a ~ X ~ b) representa

a rea sob a curva da funo densidade

de probabilidade

entre a e b. 2. Para qualquer valor especifico


P(X

de X, digamos Xo, temos que P(X=xo) = O, pois

= xo) = rOf(x)dx = O xo
nula,

3. Como a probabilidade de X assumir valores em pontos isolados ento: P(a ~ X::; b) = P(a::; X <b) = P(a < X ::;b) = P(a < X <b)

EXEMPLO 3.1:Suponha que X uma varivel aleatria contnua com a seguinte fdp: 2X, O < x < I,
f( x)

= { O; para

quaisquer outros valores

a) Mostre que f(x) uma fdp. b) Calcule P(X $' 1/2) c) Calcule P(X::; 112/1135. X ::;2/3)

SOLUO:
a) Evidentemente,f(x)

> O para todo x

Rx e f~2xdx = x 21~ = 1.

52

1/2

b) Para calcular P(X 5, 1/2), c) Aplicando-se

deve-sc apcnas calcular a integral :fo(2x)Jx = 1/4. o conceito de probabilidade


1/2

diretamente

condicional,

. p(X < 1/2/


teremos 71/3 ~ X ~ 2/3

J(2x)Jx
) _ P( 1/ 35, X ~ 1/2) _1/3 - P(1 / 3 ~ X ~ 2/3) - lfl3 (2x)Jx
1/3 _

-1/3-\2

5/36 _ 5

Da definio 2.3, a funo de distribuio acumulada, para o caso continuo dada por: F(x) = r..,f(s)d~' EXEMPLO 3.2: Sejaf(x) como definida no exemplo 3.1. Calcule a funo de distribuio acumulada e representc graficamcnte esta funo.

SOLUO:

F(x)

O, se x < O,

f(2s)d\'

= Xl,

se

x < I,

[1: se
Graficamente, F(x)

x 2: 1
.A\

(1,1)

/-'X

Obsen'ao:

Seja F(x) a funo de distribuio acumulada contnua X, ~om fdp 1(>.), Ento f(x) seja derivvel.

de uma varivel aleatria para todo x no qu~1 F(x)

=~

F(x),

EXEMI)LO

3.3: Suponha que a varivel aleatria X tenha funo de distribuio acumulada F dada por: O, se x < O F(x)

x, se O ~ x < 1
I, se x;::: I

Calcule a fdp de X.
53

SOLUO: fcil ver que ~F(x) dx


I se O ~ x ~ 1 { ~,cas() contrrio

= I, para

todo x E(O,l]e pormto a sua fdp ser:

f(x)

4. ESPERANA

MATEMTICA

E VARINCIA

Nos modelos matemticos aleatrios, que temos considerado, os parmetros podem, tambm, ser empregados para caracterizar a distribuio de probabilidade. A cada distribuio de probabilidade, podemos associr certos parmetros, os quais fornecem informao valiosa sobre a distribuio, tal como a declividade de uma reta fornece informao importante sobre a relao linear que representa. Um dos parmetros mais importantes dado na definio abaixo.

Defi!,io 4.1: Seja X uma varivel aleatria discreta, com valores possveis XI, ..., XII, ...
Seja p(Xj) = P(X=Xi), i=1,2, ...,n, ... Ento, o valor esperado, eWeralla matemtica de X, valol' mdio de X, ou expectncia de X, denotado por E(X) definido como
w ~

E(X) = LX;p(x;),
;=1

se a srie LX;p(x;)
;~I

convergir absolutamente, isto ,

se 'Llxilp(x;)
;=1

'"

<'00 .

Seja X uma varivel aleatria continua com fdp f(x). O valor e.\perado de X

definido como
E(~) Notao: E(X) = J1
=

r~.if(x)d'(., se, e somente se, J]xl.f(x)dx

<

00.

EXEMPLO 4.1: Consideremos a varivel aleatria discreta do exemplo 2.1. Calculemos


E(X).
.. _

SOLUA0: L(X)

= LX;p(x;)
;=1

= 0*-+
4

1*-+2*- = 1. 4 4

Isto representa que ao retirarmos duas peas do lote, esperamos, em mdia, vir uma pea defeituosa.

54

~--

EXEMPLO 4.2: Consideremos a varivel aleatria continua do exemplo 3.1. Calculemos


. a E(X).

. SOLUA0: E(X)

= 11 (x*2x)dx = 11 (21'2 )dr = -2 o o 3


PROPRIEDADES DA ESPERANA MATEMTICA

1. A mdia de uma constante a prpria constante.


E(K)

= K.
uma varivel aleatria X por uma constante, sua mdia fica

2. Multiplicando-se

multiplicada por essa constante. H(KX)

Kh'(X)

3. A mdia da soma ou da diferena de duas variveis aleatrias , respectivamente, a soma ou diferena das mdias.
E(X:t Y)

= E(X):t

E(Y)

Obsen'ao: Note que toda funo de uma varivel aleatria X tambm uma varivel 2 aleatria. Podemos, portanto, falar na esperana de X , 2X + I, dentre outras. Teramos, por exemplo, a esperana de X dclillida como:
2

E(X2)

= LX;
;=1
+OO

p(x;),

para o caso discreto e analogamente

E(X2)

=f

-00

(x2

f (xd-c

, para o caso contnuo.

Deji"ielo 4.2: Definimos a varincia de uma varivel aleatria X como:


V(X) = E(X - E(X)r

Notao:

V(X)

(52

Observao: 1. A varincia de uma varivel aleatria, uma medida que d a idia de disperso dos valores da varivel, em relao ao seu valor esperado. 2. A expresso da varincia na definio acima pode ainda ser escrita como:

V(X) = E(X2)

[i';(X)f

55

..

])ROPRIEDADES 1. A varincia de uma constante zero. V(K)

DA VARINCIA

=O
por uma constante sua varincia fica

2. Multiplicando-se uma varivel aleatria multiplicada pelo quadrado da constante. V(KX) = K2V(X). 3. Somando-se ou subtraindo-se altera,
V(K:f: X) = V(X)

uma constantc varivel aleatria, sua varincia no sc

4. A varincia da soma ou da difercna de duas variveis aleatrias dada por: . V(X:f: 1') = V(X) + V(Y):t 2*cov(X,Y) onde cov(X,1')
OJJS.: Quando

= EU X

- E(X)XY

- E(Y)]}

= E(XY)

- E(X)E(Y) E(T)

X e Y so variveis aleatrias

indepcndentes,

= E(X)I~(Y),

consequentemente,

cov(XY)=O, logo V(X:l:. Y)

= V(X)

+ V(Y)

Notamos que se uma varivel aleatria medida em certa unidade, a varincia dessa varivel expressa no quadrado dessa unidade Para fins de comparao e facilidade de interpretao introduz-se o conceito do desvio padro da varivel aleatria, dcnotado por a( X), que definido como a raiz quadrada positiva da varincia, isto , a(X)

= Ja

(X)

EXEMPLO 4.3: Calcule a esperana matemtica c a varincia da varivel aleatria X, '., cuja fdp dada abaixo.
K,

(x)

= { O,

se a::; x ::;h caso contrrio


de densidade uniforme no intervalo [a,b].

Esta funo denominadajilllo

SOLUO: Para que [(x) satisfaa a condio (2) da dcfinio 3.1, temos que

J.a

b Kdx = KX\b = K(b - a) = 1. Logo,


a

K = _1- > O, que satisfaz a condio (1) da

b-a

mesma definio.

56

Agora, E(X) f -

Ix--dx (h-a)
b ]
li

(b-a

')

2 ,b

2 I,. - 2(b-a)

_ h2 _a2 _ (h -a)(h +a) _ a +h

2(b-a)

Tambm temos que, E(X2)=tx2


"

dx= b3_a =(b_a)(b2+a2+ab)_b2+a2+ah (b - a) 3( h - l) 3(h - li) 1

Da, V(X )
V(X)

= b2 +a2 +ah _ (a+h)2

= 4h +40

= b +a

3 2 ,,,

4 -2ab
= (b _a)2

2 +4ah-30 12

-3h

-6ah

12

5.ALGLJMAS I>ISTIUIJUICES

DE l'I{OBAIJILlJ)ADE

Dentre as funes de probabilidade, ser'o abordados algumas especiaIs. Apresentaremos inicialmente as distribuies discretas mais importantes e finalizamos esta seo com a distribuio contnua mais utilizada na teoria da probabilidade, a distribuio Normal. 5.1. Distribuio de 8e . oulli Suponha que realizamos um experimento E, cujo resultado pode ser observado e classificado como sucesso ou fracasso, caso o evento que nos interessa ocorra ou no, respectivamente. Associaremos p, a probabilidade de sucesso, ao evento que nos interessa e I-p
=

q, ser a probabilidade de fracasso.


Definimos, ento, a seguinte varivel aleatria discreta: l, se ocorrer Sllces.\'o {O, se ocorrer fracasso A distribuio de probabilidade :
x.

X-

P(X ~Xi)

O l-p

1 P
=

Verifica-se facilmente que E(X) = P e Var(X) caractersticas.

p(J-p),

que so as pnnclpals

57

..J

EX~MPLO

5.1:Seja o experimento E: "Lanar um dado e 'observar a tce superior". Defina o evento: "o nmero mltiplo de 3" e a varivel X definida como o nmero de sucesso. Determine a funo de probabilidade de X, calcule a esperana e a varincia.

SOLUO:Temos

que o evento ocorre com probabilidade

= ~, 6

logo 1- P

=4. 6

Ento, a varivel X tem distribuio:


Xi

P(X=Xj) com E(X)

I
=2
9 Binomial

4/6

2/6

=.!-

e Var(X)

5.2. Distribuico

Vamos considerar experimentos que satisfaam as seguintes condies: 1. O experimento deve ser repetido, nas mesmas condies, um nmero finito de vezes

(n).
2. As provas repetidas devem ser independentes,

isto , o resultado de uma no afeta os

resultados das sucessivas. 3. Em cada prova deve aparecer um dos possveis resultados: sucesso ou fracasso. 4. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q=l-p) do insucesso manter-se-o constante. S. Definimos a varivel aleatria discreta Y como sendo o nmero de sucessos nas realizaes. Ento Y = X + Xz+ ... +XII, onde cada Xi, (i
J 11

1,2, ... ,n) um cnsaio de Bernoulli,

sendo a distribuio de probabilidade dada por:

P(Y

= k) =",(11) P k

(1-: p)

' n-k

,k =0,1, ...

11

pois, para Y=k teremos observado k sucessos, cada um com probabilidade consequentemente (l1-k) fracassos, cada um com probabilidade (l-p).

fJ

Notao: Y - B(II,p), que cquivalentc a dizer que Y tem uma distribuio Binomial com , parmetros
11

e p.

A mdia da Binomial :
E(Y)

= E(X + X2+ ... +XII) = E(X )+


1 1

l~'(X2)+ ... E(XII)

= I1p,

e a varincia : V(Y) = V(X1


58

+ X2 + ... +X,,)

= V(X)

+ V(X2 )+ ... +V(X,,)

= I1fJ(l-

17)

EXEMPLO

5.2:Dois times de futebol, A e B, jogam entre si 6 vezes. Suponha que as probabilidades de A ganhar, perder ou' empatar um jogo, so as mesmas, e permaneam constante durante as 6 partidas. Encontre a probabilidade do time A ganhar 4 vezes e calcule a esperana. e a varincia. Seja X o nmero de vezes que o time A ganha. 6, P

SOLUO:

Temos que

11 =

= -,

ento,

P(X = k) = k

6)(1)"( '3

1-

1)(6-k) '3

,k

= 0,1,2,3,4,5,6
1 4 15*8"1*9' 20

6)(1)4(2)2 Queremos P(X = 4) = ( 4 "3 '3

= 243

E a esperana E(X)

= 6*J. = 2, 3

com varincia V(X)

= 6*J.*~3 = ~ 3 3

5.3. Distribuio

de Poissol1

Uma varivel aleatria X, assumindo os valores 0,1,2, ... tem distribuio de Poisson Com parmetro (IVO) e denotaremos por X-P(), quando a probabilidade da varivel aleatria assumir um valor k, k fixado, dada por: .
e-. "

P(X = k) = --,k

k!

= 0,1,2, ....

Pode-se mostrar facilmente que


E(X) =

Var(X)

= ,

onde lembramos

o fato que

L-. = e k!
k=O

'" "

obtido pelo desenvolvimento da srie de Taylor nas vizinhanas de zero. Esta distribuio infinita enumervel' ocorre em muitos fenmenos naturais, tais como o nmero de chamadas telefnicas por minuto em uma central telefnica, o nmero de erros de impresso por pgina em um texto e o nmero de partculas a emitidas por uma substncia radioativa. EXEMPLO 5.3: Numa fbrica existem vrias mquinas de um certo tipo. Depois de muitas observaes chegou-se concluso que o nmero de mquinas que se avariam em cada ms uma varivel aleatria com distribuio de Poisson com parmetro 3. Qual a probabilidade de que em um determinado ms se avariem 7 ou mais mquinas?
59

SOLUO: P(X;:: 7) =

L_e *=7

'"

-33k
=

0,0335

k!

Em muitos estudos estatsticos, h muitas vezes necessidade de considerarmos a ocorrncias de eventos casuais que se processam a longo do tempo, ou espao. Por exemplo, a) Chegada de chamadas telefnicas a uma central telefnica. b) Nmero de erros de impresso em um texto. c) Nmero de carros que passam por um cruzamento durante um intervalo de tempo t. d) Chegadas de clientes a um caixa de banco. Observamos, ento, que h uma varivel "t", a qual comporta-se de modo que enquanto "1" aumenta a probabilidade de sucesso tende a aumentar. , Faremos algumas hipteses para construir um modelo para estas situaes. a) Eventos definidos em intervalos disjuntos so independentes. b) A distribuio do nmero de ocorrncias em qualquer intervalo depende apenas do comprimento do intervalo e no dos seus extremos. c) Em intervalos de mesmo comprimento, as probabilidades de ocorrncia de um mesmo nmero de sucessos so iguais. d) Em intervalos muito pequenos, a probabilidade de ocorrncia de mais de um sucesso zero. Sob estas hipteses, pode-se mostrar que a probabilidade intervalos de tempo t, dada por: de ocorrncias em

P(X/

= k) =

e-(.t/\./)*

k!

,k

= 0,1,2, ....

O nmero mdio de ocorrncias em' um intervalo t dado por: t.'(X) = I e a varincia da distribuio tambm I . Observe que quando 1= 1, recamos na expresso anterior (P(X=k). EXEMPLO 5.4: Em mdia h duas chamadas por hora num certo telefone. Calcule a probabilidade de no haver chamada em 90 minutos.

SOLUO: Seja XI: o nmero de chamadas em uma hora.

=-=2
1

e
e-3O (3,0)0

!=--

90 _ 15'
,

60

_' Entao, P( XI'

.~ = O) = ----

O!

= 0,04979

60

Apresentaremos

agora a distribuio contnua mais importante.

5.4. Distribuidio Normal Muitas das variveis analisadas na pesquisa scio-econmica aproximam da distribuio normal. Seja uma varivel aleatria contnua que assume valores reais. Dizemos que X tem distribuio normal com parmetros ~ c (52 onde ~ = E(X) e (52 = Var(X), e dCI~otarclllos X - N(/l,O'\ se sua funo de densidade de probabilidade for da' forma: j(x)= I ~e
2Jra
_.I,(x"I')2 2 l<1

correspondcm ou se

,-00

<x < 00,-00 <p'<

2 00,a

>0,

Com a seguinte representao grfica: f(x)

I.

.\

\.

/ /
--_./
PROPRIEDADES

\\\
\

//
j.J.-O
jJ.

"'"

"--

~'""

""""---

j.J.+O

DA CURVA NORMAL:

1. unimodal, isto , f(x) tem um ponto de mximo, cuja abscissa x = /l. Esse ponto situado no meio da distribuio aquele em que coincidem os valores da mdia, moda e mediana. 2. f(x) simtrica com relao reta x = 1-'. 3. f(x) tem dois pontos de inflexo, cujas abscissas so x = p- a e x = fJ -I a 4. f(x) tem uma assntota: eixo x, isto , a partir do topo a curva cai gradativmente at formar as caudas, que se estendem indefinidamente, aproximando-se cada vez mais da linha base, sem entretanto, jamais toc-la. 5. Fixando-se a mdia, verifica-se que o achatamento da curva est diretamente ligado ao valor do desvio padro 0', ou seja, quanto maior for o desvio padro mais achatada a curva como pode ser vista na figura abaixo.

(,1

...

. J

f(x)

..

-_.-_ ..-.-

__._./'
/

/~~05 L~-~\ .. -.\ - .~~ 7 "


/i
\"0=1
'~

\ "'. ~

'",-

._--_--_
..

o=

..

Para o clculo das probabilidades surgem dois problemas: 1. integrar a funo de densidade 2. tabelar os dados, j que -00 < I' < 00 e

0-

> O.

A soluo para este problema surge fazendo uma mudana na varivel. A mudana :

z=
Ento: (Z) =

X-p

o-

E( X-I-') oo-

= ~(E(X)
o-

- p) = ~CLJ- p)

= O,

e
Var(Z) = var(X -

p) = _l-Var(X) a
2

Ento, Z ,- N(O, 1), isto , a varivel aleatria Z tem distribuio normal padro, reduzida ou Standard e sua fdp dada por:
'I.

fez)

= J'2lf' e

._.1

z2

-00

<z <00

A curva normal padro conserva as mesmas propriedades listadas anteriormente. Atravs de mtodos de integrao numrica podemos calcular integrais da distribuio acima, e de fato P(Z::; x) tem sido tabelada extensivamente. A funo distribuio acumulada da distribuio normal padro denotada por cjJ(x), isto , 1 cjJ(x) = r;::..,;2lf

(e-

/2

)dz ,

_'"

62

Podemos utilizar a. tabulao da funo .r/J. a fim ~e calculrmos a P(a ~ Z ~b), visto que P(a ~ Z ~ b) = P(Z ~ h) - P(Z ~ a) = r/J(h)- q,(a). A utilidade notvel da tabulao acima devida ao fato de que, se X tiver qualquer distribuio normal N(~l,(J2), a funo tabelada r/J pode ser empregada para calcular probabilidades associadas a X. Simplesmente empregaremos a transformada para a varivel Z. Consequenteme~te, P(a5.X~b)= p

h - fi) --;;-~Z~-;;(a - J1 b - J1) =p ( Z~-;;--P


= 1r/J(x) .

( Z5.-;;- - fi) a

=ljJ -;;-

(b - J-i) -ljJ-;;- - J1) (a

evidente da definio que r/J(-x) EXERCCIOS:

1. Seja Z uma varivel aleatria com distribuio normal padro. Encontre: a) P(O ~ Z ~ 1,42) b) P(-0,73 ~ Z ~ O) c) P(-1,37~Z~2,01) SOLUO: a) P(05. Z 5. 1,42) = r/J(1,42)- r/J(O)= 0,9222 - 0,5 = 0,4222 b) P(-0,73 ~ Z ~ O) = r/J(0)-ljJ(-0,73) = 0,5-0,2327 = 0,2673 c) P(-1,37 ~ Z ~ 2,01) = ljJ(2,01)-ljJ(-1,37) = 0,9778-0,0853 d) P(0,65 ~ Z ~ 1,26) = r/J(1,26)- ljJ(0,65) = 0,8962 - 0,7422 e) P(Z? f)
d) P(0,65 ~ Z ~ 1,26)

e) P(Z? f)

1,13)

p(IZI ~ 0,5)

= 0,8925

= 0,1540

p(IZI ~

1,13) = 1- P(Z < 1,13) = 1- ljJ(I,13) = 1- 0,8708 = 0,1292 0,5) = P( -0,5 ~ Z ~ 0,5) = ljJ(0,5)- ljJ(-0,5) = 0,6915 - 0,3085 = 0,3830

2. Seja Z uma varivel aleatria com distribuio normal padro. Determine o valor de I

se:
a) P(Z 5. ') = 0,7967 b) P(t ~ Z ~ 2) = 0,1000 SOLUO: a) P(Z ~ I) = 0,7967 => r/J(I) = 0,7967 => t = 0,83 b) P(Z > ,) = 0,9099 => 1- r/J(I) = 0,9099 => ljJ(I) = 0,090 I=> t = -1,34 P(O ~ Z ~ t) = 0,4236 => 4>(1) -4>(0) = 0,4236 => 4>(1) - 0,5 = 0,4236 => r/J(t) c) P(O ~ Z ~ t) d) P(Z > I)

= 0,4236

= 0,9099

= 0,9236

c) t = 1,43 P(I ~ Z ~ 2) = 0,1000 => ljJ(2) - ljJ(t) = 0,1 => 0,9772 -4>(1) = 0,1 => ljJ(1) = 0,8772 => d)

,= 1,16

63

3. Seja X uma varivel aleatria com distribuio N(2;0,16). Calcule: a) P(X > 2,3) c) P(X
$

t)

= 0,48

b) P(1,8s;XS;2,1) SOLUO: a) P(X> b P(I,8s;


) . 2 , 3)

d) P(X > t)

= 0,34

p( XO,4 2 s; 2,3 ,-4 2) = 1- "'(O 75) = 1- O 7734 = 02266 O X::; 2,1) = p( 1,8- 2 s; X - 2 2,1 - 2) = })(-0,5::; Z 0,25) = 4J(0,25) - fjJ(-0,5)
=
1-,
Y' , , , $ $

0,4

0,4

0,4

= 0,5987 - 0,3085 = 0,2902

c) P(X

X SI) = 0,48 => P ( --$ 0,4

-.

t0,4

2) = 0,48 => fjJ(t- 2) = 0,48 => -- - 2 = -0,05 t -. 0,4 0,4


s; t)

=> t

1,98

P(X> d)
f/J --

I) = 0,34 => 1- P(X s; t)

= 0,34 => P(X

= 0,66 => P ( --

X - 2 t-2)
$ --

0,4

0,4

= 0,66

t( 0,4

2)

t-2 =0,66 => -= 0,41 => t = 2,164 0,4

4. Os salrios mensais dos operrios industriais so distribudos normalmente, em torno da mdia de R$ 50,00, com desvio padro de R$ 4,00. Encontre a probabilidade de um operrio ter um salrio semanal situado entre R$ 49,00 e R$ 52,00.

SOLUO: Queremos encontrar P(49::; .X ::;52), ento


P( 49::; X::; 52) .

1'(49 - 50 s; X-50 444

::; 52 - 50)

P( -0,25::; Z

0,5)

= fjJ(0,5) -

fjJ(-0,25)

= 0,6915 - 0,40 13 == 0,2902

, pois, de se esperar que, em mdia, 29,02% dos operrios tcnham salrios entre
R$ 49,00 e R$ 52,00. 6. REFERNCIAS BIBLIOGRFICAS aplicaes estatstica. Livros tcnicos Cicntficos

I. Meyer, P.L. (1984). Probabilidade: Editora S.A. 2. Lipschutz, S. (1972). Probabilidade.

Editora McGraw Hill do Brasil Ltda.

64

UNIDADE IV - ESTA TIS TICA lNFERENCIAL


l. NOCESELEMENTRES DE AMOSTRAGEM

...'

Dizemos que em determinadas ocasies, h de se proceder a coleta de dados diretamente da origem, isto , dos sujeitos com quem pretendemos realizar determinado estudo. Entretanto, quando impossvel se observar toda a populao em que desejamos estudar o fenmeno, recorremos s tcnicas de amostragetri, em que nos Iilnitamos a uma

amostra do Universo.

Damos incio a determinao de uma frao da populao, que ir fornecer informaes que sero generalizadas para a populao. Para que esta generalizao seja possvel, os integrantes da amostra devem ser escolhidos adequadamente. Existe a necessidade de definIrmos o conjunto de elementos para os quais devem ser observadas e/ou mensuradas as variveis de interesse dentro da questo ou problema estabelecido. Vamos, ento, definir alguns termos necessrios. CONCEITOS POPULAO BSICOS: OBJETO:

a populao total de interesse sobre a qual desejamos obter informaes. Por exemplo, as peas produzidas por uma fbrica. POPULAO DE ESTUDO: o cOl~unto de indivduos de interesse especfico. Ex.: as peas que permanecem no estoque. CARACTERSTICA POPULACIONAL: Este o aspecto da populao que interessa ser medido. Ex.: O dimetro das peas. UNIDADE AMOSTRAL: Deve ser definida de acordo com o interesse do estudo, podendo ser uma pea, um indivduo, uma famlia, uma fazenda, etc. A escolha deve ser feita no incio da investigao. ESTRUTURA AMOSTRAL: a fonte do nosso estudo, ou seja, o conjunto de unidades amostrais. Ex.: O conjunto das peas selecionadas. VANTAGENS E DESVANTAGENS DA AMOSTRAGEM CENSO EM RELAO AO

VANTAGENS: . a)Economia: evidente que ao utilizarmos apenas uma frao de uma populao, estaremos economizando dinheiro, material, pessoal, etc. b)Rapidez: Quando desejamos urgncia nas informaes a economia de tempo ser indiscutvel. c)Maior amplitude do Universo: Como mesmo custo do CENSO, temos condies de pesquisar uma rea muito maior. d)Mair exatido: Num planejamento em que utilizamos amostragem, consideramos que o pessoal a ser utilizado mais treinado e especializado, concorrendo para que os resultados encontrados sejam mais detalhados, o que no ocorre com o CENSO.

65.

.I

DESVANTAGENS: Em uma populao com nmero menor que 100 (ccm) elementos, a utilizao de amostragem no ser vantajosa. Neste caso procederemos o Censo. A principal desvantagem seria a de que no proporciona informao sobre todos os elementos da populao. TIPOS DE AMOSTRAGEM: AMOSTRAGEM I)ROBABILISTICA: o proccdimcnto atravs do qual cxiste uma probabilidade conhecida e diferente de zero para cada elemento da populao vir a ser sc1ecionado para constituir a amostra. Tambm dita amostragem aleatria. AMOSTRAGEM NO PROBABILSTICA (ou NO ALEATRI): Quando, processo de seleo, no existe nenhum mecanismo de probabilidade associado. no

PROCEDIMENTOS POPULACES

AMOSTRAIS PROBABILSTICOS SIMPLES PARA FINITAS E AMOSTRAGEM SEM REPOSIO.

Segundo a definio de amostragem probabilstica, existe a suposio de sorteio com regras bem determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel. Essa amostragem probabilstica a melhor garantia da representatividade da amostra, pois o acaso ser o nico responsvel por eventuais discrepncias entre a populao e a amostra. POPULAO FINITA: um conjunto de N elementos, onde N um nmcro natural inteiro. AMOSTRAGEM SEM REPOSIO: um procedimento de amostragem tal que cada elemento selecionado no retoma populao at que o tamanho pr-definido para a amostra tenha se completado. Os principais tipos de amostragens~probabilsticas I - AMOSTRAGEM CASUAL SIMPLES SIMPLES (A.A.S). so: ALEATRIA

(A.C.S) ou AMOSTRAGEM

Dada uma populao finita com N elementos consideremos a seleo de 11 < N elementos para constituir uma amostra, scm reposio. Pode-se demonstrar que o nmero total, de amostras possveis, nestas circunstncias :

Cl1 N
Definio 1.1:
REPOSIO,

=(N) =. n!(NN! n)! n -

'

U"m procedimento de amostragem dito CASUAL SIMPLES, SEM se cada uma das possveis amostras tm a mesma probabilidade de seleo.

66

A partir da definio acima, possvel demonstrar que, cada' elemento, na populao, tem a mesma probabilidade de ser selecionada na amostra. Por isso, tal fato tem :sido utilizado para caracterizar uma amostragem casual simples. a) PROCEDIMENTOPR TICO PARA SELECIONAR UMA A.C.S.

Para poder distribuir, a cada elemento na populao, a mesma probabilidade de ser selecionado, sem reposio, necessrio, inicialmente, estabelecer a identificao de cada elemento atravs de um rtulo. Isto constitui a operao de listagem da populao de estudo. Em geral, a listagem estabelecida identificando, cada clemento na populao, por um nmero. Por exemplo, se a populao tem tamnho N = 350 ento, os' elemcntos so identificados pelos nmeros.: 001~ 002~ 003~ ..... ~348; 349; 350. Uma vez listada' a populao podcr-se-ia utilizar' procedimentos mecnicos para selecionar a amostra, digamos, de tamanho /I :::;;o 10. Poderamos utilizar, por exemplo, uma roleta (no viciada) com nmeros de 001 a 350 e gir-la 10 vezes anotando os nmeros de parada da roleta (e excluindo as possveis repeties). Os elementos populacionais rotulados com tais nmeros seriam os componentes da amostra. Alternativamente, poderamos colocar 350 bolas numeradas de 00 I a 350, em uma urna e selecionar 10 bolas numeradas. Outros procedimentos mecnicos poderiam ser imaginados. No entanto, tais procedimentos so, operacionalmente complexos principalmente para grandes populaes. A questo resolvida, de modo mais simples, atravs do uso da TABELA DE DGITOS ALEATRIOS ou pela gerao de nmeros aleatrios em algum programa computacional. A tabela constituda de tal forma que cada um dos dgitos de O a 9 tem a mesma probabilidade de aparecer, em uma' dada posio, que qualquer outro, na referida tabela.

11- AMOSTRAGEM SISTEMTICA. realizada quando os elementos da populao esto ordenados e a retirada dos elementos da amostra feita periodicamente, ou sistematicamente.
Suponhamos que se deseja selecionar uma amostra de tamanho /I de uma populao finita de tamanho N Suponhamos que o quociente (N / /I) = K seja um nmcro inteiro. Uma amostra sistemtica, de intervalo K, consste em selecionar I a cada K elementos da populao de interesse. O carter aleatrio ou: casual dado pela seleo do INCIO CASUAL. Este determinado selecionando-se, aleatoriamente, um nmero entre 1 e K. Este nmero corresponde ao primeiro elemento selecionado para compor a amostra. Os demas so obtidos adicionando-se K ao incio casual. Por exemplo: K = 5. Incio casual 3. Ento, os elementos selecionados sero os elementos numerados pelos nmeros 3, 8, 13, 18, ... A amostragem sistemtica extremamente simples para ser operacionada em trabalho de campo, razo pela qual, em muitas circunstncias utilizada em substituio da amostragem aleatria simples.

lU - AMOSTRAGEM ESTRATIFICADA.
A estratificao de.uma populao correspondelltea uma subdiviso da mesma, em subpopulaes, de tal forma que haja a maior homogeneidade possvel dentro e maior

(,7

heterogeneidade

possvel entre tais subpopulaes.

Cada uma destas subpopulaes

constitui

um estrato. Um exemplo prtico disso ocorre ao supor que um tipo de opinio pblica de uma cidade pudesse depender da renda do opinante, isto , ser inOuenciado pelo bairro de residncia do opinante. Uma amostra casual simples, entre a grande quantidade de amostras possveis, poderia favorecer o aparecimento de todos os opinantes de um bairro s e nenhum dos demais, produzindo um vis nos resultados. Para evitar tal fato e garantir a presena de elementos de todos. os bairros ligados rea de inOuncia em questo, podemos subdividir a populao por bairro de residncia e, ento, selecionar uma amostra aleatria simples ou uma amostra sistemtica, dentro de cada bairro. Dizemos, neste caso, que o bairro a VARIVEL DE ESTRA TLFICAO, ou que a POPULAO foi ESTRATIFICADA POR BAIRROS. Sempre que em uma investigao existe uma ou mais variveis que podem interferir nos resultados da varivel sob anlise conveniente controlar o efeito de tais variveis tomando-as como variveis de estratificao.

IV - AMOSTRAGEM

POR CONGLOMERADOS

Uma amostragem por conglomerado uma amostra aleatria simples na qual cada unidade amostrai um grupo, ou congloillerado, dc elemcntos. Este esquema amostrai utilizado quando h uma subdiviso da populao em grupos que sejam bastante semelhantes entre si, mas com fortes discrepncias dentro dos grupos, de modo que cada um possa ser uma pequena representao da populao de interesse especfico. A esses grupos dar-se o nome de CONGLOMERADOS. O primeiro passo para se usar este processo especilicar conglomerados apropriados. Os elementos entre os conglomerados devem ter caractersticas similares. Como regra geral, o nmero de elementos em um conglomerado deve ser pequeno em relao ao tamanho da populao, e o nmero de conglomerados razoavelmente grande. Tanto no caso da. amostragem estratificada, como no da amostragem por conglomerado, a populao deve est dividida em grupos. Na amostragem estratificada, entretanto, seleciona-se uma amostra aleatria simples dentro de cada grupo (estrato), enquanto que na amostragem por conglomerado selecionam-se amostras aleatrias simples de grupos (conglomerados), e todos os itens dcntro dos conglomerados selecionados faro parte da amostra. " Para o exemplo da amostragem nos bairros da cidade, teramos 'os bairros como ESTRATOS e as CASAS como CONGLOMERADOS. Uma vez feita a escolha do Bairro, seleciona-se ao acaso as casas que faro parte da amostra. Uma vez escolhida a casa, todos os seus moradores devem fazer parte da amostra. Desta forma, existe uma homogeneidade entre as casas do mesmo bairro, devido s condies scio-ecnmicas que levaram seus moradores para l, e uma heterogeneidade entre os moradores da casa em termos de idade, sexo, renda, nvel de instruo, etc. A amostragem por conglomerado recomendada quando: a) Ou no se tem um sistema de referncia listando todos os elementos da populao, ou a obteno dessa listagem dispendiosa~ b) O custo da obteno de informaes crcsce com o aumcnto da distncia entre os elementos.

68

Obsen'uo: .
A inferncia estatstica embasada em conceitos e resultados da Teoria da' Probabilidade. Por outro lado, antes de iniciar qualquer anlise dos dados atravs dos mtodos estatsticos da estatstica indutiva, preciso organiz-los, o que feito com as tcnicas da estatstica descritiva. Um outro problema que surge paralelamente o da escolha da amostra, pois nossas concluses, referentes populao, vo basear-se nos. resu.Jtados dessa amostra. Certos cuidados devem ser tomados no processo de obteno dessa amostra, ou seja, no processo de "amostragem", pois muitas vezes erros grosseiros e concluses falsas ocorrem devido a falhas' nesse processo. .

...

12. DISTRIBUiO AMOSTRAL


Como j sabemos, o probiema de Inferncia Estatstica. fazer uma afirmao sobre os parmetros da populao atravs da amostra. Digamos que nossa afirmao deva ser feita sobre um parmetro e da populao (mdia, varincia ou qualquer outra medida). Decidimos que ser usada a amostragem aleatria simples (a.a.s.), de li elementos sorteados dessa populao. Tambm decidimos que nossa deciso ser baseada na estatstica T, que ser uma funo da amostra (XpX2, , XII), ou seja, T = j(XI' X2"'" X,,). Colhida uma amostra, teremos observado um particular valor de T, digamos to, e baseado nesse valor que faremos a afirmao sobre e, o parmetro populacional. A validade de nossa afirmao seria melhor compreendida se soubssem'os o que acontece com a estatstica T, quando retiramos todas as amostras de uma populao conhecida segundo o plano amostraI adotado. Isto , qual a distribuio de T quando (XI' X 2'"'' X,,) assume todos os valores possveis. Esta distribuio , chamada de distribuio amostrai da estatstica T e desempenha papel fundamental na teoria de Inferncia Estatstica. Esquematicamente, teramos o procedimento representado na figura

abaixo, onde temos: i. Uma populao X, com um certo parmetro e de interesse. ii. Todas as amostras retirdas da populao, de acordo com um certo procedimento. iii. Para cada amostra, calculamos o valor t da estatstica 1'. iv. Os valores de t formam uma nova populao, cuja distribuio recebe o nome de distribuio amostrai de T. Populao Amostra

-- (t)

CJ

8
(,\)

..J

Vejamos

um exemplo

simples

para aclarar

um pouco

melhor

o conceito

de

distribuio amostraI. EXEMPLO 2.1: Uma populao consiste de 5 elementos (N = 5): 2, 3, 6, 8 e 11. Considere todas as amostras de tamanho 11 = 2 que dela podem ser retiradas. Determine todas as possveis amostras e calcule as respectivas mdias e varincias: a) com reposio; b) sem reposio. SOLUO: a) Com reposio: Amostras Mdias Varincia Amostras Mdias Varincia

2;2 2
O

2;3 2,5 0,5 6;11 8,5 12,5

2;6 4 8 8;2 5 18

2;8 5 18
8;3

2; 11 6,5 40,5 8;6


7

3;2 2,5 0,5 8;8 8


O

3;3
3 O

3;6

4,5 4,5

3;8 3; 11 .6;2 4 7 5,5 8 12,5 32


1 1;3

6;3

6;6

4,5 4,5

6
O

6;8
7

5,5 12,5

8;11 9,5 4,5

11;2 6,5 40,5

32

11;6 8,5 12,5

11;8 I 1;I 1 11 9,5 O 4,5

b) Sem reposio: Amostras Mdias Varincia Amostras Mdias Varincia 2;3 2,5 0,5 6;8 7 2
2'6 ..z. 2'8 ..z.

4 8
6'11

5
18
8'2 ..z.

-' 6,5 40,5

2'11

3;2 2,5 0,5


8'6 ..z.

3;6 4,5

3;8 5,5

3i..! I
7

6'2 ..z.
4

-'4,5
4,5
11'8

6;3

4,5
8; 1I

12,5
11 ;2

32
I li3

-'

8,5

12,5

5 18

8;3 5,5 12,5

Ui>
8,5

-'

7 2

9,5

6,5

4,5

40,5

7 32

9,5

12,5

4,5

Se, por exemplo, a quantidade populacional de interesse for a mdia, a grandeza estatstica adotada ser a mdia amostrai (X). Neste caso, a distribuio amostrai ser denominada Distribuio AI11(}s,,.~1 Mdia. da
-

/2.1.DISTRIBUICO

AMOSTH.AL

DA MDIA

Vamos estudar agora a distribuio amostrai da estatstica X, a mdia da amostra. ' Consideremos uma populao identificada pela varivel X, cujos parmetros mdia populacional f.J = E (X) e varincia populacional (Y 2 = VaI' (X), so supostamente conhecidos. Vamos retirar todas as possveis amostras casuais simples de tamanho 11 dessa populao, e para cada uma calcular a mdia X. Em seguida, construamos a distribuio amostrai e estudemos suas propriedades. Ilustremos com os dados do exemplo 2.1.

70

EXEMPLO 2.2: Calcule a mdi~ e a varincia da populao do exemplo 2.1. Construa a distribuio de X para todas as amostras de tamanho 11 = 2, retiradas da populao X do excmplo 2.1. a) Com rcposio b) Sem reposio.

SOLUO:
A populao {2,3,6,8,11} tem mdia a) Com reposio:
fi

= 6 e varincia

UI

= 10,8.

x I 2 P( .i = x) 1/25

2,5 2/25

4.5 2/25

5 2/25

5,5 2/25

" 1/25

(,.5 2/25

7 4/25

8 1/25

X,5 2/25

9.5

11

1/25 2/25

2125

1125

, Baseando-se nesses dados, podcmos verificar que

F(X) =
.J

-2 E(X)=

2":- "25' 1 2 I x'/J=2*-+25*-+3*-+. 25 25' L:1 .x'j'J.=2 *_+(25)2 *-.2 +3


2
2

I +11*-=6 25 2 I .. , + 11 *-=414 25'

"

25

'

25

I *-+ 25

Var(X)

= 41,4 - (6)2 = 5,4

Observe que a mdia das mdias amostrais coincide com a mdia populacional, e que _ 108 a varincia de X igual a Var(X) dividida por 11, isto , Var(X) = = 5,4

-t7

b) Sem reposio:

x P(X=x)

2,5 2/20

4 2/20

4,5 2/20

5 2/20

5,5 2/20

6,5 2/20

8,5 2/20

9,5 2/20

4/20

Com base nessa distribuio, observamos que

E(X) E(X

_ z:=
-2

x'l)

"

2 2 = 2 5,11:-+4 *-+45*' 20 20'


"

2 + ... 195*- 2 = 6 20 ' 20 ' 2 ... +(95)2*-=4005 ' 20 '

. .

)='"'X'/J.
.LJ

-2

2 =(25)2*_+42*-+ ' 20
2

2 20

Var(X)

= 40,05 - 6 = 4,05 Observe que a mdia das mdias amostrais coincide com a mdia populacional, e que

a varincia de X igual a Var(X) _ 108 Var(X)=-'

dividida por

li

multiplicada pelo fator

(NN -li) ' isto , _ I

* (5-2) -5-1

3 =54 *-=405

'

'

71

..

_---

....

Ser que isto foi coincidncia? abaixo.

No, isso sempre acontece

como ser mostrado

Notao: 1-' e (J" : mdia e desvio padro da populao. J1 x e (J"x : mdia e desvio padro da distribuio amostraI da mdia.
Ohs. :
(J"x

tambm conhecido como erro padro da mdia.


11

Suponha que podemos extrair todas as amostras de tamanho uma populao finita de tamanho N, neste caso podemos mostrar que:
J1.\'

(sem reposio) de

=- J1

e crx

= j;;

cr

~N-ll

N.

Se o tamanho da populao for muito grande, infinito ou ainda a amostragem for feita com reposio, os resultados acima passam a ser:
JI.\c -

JI

e cr. x

cr
-VC 11

-- conhecida como o ttor de correo amostraI para populao N -1 finita, ou simplesmente "Fator de Correo".

A quantidade

N-II

PROPRIEDADES

DA DISTRI8UIO

AMOSTRAL

DA MDIA

Duas propriedades muito importantes para a aproximao da distribuio amostraI da mdia para a distribuio Normal, so apresentadas a seguir: 1 - Para grandes valores de 11 (11 > 30), a distribuio amostrai da mdia Normal com mdia J1 e desvio padro (J"j," independente da populao da qual a amostra foi retirada, ou

seja, se uma amostra de tamanho pertence, ento' X

11

> 30, for retirada da mesma populao a qual X se X tenha ou no

- = --' LX
". n

ter distribuio Normal, independente

distribuio Normal. 2 - Caso a populao a qual X pertence seja Normal, a distribuio amostrai da mdia tambm ser Normal, mesmo para pequenos valores de 11, ou seja, se uma amostra de qualquer tamanho for retirada da mesma populao a que X pertence, tendo ~ distribuio Normal, ento X Obs.: Se uma a.a.s. que Xl, X2,

- = --' , tambm LX
f1

ter distribuio Normal, mesmo para

J1

'<: 30.

XI, X2, ... , Xn foi retirada de uma populao a qual X pertence, temos ... , Xn so independentes, com 1-.;(X,) = J1 e ~rar(Xj) = (J"2 (a mesma

72
L

--------

--,

mdia e mesma varincia da v. a. X), assim se X tem distribuio Normal, ou temos que:
Cf!

11

> 30,

X -

N(,u , -)

e fazendo

z=

X-Jl

- N(O,I).

11

-:r;;

A vantagem de estabelecer uma distribuio Normal para X que a partir desse fato podemos usar a tabela da Normal reduz.ida para calcular algumas probabilidades mais facilmente, como o caso do seguinte exemplo:

EXEMPLO 2.3: Quinhentos estudantes de uma escola da rede estadual tem peso mdio 42,32 Kg e desvio padro 8,5 Kg. Determine: a) Qual a probabilidade de uma a.a.s. de tamanho peso total superior a 4.368,5 Kg? b) Para 1.000 amostras todas de mesmos tamanho
/I =

100, rctirada dcsses cstudantes tcr


=

(11

100), retirada desses alunos, em

quantas esperamos que a mdia csteja entre 40,56 Kg e 43,76 Kg ? SOLUO:

N = 500 , ,u = 42,32 e a
a)
11 =
100

= 8,5

100,
(

P(~

Xi > 4368,5)

= p(X

> 43,685)
=

=P

Z>

43,685 - 42,32) 8,5/ Jlo

p(Z > 1,61) = 1-1(1,61)

= 0,0537
espera-se que o peso total

Retirando-se amostras de 100 alunos dessa populao, ultrapasse 4.368,5 Kg. em cerca 5,37% das possveis amostras. b) Para uma amostra com _
P(40,56<
11 =

100, 43,76 - 42,32) / ~ = 8,5 '" 100 1J( 1,69) -1J(-2,07) = 0,9545 - 0,0192

"

X <43,76)

8,5 '" 100 = jJ(-2,07 < Z < 1,69) =

=p

(40,56 - 42,32

... / ~-

<Z<

= 0,9353

Logo, em 1000 amostras

espera-se que aproximadamente

935 dessas amostras

tenham peso mdio entre 40,56 Kg. e 43,76 Kg.

73

2.2. DISTRIDUICO

AMOSTRAL

DA PROPORCO

Admita que a populao infinita, ou que a amostragem feita com reposio. Vamos considerar que a proporo de indivduos, nessa populao, portadores de uma certa caracterstica /l. Assim, cada 'elemento da populao pode ser considerado como uma varivel aleatria X, tal que:

_{I,
X, Portanto:

se o indivduo portador da caracterstica O, se caso contrano "

Logo, X uma varivel aleatria com distribuio de Bernoulli com parmetro p, isto P(sucesso) = P(X = 1) = p, e P(fracasso) = P(X = O) = l-p. .

E(X)

J-I

=p

J"ur()()

()2

=
/I

p(l-p) . e indicando por .)'" =

Retirada uma a.a.s. dessa populao dc tamanho total de indivduos com a caracterstica binomial com parmetros distribuio Normal, para amostraI, temos que:
/I

L Xi
;:.-1

"

, o

na amostra, j vimos quc S" tcm distribuio tem

- .)' c p. Tambm, j foi mostrado que a mdia amostrai X = -" /I


suficientemcnte grande
(/I

/1

> 30). Chamando

P = X,

a proporo

jJ _
pOIS,

N(p, p(J - p))


/I

'

1 , A) E( P =' E'(X) = ~ - 11 = -1 ~ "'" = -I1P = P 11 11


A -;: ,

1,(8,,) 1"((")
= VareS,,)

=
1

11., e
1

Var(p)

= Var(.)

= 11

1,

-2

I/ar(.),,) = l-/1p(l/I

p)

= ---=/1

p(! - p)

(Ji"

EXEMPLO

2.4: Em uma 'eleio, dcterminado candidato recebeu 46% dos votos. Determine a probabilidadc de que, em um cscrutnio efetuado em

a) 200 e
b) 1000 dos votantes, se obtcnha maioria em favor do candidato. SOLUO.: ;~ a)
Ill

=0,46 101)

2.

(Tj,

=,

,.pO /1"

p)

0,46 *0,54 =--20-0-=0,001242

=>

()il

=0,035242

P ( p> 200

( 0,505 - 0,46) = P z> 0,035242 = P(Z > 1,28)= 1 -ljJ( 1,28)= 1- 0,8997 = 0,1~03
',' .r

Espera-se que em escrutnio com 200 votantes, 10,03% desses tenham maioria para o candidato.

74

..

2 pC1 - p) b) 11ft = 0,46 e crj, = --".-=

0,46 * 0,54 --10-0-0-=

0,0002484

=> crj, = 0,0157607

~ 501) = p ( Z> ---- - 0,46) = jJ(Z > 2 60) = 1- "'(260) = 1- O9953 = O0047 0,501 . P j'J> -1000 OO15760 7 ~, Y' , , , ( ,
J

Espera-se

que escrutnio

com 1000 votantes,

0,47%

desses escrutnios tenham

maioria para o candidato.

2.3. DISTRIDUJCO

AMOSTRAL

DA VARINCIA

Tomando todas as amostras aleatrias possveis, de tamanho 11, de uma populao, e calculando a varincia de cada amostra, obtemos a distribuio amostrai das varincias. EXEMPLO 2.5: Obtenha a distribuio amostrai das varincias a partir do exemplo 2.1.

SOLUO:
a) com reposio:

S2
p(S2=S2)
E(S)=
2

o
5/25

0,5 2/25

2 2/25 5 0*-+0 25

4,5 4/25 2 5*-+ 25

2/25

12,5 4125

18 2/25 270 25

32 2/25

40,5 2/25

L s2P(S 2 =s 2)=
=

'

2 .. , +405*-=-= ' 25

108 '

Es2)2)

I (S2)2 p(S2

= S2) = 02

* -25 + (O' 5)

1_

+ 25

+(405)2 ,

* -25 = 272 ' 76

Var(S2) = 272,76 - (19,8)2 = 156,12

b) Sem reposio:

S2
p(S2=S2)
E(S)=
2

0,5 2/20

2 2/20 2

4,5 4/20

12,5
4/20

18

2/20

2/20

32 2120

40,5 2/20

Is

P(S

=s

2 )=05*-+ 20 ,

2 270 .. , +405*-=-=135 20 ' 20

'

S2)2)

= I(S2)2

p(S2

= S2) = (0,5)2 ;0 + .,. +(40,5)2

* ;0

= 340,95

Var(S2) = 340,95 - (13,5) 2 = 158,70

75

A.derivao das propriedades gerais da distribuio dessa estatstica no muito fcil, e o modelo de probabilidade resultante depende do resultado apresentado abaixo.

Teorema 2.1: Se extramos amostras aleatrias de tamanho


ento Y ='
(11-1)S2
1

11

de uma populao Normal, de

tem dlstnbuio

.,

QUI-quadrado com (11-1) graus

(}"

liberdade

(x t'-I)'
E(Y) = (11- I) c Var(Y) = 2(11- I).
(}"2

Pode-se mostrar que

Ento, podemos cscrever S 2 = (


(}"2 (}"2 ,

11-1

)y

sendoE(S2)=,

11-1

) E(-Y) = (

11-1

,(11-1)=0"2

(}".

(}".
2

2(}"4

e Var(.. = ~.2) 2 Var(Y) = . (11-1) (1l~1)

2(11- I) = (

/1-1

Observe que o exemplo 2.5, no satisfaz as condies do teorema e portanto, os valores das esperanas e das varincias no coincide com os resultados do tcorema, com exceo do valor da esperana no caso com reposio, que tem uma justificativa terica fora do contexto deste curso. EXEM PLO 2.6: Observou-se que a produo mensal de uma indstria durante vrios anos, verificando-se que essa produo obedecia a uma distribuio normal, com varincia 300. Aps um perodo de 24 meses, constatou-se que X = 10000 e S2 = 400 .Qual a probabilidade dessa varincia ter aumentado?

SOLUO:
P(S
. ,2

> 400)

=P

(24

- 1)S2 (24 - 1)400) 300 > 300

= P(X

2 (23)

> 30,67)

= 0,10

Logo, a probabilidade da varincia tcr aumentado nesses ltimos 24 meses, de 10%.

3. REFERNCIAS "BIBLIOGRFICAS

1. Morettin,

P.A. & Bussab, W.O. (1984).

Mtodos Qual1titativos para Ecollomistas e

Administradores - E,.ta/stica Bsica. Atual Editora Ltda.


2. Costa Neto, r.L.o. (1977). E,.tatstica. Editora Edgard Blcher Ltda.

3. Spiegel, M.R. (1978). Probabilidade e E,.tatstica. Editora McGraw Hill do Brasil Ltda.

76
l

IUNlDADEV

- BSTIMAO

I
I

IUNTRODUCO

.....

o problema de estimao informalmente definido por: Assuma que alguma caracterstica dos elementos da populao possa ser representada por uma varivel aleatria X, a qual tem densidade Ix (x; O), onde a forma da densidade conhecida, mas o parmetro

desconhecido (se fosse conhecido, a funo de probabilidade seria completamente especificada, e no haveria necessidade de fazcr inferncia). Assuma que os valores xl'x ' ,xnde uma amostra aleatria XpX2, . , ,Xn de Ix(x;O) possa ser observada. Em base dos valores amostrais observados
2

XI ,Xl'

...

,X"

desejvel estimar o valor do

parmetro desconhecido ou o valor de alguma funo do parmetro desconhecido. Esta estimao pode ser feita de duas maneiras. A primeira, chamada de esOmac1o pOll/ual, o valor que alguma estatstica, digamos T(X., Xl' ... , X,,), assume ou estima, o desconhecido Tal estatstica chamada de estimado,. pOlltual. A segunda, chamada de estimao por ill/erva/o, definida por duas estatsticas, dig~mos 1; (X" Xl' ... ,X,,) e ~(X"Xl' (TI eX
I'

e.

... ,X,,),
X
2 , ,

onde 1'2 ex
l'

T,(X"Xl,

... ,Xn)

< Tl(XI'X2"",Xn),

tal com

que

n)'

2 , . ,

n)

constitua

um

intervalo

probabilidade

conhecida de conter o desconhecido O.

12.

ESTIMACO

PONTUAL

..

Lembrando o que j foi dito na primeira unidade, chama-se e. timlll/or, quantidade calculada em funo da amostra, que sendo uma funo amostrai, considerada uma estatstica, e como tal uma varivel aleatria, caracterizada por uma distribuio de probabilidade e seus respectivos parmetros prprios. Estimatil'a um particular valor nmerico assumido p'or um estir.nador.

Notao: O o parmetro de interesse.


T um estimador de O To uma estimativa de O Quando falamos em um estimador queremos frisar que podem existir vrios estimadores para o mesmo parmetro, determinado por algum mtodo estatstico. Sendo portanto, a escolha do melhor, feita atravs de critrios que satisfazem propriedades de um bom estimador. A seguir descrevemos algumas das principais propriedades. '

77

2.l.PROPRIEDADES

DOS ESTIMADORES
mostrar como as propriedades de um estimador

No exemplo abaixo, procuraremos podem ajudar-nos a analis-lo.

EXEMPLO 2.1.: Desejamos

comprar um rine e, aps algumas selees, restou-nos 4 alternativas que chamaremos de rifles A, B, C e D. Foi-nos permitido fazcr um teste com cada rifle. Este teste consistiu em fixar o rine num cavalete, mirar o centro do alvo e disparar 15 tiros. Repetiu-se o procedimento para cada rifle e os resultados esto ilustrados na figura abaixo .

':@3~~, ~
~~~

/-x::::::*:::::---~

. '-..:*-"X".

"---

--

(A)

(B)

x
x x

(C)

(D)

Figura 2.1: Resultados de 15 tiros dados por 4 rifles

Para analisar qual a melhor arma, podemos fixar critrios. Por exemplo, segundo o critrio de "em mdia acertar o alvo", escolheramos as armas A e C. Segundo o critrio de "no ser muitO dispersivo" (varincia pequena), a escolha recairia nas armas C e D. A arma C aquela que rene as duas propriedades e, segundo esses critrios, essa seria a melhor arma. Mas, se outro critrio fosse introduzido (por exemplo, preo), talvez essa no fosse a arma mais interessante. s vezes, a soluo deve ser um compromisso entre todas as propriedades. Esse exemplo nos permite introduzir alguns conceitos informalmente. Diremos que um estimador no tendencioso se "em mdia acerta o alvo". Chamaremos de preciso proximidade de cada observao de sua prpria mdia. A curcia mede a proximidade de cada observao ao valor alvo que se procura atingir.

78

-----,

Desse modo, pdemos descrever cada arma do seguinte modo: Arma Arma Arma Arma A: No tendenciosa, baixa preciso e pouco acurada. B: Tendenciosa, baixa preciso e pouco acurada. C: No tendenciosa, boa preciso e muito acurada. D: Tendenciosa, alta preciso e pouco acura,da.

Do exposto acima, notamos a importncia de se definir propriedades desejveis para estimadores. O primeiro critrio que iremos abordar o de no tendenciosidade. a) No-Tcndenciosidade no tendencioso) de ele pretende estimar (Sem Vcio): Diz-se que um estimador T no viciado (ou ainda quando seu valor esperado o prprio parmetro populacional que isto , E(T)

e, e,

= e,

para todo

Note que a esperana de T calculada sobre a distribuio amostrai de T. Por exemplo, a mdia amostrai X, um estimador no viciado para o parmetro populacional f.1. (isto , E( X) b) Consistncia: no viciado,

J.I).

Diz-se que uma sequncia de es'timadores Tn CO/1siste/1te se, alm de ser sua varincia tende a zero, quando o tamanho da amostra (/1)

suficientemente grande, isto ,


limE(Tn)=O
n-J>1t)

e limVar(l;,)=0
n-.)-U)

Isto significa que, sendo T um estimador consistente, pode-se aumentar significativamente o tamanho da amostra, de modo a tornar o erro de estimao to prximo a zero quanto se deseje. Por exemplo, a mdia amostrai .X, um estimado r consistente de J.1.
2

(lim Var(X)
II-)(.()

lim ~
1I-)fO

11

= O) .

c) Eficincia: Sejam TI e 1'2 dois estimadores no viciados de O, e ainda

rrar(1;
ento, TI dito mais eficie11te que T 2.

) < Var(1~ ),

Por exemplo, pode-se mostrar que a mdia e a mediana so estimadores no tendenciosos para a mdia de uma populao Normal, mas X mais eficiente, pois a sua varincia menor.

E:xEMPLO 2.2: Considere uma populao qualquer, com mdia J.l e varincia unitria, da
qual so obtida todas as amostras possveis de tamanho 3. Qual(is) does) estimadores abaixo (so) no tendencioso(s) para f.l?

7lJ

~ a) b) c)
111

1 6 XI

+3"x2 +3"x.1

f.1~

1 1 1 +- x +- X 3x 23 3 3 ~] 1 I
=1 1 =-

f.13

XI

+ - x2 + 6

3'

X ~

SOLUO: a) ~ E(Pl)= 1 ( ) 6 E XI 1 ,( 1 "( I 1 +3"1~x ) +3"I~ x ) =61J1+3"P+-:;/'=7/'


2 .1

~) 1,( I "( I b) E,(J.l-z = 3" 1" x I ) +3"I E,( 2 ) + 3" 1~ X 3 ) = 3" J1 x c)

-I-

] ] 3" J1 + 3" li = J1
I J 9

E(.u3) = 4li(xl)+61~(XJ+3li(xJ=
Ento,

~]

4'u+ 6P+)P=T2P

fi2

um estimador no-tendencioso.

12.2. ESTIMADORES

PONTUAIS

. Para se proceder estimao pontual, deve-se escolher o melhor estimador possivel, colher a amostra e, em funo de seus elementos, verificar a estimativa obtida, a qual corresponder a um ponto sobre o eixo de variao da varivel. MDIA: O melhor estimador da mdia populacional, " ""'x
P = X
A --

f.1,

a mdia amostrai

X,

isto , 2.1

= ..!..::!.~,

11

Pode-se provar que este estimador satisfaz as propriedades de um bom estimador: Pela distribuio amostrai da mdia observa-se facilmente que este um estimador notendencioso e consistente. Alm disso, podemos provar que tambm eficiente. VARINCIA: Quando a mdia expresso: I-' conhecida, deve-se estimar a varincia atravs da

d2

:",2

" L (xi
= _;._,'

_1-')2
_
11

2.2

80

... ,

i.

e desvio padro por:

" L (Xi

- J.1)1
11

u=s=

ice.\

2.3

Quando a mdia J.1 desconhecida, que a situao mais comum na prtica, deve-se substituir o valor de I' por X, a mdia amostrai, e estimar a varincia pela expresso: " L(x; - X)l -I = SI = _.;0._1 _
11-1

2.4

e o desvio padro por: "

L(x

X)I

2.5

u=s=

i',J

11-1

Observe que o denominador nas expresses (2.4) e (2.5) 11-1 ao invs de /1 das expresses (2.2) e (2.3). Embora para grandes amostras seja indiferente o uso de 11 ou 11-1. Estes estimadores tambm satisfazem algumas propriedades de um bom cstimador: no tendencioso, consistente e eficiente para (J'I. Observe a distribuio amostrai da varincia para se convencer que este um estimador no-tendencioso e consistente.

PROPORO: O estimador da proporo populacional, p dado pela proporo amostrai, p= -,


A

"'\-'11
11

onde Sn o nmero dc elementos quc aprescntam uma determinada

caracteristica entre os 11 elementos da amostra. Observando-se a distribuio amostrai da proporo, verifica-se que um estimador no-tendencioso e consistente. Quando a populao finita, desejando-se estimar pontualmente o nmero de elementos da populao que apresentem uma determinada caracterstica, esse nmero estimado por Nj, onde N o tamanho da populao.

[3. ESTIMACOPOR

INTERVALO Xl' X
I'" .,

I
X"' que tem densidade

Assuma que uma amostra aleatria

Ix

(x; O)

possa ser observada. Com base nos valores amostrais observados, estimamos o valor do parmetro desconhecido ou o valor de alguma funo do parmetro desconhecido. Entretanto, por melhores que sejam as qualidades do estimador utilizado, no devemos

e,

SI

esperar que essa estimativa coincida com o verdadeiro valor do parmetro. Na verdade, a probabilidade de que isto acontea extremamente pequcna, sendo igual a zero, quando T for uma varivel aleatria contnua. Ento, desejvel que a estimativa pontual seja acompanhada por alguma medida do erro possvel da estimativa. nesse sentido que a estimao por intervalo complementa a estimao pontual. Na verdade, procuramos um intervalo em torno da estimativa, onde este intervalo produzido pelo estimador pontual acompanhado de uma medida de confiabilidade de que o verdadeiro valor do parmetro pertena ao intervalo encontrado. Ento, a amplitude desse intervalo uma medida natural da preciso da estimativa. Esses intervalos so chamados Intel"Valo de Confiana, e a probabilidade de que esse intervalo contenha o verdadeiro valor do parmetro, denomina-se Nvel de Confiana ou Grau de Confiana, sendo representado por (1- a). Logo, a ser a probabilidade de erro ao se afirmar que o intervalo contm o verdadeiro valor do parmetro.

3.1. INTERVALO

DE CONFIANCA

PARA A MDIA nA POPULAO

Duas situaes so consideradas quando desejamos estabelecer um Intervalo de Confiana para P, a mdia da populao: Quando a varincia populacional ou no conhecida. Vamos considerar tambm que a distribuio de X Normal, sendo esta suposio feita ou a partir da distribuio dos elementos da populao ou atravs de grandes amostras, isto , estamos considerando que a populao que origina X Normal ou que, o tamanho da amostra, /I > 30~ Portanto, para todos os efeitos supomos que

X - N(P;

~12).
UI11

De modo geral estamos interessados em encontrar


[X &0 ;

intervalo da forma:

80],

isto ,

[ X:!: CO ], ERRO DE

onde

&0

a semi-amplitude

do intervalo de confiana que denominado

PRECISO. Portanto, o objetivo encontrar


b"o,

tal que:
,LI
0)

p(lx - I < 8
que equivalente a P(p-b"O<'X

= I- a,

<p-l-b'o)=I-a.

Esta afirmao probabilstica pode ser reescrita do seguinte modo: P( X 80

< li < X

-I- 80)

= 1-

a.

82

a) cr2 conhecida: Como, tnhamos observado anteriormente quando falvamos de distribuio Normal, e estvamos interessados em determinar uma constante 'a' tal que P(Z < a) = "o, onde Xo seria a rea na tabel da distribuio Normal padronizada, inferior ao valor de 'a', por exernplo, se Xo = 0,05 (5%), isso implica que 'a = -1,64' (ver tabela da distribuio Normal reduzida). Assim vamos tratar os valores de 'a' pela notao z" e
2

Xo

por a/2 . De tal forma que as probabilidades:


)

P(Z < -z a

=a/2 ,

P(Z > +z

a )
o-

a/2

P(_z,,<Z<+za)=(l-a).
I 2

--

Usando esta notao, podemos encontrar o valor de

Co

da'seguinte maneira:
[;0 -

P(J-l - Co < X .. + co)= I - a < J-l

:::::>

[J1 -

[;0 -

J-l

<Z <

J-.l +

. a

J1]

== 1- a

J::
[;. + P ----2-<Z<-_o c
.[ cr a

J::
e +Z
fI

=l-a

'

=>

:- Z

Co

.j;;
PC X
-

.j;;
Co

l'

.J::
:::::>

=-I

+ Co a

a:::::> Co

= z~ J;i
2

.j;;

Isto ,

<,u. < X + co)

1 - ex

u P(X-=a-<P<X+za--

- ..r;;
I

-- J;, 2

aJ

=I-a.

Em outras palavras, isso significa que a probabilidade de que o verdadeiro valor de pertena ao intervalo (- X EXEMPLO
Z
fI

J.1-

a ~ + z" r X
'1/11

'i

u r'1/ /I

J igual a (1 - ex).

3.1: A medida dos dimetros de uma amostra aleatria de 200 cilindros fabricados por uma determinada mquina, acusou uma mdia de 2,093 em. Sabe-se que o desvio padro dos dimetros dos cilindros de 0,107 em. Determine o intervalo de 95% confiana para o dimetro mdio de todos os cilindros.

SOLUO:

11

200,

= 2,093,
:::::>

cr::: O, I07 e 1- ex = 0,95

= 0,05

=> a/2

= 0,025

P(Z < - ZII)

0,025

:::::>

=a
2

= 1,96

IC(,u.)

= ( 2,093

- 1,96 *

0,107) ;2,093 + 1,96 * r;;;;;; '1/200 '1/200

0,107

= (2,078;2,108)

Isto significa dizer que, com probabilidade 0,95 o verdadeiro valor da mdia dos dimetros dos cilindros pertence ao intervalo (2,078cm;2, 108cm).

lO

b) 0-2 desconhecida: Quando no conhecemos o desvio padro da populao, devemos estim-lo com base no conjunto amostraI. Adota-se como cstimador a varincia amostrai S2: " L(x; - X)2
~'2 __ '._1 _

/I-I

A substituio simples da varincia populacional pela varincia amostrai, somente justificvel para grandes amostras (11 > 30). Para amostras pequenas (11 < 30), torna-se necessrio uma correo na distribuio padronizada, que consiste em substituir a distribuio Normal (2) pela distribuico t-Student ( 't' de Student). Como veremos a seguir. Conforme mostrou" Gosset, a estatstica: 1'= .X-I'
.\'

J-;i
distribui-se simetricamente, com mdia zero, porm no normalmente. claro que, para grandes amostras, S deve ser prximo a a, c as correspondentes distribuies. T devem estar prximas da Normal reduzida. Vemos, pois, que existe uma faml.ia de distribuies T cuja forma tende distribuio Normal reduzida quando 11 cresce. Notemos que a estatstica definida acima tem 11-1 graus de liberdade, o que justifica a sua notao por l(n-/l.

Notao: T -'(n-.I).
A tabela da distribuio t-Student fornece valores de t em funo de diversos graus de liberdade vede algumas probabilidades correspondentes cauda direita na respectiva distribuio. importante notar que a expresso acima pode ser escrita X-I-' ( 1'=--*-=2(5
(

S
S
-.

J:;
Conseq uentem ente, onde
1(n l;a12)
o

t(n l;"/2)
o

Cf
za/l

"""lo
LJ

=> Z(l/l

= t("01;'l/2)

(5

um valor tabelado na distribuio t-Student. Observe que

2 nmero de graus de liberdade, associados com a estimativa de 8 .

'/1-1'

representa o

Fazendo as substituies, temos:

PC X -

Co

< J.l < X +

Co) =

1 ~a

=> l' X-zu-<fl<X+z,,o.

2.

J-;;

(5

0.0

..rn

(5)

=l-a

.
= 1- a .

=> P ( X - '( fl) II-I;i

'VII

S. r < I-' < X + '("

n-I;2

(l)

sJ
'V /I

84
l

Em outras ,palavras, isso significa, no caso da varincia desconhecida e com que a probabilidade de que o verdadeiro valor de p pertena ao intervalo

11

< 30,

(
igual a (1 - a). EXEMPLO

X-I

(,,<;_) .j;, ,

,-'X+l

s -

(" I;';) .;;,

,-

s]

3.2: Uma amostra de 10 medidas do p direito ," dos degraus dC?uma escada acusou os seguintes valorcs, em ccntmetros: 20, 23,27, 19,26,24, 30, 23, 18 e 28. Determine um intcrvalo de 99% de confiana para a mdia do verdadeiro p direito dos degraus da escada.

SOLUO:
/1=

10,

x=

23,8 e S=3,99,com

l-a.
1(9;0,005)

0,99

, a = 0,01 => _ a/2 = 0,005 =>


IC(p)= ( 23,8- 3,25

= 3,25

* JlO

3,99

;23,8- 3,25

*..J\O

3,99)

= (19,70;27,90)

Logo, com 99% de confiana a mdia de todos os ps direito dos degraus desta escada esto entre 19,70cm. e 27,90cm.

3.2. INTERVALO A
/I

DE CONFIt\NCAPt\Rt\ amostrai de

t\ I)ROPORCO

DA POPllLt\CO , como vimos, c,

distribuio
'

iJ ,

para

grandes

amostras

N( p, p(l- p)
o -- V
2

'd entao o mterva 1 que estamos procuran"d o c a ('arma (~ o [J

~ &" ; I) + 1:" )

por um caminho scmelhante ao que foi feito no caso de estimao de 11, chega-se facilmente a - . . c = za \1p(l- p) . Note que essa expressa0 e em tudo analoga ao . mtervalo de confiana
11

para fl, pois estimador


jJ.

7..r,;

o desvio padro de estimador X, e

F- P)(,

o desvio padro do

p.

Observe que o desvio padro de

est em funo do parmetro desconhecido

Podemos, entretanto, simplesmente substituir p por sua cstimativa

p.

Tal substituio

encontra justificativa no fato que, sendo a amostra grande para haver satisfeito s condies da aproximao pela Normal, a estimativa deve scr razoavelmente prxima do valor real do parmetro. Alm do que, o eventual erro a mais que poderamos cometer ao substituir p por jJ seria em boa parte compensado pelo erro a menos que, ento, cometeramos ao substituir 1- p por 1 _ fi, e vice-versa, o que torna ainda mais justificvel a aproximao feita.

xs

Logo, o intervalo de confiana para p, ao nvclde confiana 1- a, dado por: [1(1 11

J -J.: z"
2

fi

significando que

~ ~ jJ(1 p ( p-z~_ 11
2

::;;p::;;p+z~_
2

J( I 11

p-]

= 1_

a , onde P(Z < -z

!l_ )

==

aI2

EXEMPLO

3.3: Uma amostra aleatria de 1000 eleitores de certo distrito eleitoral d 350 como favorveis a certo candidato. Determine um intervalo de confian~ ao nvel de 95% para a proporo de eleitores favorveis ao candidato. 1- u == 0,95

_ ~ 350 SOLUA0: n == 1000, P = -= 0,35 e 1000

a = 0,05 => ~ = 0,025 => z,~= 1,96


2

IC(p)

0,35 - 1,96 *

f1
'.

35(1- O35) ~o 35(1- O 35) ' ;0,35 + 1,96 *' ,\ 1000 1000

= (0,32;0,38)

Ento, a proporo confiana.

de eleitores do candidato est entre 32% e 38% com 95% de

4. REFERNCIAS

BIBLIOGRFICAS

1. Morettin, P. A. & Bussab, W. 0.( 1984). A--ltodos_ Qualltitativos para Ecollomistas Administradores - Estatstica Bsica. Atual Editora Ltda. 2. Costa Neto, P.L.O. (1977). Estatstica. Edgard Blcher Ltda. 3. Mood, A. M., Graybill, F. A. & Boes, D.e. (1974). lntroduction Statistics. 33 ed. San Farncisco. McGraw-Hill Book Co.

to the Theory of

".

86

I UNIDADE

VI-TESTES
.

DE HIPTESES

I
I

11. TNTRODUCO<

Estudaremos uma forma de tratar o problema de lzer uma afirmao sobre o parmetro desconhecido O associado a uma varivel aleatria X, baseado em uma amostra aleatria simples (a. a. s.)(X.,x2, ... ,XII)' extrada da populao. . Em vez de procurarmos uma estimativa pontual do parmetro ou um intervalo de . confiana deste parmetro, freqentemente nos parecer conveniente admitir um valor hipottico para o parmetro B, e depois utilizar a informao da amostra para confirmar ou rejeitar esse valor hipottico. ' Um problema de teste de hiptese paramtrico sempre ter a seguinte forma: Seja X _ f(x;B), B E0, onde 0 chamado de espao paramtrico, e o conjunto de todos os valores possveis do parmetro da v. a. X. Especificamos um conjunto 0 o' tal que e o c e, e a pergunta que fazemos :

B E0 ? Ento, para cada a. a. s. (X.,x2, 0

... ,XII) a resposta "sim" significa que com base

nesta a. a. s. mais razovel acreditar que O E o' do que no pertena. Antes de falarmos de teste de hipteses, precisamos introduzir algumas notaes e darmos algumas definies.

12.

CONCEJTOSFUNDAMENTAIS

I
]f o'

Define-se por H o a hiptese existente, chamada hiptese nula, a ser testada e P?r H\ a hiptese alternativa. O teste ir levar a aceitao ou rejeio. de o que eorresponde rejeio ou aceitao de li J' respectivamente. Entretanto, para manter a uniformidade enuncia-se o resultado [mal sempre em termos da hiptese Ho' ou seja aceitar ou rejeitar H o . Qualquer que seja a deciso tomada, estamos sujeitos a cometer erros. Para facilitar a linguagem, necessitamos das seguintes defmies: Erro tipo 1: rejeitar a hiptese nula, quando esta verdadeira. probabilidade de cometer esse erro, isto , a = P( erro tipo I) = P(rejeitar H o / H o verdadeira) Chamamos de a a

Erro tipo 11: no rejeitar fi o quando H o llsa. A probabilidade de cometer esse erro indicada por f3, logo, f3 = P(erro tipo ll) = P(no rejeitar Ho/ lIo falsa)

X7

-.1,

Nossas decises em um teste de hiptese podem ser resumidos na seguinte tabela: Tabela 1: Acertos e Erros nas decises tomadas em um teste de hiptese
---Amostra __ !~~pulao _

Realidade 1-10 Verdade Deciso Correta (I-a) Ho Falsa (=Ht Erro tipo 11 (P) Deciso Correta (1-

Aceita Hu Deciso Rejeita 1-10

A probabilidade a. de cometer um erro de primeira espcie um valor arbitrrio e recebe o nome de Nvel de Significncia do teste. O resultado da amostra .cada vez mais significante para rejeitar H o quanto menor for esse nvel. Usualmente, esses valores so fixados em 10%, 5% ou 1%. . A probabilidade ~ uma funo que depende dos valores do parmetro sob H, e 1- p denominado de Potncia do Teste, ou seja a capacidade de rejc,itar H o quando H o falsa, urna medida de qualidade do teste. Um teste de hiptese que fornece uma regra de deciso com uma funo pqtncia maior que outro dito mais poderoso. Note que na prtica no conhecemos a realidade. Jamais saberemos se a deciso tomada foi certa ou errada. O certo que podemos cometer dois tipos de CITO: o erro tipo 1 quando nossa deciso rejeitar lJ o sendo H o verdadeira e o erro tipo 11 quando nossa deciso for aceitar Ho sendo llo falsa. Pensamos ento que um teste de hiptese ideal aquele em que a regra de deciso que ele oferece torna mnimo os erros tipo 1 e 11. Isto no possvel, pois ao tentar minimizar o erro tipo I estamos aumentando o erro tipo 11 e viceversa. No entanto, quando fixamos o erro tipo 1, conseguiremos diminuir o erro tipo II aumentando o tamanho da amostra o mximo possvel, dentro das limitaes, de tempo e custo, permitidas. Sendo um teste de hiptese uma regra de deciso, e esta Aceitar ou Rjeitar Ho' o conjunto de valores que levam a rejeitar fio chamado de Conjunto Crtica, denotado por RC. O complemento Regio de Aceitao. C .tico ou Regio de RC chamado de Conj unto de Aceitao ou

3. PASSOS PARA CONSTf~UCO ()E UM TESTE DE IIIPTESES Vimos, na seo anterior, o procedimento que se deve usar para realizar um teste de hiptese, discutindo as notaes tcnicas. Daremos abaixo uma seqncia que pode ser usada sistematicamente para qualqu' teste de hipteses.

Primeiro Passo: Formule as hipteses nula e alternativa. No nosso caso:


/lo: O = 00'

A alternativa mais geral seria:

H,:O;/:.O()

(a)

"',

K8

Poderamos

ainda ter alternativas

da forma:

/fI: () < O()


ou

(b)

HI:O>Ou
dependendo das inforinaes que o problema traz.

(c)

Segundo Passo: Especifique Terceiro

o nivel de signilicncia

a . Em geral, 0,0 1~0,05 ou 0,10.

. Passo:

Use a teoria estatstica e as informaes disponveis para decidir qual estatstca ser usada para julgar !J ()' No se esquea de identificar a distribuio amostraI adequada.

Quarfo Passo: Determine Quinfo

a regio crtica do teste, Re. fornecidas pela amostra para encontrar o valor da

Passo: Use as informaes estatstica

do teste do terceiro passo. obselvada rejeite. em estudo. da amostra no pertencer

Sexfo Passo: Se o valor da estatstica aceite 1J o ~ caso contrrio,

regio crtica,

Sfimo Passo: Concluir a respeito do problema

4. TESTES SOBRE A MDIA DA POI)LJLACO


Vejamos agora uma aplicao dos sele passos, definidos na seo anterior, para testar a hiptese de que a mdia de uma populao J.l igual a um nmero fixado Po'. Vamos dividir este estudo em duas partes: a)
(j2

conhecida ou

Il

> 30:

1.. Hipteses:

Ho: f.1 = Po H I: P :;:.Po

(a) (b) (c)

H.:p<po
HJ:p>Jl()
2. Fixar

a.

89

3. Estatstica do Teste: X - N

()l;'~,')

4. A Regio Crtica ir depender da hiptese alternativa (Regio Grifada). Ento,

a)

Ho:p
H
I:

= Po
:t:

/-..,('!_, __ ,l~.

J.10

.d

').,.,
l' .,' .. .

. -Z,V2

+Z".12

b)

Ho: p = J.10 H1:p<J.1u

~ "",,,~'~~~i"f.i
-Z'L

'

...

c)

Ho: p

= Pu

H):p>po

..

~"
.

"f.;'j.V),,"-_
~"

+Za.

5. Calcular a Estatstica Z c =

X-Po

0/

/Jn
6. Deciso: Rejeita-se ou no H o ? Depende da Regio CrLica do passo 4. Se Z c E RC , rejeita-se 110, Caso contrrio, aceita-se H o . 7. Concluso

EXEMPLO 4.1: Uma mquina automtica de encher pacotes de caf enche-os segundo uma
distribuio normal, com mdia p e varincia 400 g2. O valor de fJ pode ser fixado num mostrador situado numa posio um pouco inacessvel. A mquina foi regulada para I' = 500g. Desejamos, de meia em meia hora, colher uma amostra de ] 6 pacotes e verificar se a produo est sob controle, isto , se P = 500g ou no. Se uma dessas amostras apresentar uma mdia de 492 g, voc pararia ou no a produo para verificar se o !TI0strador est ou no na posio correta?

90

SOLUA0:

11 =

16 X

= 492

g,

cr

= 400g

c Jlo = 500g

1. Ho:

H.: J.1

J.1 = 500 :t 500, pois a mquina pode desregular

para mais ou para menos.

2. a = 0,01 =:> a/2


_ 3. X - N (400) J.1;J6

= 0,005
, X - N(II ,25)
Normal, obtemos que -Z".J2 '-

' isto

4. Da tabela da distribuio Logo, RC =

= -2,58 e Za./2

= 2,58.

{Zc E~H/ Zc < -2,58 ou Zc > 2,58}

5, Zc=

492 - 500

=-1,6

6. Como (Zc = -1,6) ~RC, a nossa deciso ser no rejeitar Ho'


7. Ao nvel de significncia de 1%, no pararamos a produo, pois o desvio da mdia da amostra para a mdia proposta por H o pode ser considerado como devido apenas ao sorteio aleatrio dos pacotes. b)er2

desconhecida e

li

< 30:

1. Hipteses:

Ho: J.1 = H1:JI:tJlo

110

(a) (b)

H I: J.1 < Jlo

H I: P > Jlo
2. Fixar

(c)

a.
do Teste:

3. Estatstica

X -

t-Student

com

11-1

graus de liberdade Ento,

4. A Regio Crtica ir depender

da hiptese alternativa.

a)

Ho: JI

= Jlo
.~ .,!';:j(':V~~i .

,,--.....

H]:p:tJlo

..~ ,,

/
,

""- b~
til.';

i :'. Oh!~\"'h

-I., '.'

lJ\

b)

Ho:p=po H\: p < Po

~
< .~;

;~;l ~
-la.

"'"

c)

H o: p = Po H I: P > Po

.~

/~'-_. .
la.

S. Calcular a Estatstica I e =

X-fi \' /
l /

// ..j";;
6. Deciso: Rejeita-se ou no IJ o ? Depende da Regio Crtica do passo 4. Se I c E RC , rejeita-se H o . Caso contrrio, aceita-se Ho' 7. Concluso

EXEMPLO 4.2: Um fabricante afirma que seus cigarros contm no mais que 30 mg de nicotina. Uma amostra de 25 cigarros fornecem mdia de 31,5mg e desvio padro de 3mg. Ao nvel de 5%, os dados refutam ou no a afirmao do fabricante? SOLUO: 1. Ho: P
11

= 25,

X = 31,5mg e S = 3mg, a = 0,05

= 30

H,: p > 30
2. a

= 0,05

3. X - t-Student com 24 graus de liberdade


4. Da tabela da distribuio t-Student, obtemos que Logo, RC
t(24:0.05)

1,71.

{te E~H/ le > 1,71}

31,5 - 30 5. le = 6. Como

31m
(I e

= 2,5
deciso ser de rejeitar H o .

= 2,5) E RC , a nossa

92

7. Ao nvel de significncia de 5%, h evidncia de que os cigarros contenham mais que 30rng de nicotina. ",

5. TESTES PARA A PROPORO DA POI)LJLAO

Vamos usar os passos descritos na seo 3 para mostrar a construo do teste para propores. 1. Hipteses: Temos uma populao, e temos uma hiptese sobre a proporo p de indivduos portadores de uma certa caracterstica. Essa hiptese afirma que essa proporo igual a um certo nmero pu. Ento,

,Ho:p=

Po
deve fornecer informaes sobre a forma da alternativa. Que ter uma

o problema
H,:p -:t- Po H,:p<po H,:p>po
2. Fixar a.

das trs formas abaixo: (a) (b) (c)

3. Estatstica do Teste:

fi -

N p,

( p(l- P)
11

4. A Regio Crtica ir depender da hiptese alternativa. Ento,

a)

Ho:p=po H1:p-:t-po

./~,

.,.~~ c.......... ,

.
'

)..

~r~~." ~ .. jtr_

-Z,J/2

Z,l

b)

Ho:p= Po
H1:p<po

4r"
.
-Z"

~.

93

.J

c)

Ho:p=po H]:p>po

.;.;..:, .

_.//~

..
' t'.'T.~'1n._

Za.

p- po 5. Calcular a Estatstica Z c =
Po(l-po)/
/11

6. Deciso: Rejeita-se ou no lJ o? Dcpende da Regio Critica do passo 4. Se Zc El~C ,rejcita-se /lo' Casoconlrrio, aceita-se !Iu' 7. Concluso

EXEMPLO

5.1: Uma estao de televiso afirma que 60% dos televisores estavam ligados no seu programa especial da ltima segunda-feira. Uma rede competidora deseja contestar essa afirmao, e decide, para isso, usar uma amostra aleatria de 200 famlias, das quais 104 responderam afirmativamente. Qual deve ser o procedimcnto adotado para julgar a afirmao da estao?
11

SOLUO:

= 20

1. Ho: P = 0,60 Ht:p<0,60 2. a 3.

= 0,05

fi -

N(P,

p(l-

200

P))

4. Da tabela da distribuio Normal, obtemos que Z = -1,65. Logo,RC= 104 5. p= 200


A A

{Zc E~H/ Zc <-1,65}

= 0,52
=0,=5=2=-=0=,=)()=_ 2 3 I = / ' 0,60 1\: 0,40; /200
E RC

Zc

p- Po Po(1- Po)/

In

6. Como

(Zc

= -2,31)

, a nossa deciso ser rejeitar Nu'

94

7. Ao nvel de 5% de significncia, podemos dizcr quc h evidncias de que a audincia do programa de segunda-feira no f~i de 60% e sim inferior a esse nmcro.

6.REFERNC[AS

BIBLIOGRFICAS

1. Morettin, P. A. & Bussab, W. 0.(1984). A4todos Quantitativos Administradores - Estatstica lJsica. Atual Editora LLda. 2. Costa Neto, P.L.O. (1977). l~statstic([. Edgard l3lchcr LLda.

para Ecollomistas

e "'

3. Mood, A. M., Graybill, F. A. & Bocs, D.e. (1974). lntroduction Statistics. 3a. ed. San Francisco. McGraw-Hill13ook Co.

to thc ThcolY of

1)5

____

.J

............................

'

'1 I

UNIDADE Vll- REGRESSO E CORRELAO

11. INTRODUO.
Correlao e Regresso so duas tcnicas estreitamente relacionadas que envolvem uma forma de estimao. A diferena entre essas duas tcnicas e o tipo de estimao estudados anteriormente que as tcnicas anteriores foram utilizadas para estimar um nico parmetro, enquanto as tcnicas apresentadas agora se referem estimao de uma relao

que possa existir na populao. A anlise de correlao d um nmero que resume o grau de relacionamcnto entrc duas variveis~ a anlise de regresso tem como resultado uma equao matemtica que descreve o relacionamento entre elas. Esta equao utilizada para estimar ou predizer valores futuros de uma varivel quando se conhece os valores da outra varivel. A anlise de correlao til em trabalhos exploratrios, ou quando um pesquisador procura determinar quais variveis so potencialmente importantes, sendo que o interesse est no grau ou fora do relacionamento. Esta tcnica utilizada quando no h dependncia funcional entre as variveis, embora possam ser correlacionadas.

12.CORRELACO.......

.....

o objetivo do estudo da correlao a determinao do grau de relacionamento entre duas variveis emparelhadas. O termo "correlao" significa "co-relacionamento", pois indica at que ponto os valores de uma varivel esto relacionados com os da outra. Se os pontos observados das variveis, digamos (X,Y) representados num diagrama de disperso parecem cair prximos a uma reta, dizemos que temos uma correlao linear. Dizemos que a correlao positiva se a tendncia crescente, ou seja, valores pequenos de X fornecem valores pequenos de Y e vice-versa (ver Figura 2.1.a) . A correlao negativa se a tendncia decrescente (Figura 2.1.b) e nula se no observa - se
tendncia alguma (Figura 2.I.c). Figura 2.1: Possveis formas de correlao linear. (a) .YI y
X X
I

(b) Y

(c)

xxx xxx xx x x x x x x x
X

xx x x x x x x x x x x x xx x X
I

x x x x x x x x x x x x

1)(,

,
Uma medida do grau e do sinal da correlao correlao linear de Pearson", definido por: 'cov( X, Y) ..e estimado por ,. =: Sx Sr
=:
O'XO'1'

linear dado pelo "cocliciente

de

Sxr

onde eov(X, Y) a covarincia entre as variveis X e Y. Cf x , Cf y so os desvios-padres de X e Y, respectivamente. " L(X;


S.A1'

- X)(1~ - Y)
1/

a covarincia amostraI de X e Y, dada por

S,\1'

= ,~

-1 dados por

Sx ,Sy
n

so _X)2

os desvios-padres

das variveis

X e Y na amostra,

~)X;
Sx =
!=.!

" L(r: - y)2


e S1'
=:

d
11-1

, respectivamente.

11-1

PROPRIEDADES

DO COEFICIENTE

DE CORRELAO

"LINEAR.

1. Este coeficiente adimensionaI, logo no afetado pelas unidades adotadas. Alm disso, apresenta duas propriedades que caracterizam a natureza da relao linear entre as duas variveis. Uma o sinal (+ ou -) e a outra a magnitude. 2. O sinal o mesmo que o do coeficiente angular de uma reta imaginria que se "ajusta" aos dados se fossem traados num diagrama de disperso. 3. A magnitude indica o quo prximo da reta imaginria esto os pontos individuais. 4. O valor de ,. E [-1,1]. Se r = -1, dizemos que h uma correlao linear negativa perfeita e se,. = 1, uma correlao linear positiva perfeita. importante assinalar que U1,n coeficiente de correlao linear igual a zero, no implica em ausncia de relao entre as duas variveis, e sim que h uma ausncia de relao linear entre as duas variveis.

TESTE DE SIGNIFICNCJAPARA

O COEFICIENTE

DE CORJ{ELAO.

Como o valor de r calculado com base nos 11 elementos de uma amostra e que portanto, representa uma estimativa, ou melhor, uma boa estimativa do verdadeiro coeficiente de correlao populacional, necessrio fazermos uma inferncia estatstica a respeito de p. Isto , queremos saber se um dado valor de r, combindo com o respectivo tamanho da amostra
11,

permite concluir,

um

dado nvel de significnciaa , 'que realmente

existe correlao linear entre as variveis.

97

-,

Para tanto, pressupomos que as variveis X e Y apresentam uma distribuio Normal Bivariada e seguiremos os seguintes passos. 1. Formular as hipteses: I-Io:P (no h correlao entre as variveis) H1:p 1:- O (h correlao entre as variveis)

=O

2. Fixar o nvel de significncia 3. Estudar a distribuio de probabilidade::::> t-Student com (n-2) graus de liberdade. 4. Regio Crtica (Regio Grifada)

/
r,,1
~

",-...,..."

/
I

"h..
t;, ..!~!1"') f

-t2

tu12

5. Calcular a estatstica do teste: I c

=r

--2

'-2

l-r

6. Deciso: Rejeita-se ou no fIo? Depende da Regio Crtica do passo 4. Se 'cERC, 7. Concluso rejeita-se Ho' Caso contrrio, aceita-se Ho'

EXEMPLO 2.1: A tabela abaixo d o preo mdio das aes e ttulos divulgados pela bolsa de Nova York nos anos 1950 1959. Calcule o coeficiente de correlao de Pearson, interprete o resultado e verifique sua significncia ao nvel de

5%.
Preo Mdio dos Ttulos 102.43 100.43 97.43 97.81 98.32 100.07 97.08 91.59 94.85 94.65 974.66

Ano 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 Total

Preo Mdio da Aes 35.22 39.87 41.85 43.23 40.06 53.29 54.14 49.12 40.71 55.15 452.64

98

SOLUO: Temos que

x =45,26;

Y=97,47;
- v)

L(X _X)2 =449,39; Lu; -ri


j

=90,51 e

L(X

X)(r;

= -91,98:
=-04561

(.,
.J Xl' -

Logo, r = S;:Sl' - J(449,39/9)

. -91,98/9 ~=~=i-~~5'
:

* ~(90,51/9)

'

Conclumos que existe uma ccrta correlao negativa entrc os prcos mdios de aes e de ttulos, isto , uma tendncia de baixa nos preos de aes quando se verifica alta nos preos de ttulos, e vice-versa, muito cmbora tal relacionamcnto no seja accntuado. Para anteriormente. 1. Formular as hipteses: Ho:p =0 (no h correlao cntrc as variveis) H(:p -:F O (h correlao entre as variveis) 2. a = 0,05 3. Distribuio t-Student com 8 graus de liberdade. 4. Da tabela da distribuio t-Student, obtemos que t(8;O.025)2,31. = Logo, RC = {te E~H/ te < -2,31 ou te > 2,31} 5. Calcular a estatstica do teste: te = r testar a significncia da correlao, seguiremos os sete passos citados

fg
1- r
2

l-2 -0,4561 ~9 =

1- (-0,4561)

= -1,4496

6. Como

(te = -1,4496)

II RC,

a nossa deciso ser no rejeitar H o .

7. Ao nvel de signifiencia de 5%, no podemos afirmar que exista uma correlao entre o preo mdio de aes e o preo mdio de ttulos nos anos de 1950 1959.

13~REGRESSO<

Quando analisamos dados que sugerem a existncia de uma relao funcional entre duas variveis, surge ento o problema de se determinar uma funo que exprima esse relacionamento, ou seja temos um problema de regresso conforme denominao introduzida por Fisher. Portanto, ao imaginar uma relao funcional entre duas variveis, digamos X e Y, estamos interessados numa funo que explique grande parte da variao de Y por X, ou

99
l

vice-versa. Uma parcela, entretanto, permanece em geral scm ser explicada, e ser atribuda ao acaso (erro experimental). Admita que a varivel X seja suposta sem erro, ou seja, no alcatria, enquanto a varivel Y apresenta uma variao residual, a qual responsvel pela disperso dos pontos experimentais em tonia da equao de regresso. Essa situao corresponde a experimentos em que os valores de X so pr-fixados pelo expcrimcntador, e por isso scrchamada dc varivel independente, enquanto os valorcs de Y sero dctcrminados experimentalmcnte, c Y dita varivel depcndentc. Se admitirmos que Y funo linear de X, podcmos cstabelcccr uma rcgresso lincar simples, cujo modelo cstatstico :

Y; =a+f3X

+~,

i= 1,2,... ,11

onde a e f3 so parmctros desconhccidos. ~ o erro de observao, sendo ~ - N (O, (J Z )

nosso

objetivo

ser estimar

a c fJ,

da reta

terica,

atravs

dos

pontos

cxperimentais fornccidos pela amostra, obtcndo um rcta estimada da forma: J~ onde a, b e Y; so as estimativas de a,f3

= a + b.. '(
e dc E(Y;) , rcspcctivamente.

ESTIMAO DOS PARMETROS. Para cada para de valores obscrvados (Xi' J~) , podemos estabelecer o desvio e = Y - Y = Y - (a + bX )
, I I I I

mtodo dos mnimos quadrados consistc cm adotar como parmetros os valores que minimizam a soma dos quadrados dos dcsvios

estimativas

dos

Z=Le
i=1

" Z
j

=L(J;-(a+hXiz
i~1

A funo Z ter mnimo quando suas derivadas parciais cm relao a "a" e "b" forcm nulas. (Note que Z no tem mximo)

8Z az

" = -2LJ(Y;

-(a+bXi

=O
=O

(1) (2)

c7Z = 2LJ (1~ -(a +bX,( -X,) m "

o que

resulta, no sistema chamado de "Equacs

Nor"mais", dado por:

100

..;"I

lIa+bLX; { aLX;

= LY;
=

+bLX;2 a = Y -bX

LX;Y;

Ento,

h-------

L(Xj - X)}~ S.\T - L (X; - X)2 - S.\T

Observaes: 1. De (1), observamos que reta zero 2. De (2), temos que

L e; = O (3),

isto , a soma dos desvios verticais em relao e;


=}~ -

L X; e; = O (4), j que

(a +bXJ. =0 (5).

3. De (3) e (4) temos que Ly;e; =L(a+bX;)e;

= aLe; +bLX;e;

4. H modelos que podem ser linearizados, tais como: Y = apx => Inf = Ina + Xlnp f

= aJ(P => Inf = Ina+

pln X

Mostramos, a seguir, alguns tpicos importantes: Como identidade 1~-

Y = o~- }~)(1~ - Y) +
Y; ) + (1~- Y
2

vcrdadc, cnto
2

L (1~Mas, onde

Y)

L (1~-

L o~- }~ + L(1~ )

Y) 2 + 2 L (1~ -

}~)(}~-

Y).

L o,,; L Cf, -

i;)(f; - Y) =

Le; O~- Y) = Le)~ - YLe; =0,

por (3) e (5),

Y)2 denominada dc Soma de Quadrados Total (SQT)

L (1~-

f;) 2 denominada de Soma de Quadrados Residual (SQ Res) denominada de Soma de Quadrados da Regresso (SQReg)

L (f; - y)2
Logo,

.
SQT = SQReg + SQRes, ou seJa) =

SQ RCK
S01'

SQRes + S01'

Quociente

definido

por

R2 = S~~;.K

denominado

de

"Coeflcientc

de

Determinao" que O~ R
2 ~

e indica a proporo da variao total quc explicada pela regrcsso. Note


1.

A estiil1ativa da varincia residual populacional

a/~ dada por

.2 SQRes L(1~ _}~)2 L}~2 -aL}~ -bLX)~ S /{ = ---"--- = ---= ---------'--

11-2

11-2

11-2

101
l

Os mesmos problemas de estimao e testes de hipteses sobre os parmetros podem ser considerados no modelo de regresso, com rdao aos parmetros a e f3, e para tanto inicia-se pelo estudo das distribuies amostrais.

Como b - f3 = ~

L(X;

- X)~
-

(Xi - X) combinao linear dos ~ .

L,(X ',- X_ J
2

~,

L(X, - X)

mostramos que b - f3 uma

Se os erros tm distribuio normal, seguc-se quc b tcm distribuio normal, isto , b - N(J.1b , a;) . Com um pouco de lgebra pode-se mostrar que ' ,

}'" = f3
2

a2

0""

L(X;

_ X)l.
\'2

Como, em geral, no conhecemos a , estimamos O"b por (Jb = Sb = "'" L.(X;

~2

dI!

- X)

De modo anlogo, temos que


I

a- N(a,(~
-2 X
j-

11

+L

x' X) -, (X
j -

Ja J .
2

Sendo o estimador

.~

~2.2

da vanancla dada por

(J"

= 5" = ( -11 + LJ( "'.

-;
) \

.2 .\/1

Baseado nas distribuies amostrais podem ser obtidos intervalos de confiana para os parmetros. Sendo to o valor crtico da distribuio t-Student com (11-2) graus de liberdade e ao nvel de confiana estabelecido, respectivamente. os intervalos de confiana para

e a so,

JC(P) = (b - toSb;b

+ t"Sb)

Je(a)

= (a -

toS'7;a

+ 'oS,,)

TESTE DE SJGNIFICNCIA

rARA A REGRESSO.

1. Formular as hipteses: 110: P = O (no h regresso) fi I: f3 :t:- O (h regresso) 2. Fixar o nvel de significncia 3. Estudar a distribuio de probabilidade

=>

t-Studcnt com (11-2) graus de liberdade.

102

4. Regio Crtica (Regio Grifada)

/"",
.J,. ....:d / "'''ii~l rP~!";"~"

~"r . :~ t,u2

__

-t,,12

5. Calcular a estatstica do teste: I c

= ---

h -/~, SI>

6. Deciso: Rejeita-se ou no H o ? Depende da Regio Crtica do passo 4. Se 7. Concluso Observao: possvel testar o parmetro a, cmbora seja um caso dc mcnor intcrcsse prtico, 3.1: A tabela abaixo'apresenta os pesos respectivos X e Y de uma amostra de 12 pais e de seus filhos mais velhos. Determine a reta de regresso c faa um teste de hiptese ao nvel de 5% de significncia para a regresso. Peso dos pais (X) Peso dos filhos (Y)
(c E

RC , rejeita-se fio' Caso contrrio, aceita-se H o .

EXEMPLO

65 63 67 64 68 62 70 66 68 67 .. 9 6 71 LX=800 SOLUO: Temos que

68 66 68 65 69 66 68
65

..-

71 67 68 70 LY=811

x = 66,67~Y = 67,58~ L (X;

- X)2

= 84,67~ L O~- Y)2 = 38,92

L (X;

- X)(Y; - Y) = 40,33

103

b= Logo,

L (X; - X)Y; S \T 40,33 _ =_.-=--=047632 (X; - X)2 ')',\J: 84,67

. '

a = Y - bX = 67,58 - 0,47632 * 66,67 = 35,8238


Ento

Y; = a + bX

= 35,8238 + 0,47632X;

Para testar a significncia da regresso, seguiremos os passos citados anteriormente. 1. I-1o: P = O (no h regresso) H 1: P ;I:. O (h regresso)

2. a = 0,05
3. A distribuio <deprobabilidade uma t-Sludenl com 10 graus de liberdade. 4. Da tabela da distribuio t-Student, obtemos que Logo, RC = {'e E~H/ 'e < -2,23 ou 'e> 2,23} ,2 _LY;2 5.SR'l
b t(Jl);O.025)

= 2,23.

-aLY;
11-2

-bLXi}~

_54849-35,8238*811-0,47632*54107
-

=23652
'

10

= S2 =
b

S2
R

23652
,

2:(X;

_ X)2

84,67

= O027934 . '

. . Calcular a estatIstIca do teste:

'e = b -SbPu = 0,47632 - O = 2,8499 .J 0,027934

6. Como (te = 2,8499)

RC , a nossa deciso ser de rejeitar I-1o'

7. Ao nvel dc significncia dc 5%, podemos afirmar que exista uma relao funcional cntre o peso dos pais e dos seus filhos mais velhos.

14. REFERNCIAS

BIBLIOGRFICAS

1. Costa Neto, P.L.O. (1977). 4~'1atstica. Edgard Blcher Ltda. 2. Draper, N.R; Smith,H. (1981). Applied Regressiol1 Al1a/ysis. Wiley. 3. Hoflinann, R; Vieira, S. (1977) Anlise de Regressto. EDUSP.

)04

1 t9t'0 Lttt'O
68'0

189t'0 98Zt'0
L68'0 O<:'O 9l'0 018Z'0

8t'0 lZH'O
9LLZ'0

1ZLt"O lt'O 96'0 H'O


Z61'0

19Lt"0

t9t'O
tL6CO

t6'O
8l Z 'O LL 8 Z' O 9tZ'0 9n'0

108t"0 tOtt'O 10t'0 H9'0 t9Z'O


<:16Z'0

t8Z'0 tlz:'O 90n'0


ZL61'0

Ot8t"0 ttt'O <:ot'O 699'0 00'0 9t6Z'0 119(:'0


L6ZZ'0 OOZ'O 9Ll'0

088t'0 8tt'0 060t'0


LOL'O

0<:6t'O nt'O 6llt'0


tL'O lL('O

096t'0 Z9t'0 89lt'0


8L'0

OOO'O l091"0 LOlt'O

9'0
186Z'0

60t'0
O~O('O

~10'0
9L9(:'0 8Z'0

118('0 9tt'0 ~80'O tLZ:'O OLtz:'O 61lz:'0 lt81'0


L8l 'O

0'0 1'0 tO. '0 t'O. s'O9'0 L'O8'0 6'0 0'11'1 ,'1f'lt'l. S'l9'1 L'I 8'16'1 0',;I', -

HtZ'O 8tl<:"0
L981"0

8tZ'0
LLl<:'O

8HZ'O
99lZ'0 LL61'0 l1Ll'O

t9Z'O
LZ<:'O

60Ll'0 68Z'0

t681'0
91'0

6t61 'O
891'0

:0,'0
<:9Ll'0 Hl'O Z6Zl'0

190,'0
88L 1'O 6(l'O

1191'0
6L1'0 OL11'0 860'0 Z80'0

10tl'0 0611 'O 001'0 880'0 t690'0 OHO'O 9tO'0


LO'O

0991'0 Ltl'O
01ZI'0 OZOI'O 80"0 80LO'0 Z8O'0

060<:'0 t181'0
(:9l'0

9ttl'O
OZI'O

69tl'0
HZ1'0

<:6tl'0
lLll'O

tll'O
ZI11'O

801 'O 6980'0


ZZLO'O

%01'0
880'0 LO'O

HOl'O 1060'0
6tLO'0

601'0 8160'0
t9LO'0

l 'O 111'0
l60'0 6LO'0 90'0 LHO'O

t60'0
8LLO'0

1890'0 6HO'0 HtO'O


L90"0

t6O'O 8tO'0
Z6O'O

9090'0 6tO'0 10tO'0


lZO'O 9ZO'0

8190'0
O~O'O

090'0
91 O'O

t90'0 9HO'0
LltO'O

HI'O Hl1'0 8960'0 8080'0 8990'0 8HO'0 9ttO'0


60'0 L8Z0'0

HtO'O t8O'O
LOO'O

60tO'0
6Z0'0 Z9Z0'0 LO<:O'O Z910'0

t6Z0'0 <:0'0 810'0 tl0'0 01l0'0 t800'0 t900'0 8tOO"0 900'0


9Z00'0

000'0
8ZO'0

tI 0'0
OZO'O L610'0

8810'0 9tl0'0 110'0 L800'0 9900'0 6tOO'0


LOO'O LZOO'O

ttZO'O Z610'0
Ol0'0

<:0<:0'0
8l0'0 ZZ10"0

81tO'0 90'0 89Z0'0 Z1 <:0'0 9910'0


6Z10'0

9tO'0
,O'O

ttO'O
tLZO'O LI ZO'O OLI0'0

18<:0'0

zno'o
tLI0'0

8nO'0
6LI0'0

9110'0 6800' O 8900'0 HOO'O 800'0


8Z00'0 OZOOO' l00'0 ,

tl0'0 6110'0 1600'0 6900'0 ,OO'O .6(00'0


6Z00'0 lZ00'0 l00'0 ZOOO'O 9

t600'0
1 LOO'O

9<:10'0 9600'0
(LOO'O

HI0'0
Z010'0 8LOO'0 6OO'0
\;.i

6600'0
LOO'O

HOO'O OtOO'O OOO'O


Z ZOO'O

OO'O 1tOO'O 1 00'0 ZOO'O 9100'0 000'0

HOO'O tOO'O HOO'O ZOO'O


LI00'0 OOO'O

91 0'0 tOl0'0 0800'0 0900'0 HOO'O t00'0


ZOO'O

610'0
LOI0'0 Z800'0 Z900'0 L tOO'O OO'O

z',f', -

t', S', -

6100'0 tl00'0 0000'0 6

0Z:00'0 tl00'0 1000'0


8

ttOO'O :00'0 tlOO'O


LI00'0 LOOO'O l

.'

9', L',8', -

noo'o
6100'0 100'0 O

9100'0
ZOOO'O

1000'0
L

li

8100'0 0100'0 1

6', 0' Z

OyaCJ\:ld 'Nlt\T'tlONOYJlil8nIlSIO

- I V73HV.L

_e

TABELA

I -CONTINUAO

z
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8

0,5000 0,5398 0,5793 0,6179 0,6554 0,6915 0,7257 0,7580 0,7881 0,8159 0,8413 0,8643 0,8849 0,9032 0,9192 0,9332 0,9452 0,9554 0,9641 0,9713 0,9772 0,9821 0,9861 0,9893 0,9918 0,9938 0,9953 0,9965 0,9974 0,9981 0.9987

1 0,5040 0,5438 0,5832 0,6217 0,6591 0,6950 0,7291 0,7611 0,7910 0,8186., 0,8438 0,8665 0,8869 0,9049 0,9207 0,9345 0,9463 0,9564 0,9648 0,9719 0,9778 0,9826 0,9864 0,9896 0,9920 0,9940 0,9955 0,9966 0,9975 0,9982" 0,9990
,.

2 0,5080 0,5478 0,5871 0,6255 0,6628 0,6985 0,7324 0,7642 0,7939 0,8212 0,8461 0,8686 0,8888 0.9066 0.9222 0,9357 0,9474 0,9573 0,9656 0,9726 0,9783 0,9830 0,9868 0,9898 0,9922 0,9941 0.9956 0,9967 0,9976 0.9982 0.'9993

3 0,5120 0,5517 0,5910 0,6293 0,6664 0,7019 0,7357 0,7673 0,7967 0,8238 0,8485 0,8708 0,8907 0,9082 0.9236 0,9370 0,9484 0.9582 0,9664 0,9732 0,9788 0,9834 0,9871 0,9901 0,9925 0,9943 0,9957 0,9968 0,9977 0,9983 0.9995

0,5160 0,5557 0,5948 0,6331 0,6700 0,7054 0,7389 0,7703 0,7995 0,8264 0,8508 0,8729 0,8925 0,9099 0,9251 0,9382 0,9495 0,9591 0,9671 0,9738 0,9793 0,9838 0,9874 0,9904 0,9927 0,9945 0,9959 0,9969 0,9977 0,9984 0.9997

5 0,5199 0,5596 0,5987 0,6368 0,6736 0,7088 0,7422 0,7734 0,8023 0,8289 0,8531 0,8749 0,8944 0,9115 0,9265 0,9394 0,9505 0.9599 0,9678 0,9744 0,9798 0,9842 0,9878 0,9906 0,9929 0,9946 0,9960 0,9970 0,9978 0,9984 0.9998

6 0,5239 0,5636 0,6026 0,6406 0,6772 0,7123 0,7454 0,7764 0,8051 0,8315 0,8554 0,8770 0,8962 0,9131 0,9278 0,9406 0.9515 0,9608 0,9686 0,9750 0,9803 0,9846 0,9881 0,9909 0,9931 0.9948 0,9961 0,9971 0,9979 0,9985 0.999'8

7 0,5279 0,5675 0,6064 0,6443 0,6808 0,7157 0,7486 0,7794 0,8078 0,8340 0,8577 0,8790 0.8980 0,9147 0,9292 0,9418 0,9525 ,0,9616 0,9693 0,9756 0,9808 0,9850 0,9884 0,9911 0,9932 0,9949 0,9962 0,9972 0,9979 0,9985 0,9999

8 0,5319 0,5714 0,6103 0,6480 0,6844 0,7190 0,7517 0,7823 0,8106 0,8365 0,8599 0,8810 0,8997 0,9162 0,9306 0,9430 0,9535 0,9625 0,9700 0,9762 0,9812 0,9854 0,9887 0,9913 0,9934 0,9951 0,9963 0,9973 0,9980 0,9986 0.9999

9 0,5359 0,5753. 0,6141 0,6517 0,6879 0,7224 0,7549 0,7853 0,813} 0,8389 0.8621 0,8830 0,9015 0.9177 0.9319 0,9441 0,9545 0.9633 0.9706 0.9767 0.9817 0,9857 0,9890 0.9916 0.9936 0.9952 0.9964 0,9974 0,9981 0,9986 1.0000

2,9 3,0

...........................

'

'

TABELA

II - DISTRIBUIO '1" DE STUDENT


~

Graus de Liberdade
(v)
1

Probabilidade
0,100 0,050 ..
6,31 2,92 2,33 2,13 2, o 2 1. 9-1 1,90 1,86 1,83 1,8 1 1. 8 1. 7 1,77 1. 7 1. 7 O 8 6 5

da
0,025
12,71 4,30 3, 1 8 2.78 2,57 2,45 2,37 2,3 1 2,26 2,23 2.20 2, I 8 2.16 2.15 2.13 2, I 2.1 2. I 2. o 2. o 2 I

Cauda

Superior
0,010
3 1,82 6,97 4,54 3,75 3,37 3,14 3, o 2,90 2,82 2,76

(N v e I de
0,005
65,66 9,93 5,84 4,60 -I, o 3

Significncia)
0,0025
127,32 14, o 9 7,45 5,60 4,77 4,32 4, 03 3,83 3,69 3,5 g 3. 5 o 3. -I 3 3.37 3.32 3,29 3.25 3.22 3.20 3,1 7 3,15 3,14 3,12 3,10 3. o 9 3, 08 3.07 3. 06 3, 05 3, 04 3. o 3 2,97 2,92 2,86 2.81

0,001
318,31 22,33 10,:2 I 7,17 5,89 5,2 1 4,79 4.50 4.30 4,14 4. 03 3,93 3.85 3,79 3,73 3.69 3.65 3.6 I 3.60 3,55 3,53 3.5 1 3.49 3.48 3, -I 5 3, -I 4 3. -I 2 3,4.1 3, -I o 3,39 3,3 1 3,:2 3 3,16 3,

0,0005
636,62 J 1,6 12,9.2 8,61 5,89

2 3 4 5
6 7 . 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40

3, 08 1,89 1,6-1 I ,53 1,48 1,4-1 I, -I 2 1, -I o 1,38 I,]i 1,36 1,36 I ,3 5 1 ,3 5 1. 3-1 1. 3 -I 1.33 1.33 1,33 1,33 1. 3 2 1,32 1,32 1,32 1,32 1 ,3 1 ,3 1,31 1 ,3 1,3 2 I I 1
('\

3,71 3,50 3,36 3,25 3.17 3,1 1 3. O 6 3. 01 2.9 g 2.95 2.92 2.90 2.88 2.86 2,85 2.83 2. g 2 2.81 2, g o 2,79 2,78 2.77 .2,76 2.76 2.75 2,70 2,66 2,62 2.58

5,96 5,41 5, o 4 4.78 4,59 4.32 4.32 4,22 4.12 4. 07 4, 02 3,96 3.92 3.88 3,85 3,82 3.79 3.77 3,75 3,73 3,71 3,6 g 3,67 3,66 3,65 3,55 3,46 3,37 1,30

2, i' 2 2.68 2.65 2,62 2,60 2,58 2,57 2.55 2,H 2,53 2,52 2,5 1 2,50 2, -I 9 2,49 2,H 2. -I 7 2,.P 2,46 2, -I 6 2, -I 2 2,39 2,36 2,33

1,75 I.H 1,73 1. 7 3 1.73 1.72 1.72 1,71 1,71 1,71 1. 71 1. 7 O 1,70 1. 7 O 1. 7 o 1,68 1. 6 7 1,66 I. 6 3

9 9

2, 08 2. 07 2. o 7 2. o 6 2, o 6 2, o 6 2. o 5 2. o 5 2. 05 2. 0-1 2. o 2 2, 1.93

60
120
co

1.3') 1. 3 ') 1,30 1.28

oo

1,93

o9

TABELA III-

DISTRIBUIO

QUI-QUADRADO

(X )

,.:lo

Graus de Liberdade
(v)
1

Probabilidade 0,990 0,975


O, o o 0,50 0,22 0,48 0,83 1;24 1,69 2.18 2,70 3,2.5 3.82 4,41) 5. O I 5,63 6,2 6.91 7 . .5 8.23 8,9 I 9,.5 9 10.31) 11,00 I 1,7 O 12.40 I J, I o 13,81) 140 6 o 15.30 16. OI) 16,80 24,40 "0.50

da 0,900
O, 02 0,'21 0,58 1, o 6 1,61 2,20 2,83 3,49 4,17 4,87 5 . .58 6.30 7, 04 7,79 8,5.5 9,3 I 10, I O 10.90 I 1,7 o 12,40 13,20 14. O o 14,80 1.5,70 16,50 17.30 18, I O 1 8,9 o 19,80 2 0,6 o 29, I O 4 6.5 o

C a I da 0,750
0,10 0,58 1,2 1 1,92 2,67 3,45 4,25 .5, o 7 5,90 6,74 7,.5 8 8,44 9,30 I 1),2 O I I. o o 12,80 12,81) 13,70 14,60 15,.5 o 16,30 17,20 18,10 19, o o 19,90 2 1),8 o 2 I ,70 22,70 23,60 24.50 33,70 52.30

Superior 0;500
0,46 1,39 2,37 3,36 4,35 .5,3.5 6,3.5 7,34 8,34 9,34 10,30 1 1,3 12,30 13,30 14,30 16.30 16,30 17.30 18,30 19,30 2 0,3 o 2 1,3 o 22. J o 23, J o 24,30 25,30 26,30 27.30 29,30 29.30 39,31) 59.30

(N v e I de 0,250
1, J 2 2.77 4,11 5,39 6,63 7,84 9, o 4 10,20 1 1,4 o 1 2.5 13.70 14.80 16, o o 17, 10 18,20 2 0,.5 2 0,5 2 1,6 22.70 23.80

':;ignificncia) 0,100 ,
2.71 4.61 6.25 7,78 9,24 10,60 1:::, o o 13.41) 14,70 16, OO 17.30 18 . .5I) 19.80 2 I. I O 22,30 2 ~. 8 O'
24.80

0,950

0,050
3,84 5,99 7,81 9,49 1 1.1 I) 12,60 14,10 1 .5 .5o 16.90 18.30 19,70 :::I . o I) :::2." I) :::3.7 o :::5, OI) :::7 .60 :::7,6 o :::8.9 o 3 O. I o 3 I ," o 32,70 33,90 35,20 36," 37,70

0,025
5, o 2 7.38 9,35 11,10 12,8 14,4 o 16, o o 17,.5 o 19,0 o 2 1),5 o 2 1,9 O :Z3.3 o 24,70 26, 10 Z7,.5 o 3 0.2 o 3 0,2 o 3 1,5 O 32,90 3 4,2 o J 5,5 J 6,8 38.10 39,40 4 0,6

0,010
6.63 9,21 1 1,3 o 1 J. 3 o 1.5, 1 o 16,80 18,50 2 0.1 21,70 23020

2
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60

0,00 0,20 0,12 0,30 0,.5 .5 0,87 1,24 1,6.5 2,0 9 2,.5 6 3, 0.5 3,.5 7 4, 1 I 4,66 5,2 J 5,81 6,41 7, O I 7,63 8,26
8,90

0.01 O, I o 0,35 0,71 1, 1 .5 1,64 2,17 2,73 3,33 3,9" 4.57 .5.23 5.89 6.57 7,26 7.96 8.67 9.39 10. I o 10.90 1 1,6 O 12. J o 1 J. I o 13,80 14.60 1.5 .40 16,20 16.90 17.70 18,50 26.50 43.20

I)

24,70 26.21) 27. i I) 29,10 3 0.6 o 33.40 3 J. 4 I) 34.80 36,::: o 37,61) 38.90 40,30 4 1,6
4
J.

o o o

26, Oo 27,20 28,40 29.60 3 1),8 o 3:::. o o 33.21) J.1, 4 o 3:',61) 36,70 37,90 39, I O 40.30 51,80 7 ~. 40

9,54 10,20 10,90 11,50 12,20


12,90

24,90 26, o o 27, I o 28,20 29,30 3 0,4 o 3 I ,5 O 32.60 33,70 34,80 4.5.60 67. O o

o o o

I)

oo
J

44.

13.60 14.30 15, o IJ 37 . .5o


22.20

38,90 4 1), I o 4 I ,3 o 42.60 43.80 .5.5,8 o 79. 10

41,90 43,20 4".50 4.5.70 41, O O .59.3 83.30

45.61) 47, I) I) 4 8.3 o 49.61) 5 0,9 Q 6 J. 7 I) 8 g. 40

..............................................
-

TABELA IV VI

DISTRIBUlO

= V2 =

Graus de Liberdade do Numerador Graus de Liberdade do Denominador

Nvel de Significncia
~
1

de 10%
3 .'
53,59 9,16 S, 3 9 4,19 3,62 3,29 3,0 7 2,9:: 2,81 2,73 2,66 2,61 2.56 2,52 2.49 2,46 2,44 2,42 2,40 2,38 2,36 2,35 2,34 2,33 2,32 2.31 2,30 2,29 2,28 2,28 2.23 2,18 2,13 2, 08

1
39,86 8,53 5,54 4,54 4,06 3,78 3.59 3,46 3,36 3,29 3,23 3,18 3,14 3,10 3,0 7 3, o 5 3,0 3 3,01 2.99 2,97 2,96 2.95 :2,94 2,93 2,92 2,91 2.90 2,89 2,89 2.88 2.84 2.79 2.75 2,71

2
49,50 9,00 5,46 4,32 3,78 3,46 3,26 3,11 3, 01 2.92 2,86 2.81 2,76 2,73 2,70 2.67 2.64 2,62 2.61

4
55,83 9,24 5,34 4,11 3,5:: 3,18 2,96 2,81 2.69 2.61 2,54 2,48 2,43 2.39 2,36 2,33 2.31 2,29 2.2 i 2.25 2,23 2,22 2,21 2,19 2.18 2.1"7
2.1 i

5
57,24 9,29 5,31 4,05 3,45 3,1 1 2,88 2,73 2,61 2.52 2,45 2,39 2.35 2.31 2,27 2,24 2.22 2.20 2,18 2.16 2,14 2,13 2,11 2.10 2,09 2. o 8 2,0 7 2,06 2. o 6 2. o 5 2,00 1,95 1,90 1,85

6
58,20 9,33 5,28 4,01 3,40 3, 05 2,83 2,67 2.55 2,46 2.39 2,33 2,28 2.24 2,21 2. I 8 2,15 2,1) 2,1 1 2,09 2,0 8 2,06 2, 05 2,04 2. o 2 2.01 2,00 2,00 1,99 1,98 \ ,93 I. 8 7 1,82 1,77

7
58,91 9,35 5,27 3,98 3,37 3,0 1 2,78 2.62

8
59,44 9,37 5,25 9,95 3.34 2.98 2,75 2.59 2.47 2.38 2.30 2.24 2,20 2.15 2.12 2.09 2.06 2,04 2.02 2.00 l. 98 1,97 1, 95 1,94 1, 9 3 1,92 1,91 I. 90 I. 8 9 1,88 I, 8 3 I. 7 7 I. 72 1,67

9
59,86 9,38 5,24 3,94 3,32 2,96 2.72 2,56 2.44 2,35 2,27 2,21 2.16 2,12 2, o 9 2,06 2,0 3 2,0 o 1.98 1,96 1,95 1,9) 1,9:: 1,91 1,89 1,83 1,81 1,87 1,86 1,85 \,79 1,74 1,68 1,63

10
60,19 9,39 5,23 3,92 3.3 o 2,94 2.70 2,54 2.42 2,32 2.25 2.19 2,14 2,10 2, o 6 2.0 ) 2,0 o l. 98 1, 9 6 I. 94 1,92 l. 9 o 1, 8 9 1,88 1, 8 7 1,86 1,85 1,84 I. 8 3 1,82 I, 7 6 1,71 1,65 1,60

12
6 0,71 9,41 5,22 3,90 3,27 2,90 2,67 2,50 2,38 2,28 2,21 2,15 2,10

15
6l,22 9,42 5,20 3,87 3,24 2,87 2,63 2,46 2,34 2.24 2.17 ::.10

20
61,74 9,44 5,18 3,84 3,21 2,84 2,59 2,42 2,30 2,20 2,12 2,06 2.01 I. 96 I. 9 2 1,89 1,86 1,84 1,81 1,79 1,78 1,76 1,74 1,73 1,72 1,71 1.70 1,69 1,68 1,61 \,6\ 1,54 1,48 1,42

24
62.0 o 9.45 5.18 3,83 3,19 2,82

30
62,26 9,46 5,17 3,82 3,17 2,80

40

60

120

00

2 3 4
6

6
7 8

2,58
2,40 2.28 2.18 2.10 2.04 1,98 I. 9 4 I. 9 o I. 8 7 I. 8 4 I. 81 1,79 1,77 1,75 I. 73 1,72 1,70 I. 6 9 1,68 1,67 1,66 1,65 1,64 1,57 1, 5 I 1.45 1,38

2,56
2,38 2.25 2,16 2.08 2,0 1 1,96 1,91 1,87 1, 8 4 1,81 1,78 1,76 1,74 1, 7 2 1,70 1,69 1,67 1,66 1.65 1,64 1,6 ) 1,62 1.61

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 25 27 28 29 30 40 60 120
00

2.51
2.4 I 2.34 2.20 2.23 2.19 2.16 2.1) 2.10 2.08 2,06 2,0 4 2,02 2,01 1,99 1,98 1,97 I. 9 6 1,95 I. 9 4 1,93 I. 93 I. 8 7 I. 8 2 1.77 1,72

2.05
2.01 I. 97 I. 9 4 I. 91 1, 8 9 1.86 I. 8 4 l. 8 3 1,81 1,80 1,78 1, 7 7 1,76 1,75 1,74 I. 7 3 1,72 \,66 1,6 o l. 55 1,49

:: ,o

2,59 2,57 2,56


2,55 2.54

2,53 2,52
2,51

2.50

2.50
2.49 2.44 2,39 2,) 5 2,30

2, I 6 2,15 2. I 4 2,0 9 2.04 1,99 I. 9 4

5 2, 02 1,99 1,96 1,93 1,91 1,89 1,87 1,86 1,84 1,83 1,82 1,81 1,80 1,79 1,78 1,77 1,7\ 1,66 1,60 1,55

\,54
1,48 1,41 1,34

63,33 63,06 62.79 62.53 4,49 9,47 9,48 9,47 5,13 5,14 5,15 5,16 3,76 3,78 3,79 3,80 3,10 3,12 3,14 3,16 2,72 2,74 2,76 2,78 2,47 2,49 2,51 2.54 2,29 2,32 2,36 2.34 2,16 2.18 2.21 2.23 2, 08 2.06 2. I I 2.13 1,97 2.00 2. o 3 2.05 1,93 1.90 1,96 I. 99 1,85 I. 8 8 1,90 I. 9 3 1,80 I. 8 3 1.86 I. 8 9 I. 7 9 I. 76 I. 8 2 1,85 1, 7 2 1,75 I. 7 8 1.8 I 1, 7 2 1,69 I. 7 5 I. 7 8 1,69 1.66 1.72 I. 75 1,67 1,63 1,70 I. 7 3 1,64 1.61 1,68 1,71 1,59 1,66 1,62 1,69 1,57 1,60 1,64 1,67 1, 55 I. 59 I. 6 2 1,66 1,53 1,57 1,61 1,64 1,52 1,56 1,59 1,63 1,50 1,54 1,53 1,61 1,49 1,53 1,5 i 1.6 o 1,43 I. 5 2 1,56 1,59 1,47 1, 5 I 1,55 1,58 1,46 1,50 I. 5 4 I. 57 I, 4 2 I, 4 7 I. J 8 I, 5 \ I. 2 9 1.44 1,40 1,35 1, 2 6 1,19 1,37 1,32 1,00 1,17 1.3 o 1.24

TABELA IV - DISTRIBUIO
Vi

F - Continuao

- Graus de Liberdade do Numerador v2= Graus de Liberdade do Denominador


F

Nvel de Significncia
1
V2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

de 5%
3 4 5 6
7 8
9

10

12

15

20

24

30

40

60

120

23
24

25
26 27 28 29 30 40 60 120
<Xl

254,30 253,30 252,20 251,10 250,10 249,10 248.00 245,90 2 olI. 90 H3.90 240.50 238,90 2H,00 236.80 224,60 230,20 199,50 215.70 161,40 19,50 19.49 18.ol8 19,47 19,45 19.46 19.45 19,43 19,40 19.41 19,38 19.35 19,37 19,33 19,25 19,30 19,16 19,00 18,51 8.53 8.55 8.57 8.59 8,6ol 8,62 8,66 8,7ol 8,70 8.81 8.79 8.8ol 8.74 8,85 9,12 9,28 9.0 I 9,55 10,13 5.63 5,66 5,69 5.72 5,75 5,77 5.80 5,86 5.91 6,04 6,00 5.96 6.09 6,39 6,26 6.16 6,59 6.94 7,71 4,40 4.36 4,43 4,46 4,50 4,53 4,56 4,62 4.7ol 4,68 4.77 4,81 4.88 4,95 5,41 5,19 5,05 5,79 6,61 3.67 3,70 3.74 3.77 3,81 3,87 3,84 3,94 4,00 4,10 4,06 4,15 4.21 4,39 4,28 5.1ol 4,53 4.76 5,99 3,23 3,2i 3.30 3,38 3.H 3.4ol 3.41 3,51 3,6ol 3,68 3.57 3.79 3,73 3,97 3.87 4,12 4,74 4,35 5,59 2.93 2.97 3.0ol 3,0 I 3,08 3.12 3.15 3.22 3,39 3.28 3,44 3.35 3.50 4,07 3,69 3.58 4.46 3.84 5,32 2.71 2.75 2.79 2.83 2,86 2,9ol 2.90 3,lol 3,0 I 3.07 3.18 3,23 3,29 3.37 3.63 3.48 4.26 3.86 5,12 2.H 2.58 2.62 2.66 2,70 2,77 2.H 2,85 2.91 2,93 3.1ol 3.02 3.07 3,33 3.22 3,48 4.10 3.71 4.96 2.40 2.45 2,49 2.53 2.57 2,61 2.65 2,72 2.79 2.90 2,85 30,1 2,95 3,20 3,09 3,59 3,36 3,98 4,8-1 2.30 2.H 2.38 2,43 2.47 2,51 2.5ol 2,62 2.69 2,85 2.80 2.75 2.91 3,49 3.1 I 3.00 3.26 3,89 4.75 2.21 2.25 2.3ol 2.30 2,38 2,46 2.42 2,53 2.67 2,60 2.71 2.83 2.77 3,03 2,92 3,41 3,18 3.81 4.67 2.13 2,22 2.18 2.27 2.31 2.35 2.39 2,46 2.65 2,60 2.53 2,70 2.76 3,11 2,85 3,34 2.96 3.74 4,60 2,07 2.11 2.16 2.20 2.25 2.29 2.33 2.5 ol 2.40 2,6ol 2,48 2.59 2,79 2.71 3,06 2,90 3,29 4.5 ol 3.68 2.0 I 2.06 2.11 2,15 2,19 2.2ol 2.28 2.42 2.35 2,H 2.49 2.7ol 2.59 2.66 3,24 3,0 I 2.85 3,63 4,49 1.96 2.0 \ 2,06 2.10 2.15 2.19 2.23 2.31 2.38 2.49 2.45 2.61 2,55 2,81 2.70 3,20 2.96 3,59 4,45 1,97 1.92 2.02 2.06 2.11 2,15 2.19 2,27 2,3ol 2.46 2.41 2.58 2.51 2.93 2.77 2,66 3,55 3.16 4,41 1.88 1,93 1.98 2,03 2,07 2,11 2.16 2,31 2.23 2,38 2.42 2,74 2,48 2.54 3,13 2,90 2.63 3.52 4.38 1.84 1,90 1.95 1,99 2,04 2,12 2.08 2,20 2,35 2.28 2,39 2.5 I 2,45 2,87 3,10 2.71 2.60 3,49 4.35 1,87 1.81 1,92 1,96 2,01 2,05 2.10 2,18 2.25 2.37 2,32 2,57 2.49 2,42 2,68 2.84 3,47 3.07 4,32 1,8ol 1.78 1,9ol 1,89 1.98 2.07 2.03 2,34 2,23 2.15 2.46 2.30 2,82 2,66 2.40 3,4ol 3,05 2.55 4,30 1,76 1,8\ 1,86 1,91 1,96 2.0 I 2,05 2,20 2,13 2,27 2.4ol 2.32 2.6ol 2.37 3,03 2.80 2.53 3.42 4.28 1.73 1.8ol 1.79 1,9ol 1.89 2.03 1.98 2.11 2.18 2.30 2.25 2,62 2,51 2.42 2.36 2.78 3,40 3.01 4.26 1, 77 1.71 1,82 1,92 1.87 1,96 2.01 2,09 2,16 2.28 2,34 2.24 2.40 2.76 2.49 3,39 2.60 4.2ol 2.99 1,69 1.75 1,80 1,85 1,90 1,99 1,95 2,07 2.15 2.27 2.39 2,H 2.22 2.7 ol 2,59 2.47 2,98 3.37 4,23 1,67 1,73 1.79 1,84 1,88 1,97 1.93 2,06 2.25 2,20 2.13 2,46 2.37 2,31 2,57 2,96 3,35 2.73 4.21 1,65 1, 71 l. 77 I. 82 1,87 1,96 1,90 2,04 2.12 2.24 2,19 2.36 2,29 2,71 2,56 2.45 3.34 2.95 4.20 1,64 1, 70 1,75 1,81 1,85 1,94 1,94 2,03 2.\ O 2,13 2,43 2,2 S 2.22 2.35 2,55 2,93 2.70 3,33 4.18 1,62 1.68 1,74 1,79 1,84 1,89 1,93 2.09 2.0 I 2.21 2,16 2.33 2.27 2.42 2,69 2.53 2,92 3.32 4.17 1,51 1,6ol 1,58 1,69 1,74 1, 79 I. 80l 2.00 1,92 2.12 2.0 :; 2,ol5 2.25 2.1 S 2,84 2.H 2.61 3.23 4,08 1,47 1.39 1,53 I, 59 1,65 1,70 1,8ol 1,75 1,92 2.04 2,10 2.17 1.99 2,76 2.53 2.25 2.37 4,00 3.15 1,25 1,35 1,43 1,50 1,55 1,61 1.66 I. 83 1,75 1.96 1,91 2,02 2.ol5 2.09 2,68 2.29 2.17 3.07 3,92 1.00 I. 22 1.32 1,46 1.39 1.75' 1.57 1.52 1,67 1,94 1.88 I. 8 3 2,21 2.01 3,8ol 2.60 2.3 i 2.10 3.00

TABELA IV DISTRIBUIO F - Continuao


Vi

= V2 =

Graus de Liberdde do Numerador Graus de Liberdade do Denominador v


F

"

Nvel de Significncia
1
1 2 3 4 5 6 7 4052,00 98,50 34, \2 2\ ,20 16,26 13,75 12,25 1\ ,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8.53 8,40 8,29 8, \8 8,10 8,02 7,95 7,88 7,82 7,77 7,72 7,68 7,64 7,60 7,56 7,31 7,08 6,85 6,63

de 1%
,.

2
4999,00 99,00 30,82 \8,00 13,27 10,92 9.55 8,65 8,02 7,56 7,21 6,93 6,70 6,51 6,36 6,23 6.1\ 6,01 5,93 5.85 5,78 5,72 5.66 5,61 5,57 5.53

3
5402,00 99, \7 29,46 \6,69 12,06 9,78 8,45 7.;9 6,99 6,55 6,22 5.95 5.74 5.56 5,42 5,29 5,18 5,09 5.0 \ 4,94 4,87 4,82 4,76 4,72 4,68 4,64 4,60 4,57 4,54 4,5 I 4,31 4, \3 3,95 3,78

4
5625,00 99,25 28,7\ 15,98 11,39 9.15 7.85 7.0 \ 6,42 5,99 5.67 5.41 5.21 5.04 4.89 4.77 4.67 4.58 4.50 4.43 4,37 4,3\ 4.26 4.22 4.18 4.14 4,11 4.07 4.04 4,02 3.83 3,65 3.48 3.32

5
5764,00 99,30 28,24 \5,52 10,97 8,75 7,46 6,63 6.06 5,64 5,32 5,06 4,86 4,69 4,56 4,H 4.34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,82 3,78 3,75 3,73 3,70 3,5\ 3,34 3,17 3.02

6
5859,00 99,33 27,9\ \5,2\ 10,67 8.47 7,19 6.37 5.80 5.39 5.07 4,82 4.62 4.46 4.32 4.28 4.10 4.0 \ 3.94 3.87 3.8\ 3,76 3,71 3.67 3,63 3.59 3.56 3,53 3.50 3.47 3.29 3,12 2.96 2.80

7
5928.00 99.36 27067 14,98 10.46 8.26 6,99 6, \8 5.6 I 5.20 4.89 4.64 4.44 4.28 4.\4 4.03 3.93 3.84 3.77 3,70 3.64 3.59 3.54 3.50 3,46 3.42 3.39 3.36 3.33 3.30 3.\2 2.95 2.79 2.64

8
5982.00 99,37 27,49 \4,80 10,29 8,10 6.84 6,03 5,47 5.06 4,74 4,50 4,30 4,14 4,00 3,89 3,78 3,7\ 3,63 3,% 3,5\ 3,45 3,41 3,36 3,32 3.29 3,26 3,23 3.20 3,17 2,99 2.82 2.66 2.5\

9
6022,00 99,39 27,35 14,66 10.16 7,89 6.72 5.9\ 5.35 4,94 4,63 4,39 4,19 4.03 3,89 3.78 3,68 3,60 3.52 3,46 3.40 3,35 3.30 3,26 3.22 3, I 8 3,\5 3,\2 3,09 3,07 2.89 2.72 2.56 2.4\

10
6056,00 99,40 27,23 \4,55 10,05 7,87 6.62 5,8\ 5,26 4.85 4.54 4,30 4.10 3,94 3.80 3,69 3,59 3,5\ 3,43 3.37 3,31 3,26 3.2\ 3.\7 3, I 3 3,09 3,06 3,03 3,00 2,98 2,80 2,63 2,47 2.32

12
6106,00 99,42 27,0 5 14,37 9.98 7,72 6,47 5.67 5, I I 4,71 4,40 4, \6 3,96 3,80 3,67 3.55 3,46 3,37 3.30 3,23 3.17 3,12 3.07 3,03 2,99 2,96 2.93 2.90 2,87 2,84 2.66 2.50 2.34 2.18

15
6\57.00 99.43 26,87 14.20 9.72 7.56 6.3\ 5.52 4.96 4.56 4,25 4,0 I 3.82 3.66 3,52 3.4\ 3.31 3,23 3,15 3.09 3,03 2.98 2.93 2.89 2.85 . 2.8\ 2.78 2.75 2.73 2,70 2.52 2.35 2.19 2.04

20
6209,00 99,45 26,69 14,02 9,55 7,40 6.16 5,36 4.81 4,4 I 4,10 3,86 3.66 3.51 3.37 3.26 3,16 3.08 3,00 2.94 2.88 2,83 2.78 2,74 2.70 2.66 2.63 2.60 2.57 2,55 2.37 2.20 2.03 1,88

24
6235,00 99,46 26,60 13,93 9,47 7.3\ 6.07 5,28 4.73 4.33 4,02 3.78 3,59 3,43 3,29 3.18 3.08 3,00 2,92 2,86 2,80 2.75 2,70 2,66 2.62 2,58 2,55 2,52 2,49 2,47 2.29 2,12 1,95 1.79

30
626\,00 99,47 26,50 \3.84 9.38 7.23 5.99 5.20 4,65 4,25 3.94 3,70 3,5\ 3.25 3.2\ 3, \ o 3,00 2.92 2.84 2.78 2.72 2.67 2.62 2.58 2.5-1 2,50 2.47 2,44 2.4\ 2.39 2.20 2.03 1.86 1,70

40
6287.00 99,47 26,4\ 13,75 9,29 7,14 5,9\ 5, \2 4.57 4,17 3,86 3.62 3,43 3.27 3.13 3,02 2,92 2,84 2,76 2,69 2.67 2,58 2.54 2.49 2,.0 2,42 2,38 2,35 2,33 2,JO 2. \\ \,94 \,76 1,59

60
6313.00 99,48 26,32 13,65 9.20 7.06 5,82 5.03 4.48 4.08 3.78 3,54 3.34 3,18 3,05 2,93 2,83 2.75 2.67 2.6\ 2.55 2.50 2,45 2,40 2.36 2,83 2.29 2,26 2.23 2,2\ 2.02 \ ,84 1.66 1.47

120
6339,00 99,49 26,22 13,56 9,1\ 6.97 5.74 4.95 4.40 4,00 3,69 3,45 3,25 3,09 2.96 2.84 2,75 2,66 2,58 2.52 2.46 2.40 2.35 2.31 2.27 2,23 2.20 2,17 2.\4 2,11 \,92 I. 73 1,53 1.32 6366,00 99,50 26, \3 13,46 9,02 6,88 5.65 4.86 4,3 I 3,9 I 3,60 3,36 3,17 3.04 2,87 2,75 2,65 2,57 2,49 2.42 2,36 2,31 2,26 2.2\ 2, \ 7 2. I 3 2, I o 2,06 2,03 2,0 I I. 80 1.60 1,38 \ ,00

8 9
10 11 12 13 1'4 15 16 17

18
19 20 21 22 23 24 25 26 27 28 29 30 40 60 120
00

5.49
5.45 5,42 5,39 5.\8 4.98 4,79 4.6\

I1

II

CLCULO DAS PROBABILIDADES , E ESTATISTICA I


LISTAS DE EXERCCIOS

---~--PERODO: 98.1

PROFESSORES: CLAUDIA REGINA O. P. LIMA MANOEL R. DE SENA JR. JOZEMAR P. DOS SANTOS

'

UNIVERSIDADE FEDERAL DA PARABA CENTRO DE CINCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE ESTATSTICA LISTA DE EXERCCIOS DE ESTATSTICA DESCRITIVA UNIDADE I DISTRIBUIO DE FREQUNCIA

1) Defina os seguintes conceitos e interprete-os:


a) b) c) d) e) f) g) h) i) j) Rol; Amplitude Total; Frequncia Absoluta; Frequncia Relativa; Frequncia Absoluta Acumulada; Frequncia Relativa Acumulada; Nmero de Classes; Amplitude de Classes ou Intervalo de Classes; LimIte das Classes; Ponto Mdio das Classes;

2) Os seguinte nmeros referem-se ao nmero de itens defeituosos por lote de 40 itens. Disponha os dados numa distribuio de freql1ncia para valores isolados, o grfico de barras e a ogiva.
05 08 03 00 12 00 04 01 09 09 05
\O

OI 08 04 08

10 02 00 03

11 03 07 07

08 08 05 02

07 04 0(, 0(,

07 04 05 02

OJ

03 03 05

3) Numa amostra de 49 participantes, vrias tarefas foram atribudas, pessoa, anotando-se os tempos (em minutos) de realizao:
17.82 18.26 23.19 20.01 20.90 21.30 18.49 14.51 13.24 17.38 15.64 18.76 20.14 16.79 15.66 13.90 16.78 18.90 14.59 I.70 15.69 17.00 18.96 20.34 21.52 17.84 14.55 17.66 20.14 19.40 17.30 13.98 18.92 l.73 16.88 15.18 14.20 17.50 15.75 14.50 17.83 15.40 21.20 22.42 25.30 24.38 18.93 ).8 20.00

uma a cada

Construa uma distribuio de frequncia por intervalo e represente graficamente esta distribuio, atravs de histograma, polgono de freql1ncia e ogiva.
~
" 's.

4) Complete os dados que faltam na distribuio de frequncia: a)


Xi Fi 4 13 18 19 1.00

o
I 2 3 4 5
()

ri I
"

r,i 0.05 0.15


..'

4 3 2

0.25 0.15

7 Total

20

....

b)
Classes
0-2 2-4 4-6 10 10-12 Xi I

r'i
:Hl

FI O.()4 0.1 X 0.27

~ 5
7 27 15
lO \OU

x-

72

~n
13 91

o. 10
0.07

14 - 16 Total

--

MEDiDAS DE POSIO 5) Quais as medidas de posio? Defina-as. 6) O nmero de carros vendidos por cada um dos 10 vendedores de uma agncia, em um dado ms, em ordem crescente, : 2,4,7, 10, 10, lO, 12, 12, 14, 15. Calcule a mdia, a moda e a mediana c inlerprete-as. 7) Os dados seguintes referem-se pluviosidade anual, nos ltimos 50 anos, numa determinada regio.
15.2 23.4 25.1 30.1 28.0 14.6 17.8 42.0 30.1 25.3 27.9 26.9 35.2 22.1 31.8 24.9 10.8 15.6 24.4 31.0 20.0 19.9 25.5 28.7 28.3 41.5 1.X 21).7 15.0 13.5 10.7 31.4 27.8 2.1 32.1 30.0 19.8 14.6 28.2 25.4 35.7 29.6 22.1 11).4 26.7 40.9 28.2 24.1 28.7 36.8

a) Construa uma distribuio de frequncia com o nmero de classes necessrio; b) Calcule a mdia, llloda e mediana com dados isolados e, atravs da distribuio de frequncia. Compare os rcsultados. 8) Enumere pelo mcnos 4 propriedades da mdia. 'MEDIDAS DE DISPERSO 9) a) b) c) Defina e diga a sua utilidade: Varincia; Desvio Padro; Coeficiente de Variao.

10) Para os dados do exerccio 06, calcule a varincia, o desvio padro e o coeficiente de variao e interprete-os. 11) Com os valores <:\.0 exerccio 07, ealcule a varincia, o desvio padro e o coeficiente de variao, atra~s da distribuio de frequncia e para os dados isolados, interpretando os resultados

c comparando-os.

12) Enumere 02 propriedades da varincia. 13) O peso mdio dos alunos de 67.3 kg. com desvio padro de 10kg., enquanto que a altura mdia de 170 em. com desvio padro de 15 cm. Qual das medidas mais homognea ?

'

'

DEPARTAMENTO

DE ESTATSTICA - CCEN - UFPb

Respostas da Lista de Exerccios - Unidade I DISTRIBUIO DE FREQUNCIA 1) 2) 3) 4) -

MEDIDAS DE POSIO
5) 6) 7) a) b) 9,6; 10; 10. 27,272; multi-modal (14,6; 22,1; 28,2; 28,7;30,1; 36,8); 27,95; 27,4; 28,088; 27,559 . 8) -

MEDIDAS DE DISPERSO
9) 10) 17,378; 4,169; 43,42% 11) 49,373; 7,026; 25,76%; 48,145; 6,939; 25,32% 12) 13) Altura

UNIVERSIDADE FEDERAL DA PARABA CENTRO DE CINCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE ESTATSTICA LISTA DE EXERCCIOS DE PROBAI3ILIDADE UNIDADES 11E 111

EXPERIMENTO

ALEATRIO

1) Considerc

os

cxpcrimcntos

aleatrios

dados

seguir

idcntifiquc

espao

amostrai

correspondente

a cada um.

a) Em um estoque de 100 peas de uma linha de produo so contadas o nmero de, peas .defeituosas. b) Peas so fabricadas at que uma dzia de peas perfeitas sejam produzidas e o nmero total de peas produzidas contado. c) Peas que saem de uma linha de produo so marcadas defeituosas (D) ou no defeituosas (N). As peas so inspecionadas e sua condio registrada. Isto feito at que duas peas defeituosas consecutivas sejam fabricadas, ou que quatro peas tenham sido inspecionadas, aquilo que ocorrer em primeiro lugar. .

NOES DE PROBABILIDADE

2) Sendo P(A) = 2x, P(B}= probabilidade.

y - x e P(A u 13) = z

+ x, calcule utilizando as propriedades de

P(A); P(B); P(A (lB); P(A u JJ) 3) Uma loja dispe de 12 geladeiras do mesmo tipo, das quais 4 aprescntam defeitos. a) Se um fregus vai comprar uma geladcira, qual a probabilidade de levar uma geladeira defeituosa? b) Se uma fregus comprar duas geladeiras, qual a probabilidade de levar uma defeituosa e outra perfeita? 4) Sabendo-se que 20% das peas produzidas por um processo apresentam defeito do tipo I, 10% do tipo lI, e 25% pelo menos um dos dois defeitos, qual a probabilidade de que uma pea tenha: a) Os dois defeitos? b) Somente defeito do tipo II ? 5) Um dado viciado de modo que eada nmero par duas vezes mais provvel de aparecer que qualquer nmero impar.' Encontre a probabilidade de: a) Aparecimento de um nmero par. b) Aparecimento de um nmero menor que 3.

6) Dez fichas numeradas de I a 10 so misturadas em uma urna. Duas fichas numeradas (X, Y) so extradas uma a uma, sucessivamente e sem reposio. a) Qual a probabilidade de que X + Y = lO? b) Qual a probabilidade de que Y > 6X ?

PROBABILIDADE

CONDICIONADA

7) Trs turmas X, Y e Z tm, respectivamente, 60%, 30% e ] 0% do total de um curso. As percentagens de um aluno com mdia abaixo de 7 so, respectivamente, 2%, 3% e 4%. Um aluno escolhido aleatoriamente. a) Qual a probabilidade destc aluno tcr mdia abaixo de 7? b) Se um aluno teve mdia abaixo de 7, qual a probabilidade de ser d' turma Z ? 8) Uma indstria fabrica trs modelos de turbinas. Os percentuais de fabricao para os trs modelos so respectivamente 40%, 30% e 30%. Os percentuais de vendas para cada modelo so: 90%, 80% e 95%, respectivamente. Uma turbina escolhida ao acaso na produo.

a) Qual a probabilidade dela ser vendida? b) Se ela no for vendida, qual a probabilidade de que ela seja do modelo 2 ? c) Se ela for vendida, qual a probabilidade de que ela no seja do modelo] ?

EVENTOS INDEPENDENTES 9) Sejam A e B dois eventos, tais que P(A) = 0,4 e P(A u H) = 0,7. Seja P(B) = p. Para que valor de "p", A e B sero mutuamente excludentes? Para que valor de "p", A e B sero independentes? 10)Numa oficina funcionam 6 mquinas idnticas, para qualquer uma dclas, a probabilidade de entrar em pane durante um dia de trabalho igual a O,]. Supondo-se que as falhas ocorram independentemente entre si, pede-se para calcular a probabilidade: a) Nenhuma entrar em pane. b) Pelo menos uma entrar em pane.

VARI VEIS ALEATRIAS

11) De uma caixa que contm 7 peas das quais 4 so defeituosas, retirou-se, sem reposio, 3 peas. Defina X = n' de peas defeituosas entre as retiradas. Determine: a) A distribuio de probabilidade de X. b) A funo de dlstribuio acumulada de X. c) O nmero esperado de peas defeituosas.

-..,.,...--

-~

12) A distribuio de probabilidade de uma v. a X dada por:

1)( A

V)

= X = { -.,se.x = 1,2,3. 5
O,caso. contrario

CX

a) Encontre c e determine o valor mais provvel de X. b) Encontre a funo de distribuio acumulada de X. 13) Suponha que a porccntagem de lcool (lOOX) em certo composto uma v. a , onde X, O<X< I, tcm a seguinte densidade: 2(l- x ),0 < x < 1 I(x) = { O,caso.contrario a) Encontre a funo de distribuio acumulada de X. b) Calcule a percentagem mdia dc lcool no composto. c) Considere que o preo de venda deste composto dependa do contedo de lcool. Espccificamcnte, se 0<x<1/3, o composto vendido por R$ 2,88 o litro. Se 1/3<x<l, o preo de venda de R$ 2,61 o litro. Calcule o prco mdio de venda, por litro, do composto.

DISTRIBUIO

BINOMIAL

14) Suponha que uma v. a X tenha distribuio binomial, com mdia E(X) = 4 e varincia V(X). = 3. a) Encontre n. b) Calcule P(X <2). 15) Um estado onde h grande nmero de residncias na zona rural, tem 60% dessas residncias seguradas contra incndio. Sorteia-se 8 residncias ao acaso, com reposio. Se X o nmero de residncias seguradas contra incndio, calcule: a) A probabilidade de que pelo menos 3 dessas 8 residncias tenham seguro contra incndio. b) O nmero esperado e a varincia do nmero de residncias no seguradas contra incndio.

DISTRIBUIO

UNIFORME

16) Dizemos que X tem distribuio uniforme no intervalo (a,b), se sua densidade for do tipo:
1

I(x) =
{

-b-,.a<x<!J

-a O,. caso. contrario

Determine F(X), E(X) e V(X).

17) O erro X na lcitura de um medidor de presso tcm distribuio uniforme no intervalo (-1/4,1/4). a) Calcule a probabilidade de cometer um erro inferior a 1/8. b) Calcule a mdia e o desvio padro da distribuio do erro.

DISTRIBUIO NORMAL

18) O nmero de pedidos para a compra de ccrto produto que uma companhia recebe por semana, distribui-se normalmente com mdia 125 unidades e dcsvio padro 30 unidades. Se uma certa semana, o estoque disponvel de 150 unidades, qual a probabilidade de que todos os pedidos sejam atendidos? 19) O tempo de vida de transistores produzidos por certa indstria, tcm distribuio aproximadamente normal com valor espcrado dc 500 horas e desvio padro dc 50 horas; a) Qual a probabilidade de que um transistor produzido por essa indstria tenha vida inferior aSSO horas? b) Um comprador exigc quc pelo mcnos 95% dos transistores fornccidos tcnham vida supcrior a 400 horas. Esta exigncia dele ser cumprida? ) Se tomarmos uma amostra dc 10000 desses transistorcs, quanto se espera que tenham vida superior a 600 horas ? 20) Suponha que a carga de ruptura X de um cabo (Em Kgt) tcnha distribuio N(lOO,16). Cada cabo fornece um lucro de R$ 3,50 se X>95. Se X<95, o cabo poder ser utilizado para uma finalidade diferente dando um lucro de R$l ,20. Fabricando-se muitos desses cabos, qual o lucro esperado por cabo ? 21) Suponha que o vo de uma porta em construo deve ser utilizado por pessoas quc tm altura normalmente distribuda com mdia 1,80m e desvio padro de 8cm. a) Qual a altura mnima, do vo da porta que no mais de 2% das pessoas batam com a cabea na

~~?
pela porta scm se curvar?

b) Se o vo da porta for construdo com 1,85m de altura, dentre 1000 pessoas, quantas passariam

DEPARTAMENTO DE ESTATSTICA - CCEN - UFPb

Respostas da Lista de Exer:c:cios - Unidades 11e 11I


EXPERIMENTO 1) NOES DE PROBABILIDADE 2) 3) 4) 5) 6) 1-2x; l-y+x; I-z-x; a) 33,33% ; b) 48,48% a) 5% ; b) 5% a) 66,67%; b) 33,33% a)8,89% ; b) 4,44% PROBABILIDADE l-y+z ALEATRIO

CONDICIONADA

7) a) 2,5% ; b) 16% 8) a) 88,5% ; b) 52,17% ; c) 59,32% EVENTOS INDEPENDENTES 9) 30%; 50% 10) a) 53,14%; b) 46,86% VARIVEIS ALEATRIAS 11) a) -; b) -; c) 1,7 12) a) 5/6 ; 3; b)13)a)-; b)33,33%; c)2,76 DISTRIBUIO BINOMIAL

14) a) 16; b) 6,35% 15) a) 95,02% ; b) 3,2 ; 1,92 DISTIUBUIO UNIFORME

16) -; (a+b )/2 ; (b-a)2/2


17) a) 75%; b) O; 0,021 DISTRIBUIO NORMAL

18) 79,67% 19) a) 84,13%; b) Sim; c) 228 20) 3,26 a) a) 1,9648 m; b) 736

UNIVERSIDADE FEDERAL DA PARABA CENTRO DE CINCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE ESTATSTICA LISTA DE EXERCCIOS DE INFERNCIA UNIDADES IV, V E VI DISTRIBUIO AMOSTRAL 1) Suponha que uma populao seja 16. Uma amostra de 25 elementos a) Qual a probabilidade que a mdia b) Qual a probabilidade que a mdia c) Qual a probabilidade quea mdia Normalmente distribuda com mdia 10 e varincia foi retirada dessa populao. Determine: amostraI seja superior a 12? amostrai seja inferior a 8? amos"trallique entre 9 e li?

2) Os pesos de fardos recebidos por um certo depsito tem em m6dia 200 kg. e desvio padro 30 kg. Supondo Normalidade para os pesos dos fardos, pede-se: a) Determinar a probabilidade de que em uma amostras de 25 desses fardos fornea peso mdio seja superior a 210 kg. b) Se o limite especfico de segurana de um elevador de 7668 kg., determinar a probabilidade de que 36 fardos recebidos ao acaso e carregado nesse elcvador no exceda o limite de segurana. 3) Um distribuidor de sementes determina atravs de testes que 5% das sementes no . germinam. Ele vende pacotes de 200 scmcntcs com garantia dc 90% de germinao. Qual a probabilidade de um pacote no satislzer a garantia? 4) Determine a probabilidade de que, das prximas 200 crianas a nascerem, a) menos de 40% sejam nlcninos, b) entre 43% e 57% sejam meninas, c) mais de 54% sejam meninos. Admita probabilidades iguais de nascimento para menino ou menina. 5) Uma populao Normal tem varincia 15. Extraindo-se dessa populao amostras do tamanho 5, que perccntagens podemos esperar com varincias a) inferiores a lO? b) superiores a 20 ? c) entre 5 e lO? 6) A vida mdia das lmpadas fabricadas por determinada companhia de 2000 horas, com desvio padro de 60 horas. - Escolhidas 10 lmpadas ao acaso, determinc a probabilidade de o desvio padro amostrai a) no exceder 50 horas? b) estar entre 50 e 70 horas?

INTERV ALOS DE CONFIANA 1) Retira-se ao acaso uma amostra de 33 notas de um concurso para professor. Sabendo-se que a mdia dessa amostra 30,0, e que a distribuio das notas Normal com um desvio padro de 2,5, determinar:

1.1) intervalos de 90%, 92% e 95% de confiana para a verdadeira nota mdia no concurso. 1.2)Se a nota mdia est nos intervalos: a)30 :t 0,5 b)30:t 1,0 c)30:t 1,2. Determine o nvel de confiana dos intervalos. 2) O diretor de uma empresa deseja estimar o nmero mdio de horas de treinamento para seus funcionrios. Determine o tamanho mnimo da amostra necessria para tanto, admitindo um fator de erro de :t4 horas a um nvel de confiana da estimativa de 95% e um desvio padro populacional de 12 horas. 3) De 50.000 computadores usados por todas as escolas e universidades da Paraba, retira-se uma amostra aleatria de 400 dcle~ e obtm-se a vida mdia de 800 horas c o desvio padro de 100 hs. 3.1)Qual o lC de 99% para a verdadeira vida mdia de todos os computadores da Paraba? 3.2)Com que confiana dir-se-ia que a vida mdia 800 :l: 0,98? 3.3)Que tamanho deve ter a amostra para que seja de 95% a conliana na estimativa 800.:t 7,84? (Que suposies voc fez para responder as questes acima?) 4) Deseja-se estimar qual a porcentagem mdia t) da receita familiar gasta com educao pelos moradores de uma certa localidade. Para isso, selecionou-se aleatoriamente uma amostra de 16 famlias, que apresentou os resultados (em %): 41 44 35 42 34 29 42 42 38 62 29 63 38 45 48 40 Admitindo Normalidade ,para a populao, construir um intervalo com 95% para ~. 5) Em 9 testes de consumo de gs de cozinha em canteiros de obras obteve-se, respectivamente, 16, 14, 17, 15, 15, 14, 18, 17 e 18 dias/bujo de gs (sob condies especficas). Supondo Normalidade, construa IC com a)95% e b)99% para o consumo verdad.eiro mdio dirio dos canteiros por bujo de gs. 6) Suponha que estamos interessados em estimar a porcentagem de consumidores de um certo produto. Se uma amostra de tamanho 300 forneceu 100 indivduos que consomem o dado produto, determine: a) Um intervalo de 95% de confiana para verdadeira percentagem de consumidores e interprete o rcsultado. b) O tamanho da amostra para que o erro da estimativa no exceda a 0,02 unidades com probabilidade 0,95 e interprete o resultado. 7) Quinze dias antes do 2". turno das eleies presidenciais de 1989 foi feita uma pesquisa com 400 eleitores de Joo Pessoa e verificou-se que 208 eram favorveis a Lula 42 estavam indecisos e os restantes eram fhvorveis a Collor. a) Construa um intervalo de 90% de confiana para a proporo de eleitores favorveis a Lula naquela ocasio. b) Determine a confiana dos scguintes intervalos para Collor: 0,37.i0,03; 0,37.i0,04.

l_

--,

..
TESTE DE HIPTESES 1) O CREA esto riiuito preocupados com o tempo perdido com acidentes de trabalho, cuja mdia, nos ltimos tempos, tem sido da ordem de 60 horas/homem por ano e desvio padro de 20 horas/homem. Tentou-se um programa de preveno de. acidentes e, aps o mesmo, tomou-se uma amostra de 9 obras e mediu-se o nmero de horas/homens perdidas por acidente, que foi de 50 horas. Voc diria, ao nvel de 5%, que h evidncia de melhoria? 2) Uma fbrica de automveis anuncia que seus carros consomem, em mdia 11 litros por 100 km, com desvio padro de 0,8 litros. Uma revista resolve testar essa afirmao e analisa 35 automveis dessa marca, obtendo 11,3 litros por 100 km como consumo mdio (considerar distribuio Normal). O que a revista pode concluir sobre o anncio da fbrica, ao nvel de 10% ? 3) O salrio mdio dos empregados do prque industrial de J. Pessoa de 2,5 salriosmnimos, com desvio padro de 0,5 salrios-mnimos. Se uma firma particular emprega 49 empregados com um salrio mdio de 2,3 salrios-mnimos, podemos afirmar que esta indstria paga salrios inferiores, ao nvel de 5% ? 4) No passado, determinada mquina produziu arruelas de espessura mdia de 0,05 cm. A fim de verificar se a mquina ainda est em boas condies, toma-se uma amostra de 10 arruelas, cuja espessura mdia de 0,053cm., com desvio padro de 0,003cm. Teste a hiptese de que a mquina ainda est em boas condies, utilizando um nvel de significncia de 0,01. 5) Um teste de resistncia de 6 eordas fabricadas por determinada companhia acusou resistncia mdia de 7.750 tono com desvio padro de 143 ton., contra a alegao do fabricante de que a resistnca mdia seria de 8.000 tono Pode-se justificar a alegao do fabricante ao nvel de 5% de significncia ? 6) Os produtores de um determinado programa de televiso pretendem modific-lo se, pelo menos, um q~arto dos possuidores de televiso no o assistirem regularmente. Uma pesquisa encomendada a uma empresa especializada mostrou que, de 400 famlias entrevistadas, 80 assistem o programa regularmente. Baseado nos dados, qual deve ser a deciso dos produtores, ao nvel de 5% de significneia ? 7) O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% das unidades fabricadas apresentam defeito. Para confirmar sua acusao, ele usou uma amostra de tamanho 50, onde 27% das peas eram defeituosas. Mostre eomo o fabricante poderia refutar a acusao. Utilize um nvel de significncia de 10%.

....

DEPARTAMENTO

DE ESTATSTICA

- CCEN - UFPb

. Respostas da Lista dc'Exerccios_ - Unidades IV, V e Professores: Claudia~ Manoel e Jozemar Distribuio Amostrai 1) 2) 3) 4) 5) 6) a) 0,62% b) 0,62% c) 78,88% a)4,75% b) 99,53% 0,94% a) 0,23% b)95,24% c) 12,92% a) 50% b) 25% c) 25% a) 50% b) 40%

vr.

~,
'

---",.,.- ~

. ,. -.

Intervalo de Confiana 1) 1.1) 30 ::!:: O,72kg ~30 ::!:: 0,76kg ; 30 ::!:: 0,85kg 1.2) a) 74,98% b) 97,86% c) 99,42% 2) n= 35 3) 3.1) 800 ::!::12~9hs 3.2) 1 - a = 15,86% 3.3)n = 625 4} 42::!::5,10% 5) a) 16 ::!::1,22km/l b) 16 ::!::1,77km/l 6) a) 0,33:t 0,05 b) n = 2135 7) a) 0,52 :t0,04 b) 78,5%~ 90,3% Teste de Hipteses I) Aceito Ho 2) Rejeito I-L. 3) Rejeito Ho 4) Aceito Ho 5) Rejeito H~ 6) Rejeito He, 7) Aceito Ho

.,

--