Anda di halaman 1dari 149

ESTATSTICA

Professora Me. Ivnna Gurniski Carniel

Graduao

Unicesumar

Reitor
Wilson de Matos Silva
Vice-Reitor
Wilson de Matos Silva Filho
Pr-Reitor de Administrao
Wilson de Matos Silva Filho
Pr-Reitor de EAD
Willian Victor Kendrick de Matos Silva
Presidente da Mantenedora
Cludio Ferdinandi

CENTRO UNIVERSITRIO DE MARING. Ncleo de Educao a


Distncia:
C397

Estatstica / Ivnna Gurniski Carniel.
Reimpresso revista e atualizada, Maring - PR, 2014.

149 p.
Graduao - EaD.


1. Estatstica 2. Populao e amostra . 3. Variveis 4. EaD. I. Ttulo.
CDD - 22 ed. 519.5
CIP - NBR 12899 - AACR/2

Ficha catalogrfica elaborada pelo bibliotecrio


Joo Vivaldo de Souza - CRB-8 - 6828

NEAD - Ncleo de Educao a Distncia


Direo de Operaes
Chrystiano Mincoff
Coordenao de Sistemas
Fabrcio Ricardo Lazilha
Coordenao de Polos
Reginaldo Carneiro
Coordenao de Ps-Graduao, Extenso e
Produo de Materiais
Renato Dutra
Coordenao de Graduao
Ktia Coelho
Coordenao Administrativa/Servios
Compartilhados
Evandro Bolsoni
Gerncia de Inteligncia de Mercado/Digital
Bruno Jorge
Gerncia de Marketing
Harrisson Brait
Superviso do Ncleo de Produo de
Materiais
Nalva Aparecida da Rosa Moura
Superviso de Materiais
Ndila de Almeida Toledo
Design Educacional
Fernando Henrique Mendes
Rossana Costa Giani
Projeto Grfico
Jaime de Marchi Junior
Jos Jhonny Coelho
Editorao
Daniel Fuverki Hey
Reviso Textual
Jaquelina Kutsunugi, Keren Pardini, Maria
Fernanda Canova Vasconcelos, Nayara
Valenciano, Rhaysa Ricci Correa e Susana Incio
Ilustrao
Thayla Daiany Guimares Cripaldi

Viver e trabalhar em uma sociedade global um


grande desafio para todos os cidados. A busca
por tecnologia, informao, conhecimento de
qualidade, novas habilidades para liderana e soluo de problemas com eficincia tornou-se uma
questo de sobrevivncia no mundo do trabalho.
Cada um de ns tem uma grande responsabilidade: as escolhas que fizermos por ns e pelos nossos far grande diferena no futuro.
Com essa viso, o Centro Universitrio Cesumar
assume o compromisso de democratizar o conhecimento por meio de alta tecnologia e contribuir
para o futuro dos brasileiros.
No cumprimento de sua misso promover a
educao de qualidade nas diferentes reas do
conhecimento, formando profissionais cidados
que contribuam para o desenvolvimento de uma
sociedade justa e solidria , o Centro Universitrio Cesumar busca a integrao do ensino-pesquisa-extenso com as demandas institucionais
e sociais; a realizao de uma prtica acadmica
que contribua para o desenvolvimento da conscincia social e poltica e, por fim, a democratizao
do conhecimento acadmico com a articulao e
a integrao com a sociedade.
Diante disso, o Centro Universitrio Cesumar almeja ser reconhecido como uma instituio universitria de referncia regional e nacional pela
qualidade e compromisso do corpo docente;
aquisio de competncias institucionais para
o desenvolvimento de linhas de pesquisa; consolidao da extenso universitria; qualidade
da oferta dos ensinos presencial e a distncia;
bem-estar e satisfao da comunidade interna;
qualidade da gesto acadmica e administrativa; compromisso social de incluso; processos de
cooperao e parceria com o mundo do trabalho,
como tambm pelo compromisso e relacionamento permanente com os egressos, incentivando a educao continuada.

Seja bem-vindo(a), caro(a) acadmico(a)! Voc est


iniciando um processo de transformao, pois quando investimos em nossa formao, seja ela pessoal
ou profissional, nos transformamos e, consequentemente, transformamos tambm a sociedade na qual
estamos inseridos. De que forma o fazemos? Criando
oportunidades e/ou estabelecendo mudanas capazes de alcanar um nvel de desenvolvimento compatvel com os desafios que surgem no mundo contemporneo.
O Centro Universitrio Cesumar mediante o Ncleo de
Educao a Distncia, o(a) acompanhar durante todo
este processo, pois conforme Freire (1996): Os homens
se educam juntos, na transformao do mundo.
Os materiais produzidos oferecem linguagem dialgica e encontram-se integrados proposta pedaggica, contribuindo no processo educacional, complementando sua formao profissional, desenvolvendo
competncias e habilidades, e aplicando conceitos
tericos em situao de realidade, de maneira a inseri-lo no mercado de trabalho. Ou seja, estes materiais
tm como principal objetivo provocar uma aproximao entre voc e o contedo, desta forma possibilita o desenvolvimento da autonomia em busca dos
conhecimentos necessrios para a sua formao pessoal e profissional.
Portanto, nossa distncia nesse processo de crescimento e construo do conhecimento deve ser
apenas geogrfica. Utilize os diversos recursos pedaggicos que o Centro Universitrio Cesumar lhe possibilita. Ou seja, acesse regularmente o AVA Ambiente
Virtual de Aprendizagem, interaja nos fruns e enquetes, assista s aulas ao vivo e participe das discusses. Alm disso, lembre-se que existe uma equipe de
professores e tutores que se encontra disponvel para
sanar suas dvidas e auxili-lo(a) em seu processo de
aprendizagem, possibilitando-lhe trilhar com tranquilidade e segurana sua trajetria acadmica.

autores

Professora Me. Ivnna Gurniski Carniel


Mestre em Ensino de Cincias e Educao Matemtica da Universidade
Estadual de Londrina, especialista em Docncia no Ensino Superior pelo
Centro Universitrio de Maring, graduada em Licenciatura em Matemtica
pela Universidade Estadual de Maring.

Apresentao

ESTATSTICA
Seja bem-vindo(A)!
Caro(a) estudante, com muito prazer que apresentamos a voc o livro que far parte
da disciplina de Estatstica. A Estatstica uma cincia que se dedica ao desenvolvimento e ao uso de mtodos para a coleta, resumo, organizao, apresentao e anlise de
dados. Antes que um novo remdio possa ser colocado no mercado, por exemplo, a
Food and Drug Administration dos Estados Unidos exige que este seja submetido a um
ensaio clnico estudo experimental envolvendo indivduos humanos. Os dados desse
estudo precisam ser compilados e analisados para que seja determinado se o remdio
efetivo e seguro. Alm desse, h outros exemplos do uso da estatstica para o desenvolvimento e o bem-estar da sociedade, como: a previso do tempo em uma regio, as
tendncias em determinada eleio, a posio dos bancos dos trens em certa linha e at
o hbito de lavar as mos aps usar o banheiro. Por essas ideias apresentadas, conclumos que sem estatstica no h cincia.
Fazendo uma pequena viagem pelo tempo, em 3000 a.C. registram-se os primeiros indcios de censos na Babilnia, na China e no Egito. No Velho Testamento, Livro 4 (Nmeros), registra--se uma instruo de Moiss: Fazer levantamento dos homens de Israel
aptos a guerrear.
A palavra Censo deriva do verbo latino censere, que significa taxar. O objetivo inicial
da realizao dos censos era buscar informaes sobre as populaes para orientar a
taxao de impostos. Era, portanto, uma atividade que interessava particularmente aos
governos, ao Estado. Da deriva a palavra ESTATSTICA (de STATUS). Trata-se da ferramenta de trabalho dos estadistas.
Em 1805, Guilherme, o Conquistador, determinou que se fizesse na Inglaterra um levantamento visando obter informaes sobre posse de terras, sua utilizao, seus proprietrios, nmero de empregados, posse de animais etc., para taxao de impostos.
No sculo XVII, John Graint publica Aritmtica Poltica, uma anlise sobre nascimentos
e bitos a partir das chamadas Tbuas de Mortalidade.
J no sculo XVIII (1797), surge na Enciclopdia Britnica o verbete STATISTICS pela
primeira vez.
O termo Estatstica usado hoje com alguns significados diferentes. Ele pode se referir
a:
meros registros de eventos que interessem ao Administrador em geral;
uma simples medida estatstica que seja obtida de uma amostra;
mtodos estatsticos padronizados utilizados em pesquisa por amostragem;
Cincia Estatstica em geral, hoje grandemente desenvolvida e com aplicao disseminada como auxiliar as mais diferentes reas de conhecimento.

Apresentao
De forma simplificada, podemos admitir que a Cincia Estatstica tem como objetivo obter informaes confiveis sobre determinado fenmeno de interesse.
A Estatstica est de forma muito presente na mdia, seja em jornais, revistas ou
meios de comunicao. Alm disso, uma vez que est diretamente envolvida com
pesquisa, a partir dela que as decises so tomadas. Podemos dizer que a Estatstica uma ferramenta para qualquer pesquisador na busca pelas respostas aos
vrios problemas relacionados ao meio em que trabalha. Entretanto, para que ela
seja bem utilizada, necessrio conhecer os seus fundamentos, seus princpios e
suas ferramentas para que possamos utiliz-la de forma adequada. importante
que o pesquisador desenvolva tambm um esprito crtico e de anlise para poder
utilizar com preciso a estatstica em suas tomadas de decises.
Este material foi separado em cinco unidades, sendo iniciado com a importncia
da estatstica bsica, passando por probabilidades e finalizando com medidas de
associao.
A Unidade I vai do incio de sua utilizao at a importncia dos grficos e das tabelas na apresentao dos dados. Essa unidade trata basicamente dos conceitos que
voc precisar saber para entender a estatstica nas unidades posteriores.
Na Unidade II, nos aprofundaremos no estudo de tabelas e grficos, mais especificamente, leitura e construo de tabelas, aplicao e utilizao de alguns tipos de
grficos. Podemos destacar que os grficos em seus mais variados tipos traduzem
de forma rpida os dados que se quer mostrar dentro de uma pesquisa. O intuito de
todos os grficos sempre o mesmo: traduzir dados em informaes que sejam visveis e traduzveis aos olhos do pesquisador e do pblico de forma geral. A utilidade
dos grficos e tabelas tambm mostra sua importncia, uma vez que a utilizao
dessas ferramentas quase uma rotina nos meios de comunicao com o objetivo
de mostrar os resultados das pesquisas.
A Unidade III mostra as medidas de posio e disperso. Essas medidas so amplamente empregadas dentro de pesquisas em nvel cientfico e tambm nos problemas mais simples do cotidiano. Dentre as medidas estatsticas, a principal e mais
utilizada a mdia, que representa o conjunto de dados como um todo. Tambm
muito empregado como medida explicativa, podemos citar o desvio padro, que
mostra a variabilidade dos dados ou a disperso dos mesmos. A mdia e o desvio padro so medidas importantes em uma anlise de dados, uma vez que uma
representa o conjunto de dados propriamente dito e a outra mostra a disperso
do mesmo, apontando assim se temos homogeneidade ou heterogeneidade nos
dados da pesquisa.
A Unidade IV trata sobre probabilidades. As probabilidades podem tratar de eventos
simples a extremamente complexos. De forma abrangente, elas tratam das chances
de determinados fenmenos ocorrerem. A importncia de se estudar probabilidades est na verificao de que alguns eventos ocorrem com alguma facilidade maior
que outros e, assim, podemos prever situaes futuras sobre esses eventos.

Apresentao
A unidade aborda as probabilidades de forma geral, mostrando desde os clculos
mais simples, passando por suas propriedades, e indo at as probabilidades condicionais e distribuies de probabilidades. As principais distribuies so aquelas
que utilizamos com maior frequncia, uma vez que existem inmeros tipos. Essas
distribuies do comportamento da varivel com a qual estamos trabalhando importante, pois por meio delas que determinamos como calcular probabilidades
de forma correta.
Finalizando o material, a Unidade V trata das medidas de associao, mais especificamente a correlao e a anlise de regresso. Essas medidas nos mostram o grau
de relao entre duas variveis. A correlao informa a intensidade da relao e a
anlise de regresso mostra a quantidade de variao em uma por meio da variao
em outra.
Este material est bastante sintetizado, focando os pontos principais da Estatstica
de modo a proporcionar encaminhamentos que possibilitem a compreenso dos
conceitos, ao contrrio do que muitas vezes posto em se tratando de estudar Matemtica e, especificamente, Estatstica.
A resoluo de tarefas importante desde que o estudante procure faz-la luz da
teoria que ela contempla. Com isso, afirmo: ser necessrio, tambm, muito empenho de sua parte para a realizao desse intenso trabalho. No decorrer de suas
leituras, procure interagir com os textos, fazer anotaes, responder as atividades
de autoestudo, anotar suas dvidas, ver as indicaes de leitura e realizar novas pesquisas sobre os assuntos tratados, pois com certeza no ser possvel esgot-los em
apenas um livro.
Prof. Ivnna Gurniski Carniel

10 - 11

sumrio

UNIDADE I

CONCEITOS E IMPORTNCIA DA ESTATSTICA


17 Introduo
17 A Importncia da Disciplina de Estatstica
19 Conceitos Bsicos em Estatstica
20 Populao e Amostra
21 Amostragem
25 Tipos de Variveis
27 Fases do Mtodo Estatsitico
28 Tabelas e Grficos
31 Consideraes Finais

UNIDADE II

TABELAS E GRFICOS
37 Introduo
38 Tabelas
45 Grficos
46 Grficos para Variveis Qualitativas
53 Consideraes Finais

sumrio

UNIDADE III

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


59 Introduo
59 Medidas Descritivas
60 Medidas de Posio ou de Localizao
68 Medidas Separatrizes
72 Medidas de Disperso
79 Consideraes Finais

UNIDADE IV

PROBABILIDADES
85 Introduo
85 Probabilidades
98 Regras de Probabilidade
100 Distribuies de Probabilidade
101 Distribuies Discretas de Probabilidade
106 Distribuies Contnuas de Probabilidade
115 Consideraes Finais

12 - 13

sumrio

UNIDADE V

CORRELAO LINEAR E REGRESSO


121 Introduo
122 Correlao Linear 
122 Coeficiente de Correlao Linear de Pearson 
126 Anlise de Regresso
127 Regresso Linear Simples
134 Consideraes Finais

139 Concluso
149 Referncias

CONCEITOS E IMPORTNCIA
DA ESTATSTICA

UNIDADE

Professora Me. Ivnna Gurniski Carniel

Objetivos de Aprendizagem
Entender o que significa Estatstica.
Compreender a importncia da Estatstica.
Assimilar os principais conceitos dentro da Estatstica.
Compreender as principais formas de apresentao de dados
estatsticos.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
A Importncia da Disciplina de Estatstica
A Necessidade do Domnio da Estatstica
Conceitos Estatsticos
Populao e Amostra
Censo
Parmetros
Variveis
Apresentao de Dados Estatsticos

16 - 17

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Introduo
A Estatstica uma cincia multidisciplinar que permite a anlise de dados em
todas as reas, fornecendo ferramentas para que sejamos capazes de transformar dados brutos em informaes acessveis e de fcil compreenso, de modo
que possamos compar-los com outros resultados ou ainda verificar sua adequao com alguma teoria pronta.
Fundamentalmente, a Estatstica fornece mtodos de coletar, organizar,
descrever, analisar e interpretar dados. Esses mtodos, j consagrados como os
mais indicados, so utilizados no processo de tomada de decises, resoluo de
problemas e produo de conhecimento, como consequncia.
Nesta unidade, sero apresentados conceitos bsicos em Estatstica, que so
subsdios para o desenvolvimento de todo o estudo proposto neste livro.

A Importncia da Disciplina de Estatstica


A palavra Estatstica deriva do latim status, que
significa ESTADO. Os primeiros usos da estatstica
se deram com base no conhecimento da populao
em relao s suas riquezas e na coleta de impostos.
Posteriormente foi empregada no manuseio de dados
que descreviam aspectos de um Estado ou pas, da a
origem da palavra estar relacionada a Estado.
A Estatstica est presente no dia a dia de qualquer
indivduo, seja na abordagem governamental em que
somos questionados, como o censo demogrfico, ou
ento quando somos abordados sobre qual candidato
que iremos votar na prxima eleio, quando nasce
um indivduo, ou quando estamos consumindo algum
tipo de produto; em todas essas situaes, dentre tantas

shutterstock

Introduo

CONCEITOS E IMPORTNCIA DA ESTATSTICA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

outras, estamos fazendo parte da estatstica.


A anlise estatstica tem, assim, por objetivo a resoluo de problemas, bem
como a produo de conhecimentos que geram novos problemas e, portanto,
podemos dizer que est envolvida diretamente num processo iterativo, sendo
seu principal objetivo auxiliar na tomada de deciso.
Segundo Rao (1999), a Estatstica uma cincia que estuda e pesquisa tanto
o levantamento de dados quanto o processamento destes para a quantificao da
incerteza existente na resposta para um determinado problema; e a tomada de
decises sob condies de incerteza, sob o menor risco possvel.
A importncia da Estatstica est presente em todos os segmentos ligados
pesquisa, de forma geral e abrangente. A maioria desses rgos possui departamentos oficiais destinados realizao de estudos estatsticos. A Estatstica
tornou-se responsvel, nos ltimos tempos, pelo desenvolvimento cientfico e tecnolgico, sendo que a partir dela que analisamos dados e tomamos as decises.
Ainda, podemos dizer que ela fornece meios precisos e rigorosos na verificao e anlise dos dados, transformando-os em informaes claras e a partir
das quais tomamos nossas decises baseados em comprovaes cientficas, e
no em achismos.
Dentre outros atributos, podemos dizer ainda que o estudo da Estatstica
justifica-se pela necessidade de desenvolver pesquisas e pela utilizao dos resultados visando comprovao de alguma hiptese e soluo de algum problema.
Ademais, atualmente as empresas tm procurado admitir profissionais que
tenham certo nvel de conhecimento em estatstica, pois este tem resultado em
diferena significativa nos processos decisrios. Torna-se fundamental para qualquer indivduo ter conhecimentos bsicos e saber aplic-los de maneira coerente,
utilizando tcnicas estatsticas nos diferentes casos que podem surgir.

18 - 19

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Conceitos Bsicos em Estatstica


A estatstica tem por objetivo fornecer mtodos e tcnicas para que se possa
lidar com situaes de incerteza, e pode ser subdividida em trs reas: descritiva, probabilstica e inferencial.
A estatstica descritiva se preocupa em descrever os dados. A estatstica inferencial, fundamentada na teoria das probabilidades, se preocupa com a anlise
desses dados e sua interpretao (GUEDES et al., 2008).
Tambm chamada de estatstica dedutiva, a estatstica descritiva tem como
objetivo organizar, resumir e simplificar as informaes, a fim de torn-las mais
fceis de serem entendidas, transmitidas e discutidas. Como o nome indica, ela
descreve os fenmenos de forma prtica e acessvel, ou seja, por meio de tabelas,
grficos e medidas resumo, que veremos nas prximas unidades. Assim, podemos
captar rapidamente, por exemplo, o significado de uma taxa de desemprego, de
um consumo mdio de combustvel por quilmetro, ou de uma nota mdia
de estudantes.
A estatstica inferencial objetiva inferir concluses sobre a populao,
interpretando os dados colhidos de uma amostra. Para isso, utiliza amplamente a
Teoria das Probabilidades, que fundamental para avaliar situaes que envolvam o acaso. A aplicao de mtodos probabilsticos nos permite quantificar
a importncia do acaso.
Assim, resultados obtidos por amostragem so testados utilizando-se
conhecimentos probabilsticos, a fim de se determinar at que ponto so eles
significativos, isto , no so obra do acaso.
Quando tratamos de dados estatsticos, podemos optar por dois processos:
o Censo e as Estatsticas, que podem ser assim definidos:
Censo: processo que consiste no exame de todos os elementos da populao. Exemplo: censo demogrfico, censo industrial etc.
Estatsticas: utilizadas para avaliar os elementos de uma amostra.
A partir do censo so encontradas medidas que descrevem toda a populao, os
chamados Parmetros e, ao se trabalhar com amostras, so obtidas as estimaes e, a partir delas, os Estimadores, como definidos a seguir:
Conceitos Bsicos em Estatstica

Parmetros: medidas descritivas de uma populao. Exemplo: a contagem do nmero total de habitantes de uma regio.

Populao e Amostra
A Estatstica fornece vrios mtodos para organizar e resumir um conjunto de
dados e, com base nestas informaes, tirar concluses.
Quando se fala em conjunto de dados ou fatos coletados, este se refere ao
material tomado a partir de um conjunto de elementos. Deve-se ento definir de
onde esses dados sero tomados, e assim surge o conceito de Populao.
Populao pode ser definida como sendo uma coleo de elementos que
possuem alguma caracterstica em comum, podendo estes ser animados ou
inanimados.
Quando as informaes desejadas estiverem disponveis para todos os objetos

CONCEITOS E IMPORTNCIA DA ESTATSTICA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

shutterstock

Estimadores: medidas descritivas de uma amostra e que indiretamente


estimam um parmetro pelo clculo de probabilidades. Exemplo: proporo de votantes em certo candidato obtido por amostragem.

20 - 21

da populao, temos o chamado censo. Normalmente, impraticvel ou invivel


trabalhar com a populao quando se faz estatstica. Isto devido a alguns fatores:
Restrio de tempo ou recursos.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Populao infinita, entre outros.


Assim, o procedimento comum coletar desta populao um subconjunto de
elementos, as chamadas Amostras.
Amostra pode ser definida como uma parte da populao. Entretanto, este
conceito deve ir um pouco mais alm. Uma amostra deve ser representativa da
populao, ou seja, deve ter todas as caractersticas da populao de onde foi
extrada.
A partir do estudo do conjunto de dados obtido na amostra, faz-se uma
extrapolao dos seus resultados para a populao toda. Essa extrapolao
chamada Inferncia.
Um exemplo pode ser dado em estudos de opinio pblica sobre a aceitao
de um candidato s eleies, ou ento sobre a durabilidade de aparelhos, resistncia de materiais etc.
A escolha das unidades que comporo a amostra feita por um processo
chamado Amostragem, e este pode ser feito de vrias maneiras, dependendo
do que se tem em mos, por exemplo, do tamanho da populao e do conhecimento que se tem da mesma.

Amostragem
Para que se obtenha uma amostra representativa da populao, o processo de
coleta deve ser feito de forma adequada, onde cada situao exige uma maneira
apropriada.
Existem dois grandes grupos de tcnicas amostrais:
Probabilsticas: quando todos os elementos da populao tm probabilidade conhecida e diferente de zero de pertencer amostra.
Amostragem

No probabilsticas: quando nem todos os elementos da populao tm


probabilidade conhecida de pertencer amostra.
A amostragem probabilstica a mais recomendada para garantir a representatividade da amostra, pois implica um sorteio dos elementos com regras bem
determinadas, sendo possvel apenas quando a populao finita.
As principais tcnicas de amostragem probabilsticas so:

Para se ter uma amostra casual simples, precisa-se de uma listagem com todos
os elementos da populao de origem. Os elementos que faro parte da amostra devem ser obtidos de forma totalmente aleatria, ou seja, por sorteio e sem
restrio. escrito cada elemento em um carto e sorteado assim os participantes da amostra. Todos os elementos da populao tm igual probabilidade ` n j
N
de pertencer amostra.
Esta tcnica de sorteio se torna invivel quando a populao significativamente grande. Neste caso, necessrio o uso de tabelas de nmeros aleatrios
ou algoritmos que geram nmeros aleatoriamente.

Para saber mais sobre a tabela de nmeros aleatrios, ver Bussab


e Morettim em Estatstica Bsica, captulos 9 e 10 (Problemas e
complementos).

Para saber mais sobre algoritmos para gerar nmero aleatrios, ver
Barbetta et al., Captulo 1.

De forma geral, na amostragem casual simples sorteia-se um elemento da populao, sendo que todos os elementos tm a mesma probabilidade de serem

CONCEITOS E IMPORTNCIA DA ESTATSTICA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Amostragem Casual Simples

22 - 23

selecionados. Repete-se o procedimento at que sejam sorteadas todas as unidades da amostra.


Exemplo:
Para obter uma amostra representativa de 10% de uma populao de 100
elementos:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Numerar os apartamentos de 1 a 100.


Escrever os nmeros de 1 a 100 em pedaos de papel e coloc-los em
uma urna.
Retirar 10 pedaos de papel um a um da urna, formando a amostra.
Observe que cada elemento tem a mesma probabilidade a 1 k de ser
100
selecionado.

Amostragem Sistemtica
utilizada quando os elementos da populao se apresentam ordenados, sendo
a retirada dos elementos feita periodicamente para compor a amostra. O sorteio feito de forma sistematizada.
De posse de uma listagem de todos os elementos da populao, estabelecese o intervalo de seleo: I = N / n.
Em seguida, sorteia-se um nmero dentro desse intervalo. Esse ser o nmero
de ordem do primeiro sorteado da lista. Os demais sujeitos da amostra sero
selecionados utilizando o intervalo I, a partir do primeiro nmero sorteado.
Exemplo:
Para obter uma amostra de 5 alunos em uma turma de 32.
Temos, portanto, N = 32 e n = 5, donde I = 32 / 5 = 6,4. Deve-se arredondar
o valor de I sempre para baixo. Adotaremos I = 6.
O sorteio ser feito entre os primeiros seis da lista. Se o sorteado for, por
exemplo, o nmero 4, a amostra ser formada pelos sujeitos de nmeros 4, 10,
16, 22 e 28.

Amostragem

Amostragem Estratificada

O tipo de investimento ( venda ou locao) permite identificar 2 subconjuntos nesta populao:


Investimento

Populao

Amostra (10%)

venda
Locao

120
80

12
8

Total

200

20

Portanto, a amostra com 20 elementos deve conter 12 imveis venda e 8 para


locao.
Sortear 12 elementos entre os 120 imveis venda e 8 entre os 80 imveis para locao, formando a amostra da populao.

CONCEITOS E IMPORTNCIA DA ESTATSTICA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Neste tipo de amostragem, a populao deve ser dividida em subgrupos (estratos). Dentro de cada subgrupo, os indivduos devem ser semelhantes entre si.
Assim, pode-se obter uma amostra aleatria de pessoas em cada grupo. Este processo pode gerar amostras bastante precisas, mas s vivel quando a populao
pode ser dividida em grupos homogneos, devendo na composio da amostra
serem sorteados elementos de todos os estratos.
Quando os estratos possuem aproximadamente o mesmo tamanho, sorteia-se igual nmero de elementos em cada estrato e a amostragem chamada
estratificada uniforme. Caso contrrio, sorteia-se, em cada estrato, um nmero
de elementos proporcional ao nmero de elementos do estrato, chamada amostragem estratificada proporcional.
Exemplo:
Um corretor possui 200 imveis disposio, h 120 venda e 80 para locao. Extrair uma amostra representativa de 10% dessa populao:

24 - 25

Amostragem por conglomerado

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Nesta amostragem, a populao dividida em diferentes grupos (conglomerados), extraindo-se uma amostra apenas dos conglomerados selecionados, e no
de toda a populao. O ideal seria que cada conglomerado representasse tanto
quanto possvel o total da populao.
Exemplo:
Estudar a populao de uma cidade, dispondo apenas do mapa dos bairros.
Numerar os bairros e colocar os pedaos de papis numa urna.
Retirar um pedao de papel da urna e realizar o estudo sobre o bairro
(conglomerado) selecionado.
importante saber que a amostra no pode conter vcios, ou seja, no ser viesada
ou tendenciosa. Deve ser selecionada com cuidado, aplicando a tcnica de amostragem adequada com tamanho amostral (n) que seja informativo ao que consta
na populao. O tamanho da amostra pode ser obtido por frmulas encontradas facilmente na literatura ou pode ser dado pelo bom senso do pesquisador.
O importante que o mesmo seja representativo da populao.
No caso da amostra no ser representativa da populao, devemos ter cuidado com o conjunto de dados para que no haja grandes erros de inferncia,
ou ento no devemos fazer a inferncia.

Tipos de Variveis
VARIVEL uma caracterstica que possa ser avaliada (ou medida) em cada
elemento da populao, sob as mesmas condies. Uma varivel observada (ou
medida) em um elemento da populao deve gerar um e apenas um resultado.
Exemplo:
Seja uma populao formada pelos funcionrios de determinada empresa.
Podemos considerar variveis como: tempo de servio, salrio, estado civil,
Tipos de Variveis

a. tempo de vida de uma placa-me;


b. tipo sanguneo;
c. raa;
d. produo de amortecedores de uma indstria num perodo de dois minutos;
e. produo de mel das caixas de um apirio;
f. religio;
g. Estado Civil;
h. nmero de pessoas na fila de um banco;
i. nmero de produtores associados a uma cooperativa.

CONCEITOS E IMPORTNCIA DA ESTATSTICA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

idade, sexo, escolaridade, inteligncia, peso, estatura, autoestima, grau de satisfao com o emprego, autoritarismo, religiosidade etc.
Como medir estas caractersticas? Devemos fixar uma unidade de medida
(kg, cm, anos completos,...) ou definir atributos (casado, solteiro, masculino,
feminino, forte, fraco,...).
Para descrever o grupo ou a amostra, h a necessidade de identificar o tipo
dessa varivel para definir a melhor metodologia de trabalho. As variveis podem
ser: Quantitativas ou Qualitativas.
Variveis Qualitativas ou Categricas - so variveis que assumem como
possveis valores atributos ou qualidades. Se tais variveis assumem uma ordenao natural, so chamadas de qualitativas ordinais (ex.: grau de escolaridade,
classe social); caso contrrio, so chamadas qualitativas nominais (ex.: cor dos
olhos, campo de estudo).
Variveis Quantitativas - so variveis que assumem como possveis valores
os nmeros. Quando estas variveis so resultantes de contagens, so chamadas
de quantitativas discretas (ex.: quantidade de irmos, de defeitos num carro
novo); caso assumam qualquer valor em intervalos dos nmeros reais, so chamadas quantitativas contnuas (ex.: altura, peso, velocidade).
Exerccios:
Classificar as seguintes variveis:

26 - 27

Fases do Mtodo Estatsitico


Aps a definio do problema a ser estudado, a marcha natural do processo de
pesquisa a seguinte:
Planejamento.
Coleta de dados.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Crtica, organizao e sumarizao dos dados.


Apresentao dos dados.
Anlise e interpretao.
PLANEJAMENTO devem-se estabelecer com clareza os objetivos e os procedimentos a serem adotados. Nesta fase, define-se a maneira de coletar os dados
(entrevista, questionrio ou simples medio), determinando tambm o tamanho necessrio para a amostra e a maneira mais indicada para selecion-la.
COLETA DE DADOS de acordo com a finalidade da pesquisa, a coleta pode ser:
contnua - obtendo-se registros de fenmenos de interesse do administrador;
peridica - quando se necessita de avaliaes sistemticas. Um exemplo bem caracterstico o censo realizado pelos governos em perodos
pr-estabelecidos;
ocasional - quando existe um interesse momentneo em determinado
fenmeno.
O conjunto de dados coletados d origem s SRIES ESTATSTICAS.
Didaticamente, podemos caracteriz-las como:
HISTRICAS ou CRONOLGICAS, quando o fenmeno estudado ao
longo do tempo, em determinado local.
GEOGRFICAS ou TERRITORIAIS, quando se observam valores da
varivel em determinado momento, segundo sua localizao.
ESPECIFICATIVAS ou CATEGRICAS, quando a varivel observada em
determinado tempo e local, discriminada por especificaes ou categorias.
CRTICA, ORGANIZAO E SUMARIZAO - tm a finalidade de eliminar
Fases do Mtodo Estatsitico

shutterstock

Tabelas e Grficos
O objetivo da utilizao de tabelas e grficos transformar dados em informaes
que permitam a fcil visualizao e interpretao da nossa pesquisa. Tambm
servem para verificar a existncia de algum padro para comparar esse padro
com outros resultados, ou ainda para julgar sua adequao a alguma teoria.
As tabelas so quadros em que sero dispostas as informaes por alguma
categoria pelo clculo de alguma frequncia. Devem ter as laterais abertas, ou
seja, sem bordas, e devem ainda ter um ttulo explicativo e localizado acima das
mesmas, precedido da palavra Tabela e seguido de sua numerao. Veja o exemplo abaixo:

CONCEITOS E IMPORTNCIA DA ESTATSTICA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

erros. Neste processo, procede-se a uma reviso crtica dos dados, retirando os
valores estranhos que podem ocorrer tanto por erro de quem coletou os dados
ou de quem foi abordado na pesquisa. Para um melhor entendimento diante de
grande quantidade de dados adequado que se faa uma compilao dos mesmos para sua apresentao.
APRESENTAO DOS DADOS ser feita por meio de TABELAS e
GRFICOS. As tabelas so mais ricas em detalhes e em preciso. Os grficos proporcionam maior rapidez de interpretao, embora percam exatido em detalhes.
ANLISE E INTERPRETAO - tm como objetivo a determinao
de medidas estatsticas, que como j vimos, tm a finalidade de descrever de
forma prtica e objetiva as caractersticas gerais de uma populao.
Determinadas as medidas estatsticas
bsicas, a anlise desejada poder ter
sequncia j no campo da Estatstica
Inferencial, baseada sempre em raciocnios probabilsticos.

28 - 29

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Ano

Nmero de computadores Percentual de computadores por


(milhes)
total de habitantes

1998

5,0

3,0

2000

8,5

4,0

2002

13,0

7,3

2004

24,0

13,1

2006

30,0

16,1

Tabela 1: Nmero de computadores pessoais () instalados no Brasil e percentual sobre total de habitantes
de 1998 a 2006
Fonte: Computer Industry Almanac, ITU estimates e FGV/SP; MDG Indicators1 Inclui PCs, laptops,
notebooks etc., mas exclui terminais ligados a mainframes, minicomputadores de uso compartilhado e
smartphones.

Um grfico uma figura utilizada na Estatstica para representar um fenmeno.


Deve refletir padres gerais e especficos do conjunto de dados. Apesar de comum,
a utilizao dos grficos fornece menos detalhes do conjunto de dados em relao
s tabelas, entretanto, um meio rpido e prtico para visualizao dos dados.
Um grfico dispe tendncias, os valores mnimos e mximos, as variaes
dos dados e tambm as ordens de grandezas dos fenmenos que esto sendo
observados. Todo grfico deve visar clareza e objetividade, alm de ser fiel s
informaes pertinentes ao conjunto original de dados.
Existem diversos tipos de grficos e tabelas disponveis e que podemos utilizar na apresentao dos dados de nossas pesquisas. Na prxima unidade, voc
ver esses exemplos associados a vrios tipos e formatos. Veja o exemplo a seguir:

Tabelas e Grficos

Algumas perguntas podem ser feitas ao se optar pela utilizao de um grfico,


como:
O grfico uma opo que realmente demonstra o que quero mostrar
na pesquisa?
Qual o tipo de grfico adequado para os dados da pesquisa?
Como este grfico deve ser mostrado ao pblico?
Devo usar somente um grfico para visualizao dos dados da pesquisa?

CONCEITOS E IMPORTNCIA DA ESTATSTICA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grfico 1 : Percentual de domiclios atendidos por rede geral de abastecimento de gua no total de
domiclios particulares permanentes (%)
FONTE: IBGE, Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento, Pesquisa Nacional por
Amostra de Domiclios 2006-2007

30 - 31

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Consideraes Finais
A estatstica utilizada para coleta, organizao, descrio e anlise de informaes obtidas de uma pesquisa, sendo que a estatstica descritiva utilizada
para a descrio dos dados. O objetivo principal transformar os dados brutos
em informaes.
Nesta unidade voc viu os principais conceitos utilizados dentro da estatstica descritiva, tipos de amostras e a importncia da utilizao de grficos
e tabelas como forma de apresentao dos dados. Dos conceitos abordados,
podemos destacar o censo, que o processo que consiste no exame de todos os
elementos da populao e cujas medidas so chamadas de parmetros. Portanto,
podemos dizer que parmetros so as medidas utilizadas quando estamos trabalhando com toda nossa populao de estudo. Por exemplo, se coletamos dados
da contagem do nmero de habitantes de uma regio, ento a medida da contagem se chama parmetro. Entretanto, se utilizamos uma parte dessa populao,
no temos um parmetro, e sim uma estatstica ou um estimador, portanto, um
estimador uma medida tomada em uma parte dessa populao, mas no nela
toda, embora este estimador represente o parmetro.
Tambm vimos os conceitos de Populao e Amostra. Populao, no sentido estatstico, pode ser definida como um conjunto de elementos que possuem
alguma caracterstica em comum. Como na maioria das vezes difcil ou custoso
trabalharmos com populao, utilizamos uma parte dela. A esta parte chamamos de amostra. Essa amostra deve, porm, representar a populao, ou seja,
deve ter as mesmas caractersticas da populao que se ir amostrar.
Para que isso seja conseguido, o processo de coleta de uma amostra, tambm
conhecido como amostragem, deve ser feito de forma casual ou aleatria. Existem
algumas maneiras de se fazer uma amostragem e para cada situao existe uma
maneira ideal. Nesta unidade, foram discutidos os principais tipos de amostras
utilizadas nas pesquisas, sendo que a escolha deve ser feita de modo que as amostras representem de fato a populao e de forma que sejam no tendenciosas.
O nmero de elementos da populao ns chamamos de N, e o nmero de
elementos da amostra de n. O tamanho da amostra deve ser feito utilizandose o bom senso ou clculos adequados. Esse tamanho da amostra obtido de
Consideraes Finais

CONCEITOS E IMPORTNCIA DA ESTATSTICA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

acordo com o tipo de caracterstica que se deseja estudar. Para cada tipo existe
uma frmula adequada.
Aps a coleta da amostra, necessrio descrever os dados. Para isso, primeiramente, devemos saber com quais tipos de variveis estamos trabalhando, para
assim escolhermos qual a melhor maneira de apresentar a pesquisa.
Finalizando, importante que a apresentao dos dados seja feita de forma
precisa. As duas formas vistas nesta unidade foram as tabelas e grficos, e o uso
correto das formas de apresentao dos dados fundamental para o sucesso da
pesquisa.

32 - 33

1. Defina estatstica, estatstica descritiva e estatstica inferencial.


2. Apresente os conceitos para os termos abaixo relacionados e d um exemplo
para cada um deles:
Populao.
Amostra.
Censo.
Estimao.
Variveis.
3. Explique os principais tipos de amostras.
4. Comente as vantagens de apresentar resultados de pesquisa por meio de tabelas grficos.
5. Identifique a populao em estudo e o tipo de amostragem a ser utilizado em
cada alternativa:
a. Uma empresa tem 3.414 empregados repartidos nos seguintes departamentos: Administrao (914), Transporte (348), Produo (1401) e Outros (751).
Deseja-se extrair uma amostra entre os empregados para verificar o grau de
satisfao em relao qualidade da refeio servida no refeitrio.
b. Um cabo eleitoral escreve o nome de cada senador do Brasil em cartes separados, mistura e extrai 10 nomes.
c. Um administrador hospitalar faz uma pesquisa com as pessoas que esto na
fila de espera para serem atendidas pelo sistema SUS, entrevistando uma a
cada 10 pessoas da fila.
d. Para dar a porcentagem de defeitos das 3000 peas fabricadas por dia, a cada
6 peas, uma retirada para teste.

TABELAS E GRFICOS

UNIDADE

Professora Me. Ivnna Gurniski Carniel

II

Objetivos de Aprendizagem
Entender a importncia dos grficos e tabelas.
Aprender a construir grficos e tabelas para variveis qualitativas.
Aprender a construir grficos e tabelas para variveis quantitativas

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Formas de descrio dos dados
Representao dos dados por meio de TABELAS
Tabelas para variveis qualitativas
Tabelas para variveis quantitativas
Representao dos dados por meio de GRFICOS
Grficos para variveis qualitativas
Grficos para variveis quantitativas
Interpretao de tabelas e grficos

36 - 37

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Introduo
Em uma pesquisa, geralmente os dados so descritos e analisados com auxlio
de tcnicas estatsticas. As pesquisas precisam da estatstica para alcanar seus
objetivos, principalmente quando envolvem grande quantidade de informaes
que precisam ser resumidas.
As formas mais simples de apresentao dos dados na estatstica so por
meio de tabelas e de grficos. A funo das tabelas e dos grficos a mesma, ou
seja, mostrar o resumo das observaes para facilitar a visualizao e o entendimento das mesmas.
H diversas formas de grficos e de tabelas. A escolha de uma ou outra forma
depende da caracterstica com a qual estamos trabalhando. Nesta unidade, temos
o objetivo de ensin-lo(a) a construir as tabelas e os principais tipos de grficos.
Para essa construo h necessidade de separao das variveis em qualitativas
e quantitativas. Alguns tipos de grficos podem ser utilizados tanto para uma
quanto para outra varivel, entretanto, existem alguns tipos que so especficos
para variveis qualitativas ou quantitativas, portanto interessante conhecer o
tipo adequado para cada caso.
importante desenvolver tanto a habilidade de construir tabelas e grficos,
como a de fazer uma leitura adequada dos mesmos.

Introduo

SHUTTERSTOCK

II

Quando retiramos as informaes da pesquisa, temos em mos os dados brutos.


A ideia transformar os dados brutos em informaes para que seu entendimento e visualizao se tornem mais simples e rpidos.
Existem normas nacionais para a organizao de tabelas, ditadas pela ABNT,
que no sero abordadas aqui, mas convm saber que as tabelas so formadas
por ttulo, cabealho, corpo e fonte:
Ttulo: precede a tabela e resume o dado em estudo (O qu? Onde?
Quando?). Deve vir precedido da palavra tabela e de sua numerao. As
tabelas devem ser numeradas em ordem crescente maneira que aparecem no texto, ex.: Tabela 1; Tabela 2 e assim por diante.
Cabealho: especifica o contedo de cada coluna.
Corpo: formado por linhas e colunas contendo os dados.
Fonte: na parte inferior se informa a fonte da coleta de dados ou o autor.
A fonte cita o informante, caracterizando a confiabilidade dos dados.
As tabelas devero ser fechadas com traos horizontais nas bordas superior e
inferior, enquanto que nas bordas esquerda e direita no. Dentro das tabelas pode
haver traos verticais na separao das colunas no corpo da tabela ou entre as
linhas. conveniente tambm que o nmero de casas decimais seja padronizado.
Uma tabela contm as categorias da varivel estudada e suas respectivas
frequncias. Essas frequncias podem ser absoluta (Fi) dada pela contagem do
nmero de ocorrncias de cada categoria; relativa (Fr) dada pela frequncia absoFi , em que n o nmero de
luta em relao ao total de elementos, ou seja,

Fr = n

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Tabelas

38 - 39

elementos a serem estudados; porcentagem (%) dada pela frequncia relativa


multiplicada por 100, ou seja, % = Fni x 100 ; e frequncia acumulada (Fac) dada
pelas frequncias absoluta, relativa, porcentagem ou acumulada de acordo com
cada categoria.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Tabelas para Variveis Qualitativas


As variveis qualitativas apresentam-se em categorias e, portanto, a representao tabular deve ser feita por meio das frequncias referentes a cada uma das
categorias. Podem se apresentar de forma simples (com apenas uma varivel)
ou conjunta (com duas ou mais variveis).
Exemplo:
Sexo

Nmero de clientes (Fi)

Fr

Masculino

7/11 = 0,636 63,6

63,6

Feminino

4/11 = 0,364 36,4

100

Total

11

1,0

100

Fac

Tabela 2 : Distribuio de frequncias de indivduos que acessam o site quanto ao sexo


Fonte: Dados hipotticos

Outro exemplo:
Grupo de Atributos

Porcentagem (%)

Localizao

27,47

Conforto

22,71

Segurana

20,51

Incorporao

17,58

Lazer

11,73

Tabela 3: Grupo de atributos que mais valorizam os imveis


Fonte: Dados hipotticos

Tabelas

II

Existem diversos tipos de variveis demonstradas em tabelas. O formato


das tabelas sempre o mesmo, podendo apresentar uma nica frequncia
como a frequncia absoluta ou a porcentagem, ou ainda vrias frequncias
combinadas.

Regio

2005

2006

2007

2008

2009

Norte

870,2

893,4

921,0

923,1

925,7

Nordeste

574,4

573,6

573,8

571,1

582,0

Sudeste

659,2

670,4

671,5

680,9

681,4

Sul

1094,3

1112,0

114,6

1240,3

1500,4

Centro-Oeste

897,5

902,4

909,5

1002,1

1004,9

Tabela 4: Custo mdio (R$/m) das reas geogrficas de um dado pas


Fonte: Dados hipotticos

Tabelas para Variveis Quantitativas


Para variveis quantitativas contnuas ou discretas com elevado nmero de valores diferentes, a distribuio de frequncias apropriada apresentar os dados em
classes de valores.
Para esse procedimento, primeiramente, precisamos determinar o nmero
de classes. Uma classe uma linha da distribuio de frequncias.
Nmero de classes
No h regras absolutas para a escolha do nmero de classes, geralmente entre 5
e 20 classes sero satisfatrias para a maior parte dos conjuntos de dados. Uma

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

As tabelas tambm podem se apresentar mostrando a combinao de algumas


variveis conjuntas. Observe que na tabela a seguir foram tomadas 2 variveis:
Regio e Ano.

40 - 41

regra prtica razovel :

k . nmero de observaes

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Usar um nmero pequeno de classes poderia concentrar a maioria das observaes em uma ou duas classes. Se for usado um nmero grande de classes, muitas
delas tero frequncias iguais a zero.
Amplitude Total e Amplitude das Classes
Para determinar a variao dos dados dentro de cada classe, ser preciso encontrar a amplitude total:
AT = maior valor menor valor
Com o valor de AT, a variao de cada classe, que chamaremos de amplitude das classes, determinada pela relao:

AT
AC = k

Construo das classes


O menor valor da classe denominado limite inferior (Li) e o maior valor da
classe, limite superior (Ls).
Para obteno da primeira classe, tomar como Li o menor valor. Ao Li somar
o valor da AC e assim se obtm o Ls. Para construo da segunda classe, repetir o Ls da primeira classe, sendo que este na segunda classe passa a ser o Li. A
este valor adicionar o valor de AC e se obtm o Ls. Para a terceira classe repetir
o procedimento. O Ls da segunda classe repetido na terceira classe e se torna
o Li. A esse Li adicionar o valor de AC e se obtm o Ls. Esse procedimento deve
ser repetido at que se obtenha o nmero de classes definido. O Ls da ltima
classe deve obrigatoriamente ultrapassar o maior valor do conjunto de dados.
Exemplo:
Suponhamos uma pesquisa em que os dados foram coletados referentes aos
clientes que procuram uma determinada imobiliria para a compra de um imvel residencial:

Tabelas

II

Quantidade de imveis
visitados

16

24

24

11

34

44

13

10

11

Fonte: Dados hipotticos

Observe que temos 11 indivduos, portanto, o nmero ideal de classes dado por:
Amplitude Total
AT = 44 2 = 42
Amplitude das Classes

Assim, podemos montar a tabela de distribuio de frequncias para essa varivel como segue:
Classes

Fi

Fr

Fac

xi

2 |---- 16

0,545

54,5

54,5

16 |---- 30

0,273

27,3

81,8

23

30 |----| 44

0,182

18,2

100

37

Total

11

100

Tabela 5: Distribuio de frequncias para a quantidade de imveis visitados por clientes de uma imobiliria
para efetuar uma compra
Fonte: Dados hipotticos

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Indivduo

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

42 - 43

Para montarmos as classes, o procedimento foi feito da seguinte maneira: na


primeira classe o Li foi o menor nmero obtido da planilha de dados referente
ao nmero de imveis visitados. A esse Li foi somada a AC (14), obtendo o Ls
da classe (16). Na segunda classe, repetiu-se o 16 e a ele somou-se a AC (14),
obtendo-se o valor 30. Da mesma forma, na terceira classe repetiu-se o 30 e a
ele somou-se a AC (14), fechando no maior valor do nmero de acessos que foi
o 44. Assim, montamos as trs classes abrangendo todos os valores da planilha.
Nessas tabelas, a Fi dada pela contagem do nmero de valores encontrados dentro dos limites de cada classe.
Caso existam valores iguais a algum dos limites (Li ou Ls), ento ter que
ser definido em qual das classes ele vai aparecer. Caso contrrio, o valor ir aparecer duas vezes. Assim, as classes so definidas da seguinte maneira:
Li |---- Ls, onde o limite inferior da classe includo na contagem da frequncia absoluta, mas o limite superior no.
Li ----| Ls, onde o limite superior da classe includo na contagem, mas
o inferior no.
Li |----| Ls, onde tanto o limite inferior quanto o superior so includos
na contagem.
Li ---- Ls, onde os limites no fazem parte da contagem.
Nesta Tabela, se observa outra coluna representada por xi; esta chamada de
ponto mdio da classe, obtido da seguinte maneira:
Ponto Mdio das Classes

De acordo com a tabela 5, os pontos mdios foram dados da seguinte maneira:


2 + 16
x1 = 2 = 9
x2 =

16 + 30
= 23
2

x3 =

30 + 44
= 37
2
Tabelas

II

Outro exemplo:
Os dados relacionados a seguir referem-se a uma pesquisa realizada a respeito
do sexo e da idade, em anos, de um grupo de estudantes de uma IES.
Indivduo

Sexo

Idade (anos)

Masculino

34

Feminino

32

Feminino

47

Feminino

17

Masculino

21

Masculino

25

Masculino

34

Feminino

39

Masculino

52

10

Masculino

41

11

Masculino

22

Logo, para a varivel idade, temos:


AC =

52 - 17
3 = 11, 7 . 12
Classes

Fi

Fr

Fac

xi

17 |--- 29

0,364

36,4

36,4

23

29 |---- 41

0,364

36,4

72,8

35

41 |----| 53

0,273

27,3

100

47

Total

11

100

Tabela 6: Distribuio de frequncias para a idade de um grupo de estudantes


Fonte: Dados hipotticos

Note que nmero 41 apareceu na planilha de dados. Optamos por coloc-lo na


classe em que o mesmo representa o Li.

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

SHUTTERSTOCK

44 - 45

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grficos
Grficos so ferramentas de representao dos dados que servem para facilitar
a visualizao dos mesmos. Devem ter simplicidade e clareza para permitir se
chegar a concluses sobre a evoluo do fenmeno ou como se relacionam os
valores da srie.
Cotidianamente se observa que meios de comunicao utilizam essa ferramenta para mostrar as pesquisas. Isso se deve ao fato da facilidade de interpretao
demonstrada nos grficos e da eficincia com que resume informaes, embora
apresente menor grau de detalhes em relao s tabelas, dando uma ideia mais
global dos dados.
Ao optar pela utilizao de um grfico em uma pesquisa, devemos levar em
conta que sua construo exige cuidados, como escolher o tipo que melhor se
encaixa na representao dos dados.

Elementos Fundamentais dos Grficos


Os elementos fundamentais de um grfico para que ele cumpra sua funo de
racionalizao das informaes so:
Ttulo: para indicar o que ele representa.
Legenda: para facilitar a leitura do grfico.
Fonte: para informar a origem dos dados.
A identificao ou ttulo de um grfico deve aparecer na parte inferior do mesmo,
precedido pela palavra Grfico, seguido de seu nmero de ordem de ocorrncia
Grficos

II

no texto. Se necessrio, uma legenda explicativa pode ser utilizada. Se os dados


observados no grfico forem extrados de terceiros, como dados obtidos de uma
revista, de uma fundao, prefeitura etc., ento obrigatrio o uso de sua fonte.

Grficos para Variveis Qualitativas

Grfico formado por retngulos verticais, em que cada um dos retngulos representa a intensidade de um atributo. o grfico mais utilizado para representar
variveis qualitativas. Indicado quando as categorias so breves.
Exemplo:

Grfico 2 : Tempo para decomposio de alguns produtos


Fonte: <www.lixo.com.br>

No caso de estarmos trabalhando com duas variveis, podemos utilizar os grficos comparativos.

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grficos em colunas

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

46 - 47

Grfico 3: Tipos de domiclios 2007 a 2009


Fonte: IBGE, Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento, Pesquisa Nacional por
Amostra de Domiclios 2007 a 2009

Para os grficos comparativos, podemos utilizar as barras empilhadas, uma acima


da outra, como visto abaixo:

Grfico 4: Proporo de domiclios com acesso Internet entre 2005 a 2009 por grandes regies do Brasil
Fonte: IBGE, Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento, Pesquisa Nacional por
Amostra de Domiclios 2005 a 2009

Grficos para Variveis Qualitativas

II

importante observar neste tipo de grfico que cada espao dentro da coluna
representa um ano com sua respectiva porcentagem. Por exemplo, a regio Norte
tem 42.5% de domiclios com acesso internet, que est subdividido em cinco
anos, e cada espao dentro dessa regio corresponde respectiva frequncia para
cada ano. Assim tambm foi feito para todas as outras regies.

Grfico em barras

Grfico 5: Nmero porcentual de computadores pessoais() instalados no Brasil sobre total de habitantes de
1998 a 2006
(1) Inclui PCs, laptops, notebooks etc., mas exclui terminais ligados a mainframes, minicomputadores de
uso compartilhado e smartphones.
Fonte: Computer Industry Almanac, ITU estimates e FGV/SP; MDG Indicators

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grfico formado por retngulos horizontais, em que cada um deles representa


a intensidade de um atributo. O objetivo deste grfico de comparar grandezas,
e recomendvel para variveis cujas categorias tenham designaes extensas.
Exemplo:

48 - 49

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grfico de setores
Tambm conhecido como grfico de pizza. Neste tipo de grfico, a varivel em
estudo projetada num crculo dividido em setores com reas proporcionais s
frequncias das suas categorias. recomendado para o caso em que o nmero
de categorias no grande e no obedece a alguma ordem especfica.
Exemplo:

Grfico 6 : Destinao final do lixo por nmero de municpio (2000)


Fonte: IBGE

Grfico de linhas
Grfico utilizado para representar dados relacionados ao tempo. feito colocando-se no eixo vertical (y) a mensurao da varivel em estudo e no eixo
horizontal (x), as unidades da varivel numa ordem crescente. Este tipo permite
mostrar as flutuaes da varivel ao longo do tempo alm de analisar tendncias.
Exemplo: Suponha uma empresa que esteja analisando o nmero de vendas
de notebooks de certa marca nos primeiros 4 meses do ano.
Ms

Nmero de vendas

Janeiro

10

Fevereiro

16

Maro

Abril

12

Tabela 7 : Nmero de vendas de notebooks por ms


Fonte: Dados hipotticos

Grficos para Variveis Qualitativas

II

Nos grficos de linhas podemos ter mais que uma varivel representando-as por linhas diferentes.
Exemplo:
Suponha uma empresa que esteja analisando o nmero de vendas de notebooks de duas marcas diferentes nos primeiros 4 meses do ano.
Ms

Marca A

Marca B

Janeiro

10

20

Fevereiro

16

30

Maro

25

Abril

12

20

Tabela 8 : Nmero de vendas de notebooks por ms das marcas A e B


Fonte: Dados hipotticos

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grfico 7 : Nmero de vendas de notebooks por ms


Fonte: Dados hipotticos

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

50 - 51

Grfico 8 : Nmero de vendas de notebooks por ms das marcas A e B


Fonte: Dados hipotticos

Grficos para Variveis Quantitativas


Se o conjunto de dados consiste de muitas observaes, seria trabalhoso construir grficos como os j mencionados. Assim, para variveis quantitativas, so
usados outros dois grficos importantes: Histograma e Polgono de Frequncia.

Histograma
Grfico de colunas, sendo dispostos no eixo horizontal os limites das classes da
varivel em questo segundo as quais os dados foram agrupados, e no eixo vertical as frequncias para cada agrupamento. Um detalhe importante que no
histograma as colunas so retngulos justapostos.

Grficos para Variveis Qualitativas

II

Polgono de frequncia
Grfico de linha, onde os pontos mdios de cada classe so colocados no eixo
horizontal e no eixo vertical, as respectivas frequncias.

Grfico 10 : Mdias do tempo total de acesso (ms) realizado com pathping durante a transmisso de pacotes
do roteador de origem ao roteador de destino final
Fonte: Lopes e Santos (2008)

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grfico 9: Distribuio de frequncias para a quantidade de imveis visitados por clientes de uma
imobiliria para efetuar uma compra
Fonte: Dados hipotticos

52 - 53

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Os diversos tipos de grficos sempre tm o mesmo objetivo: mostrar os dados de forma resumida. A escolha do tipo de grfico a ser utilizado depende
da escolha e objetivo do pesquisador.

A interpretao adequada de um grfico ou tabela fundamental para o entendimento da pesquisa. Ler o ttulo de forma minuciosa e observar valores mximos,
mnimos e suas variaes, so pontos fundamentais para uma interpretao
adequada.

Consideraes Finais
Nesta unidade tratamos da necessidade de que a apresentao dos dados seja
feita de forma precisa. As duas formas vistas nesta unidade foram tabelas e grficos, e o uso correto das formas de apresentao dos dados fundamental para
o sucesso da pesquisa.
Os grficos so formas de sintetizar as informaes coletadas. So importantes para dispormos as informaes de forma clara que para consigamos enxergar
o que aconteceu na nossa pesquisa. Existem diversos tipos de grficos. Nesta unidade, vimos os tipos mais comuns como os de barras e colunas, os de linha, de
setores ou pizza, histograma e polgono de frequncia.
De forma geral, os grficos demonstram dados quantitativos associados a
alguma varivel qualitativa. Todos os grficos tm o mesmo objetivo, que o
de demonstrar de forma clara e rpida os dados da pesquisa. A escolha do tipo
adequado fica ou a critrio do pesquisador ou a critrio do objetivo da pesquisa.

Consideraes Finais

Considere a seguinte planilha de dados quanto topologias de rede de computadores na resposta do tempo ao usurio:
Informao

Topologia

Tempo de resposta

Informao

Topologia

Tempo de
resposta

C1

6,0

C1

5,7

C2

7,0

10

C2

6,5

C3

5,0

11

C3

6,4

C1

6,3

12

C1

5,7

C2

6,8

13

C3

7,2

C2

7,2

14

C3

6,8

C1

6,0

15

C3

6,5

C2

6,7

16

C2

7,5

1. Construa uma tabela de distribuio de frequncias para Topologia.


2. Construa um grfico de setores para topologia.
3. Construa uma tabela de distribuio de frequncias para a varivel tempo de
resposta em quatro classes.
4. Demonstre um histograma para a varivel tempo de resposta.
5. Demonstre um polgono de frequncias para a varivel tempo de resposta.

54 - 55

Material Complementar

Anlises estatsticas no Excel Guia Prtico


RIBEIRO Jr., J. I
Editora: UFV
Sinopse: Utilize planilhas eletrnicas como as do programa Excel para fazer grficos e tabelas.

Material Complementar

MEDIDAS DESCRITIVAS
ASSOCIADAS A VARIVEIS
QUANTITATIVAS

UNIDADE

Professora Me. Ivnna Gurniski Carniel

III

Objetivos de Aprendizagem
Compreender as principais medidas estatsticas de posio, disperso
e separatrizes.
Entender a aplicao das medidas estatsticas de posio, disperso e
separatrizes.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Apresentao dos Dados Estatsticos
Medidas de Posio
Mdia aritmtica simples
Mdia ponderada
Moda
Mediana
Medidas Separatrizes
Quartis
Decis
Percentis
Medidas de Disperso
Amplitude Total
Varincia
Desvio Padro
Coeficiente de variao

SHUTTERSTOCK

58 - 59

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Introduo
Quando estamos realizando uma pesquisa, podemos fazer a apresentao dos
dados por meio de grficos, tabelas, ou fazendo o uso de medidas que resumem
as informaes obtidas na coleta dos dados, chamadas medidas descritivas.
Nesta unidade, estudaremos as medidas de posio e de disperso utilizadas
para descrever dados quantitativos. Essas medidas so demasiadas importantes
na representao dos dados. As medidas de posio mostram o centro de uma
distribuio de dados, nos dando uma noo do que est ocorrendo com os mesmos. J as medidas de disperso indicam a variabilidade do conjunto de dados,
mostrando se o mesmo homogneo ou heterogneo.
Assim, para descrevermos um conjunto de dados, de bom grado sempre
termos uma medida de posio e uma de disperso para represent-lo. A de
posio, para dizer o que est ocorrendo com a pesquisa e a de disperso, para
dizer se h alta ou baixa variabilidade.
Nesta unidade, sero apresentadas as principais medidas de posio e de disperso utilizadas nas pesquisas para descrever e representar o conjunto de dados.

Medidas Descritivas
Para sumarizar as informaes de um conjunto de observaes, muitas vezes
necessrio utilizar medidas que resumem em um s nmero certas caractersticas. Assim, temos as medidas de posio, disperso, assimetria e curtose. Se as
medidas so calculadas para dados a partir de uma amostra, so chamadas de
Introduo

III

estatsticas da amostra; se so calculadas a partir de uma populao, so chamadas de parmetros da populao.


As principais medidas de posio e as principais medidas separatrizes so:

Medidas de Posio ou de Localizao


As medidas de posio servem para representar o ponto central de equilbrio
de um conjunto de observaes ordenadas segundo suas grandezas. Dentre as
medidas de posio, destacamos: mdia, mediana e moda sendo que a medida
a ser escolhida para representar coerentemente os dados depende das caractersticas dos mesmos.

Mdia aritmtica
A mdia de uma varivel a medida mais importante e mais simples de ser calculada. Esta fornece uma medida de posio central. Se os dados so de uma
amostra, a mdia denotada x ; se os dados so de uma populao, a mdia

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

As principais medidas de disperso so:

60 - 61

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

denotada pela letra grega .


A mdia de um conjunto de dados encontrada somando seus valores e dividindo pelo nmero de observaes. Seja x1, x2,.....xn , um conjunto de dados a
mdia ser dada por:
Populao
Amostra

Exemplo:
Supondo que estamos estudando a idade das pessoas de uma famlia, dada
em anos. Foram observadas 5 pessoas e as idades foram: 5; 10; 12; 35; 38. Qual
a idade mdia dessa famlia?

Exerccio: Calcule a mdia para a quantidade de atendimentos realizados


num ms pelos corretores de uma imobiliria:
18, 19, 20, 21, 21, 22, 24, 34, 35, 37
R: 25,1

Mdia aritmtica ponderada


Existem situaes em que no temos todos os dados disponveis ou ento temos
pesos diferentes para os dados considerados. Nestes casos, utilizamos o que
chamamos de mdia aritmtica ponderada para obtermos a mdia, cujas frmulas para Populao e Amostra so dadas da seguinte maneira:

Medidas de Posio ou de Localizao

III

Populao Amostra

Se a situao for de dados agrupados, a mdia obtida a partir de uma ponderao em que os pesos so as frequncias absolutas (Fi) de cada classe e xi o
ponto mdio da classe i. Observe o exemplo abaixo:
Fi

Fr

Fac

xi

2 |---- 16

0,545

54,5

54,5

16 |---- 30

0,273

27,3

81,8

23

30 |----| 44

0,182

18,2

100

37

Total

11

100

Tabela 9: Distribuio de frequncias para a quantidade de imveis visitados por clientes de uma imobiliria
para efetuar uma compra
Fonte: Dados hipotticos

A mdia ponderada ser dada por:


imveis visitados
Exerccio: Calcule a mdia ponderada para a seguinte situao:
Classes

Fi

Fr

Fac

xi

17 ----| 29

0,364

36,4

36,4

18

29 ----| 41

0,364

36,4

72,8

35

41 ----| 53

0,273

27,3

100

47

Total

11

100

Tabela 10: Distribuio de frequncias para a idade dos clientes de uma imobiliria para efetuar uma
compra
Fonte: Dados hipotticos

R: 32,09
Existem situaes em que os dados no esto agrupados, mas existem pesos
diferentes para cada um deles. Vejamos um exemplo.
Exemplo:
A mdia da nota bimestral dos alunos do Cesumar composta pela nota de
MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Classes

62 - 63

uma prova (com peso 8) e pela nota dos trabalhos (com peso 2). Calcule a mdia
bimestral do aluno que tirou as seguintes notas:
Prova: 7 (peso 8) Trabalho: 9 (peso 2)
A mdia ser dada por:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Exerccio: Calcule as mdias ponderadas das notas bimestrais dos alunos


abaixo:
Aluno

Prova

Trabalho

Joo

5,0

3,0

Antnio

7,0

4,0

*Considere que o peso da prova seja igual a 9,0 e o peso do trabalho seja igual a 1,0.

R: 4,8 e 6,7
A mdia a medida mais importante dentro de um conjunto de dados e possui algumas propriedades importantes. So elas:
1. a mdia nica em um conjunto de dados;
2. a mdia afetada por valores extremamente pequenos ou grandes;
3. a mdia depende de todos os valores observados, assim, qualquer modificao nos dados far com que a mdia fique alterada;
4. a soma das diferenas dos valores observados em relao mdia zero:

A propriedade 2 importante, pois em um conjunto de dados muito heterogneo, a mdia torna-se uma medida no apropriada para representar os dados,
devendo o pesquisador optar por uma outra medida.
A propriedade 4 importante na definio de varincia, uma medida de disperso que veremos na unidade seguinte.

Projeto de Ensino: Aprender Fazendo Estatstica


GUEDES, T. A. et al.
Veja um exemplo para ilustrar melhor nas pginas. 29-30

Medidas de Posio ou de Localizao

III

Moda

Em que:
i a ordem da classe modal;
li o limite inferior da classe modal;
h a amplitude da classe modal;
Fi a frequncia absoluta da classe modal;
Fi1 a frequncia absoluta da classe anterior classe modal;
Fi+1 a frequncia absoluta da classe posterior classe modal.
Se o conjunto de dados apresentar todos seus elementos com a mesma frequncia absoluta, no existir a Moda. Se ocorrer vrias frequncias iguais, ento
teremos uma distribuio com mais de uma moda.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Chamamos de moda o valor que aparece com maior frequncia em um conjunto de dados. Para o caso de valores individuais, a moda pode ser determinada
observando-se o rol dos dados.
Exemplos:
Observe as notas da prova de estatstica da turma de Negcios Imobilirios:
4; 5; 6; 6; 6; 6; 7; 7; 7; 8.
A moda 6, pois esse o valor que ocorreu com maior frequncia.
Essa sequncia unimodal, pois tem apenas uma moda.
Veja essa outra sequncia:
4; 5; 5; 5; 6; 7; 7; 7; 8; 9.
Nesta existem duas modas (5 e 7), ela bimodal.
Essa outra:
1; 2; 3; 4; 5; 6; 7; 8; 9; 10.
No existe moda, nenhum valor aparece com maior frequncia, amodal ou
antimodal.
Quando os dados esto agrupados em classes, primeiramente necessrio
identificar a classe modal que apresenta a maior frequncia e calcular ento a
moda da seguinte maneira:

64 - 65

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

A Moda tem o atributo de no ser afetada pelos valores extremos no conjunto de dados.
Exemplo:
Classes

Fi

Fr

Fac

xi

0,5 ___ 0,8

0,25

25

0,65

0,8 ___ 1,1

0,25

25

0,95

1,1 ___ 1,4

0,4325

43,25

15

1,25

1,4 ___ 1,7

0,0625

6,25

16

1,55

Total

16

100

Tabela 11 : Teor de oxignio (mg/L) em vrios rios da regio Norte do Brasil


Fonte: Dados hipotticos

Exerccio: Calcular a Moda para o seguinte conjunto de dados:


Classes

Fi

Fr

Fac

xi

17 ----| 29

0,364

36,4

36,4

23

29 ----| 41

0,364

36,4

72,8

35

41 ----| 53

0,273

27,3

100

47

Total

11

100

Tabela 12: Distribuio de frequncias para a idade de um grupo de estudantes


Fonte: Dados hipotticos

R: 29

Mediana
Corresponde ao valor central ou mdia aritmtica dos dois valores centrais de
um conjunto de observaes organizadas em ordem crescente. Ou seja, 50% das
observaes so inferiores mediana e 50% superiores.

Medidas de Posio ou de Localizao

III

Assim, considerando n o nmero de elementos da srie, o valor mediano


ser dado pelo termo de ordem dado pelas seguintes frmulas:
Se n for mpar:
Se n for par:

(mdia entre dois nmeros)

Exerccio: Calcule a mediana para as notas dos alunos nas duas situaes
seguintes:
6.0, 4.5, 5.0, 7.0, 6.5;
4.8, 6.3, 8.9, 9.5, 6.0, 7,8;
R: 6.0 e 7.05
Para os dados em distribuio de frequncias em classes, tem-se:

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Exemplo:
Uma pesquisa em uma empresa apresentou os seguintes dados relacionados
ao tempo de trabalho de seus funcionrios:
5, 13, 12, 3, 15, 17, 8, 15, 6, 16, 9.
Para encontrarmos a mediana, primeiramente devemos ordenar os dados
brutos transformando--os em um rol:
3, 5, 6, 8, 9, 12,13, 15, 15, 16, 17.
Depois localizamos o elemento central, no caso 12, pois esquerda dele
temos 5 elementos e direita tambm. Assim temos:
Md = 12.
Quando o rol tiver nmero par de elementos, a mediana ser a mdia aritmtica entre os dois elementos centrais. Vejamos, por exemplo, um rol com 10
elementos (nmero par de elementos):
3, 5, 6, 8, 9, 13, 14, 15, 15, 16.

66 - 67

Em que:

indica a posio central da srie;

i a ordem da classe que contm o menor valor de Fai, tal que Fai p ;
Fai - 1 a frequncia acumulada da classe anterior a da mediana.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Exemplo:
Classes

Fi

FR

Fac

xi

10 ---- 29

0,364

36,4

36,4

19,5

29 ---- 48

0,545

54,5

90,9

38,5

48 ---- 67

0,091

9,1

100

57,5

Total

11

100

Tabela 13 : Distribuio de frequncia de indivduos que acessam certo site quanto ao nmero de acessos
Fonte: Dados hipotticos

logo o nmero 6 est inserido na 2 classe. Sendo assim:

Exerccio: Calcule a mediana para a seguinte situao:


Classes

Fi

Fr

Fac

xi

17 ----| 29

0,364

36,4

36,4

23

29 ----| 41

0,364

36,4

72,8

35

41 ----| 53

0,273

27,3

100

47

Total

11

100

Tabela 14: Distribuio de frequncias para a idade dos clientes de uma imobiliria para efetuar uma
compra
Fonte: Dados hipotticos

R: 33,5

Medidas de Posio ou de Localizao

III

Para qualquer assunto que trate de dados numricos, sempre trabalhamos


com uma medida de posio. Normalmente usamos a mdia, que a medida mais conhecida. Observe tambm como essas medidas so importantes
no seu cotidiano.

Medidas Separatrizes

Quartis
Chamamos de quartis os valores que dividem a distribuio em 4 partes iguais
e podem ser obtidos da seguinte maneira:
Temos trs quartis:
Primeiro quartil (Q1) o valor que tem 25% dos dados sua esquerda e
o restante (75%) direita.
Segundo quartil (Q2) tem 50% dos dados de cada lado, coincide com a
mediana.
Terceiro quartil (Q3) tem 75% dos dados sua esquerda e 25% direita.
Frmulas:
1 Quartil (Q1)

P=0,25(n +1)

2 Quartil (Q2)

P=0,50(n +1)

3 Quartil (Q3)

P=0,75(n +1)

Decis
Chamamos de decis os valores que dividem uma srie em dez partes iguais.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

As separatrizes so os valores que dividem as sries em partes iguais. As principais medidas separatrizes so: a mediana (j estudada) e os quartis, os decis
e os percentis.

68 - 69

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Portanto, temos nove decis, o primeiro tem 10% dos dados sua esquerda e 90%
sua direita, o segundo tem 20% dos dados sua esquerda e 80% sua direita
e assim por diante at o nono decil, que tem 90% dos dados sua esquerda e
10% sua direita.
1 Decil (D1)

P=0,10(n +1)

2 Decil (D2)

P=0,20(n +1)

3 Decil (D3)

P=0,30(n +1)

4 Decil (D4)

P=0,40(n +1)

5 Decil (D5)

P=0,50(n +1)

6 Decil (D6)

P=0,60(n +1)

7 Decil (D7)

P=0,70(n +1)

8 Decil (D8)

P=0,80(n +1)

9 Decil (D9)

P=0,90(n +1)

Percentis
Chamamos de percentis os noventa e nove valores que separam uma srie em
100 partes iguais. O clculo dos percentis est relacionado com percentagem.
No quadro abaixo so mostrados alguns percentis:
5 Percentil (P5)

P=0,05(n +1)

25 Percentil (P25)

P=0,25(n +1)

50 Percentil (P50)

P=0,50(n +1)

75 Percentil (P75)

P=0,75(n +1)

90 Percentil (P90)

P=0,90(n +1)

Para os dados em rol, o clculo das medidas separatrizes o mesmo que o da


mediana, a saber:

Medidas Separatrizes

III

Em que:
Ip a parte inteira de p;
Fp a parte fracionria (ou decimal).
Exemplo: Calcule o 3 quartil (Q3) e o 90 percentil (P90) para a idade
mdia de um grupo de indivduos que tm as seguintes idades:
18, 19, 20, 21, 21, 22, 24, 24, 25, 27, 30, 33, 38.
Para o Q3 temos:
p = 0,75(13 + 1) = 10,5
Como a posio do elemento quartil decimal, encontrar o valor correspondente posio da parte inteira e a imediatamente posterior a ela:
10 posio: 27
11 posio: 30
Encontrar a diferena entre estes valores:
30 27 = 3
O quartil ser o menor valor somado ao produto da parte decimal pela
diferena encontrada.
Q3 = 27 + (0,5 . 3) = 28,5 anos
Pode-se afirmar que 75% dos indivduos tm idade inferior a 28,5 anos.
Para o P90 temos:
P = 0,90(13 + 1) = 12,6
12 posio: 33
13 posio: 38
38 33 = 5
P90 = 33 + (0,6 . 5) = 36 anos
Dizemos que 90% dos indivduos tm idade inferior a 36 anos.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Primeiramente, calculamos a posio do dado:

70 - 71

Para os dados em distribuio de frequncias em classes, o clculo das medidas separatrizes feito da seguinte maneira:

Em que:
, com k = 1, 2, 3, para determinao dos quartis;

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

, k =1,2,..,9 para o clculo dos decis; e


, k =1, 2,...,99 para os percentis;
i a ordem da classe que contm o menor valor de Fai, tal que Fai p ;
Fai - 1 a frequncia acumulada da classe anterior da separatriz.
Exerccio: Considerando o exemplo da tabela abaixo, calcular o Q3 e o D7.
Classes

Fi

Fr

Fac

xi

0,5 ___ 0,8

0,25

25

0,65

0,8 ___ 1,1

0,25

25

0,95

1,1 ___ 1,4

0,4325

43,25

15

1,25

1,4 ___ 1,7

0,0625

6,25

16

1,55

Total

16

100

Tabela 15: Teor de oxignio (mg/L) em vrios rios da regio Norte do Brasil
Fonte: Dados hipotticos

Para o Q3:

Para o D7:

Medidas Separatrizes

III

Medidas de Disperso

Amplitude Total
A amplitude total de um conjunto de dados a diferena entre o maior e o
menor valor. Essa medida nos diz muito pouco, pois embora fcil de ser calculada, baseada em somente duas observaes, sendo altamente influenciada
pelos valores extremos; quanto maior a amplitude, maior ser a variabilidade.
Veja sua frmula abaixo:
AT = xmax xmin
Em que:
xmax o maior valor no conjunto de dados;
xmin o menor valor no conjunto de dados.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

As medidas de disperso mostram a variabilidade de um conjunto de observaes em relao regio central. Essas medidas indicam se um conjunto de
dados homogneo ou heterogneo. Alm disso, mostram se a medida de tendncia central escolhida representa bem o conjunto de dados que est sendo
trabalhado pelo pesquisador. Vejamos um exemplo:
Considere as idades de trs grupos de pessoas A, B e C:
A: 15; 15; 15; 15; 15
B: 13; 14; 15; 16; 17
C: 5; 10; 15; 20; 25
A mdia aritmtica do conjunto A 15, do B 15 e do C tambm 15.
A mdia aritmtica a mesma para os trs conjuntos acima, porm o grau de
homogeneidade entre eles muito diferente, ou seja, a variao dos seus elementos em relao mdia bem distinta. O conjunto A no tem disperso, o B tem
certo grau de variabilidade e o conjunto C tem grande variabilidade. Por isso,
devemos estudar as medidas de disperso. Pois conjuntos de dados diferentes
podem ter mdias iguais, porm isso no indica que so iguais, pois a variabilidade entre eles pode ser diferente.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

72 - 73

Verifique o exemplo em que foram medidas as idades das pessoas de uma


famlia, sendo elas: 5; 10; 12; 35; 38. Qual a Amplitude das idades nessa famlia?
AT = 38 5 = 33 anos
Esta medida de disperso no leva em considerao os valores intermedirios, perdendo a informao de como os dados esto distribudos.
Exerccio: Calcule a Amplitude total dos seguintes conjuntos de dados:
A: 15; 15; 15; 15; 15
B: 13; 14; 15; 16; 17
C: 5; 10; 15; 20; 25
R: 0; 4; 20

Varincia
A varincia uma medida de variabilidade que utiliza todos os dados. calculada considerando o quadrado dos desvios em relao mdia aritmtica dos
dados em estudo.
Se os dados so para uma populao, a varincia denotada pelo smbolo
grego 2 e sua definio dada como segue:

onde a mdia da populao e N o nmero de observaes.


Se os dados so para uma amostra, a varincia, denotada por s2, definida
como:

onde x a mdia da amostra e n o nmero de observaes. O uso de (n 1)


neste denominador necessrio para que a varincia da amostra resultante fornea uma estimativa no induzida da varincia da populao.
Na maioria das vezes trabalhamos nas pesquisas com dados amostrais.

Medidas de Disperso

III

Portanto, iremos nos basear sempre na varincia amostral.


Exemplo:
Continuando com o exemplo das idades das pessoas de uma famlia sendo
elas: 5; 10; 12; 35; 38, calcule a varincia amostra para este conjunto de dados.
Primeiramente, calculamos a mdia sendo esta igual a 20.
Vamos s contas:

Desvio padro
O desvio padro d a ideia de distribuio dos desvios ao redor do valor da mdia.
Para obtermos o desvio padro basta que se extraia a raiz quadrada da varincia e, seguindo a notao adotada para as varincias de populao e amostra, s
denotar o desvio padro da amostra enquanto , o desvio padro da populao. Assim:
Populao Amostra

De forma mais simplificada...



Considerando o caso acima em que a varincia foi s2 = 234,5 anos2, o clculo do

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

s2 = 234,5 anos2
A unidade da varincia a mesma unidade da caracterstica, entretanto, por simbologia apenas, devemos colocar o smbolo do quadrado junto unidade. Assim,
dizemos que a varincia dada em unidades quadrticas, o que dificulta a sua
interpretao. O problema resolvido extraindo-se a raiz quadrada da varincia, definindo-se, assim, o desvio padro.

74 - 75

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

desvio padro (s) fica bastante simples, ou seja:

Esta medida interpretvel e dizemos que a disperso mdia entre os indivduos desta famlia de 15,31 anos.
Para saber se o desvio padro est alto ou baixo, vamos compar-lo com
o valor da mdia. Quanto maior o valor do desvio padro em relao mdia,
maior ento ser a variao dos dados e mais heterogneo o nosso conjunto
de observaes.

Coeficiente de variao
O Coeficiente de Variao (CV) envolve clculos percentuais, por isso uma
medida relativa, e no absoluta. Assim, observe as frmulas a seguir:

Populao
Amostra

A partir do valor do coeficiente de variao, podemos verificar se o conjunto de


dados homogneo e tambm conseguimos saber se a mdia uma boa medida
para representar o conjunto de dados. Outra utilizao para esta medida comparar conjuntos com unidades de medidas distintas, uma vez que o CV dado
em porcentagem (%).
O CV tem o problema de deixar de ser explicativo da variao quando a mdia
est perto de zero, pois esta situao pode deix-lo alto demais. Um coeficiente de
variao alto sugere alta variabilidade ou heterogeneidade do conjunto de observaes. Quanto maior for este valor, menos representativa ser a mdia. Se isto
acontecer, deve-se optar para representar os dados por outra medida, podendo
ser essa a mediana ou moda, no existindo uma regra prtica para a escolha de
uma dessas. Fica ento essa escolha a critrio do pesquisador. Ao mesmo tempo,
quanto mais baixo for o valor do CV, mais homogneo o conjunto de dados e
mais representativa ser sua mdia.
Medidas de Disperso

III

Quanto representatividade em relao mdia, podemos dizer que quando o


coeficiente de variao (CV) ou est:
menor que 10%: significa que um timo representante da mdia, pois
existe uma pequena disperso (desvio padro) dos dados em torno da
mdia;
entre 10% e 20%: um bom representante da mdia, pois existe uma boa
disperso dos dados em torno da mdia;

entre 35% e 50%: representa fracamente a mdia, pois existe uma grande
disperso dos dados em torno da mdia;
acima de 50%: no representa a mdia, pois existe uma grandssima disperso dos dados em torno da mdia.
Exemplo:
De acordo com o exemplo das idades das pessoas de uma famlia, sendo elas:
5; 10; 12; 35; 38, calcule o coeficiente de variao para este conjunto de dados.
Considerando o clculo da mdia e do desvio padro j feitos, sabemos que:

Verifica-se uma grande variao, ou seja, uma alta disperso dos dados, e assim
a mdia no seria uma boa representante para este conjunto de dados.
Exerccio: Calcule as medidas de disperso para um grupo de indivduos que
tm as seguintes idades: 18, 19, 20, 21, 21, 22, 24, 24, 25, 27, 30, 33 e verifique se
a mdia uma medida que representa bem este conjunto de dados.
R: 15; 20,43; 4,52; 19,07%
Observe que para dados agrupados, h uma pequena diferena nas frmulas de varincia da populao e amostra:
Populao
Amostra

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

entre 20% e 35%: um razovel representante da mdia, pois existe uma


razovel disperso dos dados em torno da mdia;

76 - 77

Em que cada xi o ponto mdio de cada classe estudada e Fi a frequncia respectiva a cada classe, sendo e x as mdias populacional e amostral,
respectivamente.
Observe que a nica diferena que com dados agrupados, os desvios ao
quadrado devem ser multiplicados por suas respectivas frequncias.
Exemplo:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Classes

Fi

Fr

Fac

xi

2 |---- 16

0,545

54,5

54,5

16 |---- 30

0,273

27,3

81,8

23

30 |----| 44

0,182

18,2

100

37

Total

11

100

Tabela 16: Distribuio de frequncias para a quantidade de imveis visitados por clientes de uma
imobiliria para efetuar uma compra
Fonte: Dados hipotticos

A mdia ponderada j calculada anteriormente x = 17,91 imveis visitados.


Logo:

S2 = 128,29 imveis visitados2

Desvio Padro
Para calcular o desvio padro, o procedimento continua sendo o mesmo, ou
seja, basta extrairmos a raiz quadrada da varincia. Assim, observe as frmulas:

Populao
Amostra

Medidas de Disperso

III

De forma mais simplificada...




Exemplo: Considerando a situao exposta acima, em que a varincia foi
igual a s2 = 128,29, o desvio padro ser:
imveis visitados
E consequentemente o Coeficiente de variao ser:

Classes

Fi

Fr

Fac

xi

17 |---- 29

0,364

36,4

36,4

23

29 |---- 41

0,364

36,4

72,8

35

41 |----| 53

0,273

27,3

100

47

Total

11

100

Tabela 17: Distribuio de frequncias para a idade dos clientes de uma loja em Maring
Fonte: Dados hipotticos

R: 149,49; 12,23; 38,11%

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Exerccio: Calcule as medidas de disperso para dados agrupados considerando


a tabela abaixo:

78 - 79

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Consideraes Finais
Nas pesquisas, aps a coleta e organizao dos dados, convm verificar o que
ocorre com os mesmos. Nos dados quantitativos, a principal forma de anlise
calcular as medidas de posio e disperso. Essas medidas do uma indicativa
de representao e variao dos dados e por meio delas que saberemos o que
de fato ocorreu com a pesquisa.
Nesta unidade voc aprendeu a calcular as principais medidas de Posio e
Disperso, alm das medidas Separatrizes.
As principais medidas de posio dentro da estatstica so mdia aritmtica, moda, mediana e separatrizes. Pelo menos uma dessas medidas sempre deve
estar presente na descrio das informaes coletadas. J as principais medidas
de disperso so varincia, desvio padro e coeficiente de variao.
De todas essas medidas vistas, as mais utilizadas nas pesquisas so a mdia
e o desvio padro. Essas so representativas da populao e da amostra tambm.
As medidas representaro sempre os dados, portanto, fundamental que
saibamos qual ou quais as medidas mais adequadas para o tipo de informao
que temos em mos.

Consideraes Finais

1. Das medidas de posio vistas na unidade, explique:


a. qual a mais utilizada e por qu;
b. quais os problemas que a mdia pode ter em sua utilizao como medida
representativa de um conjunto de dados.
2. Considere os seguintes dimetros (mm) de eixos produzidos em certa fbrica de
autopeas:
93

94

96

100

96

102

89

87

105

Demonstre:
a) a mdia aritmtica, a moda e a mediana;
b) a varincia, o desvio padro;
c) o coeficiente de variao (interprete);
d) o 3 quartil e o 6 decil.
3. Considere a seguinte tabela de distribuio de frequncias com os tempos (em
dias) que um corretor demora a concluir um negcio, observado em 40 operaes:
Tempo (dias)

Fi

Fac

xi

0 2,5

1,25

2,5 5,0

3,75

5,0 7,5

25

30

6,25

7,5 10,0

10

40

8,75

total

40

Demonstre:
a) a mdia aritmtica, a moda e a mediana;
b) a varincia, o desvio padro;
c) o coeficiente de variao (interprete);
d) o 3 quartil e o 4 percentil.

80 - 81

Material Complementar

MEDIDAS RESUMO
Estatstica Bsica

BUSSAB, W. O. ; MORETTIN, P. A.
Editora: Saraiva

Material Complementar

PROBABILIDADES

UNIDADE

Professora Me. Ivnna Gurniski Carniel

IV

Objetivos de Aprendizagem
Entender os conceitos relacionados a probabilidades.
Saber aplicar as probabilidades nas diversas situaes.
Compreender probabilidade condicional.
Conhecer as principais distribuies de probabilidades.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Regras Bsicas de Probabilidade
Operaes com Eventos
Probabilidade Condicional
Distribuio de Probabilidadel

84 - 85

Probabilidade deriva do Latim probare (provar ou testar), e designa eventos


incertos, ou mesmo sorte, risco, azar, incerteza ou duvidoso.
A Probabilidade como ramo da matemtica data de mais de 300 anos e se
aplicava a jogos de azar, em que jogadores que tinham mais conhecimento sobre
suas teorias planejavam estratgias para levar vantagem nos jogos. Hoje, essa
prtica ainda utilizada, porm, tambm passou a ser empregada por governos,
empresas e organizaes profissionais nas suas tomadas de decises ou ainda na
escolha de produtos, sendo teis tambm para o desenvolvimento de estratgias.
As decises nos negcios so frequentemente baseadas na anlise de incertezas, tais como: chances de um investimento ser lucrativo, chances das vendas
decrescerem se o preo for aumentado, probabilidade de projetos terminarem no
prazo etc. As probabilidades medem o grau de incerteza, assim, no podemos antecipar o evento, mas lidar com as chances maiores ou menores do mesmo ocorrer.
Nesta unidade, sero apresentados conceitos bsicos de probabilidade, como
a probabilidade pode ser interpretada e como suas regras podem ser utilizadas
para calcular as possibilidades de ocorrncia de eventos futuros.

Probabilidades

SHUTTERSTOCK

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Introduo

As probabilidades so utilizadas para delinear


a chance de ocorrncia de determinado evento.
Seus valores so sempre atribudos numa escala
de 0 a 1. A probabilidade prxima de 1 indica um
evento quase certo, enquanto que a probabilidade
prxima de zero indica um evento improvvel
de acontecer.

Introduo

IV

Face

Frequncia

1/6

1/6

1/6

1/6

1/6

1/6

Se o experimento aleatrio for o lanamento de uma moeda. Sabendo que s


podem ocorrer duas situaes ao lanamento da mesma: cara ou coroa, o modelo
probabilstico para esta situao seria:
Face

Cara

Coroa

Frequncia

1/2

1/2

Se um grupo for composto por 20 homens e 30 mulheres e um deles for sorteado ao acaso para ganhar um determinado prmio, o modelo probabilstico ser:
Face

Homem

Mulher

Frequncia

20/50

30/50

Verificamos que em todos os exemplos mostrados, precisamos ter um modelo


probabilstico, sendo que o mesmo envolve:
Espao amostral
Quando especificamos todos os resultados experimentais possveis, identificamos o espao amostral () de um experimento:

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Ao discutirmos probabilidade, definimos experimentos como qualquer ao


ou processo que gera resultados bem definidos. Os experimentos aleatrios so
aqueles que repetidos vrias vezes apresentam resultados imprevisveis. Ao descrever um experimento aleatrio, deve-se sempre especificar o que dever ser
observado.
Exemplos:
Queremos estudar a ocorrncia das faces de um dado. Esse seria o experimento
aleatrio. A partir do conhecimento de que o dado tem 6 faces, sendo o dado
equilibrado, de modo a no favorecer nenhuma das faces, podemos construir o
modelo probabilstico da seguinte maneira:

86 - 87

= {1, 2,.... n}, sendo que cada elemento de chamado de um ponto


amostral.
Exemplos:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Em um experimento o lanamento de uma moeda. Os possveis resultados so cara ou coroa, ento, ={cara, coroa}. Com N = 2 possveis
resultados.
Em dois lanamentos de uma moeda, sendo interessante observar a ordem
dos resultados, os possveis resultados so: cara e cara; cara e coroa; coroa
e cara; coroa e coroa. O espao amostral :
= {(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. Com N igual a 4 possveis resultados.
Eventos
Chamamos de evento um subconjunto do espao amostral de um experimento
aleatrio. O evento dito simples se consistir em um nico resultado, ou composto se consistir em mais de um resultado.
Exemplo:
No lanamento de uma moeda = {cara, coroa}. Um evento de interesse A
pode ser obter cara no lanamento de uma moeda e ento A = {cara} e o n para
este evento ser 1, sendo n o nmero de resultados para o evento.
No lanamento de um dado, o evento de interesse A pode ser obter face par
e ento A ser igual a:
A = { 2; 4, 6 } e n = 3.
Probabilidade de um evento
Podemos fazer clculos de probabilidades utilizando trs formas distintas:
Mtodo clssico quanto o espao amostral tem resultados equiprovveis.
Mtodo emprico baseado na frequncia relativa de um grande nmero
de experimentos repetidos.
Mtodo subjetivo se baseia em estimativas pessoais de probabilidade
com certo grau de crena.
Utilizaremos aqui o mtodo clssico.
Probabilidades

IV

Considerando um experimento aleatrio em que se queira um determinado


evento A, a probabilidade deste evento ocorrer dada por P(A).
Assim: a probabilidade de A ocorrer ser dada por:
, para qualquer evento discreto. Ou seja,

ou em porcentagem 0,33 x 100 = 33%


Regras Bsicas
Tendo um modelo probabilstico e conhecendo suas frequncias relativas, podemos estabelecer no clculo das probabilidades algumas regras:
A probabilidade dever ser um valor que varie entre 0 e 1, sendo representado por
0 < P(A) < 1
Um evento impossvel um conjunto vazio () e atribui-se probabilidade
0, enquanto que um evento certo tem probabilidade 1, assim:
P() = 1 P()= 0
A soma das probabilidades para todos os resultados experimentais tem
de ser igual a 1.

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Exemplo:
No lanamento de um dado, construir o espao amostral e calcular a probabilidade de sair face mpar (evento A) e sair as face 2 e 5 (evento B).
= { 1, 2, 3, 4, 5, 6 } N = 6
A = { 1, 3, 5, } n(A) = 3
B = { 2, 5 } n(B) = 2
Assim:
ou em porcentagem 0,5 x 100 = 50%

88 - 89

Operaes com Eventos


Nos clculos de probabilidades, algumas vezes, o interesse do pesquisador est
na determinao da probabilidade de combinao dos eventos relacionados ao
experimento aleatrio. Podemos ter dois tipos de combinaes dados dois eventos A e B:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

O evento interseo de A e B, denotado AkB, o evento em que A e B


ocorrem simultaneamente.
O evento reunio de A e B, denotado A j B, o evento em que A ocorre
ou B ocorre (ou ambos).
O evento complementar de A, denotado Ac, o evento em que A no
ocorre.
Assim :
A probabilidade de um ou outro evento ocorrer dada por P(Aj B).
A probabilidade de ambos os eventos ocorrerem simultaneamente
P(AkB).
Exemplo: Duas cidades so questionadas sobre o servio de esgoto sanitrio.
Perguntas possveis seriam: Qual a probabilidade de ambas terem o servio de
esgoto sanitrio? Qual a probabilidade de uma ou outra cidade ter o servio de
esgoto sanitrio?
Ambas - implica em P(A e B).
Uma ou outra - implica em P(A ou B).
Regra da adio
Essa regra leva em considerao a ocorrncia do evento A ou a ocorrncia do
evento B ou ainda de ambos os eventos. denotada matematicamente por
P(Aj B) e dizemos unio de A e B que a probabilidade de ocorrncia de pelo
menos um dos dois eventos.
No clculo dessa probabilidade surgem duas situaes:
A primeira quando os eventos A e B so mutuamente excludentes (no tm
elementos em comum). Nesta situao a frmula dada por:
P(AjB) = P(A) + P(B)
Probabilidades

IV

A segunda quando os eventos A e B no so mutuamente excludentes (tm


elementos em comum). Nesta situao a frmula dada por:
P(A j B) = P(A) + P(B) - P(A k B), em que:
P(A k B) a probabilidade de A e B ocorrerem simultaneamente; a interseco entre os eventos A e B.

O clculo da probabilidade usando o complemento feito por meio da relao:


P(AC) = 1 - P(A) para todo evento A
Exemplo:
= {1,2,3,4,5,6}
Eventos A = {2, 4, 6}, B = {4, 5, 6} e C = {1, 3, 5}
A k B = {2, 4, 6} k {4, 5, 6} = {4, 6}

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Complemento de um evento
Dado um evento A, o complemento de A (Ac) um evento que consiste de todos
os pontos amostrais que no esto em A. O diagrama abaixo ilustra o conceito.
A rea retangular representa o espao amostral; o crculo representa o evento A
e a regio com preenchimento, os pontos do complemento de A.

90 - 91

A k C = {2, 4, 6} k {1, 3, 5} =
Aj B = {2, 4, 5, 6}
Ac = {1, 3, 5} = C
Exerccios:
1. Demonstre o espao amostral no lanamento de um dado.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

2. Considere o experimento aleatrio do lanamento de dois dados e:


a) Encontre .
b) Demonstre o n(A) e P(A) nos casos abaixo.
A1: apaream faces iguais.
A2: a segunda face o dobro da primeira.
A3: apaream somente nmeros mpares.
A4: apaream faces iguais ou a segunda face o quadrado da primeira.
A5: a soma das faces igual a 7.
3. Um consultor est estudando dois diferentes tipos de imveis quanto a
quantidades disponveis venda, por regio, em uma determinada cidade.
Os dados so mostrados abaixo:
Regio

Tipo de Imvel

Total

Apartamento

Casa

Norte

30

28

58

Sul

40

56

96

Leste

38

34

72

Oeste

52

22

74

Total

160

140

300

Fonte: Dados hipotticos

Indique Norte por N; Sul por S; Leste por L; Oeste por O; Apartamento por A
e Casa por C.
Calcule as seguintes probabilidades:
P(N) =
P(S) =
Probabilidades

IV

P(L) =
P(O) =
P(A) =
P(C) =
P(N k A) =
P(S k C) =

P(O k C) =
P(N j A) =
P(S j C) =
P(L j A) =
P(O j C) =
R:
1. = {1, 2, 3, 4, 5, 6}
2. a) = {(1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3)
(5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)}
b) A1 = {(1,1) (2,2) (3,3) (4,4) (5,5) (6,6)}
P(A1) = 6/36 = 0,17

A2 = {(1,2) (2,4) (3,6)}

P(A2) = 3/36 = 0,08
A3 = {(1,1) (1,3) (1,5) (3,1) (3,3) (3,5) (5,1) (5,3) (5,5)}

P(A3) = 9/36 = 0,25

A4 = {(1,1) (2,2) (2,4) (3,3) (4,4) (5,5) (6,6)}

P(A4) = 7/36 = 0,19

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

P(L k A) =

92 - 93

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.


A5 = {(1,6) (2,5) (3,4) (4,3) (5,2) (6,1)}

P(A5) = 6/36 = 0,17
3. 0,193; 0,32; 0,24; 0,257; 0,533; 0,467; 0,1; 0,187; 0,127; 0,073; 0,627; 0,6;
0,647; 0,64
Probabilidade condicional
Frequentemente, a probabilidade de um evento influenciada pela ocorrncia de
um evento paralelo. Seja A um evento com probabilidade P(A). Se obtivermos a
informao extra que o evento B ocorreu paralelamente, iremos tirar vantagem
dela no clculo de uma nova probabilidade para o evento A. Esta ser escrita
como P(A | B) e lida como probabilidade de A dado B.
Neste caso, podemos utilizar esta informao extra para realocar probabilidades aos outros eventos. Vamos utilizar o exemplo da tabela do exerccio
anterior nmero 3.
Regio

Tipo de Imvel

Total

Apartamento

Casa

Norte

30

28

58

Sul

40

56

96

Leste

38

34

72

Oeste

52

22

74

Total

160

140

300

Se soubermos que o imvel um Apartamento, qual a chance de ser da regio


Norte? Reformulando a pergunta, poderamos ter o interesse de saber: dado que
o imvel um Apartamento, qual a probabilidade de pertencer regio Norte?
Observe que estamos impondo uma condio ao evento. Sabemos que o imvel
um apartamento, essa a condio imposta. Quando impomos alguma condio em probabilidade, dizemos ento que a probabilidade condicional e assim,
reduzimos ento o espao amostra condio imposta.

Probabilidades

IV

Assim, escrevemos:
P(N | A) e l-se probabilidade de N dado A, sendo a condio A, ou seja,
ser Apartamento, sendo que:

Caso a condio seja A:

Para o exemplo acima mencionado, se N e A indicam, respectivamente, Norte


para regio e Apartamento para tipo, ento:
como mostrado acima.

Observe que se trocarmos a condio para ser do tipo A, dado que a regio Norte,
a condio agora ser da regio Norte e o problema ficaria da seguinte maneira:

Exerccios:
Baseado na tabela acima, calcular as seguintes probabilidades:
P(S | C) =
P(C | S) =
P (L | A) =
P(A | L) =
P(O | C) =

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

De forma geral, para dois eventos quaisquer A e B, sendo P(B) > 0, definimos
a probabilidade condicional de A | B como sendo P(A | B) dado pela seguinte
frmula:

94 - 95

P(C | O) =
R: 0,4; 0,583; 0,238; 0,528; 0,157; 0,297

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Eventos independentes
Dois eventos A e B so independentes se P(A | B) = P(A) ou P(A | B) = P(B).
Caso contrrio, os eventos so dependentes.
Regra da multiplicao
A relao geral mostrada acima foi:

Desta relao obtemos a regra do produto das probabilidades, em que:


P(A k B) = P(B) . P(A | B).
Observe que a probabilidade de A e B ocorrerem conjuntamente est sob uma
condio, pois a probabilidade de A est sob a condio de B, mostrando que
h uma dependncia de uma probabilidade em relao ao evento ocorrido
anteriormente.
Em caso de A e B serem eventos no independentes, ou seja, a probabilidade de um evento no depender da ocorrncia do outro evento, nesta condio
a probabilidade de A e B ocorrer dada pela probabilidade de A vezes a probabilidade de B.
P(A k B) = P(A) . P(B)
Exemplo:
Uma urna contm duas bolas brancas e trs bolas pretas. Sorteamos duas bolas
ao acaso sem reposio. Isto quer dizer que sorteamos a primeira bola, verificamos sua cor e no a devolvemos urna. As bolas so novamente misturadas e
sorteamos ento a segunda bola. Para resolver as probabilidades nesta situao
ilustraremos as mesmas por um diagrama de rvore em que em cada galho da
rvore esto indicadas as probabilidades.

Probabilidades

IV

Probabilidades

BB

2/5 x 1/4 = 2/20

BP

2/5 x 3/4 = 6/20

PB

3/5 x 2/4 = 6/20

PP

3/5 x 2/4 = 6/20

Total

1,0

Observe que o clculo das probabilidades, na segunda retirada, ficaria condicionado aos resultados da primeira retirada. Assim, indicando B por branca e P
por preta, vejamos o clculo das probabilidades.
a) Qual a probabilidade de sair bola branca na primeira retirada?
P(B) = 2/5
b) Qual a probabilidade de sair bola branca na primeira retirada e bola preta
na segunda retirada?
P(B na 1 k P na 2 ) = 6/20
c) Qual a probabilidade de sair bola preta na segunda retirada, dado que saiu
branca na primeira retirada?
P(P na 2 | B na 1 ) = 3/4

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Resultados

96 - 97

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

d) Qual a probabilidade de sair bola branca na segunda retirada, dado que


saiu preta na primeira retirada?
P(B na 2 | P na 1 ) = 2/4
e) Qual a probabilidade de sair bola preta na segunda retirada?
P(P na 2) = 6/20 + 6/20 = 12/20
Vejamos agora o exemplo acima, porm, aps a retirada da primeira bola, a mesma
sendo devolvida urna para a retirada da segunda. Nesse caso, dizemos que a
extrao das duas bolas com reposio, o que torna as extraes independentes.

Resultados

Probabilidades

BB

2/5 x 2/5 = 4/25

BP

2/5 x 3/5 = 6/25

PB

3/5 x 2/5 = 6/25

PP

3/5 x 3/5 = 9/25

Total

1,0

Observe que os clculos das probabilidades na segunda retirada no ficariam condicionados aos resultados da primeira retirada. Assim, indicando B por branca
e P por preta, vejamos o clculo das probabilidades.
a) Qual a probabilidade de sair bola branca na primeira retirada?
P(B) = 2/5

Probabilidades

IV

Regras de Probabilidade
P(A ou B), para eventos no mutuamente
excludentes:
P(A ou B ou ambos) = P(A) + P(B)
P(A e B)
Para eventos mutuamente excludentes:
P(A ou B) = P(A) + P(B)
Para eventos independentes:
P(A e B) = P(A) . P(B)
Para eventos dependentes:
P(A e B) = P(B).P(A | B) ou P(A).P(B | A)

PROBABILIDADES

shutterstock

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

b) Qual a probabilidade de sair bola branca na primeira retirada e bola preta


na segunda retirada?
P(B na 1 k P na 2 ) = 6/25
c) Qual a probabilidade de sair bola preta na segunda retirada, dado que
saiu branca na primeira retirada?
P(P na 2 | B na 1 ) = 3/5
d) Qual a probabilidade de sair bola branca na segunda retirada, dado que
saiu preta na primeira retirada?
P(B na 2 | P na 1 ) = 2/5
e) Qual a probabilidade de sair bola preta na segunda retirada?
P(P na 2 ) = 6/25 + 9/25= 15/25 = 3/5
Observe que as probabilidades da segunda retirada no so alteradas pela extrao da primeira bola.
Assim, P(P na 2 | B na 1 ) = 3/5 = P(P na 2 )
Nesse caso, dizemos que o evento A independe do evento B e:
P(A k B) = P(A) . P(B)

98 - 99

Exerccios:
1. Uma urna contm 5 bolas pretas e 4 azuis. Em duas extraes consecutivas, sem reposio, determine os resultados esperados e calcule as
seguintes probabilidades:
a. de retirar a primeira azul e a segunda preta;
b. de retirar a primeira azul e a segunda azul;

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

c. de retirar a segunda azul, dado que a primeira foi preta.


2. Em um lote de 15 peas, sendo 5 defeituosas, retira-se uma pea e inspeciona-se. Qual a probabilidade:
a. Da pea ser defeituosa.
b. Dela no ser defeituosa.
3. Uma loja dispe de cartuchos de tintas novas e recondicionadas. Entre
30 cartuchos, sabe-se que 10 so recondicionados.
a. Se um cliente levar um cartucho, qual a probabilidade de que ele seja
recondicionado?
b. Se um cliente levar dois cartuchos, qual a probabilidade de que ambos
sejam recondicionados?
c. Se um cliente levar 4 cartuchos, qual a probabilidade de que todos sejam
recondicionados?
R: 1.
a) 0,278
b) 0,167
c) 0,5
2.
a) 0,333
b) 0,667
3.
a) 0,333
b) 0,103
c) 0,008
Regras de Probabilidade

IV

Distribuies de Probabilidade

Discreta: quando pode assumir tanto um nmero finito de valores como


uma infinita sequncia de valores, tais como 0, 1, 2, ..., n.
Contnua: quando pode assumir qualquer valor numrico em um intervalo ou associao de intervalos.
Observe o exemplo do lanamento de uma moeda duas vezes. A varivel aleatria o nmero de caras em duas jogadas. Considerando C como sair cara e
K como sair coroa, os possveis resultados so:

Resultados

Valor da varivel
aleatria
(sair cara)

PROBABILIDADES

Probabilidade do
resultado

CC

x=

CK

x=

KC

x=

KK

x=

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Os mtodos de anlise estatstica requerem sempre que sejam enfocados certos


aspectos numricos dos dados (mdia, desvio padro, ...), independentemente
do experimento originar resultados qualitativos ou quantitativos.
Um meio para descrever por valores numricos os resultados experimentais o conceito de Varivel Aleatria.
Uma varivel aleatria permite passar cada um dos resultados do experimento para uma funo numrica dos resultados. Para ilustrar, numa amostra
de componentes, ao invs de manter o registro de falhas individuais, o pesquisador pode registrar apenas quantos apresentaram falhas dentro de mil horas.
Em geral, cada resultado associado por um nmero, especificando-se uma
regra de associao.
Uma varivel aleatria pode ser classificada como discreta ou contnua,
dependendo dos valores numricos que ela assume. Uma varivel aleatria :

100 - 101

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

A distribuio de probabilidades ficar:


Valor da varivel
aleatria
(sair cara)

Probabilidade do
resultado

+ = 2/4

Total

1,0

Para cada possvel evento, associamos um nmero e em seguida montamos o


modelo probabilstico. Assim, conhecemos a distribuio de probabilidades que
essa varivel aleatria (v.a.) segue.

Distribuies Discretas de Probabilidade


Existem experimentos cujos resultados, refletidos em uma varivel aleatria,
seguem um comportamento previsvel em relao s suas probabilidades de ocorrncia e, portanto, podem ser modelados por uma equao especfica.
Dentre as principais distribuies discretas, destacam-se a Distribuio de
Bernoulli, Distribuio Binomial e Distribuio de Poisson.

Distribuio de Bernoulli
A distribuio de Bernoulli consiste em uma distribuio em que a varivel aleatria assume apenas dois possveis resultados: sucesso (o evento se realiza) ou
fracasso (o evento no se realiza).
Exemplos:
Lanamento de uma moeda: o resultado cara ou no.
Uma pea escolhida ao acaso: o resultado defeituosa ou no.
Distribuies Discretas de Probabilidade

IV

Distribuio Binomial
Um experimento Binomial aquele que consiste em uma sequncia de n ensaios
idnticos e independentes. Cada tentativa pode resultar em apenas dois resultados possveis: sucesso e fracasso, e a probabilidade de sucesso constante de
uma tentativa para outra.
Exemplos:
Lanamento de uma moeda 5 vezes e observarmos o nmero de caras.
10 peas so escolhidas ao acaso e observarmos as falhas.
5 cidades so observadas quanto ao acesso a rede de internet.

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Uma cidade tem esgotamento sanitrio: sim ou no.


Deve ficar claro que nem sempre o que bom o sucesso, mas sim o que
se est estudando o sucesso. Assim, o fato da pea ser defeituosa, por exemplo, seria o sucesso da pesquisa em si.
Em todos os casos temos que definir uma varivel aleatria X que s assuma
dois possveis valores: 1 em caso de sucesso e 0 em caso de fracasso. Seja p a probabilidade de sucesso e q a probabilidade de fracasso, com p + q = 1.
Definindo a seguinte varivel discreta X como o nmero de sucessos em
uma nica tentativa do experimento. A funo de probabilidade de Bernoulli
dada por:
P(X = x) = px . q1 x
P(0) = P(X = 0) = q = 1 p
P(1) = P(X = 1) = p
Tambm, Esperana (mdia): E(X) = p -e- Varincia: Var(X) = p(1 p) = p.q
Exemplo: Supondo que a probabilidade de venda amanh seja de 0,8.
Seja a varivel aleatria vender, temos que:
P(X = 0) = 1 0,8 = 0,2
P(X = 1) = 0,8
E(X) = 0,8
Var (X) = 0,8(1 0,8) = 0,16
Desvio padro =

102 - 103

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Designando por X: o nmero total de sucessos em n tentativas, com probabilidade p de sucesso, sendo 0 < p < 1. Os possveis valores de X so 0, 1, 2,....n e
os pares (x, p(x)), em que p(x) = P(X = x), constituem a distribuio Binomial,
de modo que :

Em que:
k = nmero de sucessos;
n = nmero de elementos da amostra;
p = probabilidade de sucesso;
q = probabilidade de fracasso.
A mdia e a varincia de uma distribuio binomial so dadas por:
E(x) = np
Var (x) = npq
Exemplos:
Um processo industrial na fabricao de monitores opera com mdia de 5%
de defeituosos. Baseado em amostras de 10 unidades, calcule as probabilidades
de uma amostra apresentar:
a) nenhum monitor com defeito:
= 0,598 ou 59,8%
P(x = 0) =

Observe que:
n = 10
k=0
p = 5% ou 0,05
q = 1 0,05 = 0,95
Distribuies Discretas de Probabilidade

IV

Aps a retirada dos dados, basta ento que joguemos esses valores na frmula.
Vejamos outro exemplo:
b) 3 monitores com defeito:
= 0,010 ou 1%
P(x = 3) =

P(x = 10) =

= 9,76 x 10-14

P(x 9) = 1,85 x 10-11 + 9,76 x 10-14 = 1,86 x 10-11 ou 0,0000000000186 ou


0,00000000186%
d) no mximo 2 monitores com defeito:
P(x 2) = P(x = 0) + P(x = 1) + P(x = 2)
= 0,598 ou 59,8%
P(x = 0) =

P(x = 1) =

= 0,315 ou 31,5%

P(x = 2) =

= 0,074

P(x 2) = 0,598 + 0,315 + 0,074 = 0,987 ou 98,7%


A mdia e a varincia de monitores defeituosos sero:
E(X) = 10 x 0,05 = 0,5
Var (X) = 10 x 0,05 x 0,95 = 0,475
Desvio padro = 0,689

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

c) pelo menos 9 monitores terem defeito:


P(x 9) = P(x = 9) + P(x =10)
= 1,85 x 10-11
P(x = 9) =

104 - 105

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Distribuio de Poisson
A distribuio de Poisson frequentemente til para estimar o nmero de ocorrncias sobre um intervalo de tempo ou de espaos especficos. A probabilidade
de uma ocorrncia a mesma para qualquer dos intervalos de igual comprimento e a ocorrncia ou no em um intervalo independente da ocorrncia ou
no em qualquer outro intervalo.
Exemplos:
Nmero de chamadas telefnicas durante 10 minutos.
Nmero de falhas de uma mquina durante um dia de operao.
Nmero de acidentes ocorridos numa semana.
Nmero de mensagens que chegam a um servidor por segundo.
Defeitos por m2 etc.
Dizemos que a varivel aleatria tem distribuio de Poisson com parmetro > 0 se:
, k = 0, 1, 2,... em que:
P (X) =
P(X) = probabilidade de X ocorrncias em um intervalo;
= nmero esperado de ocorrncias em um intervalo;
e = constante matemtica (aproximadamente 2,71828);
X = nmero de sucessos por unidade.
O valor mdio pela distribuio de Poisson dado pela sua esperana em que:
E(X) =
A varincia para a distribuio de Poisson dada por:
Var (X) = ,
sendo que representa o nmero mdio de eventos ocorrendo num intervalo
considerado.
Vale ressaltar que a Distribuio de Poisson no tem um limite superior, ou seja,
o nmero de ocorrncias x pode assumir uma infinita sequncia de valores.
Exemplos:
1. Um departamento de polcia recebe 5 solicitaes por hora em mdia relacionadas a crimes cometidos. Qual a probabilidade de receber:
a) 2 solicitaes numa hora selecionada aleatoriamente?
Distribuies Discretas de Probabilidade

IV

P (X) =

= 0,0842 ou 8,42%

b) No mximo 2 solicitaes numa hora selecionada aleatoriamente?


P (X 2) =P(x = 0)+ P(x = 1) + P(x = 2)
= 0,0068 ou 0,68%
P(x = 0) =
P(x = 0) =

=0,0842 ou 8,42%

P (X 2) = 0,0068 + 0,034 + 0,0842 = 0,125 ou 12,5%


2. Em um posto de gasolina sabe-se que em mdia 10 clientes por hora param
para colocar gasolina numa bomba. Pergunta-se:
a) Qual a probabilidade de 3 clientes pararem qualquer hora para abastecer?
P (X) =
= 0,0076 ou 0,76%
b) Qual o valor esperado, a mdia e o desvio padro para esta distribuio?
Valor mdio = E(X) = 10
Varincia = Var (x) = 10 Desvio padro =

Distribuies Contnuas de Probabilidade


As variveis aleatrias contnuas so aquelas que assumem qualquer valor numrico em um intervalo de nmeros reais. Como este tipo de varivel pode assumir
infinitos valores dentro de um intervalo e, por consequncia, infinitos valores
de probabilidade, no faz sentido tratar as variveis contnuas da mesma forma
que so tratadas as variveis discretas.
Por exemplo, supondo que quisssemos calcular a probabilidade de, num
grupo, uma pessoa ter 170 cm de altura. Observe que a varivel aleatria agora
a altura e X pode assumir qualquer valor entre 0 e infinito. Assim, se cada ponto

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

P (X) =

= 0,034 ou 3,4%

106 - 107

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

fosse uma probabilidade, iramos obter probabilidades com valores tendendo a


zero. O valor para probabilidade citada no exemplo seria 1/. Assim, para calcular a probabilidade X, usamos o artifcio de que X esteja compreendido entre
dois pontos quaisquer. Exemplo: podemos calcular a probabilidade de um indivduo medir entre 160 cm e 180 cm. Podemos fazer isso por meio da construo
de um histograma, como pode ser visto abaixo:

Com o conhecimento da rea na qual o intervalo 160 180 est compreendido


sabemos a probabilidade correspondente de um indivduo ter entre 160 cm e
180 cm. Para o clculo da rea usamos o artifcio matemtico chamado de integral. Assim, definidos dois pontos [a, b], a probabilidade da varivel estar entre
a e b dado por:
P (a # X < b) =
A funo f (x) chamada densidade de probabilidade (f.d.p) da varivel aleatria X. Assim, podemos construir modelos tericos para variveis aleatrias
contnuas, escolhendo adequadamente as funes densidade de probabilidade.
Dentre as principais distribuies contnuas, destacam-se a Distribuio
Uniforme, Distribuio Exponencial e Distribuio Normal.

Distribuies Contnuas de Probabilidade

IV

Distribuio uniforme

Sendo que:

As frmulas para o valor esperado e para a varincia so:

Distribuio Exponencial
A Distribuio Exponencial de Probabilidade uma distribuio contnua muito
til para descrever o tempo que se leva para completar uma tarefa.
A funo densidade de probabilidade que identifica uma varivel exponencial

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

A Distribuio Uniforme uma das mais simples de se conceituar. usada em


situaes em que a funo densidade de probabilidade constante dentro de um
intervalo de valores da varivel aleatria X.
Usualmente, associamos uma distribuio uniforme a uma determinada
varivel aleatria, simplesmente por falta de informao mais precisa, alm do
conhecimento do seu intervalo de valores. A figura abaixo representa a funo
dada.

108 - 109

:
f (x) = m e

- mx

= mdia

, x > 0 sendo que:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

x = tempo
A esperana e varincia de x so dadas por:

Considere o exemplo:
Em uma grande empresa de computadores, as conexes dos usurios ao sistema
tm mdia de 20 conexes por hora. Qual a probabilidade de no haver conexes em um intervalo de 0,6 minutos?
6 minutos = 0,1 hora...assim,
A esperana e a varincia x sero dadas por
E(x) = 1 = 0,05 ou 3,0 minutos
20
1
2
Var(x) = 20 = 0,0025 Desvio padro =
minutos

0, 0025 = 0,05 horas ou 3,0

Observe que a probabilidade de no haver conexo no intervalo de 6 minutos


0,136 independente do tempo inicial do intervalo, pois o processo supe que
os eventos ocorram uniformemente por meio do intervalo de observao, no
ocorrendo agrupamentos de eventos. Assim, a probabilidade de ocorrncia da
primeira ligao aps 12:00 ser depois de 11:06 a mesma probabilidade de
conexo depois das 12:00 ocorrer aps 12:06.

Enquanto a Distribuio Discreta de Poisson fornece uma descrio do nmero de ocorrncias por intervalo, a Distribuio Exponencial Contnua de
probabilidade fornece uma descrio do comprimento do intervalo entre
as ocorrncias.

Distribuies Contnuas de Probabilidade

IV

Distribuio Normal de Probabilidade


A distribuio de probabilidade contnua mais importante e mais utilizada na
prtica a Distribuio Normal. A forma desta distribuio ilustrada por uma
curva em forma de sino, cujo ponto mais alto est na mdia, que tambm a
mediana e a moda da distribuio. Seu formato simtrico em relao mdia
e seus extremos se estendem ao infinito em ambas as direes e teoricamente
nunca tocam o eixo horizontal.

e = constante matemtica (aproximada por 2,71828);


= constante matemtica (aproximada por 3,14159);
= mdia aritmtica da populao;

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

O desvio-padro determina a curva, curvas mais largas e planas resultam de


valores maiores de desvio-padro, mostrando maior variabilidade dos dados.
Tambm, a rea total sob a curva para a Distribuio Normal 1.
Para simplificar a notao de uma varivel aleatria com distribuio normal, com mdia e varincia, utiliza-se:
X ~ N(, 2)
Dizemos que a varivel aleatria X tem distribuio normal com parmetros e 2 se sua densidade dada por:

110 - 111

= desvio padro da populao;


x = qualquer valor da varivel aleatria contnua onde - < X < .

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Distribuio Normal Padro


Para calcular P(a X b) quando X uma varivel aleatria normal com parmetros e , devemos calcular:

Quando uma varivel aleatria tem uma distribuio normal com mdia zero e
desvio padro 1, tem uma distribuio normal padro de probabilidade.
Nenhuma das tcnicas de integrao padro pode ser usada para calcular a
integral acima. Assim, quando = 0 e = 1, esta expresso foi calculada e tabulada para valores determinados de a e b. Nesta tabela se entra com a varivel
reduzida ou varivel padronizada Z e se encontra f(Z) ou vice-versa.

A partir dessas integrais obtidas numericamente e utilizando a curva normal


padronizada, podemos obter as probabilidades por meio de tabelas prontas que
mostram a rea sob a curva normal correspondente. A tabela para utilizao das
probabilidades mostrada a seguir:

Distribuies Contnuas de Probabilidade

IV

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0

0.0000

0.0040

0.0080

0.0120

0.0160

0.0199

0.0239

0.0279

0.0319

0.0359

0.1

0.0398

0.0438

0.0478

0.0517

0.0557

0.0596

0.0636

0.0675

0.0714

0.0753

0.2

0.0793

0.0832

0.0871

0.0910

0.0948

0.0987

0.1026

0.1064

0.1103

0.1141

0.3

0.1179

0.1217

0.1255

0.1293

0.1331

0.1368

0.1406

0.1443

0.1480

0.1517

0.4

0.1554

0.1591

0.1628

0.1664

0.1700

0.1736

0.1772

0.1808

0.1844

0.1879

0.5

0.1915

0.1950

0.1985

0.2019

0.2054

0.2088

0.2123

0.2157

0.2190

0.2224

0.6

0.2257

0.2291

0.2324

0.2357

0.2389

0.2422

0.2454

0.2486

0.2517

0.2549

0.7

0.2580

0.2611

0.2642

0.2673

0.2704

0.2734

0.2764

0.2794

0.2823

0.2852

0.8

0.2881

0.2910

0.2939

0.2967

0.2995

0.3023

0.3051

0.3078

0.3106

0.3133

0.9

0.3159

0.3186

0.3212

0.3238

0.3264

0.3289

0.3315

0.3340

0.3365

0.3389

1.0

0.3413

0.3438

0.3461

0.3485

0.3508

0.3531

0.3554

0.3577

0.3599

0.3621

1.1

0.3643

0.3665

0.3686

0.3708

0.3729

0.3749

0.3770

0.3790

0.3810

0.3830

1.2

0.3849

0.3869

0.3888

0.3907

0.3925

0.3944

0.3962

0.3980

0.3997

0.4015

1.3

0.4032

0.4049

0.4066

0.4082

0.4099

0.4115

0.4131

0.4147

0.4162

0.4177

1.4

0.4192

0.4207

0.4222

0.4236

0.4251

0.4265

0.4279

0.4292

0.4306

0.4319

1.5

0.4332

0.4345

0.4357

0.4370

0.4382

0.4394

0.4406

0.4418

0.4429

0.4441

1.6

0.4452

0.4463

0.4474

0.4484

0.4495

0.4505

0.4515

0.4525

0.4535

0.4545

1.7

0.4554

0.4564

0.4573

0.4582

0.4591

0.4599

0.4608

0.4616

0.4625

0.4633

1.8

0.4641

0.4649

0.4656

0.4664

0.4671

0.4678

0.4686

0.4693

0.4699

0.4706

1.9

0.4713

0.4719

0.4726

0.4732

0.4738

0.4744

0.4750

0.4756

0.4761

0.4767

2.0

0.4772

0.4778

0.4783

0.4788

0.4793

0.4798

0.4803

0.4808

0.4812

0.4817

2.1

0.4821

0.4826

0.4830

0.4834

0.4838

0.4842

0.4846

0.4850

0.4854

0.4857

2.2

0.4861

0.4864

0.4868

0.4871

0.4875

0.4878

0.4881

0.4884

0.4887

0.4890

2.3

0.4893

0.4896

0.4898

0.4901

0.4904

0.4906

0.4909

0.4911

0.4913

0.4916

2.4

0.4918

0.4920

0.4922

0.4925

0.4927

0.4929

0.4931

0.4932

0.4934

0.4936

2.5

0.4938

0.4940

0.4941

0.4943

0.4945

0.4946

0.4948

0.4949

0.4951

0.4952

2.6

0.4953

0.4955

0.4956

0.4957

0.4959

0.4960

0.4961

0.4962

0.4963

0.4964

2.7

0.4965

0.4966

0.4967

0.4968

0.4969

0.4970

0.4971

0.4972

0.4973

0.4974

2.8

0.4974

0.4975

0.4976

0.4977

0.4977

0.4978

0.4979

0.4979

0.4980

0.4981

2.9

0.4981

0.4982

0.4982

0.4983

0.4984

0.4984

0.4985

0.4985

0.4986

0.4986

3.0

0.4987

0.4987

0.4987

0.4988

0.4988

0.4989

0.4989

0.4989

0.4990

0.4990

Vale ressaltar que tabelas com diferentes integrais calculadas podem ser encontradas. A tabela acima fornece sempre a seguinte rea sob a curva.

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

0.00

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

112 - 113

A tabela anterior retorna a probabilidade de ocorrncia de um evento entre 0 e z.


Na margem esquerda h o valor de z com uma decimal e, se for necessrio considerar a segunda decimal, deve-se procur-la na margem superior.
Exemplos:
Para calcular a probabilidade de z entre 0 e 1, procuramos na margem
esquerda a linha que tem z = 1,0 e a coluna 0,00, e encontramos o valor
0,3413. Isto significa que a probabilidade de encontrar um valor de x entre
a mdia zero e z = 1,0 0,3413, ou 34,13%.
Por outro lado, para se obter a probabilidade de z maior que 1, calculamos a probabilidade de z entre 0 e 1, que 0,3413, e a seguir fazemos 0,5
- 0,3413 = 0,1587, ou 15,87%.
Para se obter a probabilidade de z entre 0 e 1,87, procuramos a clula cuja
linha 1,8 e coluna 0,07. O resultado o valor 0,4693 ou 46,93%.
Valores procurados abaixo da mdia, ou seja, abaixo de 0, iro aparecer
como negativos, porm observe que na tabela no h valores negativos.
Como a curva simtrica, valores negativos so equivalentes aos valores positivos, ou seja, a rea procurada a mesma equivalente aos valores
positivos.
Para utilizar a tabela, as variveis aleatrias x precisam ser padronizadas. A frmula usada para esta converso :

Distribuies Contnuas de Probabilidade

IV

De tomarmos um lote ao acaso e este ter uma taxa de falhas entre 2,0 e 2,5
Traduzindo para linguagem probabilstica, queremos:
P(2,0 < x < 2,5) = ?
Primeiramente, vamos padronizar os dados.
Lembre-se que a frmula da padronizao :
e que
= 2,0
= 0,5
Assim:

Novamente traduzimos para a linguagem probabilstica, mas agora usando


os dados padronizados:
P(2,0 < x < 2,5) = P(0 < z < 1) = 0,3413 ou 34,13%
Queremos uma rea que esteja entre 0 e 1 desvios padro.
Essa rea exatamente o que a tabela nos d. Basta olhar, como explicado
acima, o valor da linha 1,0 e na linha 0,0 e obtemos o valor 0,3413.
Assim, dizemos que a chance de tomarmos um lote que tenha uma taxa de
falhas de dados entre 2,0 e 2,5 de 34,13%.
Vamos ver outra probabilidade:

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

xi = ponto que se deseja converter em z;


= mdia da normal original;
= desvio padro da normal original.
Vejamos o exemplo:
Suponha que a mdia da taxa de falhas de dados transmitida em lotes.
Sabe-se que essa caracterstica segue uma distribuio normal com mdia de 2,0
e desvio padro igual a 0,5. Calcule as seguintes probabilidades:

114 - 115

De tomarmos um lote ao acaso e ter menos que uma taxa de falhas de 2,5.
P(x < 2,5) = P(z < 1) = 0,5 0,3413 = 0,1587 ou 15,87%
De tomarmos um lote ao acaso e ter mais que uma taxa de falhas de 2,5.
P(x > 2,5) = P(z > 1) = 0,5 + 0,3413 = 0,8413 ou 84,13%
De tomarmos um lote ao acaso e ter uma taxa de falhas entre 1,25 e 2,0
falhas.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

P(1,25 < x < 2,0) = P(-1,5<z<0) = 0,4332 ou 43,32%


Observe que a rea desejada est entre a mdia (0) e 1,5 desvios abaixo da mdia.
Olhamos no 1,5 na linha e no 0 na coluna, que me dar a rea entre 0 e 1,5 equivalente rea entre 1,5 e 0.
De tomarmos um lote ao acaso e este ter uma taxa de falhas entre 1,25 e 2,5.
P(1,25 < x < 2,5) = P(-1,5 < z < 1) = 0,4332 + 0,3413 = 0,7745
Observe que quando olhamos no valor 1,5 na tabela, estamos tomando a rea
entre 0 e 1,5; quando olhamos no 1 na tabela, estamos tomando a rea entre 0 e
1. Se somarmos as duas reas, ento temos a rea compreendida entre 1,5 e 1,0,
que condizente com os valores de lotes com falhas entre 1,25 e 2,5.

Consideraes Finais
Vimos nesta unidade a importncia das probabilidades no nosso cotidiano.
A teoria das probabilidades tenta quantificar a noo de provvel, sendo
uma ferramenta estatstica de grande utilidade quando se trabalha com inmeros eventos relacionados a pesquisas em empresas, rgos governamentais
e instituies de ensino. Essa ferramenta lida com as chances de ocorrncias de
algo que vai acontecer, ento dizemos que ela lida com fenmenos aleatrios.
Portanto, necessrio conhecer o material de estudo para poder calcular essas
chances ou probabilidades de maneira correta e ento tomarmos nossas decises com base em nossas estimativas.
Consideraes Finais

IV

PROBABILIDADES

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Um efeito importante da teoria da probabilidade no cotidiano est na avaliao


de riscos. Normalmente, governos, por exemplo, utilizam processos envolvidos
em probabilidades para suas tomadas de decises. Uma aplicao importante
das probabilidades a questo da confiabilidade como, por exemplo, no lanamento de algum produto, nas chances dos mesmos falharem.
Para inferir sobre probabilidades, necessrio saber que tipo de varivel
aleatria est sendo trabalhado. Cada varivel aleatria possui um tipo de comportamento chamado de distribuio de probabilidades. Isso importante, pois
cada distribuio de probabilidade possui algumas caractersticas e as mesmas
devem ser respeitadas para que se possa chegar a resultados precisos e ento concluses vlidas possam ser tomadas sobre aquilo que estamos estudando. Vimos
nesta unidade os conceitos bsicos de probabilidade, a forma clssica de calcul-la e tambm vimos as principais distribuies de probabilidades utilizadas.
Deve-se entender que razovel pensar ser de extrema importncia compreender como estimativas de chance e probabilidades so feitas e como elas
contribuem para reputaes e decises em nossa sociedade.

116 - 117

1. Explique espao amostral e eventos.


2. Uma mquina de fabricao de computadores tem probabilidade de produzir
um item defeituoso de 10%. Em uma amostra de 6 itens, calcule a probabilidade
de:
a) haver no mximo um item defeituoso;
b) haver 3 itens defeituosos;
c) no haver itens defeituosos; e
d) determine a mdia e a varincia do experimento.
3. A qualidade de CDs foi avaliada sobre a resistncia a arranhes e adequao de
trilhas. Os resultados foram:
Resistncia a
arranhes

Adequao de trilhas

Aprovado

Total

Reprovado

Alta

700

140

840

Baixa

100

60

160

Total

800

200

1000

Fonte: Adaptado de Barbetta et al. (2010)

Se um CD for selecionado aleatoriamente deste lote, qual a probabilidade de:


a. ter resistncia alta a arranhes;
b. ter resistncia baixa a arranhes;
c. ser aprovado na avaliao das trilhas;
d. ser reprovado na avaliao das trilhas;
e. ter resistncia alta ou ser aprovado;
f. ter resistncia baixa ou ser reprovado;
g. ter resistncia alta dado que seja reprovado;
h. ter resistncia baixa dado que seja aprovado.
4. Um sistema de banco de dados recebe em mdia 80 requisies por minuto,
segundo uma distribuio de Poisson. Qual a probabilidade de que no prximo
minuto ocorram 100 requisies? Determine a mdia e a varincia para essa varivel aleatria.

5. Uma empresa de computao observou as falhas obtidas na


produo das mquinas e verificou que, em mdia, ocorrem 5
por ano e que o tempo entre falhas segue distribuio exponencial. Pergunta-se:
a. Qual a probabilidade do equipamento falhar no prximo ano?
b. Qual o valor mdio esperado de falhas?
c. Qual a varincia e desvio padro para falhas?
6. A distribuio da durao de monitores pode ser aproximada
por uma distribuio normal de mdia = 6 anos e desvio padro = 2 anos. Determine a probabilidade de um monitor durar:
a. entre 6 e 9 anos;
b. acima de 9 anos;
c. entre 4 e 9 anos;
d. acima de 4 anos.

118 - 119

CORRELAO LINEAR E
REGRESSO

UNIDADE

Professora Me. Ivnna Gurniski Carniel

Objetivos de Aprendizagem
Conhecer o coeficiente de correlao linear.
Entender associao entre duas variveis.
Saber interpretar correlao positiva e negativa.
Compreender a correlao e aplicao da correlao de Pearson.
Conhecer a utilizao da regresso linear.
Entender a predio de uma varivel por meio de outra.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Coeficiente de Correlao (r)
Aspectos Gerais da Correlao Linear
Correlao de Pearson
Anlise de Regresso
Regresso Linear Simples

SHUTTERSTOCK

120 - 121

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Introduo
A estatstica apresenta muitas ferramentas para descrever e analisar dados de
pesquisas. A escolha das ferramentas a serem utilizadas na pesquisa depende
dos objetivos da mesma, bem como do tipo de varivel com a qual se trabalha.
Como visto na unidade I, as variveis podem ser qualitativas e quantitativas.
Esta distino importante, uma vez que as ferramentas utilizadas para um tipo
de varivel nem sempre podem ser utilizadas para o outro tipo. importante tambm saber que nas pesquisas se utiliza no s uma, mas um grupo de variveis.
Em alguns casos, algumas variveis podem estar relacionadas de alguma
forma e a variao de uma vai depender da variao da outra.
As decises gerenciais geralmente so baseadas nas relaes entre duas ou
mais variveis. Por exemplo, aps considerar a relao entre gastos com publicidade e vendas, um gerente poderia tentar prever as vendas de acordo com o
nvel de gastos com a publicidade.
O fato de duas variveis estarem ligadas permite tomar decises se baseando
em uma varivel, porm esperando resposta em outra que seja de difcil mensurao ou s possa ser medida tardiamente.
Existem algumas medidas estatsticas que permitem medir o grau de associao entre duas variveis. Nesta unidade, iremos ver duas delas: a correlao linear
e a regresso linear. Entretanto, essas duas ferramentas s podem ser utilizadas
quando as variveis medidas so quantitativas. Assim, nesta unidade, voc estar
vendo como podemos verificar a associao entre variveis ou a dependncia de
uma varivel em funo da outra, e tambm como quantificar esta associao.

Introduo

Correlao Linear

Coeficiente de Correlao Linear de Pearson


O coeficiente de correlao uma medida que dimensiona a correlao. representado pela letra r e dado pela seguinte frmula:

O valor de r no depende de qual das duas variveis em estudo chamada de


xe de y e independe das unidades com as quais as variveis so medidas.
A intensidade do coeficiente de correlao pode variar entre -1 e 1, sendo
que quanto mais prximo de -1 ou de 1, mais forte ser a associao entre as duas
variveis, e quanto mais prximo de 0, mais fraca ser a associao. Quando r =
1, todos os pares (x, y) estaro alinhados em linha reta com coeficiente angular
positivo e quando r = -1, todos os pares (x, y) estaro alinhados com o coeficiente angular negativo.

CORRELAO LINEAR E REGRESSO

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Em diversas situaes, o objetivo apenas estudar o comportamento conjunto


de duas variveis e verificar se elas esto relacionadas, ou seja, saber se as alteraes sofridas por uma das variveis so acompanhadas por alteraes nas outras.
Em estatstica, o termo correlao usado para indicar a fora que mantm
unidos dois conjuntos de valores. O estudo da correlao tem como objetivo
estudar a existncia ou no e seu grau de relao entre as variveis.
Uma medida do grau da correlao e sua direo dada pela covarincia
entre duas variveis aleatrias, mas mais conveniente medir o grau da correlao por meio do Coeficiente de Correlao Linear de Pearson.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

122 - 123

Quanto ao direcionamento entre as duas variveis, o coeficiente de correlao


pode ser positivo ou negativo. Se a correlao entre duas variveis for positiva,
dizemos que as duas variveis variam para o mesmo sentido.
Exemplo: se sabemos que a correlao entre renda familiar e gastos com alimentao positiva, podemos dizer que medida que a renda familiar aumenta,
tambm aumentam os gastos com alimentao, ou medida que a renda familiar
diminui, tambm diminuem os gastos com alimentao. Entretanto, se dizemos
que o conhecimento e tempo gasto para aprender a operar uma mquina tm
uma correlao negativa, ento podemos pensar que medida que o conhecimento aumenta, o tempo gasto para aprender a operar uma mquina diminui
ou vice-versa.
Se o coeficiente de correlao for igual a 0, dizemos que no existe associao linear entre as duas variveis.
Outra forma de representao das correlaes por meio do diagrama de
disperso, mostrando a variao conjunta entre as duas variveis. Observe os
diagramas de disperso abaixo:

Coeficiente de Correlao Linear de Pearson

Exemplo:
Verifique se existe correlao linear entre o nmero de nascidos vivos e a
taxa de mortalidade infantil na regio de Maring-PR.
Regional de Sade e
Municpios

Total Menor de 01
ano

Nascidos Vivos *

289

Colorado

246

Floresta

68

Itamb

67

Mandaguau

251

Mandaguari

423

Marialva

378

Nova Esperana

423

Paiandu

443

So Jorge do Iva

59

Fonte: SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade

Inicialmente, interessante traar um diagrama de disperso para as duas variveis para nos dar uma ideia de como ocorre a variao conjunta dos dados.

Grfico 11: Disperso da taxa de mortalidade at 1 ano e o nmero de nascidos vivos na regio de Maring
Fonte: SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade

CORRELAO LINEAR E REGRESSO

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Astorga

124 - 125

Por meio do diagrama de disperso, podemos notar que h uma variao


crescente entre as duas variveis.
As maiores correlaes positivas e negativas so obtidas somente quando
todos os pontos esto bem prximos a uma linha reta.
O prximo passo calcular o coeficiente de correlao entre as duas variveis. Podemos utilizar uma tabela para organizar os dados:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Cidade

Nascidos Taxa de mortalidade


vivos (x)
(y)

x.y

x2

y2

Astorga

289

1734

83521

36

Colorado

246

492

60516

Floresta

68

68

4624

Itamb

67

67

4489

Mandaguau

251

1004

63001

16

Mandaguari

423

2538

178929

36

Marialva

378

1890

142884

25

Nova Esperana

423

3807

178929

81

Paiandu

443

1772

196249

16

So Jorge do
Iva

59

3481

Soma

2647

38

13372

916623

216

Agora vamos calcular o r:

Observe que o valor do coeficiente de correlao foi 0,84. Assim, podemos concluir que existe uma forte correlao ou associao entre o nmero de nascidos
vivos e a taxa de mortalidade antes de 1 ano de idade, uma vez que o valor 0,84
um valor prximo de 1. Em seguida, podemos verificar que, como mostrado
no diagrama de disperso, o valor dessa correlao positivo, ento podemos
Coeficiente de Correlao Linear de Pearson

pensar que se aumenta o nmero de nascidos vivos, tambm h um aumento


na taxa de mortalidade at 1 ano de idade.

Coeficiente de Determinao

Anlise de Regresso
A anlise de regresso uma tcnica estatstica cujo objetivo investigar e descrever a relao entre variveis por meio de um modelo matemtico. Esta relao
explorada de modo que se possa obter informaes sobre uma varivel, por
meio dos valores conhecidos das outras.
Primeiramente, preciso estudar a dependncia de uma varivel em relao outra e, assim, indicar a varivel independente para o eixo x e a varivel
dependente para o eixo y. medida que a varivel independente (ou explicativa)

CORRELAO LINEAR E REGRESSO

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

O coeficiente de determinao expressa a porcentagem de variao dos valores de Y em funo do valor X, ou seja, este coeficiente mostra at que ponto
a variao conjunta dos dados de fato linear. Esse coeficiente varia de 0 a 1,
sendo que quanto mais perto de 1, maior variao conjunta das duas variveis
e mais a varivel y poder ser explicada pela varivel x. O coeficiente de determinao dado por R2, ou seja, o smbolo do coeficiente de determinao
dado por R maisculo e dado pelo valor encontrado para a correlao linear
de Pearson ao quadrado.
Utilizando um exemplo em que r = 0,84 o coeficiente de determinao ser
dado por:
R2 = 0,842= 0,7056
Isso mostra que a variao conjunta dos dados boa, ou seja, a variao taxa
de mortalidade pode ser explicada pela variao no nmero de nascidos vivos.
Observe que os dados retirados pela estatstica se encaixam.

126 - 127

varia, provoca uma mudana na varivel dependente (ou resposta).


Aplicaes da regresso:
Estimar valores de uma varivel com base em valores conhecidos de
outra varivel.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Situaes em que as duas variveis medem aproximadamente a mesma


situao, mas uma delas relativamente dispendiosa ou difcil de lidar,
enquanto a outra no.
Explicar valores de uma varivel em termos da outra, isto , pode-se suspeitar de uma relao de causa e efeito.
Predizer valores de uma varivel para a anlise de regresso:
Resta saber como o tipo dessa relao.

[...] a correlao entre beber um copo de vinho por dia e a menor chance de
infarto do miocrdio um bom exemplo. Estudos recentes mostram que ela
no se deve ao vinho e ao lcool, mas sim ao betacaroteno, corante contido
na uva. Para infelicidade de muitos, tomar suco de uva d o mesmo resultado que beber vinho tinto.
Fonte: Jornal do Brasil, 08/01/1999 apud Cntia Paese Giacomello - Probabilidade e Estatstica (apostila).

Regresso Linear Simples


A regresso linear simples assim chamada quando duas variveis, X e Y, (numricas e contnuas), esto relacionadas linearmente. Isso quer dizer que medida
que X aumenta, Y tambm aumenta, ou medida que X aumenta, Y diminui. Essa
relao dada por uma equao que chamamos de equao de regresso linear:
y = a + bx
em que
y = valor predito da varivel resposta;
Regresso Linear Simples

O diagrama de disperso mostra o tipo de relao que existe entre x e y e tambm verifica se o modelo proposto (y = a + bx) explica bem a variao dos dados.
O modelo explicar melhor quanto mais perto dos dados ou pontos (visto no
grfico) a reta estiver.
O mtodo mais usado para ajustar uma linha reta a um conjunto de pontos
conhecido como mtodo dos mnimos quadrados que nos fornece os seguintes resultados para estimarmos a:
e

em que y e x so as mdias de y e x, respectivamente.

CORRELAO LINEAR E REGRESSO

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

a = constante de regresso que representa o intercepto entre a linha de regresso e o eixo y;


b = coeficiente linear de regresso da varivel resposta y em funo da varivel explicativa x; inclinao da reta; taxa de mudana na varivel y por unidade
de mudana na varivel x;
x = valor da varivel explicativa.
O coeficiente de regresso b fornece uma estimativa da variao esperada
de y a partir da variao de uma unidade em X (BARBETTA et al. 2010).
A partir dessa equao, possvel encontrar os valores preditos para y e a
reta de regresso. Alm disso, a relao entre x e y pode ser mostrada por um
diagrama de disperso. Vejamos o diagrama de disperso abaixo mostrando a
relao entre as variveis x e y, bem como o exemplo de uma reta de regresso.

128 - 129

Exemplo:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Regional de Sade e
Municpios

Nascidos
Vivos *

Total Menor de 01
ano

Astorga

289

Colorado

246

Floresta

68

Itamb

67

Mandaguau

251

Mandaguari

423

Marialva

378

Nova Esperana

423

Paiandu

443

So Jorge do Iva

59

Fonte: SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade

Nesse caso, a varivel x o nmero de nascidos vivos, a varivel y a taxa de mortalidade, uma vez que evidente que a taxa de mortalidade depende do nmero
de nascidos vivos. A partir dessa definio, necessria a estimao dos parmetros da equao a e b.
Cidade

Nascidos vivos
(x)

Taxa de
mortalidade (y)

x.y

x2

Astorga

289

1734

83521

Colorado

246

492

60516

Floresta

68

68

4624

Itamb

67

67

4489

Mandaguau

251

1004

63001

Mandaguari

423

2538

178929

Marialva

378

1890

142884

Nova Esperana

423

3807

178929

Paiandu

443

1772

196249

Regresso Linear Simples

So Jorge do Iva

59

3481

Soma

2647

38

13372

916623

Fonte: SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade

Assim, o valor de b e de a sero:

Nmero de nascidos
vivos (x)

a + bx

59

- 0,17 + 0,015 . 59

0,715

67

- 0,17 + 0,015 . 67

0,835

68

- 0,17 + 0,015 . 68

0,85

246

- 0,17 + 0,015 . 246

3,52

251

- 0,17 + 0,015 . 251

3,595

289

- 0,17 + 0,015 . 289

4,165

378

- 0,17 + 0,015 . 378

5,5

423

- 0,17 + 0,015 . 423

6,175

443

- 0,17 + 0,015 . 443

6,475

CORRELAO LINEAR E REGRESSO

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

a = 3,8 0,015 x 264,7 = -0,17


De acordo com o valor de b, dizemos que a cada 1 nascido vivo esperamos um
aumento (b positivo) de 0,015% na taxa de mortalidade em crianas de at 1
ano de idade.
Assim, a equao da reta de regresso dada por:
y = -0,17 + 0,015x
As equaes de regresso mostram as taxas de mortalidades preditas em
funo do nmero de nascidos vivos, como segue:

130 - 131

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Para cada nmero de nascidos vivos temos uma taxa de mortalidade prevista. A representao grfica para esta situao pode ser observada no diagrama
de disperso abaixo.

Grfico 12: Diagrama de disperso para a taxa de mortalidade prevista em funo do nmero de nascidos
vivos

Observe que para cada nmero de nascidos vivos foi construda uma equao
e obtida uma taxa de mortalidade prevista. No grfico 2 mostrada a reta que
descreve os dados e a ttulo de exemplificao, foi mostrado um ponto no grfico em que o nmero de nascidos vivos (disposto no eixo x) foi 378 e a taxa de
mortalidade (disposta no eixo y) prevista de 5,41.
Vimos que a correlao linear de Pearson mostrou um valor alto para a relao entre o nmero de nascidos vivos e a taxa de mortalidade (0,84), e que foi
verificada uma correlao populacional acima de 0. Na anlise de regresso utilizamos tambm o coeficiente de determinao para verificar a preciso da reta
de regresso e dizer se ela explica bem ou no a variao dos dados.
Como vimos:
R2 = 0,7056
A explicao para a anlise de regresso ser:
70,56% da variao observada na taxa de mortalidade explicada pela reta
de regresso. Isto mostra que a reta se aproxima bem dos pontos observados. A
reta de regresso mostra as equaes de regresso previstas e os pontos so os
valores observados.
Regresso Linear Simples

Os pontos em vermelho nos mostram as taxas de mortalidade observadas.


Observe que os pontos esto prximos da reta de regresso. Isso, associado ao
coeficiente de determinao, indica boa preciso de a reta linear explicar a variao dos dados.
A partir da equao dada acima e tambm do diagrama de disperso, podemos
fazer predies para a varivel dependente em funo da varivel independente.
Como exemplo, podemos prever a taxa de mortalidade em funo de qualquer
nmero de nascidos vivos dentro do intervalo estudado (59 a 443). Supondo
que quisssemos saber a taxa de mortalidade esperada para um nmero de 300
nascidos vivos, se substituirmos esse valor na equao de regresso estimada,
temos que:
y = -0,17 + 0,015 x 300 = 4,33% de mortalidade esperada
No entanto, essas predies devem seguir alguns critrios:
S podemos fazer predies em casos de valores dentro do intervalo trabalhado para a varivel independente.
S devemos fazer essas predies caso de fato a varivel independente
explique a variao da varivel dependente.

CORRELAO LINEAR E REGRESSO

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grfico 13: Diagrama de disperso para a taxa de mortalidade prevista e taxa de mortalidade observada em
funo do nmero de nascidos vivos

132 - 133

Exerccios:
(Retirados de: <www.inf.ufsc.br/~ogliari/arquivos/Correlacao.ppt#320,10,
Slide 10>. Acesso em: 05 fev. 2013.)
Resultado de um teste (de 0 a 100) sobre conhecimento (X) e tempo gasto
(minutos) para aprender a operar uma mquina (Y) para oito indivduos.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Indivduo

Teste (X)

Tempo (Y)

45

343

52

368

61

355

70

334

74

337

76

381

80

345

90

375

Responda:
1. Construa um diagrama de disperso entre as variveis teste e tempo.
2. Calcule os valores do coeficiente de regresso linear b e do intercepto a.
3. Demonstre os valores das equaes para o tempo esperado ou previsto
para todos os valores do teste.
4. Demonstre o diagrama de disperso para as duas variveis utilizando
os y preditos.
5. Demonstre o valor do tempo esperado quando o valor do teste for igual
a 69.
R: 2) a = 316,462 e b = 0,548

Regresso Linear Simples

A anlise de regresso tambm pode ser feita com vrias variveis independentes sobre uma nica varivel dependente. A esse tipo de anlise damos
o nome de anlise de regresso mltipla, que muito utilizada em aplicaes financeiras como renda, poupana e juros. Para ver um exemplo, ler
Barbetta et al. (2010, p. 346).

Estudar o grau de relacionamento entre duas variveis de grande importncia


dentro das anlises estatsticas. Para verificar o grau de associao entre duas
variveis, h necessidade de conhecer os mtodos estatsticos utilizados para tal
procedimento.
Vimos nesta unidade duas ferramentas importantes para estudar o grau de associao entre duas caractersticas numricas: a correlao
e a regresso. Entretanto, antes de conceituarmos correlao e regresso
estatstica, devemos saber por que us-las. De forma mais simples, na estatstica, estuda-se casos com 1 varivel. No estudo de Correlao e Regresso,
deve-se levar em conta 2 ou mais variveis. Dentre esse estudo o principal objetivo
investigar a existncia ou no de relao entres essas variveis, quantificando a
fora dessa relao por meio da correlao; ou explicitando a forma dessa relao por meio da regresso.
As correlaes podem ser positivas, quando o aumento de uma varivel corresponde ao aumento da outra; negativas quando o aumento de uma varivel
corresponde diminuio da outra; Lineares quando possvel ajustar uma reta,
que podem ser fortes (quanto mais prximas da reta) ou fracas (quanto menos
prximas da reta), e ainda no lineares, quando no possvel ajustar uma reta.
Aps estabelecida uma relao linear e uma boa correlao entre as variveis, deve-se agora determinar uma frmula matemtica para fazer predies
de uma das variveis por meio da outra, e a essa tcnica damos o nome de anlise de regresso.

CORRELAO LINEAR E REGRESSO

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Consideraes Finais

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

134 - 135

importante entender que nem sempre duas variveis esto de fato associadas. Para isso, h necessidade da avaliao do coeficiente de determinao na
anlise de regresso. tambm importante termos bom senso na hora de calcular
algumas medidas, uma vez que estamos trabalhando com frmulas matemticas
para explicar fenmenos. Assim, sempre algum valor ser extrado numericamente, porm nem sempre esses valores podem ser explicados biologicamente
ou socialmente. Portanto, cabe ao pesquisador escolher quais variveis devem
participar das anlises.
Pode-se concluir que Correlao e Regresso linear so duas ferramentas de
grande importncia e aplicabilidade, dentro de vrias reas, inclusive nas reas
ligadas a negcios e sua utilizao depende do conhecimento do pesquisador.

Consideraes Finais

1. Um estudo foi desenvolvido para verificar o quanto o comprimento de um cabo


da porta serial de microcomputadores influencia na qualidade da transmisso
de dados, medida pelo nmero de falhas em 10000 lotes de dados transmitidos
(taxa de falha) (BARBETTA et al., 2010).
Os resultados foram:
C o m p r im e n t o Taxa de
do cabo (m)
falha

2,2

2,1

3,0

2,9

10

44,1

10

4,5

11

6,2

11

5,9

12

9,8

12

8,7

13

12,5

13

13,1

14

19,3

14

17,4

15

28,2

Desenvolva os exerccios abaixo:


a. Explique quem a varivel independente (x) e a dependente (y).
b. Demonstre e interprete o valor da correlao entre o comprimento do cabo
e a taxa de falha.
c. Verifique a significncia da correlao populacional em nvel de 1% de erro.
d. Explique a significncia da correlao por meio dos intervalos.
e. Demonstre os valores de b e de a na anlise de regresso linear.

136 - 137

f. Demonstre os valores das equaes de predio (y = a + bx) para todos os


comprimentos de cabo mostrados na tabela.
g. Demonstre o diagrama de disperso entre os valores dos comprimentos dos
cabos (x) e das taxas de falhas preditas ( y ).
h. Calcule e interprete o coeficiente de determinao e de alienao.
i. Explique a diferena entre a anlise de correlao linear e de regresso linear.
2. Uma pesquisa foi realizada para verificar o efeito da rea (m2) sobre o preo de
terrenos na cidade de Mogimirim SP. Conside a equao y = 20 + 0,5x para
estimar os preos em funo da rea. Considerando terrenos com 200, 300 e 400
m2, estime o preo de cada terreno.

138 - 139

Concluso
Caro(a) aluno(a)!
Este material foi feito para contribuir com seu processo de formao. Atualmente,
as informaes chegam a ns de forma rpida e no podemos deixar de pensar o
quanto a Estatstica til para quem precisa tomar decises. O mundo passa por
transformaes econmicas, polticas e sociais que tm nos levado a adotar estratgias para elevar a qualidade dos nossos trabalhos. Essas transformaes esto ocorrendo mundialmente devido globalizao, verificando-se inovaes tecnolgicas,
fazendo com que tenhamos um mundo cada vez mais competitivo.
Nesse sentido, a estatstica aparece como suporte na compreenso dos fatos, dando
base para o seu entendimento e compreenso adequada dos mesmos. Assim, podemos dizer que importante conhecermos a estatstica, de onde ela surgiu, seus
mtodos e aplicaes no mundo atual, pois isso enriquece nosso conhecimento e
aumenta nosso poder de discusso perante o meio em que vivemos.
Este material tratou de alguns pontos importantes no ensino da Estatstica. O primeiro ponto tratou da importncia da estatstica, seus conceitos e da aplicao de
algumas de suas ferramentas. A estatstica se preocupa com dados. Em qualquer
pesquisa, seja ela de ordem observacional ou experimental, pesquisas eleitorais ou
sobre aceitao de algum produto, pesquisas comparativas, dentre tantas outras,
utilizamos a Estatstica.
Na Unidade II foram discutidas formas de apresentao dos dados estatsticos, mais
especificamente a estruturao e interpretao de grficos e tabelas. Essas duas
ferramentas estatsticas so valiosas. Basta abrirmos uma revista ou jornal para observar alguma tabela ou grfico mostrando a sntese de alguma pesquisa realizada.
Assim, de grande utilidade entender o processo de construo, bem como o de
anlise de uma figura ou de uma tabela que trazem informaes importantes sobre
pesquisas que so feitas no Brasil e no mundo.
A Unidade III tratou das medidas descritivas, mostrou como devemos calcul-las e
onde devemos aplic-las. Essas medidas representam, com um nico valor, o conjunto de dados. Vimos as principais medidas de posio, as separatrizes e as medidas de disperso. De forma geral, sempre representamos os dados por meio de
pelo menos uma medida de posio e uma de disperso, sendo as mais utilizadas a
mdia, como medida de posio representando os dados, e o desvio padro, como
medida de disperso, mostrando a variabilidade dos dados.
Na Unidade IV trabalhamos com parte da teoria das probabilidades e algumas de
suas principais distribuies. As probabilidades mostram as chances de eventos
ocorrerem. Inicialmente os clculos so simples. Entretanto, medida que vamos
nos aprofundando ao contedo percebemos que h necessidade e entendimento minucioso sobre o que est sendo mostrado para utilizar o clculo adequado e
assim obtermos as respectivas probabilidades sem erros. As probabilidades condicionais so interessantes medida que entendemos que em algumas situaes a
chance de um evento ocorrer pode depender da chance de outro evento ocorrer.

Concluso
Existem algumas regras que foram mostradas em relao s probabilidades que devemos segui-las de forma correta para termos resultados confiveis. As distribuies
de probabilidades, vistas tambm nessa unidade, lida com probabilidades, porm
associadas ao tipo de varivel aleatria em questo. Para utilizarmos qualquer distribuio, necessrio saber se a varivel aleatria numrica contnua, discreta, se
exige intervalo de tempo ou outras particularidades. O mau uso dessas distribuies implica em anlises de dados distorcidas e concluses errneas.
Finalizando o material, a Unidade V tratou das medidas de associao, duas ferramentas importantes dentro da estatstica. Tanto a correlao quanto a regresso envolvem associao entre variveis, embora a funo de cada uma delas seja diferente. Na correlao tem-se o grau de associao entre as duas variveis; na regresso o
que se obtm estimao de uma varivel por meio da outra. Entender como duas
variveis se relacionam importante dentro da anlise de dados. Alguns critrios
devem ser seguidos, entretanto, ao se trabalhar com regresso ou correlao, essas
medidas s podem ser utilizadas em casos de variveis quantitativas. Para associar
variveis qualitativas, existem outras medidas estatsticas apropriadas. Outro cuidado a ser verificado que nem sempre que, numericamente, existe correlao ou
regresso, a associao pode ser explicada. Alm disso, testes estatsticos tambm
podem ser utilizados para verificar a significncia dessas duas medidas dentro de
cada anlise.
A estatstica lida com incertezas e, assim, podemos incorrer ao erro. Portanto, ao se
fazer uso de algum teste estatstico, a margem de erro, que deve ser pequena, deve
ser estabelecida, sendo sua escolha critrio do pesquisador.
Finalizamos este material que foi feito com cuidado para contribuir com o seu crescimento profissional e pessoal. Aproveite!
Professora Me. Ivnna Gurniski Carniel

GABARITO - Atividades de Autoestudo

Unidade I
1. A Estatstica pode ser definida como uma parte da matemtica que se preocupa
em coletar, organizar, descrever, analisar e interpretar um conjunto de dados.
A estatstica descritiva se preocupa em descrever os dados.
A estatstica inferencial se preocupa com a anlise dos dados e sua interpretao. Ela
analisa os dados com base na amostra e ento estende as concluses desta amostra
populao.
2. Populao conjunto de elementos que possuem alguma caracterstica em comum.
Amostra parte da populao, devendo ser representativa da mesma.
Censo levantamento de dados de toda uma populao.
Estimao obteno de valores de uma amostra.
Variveis caractersticas tomadas em uma populao ou amostra como, por
exemplo: sexo, idade, regio de procedncia, peso etc.
3. Amostra casual simples - aquela em que todos os elementos da populao tm
igual probabilidade de pertencer amostra. Pode ser obtida sorteando os elementos a partir da populao de estudo.
Amostra Sistemtica - uma forma simplificada da amostragem casual simples, podendo ser utilizada quando os elementos da populao se apresentam ordenados,
sendo a retirada dos elementos para compor a amostra feita com certa periodicidade.
Amostra Estratificada uma amostra em que a populao separada em grupos
ou estratos, e dentro de cada estrato os indivduos so sorteados, devendo os mesmos ser semelhantes entre si dentro de cada estrato.
Amostra por conglomerado uma amostra em que a populao dividida em
diferentes conglomerados, extraindo-se uma amostra apenas dos conglomerados
selecionados, e no de toda a populao.
4. Representar os dados por meio de grficos e tabelas: os dados so apresentados
de forma resumida, em que h uma visualizao rpida e fcil dos mesmos para o
pblico. H um entendimento melhor dos dados, ficando fcil de sabermos o que
est ocorrendo com os dados coletados.
5.
a) Funcionrio da empresa, amostragem estratificada.
b) Senadores do Brasil, amostragem aleatria simples.

140 - 141

GABARITO - Atividades de Autoestudo

c) Pessoas na fila de atendimento, amostragem sistemtica.


d) Peas fabricadas, amostragem sistemtica.

Unidade II
1.
Tabela 1 Distribuio de frequncias para a varivel topologia
Topologia

Fi

Fac

C1

37,5

37,5

C2

50

87,5

C3

12,5

100

Total

100

2.

Grfico 1 Porcentagem de clientes para a varivel topologia


3.

GABARITO - Atividades de Autoestudo

Tabela 2 Distribuio de frequncias para a varivel tempo de resposta

Classes

Fi

Fac

Ponto
mdio

5---5,63

6,25

6,25

5,315

5,63---6,26

25

31,25

5,945

6,26---6,89

43,75

75

6,575

6,89---7,52

25

100

7,205

Total

16

100

4.

Grfico 2 Porcentagem de clientes para a varivel tempo de resposta ao usurio


5.

Grfico 3 Porcentagem de clientes para a varivel tempo de resposta ao usurio

GABARITO - Atividades de Autoestudo

Unidade III
1.
a) A mdia mais utilizada, pois a medida mais precisa, nica num conjunto de
dados e sempre existe.
b) Os problemas da mdia ocorrem porque ela afetada por medidas extremas, ou
seja, valores muito altos ou muito baixos, destoando da maioria dos outros valores,
podem comprometer o valor da mdia. Alm disso, em conjuntos de dados muito
heterogneos, ela no uma medida que representa bem o conjunto de dados.
2.

x = 95,8 mm

a)

a mdia aritmtica:

a moda: Mo = 96 mm

a mediana: Md = 96 mm

b)

varincia 34,4 mm2

Desvio padro 5,87 mm


c)

CV = 6,12%

d)

Para o Q3 temos:

p = 0,75(9 + 1) = 7,5 ~ 8 valor

Q3 = 102 + 0,102(105 102) = 102,3 mm

Dizemos que 75% dos valores esto abaixo de 102,3 mm.


Para o D6 temos

p = 0,6(9+1) = 6

D6 = 96 + 0,96(100-96) = 99,84
Dizemos que 60% dos valores esto abaixo de 99,84 mm.
3.
a)

x = 6,44 dias

Mo = 6,48

Md = 6,5

b)

s2 = 3,33

s = 1,82

GABARITO - Atividades de Autoestudo

c)

CV = 28,26%

d)

Q3 = 7,5 e P4 = 2

Unidade IV
1. Espao amostral o conjunto de todos os possveis resultados do experimento
aleatrio.
Eventos: um dos possveis resultados do experimento aleatrio e o qual se deseja
saber a probabilidade de ocorrncia.
a)

0,53 + 0,35 = 0,88 ou 88%

b)

0,53 ou 53%

c)
d)

Mdia = 0,6 Varincia = 0,54

a)

ter resistncia alta a arranhes 840/1000

b)

ter resistncia baixa a arranhes 160/1000

c)

ser aprovado na avaliao das trilhas 800/1000

d)

ser reprovado na avaliao das trilhas 200/1000

e)

ter resistncia alta ou ser aprovado P(AjAP) =

= 940/1000

f)

ter resistncia baixa ou ser reprovado P(BjR) =

= 300/1000

g)

ter resistncia alta dado que seja reprovado P(A/R) = 140/200

h)

ter resistncia baixa dado que seja aprovado 100/800

P (X) =

E(x) = 80

Var (x) = 80

=0,0039 ou 0,39%

GABARITO - Atividades de Autoestudo

A esperana e a varincia x sero dadas por:



Desvio padro =

a)

0,4332 ou 43,32%

b)

0,0668

c)

0,3413 + 0,4332 = 0,77 ou 77%

d)

0,8413 ou 84,13%

Unidade V
1.
a) A varivel independente o comprimento do cabo x e a varivel dependente
a
varivel taxa de falhas y, ou seja, a taxa de falhas depende
do comprimento do cabo.
b) 0,47 verifica-se uma correlao mediana e positiva entre as duas variveis a,

mostrando que quanto maior o comprimento do cabo maior a
taxa de falhas.
c) tc = 2,17

ttabelado = 3,06


tc < ttabelado conclui-se que no existe significncia na correlao entre
as duas variveis em nvel de 1% de erro.
d) Correlao substancial entre as duas variveis.
e) b = 2,4 a = -15,2

GABARITO - Atividades de Autoestudo

f )
Comprimento do
cabo(m)

4,08

6,49

10

8,9

11

11,31

12

13,72

13

16,13

14

18,54

15

20,95

g) Diagrama de disperso

Diagrama de disperso entre o comprimento do cabo e as taxas de falhas preditas


h) R2 = 0,472 = 0,22 k = 0,78

22% dos dados so explicados pela equao linear de regresso.

Pelo coeficiente de alienao observamos que h mais ausncia que relao entre
as duas variveis.
i)Na correlao linear, medimos somente o grau de associao linear entre duas
variveis. J na anlise de regresso medimos o quanto de variao de uma varivel
que explicada pela outra; podemos tambm fazer predies de uma varivel
baseada em outra.
2) 120; 170; 220

148 - 149

Referncias
BARBETTA, P. A. et al. Estatstica para os cursos de engenharia e informtica. 3.
ed. So Paulo: Atlas, 2010.
BUSSAB, W. O. ; MORETTIN, P. A. Estatstica Bsica. So Paulo: Editora Saraiva, 2003.
GIACOMELLO, Cintia Paese. Probabilidade e Estatstica. Jornal do Brasil.
Universidade de Caxias do Sul.
GUEDES, T. A. et al. Projeto de Ensino: Aprender Fazendo Estatstica. Disponvel em:
<www.des.uem.br>. Acesso em: 15 jun. 2012.
IBGE. Comentrios. Disponvel em: <http://www.ibge.gov.br/home/estatistica/
populacao/trabalhoerendimento/pnad2007/comentarios2007.pdf>. Acesso em: 15
jun. 2012.
MAGALHES, M. N.; LIMA, A. C. P. de. Noes de Probabilidade e Estatstica. So
Paulo: IME-USP, 2008.
MONTGOMERY, D. C.; RUNGER, G. C. Estatstica Aplicada e Probabilidade para
Engenheiros. Rio de Janeiro: Livros Tcnicos e Cientficos Editora S.A., 2003.
STEEN, L. A. Why numbers count: quantitative literacy for tomorrows America.
USA: College Entrance Examination Board, 1997.
TOLEDO, G. L. ; OVALLE, I.I. Estatstica Bsica. So Paulo: Atlas, 1997.
TRIOLA, Mrio F. Introduo Estatstica. Rio de Janeiro: LTC, 1999.
Site:
<www.inf.ufsc.br/~ogliari/arquivos/Correlacao.ppt#320,10, Slide 10>. Acesso em:
16 jun. 2012.

Anda mungkin juga menyukai