Graduao
Unicesumar
Reitor
Wilson de Matos Silva
Vice-Reitor
Wilson de Matos Silva Filho
Pr-Reitor de Administrao
Wilson de Matos Silva Filho
Pr-Reitor de EAD
Willian Victor Kendrick de Matos Silva
Presidente da Mantenedora
Cludio Ferdinandi
autores
Apresentao
ESTATSTICA
Seja bem-vindo(A)!
Caro(a) estudante, com muito prazer que apresentamos a voc o livro que far parte
da disciplina de Estatstica. A Estatstica uma cincia que se dedica ao desenvolvimento e ao uso de mtodos para a coleta, resumo, organizao, apresentao e anlise de
dados. Antes que um novo remdio possa ser colocado no mercado, por exemplo, a
Food and Drug Administration dos Estados Unidos exige que este seja submetido a um
ensaio clnico estudo experimental envolvendo indivduos humanos. Os dados desse
estudo precisam ser compilados e analisados para que seja determinado se o remdio
efetivo e seguro. Alm desse, h outros exemplos do uso da estatstica para o desenvolvimento e o bem-estar da sociedade, como: a previso do tempo em uma regio, as
tendncias em determinada eleio, a posio dos bancos dos trens em certa linha e at
o hbito de lavar as mos aps usar o banheiro. Por essas ideias apresentadas, conclumos que sem estatstica no h cincia.
Fazendo uma pequena viagem pelo tempo, em 3000 a.C. registram-se os primeiros indcios de censos na Babilnia, na China e no Egito. No Velho Testamento, Livro 4 (Nmeros), registra--se uma instruo de Moiss: Fazer levantamento dos homens de Israel
aptos a guerrear.
A palavra Censo deriva do verbo latino censere, que significa taxar. O objetivo inicial
da realizao dos censos era buscar informaes sobre as populaes para orientar a
taxao de impostos. Era, portanto, uma atividade que interessava particularmente aos
governos, ao Estado. Da deriva a palavra ESTATSTICA (de STATUS). Trata-se da ferramenta de trabalho dos estadistas.
Em 1805, Guilherme, o Conquistador, determinou que se fizesse na Inglaterra um levantamento visando obter informaes sobre posse de terras, sua utilizao, seus proprietrios, nmero de empregados, posse de animais etc., para taxao de impostos.
No sculo XVII, John Graint publica Aritmtica Poltica, uma anlise sobre nascimentos
e bitos a partir das chamadas Tbuas de Mortalidade.
J no sculo XVIII (1797), surge na Enciclopdia Britnica o verbete STATISTICS pela
primeira vez.
O termo Estatstica usado hoje com alguns significados diferentes. Ele pode se referir
a:
meros registros de eventos que interessem ao Administrador em geral;
uma simples medida estatstica que seja obtida de uma amostra;
mtodos estatsticos padronizados utilizados em pesquisa por amostragem;
Cincia Estatstica em geral, hoje grandemente desenvolvida e com aplicao disseminada como auxiliar as mais diferentes reas de conhecimento.
Apresentao
De forma simplificada, podemos admitir que a Cincia Estatstica tem como objetivo obter informaes confiveis sobre determinado fenmeno de interesse.
A Estatstica est de forma muito presente na mdia, seja em jornais, revistas ou
meios de comunicao. Alm disso, uma vez que est diretamente envolvida com
pesquisa, a partir dela que as decises so tomadas. Podemos dizer que a Estatstica uma ferramenta para qualquer pesquisador na busca pelas respostas aos
vrios problemas relacionados ao meio em que trabalha. Entretanto, para que ela
seja bem utilizada, necessrio conhecer os seus fundamentos, seus princpios e
suas ferramentas para que possamos utiliz-la de forma adequada. importante
que o pesquisador desenvolva tambm um esprito crtico e de anlise para poder
utilizar com preciso a estatstica em suas tomadas de decises.
Este material foi separado em cinco unidades, sendo iniciado com a importncia
da estatstica bsica, passando por probabilidades e finalizando com medidas de
associao.
A Unidade I vai do incio de sua utilizao at a importncia dos grficos e das tabelas na apresentao dos dados. Essa unidade trata basicamente dos conceitos que
voc precisar saber para entender a estatstica nas unidades posteriores.
Na Unidade II, nos aprofundaremos no estudo de tabelas e grficos, mais especificamente, leitura e construo de tabelas, aplicao e utilizao de alguns tipos de
grficos. Podemos destacar que os grficos em seus mais variados tipos traduzem
de forma rpida os dados que se quer mostrar dentro de uma pesquisa. O intuito de
todos os grficos sempre o mesmo: traduzir dados em informaes que sejam visveis e traduzveis aos olhos do pesquisador e do pblico de forma geral. A utilidade
dos grficos e tabelas tambm mostra sua importncia, uma vez que a utilizao
dessas ferramentas quase uma rotina nos meios de comunicao com o objetivo
de mostrar os resultados das pesquisas.
A Unidade III mostra as medidas de posio e disperso. Essas medidas so amplamente empregadas dentro de pesquisas em nvel cientfico e tambm nos problemas mais simples do cotidiano. Dentre as medidas estatsticas, a principal e mais
utilizada a mdia, que representa o conjunto de dados como um todo. Tambm
muito empregado como medida explicativa, podemos citar o desvio padro, que
mostra a variabilidade dos dados ou a disperso dos mesmos. A mdia e o desvio padro so medidas importantes em uma anlise de dados, uma vez que uma
representa o conjunto de dados propriamente dito e a outra mostra a disperso
do mesmo, apontando assim se temos homogeneidade ou heterogeneidade nos
dados da pesquisa.
A Unidade IV trata sobre probabilidades. As probabilidades podem tratar de eventos
simples a extremamente complexos. De forma abrangente, elas tratam das chances
de determinados fenmenos ocorrerem. A importncia de se estudar probabilidades est na verificao de que alguns eventos ocorrem com alguma facilidade maior
que outros e, assim, podemos prever situaes futuras sobre esses eventos.
Apresentao
A unidade aborda as probabilidades de forma geral, mostrando desde os clculos
mais simples, passando por suas propriedades, e indo at as probabilidades condicionais e distribuies de probabilidades. As principais distribuies so aquelas
que utilizamos com maior frequncia, uma vez que existem inmeros tipos. Essas
distribuies do comportamento da varivel com a qual estamos trabalhando importante, pois por meio delas que determinamos como calcular probabilidades
de forma correta.
Finalizando o material, a Unidade V trata das medidas de associao, mais especificamente a correlao e a anlise de regresso. Essas medidas nos mostram o grau
de relao entre duas variveis. A correlao informa a intensidade da relao e a
anlise de regresso mostra a quantidade de variao em uma por meio da variao
em outra.
Este material est bastante sintetizado, focando os pontos principais da Estatstica
de modo a proporcionar encaminhamentos que possibilitem a compreenso dos
conceitos, ao contrrio do que muitas vezes posto em se tratando de estudar Matemtica e, especificamente, Estatstica.
A resoluo de tarefas importante desde que o estudante procure faz-la luz da
teoria que ela contempla. Com isso, afirmo: ser necessrio, tambm, muito empenho de sua parte para a realizao desse intenso trabalho. No decorrer de suas
leituras, procure interagir com os textos, fazer anotaes, responder as atividades
de autoestudo, anotar suas dvidas, ver as indicaes de leitura e realizar novas pesquisas sobre os assuntos tratados, pois com certeza no ser possvel esgot-los em
apenas um livro.
Prof. Ivnna Gurniski Carniel
10 - 11
sumrio
UNIDADE I
UNIDADE II
TABELAS E GRFICOS
37 Introduo
38 Tabelas
45 Grficos
46 Grficos para Variveis Qualitativas
53 Consideraes Finais
sumrio
UNIDADE III
UNIDADE IV
PROBABILIDADES
85 Introduo
85 Probabilidades
98 Regras de Probabilidade
100 Distribuies de Probabilidade
101 Distribuies Discretas de Probabilidade
106 Distribuies Contnuas de Probabilidade
115 Consideraes Finais
12 - 13
sumrio
UNIDADE V
139 Concluso
149 Referncias
CONCEITOS E IMPORTNCIA
DA ESTATSTICA
UNIDADE
Objetivos de Aprendizagem
Entender o que significa Estatstica.
Compreender a importncia da Estatstica.
Assimilar os principais conceitos dentro da Estatstica.
Compreender as principais formas de apresentao de dados
estatsticos.
Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
A Importncia da Disciplina de Estatstica
A Necessidade do Domnio da Estatstica
Conceitos Estatsticos
Populao e Amostra
Censo
Parmetros
Variveis
Apresentao de Dados Estatsticos
16 - 17
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Introduo
A Estatstica uma cincia multidisciplinar que permite a anlise de dados em
todas as reas, fornecendo ferramentas para que sejamos capazes de transformar dados brutos em informaes acessveis e de fcil compreenso, de modo
que possamos compar-los com outros resultados ou ainda verificar sua adequao com alguma teoria pronta.
Fundamentalmente, a Estatstica fornece mtodos de coletar, organizar,
descrever, analisar e interpretar dados. Esses mtodos, j consagrados como os
mais indicados, so utilizados no processo de tomada de decises, resoluo de
problemas e produo de conhecimento, como consequncia.
Nesta unidade, sero apresentados conceitos bsicos em Estatstica, que so
subsdios para o desenvolvimento de todo o estudo proposto neste livro.
shutterstock
Introduo
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
18 - 19
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Parmetros: medidas descritivas de uma populao. Exemplo: a contagem do nmero total de habitantes de uma regio.
Populao e Amostra
A Estatstica fornece vrios mtodos para organizar e resumir um conjunto de
dados e, com base nestas informaes, tirar concluses.
Quando se fala em conjunto de dados ou fatos coletados, este se refere ao
material tomado a partir de um conjunto de elementos. Deve-se ento definir de
onde esses dados sero tomados, e assim surge o conceito de Populao.
Populao pode ser definida como sendo uma coleo de elementos que
possuem alguma caracterstica em comum, podendo estes ser animados ou
inanimados.
Quando as informaes desejadas estiverem disponveis para todos os objetos
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
shutterstock
20 - 21
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Amostragem
Para que se obtenha uma amostra representativa da populao, o processo de
coleta deve ser feito de forma adequada, onde cada situao exige uma maneira
apropriada.
Existem dois grandes grupos de tcnicas amostrais:
Probabilsticas: quando todos os elementos da populao tm probabilidade conhecida e diferente de zero de pertencer amostra.
Amostragem
Para se ter uma amostra casual simples, precisa-se de uma listagem com todos
os elementos da populao de origem. Os elementos que faro parte da amostra devem ser obtidos de forma totalmente aleatria, ou seja, por sorteio e sem
restrio. escrito cada elemento em um carto e sorteado assim os participantes da amostra. Todos os elementos da populao tm igual probabilidade ` n j
N
de pertencer amostra.
Esta tcnica de sorteio se torna invivel quando a populao significativamente grande. Neste caso, necessrio o uso de tabelas de nmeros aleatrios
ou algoritmos que geram nmeros aleatoriamente.
Para saber mais sobre algoritmos para gerar nmero aleatrios, ver
Barbetta et al., Captulo 1.
De forma geral, na amostragem casual simples sorteia-se um elemento da populao, sendo que todos os elementos tm a mesma probabilidade de serem
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
22 - 23
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Amostragem Sistemtica
utilizada quando os elementos da populao se apresentam ordenados, sendo
a retirada dos elementos feita periodicamente para compor a amostra. O sorteio feito de forma sistematizada.
De posse de uma listagem de todos os elementos da populao, estabelecese o intervalo de seleo: I = N / n.
Em seguida, sorteia-se um nmero dentro desse intervalo. Esse ser o nmero
de ordem do primeiro sorteado da lista. Os demais sujeitos da amostra sero
selecionados utilizando o intervalo I, a partir do primeiro nmero sorteado.
Exemplo:
Para obter uma amostra de 5 alunos em uma turma de 32.
Temos, portanto, N = 32 e n = 5, donde I = 32 / 5 = 6,4. Deve-se arredondar
o valor de I sempre para baixo. Adotaremos I = 6.
O sorteio ser feito entre os primeiros seis da lista. Se o sorteado for, por
exemplo, o nmero 4, a amostra ser formada pelos sujeitos de nmeros 4, 10,
16, 22 e 28.
Amostragem
Amostragem Estratificada
Populao
Amostra (10%)
venda
Locao
120
80
12
8
Total
200
20
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Neste tipo de amostragem, a populao deve ser dividida em subgrupos (estratos). Dentro de cada subgrupo, os indivduos devem ser semelhantes entre si.
Assim, pode-se obter uma amostra aleatria de pessoas em cada grupo. Este processo pode gerar amostras bastante precisas, mas s vivel quando a populao
pode ser dividida em grupos homogneos, devendo na composio da amostra
serem sorteados elementos de todos os estratos.
Quando os estratos possuem aproximadamente o mesmo tamanho, sorteia-se igual nmero de elementos em cada estrato e a amostragem chamada
estratificada uniforme. Caso contrrio, sorteia-se, em cada estrato, um nmero
de elementos proporcional ao nmero de elementos do estrato, chamada amostragem estratificada proporcional.
Exemplo:
Um corretor possui 200 imveis disposio, h 120 venda e 80 para locao. Extrair uma amostra representativa de 10% dessa populao:
24 - 25
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Nesta amostragem, a populao dividida em diferentes grupos (conglomerados), extraindo-se uma amostra apenas dos conglomerados selecionados, e no
de toda a populao. O ideal seria que cada conglomerado representasse tanto
quanto possvel o total da populao.
Exemplo:
Estudar a populao de uma cidade, dispondo apenas do mapa dos bairros.
Numerar os bairros e colocar os pedaos de papis numa urna.
Retirar um pedao de papel da urna e realizar o estudo sobre o bairro
(conglomerado) selecionado.
importante saber que a amostra no pode conter vcios, ou seja, no ser viesada
ou tendenciosa. Deve ser selecionada com cuidado, aplicando a tcnica de amostragem adequada com tamanho amostral (n) que seja informativo ao que consta
na populao. O tamanho da amostra pode ser obtido por frmulas encontradas facilmente na literatura ou pode ser dado pelo bom senso do pesquisador.
O importante que o mesmo seja representativo da populao.
No caso da amostra no ser representativa da populao, devemos ter cuidado com o conjunto de dados para que no haja grandes erros de inferncia,
ou ento no devemos fazer a inferncia.
Tipos de Variveis
VARIVEL uma caracterstica que possa ser avaliada (ou medida) em cada
elemento da populao, sob as mesmas condies. Uma varivel observada (ou
medida) em um elemento da populao deve gerar um e apenas um resultado.
Exemplo:
Seja uma populao formada pelos funcionrios de determinada empresa.
Podemos considerar variveis como: tempo de servio, salrio, estado civil,
Tipos de Variveis
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
idade, sexo, escolaridade, inteligncia, peso, estatura, autoestima, grau de satisfao com o emprego, autoritarismo, religiosidade etc.
Como medir estas caractersticas? Devemos fixar uma unidade de medida
(kg, cm, anos completos,...) ou definir atributos (casado, solteiro, masculino,
feminino, forte, fraco,...).
Para descrever o grupo ou a amostra, h a necessidade de identificar o tipo
dessa varivel para definir a melhor metodologia de trabalho. As variveis podem
ser: Quantitativas ou Qualitativas.
Variveis Qualitativas ou Categricas - so variveis que assumem como
possveis valores atributos ou qualidades. Se tais variveis assumem uma ordenao natural, so chamadas de qualitativas ordinais (ex.: grau de escolaridade,
classe social); caso contrrio, so chamadas qualitativas nominais (ex.: cor dos
olhos, campo de estudo).
Variveis Quantitativas - so variveis que assumem como possveis valores
os nmeros. Quando estas variveis so resultantes de contagens, so chamadas
de quantitativas discretas (ex.: quantidade de irmos, de defeitos num carro
novo); caso assumam qualquer valor em intervalos dos nmeros reais, so chamadas quantitativas contnuas (ex.: altura, peso, velocidade).
Exerccios:
Classificar as seguintes variveis:
26 - 27
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
shutterstock
Tabelas e Grficos
O objetivo da utilizao de tabelas e grficos transformar dados em informaes
que permitam a fcil visualizao e interpretao da nossa pesquisa. Tambm
servem para verificar a existncia de algum padro para comparar esse padro
com outros resultados, ou ainda para julgar sua adequao a alguma teoria.
As tabelas so quadros em que sero dispostas as informaes por alguma
categoria pelo clculo de alguma frequncia. Devem ter as laterais abertas, ou
seja, sem bordas, e devem ainda ter um ttulo explicativo e localizado acima das
mesmas, precedido da palavra Tabela e seguido de sua numerao. Veja o exemplo abaixo:
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
erros. Neste processo, procede-se a uma reviso crtica dos dados, retirando os
valores estranhos que podem ocorrer tanto por erro de quem coletou os dados
ou de quem foi abordado na pesquisa. Para um melhor entendimento diante de
grande quantidade de dados adequado que se faa uma compilao dos mesmos para sua apresentao.
APRESENTAO DOS DADOS ser feita por meio de TABELAS e
GRFICOS. As tabelas so mais ricas em detalhes e em preciso. Os grficos proporcionam maior rapidez de interpretao, embora percam exatido em detalhes.
ANLISE E INTERPRETAO - tm como objetivo a determinao
de medidas estatsticas, que como j vimos, tm a finalidade de descrever de
forma prtica e objetiva as caractersticas gerais de uma populao.
Determinadas as medidas estatsticas
bsicas, a anlise desejada poder ter
sequncia j no campo da Estatstica
Inferencial, baseada sempre em raciocnios probabilsticos.
28 - 29
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Ano
1998
5,0
3,0
2000
8,5
4,0
2002
13,0
7,3
2004
24,0
13,1
2006
30,0
16,1
Tabela 1: Nmero de computadores pessoais () instalados no Brasil e percentual sobre total de habitantes
de 1998 a 2006
Fonte: Computer Industry Almanac, ITU estimates e FGV/SP; MDG Indicators1 Inclui PCs, laptops,
notebooks etc., mas exclui terminais ligados a mainframes, minicomputadores de uso compartilhado e
smartphones.
Tabelas e Grficos
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Grfico 1 : Percentual de domiclios atendidos por rede geral de abastecimento de gua no total de
domiclios particulares permanentes (%)
FONTE: IBGE, Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento, Pesquisa Nacional por
Amostra de Domiclios 2006-2007
30 - 31
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Consideraes Finais
A estatstica utilizada para coleta, organizao, descrio e anlise de informaes obtidas de uma pesquisa, sendo que a estatstica descritiva utilizada
para a descrio dos dados. O objetivo principal transformar os dados brutos
em informaes.
Nesta unidade voc viu os principais conceitos utilizados dentro da estatstica descritiva, tipos de amostras e a importncia da utilizao de grficos
e tabelas como forma de apresentao dos dados. Dos conceitos abordados,
podemos destacar o censo, que o processo que consiste no exame de todos os
elementos da populao e cujas medidas so chamadas de parmetros. Portanto,
podemos dizer que parmetros so as medidas utilizadas quando estamos trabalhando com toda nossa populao de estudo. Por exemplo, se coletamos dados
da contagem do nmero de habitantes de uma regio, ento a medida da contagem se chama parmetro. Entretanto, se utilizamos uma parte dessa populao,
no temos um parmetro, e sim uma estatstica ou um estimador, portanto, um
estimador uma medida tomada em uma parte dessa populao, mas no nela
toda, embora este estimador represente o parmetro.
Tambm vimos os conceitos de Populao e Amostra. Populao, no sentido estatstico, pode ser definida como um conjunto de elementos que possuem
alguma caracterstica em comum. Como na maioria das vezes difcil ou custoso
trabalharmos com populao, utilizamos uma parte dela. A esta parte chamamos de amostra. Essa amostra deve, porm, representar a populao, ou seja,
deve ter as mesmas caractersticas da populao que se ir amostrar.
Para que isso seja conseguido, o processo de coleta de uma amostra, tambm
conhecido como amostragem, deve ser feito de forma casual ou aleatria. Existem
algumas maneiras de se fazer uma amostragem e para cada situao existe uma
maneira ideal. Nesta unidade, foram discutidos os principais tipos de amostras
utilizadas nas pesquisas, sendo que a escolha deve ser feita de modo que as amostras representem de fato a populao e de forma que sejam no tendenciosas.
O nmero de elementos da populao ns chamamos de N, e o nmero de
elementos da amostra de n. O tamanho da amostra deve ser feito utilizandose o bom senso ou clculos adequados. Esse tamanho da amostra obtido de
Consideraes Finais
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
acordo com o tipo de caracterstica que se deseja estudar. Para cada tipo existe
uma frmula adequada.
Aps a coleta da amostra, necessrio descrever os dados. Para isso, primeiramente, devemos saber com quais tipos de variveis estamos trabalhando, para
assim escolhermos qual a melhor maneira de apresentar a pesquisa.
Finalizando, importante que a apresentao dos dados seja feita de forma
precisa. As duas formas vistas nesta unidade foram as tabelas e grficos, e o uso
correto das formas de apresentao dos dados fundamental para o sucesso da
pesquisa.
32 - 33
TABELAS E GRFICOS
UNIDADE
II
Objetivos de Aprendizagem
Entender a importncia dos grficos e tabelas.
Aprender a construir grficos e tabelas para variveis qualitativas.
Aprender a construir grficos e tabelas para variveis quantitativas
Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Formas de descrio dos dados
Representao dos dados por meio de TABELAS
Tabelas para variveis qualitativas
Tabelas para variveis quantitativas
Representao dos dados por meio de GRFICOS
Grficos para variveis qualitativas
Grficos para variveis quantitativas
Interpretao de tabelas e grficos
36 - 37
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Introduo
Em uma pesquisa, geralmente os dados so descritos e analisados com auxlio
de tcnicas estatsticas. As pesquisas precisam da estatstica para alcanar seus
objetivos, principalmente quando envolvem grande quantidade de informaes
que precisam ser resumidas.
As formas mais simples de apresentao dos dados na estatstica so por
meio de tabelas e de grficos. A funo das tabelas e dos grficos a mesma, ou
seja, mostrar o resumo das observaes para facilitar a visualizao e o entendimento das mesmas.
H diversas formas de grficos e de tabelas. A escolha de uma ou outra forma
depende da caracterstica com a qual estamos trabalhando. Nesta unidade, temos
o objetivo de ensin-lo(a) a construir as tabelas e os principais tipos de grficos.
Para essa construo h necessidade de separao das variveis em qualitativas
e quantitativas. Alguns tipos de grficos podem ser utilizados tanto para uma
quanto para outra varivel, entretanto, existem alguns tipos que so especficos
para variveis qualitativas ou quantitativas, portanto interessante conhecer o
tipo adequado para cada caso.
importante desenvolver tanto a habilidade de construir tabelas e grficos,
como a de fazer uma leitura adequada dos mesmos.
Introduo
SHUTTERSTOCK
II
Fr = n
TABELAS E GRFICOS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Tabelas
38 - 39
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Fr
Masculino
63,6
Feminino
100
Total
11
1,0
100
Fac
Outro exemplo:
Grupo de Atributos
Porcentagem (%)
Localizao
27,47
Conforto
22,71
Segurana
20,51
Incorporao
17,58
Lazer
11,73
Tabelas
II
Regio
2005
2006
2007
2008
2009
Norte
870,2
893,4
921,0
923,1
925,7
Nordeste
574,4
573,6
573,8
571,1
582,0
Sudeste
659,2
670,4
671,5
680,9
681,4
Sul
1094,3
1112,0
114,6
1240,3
1500,4
Centro-Oeste
897,5
902,4
909,5
1002,1
1004,9
TABELAS E GRFICOS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
40 - 41
k . nmero de observaes
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Usar um nmero pequeno de classes poderia concentrar a maioria das observaes em uma ou duas classes. Se for usado um nmero grande de classes, muitas
delas tero frequncias iguais a zero.
Amplitude Total e Amplitude das Classes
Para determinar a variao dos dados dentro de cada classe, ser preciso encontrar a amplitude total:
AT = maior valor menor valor
Com o valor de AT, a variao de cada classe, que chamaremos de amplitude das classes, determinada pela relao:
AT
AC = k
Tabelas
II
Quantidade de imveis
visitados
16
24
24
11
34
44
13
10
11
Observe que temos 11 indivduos, portanto, o nmero ideal de classes dado por:
Amplitude Total
AT = 44 2 = 42
Amplitude das Classes
Assim, podemos montar a tabela de distribuio de frequncias para essa varivel como segue:
Classes
Fi
Fr
Fac
xi
2 |---- 16
0,545
54,5
54,5
16 |---- 30
0,273
27,3
81,8
23
30 |----| 44
0,182
18,2
100
37
Total
11
100
Tabela 5: Distribuio de frequncias para a quantidade de imveis visitados por clientes de uma imobiliria
para efetuar uma compra
Fonte: Dados hipotticos
TABELAS E GRFICOS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Indivduo
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
42 - 43
16 + 30
= 23
2
x3 =
30 + 44
= 37
2
Tabelas
II
Outro exemplo:
Os dados relacionados a seguir referem-se a uma pesquisa realizada a respeito
do sexo e da idade, em anos, de um grupo de estudantes de uma IES.
Indivduo
Sexo
Idade (anos)
Masculino
34
Feminino
32
Feminino
47
Feminino
17
Masculino
21
Masculino
25
Masculino
34
Feminino
39
Masculino
52
10
Masculino
41
11
Masculino
22
52 - 17
3 = 11, 7 . 12
Classes
Fi
Fr
Fac
xi
17 |--- 29
0,364
36,4
36,4
23
29 |---- 41
0,364
36,4
72,8
35
41 |----| 53
0,273
27,3
100
47
Total
11
100
TABELAS E GRFICOS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
SHUTTERSTOCK
44 - 45
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Grficos
Grficos so ferramentas de representao dos dados que servem para facilitar
a visualizao dos mesmos. Devem ter simplicidade e clareza para permitir se
chegar a concluses sobre a evoluo do fenmeno ou como se relacionam os
valores da srie.
Cotidianamente se observa que meios de comunicao utilizam essa ferramenta para mostrar as pesquisas. Isso se deve ao fato da facilidade de interpretao
demonstrada nos grficos e da eficincia com que resume informaes, embora
apresente menor grau de detalhes em relao s tabelas, dando uma ideia mais
global dos dados.
Ao optar pela utilizao de um grfico em uma pesquisa, devemos levar em
conta que sua construo exige cuidados, como escolher o tipo que melhor se
encaixa na representao dos dados.
II
Grfico formado por retngulos verticais, em que cada um dos retngulos representa a intensidade de um atributo. o grfico mais utilizado para representar
variveis qualitativas. Indicado quando as categorias so breves.
Exemplo:
No caso de estarmos trabalhando com duas variveis, podemos utilizar os grficos comparativos.
TABELAS E GRFICOS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Grficos em colunas
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
46 - 47
Grfico 4: Proporo de domiclios com acesso Internet entre 2005 a 2009 por grandes regies do Brasil
Fonte: IBGE, Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento, Pesquisa Nacional por
Amostra de Domiclios 2005 a 2009
II
importante observar neste tipo de grfico que cada espao dentro da coluna
representa um ano com sua respectiva porcentagem. Por exemplo, a regio Norte
tem 42.5% de domiclios com acesso internet, que est subdividido em cinco
anos, e cada espao dentro dessa regio corresponde respectiva frequncia para
cada ano. Assim tambm foi feito para todas as outras regies.
Grfico em barras
Grfico 5: Nmero porcentual de computadores pessoais() instalados no Brasil sobre total de habitantes de
1998 a 2006
(1) Inclui PCs, laptops, notebooks etc., mas exclui terminais ligados a mainframes, minicomputadores de
uso compartilhado e smartphones.
Fonte: Computer Industry Almanac, ITU estimates e FGV/SP; MDG Indicators
TABELAS E GRFICOS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
48 - 49
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Grfico de setores
Tambm conhecido como grfico de pizza. Neste tipo de grfico, a varivel em
estudo projetada num crculo dividido em setores com reas proporcionais s
frequncias das suas categorias. recomendado para o caso em que o nmero
de categorias no grande e no obedece a alguma ordem especfica.
Exemplo:
Grfico de linhas
Grfico utilizado para representar dados relacionados ao tempo. feito colocando-se no eixo vertical (y) a mensurao da varivel em estudo e no eixo
horizontal (x), as unidades da varivel numa ordem crescente. Este tipo permite
mostrar as flutuaes da varivel ao longo do tempo alm de analisar tendncias.
Exemplo: Suponha uma empresa que esteja analisando o nmero de vendas
de notebooks de certa marca nos primeiros 4 meses do ano.
Ms
Nmero de vendas
Janeiro
10
Fevereiro
16
Maro
Abril
12
II
Nos grficos de linhas podemos ter mais que uma varivel representando-as por linhas diferentes.
Exemplo:
Suponha uma empresa que esteja analisando o nmero de vendas de notebooks de duas marcas diferentes nos primeiros 4 meses do ano.
Ms
Marca A
Marca B
Janeiro
10
20
Fevereiro
16
30
Maro
25
Abril
12
20
TABELAS E GRFICOS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
50 - 51
Histograma
Grfico de colunas, sendo dispostos no eixo horizontal os limites das classes da
varivel em questo segundo as quais os dados foram agrupados, e no eixo vertical as frequncias para cada agrupamento. Um detalhe importante que no
histograma as colunas so retngulos justapostos.
II
Polgono de frequncia
Grfico de linha, onde os pontos mdios de cada classe so colocados no eixo
horizontal e no eixo vertical, as respectivas frequncias.
Grfico 10 : Mdias do tempo total de acesso (ms) realizado com pathping durante a transmisso de pacotes
do roteador de origem ao roteador de destino final
Fonte: Lopes e Santos (2008)
TABELAS E GRFICOS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Grfico 9: Distribuio de frequncias para a quantidade de imveis visitados por clientes de uma
imobiliria para efetuar uma compra
Fonte: Dados hipotticos
52 - 53
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Os diversos tipos de grficos sempre tm o mesmo objetivo: mostrar os dados de forma resumida. A escolha do tipo de grfico a ser utilizado depende
da escolha e objetivo do pesquisador.
A interpretao adequada de um grfico ou tabela fundamental para o entendimento da pesquisa. Ler o ttulo de forma minuciosa e observar valores mximos,
mnimos e suas variaes, so pontos fundamentais para uma interpretao
adequada.
Consideraes Finais
Nesta unidade tratamos da necessidade de que a apresentao dos dados seja
feita de forma precisa. As duas formas vistas nesta unidade foram tabelas e grficos, e o uso correto das formas de apresentao dos dados fundamental para
o sucesso da pesquisa.
Os grficos so formas de sintetizar as informaes coletadas. So importantes para dispormos as informaes de forma clara que para consigamos enxergar
o que aconteceu na nossa pesquisa. Existem diversos tipos de grficos. Nesta unidade, vimos os tipos mais comuns como os de barras e colunas, os de linha, de
setores ou pizza, histograma e polgono de frequncia.
De forma geral, os grficos demonstram dados quantitativos associados a
alguma varivel qualitativa. Todos os grficos tm o mesmo objetivo, que o
de demonstrar de forma clara e rpida os dados da pesquisa. A escolha do tipo
adequado fica ou a critrio do pesquisador ou a critrio do objetivo da pesquisa.
Consideraes Finais
Considere a seguinte planilha de dados quanto topologias de rede de computadores na resposta do tempo ao usurio:
Informao
Topologia
Tempo de resposta
Informao
Topologia
Tempo de
resposta
C1
6,0
C1
5,7
C2
7,0
10
C2
6,5
C3
5,0
11
C3
6,4
C1
6,3
12
C1
5,7
C2
6,8
13
C3
7,2
C2
7,2
14
C3
6,8
C1
6,0
15
C3
6,5
C2
6,7
16
C2
7,5
54 - 55
Material Complementar
Material Complementar
MEDIDAS DESCRITIVAS
ASSOCIADAS A VARIVEIS
QUANTITATIVAS
UNIDADE
III
Objetivos de Aprendizagem
Compreender as principais medidas estatsticas de posio, disperso
e separatrizes.
Entender a aplicao das medidas estatsticas de posio, disperso e
separatrizes.
Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Apresentao dos Dados Estatsticos
Medidas de Posio
Mdia aritmtica simples
Mdia ponderada
Moda
Mediana
Medidas Separatrizes
Quartis
Decis
Percentis
Medidas de Disperso
Amplitude Total
Varincia
Desvio Padro
Coeficiente de variao
SHUTTERSTOCK
58 - 59
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Introduo
Quando estamos realizando uma pesquisa, podemos fazer a apresentao dos
dados por meio de grficos, tabelas, ou fazendo o uso de medidas que resumem
as informaes obtidas na coleta dos dados, chamadas medidas descritivas.
Nesta unidade, estudaremos as medidas de posio e de disperso utilizadas
para descrever dados quantitativos. Essas medidas so demasiadas importantes
na representao dos dados. As medidas de posio mostram o centro de uma
distribuio de dados, nos dando uma noo do que est ocorrendo com os mesmos. J as medidas de disperso indicam a variabilidade do conjunto de dados,
mostrando se o mesmo homogneo ou heterogneo.
Assim, para descrevermos um conjunto de dados, de bom grado sempre
termos uma medida de posio e uma de disperso para represent-lo. A de
posio, para dizer o que est ocorrendo com a pesquisa e a de disperso, para
dizer se h alta ou baixa variabilidade.
Nesta unidade, sero apresentadas as principais medidas de posio e de disperso utilizadas nas pesquisas para descrever e representar o conjunto de dados.
Medidas Descritivas
Para sumarizar as informaes de um conjunto de observaes, muitas vezes
necessrio utilizar medidas que resumem em um s nmero certas caractersticas. Assim, temos as medidas de posio, disperso, assimetria e curtose. Se as
medidas so calculadas para dados a partir de uma amostra, so chamadas de
Introduo
III
Mdia aritmtica
A mdia de uma varivel a medida mais importante e mais simples de ser calculada. Esta fornece uma medida de posio central. Se os dados so de uma
amostra, a mdia denotada x ; se os dados so de uma populao, a mdia
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
60 - 61
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Exemplo:
Supondo que estamos estudando a idade das pessoas de uma famlia, dada
em anos. Foram observadas 5 pessoas e as idades foram: 5; 10; 12; 35; 38. Qual
a idade mdia dessa famlia?
III
Populao Amostra
Se a situao for de dados agrupados, a mdia obtida a partir de uma ponderao em que os pesos so as frequncias absolutas (Fi) de cada classe e xi o
ponto mdio da classe i. Observe o exemplo abaixo:
Fi
Fr
Fac
xi
2 |---- 16
0,545
54,5
54,5
16 |---- 30
0,273
27,3
81,8
23
30 |----| 44
0,182
18,2
100
37
Total
11
100
Tabela 9: Distribuio de frequncias para a quantidade de imveis visitados por clientes de uma imobiliria
para efetuar uma compra
Fonte: Dados hipotticos
Fi
Fr
Fac
xi
17 ----| 29
0,364
36,4
36,4
18
29 ----| 41
0,364
36,4
72,8
35
41 ----| 53
0,273
27,3
100
47
Total
11
100
Tabela 10: Distribuio de frequncias para a idade dos clientes de uma imobiliria para efetuar uma
compra
Fonte: Dados hipotticos
R: 32,09
Existem situaes em que os dados no esto agrupados, mas existem pesos
diferentes para cada um deles. Vejamos um exemplo.
Exemplo:
A mdia da nota bimestral dos alunos do Cesumar composta pela nota de
MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Classes
62 - 63
uma prova (com peso 8) e pela nota dos trabalhos (com peso 2). Calcule a mdia
bimestral do aluno que tirou as seguintes notas:
Prova: 7 (peso 8) Trabalho: 9 (peso 2)
A mdia ser dada por:
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Prova
Trabalho
Joo
5,0
3,0
Antnio
7,0
4,0
*Considere que o peso da prova seja igual a 9,0 e o peso do trabalho seja igual a 1,0.
R: 4,8 e 6,7
A mdia a medida mais importante dentro de um conjunto de dados e possui algumas propriedades importantes. So elas:
1. a mdia nica em um conjunto de dados;
2. a mdia afetada por valores extremamente pequenos ou grandes;
3. a mdia depende de todos os valores observados, assim, qualquer modificao nos dados far com que a mdia fique alterada;
4. a soma das diferenas dos valores observados em relao mdia zero:
A propriedade 2 importante, pois em um conjunto de dados muito heterogneo, a mdia torna-se uma medida no apropriada para representar os dados,
devendo o pesquisador optar por uma outra medida.
A propriedade 4 importante na definio de varincia, uma medida de disperso que veremos na unidade seguinte.
III
Moda
Em que:
i a ordem da classe modal;
li o limite inferior da classe modal;
h a amplitude da classe modal;
Fi a frequncia absoluta da classe modal;
Fi1 a frequncia absoluta da classe anterior classe modal;
Fi+1 a frequncia absoluta da classe posterior classe modal.
Se o conjunto de dados apresentar todos seus elementos com a mesma frequncia absoluta, no existir a Moda. Se ocorrer vrias frequncias iguais, ento
teremos uma distribuio com mais de uma moda.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Chamamos de moda o valor que aparece com maior frequncia em um conjunto de dados. Para o caso de valores individuais, a moda pode ser determinada
observando-se o rol dos dados.
Exemplos:
Observe as notas da prova de estatstica da turma de Negcios Imobilirios:
4; 5; 6; 6; 6; 6; 7; 7; 7; 8.
A moda 6, pois esse o valor que ocorreu com maior frequncia.
Essa sequncia unimodal, pois tem apenas uma moda.
Veja essa outra sequncia:
4; 5; 5; 5; 6; 7; 7; 7; 8; 9.
Nesta existem duas modas (5 e 7), ela bimodal.
Essa outra:
1; 2; 3; 4; 5; 6; 7; 8; 9; 10.
No existe moda, nenhum valor aparece com maior frequncia, amodal ou
antimodal.
Quando os dados esto agrupados em classes, primeiramente necessrio
identificar a classe modal que apresenta a maior frequncia e calcular ento a
moda da seguinte maneira:
64 - 65
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
A Moda tem o atributo de no ser afetada pelos valores extremos no conjunto de dados.
Exemplo:
Classes
Fi
Fr
Fac
xi
0,25
25
0,65
0,25
25
0,95
0,4325
43,25
15
1,25
0,0625
6,25
16
1,55
Total
16
100
Fi
Fr
Fac
xi
17 ----| 29
0,364
36,4
36,4
23
29 ----| 41
0,364
36,4
72,8
35
41 ----| 53
0,273
27,3
100
47
Total
11
100
R: 29
Mediana
Corresponde ao valor central ou mdia aritmtica dos dois valores centrais de
um conjunto de observaes organizadas em ordem crescente. Ou seja, 50% das
observaes so inferiores mediana e 50% superiores.
III
Exerccio: Calcule a mediana para as notas dos alunos nas duas situaes
seguintes:
6.0, 4.5, 5.0, 7.0, 6.5;
4.8, 6.3, 8.9, 9.5, 6.0, 7,8;
R: 6.0 e 7.05
Para os dados em distribuio de frequncias em classes, tem-se:
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Exemplo:
Uma pesquisa em uma empresa apresentou os seguintes dados relacionados
ao tempo de trabalho de seus funcionrios:
5, 13, 12, 3, 15, 17, 8, 15, 6, 16, 9.
Para encontrarmos a mediana, primeiramente devemos ordenar os dados
brutos transformando--os em um rol:
3, 5, 6, 8, 9, 12,13, 15, 15, 16, 17.
Depois localizamos o elemento central, no caso 12, pois esquerda dele
temos 5 elementos e direita tambm. Assim temos:
Md = 12.
Quando o rol tiver nmero par de elementos, a mediana ser a mdia aritmtica entre os dois elementos centrais. Vejamos, por exemplo, um rol com 10
elementos (nmero par de elementos):
3, 5, 6, 8, 9, 13, 14, 15, 15, 16.
66 - 67
Em que:
i a ordem da classe que contm o menor valor de Fai, tal que Fai p ;
Fai - 1 a frequncia acumulada da classe anterior a da mediana.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Exemplo:
Classes
Fi
FR
Fac
xi
10 ---- 29
0,364
36,4
36,4
19,5
29 ---- 48
0,545
54,5
90,9
38,5
48 ---- 67
0,091
9,1
100
57,5
Total
11
100
Tabela 13 : Distribuio de frequncia de indivduos que acessam certo site quanto ao nmero de acessos
Fonte: Dados hipotticos
Fi
Fr
Fac
xi
17 ----| 29
0,364
36,4
36,4
23
29 ----| 41
0,364
36,4
72,8
35
41 ----| 53
0,273
27,3
100
47
Total
11
100
Tabela 14: Distribuio de frequncias para a idade dos clientes de uma imobiliria para efetuar uma
compra
Fonte: Dados hipotticos
R: 33,5
III
Medidas Separatrizes
Quartis
Chamamos de quartis os valores que dividem a distribuio em 4 partes iguais
e podem ser obtidos da seguinte maneira:
Temos trs quartis:
Primeiro quartil (Q1) o valor que tem 25% dos dados sua esquerda e
o restante (75%) direita.
Segundo quartil (Q2) tem 50% dos dados de cada lado, coincide com a
mediana.
Terceiro quartil (Q3) tem 75% dos dados sua esquerda e 25% direita.
Frmulas:
1 Quartil (Q1)
P=0,25(n +1)
2 Quartil (Q2)
P=0,50(n +1)
3 Quartil (Q3)
P=0,75(n +1)
Decis
Chamamos de decis os valores que dividem uma srie em dez partes iguais.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
As separatrizes so os valores que dividem as sries em partes iguais. As principais medidas separatrizes so: a mediana (j estudada) e os quartis, os decis
e os percentis.
68 - 69
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Portanto, temos nove decis, o primeiro tem 10% dos dados sua esquerda e 90%
sua direita, o segundo tem 20% dos dados sua esquerda e 80% sua direita
e assim por diante at o nono decil, que tem 90% dos dados sua esquerda e
10% sua direita.
1 Decil (D1)
P=0,10(n +1)
2 Decil (D2)
P=0,20(n +1)
3 Decil (D3)
P=0,30(n +1)
4 Decil (D4)
P=0,40(n +1)
5 Decil (D5)
P=0,50(n +1)
6 Decil (D6)
P=0,60(n +1)
7 Decil (D7)
P=0,70(n +1)
8 Decil (D8)
P=0,80(n +1)
9 Decil (D9)
P=0,90(n +1)
Percentis
Chamamos de percentis os noventa e nove valores que separam uma srie em
100 partes iguais. O clculo dos percentis est relacionado com percentagem.
No quadro abaixo so mostrados alguns percentis:
5 Percentil (P5)
P=0,05(n +1)
25 Percentil (P25)
P=0,25(n +1)
50 Percentil (P50)
P=0,50(n +1)
75 Percentil (P75)
P=0,75(n +1)
90 Percentil (P90)
P=0,90(n +1)
Medidas Separatrizes
III
Em que:
Ip a parte inteira de p;
Fp a parte fracionria (ou decimal).
Exemplo: Calcule o 3 quartil (Q3) e o 90 percentil (P90) para a idade
mdia de um grupo de indivduos que tm as seguintes idades:
18, 19, 20, 21, 21, 22, 24, 24, 25, 27, 30, 33, 38.
Para o Q3 temos:
p = 0,75(13 + 1) = 10,5
Como a posio do elemento quartil decimal, encontrar o valor correspondente posio da parte inteira e a imediatamente posterior a ela:
10 posio: 27
11 posio: 30
Encontrar a diferena entre estes valores:
30 27 = 3
O quartil ser o menor valor somado ao produto da parte decimal pela
diferena encontrada.
Q3 = 27 + (0,5 . 3) = 28,5 anos
Pode-se afirmar que 75% dos indivduos tm idade inferior a 28,5 anos.
Para o P90 temos:
P = 0,90(13 + 1) = 12,6
12 posio: 33
13 posio: 38
38 33 = 5
P90 = 33 + (0,6 . 5) = 36 anos
Dizemos que 90% dos indivduos tm idade inferior a 36 anos.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
70 - 71
Para os dados em distribuio de frequncias em classes, o clculo das medidas separatrizes feito da seguinte maneira:
Em que:
, com k = 1, 2, 3, para determinao dos quartis;
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Fi
Fr
Fac
xi
0,25
25
0,65
0,25
25
0,95
0,4325
43,25
15
1,25
0,0625
6,25
16
1,55
Total
16
100
Tabela 15: Teor de oxignio (mg/L) em vrios rios da regio Norte do Brasil
Fonte: Dados hipotticos
Para o Q3:
Para o D7:
Medidas Separatrizes
III
Medidas de Disperso
Amplitude Total
A amplitude total de um conjunto de dados a diferena entre o maior e o
menor valor. Essa medida nos diz muito pouco, pois embora fcil de ser calculada, baseada em somente duas observaes, sendo altamente influenciada
pelos valores extremos; quanto maior a amplitude, maior ser a variabilidade.
Veja sua frmula abaixo:
AT = xmax xmin
Em que:
xmax o maior valor no conjunto de dados;
xmin o menor valor no conjunto de dados.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
As medidas de disperso mostram a variabilidade de um conjunto de observaes em relao regio central. Essas medidas indicam se um conjunto de
dados homogneo ou heterogneo. Alm disso, mostram se a medida de tendncia central escolhida representa bem o conjunto de dados que est sendo
trabalhado pelo pesquisador. Vejamos um exemplo:
Considere as idades de trs grupos de pessoas A, B e C:
A: 15; 15; 15; 15; 15
B: 13; 14; 15; 16; 17
C: 5; 10; 15; 20; 25
A mdia aritmtica do conjunto A 15, do B 15 e do C tambm 15.
A mdia aritmtica a mesma para os trs conjuntos acima, porm o grau de
homogeneidade entre eles muito diferente, ou seja, a variao dos seus elementos em relao mdia bem distinta. O conjunto A no tem disperso, o B tem
certo grau de variabilidade e o conjunto C tem grande variabilidade. Por isso,
devemos estudar as medidas de disperso. Pois conjuntos de dados diferentes
podem ter mdias iguais, porm isso no indica que so iguais, pois a variabilidade entre eles pode ser diferente.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
72 - 73
Varincia
A varincia uma medida de variabilidade que utiliza todos os dados. calculada considerando o quadrado dos desvios em relao mdia aritmtica dos
dados em estudo.
Se os dados so para uma populao, a varincia denotada pelo smbolo
grego 2 e sua definio dada como segue:
Medidas de Disperso
III
Desvio padro
O desvio padro d a ideia de distribuio dos desvios ao redor do valor da mdia.
Para obtermos o desvio padro basta que se extraia a raiz quadrada da varincia e, seguindo a notao adotada para as varincias de populao e amostra, s
denotar o desvio padro da amostra enquanto , o desvio padro da populao. Assim:
Populao Amostra
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
s2 = 234,5 anos2
A unidade da varincia a mesma unidade da caracterstica, entretanto, por simbologia apenas, devemos colocar o smbolo do quadrado junto unidade. Assim,
dizemos que a varincia dada em unidades quadrticas, o que dificulta a sua
interpretao. O problema resolvido extraindo-se a raiz quadrada da varincia, definindo-se, assim, o desvio padro.
74 - 75
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Esta medida interpretvel e dizemos que a disperso mdia entre os indivduos desta famlia de 15,31 anos.
Para saber se o desvio padro est alto ou baixo, vamos compar-lo com
o valor da mdia. Quanto maior o valor do desvio padro em relao mdia,
maior ento ser a variao dos dados e mais heterogneo o nosso conjunto
de observaes.
Coeficiente de variao
O Coeficiente de Variao (CV) envolve clculos percentuais, por isso uma
medida relativa, e no absoluta. Assim, observe as frmulas a seguir:
Populao
Amostra
III
entre 35% e 50%: representa fracamente a mdia, pois existe uma grande
disperso dos dados em torno da mdia;
acima de 50%: no representa a mdia, pois existe uma grandssima disperso dos dados em torno da mdia.
Exemplo:
De acordo com o exemplo das idades das pessoas de uma famlia, sendo elas:
5; 10; 12; 35; 38, calcule o coeficiente de variao para este conjunto de dados.
Considerando o clculo da mdia e do desvio padro j feitos, sabemos que:
Verifica-se uma grande variao, ou seja, uma alta disperso dos dados, e assim
a mdia no seria uma boa representante para este conjunto de dados.
Exerccio: Calcule as medidas de disperso para um grupo de indivduos que
tm as seguintes idades: 18, 19, 20, 21, 21, 22, 24, 24, 25, 27, 30, 33 e verifique se
a mdia uma medida que representa bem este conjunto de dados.
R: 15; 20,43; 4,52; 19,07%
Observe que para dados agrupados, h uma pequena diferena nas frmulas de varincia da populao e amostra:
Populao
Amostra
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
76 - 77
Em que cada xi o ponto mdio de cada classe estudada e Fi a frequncia respectiva a cada classe, sendo e x as mdias populacional e amostral,
respectivamente.
Observe que a nica diferena que com dados agrupados, os desvios ao
quadrado devem ser multiplicados por suas respectivas frequncias.
Exemplo:
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Classes
Fi
Fr
Fac
xi
2 |---- 16
0,545
54,5
54,5
16 |---- 30
0,273
27,3
81,8
23
30 |----| 44
0,182
18,2
100
37
Total
11
100
Tabela 16: Distribuio de frequncias para a quantidade de imveis visitados por clientes de uma
imobiliria para efetuar uma compra
Fonte: Dados hipotticos
Desvio Padro
Para calcular o desvio padro, o procedimento continua sendo o mesmo, ou
seja, basta extrairmos a raiz quadrada da varincia. Assim, observe as frmulas:
Populao
Amostra
Medidas de Disperso
III
Classes
Fi
Fr
Fac
xi
17 |---- 29
0,364
36,4
36,4
23
29 |---- 41
0,364
36,4
72,8
35
41 |----| 53
0,273
27,3
100
47
Total
11
100
Tabela 17: Distribuio de frequncias para a idade dos clientes de uma loja em Maring
Fonte: Dados hipotticos
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
78 - 79
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Consideraes Finais
Nas pesquisas, aps a coleta e organizao dos dados, convm verificar o que
ocorre com os mesmos. Nos dados quantitativos, a principal forma de anlise
calcular as medidas de posio e disperso. Essas medidas do uma indicativa
de representao e variao dos dados e por meio delas que saberemos o que
de fato ocorreu com a pesquisa.
Nesta unidade voc aprendeu a calcular as principais medidas de Posio e
Disperso, alm das medidas Separatrizes.
As principais medidas de posio dentro da estatstica so mdia aritmtica, moda, mediana e separatrizes. Pelo menos uma dessas medidas sempre deve
estar presente na descrio das informaes coletadas. J as principais medidas
de disperso so varincia, desvio padro e coeficiente de variao.
De todas essas medidas vistas, as mais utilizadas nas pesquisas so a mdia
e o desvio padro. Essas so representativas da populao e da amostra tambm.
As medidas representaro sempre os dados, portanto, fundamental que
saibamos qual ou quais as medidas mais adequadas para o tipo de informao
que temos em mos.
Consideraes Finais
94
96
100
96
102
89
87
105
Demonstre:
a) a mdia aritmtica, a moda e a mediana;
b) a varincia, o desvio padro;
c) o coeficiente de variao (interprete);
d) o 3 quartil e o 6 decil.
3. Considere a seguinte tabela de distribuio de frequncias com os tempos (em
dias) que um corretor demora a concluir um negcio, observado em 40 operaes:
Tempo (dias)
Fi
Fac
xi
0 2,5
1,25
2,5 5,0
3,75
5,0 7,5
25
30
6,25
7,5 10,0
10
40
8,75
total
40
Demonstre:
a) a mdia aritmtica, a moda e a mediana;
b) a varincia, o desvio padro;
c) o coeficiente de variao (interprete);
d) o 3 quartil e o 4 percentil.
80 - 81
Material Complementar
MEDIDAS RESUMO
Estatstica Bsica
BUSSAB, W. O. ; MORETTIN, P. A.
Editora: Saraiva
Material Complementar
PROBABILIDADES
UNIDADE
IV
Objetivos de Aprendizagem
Entender os conceitos relacionados a probabilidades.
Saber aplicar as probabilidades nas diversas situaes.
Compreender probabilidade condicional.
Conhecer as principais distribuies de probabilidades.
Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Regras Bsicas de Probabilidade
Operaes com Eventos
Probabilidade Condicional
Distribuio de Probabilidadel
84 - 85
Probabilidades
SHUTTERSTOCK
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Introduo
Introduo
IV
Face
Frequncia
1/6
1/6
1/6
1/6
1/6
1/6
Cara
Coroa
Frequncia
1/2
1/2
Se um grupo for composto por 20 homens e 30 mulheres e um deles for sorteado ao acaso para ganhar um determinado prmio, o modelo probabilstico ser:
Face
Homem
Mulher
Frequncia
20/50
30/50
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
86 - 87
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Em um experimento o lanamento de uma moeda. Os possveis resultados so cara ou coroa, ento, ={cara, coroa}. Com N = 2 possveis
resultados.
Em dois lanamentos de uma moeda, sendo interessante observar a ordem
dos resultados, os possveis resultados so: cara e cara; cara e coroa; coroa
e cara; coroa e coroa. O espao amostral :
= {(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. Com N igual a 4 possveis resultados.
Eventos
Chamamos de evento um subconjunto do espao amostral de um experimento
aleatrio. O evento dito simples se consistir em um nico resultado, ou composto se consistir em mais de um resultado.
Exemplo:
No lanamento de uma moeda = {cara, coroa}. Um evento de interesse A
pode ser obter cara no lanamento de uma moeda e ento A = {cara} e o n para
este evento ser 1, sendo n o nmero de resultados para o evento.
No lanamento de um dado, o evento de interesse A pode ser obter face par
e ento A ser igual a:
A = { 2; 4, 6 } e n = 3.
Probabilidade de um evento
Podemos fazer clculos de probabilidades utilizando trs formas distintas:
Mtodo clssico quanto o espao amostral tem resultados equiprovveis.
Mtodo emprico baseado na frequncia relativa de um grande nmero
de experimentos repetidos.
Mtodo subjetivo se baseia em estimativas pessoais de probabilidade
com certo grau de crena.
Utilizaremos aqui o mtodo clssico.
Probabilidades
IV
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Exemplo:
No lanamento de um dado, construir o espao amostral e calcular a probabilidade de sair face mpar (evento A) e sair as face 2 e 5 (evento B).
= { 1, 2, 3, 4, 5, 6 } N = 6
A = { 1, 3, 5, } n(A) = 3
B = { 2, 5 } n(B) = 2
Assim:
ou em porcentagem 0,5 x 100 = 50%
88 - 89
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
IV
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Complemento de um evento
Dado um evento A, o complemento de A (Ac) um evento que consiste de todos
os pontos amostrais que no esto em A. O diagrama abaixo ilustra o conceito.
A rea retangular representa o espao amostral; o crculo representa o evento A
e a regio com preenchimento, os pontos do complemento de A.
90 - 91
A k C = {2, 4, 6} k {1, 3, 5} =
Aj B = {2, 4, 5, 6}
Ac = {1, 3, 5} = C
Exerccios:
1. Demonstre o espao amostral no lanamento de um dado.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Tipo de Imvel
Total
Apartamento
Casa
Norte
30
28
58
Sul
40
56
96
Leste
38
34
72
Oeste
52
22
74
Total
160
140
300
Indique Norte por N; Sul por S; Leste por L; Oeste por O; Apartamento por A
e Casa por C.
Calcule as seguintes probabilidades:
P(N) =
P(S) =
Probabilidades
IV
P(L) =
P(O) =
P(A) =
P(C) =
P(N k A) =
P(S k C) =
P(O k C) =
P(N j A) =
P(S j C) =
P(L j A) =
P(O j C) =
R:
1. = {1, 2, 3, 4, 5, 6}
2. a) = {(1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3)
(5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)}
b) A1 = {(1,1) (2,2) (3,3) (4,4) (5,5) (6,6)}
P(A1) = 6/36 = 0,17
A2 = {(1,2) (2,4) (3,6)}
P(A2) = 3/36 = 0,08
A3 = {(1,1) (1,3) (1,5) (3,1) (3,3) (3,5) (5,1) (5,3) (5,5)}
P(A3) = 9/36 = 0,25
A4 = {(1,1) (2,2) (2,4) (3,3) (4,4) (5,5) (6,6)}
P(A4) = 7/36 = 0,19
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
P(L k A) =
92 - 93
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
A5 = {(1,6) (2,5) (3,4) (4,3) (5,2) (6,1)}
P(A5) = 6/36 = 0,17
3. 0,193; 0,32; 0,24; 0,257; 0,533; 0,467; 0,1; 0,187; 0,127; 0,073; 0,627; 0,6;
0,647; 0,64
Probabilidade condicional
Frequentemente, a probabilidade de um evento influenciada pela ocorrncia de
um evento paralelo. Seja A um evento com probabilidade P(A). Se obtivermos a
informao extra que o evento B ocorreu paralelamente, iremos tirar vantagem
dela no clculo de uma nova probabilidade para o evento A. Esta ser escrita
como P(A | B) e lida como probabilidade de A dado B.
Neste caso, podemos utilizar esta informao extra para realocar probabilidades aos outros eventos. Vamos utilizar o exemplo da tabela do exerccio
anterior nmero 3.
Regio
Tipo de Imvel
Total
Apartamento
Casa
Norte
30
28
58
Sul
40
56
96
Leste
38
34
72
Oeste
52
22
74
Total
160
140
300
Probabilidades
IV
Assim, escrevemos:
P(N | A) e l-se probabilidade de N dado A, sendo a condio A, ou seja,
ser Apartamento, sendo que:
Observe que se trocarmos a condio para ser do tipo A, dado que a regio Norte,
a condio agora ser da regio Norte e o problema ficaria da seguinte maneira:
Exerccios:
Baseado na tabela acima, calcular as seguintes probabilidades:
P(S | C) =
P(C | S) =
P (L | A) =
P(A | L) =
P(O | C) =
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
De forma geral, para dois eventos quaisquer A e B, sendo P(B) > 0, definimos
a probabilidade condicional de A | B como sendo P(A | B) dado pela seguinte
frmula:
94 - 95
P(C | O) =
R: 0,4; 0,583; 0,238; 0,528; 0,157; 0,297
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Eventos independentes
Dois eventos A e B so independentes se P(A | B) = P(A) ou P(A | B) = P(B).
Caso contrrio, os eventos so dependentes.
Regra da multiplicao
A relao geral mostrada acima foi:
Probabilidades
IV
Probabilidades
BB
BP
PB
PP
Total
1,0
Observe que o clculo das probabilidades, na segunda retirada, ficaria condicionado aos resultados da primeira retirada. Assim, indicando B por branca e P
por preta, vejamos o clculo das probabilidades.
a) Qual a probabilidade de sair bola branca na primeira retirada?
P(B) = 2/5
b) Qual a probabilidade de sair bola branca na primeira retirada e bola preta
na segunda retirada?
P(B na 1 k P na 2 ) = 6/20
c) Qual a probabilidade de sair bola preta na segunda retirada, dado que saiu
branca na primeira retirada?
P(P na 2 | B na 1 ) = 3/4
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Resultados
96 - 97
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Resultados
Probabilidades
BB
BP
PB
PP
Total
1,0
Observe que os clculos das probabilidades na segunda retirada no ficariam condicionados aos resultados da primeira retirada. Assim, indicando B por branca
e P por preta, vejamos o clculo das probabilidades.
a) Qual a probabilidade de sair bola branca na primeira retirada?
P(B) = 2/5
Probabilidades
IV
Regras de Probabilidade
P(A ou B), para eventos no mutuamente
excludentes:
P(A ou B ou ambos) = P(A) + P(B)
P(A e B)
Para eventos mutuamente excludentes:
P(A ou B) = P(A) + P(B)
Para eventos independentes:
P(A e B) = P(A) . P(B)
Para eventos dependentes:
P(A e B) = P(B).P(A | B) ou P(A).P(B | A)
PROBABILIDADES
shutterstock
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
98 - 99
Exerccios:
1. Uma urna contm 5 bolas pretas e 4 azuis. Em duas extraes consecutivas, sem reposio, determine os resultados esperados e calcule as
seguintes probabilidades:
a. de retirar a primeira azul e a segunda preta;
b. de retirar a primeira azul e a segunda azul;
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
IV
Distribuies de Probabilidade
Resultados
Valor da varivel
aleatria
(sair cara)
PROBABILIDADES
Probabilidade do
resultado
CC
x=
CK
x=
KC
x=
KK
x=
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
100 - 101
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Probabilidade do
resultado
+ = 2/4
Total
1,0
Distribuio de Bernoulli
A distribuio de Bernoulli consiste em uma distribuio em que a varivel aleatria assume apenas dois possveis resultados: sucesso (o evento se realiza) ou
fracasso (o evento no se realiza).
Exemplos:
Lanamento de uma moeda: o resultado cara ou no.
Uma pea escolhida ao acaso: o resultado defeituosa ou no.
Distribuies Discretas de Probabilidade
IV
Distribuio Binomial
Um experimento Binomial aquele que consiste em uma sequncia de n ensaios
idnticos e independentes. Cada tentativa pode resultar em apenas dois resultados possveis: sucesso e fracasso, e a probabilidade de sucesso constante de
uma tentativa para outra.
Exemplos:
Lanamento de uma moeda 5 vezes e observarmos o nmero de caras.
10 peas so escolhidas ao acaso e observarmos as falhas.
5 cidades so observadas quanto ao acesso a rede de internet.
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
102 - 103
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Designando por X: o nmero total de sucessos em n tentativas, com probabilidade p de sucesso, sendo 0 < p < 1. Os possveis valores de X so 0, 1, 2,....n e
os pares (x, p(x)), em que p(x) = P(X = x), constituem a distribuio Binomial,
de modo que :
Em que:
k = nmero de sucessos;
n = nmero de elementos da amostra;
p = probabilidade de sucesso;
q = probabilidade de fracasso.
A mdia e a varincia de uma distribuio binomial so dadas por:
E(x) = np
Var (x) = npq
Exemplos:
Um processo industrial na fabricao de monitores opera com mdia de 5%
de defeituosos. Baseado em amostras de 10 unidades, calcule as probabilidades
de uma amostra apresentar:
a) nenhum monitor com defeito:
= 0,598 ou 59,8%
P(x = 0) =
Observe que:
n = 10
k=0
p = 5% ou 0,05
q = 1 0,05 = 0,95
Distribuies Discretas de Probabilidade
IV
Aps a retirada dos dados, basta ento que joguemos esses valores na frmula.
Vejamos outro exemplo:
b) 3 monitores com defeito:
= 0,010 ou 1%
P(x = 3) =
P(x = 10) =
= 9,76 x 10-14
P(x = 1) =
= 0,315 ou 31,5%
P(x = 2) =
= 0,074
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
104 - 105
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Distribuio de Poisson
A distribuio de Poisson frequentemente til para estimar o nmero de ocorrncias sobre um intervalo de tempo ou de espaos especficos. A probabilidade
de uma ocorrncia a mesma para qualquer dos intervalos de igual comprimento e a ocorrncia ou no em um intervalo independente da ocorrncia ou
no em qualquer outro intervalo.
Exemplos:
Nmero de chamadas telefnicas durante 10 minutos.
Nmero de falhas de uma mquina durante um dia de operao.
Nmero de acidentes ocorridos numa semana.
Nmero de mensagens que chegam a um servidor por segundo.
Defeitos por m2 etc.
Dizemos que a varivel aleatria tem distribuio de Poisson com parmetro > 0 se:
, k = 0, 1, 2,... em que:
P (X) =
P(X) = probabilidade de X ocorrncias em um intervalo;
= nmero esperado de ocorrncias em um intervalo;
e = constante matemtica (aproximadamente 2,71828);
X = nmero de sucessos por unidade.
O valor mdio pela distribuio de Poisson dado pela sua esperana em que:
E(X) =
A varincia para a distribuio de Poisson dada por:
Var (X) = ,
sendo que representa o nmero mdio de eventos ocorrendo num intervalo
considerado.
Vale ressaltar que a Distribuio de Poisson no tem um limite superior, ou seja,
o nmero de ocorrncias x pode assumir uma infinita sequncia de valores.
Exemplos:
1. Um departamento de polcia recebe 5 solicitaes por hora em mdia relacionadas a crimes cometidos. Qual a probabilidade de receber:
a) 2 solicitaes numa hora selecionada aleatoriamente?
Distribuies Discretas de Probabilidade
IV
P (X) =
= 0,0842 ou 8,42%
=0,0842 ou 8,42%
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
P (X) =
= 0,034 ou 3,4%
106 - 107
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
IV
Distribuio uniforme
Sendo que:
Distribuio Exponencial
A Distribuio Exponencial de Probabilidade uma distribuio contnua muito
til para descrever o tempo que se leva para completar uma tarefa.
A funo densidade de probabilidade que identifica uma varivel exponencial
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
108 - 109
:
f (x) = m e
- mx
= mdia
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
x = tempo
A esperana e varincia de x so dadas por:
Considere o exemplo:
Em uma grande empresa de computadores, as conexes dos usurios ao sistema
tm mdia de 20 conexes por hora. Qual a probabilidade de no haver conexes em um intervalo de 0,6 minutos?
6 minutos = 0,1 hora...assim,
A esperana e a varincia x sero dadas por
E(x) = 1 = 0,05 ou 3,0 minutos
20
1
2
Var(x) = 20 = 0,0025 Desvio padro =
minutos
Enquanto a Distribuio Discreta de Poisson fornece uma descrio do nmero de ocorrncias por intervalo, a Distribuio Exponencial Contnua de
probabilidade fornece uma descrio do comprimento do intervalo entre
as ocorrncias.
IV
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
110 - 111
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Quando uma varivel aleatria tem uma distribuio normal com mdia zero e
desvio padro 1, tem uma distribuio normal padro de probabilidade.
Nenhuma das tcnicas de integrao padro pode ser usada para calcular a
integral acima. Assim, quando = 0 e = 1, esta expresso foi calculada e tabulada para valores determinados de a e b. Nesta tabela se entra com a varivel
reduzida ou varivel padronizada Z e se encontra f(Z) ou vice-versa.
IV
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.0000
0.0040
0.0080
0.0120
0.0160
0.0199
0.0239
0.0279
0.0319
0.0359
0.1
0.0398
0.0438
0.0478
0.0517
0.0557
0.0596
0.0636
0.0675
0.0714
0.0753
0.2
0.0793
0.0832
0.0871
0.0910
0.0948
0.0987
0.1026
0.1064
0.1103
0.1141
0.3
0.1179
0.1217
0.1255
0.1293
0.1331
0.1368
0.1406
0.1443
0.1480
0.1517
0.4
0.1554
0.1591
0.1628
0.1664
0.1700
0.1736
0.1772
0.1808
0.1844
0.1879
0.5
0.1915
0.1950
0.1985
0.2019
0.2054
0.2088
0.2123
0.2157
0.2190
0.2224
0.6
0.2257
0.2291
0.2324
0.2357
0.2389
0.2422
0.2454
0.2486
0.2517
0.2549
0.7
0.2580
0.2611
0.2642
0.2673
0.2704
0.2734
0.2764
0.2794
0.2823
0.2852
0.8
0.2881
0.2910
0.2939
0.2967
0.2995
0.3023
0.3051
0.3078
0.3106
0.3133
0.9
0.3159
0.3186
0.3212
0.3238
0.3264
0.3289
0.3315
0.3340
0.3365
0.3389
1.0
0.3413
0.3438
0.3461
0.3485
0.3508
0.3531
0.3554
0.3577
0.3599
0.3621
1.1
0.3643
0.3665
0.3686
0.3708
0.3729
0.3749
0.3770
0.3790
0.3810
0.3830
1.2
0.3849
0.3869
0.3888
0.3907
0.3925
0.3944
0.3962
0.3980
0.3997
0.4015
1.3
0.4032
0.4049
0.4066
0.4082
0.4099
0.4115
0.4131
0.4147
0.4162
0.4177
1.4
0.4192
0.4207
0.4222
0.4236
0.4251
0.4265
0.4279
0.4292
0.4306
0.4319
1.5
0.4332
0.4345
0.4357
0.4370
0.4382
0.4394
0.4406
0.4418
0.4429
0.4441
1.6
0.4452
0.4463
0.4474
0.4484
0.4495
0.4505
0.4515
0.4525
0.4535
0.4545
1.7
0.4554
0.4564
0.4573
0.4582
0.4591
0.4599
0.4608
0.4616
0.4625
0.4633
1.8
0.4641
0.4649
0.4656
0.4664
0.4671
0.4678
0.4686
0.4693
0.4699
0.4706
1.9
0.4713
0.4719
0.4726
0.4732
0.4738
0.4744
0.4750
0.4756
0.4761
0.4767
2.0
0.4772
0.4778
0.4783
0.4788
0.4793
0.4798
0.4803
0.4808
0.4812
0.4817
2.1
0.4821
0.4826
0.4830
0.4834
0.4838
0.4842
0.4846
0.4850
0.4854
0.4857
2.2
0.4861
0.4864
0.4868
0.4871
0.4875
0.4878
0.4881
0.4884
0.4887
0.4890
2.3
0.4893
0.4896
0.4898
0.4901
0.4904
0.4906
0.4909
0.4911
0.4913
0.4916
2.4
0.4918
0.4920
0.4922
0.4925
0.4927
0.4929
0.4931
0.4932
0.4934
0.4936
2.5
0.4938
0.4940
0.4941
0.4943
0.4945
0.4946
0.4948
0.4949
0.4951
0.4952
2.6
0.4953
0.4955
0.4956
0.4957
0.4959
0.4960
0.4961
0.4962
0.4963
0.4964
2.7
0.4965
0.4966
0.4967
0.4968
0.4969
0.4970
0.4971
0.4972
0.4973
0.4974
2.8
0.4974
0.4975
0.4976
0.4977
0.4977
0.4978
0.4979
0.4979
0.4980
0.4981
2.9
0.4981
0.4982
0.4982
0.4983
0.4984
0.4984
0.4985
0.4985
0.4986
0.4986
3.0
0.4987
0.4987
0.4987
0.4988
0.4988
0.4989
0.4989
0.4989
0.4990
0.4990
Vale ressaltar que tabelas com diferentes integrais calculadas podem ser encontradas. A tabela acima fornece sempre a seguinte rea sob a curva.
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
0.00
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
112 - 113
IV
De tomarmos um lote ao acaso e este ter uma taxa de falhas entre 2,0 e 2,5
Traduzindo para linguagem probabilstica, queremos:
P(2,0 < x < 2,5) = ?
Primeiramente, vamos padronizar os dados.
Lembre-se que a frmula da padronizao :
e que
= 2,0
= 0,5
Assim:
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
114 - 115
De tomarmos um lote ao acaso e ter menos que uma taxa de falhas de 2,5.
P(x < 2,5) = P(z < 1) = 0,5 0,3413 = 0,1587 ou 15,87%
De tomarmos um lote ao acaso e ter mais que uma taxa de falhas de 2,5.
P(x > 2,5) = P(z > 1) = 0,5 + 0,3413 = 0,8413 ou 84,13%
De tomarmos um lote ao acaso e ter uma taxa de falhas entre 1,25 e 2,0
falhas.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Consideraes Finais
Vimos nesta unidade a importncia das probabilidades no nosso cotidiano.
A teoria das probabilidades tenta quantificar a noo de provvel, sendo
uma ferramenta estatstica de grande utilidade quando se trabalha com inmeros eventos relacionados a pesquisas em empresas, rgos governamentais
e instituies de ensino. Essa ferramenta lida com as chances de ocorrncias de
algo que vai acontecer, ento dizemos que ela lida com fenmenos aleatrios.
Portanto, necessrio conhecer o material de estudo para poder calcular essas
chances ou probabilidades de maneira correta e ento tomarmos nossas decises com base em nossas estimativas.
Consideraes Finais
IV
PROBABILIDADES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
116 - 117
Adequao de trilhas
Aprovado
Total
Reprovado
Alta
700
140
840
Baixa
100
60
160
Total
800
200
1000
118 - 119
CORRELAO LINEAR E
REGRESSO
UNIDADE
Objetivos de Aprendizagem
Conhecer o coeficiente de correlao linear.
Entender associao entre duas variveis.
Saber interpretar correlao positiva e negativa.
Compreender a correlao e aplicao da correlao de Pearson.
Conhecer a utilizao da regresso linear.
Entender a predio de uma varivel por meio de outra.
Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Coeficiente de Correlao (r)
Aspectos Gerais da Correlao Linear
Correlao de Pearson
Anlise de Regresso
Regresso Linear Simples
SHUTTERSTOCK
120 - 121
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Introduo
A estatstica apresenta muitas ferramentas para descrever e analisar dados de
pesquisas. A escolha das ferramentas a serem utilizadas na pesquisa depende
dos objetivos da mesma, bem como do tipo de varivel com a qual se trabalha.
Como visto na unidade I, as variveis podem ser qualitativas e quantitativas.
Esta distino importante, uma vez que as ferramentas utilizadas para um tipo
de varivel nem sempre podem ser utilizadas para o outro tipo. importante tambm saber que nas pesquisas se utiliza no s uma, mas um grupo de variveis.
Em alguns casos, algumas variveis podem estar relacionadas de alguma
forma e a variao de uma vai depender da variao da outra.
As decises gerenciais geralmente so baseadas nas relaes entre duas ou
mais variveis. Por exemplo, aps considerar a relao entre gastos com publicidade e vendas, um gerente poderia tentar prever as vendas de acordo com o
nvel de gastos com a publicidade.
O fato de duas variveis estarem ligadas permite tomar decises se baseando
em uma varivel, porm esperando resposta em outra que seja de difcil mensurao ou s possa ser medida tardiamente.
Existem algumas medidas estatsticas que permitem medir o grau de associao entre duas variveis. Nesta unidade, iremos ver duas delas: a correlao linear
e a regresso linear. Entretanto, essas duas ferramentas s podem ser utilizadas
quando as variveis medidas so quantitativas. Assim, nesta unidade, voc estar
vendo como podemos verificar a associao entre variveis ou a dependncia de
uma varivel em funo da outra, e tambm como quantificar esta associao.
Introduo
Correlao Linear
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
122 - 123
Exemplo:
Verifique se existe correlao linear entre o nmero de nascidos vivos e a
taxa de mortalidade infantil na regio de Maring-PR.
Regional de Sade e
Municpios
Total Menor de 01
ano
Nascidos Vivos *
289
Colorado
246
Floresta
68
Itamb
67
Mandaguau
251
Mandaguari
423
Marialva
378
Nova Esperana
423
Paiandu
443
So Jorge do Iva
59
Inicialmente, interessante traar um diagrama de disperso para as duas variveis para nos dar uma ideia de como ocorre a variao conjunta dos dados.
Grfico 11: Disperso da taxa de mortalidade at 1 ano e o nmero de nascidos vivos na regio de Maring
Fonte: SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Astorga
124 - 125
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Cidade
x.y
x2
y2
Astorga
289
1734
83521
36
Colorado
246
492
60516
Floresta
68
68
4624
Itamb
67
67
4489
Mandaguau
251
1004
63001
16
Mandaguari
423
2538
178929
36
Marialva
378
1890
142884
25
Nova Esperana
423
3807
178929
81
Paiandu
443
1772
196249
16
So Jorge do
Iva
59
3481
Soma
2647
38
13372
916623
216
Observe que o valor do coeficiente de correlao foi 0,84. Assim, podemos concluir que existe uma forte correlao ou associao entre o nmero de nascidos
vivos e a taxa de mortalidade antes de 1 ano de idade, uma vez que o valor 0,84
um valor prximo de 1. Em seguida, podemos verificar que, como mostrado
no diagrama de disperso, o valor dessa correlao positivo, ento podemos
Coeficiente de Correlao Linear de Pearson
Coeficiente de Determinao
Anlise de Regresso
A anlise de regresso uma tcnica estatstica cujo objetivo investigar e descrever a relao entre variveis por meio de um modelo matemtico. Esta relao
explorada de modo que se possa obter informaes sobre uma varivel, por
meio dos valores conhecidos das outras.
Primeiramente, preciso estudar a dependncia de uma varivel em relao outra e, assim, indicar a varivel independente para o eixo x e a varivel
dependente para o eixo y. medida que a varivel independente (ou explicativa)
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
O coeficiente de determinao expressa a porcentagem de variao dos valores de Y em funo do valor X, ou seja, este coeficiente mostra at que ponto
a variao conjunta dos dados de fato linear. Esse coeficiente varia de 0 a 1,
sendo que quanto mais perto de 1, maior variao conjunta das duas variveis
e mais a varivel y poder ser explicada pela varivel x. O coeficiente de determinao dado por R2, ou seja, o smbolo do coeficiente de determinao
dado por R maisculo e dado pelo valor encontrado para a correlao linear
de Pearson ao quadrado.
Utilizando um exemplo em que r = 0,84 o coeficiente de determinao ser
dado por:
R2 = 0,842= 0,7056
Isso mostra que a variao conjunta dos dados boa, ou seja, a variao taxa
de mortalidade pode ser explicada pela variao no nmero de nascidos vivos.
Observe que os dados retirados pela estatstica se encaixam.
126 - 127
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
[...] a correlao entre beber um copo de vinho por dia e a menor chance de
infarto do miocrdio um bom exemplo. Estudos recentes mostram que ela
no se deve ao vinho e ao lcool, mas sim ao betacaroteno, corante contido
na uva. Para infelicidade de muitos, tomar suco de uva d o mesmo resultado que beber vinho tinto.
Fonte: Jornal do Brasil, 08/01/1999 apud Cntia Paese Giacomello - Probabilidade e Estatstica (apostila).
O diagrama de disperso mostra o tipo de relao que existe entre x e y e tambm verifica se o modelo proposto (y = a + bx) explica bem a variao dos dados.
O modelo explicar melhor quanto mais perto dos dados ou pontos (visto no
grfico) a reta estiver.
O mtodo mais usado para ajustar uma linha reta a um conjunto de pontos
conhecido como mtodo dos mnimos quadrados que nos fornece os seguintes resultados para estimarmos a:
e
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
128 - 129
Exemplo:
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Regional de Sade e
Municpios
Nascidos
Vivos *
Total Menor de 01
ano
Astorga
289
Colorado
246
Floresta
68
Itamb
67
Mandaguau
251
Mandaguari
423
Marialva
378
Nova Esperana
423
Paiandu
443
So Jorge do Iva
59
Nesse caso, a varivel x o nmero de nascidos vivos, a varivel y a taxa de mortalidade, uma vez que evidente que a taxa de mortalidade depende do nmero
de nascidos vivos. A partir dessa definio, necessria a estimao dos parmetros da equao a e b.
Cidade
Nascidos vivos
(x)
Taxa de
mortalidade (y)
x.y
x2
Astorga
289
1734
83521
Colorado
246
492
60516
Floresta
68
68
4624
Itamb
67
67
4489
Mandaguau
251
1004
63001
Mandaguari
423
2538
178929
Marialva
378
1890
142884
Nova Esperana
423
3807
178929
Paiandu
443
1772
196249
So Jorge do Iva
59
3481
Soma
2647
38
13372
916623
Nmero de nascidos
vivos (x)
a + bx
59
- 0,17 + 0,015 . 59
0,715
67
- 0,17 + 0,015 . 67
0,835
68
- 0,17 + 0,015 . 68
0,85
246
3,52
251
3,595
289
4,165
378
5,5
423
6,175
443
6,475
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
130 - 131
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Para cada nmero de nascidos vivos temos uma taxa de mortalidade prevista. A representao grfica para esta situao pode ser observada no diagrama
de disperso abaixo.
Grfico 12: Diagrama de disperso para a taxa de mortalidade prevista em funo do nmero de nascidos
vivos
Observe que para cada nmero de nascidos vivos foi construda uma equao
e obtida uma taxa de mortalidade prevista. No grfico 2 mostrada a reta que
descreve os dados e a ttulo de exemplificao, foi mostrado um ponto no grfico em que o nmero de nascidos vivos (disposto no eixo x) foi 378 e a taxa de
mortalidade (disposta no eixo y) prevista de 5,41.
Vimos que a correlao linear de Pearson mostrou um valor alto para a relao entre o nmero de nascidos vivos e a taxa de mortalidade (0,84), e que foi
verificada uma correlao populacional acima de 0. Na anlise de regresso utilizamos tambm o coeficiente de determinao para verificar a preciso da reta
de regresso e dizer se ela explica bem ou no a variao dos dados.
Como vimos:
R2 = 0,7056
A explicao para a anlise de regresso ser:
70,56% da variao observada na taxa de mortalidade explicada pela reta
de regresso. Isto mostra que a reta se aproxima bem dos pontos observados. A
reta de regresso mostra as equaes de regresso previstas e os pontos so os
valores observados.
Regresso Linear Simples
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Grfico 13: Diagrama de disperso para a taxa de mortalidade prevista e taxa de mortalidade observada em
funo do nmero de nascidos vivos
132 - 133
Exerccios:
(Retirados de: <www.inf.ufsc.br/~ogliari/arquivos/Correlacao.ppt#320,10,
Slide 10>. Acesso em: 05 fev. 2013.)
Resultado de um teste (de 0 a 100) sobre conhecimento (X) e tempo gasto
(minutos) para aprender a operar uma mquina (Y) para oito indivduos.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Indivduo
Teste (X)
Tempo (Y)
45
343
52
368
61
355
70
334
74
337
76
381
80
345
90
375
Responda:
1. Construa um diagrama de disperso entre as variveis teste e tempo.
2. Calcule os valores do coeficiente de regresso linear b e do intercepto a.
3. Demonstre os valores das equaes para o tempo esperado ou previsto
para todos os valores do teste.
4. Demonstre o diagrama de disperso para as duas variveis utilizando
os y preditos.
5. Demonstre o valor do tempo esperado quando o valor do teste for igual
a 69.
R: 2) a = 316,462 e b = 0,548
A anlise de regresso tambm pode ser feita com vrias variveis independentes sobre uma nica varivel dependente. A esse tipo de anlise damos
o nome de anlise de regresso mltipla, que muito utilizada em aplicaes financeiras como renda, poupana e juros. Para ver um exemplo, ler
Barbetta et al. (2010, p. 346).
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Consideraes Finais
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
134 - 135
importante entender que nem sempre duas variveis esto de fato associadas. Para isso, h necessidade da avaliao do coeficiente de determinao na
anlise de regresso. tambm importante termos bom senso na hora de calcular
algumas medidas, uma vez que estamos trabalhando com frmulas matemticas
para explicar fenmenos. Assim, sempre algum valor ser extrado numericamente, porm nem sempre esses valores podem ser explicados biologicamente
ou socialmente. Portanto, cabe ao pesquisador escolher quais variveis devem
participar das anlises.
Pode-se concluir que Correlao e Regresso linear so duas ferramentas de
grande importncia e aplicabilidade, dentro de vrias reas, inclusive nas reas
ligadas a negcios e sua utilizao depende do conhecimento do pesquisador.
Consideraes Finais
2,2
2,1
3,0
2,9
10
44,1
10
4,5
11
6,2
11
5,9
12
9,8
12
8,7
13
12,5
13
13,1
14
19,3
14
17,4
15
28,2
136 - 137
138 - 139
Concluso
Caro(a) aluno(a)!
Este material foi feito para contribuir com seu processo de formao. Atualmente,
as informaes chegam a ns de forma rpida e no podemos deixar de pensar o
quanto a Estatstica til para quem precisa tomar decises. O mundo passa por
transformaes econmicas, polticas e sociais que tm nos levado a adotar estratgias para elevar a qualidade dos nossos trabalhos. Essas transformaes esto ocorrendo mundialmente devido globalizao, verificando-se inovaes tecnolgicas,
fazendo com que tenhamos um mundo cada vez mais competitivo.
Nesse sentido, a estatstica aparece como suporte na compreenso dos fatos, dando
base para o seu entendimento e compreenso adequada dos mesmos. Assim, podemos dizer que importante conhecermos a estatstica, de onde ela surgiu, seus
mtodos e aplicaes no mundo atual, pois isso enriquece nosso conhecimento e
aumenta nosso poder de discusso perante o meio em que vivemos.
Este material tratou de alguns pontos importantes no ensino da Estatstica. O primeiro ponto tratou da importncia da estatstica, seus conceitos e da aplicao de
algumas de suas ferramentas. A estatstica se preocupa com dados. Em qualquer
pesquisa, seja ela de ordem observacional ou experimental, pesquisas eleitorais ou
sobre aceitao de algum produto, pesquisas comparativas, dentre tantas outras,
utilizamos a Estatstica.
Na Unidade II foram discutidas formas de apresentao dos dados estatsticos, mais
especificamente a estruturao e interpretao de grficos e tabelas. Essas duas
ferramentas estatsticas so valiosas. Basta abrirmos uma revista ou jornal para observar alguma tabela ou grfico mostrando a sntese de alguma pesquisa realizada.
Assim, de grande utilidade entender o processo de construo, bem como o de
anlise de uma figura ou de uma tabela que trazem informaes importantes sobre
pesquisas que so feitas no Brasil e no mundo.
A Unidade III tratou das medidas descritivas, mostrou como devemos calcul-las e
onde devemos aplic-las. Essas medidas representam, com um nico valor, o conjunto de dados. Vimos as principais medidas de posio, as separatrizes e as medidas de disperso. De forma geral, sempre representamos os dados por meio de
pelo menos uma medida de posio e uma de disperso, sendo as mais utilizadas a
mdia, como medida de posio representando os dados, e o desvio padro, como
medida de disperso, mostrando a variabilidade dos dados.
Na Unidade IV trabalhamos com parte da teoria das probabilidades e algumas de
suas principais distribuies. As probabilidades mostram as chances de eventos
ocorrerem. Inicialmente os clculos so simples. Entretanto, medida que vamos
nos aprofundando ao contedo percebemos que h necessidade e entendimento minucioso sobre o que est sendo mostrado para utilizar o clculo adequado e
assim obtermos as respectivas probabilidades sem erros. As probabilidades condicionais so interessantes medida que entendemos que em algumas situaes a
chance de um evento ocorrer pode depender da chance de outro evento ocorrer.
Concluso
Existem algumas regras que foram mostradas em relao s probabilidades que devemos segui-las de forma correta para termos resultados confiveis. As distribuies
de probabilidades, vistas tambm nessa unidade, lida com probabilidades, porm
associadas ao tipo de varivel aleatria em questo. Para utilizarmos qualquer distribuio, necessrio saber se a varivel aleatria numrica contnua, discreta, se
exige intervalo de tempo ou outras particularidades. O mau uso dessas distribuies implica em anlises de dados distorcidas e concluses errneas.
Finalizando o material, a Unidade V tratou das medidas de associao, duas ferramentas importantes dentro da estatstica. Tanto a correlao quanto a regresso envolvem associao entre variveis, embora a funo de cada uma delas seja diferente. Na correlao tem-se o grau de associao entre as duas variveis; na regresso o
que se obtm estimao de uma varivel por meio da outra. Entender como duas
variveis se relacionam importante dentro da anlise de dados. Alguns critrios
devem ser seguidos, entretanto, ao se trabalhar com regresso ou correlao, essas
medidas s podem ser utilizadas em casos de variveis quantitativas. Para associar
variveis qualitativas, existem outras medidas estatsticas apropriadas. Outro cuidado a ser verificado que nem sempre que, numericamente, existe correlao ou
regresso, a associao pode ser explicada. Alm disso, testes estatsticos tambm
podem ser utilizados para verificar a significncia dessas duas medidas dentro de
cada anlise.
A estatstica lida com incertezas e, assim, podemos incorrer ao erro. Portanto, ao se
fazer uso de algum teste estatstico, a margem de erro, que deve ser pequena, deve
ser estabelecida, sendo sua escolha critrio do pesquisador.
Finalizamos este material que foi feito com cuidado para contribuir com o seu crescimento profissional e pessoal. Aproveite!
Professora Me. Ivnna Gurniski Carniel
Unidade I
1. A Estatstica pode ser definida como uma parte da matemtica que se preocupa
em coletar, organizar, descrever, analisar e interpretar um conjunto de dados.
A estatstica descritiva se preocupa em descrever os dados.
A estatstica inferencial se preocupa com a anlise dos dados e sua interpretao. Ela
analisa os dados com base na amostra e ento estende as concluses desta amostra
populao.
2. Populao conjunto de elementos que possuem alguma caracterstica em comum.
Amostra parte da populao, devendo ser representativa da mesma.
Censo levantamento de dados de toda uma populao.
Estimao obteno de valores de uma amostra.
Variveis caractersticas tomadas em uma populao ou amostra como, por
exemplo: sexo, idade, regio de procedncia, peso etc.
3. Amostra casual simples - aquela em que todos os elementos da populao tm
igual probabilidade de pertencer amostra. Pode ser obtida sorteando os elementos a partir da populao de estudo.
Amostra Sistemtica - uma forma simplificada da amostragem casual simples, podendo ser utilizada quando os elementos da populao se apresentam ordenados,
sendo a retirada dos elementos para compor a amostra feita com certa periodicidade.
Amostra Estratificada uma amostra em que a populao separada em grupos
ou estratos, e dentro de cada estrato os indivduos so sorteados, devendo os mesmos ser semelhantes entre si dentro de cada estrato.
Amostra por conglomerado uma amostra em que a populao dividida em
diferentes conglomerados, extraindo-se uma amostra apenas dos conglomerados
selecionados, e no de toda a populao.
4. Representar os dados por meio de grficos e tabelas: os dados so apresentados
de forma resumida, em que h uma visualizao rpida e fcil dos mesmos para o
pblico. H um entendimento melhor dos dados, ficando fcil de sabermos o que
est ocorrendo com os dados coletados.
5.
a) Funcionrio da empresa, amostragem estratificada.
b) Senadores do Brasil, amostragem aleatria simples.
140 - 141
Unidade II
1.
Tabela 1 Distribuio de frequncias para a varivel topologia
Topologia
Fi
Fac
C1
37,5
37,5
C2
50
87,5
C3
12,5
100
Total
100
2.
Classes
Fi
Fac
Ponto
mdio
5---5,63
6,25
6,25
5,315
5,63---6,26
25
31,25
5,945
6,26---6,89
43,75
75
6,575
6,89---7,52
25
100
7,205
Total
16
100
4.
Unidade III
1.
a) A mdia mais utilizada, pois a medida mais precisa, nica num conjunto de
dados e sempre existe.
b) Os problemas da mdia ocorrem porque ela afetada por medidas extremas, ou
seja, valores muito altos ou muito baixos, destoando da maioria dos outros valores,
podem comprometer o valor da mdia. Alm disso, em conjuntos de dados muito
heterogneos, ela no uma medida que representa bem o conjunto de dados.
2.
x = 95,8 mm
a)
a mdia aritmtica:
a moda: Mo = 96 mm
a mediana: Md = 96 mm
b)
CV = 6,12%
d)
Para o Q3 temos:
Para o D6 temos
p = 0,6(9+1) = 6
D6 = 96 + 0,96(100-96) = 99,84
Dizemos que 60% dos valores esto abaixo de 99,84 mm.
3.
a)
x = 6,44 dias
Mo = 6,48
Md = 6,5
b)
s2 = 3,33
s = 1,82
c)
CV = 28,26%
d)
Q3 = 7,5 e P4 = 2
Unidade IV
1. Espao amostral o conjunto de todos os possveis resultados do experimento
aleatrio.
Eventos: um dos possveis resultados do experimento aleatrio e o qual se deseja
saber a probabilidade de ocorrncia.
a)
b)
0,53 ou 53%
c)
d)
a)
b)
c)
d)
e)
= 940/1000
f)
= 300/1000
g)
h)
P (X) =
E(x) = 80
Var (x) = 80
=0,0039 ou 0,39%
Desvio padro =
a)
0,4332 ou 43,32%
b)
0,0668
c)
d)
0,8413 ou 84,13%
Unidade V
1.
a) A varivel independente o comprimento do cabo x e a varivel dependente
a
varivel taxa de falhas y, ou seja, a taxa de falhas depende
do comprimento do cabo.
b) 0,47 verifica-se uma correlao mediana e positiva entre as duas variveis a,
mostrando que quanto maior o comprimento do cabo maior a
taxa de falhas.
c) tc = 2,17
ttabelado = 3,06
tc < ttabelado conclui-se que no existe significncia na correlao entre
as duas variveis em nvel de 1% de erro.
d) Correlao substancial entre as duas variveis.
e) b = 2,4 a = -15,2
f )
Comprimento do
cabo(m)
4,08
6,49
10
8,9
11
11,31
12
13,72
13
16,13
14
18,54
15
20,95
g) Diagrama de disperso
Pelo coeficiente de alienao observamos que h mais ausncia que relao entre
as duas variveis.
i)Na correlao linear, medimos somente o grau de associao linear entre duas
variveis. J na anlise de regresso medimos o quanto de variao de uma varivel
que explicada pela outra; podemos tambm fazer predies de uma varivel
baseada em outra.
2) 120; 170; 220
148 - 149
Referncias
BARBETTA, P. A. et al. Estatstica para os cursos de engenharia e informtica. 3.
ed. So Paulo: Atlas, 2010.
BUSSAB, W. O. ; MORETTIN, P. A. Estatstica Bsica. So Paulo: Editora Saraiva, 2003.
GIACOMELLO, Cintia Paese. Probabilidade e Estatstica. Jornal do Brasil.
Universidade de Caxias do Sul.
GUEDES, T. A. et al. Projeto de Ensino: Aprender Fazendo Estatstica. Disponvel em:
<www.des.uem.br>. Acesso em: 15 jun. 2012.
IBGE. Comentrios. Disponvel em: <http://www.ibge.gov.br/home/estatistica/
populacao/trabalhoerendimento/pnad2007/comentarios2007.pdf>. Acesso em: 15
jun. 2012.
MAGALHES, M. N.; LIMA, A. C. P. de. Noes de Probabilidade e Estatstica. So
Paulo: IME-USP, 2008.
MONTGOMERY, D. C.; RUNGER, G. C. Estatstica Aplicada e Probabilidade para
Engenheiros. Rio de Janeiro: Livros Tcnicos e Cientficos Editora S.A., 2003.
STEEN, L. A. Why numbers count: quantitative literacy for tomorrows America.
USA: College Entrance Examination Board, 1997.
TOLEDO, G. L. ; OVALLE, I.I. Estatstica Bsica. So Paulo: Atlas, 1997.
TRIOLA, Mrio F. Introduo Estatstica. Rio de Janeiro: LTC, 1999.
Site:
<www.inf.ufsc.br/~ogliari/arquivos/Correlacao.ppt#320,10, Slide 10>. Acesso em:
16 jun. 2012.