Edwin F. F. Silva
Possui licenciatura em Fsica pela Universidade Catlica de Braslia (2005); especializao em Higiene das radiaes
ionizantes (Senacap, 2011); em Metodologia do Ensino e Aprendizagem em Matemtica (2009); ps-graduao em
Transporte (em andamento) pela Universidade de Braslia. Atualmente, professor da Faculdade Fortium, ministrando
aulas de clculo e estatstica nos cursos de Sistema de Informaes e Administrao, e da Universidade Paulista, no
curso de Engenharia. Atua em pesquisas relacionadas poluio sonora, na rea de polos geradores de viagens e
tambm como corretor de questes dos cursos de graduao a distncia da UNIP e como tutor do curso de RH da
UNIP Interativa.
Possui licenciatura em Fsica pela Universidade Catlica de Braslia (2006); especializao em Matemtica
e Estatstica pela FACITEC (2008); ps-graduao em Transporte (em andamento) pela Universidade de Braslia.
Atualmente, professor da Universidade Paulista, ministrando aulas para os cursos de Engenharia, Gesto de RH
e Segurana Privada; da Faculdade JK, nos cursos de Administrao e Radiologia. Atua tambm como corretor de
questes dos cursos de graduao a distncia da UNIP e como tutor do curso de RH da UNIP Interativa. pesquisador
vinculado ao grupo de pesquisa em Poluio sonora com nfase em Rudos aeronuticos no curso de Fsica da
Universidade Catlica de Braslia.
CDU 519.2
Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrnico, incluindo fotocpia e gravao) ou arquivada em qualquer sistema ou banco de dados sem
permisso escrita da Universidade Paulista.
Prof. Dr. Joo Carlos Di Genio
Reitor
Comisso editorial:
Dra. Anglica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Ktia Mosorov Alonso (UFMT)
Dra. Valria de Carvalho (UNIP)
Apoio:
Profa. Cludia Regina Baptista EaD
Profa. Betisa Malaman Comisso de Qualificao e Avaliao de Cursos
Projeto grfico:
Prof. Alexandre Ponzetto
Reviso:
Andria Gomes
Geraldo Teixeira Jr.
Sumrio
Estatstica Aplicada
APRESENTAO.......................................................................................................................................................7
INTRODUO............................................................................................................................................................7
Unidade I
1 HISTRIA DA ESTATSTICA...............................................................................................................................9
1.1 Introduo estatstica.........................................................................................................................9
1.2 Importncia da estatstica..................................................................................................................11
1.3 Elementos fundamentais da estatstica....................................................................................... 12
1.3.1 Populao e amostra.............................................................................................................................. 12
1.4 Fases do mtodo estatstico.............................................................................................................. 13
1.5 Dados estatsticos................................................................................................................................. 13
1.6 Formas iniciais de tratamento dos dados................................................................................... 15
1.7 Notaes por ndices........................................................................................................................... 16
1.7.1 Notao sigma ().................................................................................................................................. 16
1.8 Sries estatsticas.................................................................................................................................. 19
2 APRESENTAO DE DADOS GRFICOS E TABELAS......................................................................... 21
2.1 Elementos bsicos das tabelas......................................................................................................... 27
3 MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA PARA
DADOS SIMPLES................................................................................................................................................... 27
3.1 A mdia aritmtica simples (x)........................................................................................................ 28
3.2 A mdia aritmtica ponderada xp.................................................................................................. 30
3.3 A mediana (Md)..................................................................................................................................... 32
3.4 A moda...................................................................................................................................................... 35
3.5 Posio relativa da mdia, moda e mediana.............................................................................. 37
4 MEDIDAS DE DISPERSO PARA DADOS SIMPLES............................................................................... 37
4.1 Amplitude total...................................................................................................................................... 39
4.2 Desvio mdio absoluto........................................................................................................................ 40
4.3 Varincia................................................................................................................................................... 41
4.4 Desvio padro......................................................................................................................................... 46
4.5 Coeficiente de variao...................................................................................................................... 47
Unidade II
5 DISTRIBUIO DE FREQUNCIAS.............................................................................................................. 53
5.1 A construo de uma distribuio de frequncias para dados contnuos..................... 54
5.2 A construo de uma distribuio de frequncias para dados discretos....................... 60
5.3 Representaes grficas de dados agrupados.......................................................................... 61
6 AS MEDIDAS DE POSIO E VARIABILIDADE NUMA DISTRIBUIO DE FREQUNCIA.................70
6.1 As medidas de posio.........................................................................................................................71
6.1.1 A mdia........................................................................................................................................................ 71
6.1.2 A mediana................................................................................................................................................... 72
6.1.3 A moda......................................................................................................................................................... 73
6.2 As medidas de disperso numa distribuio de frequncia................................................. 74
6.2.1 O desvio mdio......................................................................................................................................... 74
6.2.2 Varincia...................................................................................................................................................... 75
6.2.3 Desvio padro............................................................................................................................................ 76
7 INTRODUO PROBABILIDADE.............................................................................................................. 81
7.1 Teorias dos conjuntos, espao amostral e eventos.................................................................. 82
8 PROBABILIDADE: ORIGEM, MTODOS E PRINCIPAIS TEOREMAS................................................. 92
8.1 Origens da probabilidade................................................................................................................... 93
8.1.1 Mtodos objetivos................................................................................................................................... 93
8.1.2 Mtodo subjetivo..................................................................................................................................... 97
8.2 Principais teoremas de probabilidade........................................................................................... 97
APRESENTAO
O objetivo deste material fazer com que o aluno tenha condies de interpretar um conjunto
de observaes de forma clara e objetiva, a fim de distinguir as limitaes e as vantagens do uso de
amostras, assim como os mtodos para sua obteno; tenha habilidade para descrever e interpretar
dados por meio de figuras (tabelas e grficos), estimativas pontuais e de variabilidade; calcular o intervalo
de confiana da proporo e mdia, assim como identificar sua aplicao; coletar e interpretar dados
de forma sistematizada e imprimir credibilidade a anlises quantitativas dos fenmenos de realidade
investigada.
Equipe organizadora.
INTRODUO
Desde a Antiguidade, a estatstica faz parte da vida das pessoas, mesmo que de forma indireta, mas o
certo que essa cincia est presente na vida das pessoas o tempo todo. Quando abrimos um jornal, por
exemplo, l est uma srie de grficos e tabelas que nos auxiliam no entendimento de determinado tema,
ou quando lemos uma reportagem que traz como tema a probabilidade de o mercado financeiro fechar
em alta ou em baixa, ou, ainda, virando a pgina desse mesmo jornal, temos a manchete divulgando os
dados do Censo 2010.
Diante desses fatos, nos perguntamos de que forma a estatstica pode nos ajudar, seja no levantamento
de dados para uma empresa saber como vo suas vendas, seja para saber os riscos de investir nas aes
de uma empresa, ou, ainda, como o governo pode determinar as caractersticas dos vrios aspectos,
sociais, econmicos e ambientais dos estados e at mesmo de nosso pas.
So perguntas como essas que a estatstica nos ajuda a responder, e ainda no podemos pensar
nessa cincia como se ela se limitasse a apenas compilar tabelas de dados e os ilustrar graficamente.
Dessa forma, de sua importncia conhecer as inmeras variveis associadas a ela, pois em qualquer
ramo da sociedade contempornea esto presentes os processos estatsticos. E o estudante que no
souber trabalhar com esses conceitos estar em desvantagem no mercado de trabalho.
Para tirar o mximo proveito da interpretao de um determinado fenmeno, deve-se seguir algumas
etapas, como, por exemplo, planejar a obteno de dados, interpretar e analisar os dados obtidos e
apresentar os resultados de maneira a facilitar a tomada de decises razoveis.
fundamental que o texto produzido neste material leve o aluno a pensar em situaes do seu
cotidiano e que dessa forma ele possa associar a teoria com a prtica vivenciada em seu dia a dia.
Pensando nisso, ele foi dividido em duas unidades, nas quais sero abordados, na primeira unidade:
sries estatsticas, grficos estatsticos, medidas de tendncia central, medidas de disperso, entre outros
7
Unidade I
temas; j na segunda unidade, sero apresentados: dados tabulares, distribuio de frequncia, medidas
de posio e variabilidade numa distribuio de frequncia, probabilidade, bem como alguns de seus
teoremas, entre outros temas.
8
ESTATSTICA APLICADA
Unidade I
Como a Unio realiza a distribuio de renda para os Estados, Municpios e o Distrito Federal? Como
saber quem deve receber mais ou menos verbas? Como saber se determinado trecho de uma via ou
rodovia ou no perigoso?
1 HISTRIA DA ESTATSTICA
No Antigo Egito, aproximadamente 3040 a.C., Herdoto pediu que fosse feito um estudo sobre a
riqueza da populao, com o objetivo de saber a quantidade de recursos econmicos e humanos para
realizar a construo das pirmides. Na China, aproximadamente 2238 a.C., o imperador Yao pediu que
fosse feito um estudo da populao, com objetivos industriais e comerciais.
A palavra estatstica foi sugerida pelo alemo Gottifried Achemmel (1719/1772) e associada
palavra latina status (Estado).
Essa cincia teve acelerado desenvolvimento a partir do sculo XVII, com os estudos de Bernoulli,
Fermat, Laplace, Gauss e outros que estabeleceram suas caractersticas atuais.
Saiba mais
Para uma abordagem mais detalhada da histria da estatstica, ler o
artigo: Conceitos iniciais e breve histrico da estatstica, disponvel em:
<http://mundobr.pro.br/uneal/wp-content/uploads/2010/04/01.conceitos_
inicias-historico-somatorio.pdf>. Acesso em: 12 jul. 2012.
A todo instante, nos noticirios, em revistas, jornais, internet, ouvimos falar na palavra estatstica,
o que possvel perceber o quanto importante conhecermos a fundo essa cincia. Algumas de
suas aplicabilidades podem ser observadas nas pesquisas de opinio pblica e nos dados publicados
9
Unidade I
diariamente na imprensa. Na realidade, a estatstica contempla muitos outros aspectos, sendo de vital
importncia na interpretao de processos em que exista variabilidade.
De acordo com Dervalmar, possvel distinguir duas concepes para a palavra estatstica. No
plural, estatsticas indica qualquer coleo de dados quantitativos ou, ainda, ramo da matemtica que
trata da coleta, da anlise, da interpretao e da apresentao de massa de dados numricos. Assim,
por exemplo, as estatsticas demogrficas referem-se aos dados numricos sobre o quantitativo de
nascimentos, falecimentos, matrimnios, desquites etc. As estatsticas econmicas esto relacionadas
aos dados numricos como emprego, produo, vendas e com outras atividades ligadas aos vrios
setores da vida econmica.
Estatstica um conjunto de mtodos e processos quantitativos que serve para estudar e medir os
fenmenos coletivos.
Para fins didticos, comum os livros-textos apresentarem a estatstica em duas grandes reas,
embora no se trate de reas isoladas: estatstica descritiva e estatstica inferencial.
estatstica descritiva: aquela que tem por objetivo descrever e analisar determinada populao,
utilizando mtodos numricos e grficos para se determinarem padres em um conjunto de
dados, e, assim, apresentar a informao em uma forma conveniente;
estatstica inferencial: aquela que tem por objetivo analisar e interpretar os dados coletados de
uma determinada populao, na maioria das vezes, a partir de resultados observados na amostra.
Constitui o conjunto de mtodos para a tomada de decises nas situaes em que h incerteza,
variaes ou outras generalizaes acerca de um conjunto maior de dados.
Exemplo 1: O grfico a seguir apresenta a participao relativa das bandeiras de cartes de crdito,
no quarto trimestre de 2010.
Master Card
Visa 38,4%
52,2%
Outras
9,4%
10
ESTATSTICA APLICADA
Por meio do grfico, possvel ver claramente que mais da metade das transaes so feitas com
a bandeira Visa e que aproximadamente 40% so feitas com a bandeira MasterCard. Como o grfico
descreve os tipos de bandeiras de cartes utilizadas em todas as transaes do quarto trimestre de 2010,
o grfico um exemplo de estatstica descritiva.
Sua apresentao envolve a sintetizao, em um nico dado, dos aumentos dos produtos de uma
cesta bsica. Trata-se de um exemplo de estatstica inferencial.
Quando uma empresa pretende lanar um produto, precisa conhecer as preferncias dos consumidores
no mercado de interesse. Faz-se necessria uma pesquisa de mercado.
Os gelogos esto continuamente coletando dados sobre a ocorrncia de terremotos. Gostariam de inferir
quando e onde ocorrero tremores e qual a sua intensidade. Trata-se, sem dvida, de uma questo complexa
que exige longa experincia geolgica, alm de cuidadosa aplicao de mtodos estatsticos.
O mtodo estatstico lida com informaes, associando os dados ao problema, mostrando como e o
que coletar para obter concluses a partir de todos os dados, de tal forma que essas concluses possam
ser entendidas por outras pessoas. Assim, esse mtodo auxilia os vrios profissionais no planejamento e
na tomada de decises.
Saiba mais
11
Unidade I
O governo anualmente divulga o censo sobre a dinmica da populao brasileira, apresentando seu
crescimento demogrfico, suas caractersticas e como vivem os brasileiros.
As grandes empresas fazem levantamentos sobre vendas, produo, inventrio, folha de pagamento
e outros dados, a fim de verificar se a empresa est crescendo, como seu crescimento est em relao a
outras empresas e como tomar decises futuras.
Saiba mais
Para o pesquisador, o estudo de qualquer fenmeno, seja ele natural, econmico, social ou biolgico,
necessita da coleta e da anlise de dados estatsticos. A coleta de dados parte inicial de qualquer
pesquisa.
Populao: o conjunto de todos os itens (pessoas, coisas e objetos) que interessam ao estudo de
um fenmeno coletivo.
Parmetro: a denominao de uma caracterstica numrica estabelecida para toda uma populao.
Figura 2
Em uma pesquisa, quando se deseja empreender um estudo estatstico completo, existem fases do
trabalho que devem ser trabalhadas para se chegar aos resultados finais do estudo.
Para organizar e processar os dados estatsticos, podem-se utilizar resumos visuais e numricos,
como grcos, mapas, tabelas e modelos numricos.
A mensurao ou a observao de itens como ndices de preos, renda mensal per capita de um Estado
etc. do origem aos dados estatsticos. Como esses itens originam valores que tendem a apresentar
certo grau de variabilidade quando so medidos sucessivas vezes, iremos cham-los, ento, de variveis.
importante identificar os quatro tipos de variveis: variveis contnuas, variveis discretas, variveis
nominais e variveis ordinais.
Variveis contnuas: podem assumir qualquer valor num intervalo contnuo (dado contnuo), ou
seja, ser um nmero real. Exemplos: altura, peso, velocidade etc.
Variveis discretas: em geral, originam-se da contagem de itens e s podem assumir valores
inteiros. Exemplos: nmero de alunos em sala de aula, nmero de professores que trabalham na
escola etc.
Variveis nominais: so aquelas que existem com o objetivo de definir categorias, e as observaes,
mensuraes e anlises so feitas levando-se em conta essas mesmas categorias. Exemplos de
categoria seriam: separao por sexo, estado civil, esporte predileto, cor etc.
Variveis ordinais: quando existe o desejo de dispor os elementos observados segundo uma
ordem de preferncia ou desempenho, atribuem-se valores relativos para indicar essa ordem.
Exemplo: primeiro, segundo, terceiro grau de escolaridade etc.
As variveis discretas e contnuas so ditas variveis quantitativas porque envolvem dados numricos.
J as variveis nominais e ordinais precisam ser transformadas em valores numricos para serem objeto
da anlise estatstica, e so ditas variveis qualitativas. Por exemplo: em um departamento da empresa
JJ, que tem 36 funcionrios, fez-se uma pesquisa para verificar alguns dados. Classifique as variveis,
conforme os dados da tabela a seguir.
Tabela 1
Estado civil Grau de instruo N filhos Salrio (X. min) Idade (anos-meses)
Ensino
Solteiro - 4,00 23 03
Fundamental
14
ESTATSTICA APLICADA
Resoluo
E ainda:
Em geral, quando nos propomos a buscar ou construir informaes a partir de dados, deparamonos,
inicialmente, com um conjunto de dados brutos que pouco nos dizem. preciso organiz-los
minimamente para que comecem a fazer algum sentido, viabilizando sua anlise.
Tabela 2
50 96 75 87 65 45 72 10
32 54 25 69 72 30 81 20
24 45 80 90 64 95 23 90
80 35 96 47 65 70 73 63
60 20 45 89 20 90 80 70
Essa tabela chamada de tabela primitiva ou dados brutos, pois os dados coletados esto dispostos
conforme a ordem da coleta e no na ordem de numerao.
Observando os dados anteriores, tabela primitiva, fica difcil visualizar em torno de que valor tendem
a se concentrar as notas dos estudantes, qual a maior ou qual menor nota, e ainda quantos alunos se
acham abaixo de uma dada nota.
15
Unidade I
Uma primeira forma de organizao dos dados brutos o chamado rol. Obtemos o rol quando
organizamos os dados brutos em ordem crescente ou decrescente de grandeza.
Ainda com respeito tabela de nota dos 40 estudantes da disciplina de estatstica, vejamos como fica:
Tabela 3
10 20 20 20 23 24 25 30
32 35 45 45 45 47 50 54
60 63 64 65 65 69 70 70
72 72 73 75 80 80 80 81
87 89 90 90 90 95 96 96
Agora, podemos saber, com relativa facilidade, qual a menor nota (10) e qual a maior nota (96). Para
determinar a amplitude do rol, basta realizar a diferena entre o maior e o menor nmero do rol, ou seja,
para o exemplo, a amplitude de variao foi de 96 10 = 86.
Exemplo 2: seja A = {10, 7, 3, 9, 1, 5, 10, 4, 2, 8} o conjunto das notas dos alunos, determine o rol
e a amplitude do rol:
A = 10 1 = 9
Limites de classe: so os nmeros extremos de cada classe; sendo assim, temos um limite inferior
e um superior, que denominamos de amplitude de variao.
A = Lsup. - Linf.
A notao por ndices bastante utilizada na estatstica, sendo importante esclarecer seu significado.
O smbolo xi (l-se x ndice i) ir representar qualquer um dos n valores assumidos pela varivel x, x1,
x2, x3, x4, ..., xn. n denominado ndice e poder assumir qualquer dos nmeros entre 1, 2, 3, 4,..., n.
A maioria dos processos estatsticos vai exigir o clculo da soma de um conjunto de nmeros. A letra
maiscula grega sigma () utilizada para representar o somatrio.
16
ESTATSTICA APLICADA
y = 3 + 5 + 7 + 9 + 11
y = 35
Por outro lado, se o consumo semanal de arroz por x, durante um ms, foi 2 kg, 4 kg, 3 kg, 5 kg, o
total consumido por x no ms teria sido:
x = 2 + 4 + 3 + 5
A notao sigma possui algumas propriedades que precisamos desenvolver para facilitar os contedos
que estudaremos nesta disciplina.
n
A) x1 = xi = x , isso signica que devemos somar as n observaes de x, comeando com
i=1
a primeira.
Por exemplo, num conjunto de dados x = {2, 4, 6, 8, 10, 12}, em que n = 6, temos:
n 6
xi = xi = 2 + 4 + 6 + 8 + 10 + 12
i=1 i=1
xi = 42
Por outro lado, possvel utilizar essa notao quando se pretende analisar a soma de apenas uma
parte dos dados disponibilizados, podendo-se, portanto, abreviar a soma de um conjunto de dados.
Dessa forma, podemos ter:
3
x1 + x2 + x 3 = xi
1 11
x8 + x 9 + x10 + x11 = xi
i=8
B) Se cada valor da varivel x multiplicado ou dividido por uma constante, temos que isso ser
igual ao valor da constante multiplicado ou dividido pela somatria de x.
c.x = c. x
17
Unidade I
Assim,
4
4 xi = 4 x1 + 4 x2 + 4 x3 + 4 x4
i=1
4
= 4( x1 + x2 + x 3 + x 4 ) = 4 xi
i=1
Por exemplo: se xi = {2, 4, 6, 8, 10, 12}, n = 6, e cada valor de x multiplicado pela constante
c = 2, temos:
cx = c x
6 6
cxi =c xi =2(2) + 2(4) + 2(6) + 2(8) + 2(10) + 2(12) =
i=1 i=1
= 2(2) + 2(44 ) + 2(6) + 2(8) + 2(10) + 2(12)
6 6
2xi = 2 xi = 2(42) = 84
i=1 i=1
C) O somatrio de uma constante c ser igual ao produto da constante pelo nmero de vezes (n) que
ela se repete. Assim, temos:
n
ci = nc
i=i
xi = ci
6 6
xi = ci = nc = 7 + 7 + 7 + 7 + 7 + 7 = 6(7) = 42
i=1 i=1
D) O somatrio de uma soma ou de uma diferena de duas variveis ser igual soma ou diferena
dos somatrios individuais das duas variveis. Assim, temos:
n n n
( xi + yi ) = xi + yi
i=1 i=1 i=1
n n n
( xi yi ) = xi yi
i=1 i=1 i=1
18
ESTATSTICA APLICADA
Por exemplo:
i X Y (X-Y)
1 8 5 3
2 3 2 1
(x y) = 9
3 4 0 4
4 5 4 1
x y = 20 11 = 9
- - - -
20 11 9
Figura 3
Por exemplo, numa dada observao, o conjunto de dados de xi = {2, 4, 6, 8, 10}, n = 5; temos, ento:
5
xi2 = 22 + 42 + 62 + 82 + 102 =
i=1
= 4 + 16 + 36 + 64 + 100 = 220
F) O somatrio ao quadrado de um conjunto de dados ser obtido tomando-se a soma dos valores
de xi e elevando-se ao quadrado. Assim, temos:
n
( xi )2 = ( x1 + x2 + x 3 + ... + xn )2
i=1
Por exemplo, se temos um mesmo conjunto xi = {2, 4, 6, 8, 10}, n = 5, tal qual no exemplo do item
E, teremos um resultado distinto. Vejamos, neste caso:
5
( xi )2 = (2 + 4 + 6 + 8 + 10)2 = (30)2 = 900
i=1
2
n n
No confunda xi2 com xi , pois, conforme se observa no exemplo anterior, seus resultados
i
sero diferentes. i
Uma srie estatstica define-se como qualquer tabela na qual haja distribuio de um conjunto de
dados estatsticos em funo da poca, do local ou da espcie. Ou, ainda, no sentido mais amplo, srie
19
Unidade I
uma sucesso de nmeros referidos a qualquer varivel. Caso os nmeros expressem dados estatsticos,
a srie ser chamada de srie estatstica.
As tabelas so utilizadas para apresentar sries estatsticas. Os trs caracteres presentes na tabela
que as apresenta so:
1. Sries homgradas: onde h variao discreta ou descontnua na varivel descrita. Podem ser
do tipo temporal, geogrfica ou especfica.
Srie temporal: os dados so observados de acordo com a poca de ocorrncia (fator cronolgico).
Isso significa que o tempo varivel e o local e a espcie (fenmeno) so elementos fixos. Essa
srie tambm chamada de histrica ou evolutiva. Exemplo:
Srie geogrfica: apresenta como elemento varivel o fator geogrfico. A localidade o elemento
varivel e a poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial
ou de localizao. Exemplo:
Tabela Variao do PIB dos pases em 2015 (em % sobre o ano anterior)
20
ESTATSTICA APLICADA
Srie especfica: o carter varivel apenas o fato ou espcie, o tempo e o local so fixos.
Tambm chamada de srie categrica. Exemplo:
A distribuio de frequncias uma srie hetergrada e ser vista com detalhes mais adiante.
A representao grfica das sries estatsticas tem por finalidade sintetizar os resultados obtidos e,
assim, chegar a concluses sobre a evoluo do fenmeno ou sobre como se relacionam os valores da
srie. O grfico mais apropriado ficar a critrio do pesquisador, respeitando os elementos de clareza,
simplicidade e veracidade (NOGUEIRA, 2009).
o ttulo do grfico deve ser o mais claro e completo possvel, sendo necessrio acrescentar subttulos;
sempre que possvel, a escala vertical h de ser escolhida de modo a aparecer a linha 0 (zero);
s devem ser includas no desenho as coordenadas indispensveis para guiar a vista na leitura, um
tracejado muito cerrado dificulta o exame do grfico;
a escala horizontal deve ser lida da esquerda para a direita e a vertical de baixo para cima;
21
Unidade I
examinar o tipo de grfico escolhido, verificar se o mais adequado, criticar a sua execuo, no
conjunto e nos detalhes;
analisar cada fenmeno separadamente, fazendo notar os pontos mais em evidncia, o mximo e
o mnimo, as mudanas mais bruscas;
investigar se h uma tendncia geral crescente ou decrescente ou, ento, se o fato exposto
estacionrio;
procurar descobrir a existncia de possveis ciclos peridicos, qual o perodo aproximado etc.
Grfico em linha
500
400
300
Srie 1
200
Srie 2
100
0
1 2 3 4 5 6 7
Figura 4
Grfico em colunas
Populao
100
80
60
Populao
40
20
0
1940 1950 1960 1970
Figura 5
22
ESTATSTICA APLICADA
Grfico em barras
Populao do Brasil
1970
1960
Populao do
1950 Brasil
1940
0 20 40 60 50 100
Figura 6
Grfico em setores
Figura 7
a representao grfica de uma srie estatstica, em crculo, por meio de setores. utilizado
principalmente quando se pretende comparar cada valor da srie com o total.
Total __________360
Parte___________ x
23
Unidade I
2008
2009
2010
Figura 8
Grfico polar
a representao de uma srie por meio de um polgono. Movimento mensal de compras de uma
agncia em 1972.
Tabela 4
Jan
Dez 20 Fev
15
Nov Mar
10
5 Srie 1
Out 0 Abr
Set Mai
Ago Jun
Jul
Figura 9
24
ESTATSTICA APLICADA
7,9
14,2
22,6 7,9
Amrica do
Norte
8,4 sia-Pacfico
Oriente
Mdio
frica
6,7
Amricas
Central e do Sul
Figura 10
Nota: inclui leo de xisto, leo de areias betuminosas o LGN, exceto para o Brasil.
Para o Brasil, inclui LGN e no inclui leo de xisto e leo de areias betuminosas.
Pictograma
a representao grfica mais utilizada na atualidade por jornais e revistas, pois um grfico de
forma atraente e de fcil interpretao. Mostra o fenmeno estudado inserido com um grfico de linha,
coluna, barra ou de setor, conforme o exemplo a seguir, em que um outdoor aponta a verba gasta com
publicidade junto com um grfico de linha para mostrar seu desempenho anual.
25
Unidade I
Figura 11
Publicidade em alta
Institucional De utilidade
167 pblica 532,1
Oramento prev 158,1
aumento de 20%
em gastos da 425,1
administrao direta
120,2
Valor da 294,7
publicidade
Em R$ Milhes
80,1 152,6
2007 2008 2009 2010 2007 2008 2009 2010
Figura 12
Saiba mais
26
ESTATSTICA APLICADA
Uma forma de sintetizar os valores que uma ou mais variveis podem assumir por meio de uma
tabela.
Quadro 1
Ttulo o conjunto de informaes que precede a tabela e contm a indicao dos fatores: o
qu? Quando? Onde?
Cabealho a parte superior da tabela que especifica o contedo das colunas.
Corpo da tabela o espao que contm as informaes sobre o fenmeno observado.
Fonte a indicao da entidade responsvel pelo levantamento dos dados.
Figura 13
27
Unidade I
Assim que decidimos extrair informaes por meio de um levantamento amostral, temos
imediatamente dois problemas:
Portanto, temos situaes profissionais em que nos bastam poucos dados ou estatsticas de dados
simples. Por outro lado, tm-se tambm situaes em que um nmero maior de elementos deve ser
investigado e tratado como distribuies de frequncia.
Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral buscamos
medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado
conjunto de nmeros. E as medidas mais usadas nesse sentido so as chamadas medidas de tendncia
eventual ou central, que so a mdia, a mediana e a moda.
Sabe-se que esses valores sero medidos de forma distinta conforme um grande conjunto de dados
ou um pequeno conjunto de dados. Tambm o clculo desses valores ser afetado caso as variveis
sejam discretas ou contnuas.
Observao
Assim, temos que, para a amostra, se calcula o valor mdio utilizando-se os seguintes parmetros:
28
ESTATSTICA APLICADA
n
xi 2 + 4 + 6 + 8 + 10 + 12
i=1
x= = =7
n 6
Exemplo 1:
Uma amostra das notas das provas de matemtica dos estudantes da 7 srie de uma grande escola
de So Paulo xi, em que:
xi = {87, 42, 64, 58, 90, 90, 85, 63, 47, 74, 100, 94} e n = 12, temos:
n
xi 87 + 42 + 64 + 58 + 90 + 90 + 85 + 63 + 47 + 74 + 100 + 94
i=1
x= = = 74, 5
n 12
A nota mdia na prova de matemtica dos estudantes da 7 srie dessa escola de So Paulo, por
amostragem, 74,5.
Observao
29
Unidade I
aritmtica ficar aumentada ou diminuda dessa constante c; se, por outro lado, multiplicarmos
cada elemento desse conjunto de dados por uma constante c, a nova mdia ser tambm
multiplicada por essa constante c; se dividirmos cada elemento do conjunto de dados por essa
mesma constante c, a mdia ser dividida por c.
Assim, se temos um conjunto xi = x1, x2, x2, ..., xn, a mdia ser:
n
x1 , logo:
i=1
x1 =
n
n n
(c + x i ) xi nc
i=1 i=1
x2 = x2 = + x2 = x1 + c
n n n
a soma algbrica dos desvios dos nmeros de um conjunto de dados em torno da mdia zero,
isso pode ser representado da seguinte forma:
xi x = 0
Por exemplo, se temos um conjunto de dados xi = (2, 4, 6, 8, 10), onde n = 5, temos que:
5
xi 2 + 4 + 6 + 8 + 10
i=1
x= = =6
5 5
Se aplicarmos a frmula acima, temos:
xi x = xi 6 = (2 6) + (4 6) + (6 6) + (8 6) + (10 6)
xi x = 4 2 + 0 + 2 + 4
xi x = 0
Observao
Num conjunto de dados em que cada elemento ou cada observao possui a mesma importncia,
o clculo da mdia aritmtica simples mostrar bem a populao ou a amostra estudada. No
entanto, se queremos atribuir pesos distintos ou importncias distintas aos elementos de um
30
ESTATSTICA APLICADA
conjunto de dados, a estatstica a ser adotada a mdia aritmtica ponderada, em que a cada
valor xi dever ser atribudo um determinado peso pi. A expresso estatstica para o clculo da
mdia ponderada :
n
xipi
i=1
xp = n
pi
i=1
Supondo que um estudante tenha de efetuar uma srie de quatro exames para obter sua mdia
final e passar de ano, cada exame possui um peso diferente na composio dessa mdia, conforme a
tabela a seguir:
Figura 14
A nota mdia ser, ento, 66,2, resultado diferente do que seria obtido se utilizssemos a mdia
aritmtica simples.
Num conjunto de dados, em que cada elemento ou cada observao possui importncia diferente,
utilizamos a mdia aritmtica ponderada.
Mdia aritmtica exemplo: um aluno tirou as notas 5, 8 e 6 em trs provas. A sua mdia aritmtica
ser (5 + 8 + 6)/3 = 6,33
Mdia ponderada exemplo: um aluno fez um teste (peso 1) e duas provas (peso 2),
tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua mdia (ponderada)
ser [(1 x 8) + (2 x 5) + (2 x 6) ]/5 = 6. Se o teste e a prova tivessem o mesmo peso (e
no importa qual o valor do peso, importa apenas a relao entre os pesos), a mdia seria,
aproximadamente, 6,33.
31
Unidade I
Observao
Exemplo: em uma turma, a nota atribuda a 28 alunos, referente a um teste de estatstica, foi
disposta em ordem crescente: 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10.
Observando que algumas notas se repetem, podemos utilizar o nmero de observaes ou frequncia
de cada um deles como o peso ou fator de ponderao.
Assim:
(4x4)+(7x5)+(5x6)+(5x7)+(4x8)+(2x9)+(1x10)
x = ---------------------------------------------------------------------------------------------------- = 6,29
4+7+5+5+4+2+1
Tabela 5
xi fi xi fi
4 4 4 x 4 = 16
5 7 5 x 7 = 35
6 5 6 x 5 = 30 x f 176
7 5 7 x 5 = 35 x = -----------i----i--- = -------------- = 6,29
n 28
8 4 8 x 4 = 32
9 2 9 x 2 = 18
10 1 10 x 1 = 10
28 176
Antes de calcular a mediana, preciso organizar os valores num rol em ordem crescente, para ento
contar at a metade dos valores e encontrar a mediana. Em geral, aps organizarmos os dados em um
rol, podemos calcular a posio da mediana com a frmula a seguir:
32
ESTATSTICA APLICADA
(n+1)
Posio mediana = --------------
2
rolxi - {1, 2, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9}
(n+1) 13+1
Posio mediana = -------------- = -------------- = 7 (7 posio)
2 2
Md = 5
A mediana outra medida de posio definida como o nmero do meio, quando as medidas so
organizadas em ordem ascendente ou descendente. Em outras palavras, a mediana de um conjunto de
termos ordenados o valor situado de tal forma no conjunto que o separa em dois subconjuntos de
mesmo nmero de elementos.
Observao
rolxi = {1, 2, 3, 4, 6, 7, 8, 9}
(n+1) 8+1
Posio mediana = -------------- = -------------- = 4,5
2 2
A mediana ser o valor que est a meio caminho dos dois valores mdios; nesse caso, entre 4 e 6.
Como fazer? Deve-se tirar a mdia entre os dois valores do meio para obter o valor da mediana.
33
Unidade I
Assim, temos:
4+6
Md = -------------- = 5
2
Observao
n + 1
2
5 + 1
2
3 posio
34
ESTATSTICA APLICADA
Exemplo 2
n n + 1
e
2 2
6 6 + 1
e
2 2
3ee44
3
3 = 4
4 = 7
4 + 7
Md =
2
Md = 5,5
Md 5, 5
3.4 A moda
Muitas vezes, em um conjunto de dados, existem valores que se repetem com frequncia maior.
A moda justamente esse valor ou esses valores que mais se repetem em um conjunto de dados.
possvel haver estatsticas que no possuam moda ou que possuam mais de uma moda.
A moda uma estatstica muito mais descritiva e sua importncia cresce medida que um valor ou grupo
de valores se repete mais que outros, e nesse sentido a moda indicaria o valor tpico daquele conjunto de
dados com maior ocorrncia. Por exemplo, o conjunto de dados xi = {2, 2, 7, 9, 9, 9, 10, 10, 11, 12, 18} tem
moda igual a 9, porque o nmero 9 aquele com maior frequncia, repetindo-se trs vezes.
Denominamos moda o valor ou valores de um conjunto de dados que aparecem com maior
frequncia em uma srie. Por exemplo: o salrio modal dos professores de uma escola o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa escola.
Exemplo
Sabendo-se que a produo leiteira diria de uma vaca, durante uma semana, foi de 10, 14, 13, 15,
16, 18 e 12 litros, pede-se que se encontre a mdia, a moda e a mediana para a produo diria de leite
dessa vaca.
Mdia
n
xi 10 + 14 + 13 + 15 + 16 + 18 + 12 98
i=1
x= = = = 14
n 7 7
Logo, x = 14 litros de leite em mdia por dia, o que significa uma produo de 98 litros de leite em
mdia por semana.
Observao
Moda
Como no possui um valor que aparece com maior frequncia que os outros, no h valor de moda
para esse exemplo.
Mediana
n + 1
Posio mediana =
2
7 + 1
Posio mediana =
2
Posio mediana = 4
Mediana ser o 4 elemento da srie, que igual a 14 litros de leite por dia.
36
ESTATSTICA APLICADA
Observao
f1a = f1
f2a = f1a + f2
f3a = f2a + f3
f4a = f3a + f4
...........
fna = f(n-1)a + fn
x = Md = Mo Mo Md x x Md Mo
Observamos que a moda, a mediana, e a mdia podem ser usadas para condensar, num nico nmero,
aquilo que mdio ou tpico de um conjunto de dados. No entanto, a informao fornecida pelas
medidas de posio necessita, em geral, ser complementada pelas medidas de disperso. Essas medidas
so usadas para indicar o quanto os dados se apresentam dispersos em torno da regio central. Dessa
forma, caracterizam o grau de variao existente no conjunto de valores. As medidas de disperso mais
utilizadas so:
amplitude total;
37
Unidade I
desvio padro;
varincia;
coeficiente de variao.
Note que, quanto maiores forem as medidas de disperso, mais heterogneos so os dados e, ao
contrrio, quanto menores forem essas medidas, mais homogneo o conjunto.
Vejamos a seguir alguns exemplos que mostram a necessidade de conhecermos as medidas de disperso.
Exemplo 1
Sabe-se que em Honolulu (Hava) e em Houston (Texas) a temperatura mdia diria quase a
mesma, em torno de 23,9 C. Pergunta-se: ser que, por isso, podemos inferir que a temperatura seja
basicamente a mesma em ambas as localidades? Ou no ser possvel que, enquanto uma cidade
melhor para natao, a outra o seja para atividades externas?
A temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, em geral, entre 21,1 C
e 26,7 C. Por outro lado, a temperatura em Houston pode diferir sazonalmente (nas estaes do ano),
isto , apresentar-se baixa em janeiro (cerca de 4,4 C) e alta em julho e agosto (bem perto de 37,8 C).
Logo, podemos perceber uma oscilao significativa. Desnecessrio dizer que as praias em Houston no
esto cheias de gente o ano todo.
Exemplo 2
Suponha que, numa particular cidade, tanto ladres quanto professores secundrios tenham uma
renda mdia mensal de R$ 900,00. Ser que essa informao indica que as duas distribuies de renda
so, necessariamente, semelhantes? Muito ao contrrio, poder-se-ia descobrir que elas diferem, e
muito, num outro aspecto importante, que o fato de as rendas dos professores concentrarem-se ao
redor de R$ 900,00 (serem constantes, homogneas), enquanto as dos ladres espalham-se mais (so
descontnuas, heterogneas), o que reflete, portanto, maiores oportunidades para prises, desemprego,
pobreza e, em alguns casos, fortunas excepcionais.
Os fatos mostram que precisamos, alm de uma medida de tendncia central, de um ndice que
sinalize o grau de disperso dos dados em torno da mdia. Esse ndice uma medida indicativa do que
costumamos chamar de variabilidade ou disperso.
Assim, quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto
de dados, faz-se necessrio dispor no apenas de informaes relativas s medidas de posio. preciso
38
ESTATSTICA APLICADA
que se disponha de informaes relativas variabilidade (disperso) daqueles nmeros que compem o
referido conjunto de dados. Essas medidas de variabilidade ou disperso indicam se os dados observados
esto prximos ou separados uns dos outros.
As principais medidas de disperso so: a amplitude total (ou intervalo), o desvio mdio, a varincia
e o desvio padro. A mdia serve de referncia para todas essas medidas, exceto para o intervalo (ou
amplitude total). proporo que essas medidas se elevam, isso representa um aumento da disperso,
o que significa que, se a medida for igual a zero, no existe disperso.
Exemplo 3
Um estudante de economia resolve fazer uma pesquisa sobre os salrios mdios dos funcionrios
de determinado setor industrial em So Paulo. Nessa pesquisa, esse estudante conseguiu os seguintes
dados em termos de salrios mnimos mensais:
xi = {1.0; 1.5; 2.0; 2.0; 2.0; 2.5; 3.0; 3.0; 80.0; 85.0}
Ao calcular o salrio mdio desse setor, ele chegou ao valor mdio de 18,2 salrios mnimos por ms.
Ora, mas esse dado, sem o clculo de sua disperso em relao mdia aritmtica, pouco nos diz sobre
a realidade dessa populao, e acabamos por ter uma viso distorcida do padro de vida da maior parte
dos funcionrios desse setor analisado pelo estudante. As medidas de variabilidade ou disperso nos
permitem perceber essa distoro.
Temos, como principais medidas de disperso, intervalo, desvio mdio, varincia e desvio padro.
As medidas mais comuns de variabilidade para dados quantitativos so a varincia; a sua raiz
quadrada e o desvio padro. A amplitude total, a distncia interquartlica e o desvio absoluto so mais
alguns exemplos de medidas de disperso.
O intervalo ou amplitude total de determinado conjunto de dados obtido pela diferena entre o
maior e o menor valor nesse conjunto de nmeros. Indica, portanto, a distncia entre a maior e a menor
observao de um conjunto de dados. Assim, temos:
39
Unidade I
Por exemplo, num conjunto de dados xi = {2, 3, 3, 5, 5, 5, 8, 10, 12}, em que n = 9, a amplitude total
ser:
Em alguns casos, o intervalo ou amplitude total pode ser expresso simplesmente pela indicao
do menor e do maior nmero do conjunto de dados. No caso do exemplo anterior, a amplitude total
poderia ser expressa simplesmente pela identificao do menor e do maior nmero, indicada como
sendo de (2 a 12) ou (2 12).
A grande vantagem da amplitude total que ela apresenta certa facilidade de ser calculada, mesmo
quando o conjunto de dados observados relativamente grande. No entanto, como a amplitude total
apenas leva em conta os dois extremos do conjunto de nmeros, em alguns casos ela pode ser uma
medida enganosa quanto indicao da disperso de um conjunto de nmeros, tendo, portanto, uma
utilidade limitada.
O intervalo de determinado conjunto de dados obtido pela diferena entre o maior e o menor valor
nesse conjunto de nmeros.
O desvio mdio absoluto inaugura o estudo das medidas de variabilidade que tm a mdia como
ponto de referncia.
O chamado desvio nada mais que a diferena entre cada valor de determinado conjunto de
dados e a mdia desse mesmo conjunto de nmeros (xi - x). O valor absoluto de um nmero ser
ele prprio, sem o sinal que lhe associado, e indicado por meio de duas linhas verticais que o
enquadram.
preciso calcular primeiro a mdia aritmtica dos dados disponveis, que em geral se apresentam
como dados amostrais.
O desvio mdio absoluto ser calculado pela mdia dos desvios dos valores a contar da mdia,
ignorando o sinal (+ ou -) do desvio, ou seja, convertendo os valores dos desvios em valores absolutos,
considerando-os todos desvios positivos. Assim, temos:
n
Dmdio = xi x
i=1
n
40
ESTATSTICA APLICADA
Vamos, agora, tomar um exemplo de desvio mdio. Num conjunto de dados amostrais xi = {2, 4, 6, 8, 10, 12},
em que n = 6, determine o desvio mdio. Temos, ento:
Dmdio = xi x
n
Precisamos, primeiro, calcular a mdia, para ento passarmos ao clculo do desvio mdio. Relembrando
a frmula do clculo da mdia aritmtica, temos:
x=
xi x = 2 + 4 + 6 + 8 + 10 + 12 = 7 x = 7
n 6
Agora, podemos calcular os desvios para cada valor do conjunto de dados. Assim, temos:
xi - x
27 -5 Dmdio = xi x =
5 + 3 + 1 + 1 + 3 + 5
47 -3 n 6
67 -1
Dmdio = 5 + 3 + 1 + 1 + 3 + 5 = 3
87 1 6
10 7 3
Dmdio = 3
12 7 5
0
Figura 16
O desvio que a diferena entre cada valor de determinado conjunto de dados a mdia desse
mesmo conjunto de nmeros.
4.3 Varincia
Como no clculo do desvio mdio, para o clculo da varincia, precisaremos utilizar o desvio de
cada elemento de um conjunto de dados em relao mdia aritmtica (xi - x). No entanto, ao invs de
41
Unidade I
trabalharmos com os valores absolutos (em mdulo), agora os desvios so elevados ao quadrado antes
da soma. Para o caso de dados amostrais, ao invs de dividirmos por n, dividimos por n 1 (que o total
da amostra menos uma unidade).
A varincia ir nos dizer o grau de disperso de determinado grupo de dados com relao mdia
aritmtica desses nmeros. Assim, a varincia populacional poder ser calculada da seguinte forma:
2: Varincia populacional;
xi: Cada observao do conjunto de
2
=
( xi )2
, onde
dados populacional;
n : Mdia da populao;
n: Nmero de observaes.
Por exemplo, seja determinado conjunto de dados xi = {1, 3, 5, 7, 9, 11, 13}, em que n = 7. Calcule a
varincia desse conjunto de dados, supondo:
A) Para calcular a varincia desse conjunto de dados, considerando que ele representa toda uma
populao, devemos utilizar a seguinte frmula:
2
=
( xi )2
n
Devemos passar ao clculo da mdia desse conjunto de dados para, ento, proceder ao clculo da
varincia. Sendo assim, temos:
=
xi =
n
1 + 3 + 5 + 7 + 9 + 11 + 13
= = 7 (mdia populacional)
7
=7
42
ESTATSTICA APLICADA
Partindo da mdia, podemos agora calcular os desvios e partir para o clculo da varincia populacional,
j que supomos que o conjunto de dados representava toda a populao. Assim, temos:
xi - (xi - )2
7 71=6 62
2 =
(xi )2
7 73=4 42 N
7 75=2 2 2
6 + 42 + 22 + ( 2)2 + ( 4 )2 + ( 6)2
2
2 =
7 77=0 0 7
7 79=-2 (-2)2 2 36 + 16 + 4 + 4 + 16 + 36
= = 16
7
7 7 11 = - 4 (-4)2
2 = 16
7 7 13 = - 6 (-6)2
0 112
Figura 17
Desse modo, a varincia populacional desse conjunto de dados seria igual a 16.
B) Se, por outro lado, temos o mesmo conjunto de dados e supondo que ele representa apenas dados
amostrais, devemos calcular a varincia amostral de outra forma, partindo do clculo da mdia
para, ento, calcularmos a varincia.
Como vimos no item 2, a expresso para o clculo da mdia aritmtica em uma amostra a mesma
do clculo da mdia para uma populao, mas utilizaremos para as amostras outra notao. Vejamos:
x=
xi x = 7 (mdia amostral).
n
Normalmente, a mdia amostral aproxima-se da mdia populacional quanto maior o tamanho da
amostra, mas no se iguala a ela.
s2 =
(xi x)2
n 1
x xi - x (xi - x)2
7 71=6 62
S2
=
( xi x )2
7 73=4 42 n 1
7 75=2 22 62 + 42 + 22 + ( 2)2 + ( 4 )2 + ( 6)2
S2 =
7 77=0 0 7 1
7 79=-2 (-2)2 36 + 16 + 4 + 4 + 16 + 36 112
S2 = =
7 1 6
7 7 11 = - 4 (-4)2
S2 = 18,666...
7 7 13 = - 6 (-6)2
0 112
Figura 18
43
Unidade I
Como a mdia aritmtica, a varincia possui algumas propriedades importantes que devemos colocar
em destaque e que facilitam o clculo de alguns problemas mais complexos.
Por exemplo, um conjunto de dados xi = {2, 4, 6, 8}, em que n = 4, e a mdia igual a 5. A varincia
desse conjunto ser dada como segue:
2
=
( xi )2
2 =
(2 5)2 + (4 5)2 + (6 5)2 + (8 5)2
n 4
2
=
( 3) + ( 1) + 12 + 32 9 + 1 + 1 + 9 20
2 2
= = =5
4 4 4
Se somarmos uma constante c = 4 a cada um dos elementos do conjunto de dados, temos um novo
conjunto de dados yi = {6, 8, 10, 12}, em que a mdia ser igual a 9. A varincia ser, ento:
2
22 =
( yi 2 ) =
(6 9) + (8 9) + (10 9) + (12 9)
2 2 2 2
n 4
22 =
( 3) + ( 1) + (1) + (3)
2 2 2 2
=
9 + 1 + 1 + 9 20
= =5
4 4 4
Sendo assim, demonstramos que 2 = 22 =, ou seja, ao somarmos uma constante a cada elemento
de um conjunto de dados, a varincia permanece a mesma.
B) Ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova
varincia ao multiplicarmos a varincia do conjunto de dados original por c2.
22 = c2 .12
C) Ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrria c, obtemos
a nova varincia dividindo-se a antiga varincia por c2.
44
ESTATSTICA APLICADA
Existe uma frmula alternativa e reduzida para o clculo da varincia populacional, deduzida da
frmula original, que :
2
=
xi2
2
n
Para a varincia amostral, tambm existe uma frmula alternativa bastante utilizada que no exige
o clculo da mdia e que decorre da frmula anterior:
s2x =
xi2 ( xi )2 n
n 1
Lembrete
Saiba mais
45
Unidade I
Obtm-se o desvio padro extraindo-se a raiz quadrada da varincia. Assim como a varincia e
o desvio mdio, o desvio padro tambm representa uma medida de variabilidade absoluta, e indica
o desvio de cada um dos nmeros xi de um dado conjunto de observaes em relao mdia .
tambm chamado por alguns autores de desvio da raiz mdia quadrtica.
=
(xi )2 s=
(xi x)2
n n 1
Por exemplo, um conjunto de dados amostrais xi = {2, 4, 6}, em que n = 3 e a mdia igual a 4.
Vamos, ento, calcular o desvio padro para a amostra:
s=
(xi x)2 = (2 4 )2 + (4 4 )2 + (6 4 )2
=
n 1 3 1
( 2)2 + 0 + 22 8
s= = = 4 =2
2 2
Assim, ao multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao antigo multiplicado pela constante. Temos, ento:
2 = c . 1
Por outro lado, se dividirmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao anterior dividido pela constante c. Assim, temos:
1
2 =
c
As demais propriedades da varincia sero as mesmas para o desvio padro.
46
ESTATSTICA APLICADA
Por exemplo, no item 4.4, foi determinado o desvio padro de uma srie amostral, portanto, vamos
calcular o coeficiente de variao dessa srie, que ser:
S
Cv =
x
2
Cv =
4
Cv = 0, 5
Cv = 50%
Nesse exemplo, o coeficiente de variao grande, indica que a variabilidade foi a metade em
relao mdia dessa srie.
quando multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao antigo multiplicado pela constante;
quando dividirmos cada elemento de um conjunto de dados por uma constante c, o novo desvio
padro ser igual ao anterior dividido pela constante c.
47
Unidade I
Faz-se uma distino entre o desvio padro (sigma) do total de uma populao ou de uma varivel
aleatria e o desvio padro s de um subconjunto em amostra.
O termo desvio padro foi introduzido na estatstica por Karl Pearson, em seu livro Sobre a disseco
de curvas de frequncia assimtricas, de 1894.
Exemplo
Utilizando-se o exemplo apresentado anteriormente, temos que a produo leiteira diria de uma
vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, pede-se calcular a amplitude, o desvio
padro (S), a varincia (S2) e 5 o coeficiente de variao (CV).
Soluo
Amplitude
R = 18 10 = 8 litros de leite, ou seja, a maior variao do nmero de litros de leite produzido por
dia pela vaca de 8 litros.
Observao
Sabemos que a mdia para esses dados : x = 14 litros de leite por dia.
Desvio padro
n
( x1 x )
2
s= i=1
=
( x1 x )2 + ( x2 x )2 + ... + ( xn x )2 =
n 1 n 1
Varincia
Coeficiente de variao
48
ESTATSTICA APLICADA
S 2, 65
cv = = = 0,1893 ou seja, existe uma variabilidade de 18,93% dos dados em relao mdia.
x 14
Saiba mais
Dica de leitura:
Resumo
49
Unidade I
Exerccios
Dia do ms Temperatura
(em C)
1 15,5
3 14
5 13,5
7 18
9 19,5
11 20
13 13,5
15 13,5
17 18
19 20
21 18,5
23 13,5
25 21,5
27 20
29 16
50
ESTATSTICA APLICADA
13, 5.4 + 14.1 + 15, 5.1 + 16.1 + 18.2 + 18, 5.2 + 19, 5.1 + 20.3 + 21, 5.1 255
X= = = 17
4 + 1+ 1+ 1+ 2 + 1+ 1+ 3 + 1 15
A mdia 17oC.
3) A moda 13,5oC.
Sendo assim,
A) Alternativa incorreta.
B) Alternativa correta.
C) Alternativa incorreta.
D) Alternativa incorreta.
E) Alternativa incorreta.
51
Unidade I
Em relao s edies de 2005 a 2009 da OBMEP, qual o percentual mdio de medalhistas de ouro
da regio Nordeste?
A) 14,6%.
B) 18,2%.
C) 18,4%.
D) 19,0%.
E) 21,0%.
52