Anda di halaman 1dari 280

Universidade Federal de Santa Catarina

Pr-Reitoria de Ensino de Graduao


Departamento de Ensino de Graduao a Distncia
Centro Scio-Econmico
Departamento de Cincias da Administrao

Estatstica Aplicada
Administrao

Professor

Marcelo Menezes Reis

2009
Copyright 2008. Todos os direitos desta edio reservados ao DEPTO. DE CINCIAS DA ADMINISTRAO (CAD/CSE/UFSC).

R375e Reis, Marcelo Menezes


Estatstica aplicada administrao / Marcelo Menezes Reis.
Florianpolis: Departamento de Cincias da Administrao/UFSC,
2008.
280p. : il.

Inclui bibliografia
Curso de Graduao em Administrao, Modalidade a Distncia
ISBN: 978-85-61608-47-7

1. Matemtica na administrao. 2. Administrao Mtodos Esta-


tsticos. 3. Probabilidades. 4. Educao a distncia. I. Ttulo.
CDU: 51-77: 65

Catalogao na publicao por: Onlia Silva Guimares CRB-14/071


PRESIDENTE DA REPBLICA Luiz Incio Lula da Silva

MINISTRO DA EDUCAO Fernando Haddad

SECRETRIO DE EDUCAO A DISTNCIA Carlos Eduardo Bielschowsky

DIRETOR DO DEPARTAMENTO DE POLTICAS EM EDUCAO A DISTNCIA Hlio Chaves Filho

COORDENADOR DE APERFEIOAMENTO DE PESSOAL DE NVEL SUPERIOR Jorge Almeida Guimares

DIRETOR DE EDUCAO A DISTNCIA Celso Costa

UNIVERSIDADE FEDERAL DE SANTA CATARINA

REITOR lvaro Toubes Prata

VICE-REITOR Carlos Alberto Justo da Silva

PR-REITORA DE ENSINO DE GRADUAO Yara Maria Rauh Muller

CCORDENADOR DE EDUCAO A DISTNCIA Carlos Pinto

COORDENADOR UAB Ccero Ricardo Frana

CENTRO SCIO-ECONMICO

DIRETOR Ricardo Jos Arajo Oliveira

VICE-DIRETOR Alexandre Marino Costa

DEPARTAMENTO DE CINCIAS DA ADMINISTRAO

CHEFE DO DEPARTAMENTO Joo Nilo Linhares

COORDENADOR DE CURSO Marcos Baptista Lopez Dalmau

SUBCOORDENADOR DE CURSO Raimundo Nonato de Oliveira Lima

COMISSO DE PLANEJAMENTO, ORGANIZAO E FUNCIONAMENTO

Alexandre Marino Costa (Presidente)


Gilberto de Oliveira Moritz
Joo Nilo Linhares
Luiz Salgado Klaes
Marcos Baptista Lopez Dalmau
Maurcio Fernandes Pereira
Raimundo Nonato de Oliveira Lima

CONSELHO CIENTFICO Altamiro Damian Prve


Lus Moretto Neto
Luiz Salgado Klaes
Raimundo Nonato de Oliveira Lima

CONSELHO TCNICO Maurcio Fernandes Pereira


Alessandra de Linhares Jacobsen

COORDENAO DE PRODUO DE MATERIAL DIDTICO Denise Aparecida Bunn

DESIGN INSTRUCIONAL Denise Aparecida Bunn


Fabiana Mendes de Carvalho
Patrcia Regina da Costa

PROJETO GRFICO E DIAGRAMAO Annye Cristiny Tessaro

REVISO DE PORTUGUS Srgio Meira

ORGANIZAO DO CONTEDO Marcelo Menezes Reis


PLOS DE APOIO PRESENCIAL

CRUZEIRO DO OESTE PR CAROEBE RR


PREFEITO Zeca Dirceu PREFEITO Arnaldo Muniz de Souza
COORDENADORA DE PLO Maria Florinda Santos Risseto COORDENADOR DE PLO Jos Francisco Soares dos Santos

CIDADE GAUCHA PR UIRAMUT RR


PREFEITO Vitor Manoel Alcobia Leito PREFEITO Elisio Cavalcante de Lima
COORDENADORA DE PLO Eliane da Silva Ribeiro COORDENADOR DE PLO Jos Francisco Franco dos Santos

PARANAGUA PR CHAPEC SC
PREFEITO Jos Baka Filho PREFEITO Joo Rodrigues
COORDENADORA DE PLO Meire Ap. Xavier Nascimento COORDENADORA DE PLO Maria de Lurdes Lamaison

HULHA NEGRA RS CANOINHAS SC


PREFEITO Carlos Renato Teixeira Machado PREFEITO Leoberto Weinert
COORDENADORA DE PLO Margarida de Souza Corra COORDENADORA DE PLO Sonia Sacheti

JACUIZINHO RS JOINVILLE SC
PREFEITO Diniz Jos Fernandes PREFEITO Carlito Merss
COORDENADORA DE PLO Jaqueline Konzen de Oliveira COORDENADORA DE PLO a definir

TIO HUGO RS FLORIANPOLIS SC


PREFEITO Gilmar Mhl PREFEITO Drio Elias Berger
COORDENADORA DE PLO Mara Elis Savadintzky Drehmer COORDENADOR DE PLO Raimundo N. de Oliveira Lima

SEBERI RS PALHOA SC
PREFEITO Marcelino Galvo Bueno Sobrinho PREFEITO Ronrio Heiderscheidt
COORDENADORA DE PLO Ana Lcia Rodrigues Guterra COORDENADORA DE PLO Luzinete Barbosa

TAPEJARA RS LAGUNA SC
PREFEITO Seger Menegaz PREFEITO Celio Antnio
COORDENADORA DE PLO Loreci Maria Biasi COORDENADORA DE PLO Maria de Lourdes Corra

SO FRANCISCO DE PAULA RS TUBARO SC


PREFEITO Dcio Antnio Colla PREFEITO Clesio Salvaro
COORDENADORA DE PLO Maria Lcia da Silva Teixeira COORDENADORA DE PLO Flora M. Mendona Figueiredo

MATA DE SO JOO BA CRICIMA SC


PREFEITO Joselito Pereira Nascimento PREFEITO Anderlei Jos Antonelli
COORDENADORA DE PLO Julieta Silva de Andrade COORDENADOR DE PLO Jlio Csar Viana

BOA VISTA RR ARARANGU SC


PREFEITO Iradilson Sampaio de Souza PREFEITO Mariano Mazzuco Neto
COORDENADORA DE PLO Dbora Soares Alexandre Melo Silva COORDENADORA DE PLO Conceio Pereira Jos

BONFIM RR LAGES SC
PREFEITO Rhomer de Sousa Lima PREFEITO Renato Nunes de Oliveira
COORDENADORA DE PLO Tarcila Vieira Souza COORDENADORA DE PLO Marilene Alves Silva

MUCAJA RR
PREFEITO Elton Vieira Lopes
COORDENADORA DE PLO Ronilda Rodrigues Silva Torres
Apresentao

Caro estudante!
Toda vez que algum ouve a palavra Estatstica as reaes
costumam combinar averso, medo, negao da importncia, restri-
es ideolgicas at, e sempre a noo que se trata de algo muito
complicado... matemtica braba, so muitas frmulas difceis,
pode-se obter qualquer resultado com Estatstica, mtodos quanti-
tativos so dispensveis, no se aplica minha realidade, so al-
gumas das expresses que ouvi nesses anos em que leciono a discipli-
na. Talvez voc tenha ouvido tais expresses tambm, mas eu lhe as-
seguro que elas so exageradas ou mesmo falsas. preciso acabar
com alguns mitos e mostrar a importncia que a Estatstica tem na
formao do administrador.
Voc est iniciando a disciplina de Estatstica Aplicada Ad-
ministrao. Os mtodos estatsticos so ferramentas primordiais para
o administrador de qualquer organizao, pois possibilitam obter in-
formaes confiveis, sem as quais a tomada de decises seria mais
difcil ou mesmo impossvel. E, no se esquea, a essncia de admi-
nistrar tomar decises. Por este motivo, esta disciplina faz parte do
currculo do curso de Administrao.
Nesta disciplina voc aprender como obter dados confiveis
(conceitos de planejamento de pesquisa estatstica e amostragem),
como resumi-los e organiz-los (anlise exploratria de dados), e apli-
cando tcnicas apropriadas (probabilidade aplicada e inferncia es-
tatstica), generalizar os resultados encontrados para tomar decises.
Procurei apresentar exemplos concretos de aplicao, usando ferra-
mentas computacionais simples (como as planilhas eletrnicas, com
as quais voc teve um primeiro contato na disciplina de Informtica
Bsica). O domnio dos mtodos estatsticos dar a voc um grande
diferencial, pois permitir tomar melhores decises, o que, em essn-
cia, o objetivo primordial de qualquer organizao.
Sucesso em sua caminhada.

Prof. Marcelo Menezes Reis


Sumrio

Unidade 1 Introduo Estatstica e ao Planejamento Estatstico

Definio e subdivises da Estatstica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Conceito de Eseatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Variabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Importncia da Estatstica para o Administrador . . . . . . . . . . . . . . . . . . . . . . . . 17

Planejamento Estatstico de Pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

Unidade 2 Tcnicas de Amostragem

Tcnicas e definies de Amostragem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

O que amostragem? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Aspectos necessrios para o sucesso da amostragem . . . . . . . . . . . . . . . . . . . . 41

Plano de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

Clculo do tamanho de uma amostra probabilstica (aleatria) . . . . . . . . . . . . . 55

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

Unidade 3 Anlise Exploratria de Dados I

O que anlise exploratria de dados? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

Estrutura de um arquivo de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Unidade 4 Anlise Exploratria de Dados II

Medidas de Posio ou de Tendncia Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

Mdia (0). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

Mediana (Md). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

Moda (Mo). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

Quartis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

Medidas de disperso ou de variabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

Clculo de medidas de sntese de uma varivel em funo dos valores de outra. . 115

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

Unidade 5 Conceitos bsicos da Probabilidade

Probabilidade: conceitos gerais . . . . . . . . . . . . . . . . . . . . . . . . . . 125

Definies Prvias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

Definies de Probabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

Regra do Produto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

Eventos Independentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

Unidade 6 Variveis aleatrias

Conceito de Varivel Aleatria . . . . . . . . . . . . . . . . . . . . . . . . . . 153

Distribuies de probabilidades para variveis aleatrias discretas . . . . . . . . 155

Distribuies de probabilidades para variveis aleatrias contnuas . . . . . . . 159

Valor Esperado e Varincia. . . . . . . . . . . . . . . . . . . . . . . . . . 160

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165


Unidade 7 Modelos probabilsticos mais comuns

Modelos Probabilsticos para Variveis Aleatrias Discretas . . . . . . . . . . . . . 169

Modelo binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

Modelo de Poisson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

Modelos para Variveis Aleatrias Contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . 177

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

Unidade 8 Inferncia estatstica e distribuio amostral

Conceito de Inferncia Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

Parmetros e Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

Distribuio Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

Unidade 9 Estimao de parmetros

Estimao por Ponto de Parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . 221

Estimao por ponto dos principais parmetros . . . . . . . . . . . . . . . . 222

Tamanho mnimo de amostra para Estimao por Intervalo. . . . . . . . . . . . . . 233

Empate tcnico. . . . . . . . . . . . . . . . . . . . . . . . . . . . 237

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240


Unidade 10 Testes de Hipteses

Lgica dos Testes de Hipteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

Tipos de Hipteses . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

Tipos de Testes Paramtricos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

Testes de Hipteses sobre a Mdia de uma Varivel em uma Populao . . . . . 257

Testes de Hipteses sobre a Proporo de uma Varivel em uma Populao. . . 262

Teste de associao de quiquadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265

Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274

Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

Referncias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

Minicurrculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
Introduo Estatstica
1
UNIDADE
e ao Planejamento
Estatstico

D
Objetivo
Nesta Unidade voc compreender o conceito de
Estatstica, sua importncia para o administrador e os
principais aspectos do planejamento estatstico para
garantir a obteno de dados confiveis.
1
UNIDADE

12 Curso de Graduao em Administrao, modalidade a distncia


Definio e subdivises da Estatstica 1

UNIDADE
Caro estudante seja bem-vindo!
Convidamos voc a entrar conosco nesse universo
B
amplo, porm, desafiador e instigante que a dis-
cusso e a reflexo sobre a Estatstica. A partir da
leitura do material podemos juntos construir e so-
cializar olhares articulando teoria e prtica. Que
rico esse movimento!!!!
Bem, como voc percebeu, o campo de debate
frtil e ter muito a discutir. Este ser um espao
de socializao e construo do conhecimento. No
esquea que dvidas e indagaes so sempre
pertinentes, pois so delineadoras para o processo
que estamos nos dispondo, coletivamente, nesta
disciplina.

N
o possvel tomar decises corretas sem dados confiveis. Os
governantes do Egito antigo e da Sumria (seus administrado-
res) j sabiam disso, portanto, mandavam seus escribas regis-
trar e compilar os dados da produo agrcola e dos homens aptos
para o servio militar. Em outras palavras, eles j usavam mtodos
estatsticos: a raiz da palavra Estatstica vem de Estado. Com o passar
do tempo, e a expanso do conhecimento, os mtodos estatsticos tor-
naram-se mais sofisticados, com a adoo de modelos probabilsticos,
inferncia estatstica e nos ltimos 30 anos a aplicao de computa-
dores, no apenas pelos governos, mas tambm por empresas, univer-
sidades e pessoas comuns.
A intensiva aplicao da informtica possibilitou a
automatizao de muitos clculos e a busca por informaes em gi-
gantescas bases de dados, o que vem constituindo o campo de conhe-
cimento de minerao de dados e inteligncia empresarial.
Hoje em dia todo administrador precisa usar mtodos estatsti-
cos. Para tanto, ele precisa conhec-los, a comear por suas defini-
es e subdivises. Veremos isso nesta Unidade, alm de apresentar-

Perodo 3 13
1 mos os conceitos de planejamento estatstico: como obter dados
confiveis.
UNIDADE

Conceito de Estatstica

"Estatstica a cincia que permite obter concluses a partir de


dados"
(Paul Velleman).

Estatstica uma Cincia que parte de perguntas e desafios do


mundo real. Veja os exemplos:

z cientistas querem verificar se uma nova droga consegue


eliminar o vrus HIV;
z uma montadora de automveis quer verificar a qualidade
de um lote inteiro de peas fornecidas atravs de uma pe-
quena amostra;
z um poltico quer saber qual o percentual de eleitores que
votaro nele nas prximas eleies;
z um empresrio deseja saber se h mercado potencial para
abrir uma casa noturna em um determinado bairro da ci-
dade; e
z em quais aes devo investir para obter maior rendimento?

Variabilidade diferen- Variabilidade


as encontradas por suces-
sivas medies realizadas
em pessoas, animais ou
objetos, em tempos ou si- O principal problema que surge ao tentar responder essas per-
tuaes diferentes Fonte:
guntas que todas as medidas feitas para tal, por mais acurados
Montgomery (2004).
que sejam os instrumentos de medio, apresentaro sempre uma
variabilidade, ou seja, no h respostas perfeitas. Feliz ou infelizmen-
te, a natureza comporta-se de forma varivel: no h dois seres hu-

14 Curso de Graduao em Administrao, modalidade a distncia


manos iguais, no h dois insetos iguais, no h dois consumidores
iguais. Mesmo os to comentados clones, e os gmeos idnticos
(clones naturais), somente apresentam um cdigo gentico comum,
1

UNIDADE
se forem submetidos experincias de vida diferentes tero um desen-
volvimento distinto. Sendo assim, variabilidade inevitvel e ine-
rente vida.
Antes de prosseguir, faa uma reflexo sobre as seguintes ques-
tes:

Voc tem as mesmas preferncias musicais que


tinha h dez anos (muitos sim, mas muitos no)?
Voc tem a mesma aparncia que tinha h dez
anos? Voc votaria no mesmo candidato a deputa-
do federal em que votou na ltima eleio (caso
voc se lembre...)? Voc tem o mesmo peso que
B
tinha h dez anos? Imagine ento as diferenas de
pessoa para pessoa, de cidade para cidade, de
Populao o conjunto
povo para povo...
de medidas da(s)
caracterstica(s) de interes-
se em todos os elementos
A Estatstica permite descrever e identificar as fontes e at in- que a(s) apresenta(m).
Fonte: Andrade e Ogliari
dicar meios de controlar a variabilidade. Vamos apresentar as suas
(2007).
subdivises para que voc entenda como isso ocorre.

Subdivises da Estatstica

Os dados so coletados para responder uma pergunta do mun-

v
do real. Para respond-la preciso estudar uma ou mais caractersti-
cas de uma Populao de interesse. Populao o conjunto de medi- Maiores detalhes, voc
das da(s) caracterstica(s) de interesse em todos os elementos que a(s) vai estudar, ainda nesta
apresenta(m). Se, por exemplo, estamos avaliando as opinies de elei- Unidade
tores sobre os candidatos a presidente, a populao da pesquisa seria
constituda pelas opinies declaradas pelos eleitores em questo.

v
Como o interesse maior est na populao, o ideal seria
pesquisar toda a populao, em suma realizar um censo (como o IBGE Para Saber sobre o cen-
faz periodicamente no Brasil). Contudo, por razes econmicas ou so no Brasil, acesse o
prticas (para obter rapidamente a informao ou evitar a extino site do IBGE: <http://
ou exausto da populao) nem sempre possvel realizar um censo, w w w. i b g e . g o v. b r /
home>.

Perodo 3 15
v
1 Mais deta-
lhes ainda
torna-se ento necessrio pesquisar apenas uma amostra da popula-
o, um subconjunto finito e representativo da populao.
s etapas dos pargrafos anteriores somam-se outros tpicos
UNIDADE

nesta Uni- que estudaremos mais adiante, para constituir o planejamento es-

!
dade. tatstico da pesquisa.

Lembre-se
Lembre-se: a qualidade de uma pesquisa nunca ser
melhor do que a qualidade dos seus dados.
Amostra um
subconjunto finito e repre-
sentativo da populao. Uma das principais subdivises da Estatstica justamente a
Fonte: Barbetta (2007).
Amostragem, que rene os mtodos necessrios para coletar ade-
quadamente amostras representativas e suficientes para que os resulta-
dos obtidos possam ser generalizados para a populao de interesse.

v
Aps a coleta dos dados, por censo ou amostragem, a Anlise
Tema das Unidades 3 Exploratria de Dados permite apresent-los e resumi-los de maneira
e4 que seja possvel identificar padres e elaborar as primeiras conclu-
ses a respeito da populao. Em suma, descrever a variabilidade
encontrada. Se a pesquisa foi feita por censo, basta realizar a anlise
exploratria de dados para obter as concluses.
Posteriormente, atravs da Inferncia Estatstica possvel ge-

v
neralizar as concluses dos dados para a populao quando os dados
forem provenientes de uma amostra, utilizando a probabilidade para
calcular a confiabilidade das concluses obtidas.
A Figura 1 ilustra a subdiviso da estatstica. Veja:
Tema das Unidades 5,
6e7

Probabilidade medi-
da da possibilidade relati-
va de ocorrncia de um
evento qualquer relaciona-
do a certo fenmeno, pode
ser calculada atravs da
definio de um modelo
probabilstico para o fen-
meno. Fonte: Lopes
(1999).

Figura 1: Subdivises da Estatstica.


Fonte: elaborada pelo autor.

16 Curso de Graduao em Administrao, modalidade a distncia


Importncia da Estatstica para o Administrador
1

UNIDADE
O administrador precisa tomar decises. Para tanto, precisa de
informaes confiveis, mas j sabemos que para obt-las preciso
coletar dados e resumi-los. Posteriormente necessrio interpret-los,
levando em conta a variabilidade inerente e inevitvel em todos os
fenmenos. Como a Estatstica fornece os meios para todas essas eta-
pas trata-se de um conhecimento indispensvel para o administrador.

No se esquea: em qualquer profisso preciso

e relacion-los ao contexto onde esto inseridos, e


vrias vezes compar-los com dados passados e
fazer previses sobre seu comportamento futuro.
Veja o exemplo a seguir, (Figura 2) extrado de um
B
analisar dados (verificando se sua fonte confivel),

jornal de grande circulao.

Figura 2: Variao do IBOVESPA de 11/10/2007 a 16/10/2007.

v
Fonte: Dirio Catarinense de 17/10/2007, adaptada pelo autor de Microsoft.

Atravs de um simples grfico de linhas podemos observar uma Na Unidade 3, voc vai
queda no ndice da Bolsa de Valores de So Paulo, entre 15 e 16 de estud-lo com mais de-
talhes
outubro de 2007, motivada pelo temor de queda nas bolsas internaci-
onais, por sua vez causada pelo possvel agravamento da crise imobi-
liria nos EUA: constatao da situao atual, relacionada ao con-
texto internacional. Ao mesmo tempo em que se verifica queda, sabe-

Perodo 3 17
1 se que o IBOVESPA nunca antes havia ultrapassado 60 mil pontos
at recentemente: relacionamento com dados do passado. Os investi-
dores em aes negociadas na BOVESPA provavelmente tomaro suas
UNIDADE

novas decises de compra e venda baseadas nessas informaes.

B O primeiro passo para qualquer anlise bem sucedida


obter dados confiveis. Por isso vamos iniciar o tpi-
co de Planejamento Estatstico.

Planejamento estatsti-
co da pesquisa con-
junto de mtodos cuja
implementao visa garan- Planejamento Estatstico de Pesquisa
tir a confiabilidade dos da-
dos coletados. Fonte:
Barbetta, Reis e Bornia
(2008). O planejamento estatstico da pesquisa parte do planejamen-
to geral da pesquisa.
Antes de se pensar em qualquer abordagem estatstica preci-
so definir o que se quer pesquisar, em qualquer campo do conheci-
mento. Como poderemos escolher o melhor caminho se no sabemos
para onde ir? Em outras palavras preciso definir corretamente a
pergunta do mundo real que queremos responder: isso nada
tem a ver com Estatstica, mas afetar profundamente as etapas do
planejamento estatstico.
Para facilitar a compreenso vamos fazer o planejamento de

v
uma pesquisa fictcia, mas que muito auxiliar na compreenso do
Essas e outras infor- contedo. O Conselho Regional de Administrao (CRA) um rgo
maes voc encontra consultivo, orientador, disciplinador e fiscalizador do exerccio da pro-
em: <http:// fisso de Administrador. Somente bacharis em Administrao (gra-
www.crasc.org.br/ duados em cursos de Administrao) podem registrar-se no CRA. O
index.php?pg=inicial/ CRA preocupa-se muito com a qualidade dos cursos de Administra-
oque.htm>. o e, freqentemente, apresenta sugestes para aperfeioar currcu-
los e disciplinas, visando melhoria da formao dos profissionais.
Com isso em mente, imagine que o CRA de Santa Catarina
est interessado em conhecer a opinio dos seus registrados sobre o
curso em que se graduaram, desde que tal curso esteja situado em
Santa Catarina. Esta a pergunta do mundo real: qual a opinio
dos profissionais registrados no CRA de Santa Catarina, e graduados

18 Curso de Graduao em Administrao, modalidade a distncia


no estado, sobre o curso em que se formaram. Observe: no se falou
em Estatstica ainda, o CRA apenas definiu o que quer pesquisar.
Agora, podemos passar ao planejamento estatstico da pesquisa.
1
B

UNIDADE
Para realizar o planejamento estatstico precisamos
definir o objetivo geral, os objetivos especficos, a
populao, as variveis, o delineamento, a forma de
coleta de dados e o instrumento de pesquisa. Todos
esses itens sero temas das prximas sees.

Objetivos da pesquisa

Como voc j sabe, h dois tipos de objetivos: o geral e os


especficos. A pesquisa pode ter APENAS um objetivo geral. Esse
objetivo inclui o propsito que motivou a pesquisa, e a sua justificati-
va e relevncia.
As caractersticas que precisam ser pesquisadas para permitir
a consecuo do objetivo geral so os objetivos especficos. Trata-
se do detalhamento do objetivo geral, em que explicamos o que quere-
mos medir (preferncias, opinies sobre fatos ou pessoas, resultados
de experimentos, entre outras).
Para o nosso exemplo (pesquisa sobre os cursos de Adminis-
trao de Santa Catarina), podemos enunciar os objetivos:

z Objetivo geral: avaliar a opinio dos registrados no CRA


de Santa Catarina, graduados no estado, sobre os seus res-
pectivos cursos.
Propsito: buscar elementos que indiquem os pontos for-
tes e fracos dos cursos.
Relevncia: a pesquisa relevante, pois poder obter in-
formaes teis para a melhoria da qualidade dos cursos
de Administrao. Tal melhoria certamente motivar mais
os atuais e futuros acadmicos, propiciando-lhes uma for-
mao mais adequada e abrindo-lhes mais oportunidades.
Para a sociedade como um todo o efeito seria benfico, por
contribuir para a formao de quadros mais qualificados.

Perodo 3 19
1 z Objetivos especficos:
z Avaliar a opinio dos registrados sobre o corpo do-
cente dos seus cursos.
UNIDADE

z Avaliar a opinio dos registrados sobre o currculo


dos seus cursos.
z Avaliar a opinio dos registrados sobre a
infraestrutura dos seus cursos (salas, bibliotecas, la-
boratrios, ventilao, limpeza, iluminao).
z Identificar as razes que levaram os registrados a es-
colher a instituio onde se graduaram.

B Observe que necessrio dividir o objetivo geral


em especficos para que a pesquisa possa ser exe-
cutada. E atravs dos objetivos especficos que
vamos chegar s variveis, isso voc vai estudar
mais frente. O prximo passo definir quem ser
pesquisado, ou seja, a populao da pesquisa.

Populao

v
Uma parte importante do delineamento de qualquer pesquisa
A definio de popula- a definio da populao. Tal definio depender obviamente dos
o foi vista no incio objetivos da pesquisa, das caractersticas a mensurar, dos recursos
desta Unidade, voc se disponveis.
lembra? Populao o conjunto de medidas da(s) caracterstica(s) de
interesse em todos os elementos que a(s) apresenta(m). Se, por exem-
plo, estamos avaliando as opinies de eleitores sobre os candidatos a
presidente, a populao da pesquisa seria constituda pelas opinies
declaradas pelos eleitores em questo. A populao pode se referir a
seres humanos, animais e mesmo a objetos. O conjunto de medidas
pode se tratar de: altura de pessoas adultas do sexo masculino, peso
de bois adultos e dimetro dos parafusos produzidos em uma fbrica.

20 Curso de Graduao em Administrao, modalidade a distncia


muito importante tambm ter alguma noo do tamanho da
populao. Isso ajudar a calcular os custos da pesquisa, a rea de
abrangncia o tempo necessrio para conclu-la e os recursos neces-
1

UNIDADE
srios para fazer a tabulao e a anlise dos resultados.

E para o nosso exemplo, a pesquisa do CRA, qual


seria a populao? B
z Conjunto das opinies dos registrados no CRA de Santa
Catarina, graduados no estado, sobre os seus cursos.
z Tamanho da populao: em 24/10/2007 havia 11.676
registrados no CRA de Santa Catarina. Vamos supor que
9.000 foram graduados em faculdades catarinenses.

Com esses aspectos definidos podemos partir para


a definio das variveis, o que efetivamente ser
medido.
B
Variveis

Quando um determinado fenmeno estudado, determinadas


caractersticas so analisadas: as variveis. atravs das variveis
que se torna possvel descrever o fenmeno. As variveis so caracte-
rsticas que podem ser observadas ou medidas em cada elemento
pesquisado, sob as mesmas condies. Para cada varivel, para cada
elemento pesquisado, em um dado momento, h um e apenas um
resultado possvel. Os resultados obtidos permitiro ento a con-

!
secuo dos objetivos especficos da pesquisa.

As variveis so as medidas que precisam ser realiza-


das para a consecuo dos objetivos especficos da
pesquisa.

Perodo 3 21
1
B Tenha em mente que as variveis precisam ser re-
lacionadas aos objetivos especficos. Faa uma ex-
perincia com o seguinte questionamento: Qual era
UNIDADE

a sua altura, em metros, quando voc tinha 12


anos? Naquele momento, a varivel altura tinha
apenas um valor possvel. No ano seguinte, em
outro momento, provavelmente a altura j era dife-
rente, que por sua vez no deve ser a mesma que
voc tem hoje. Mas em cada momento, para voc,
ela teve um nico valor.

As variveis podem ser classificadas de acordo com o seu n-


vel de mensurao (o quanto de informao cada varivel apresen-
ta) e seu nvel de manipulao (como uma varivel relaciona-se
com as outras no estudo), Observe a Figura 3 e entenda a classifica-
o das variveis por nvel de mensurao.

Figura 3: Classificao das variveis por nvel de mensurao.


Fonte: elaborada pelo autor.

As variveis qualitativas ou categricas so aquelas cujas


realizaes so atributos (categorias) do elemento pesquisado, como
sexo, grau de instruo e espcie. Elas podem ser nominais ou ordinais:

z As qualitativas nominais podem ser medidas apenas em


termos de quais itens pertencem a diferentes categorias,
mas no podemos quantificar nem mesmo ordenar tais ca-
tegorias. Por exemplo, podemos dizer que dois indivduos

22 Curso de Graduao em Administrao, modalidade a distncia


so diferentes em termos da varivel A (sexo, por exem-
plo), mas no podemos dizer qual deles tem mais da quali-
dade representada pela varivel. Exemplos tpicos de vari-
1

UNIDADE
veis nominais: sexo, naturalidade, entre outros.
z As qualitativas ordinais permitem ordenar os itens medi-
dos em termos de qual tem menos ou tem mais da qualida-
de representada pela varivel, mas ainda no permitem que
se diga o quanto mais. Um exemplo tpico de uma varivel
ordinal o status socioeconmico das famlias residentes
em uma localidade, sabemos que mdia-alta mais alta
do que mdia, mas no podemos dizer, por exemplo, que
18% mais alta.

J as variveis quantitativas so aquelas cujas realizaes


so nmeros resultantes de contagem ou mensurao, como nmero
de filhos, nmero de clientes, velocidade em km/h, peso em kg, entre
outros. Elas podem ser discretas ou contnuas:

z As quantitativas discretas so aquelas que podem assu-


mir apenas alguns valores numricos que geralmente po-
dem ser listados (nmero de filhos, nmero de acidentes).
z As quantitativas contnuas so aquelas que podem assu-
mir teoricamente qualquer valor em um intervalo (veloci-
dade, peso).

A predileo dos pesquisadores em geral por variveis quanti-


tativas explica-se porque elas costumam conter mais informao do
que as qualitativas. Quando a varivel peso de um indivduo descri-
ta em termos de magro e gordo sabemos que o gordo mais pesa-
do do que o magro, mas no temos ideia de quo mais pesado. Se,
contudo, descreve-se o peso de forma numrica, medido em quilogra-
mas, e um indivduo pesa 60 kg e outro pesa 90 kg, no somente sabe-
mos que o segundo mais pesado, mas que 30 kg mais pesado do
que o primeiro.

so saber disso? Deve saber por que a escolha da


B
Voc deve estar se perguntando, por que eu preci-
Veremos nas Unidades

v
3, 4, 8, 9 e 10, quais
forma de medio da varivel vai influenciar a qua-
sero as tcnicas esta-
lidade dos resultados da pesquisa, os custos.
tsticas mais apropriadas
para analisar os dados.

Perodo 3 23
1 Vejamos na Figura 4 a classificao das variveis por nvel de
manipulao.
UNIDADE

Figura 4: Classificao das variveis por nvel de manipulao


Fonte: elaborada pelo autor.

Variveis independentes so aquelas que so manipuladas


enquanto que as dependentes so apenas medidas ou registradas,
como resultado da manipulao das variveis independentes. Essa
distino confunde muitas pessoas que dizem que todas as variveis
dependem de alguma coisa. Entretanto, uma vez acostumado a essa
distino ela se torna indispensvel.

v
Os termos varivel dependente e independente aplicam-se prin-
Veremos mais deta- cipalmente pesquisa experimental, em que algumas variveis so
lhes nas prximas Uni- manipuladas, e, nesse sentido, so independentes dos padres de
dades reao inicial, intenes e caractersticas das unidades experimen-
tais. Espera-se que outras variveis sejam dependentes da manipu-
lao ou das condies experimentais. Ou seja, elas dependem do
que as unidades experimentais faro em resposta.
Contrariando um pouco a natureza da distino, esses termos
tambm so usados em estudos em que no se manipulam variveis
independentes, literalmente falando, mas apenas se designam sujeitos
a grupos experimentais (blocos) baseados em propriedades pr-exis-
tentes dos prprios sujeitos.
Muitas vezes fazemos a pesquisa para tentar identificar o rela-
cionamento existente entre variveis. Em uma pesquisa eleitoral para
presidente do Brasil, por exemplo, uma varivel independente poderia
ser a regio do pas, e a dependente o candidato escolhido pelo eleitor
pesquisado.
Vejamos um exemplo para entender esse processo de anlise e
observar se h relao entre as variveis. Nesse caso, para o nosso
exemplo da pesquisa com os registrados no CRA de Santa Catarina,
as variveis a serem medidas devem definir pelo menos uma varivel
para cada objetivo especfico, conforme a seguir:

24 Curso de Graduao em Administrao, modalidade a distncia


Para identificar o primeiro objetivo especfico vamos avaliar a
opinio dos registrados sobre o corpo docente dos seus cursos para
definir as variveis:
1

UNIDADE
z Conhecimento sobre o contedo da disciplina;
z Habilidade didtica;
z Forma de avaliao; e
z Relacionamento com os estudantes.

Veja que cada um desses quatro aspectos pode


ser segmentado em outros para obter maiores de-
talhes. E ento como mensur-los? Neste caso,
devemos utilizar uma escala ordinal. Observe a
pergunta:
B
No que diz respeito ao conhecimento terico sobre a disci-
plina X, o professor pode ser considerado:

( ) timo
( ) bom
( ) satisfatrio
( ) insuficiente
( ) horrvel.

Repare que para cada acadmico, em um dado momento, h


apenas um resultado possvel para a pergunta (ou assim limitamos no
enunciado da questo). Poderamos construir perguntas semelhantes
para os outros trs itens e para cada objetivo especfico.

Passaremos agora definio do delineamento da


pesquisa, momento em que as preocupaes lgi-
B
cas e tericas das fases anteriores cedem lugar s
questes mais prticas de verificao.

Perodo 3 25
1 Delineamento da pesquisa

Conhecendo os objetivos da pesquisa, a populao e as vari-


UNIDADE

veis, precisamos definir como ela ser conduzida. H basicamente


dois modos de faz-la: levantamento e experimento.
A maioria das pesquisas socioeconmicas conduzida como
levantamento, em que o pesquisador usualmente apenas registra os
dados, atravs de um questionrio ou qualquer outro instrumento de
pesquisa. Procura-se responder s perguntas da pesquisa, atravs da
identificao de associaes entre as variveis ou entre grupos de ele-
mentos da populao, mas o pesquisador no tem controle sobre as
variveis. Por esse motivo, para que os resultados sejam confiveis,
costuma ser necessrio obter um grande conjunto de dados.

B A nossa pesquisa com os registrados no Conselho


Regional de Administrao (CRA) de Santa Catarina,
poderia ser conduzida como um levantamento, atra-
vs da aplicao de um questionrio aos acadmi-
cos de Administrao, observe a Figura 5:

Figura 5: Pesquisa por levantamento.


Fonte: adaptada pelo autor a partir de Barbetta (2007).

Quando h absoluta necessidade (e viabilidade) de provar re-


laes de causa e efeito o delineamento apropriado o experimen-
to. Nesse tipo de delineamento podemos manipular algumas vari-
veis para observar o efeito em outras, removendo (ou tentando remo-
ver) todas as outras variveis que poderiam influenciar o resultado
final: assim, se o experimento for adequadamente conduzido, ser
possvel provar que a variao nos valores de uma ou mais variveis
causou as mudanas, entre outras. Como o pesquisador tem muito

26 Curso de Graduao em Administrao, modalidade a distncia


controle sobre o estudo no h necessidade de um grande conjunto de
dados.
No seu dia-a-dia como administrador voc encontrar os dois
1

UNIDADE
tipos de delineamento:

z pesquisas de opinio (eleitoral ou no), de mercado, de


desemprego, de produo industrial, entre outras, so
implementadas como levantamentos; e
z pesquisas na indstria farmacutica (sobre eficcia e segu-
rana de medicamentos), na indstria qumica (quais fato-
res iro propiciar um maior rendimento nas reaes qu-
micas), na indstria siderrgica (qual a composio ne-
cessria de uma liga de ao para obter a dureza
especificada), entre outras, so conduzidas como experi-
mentos.

Forma de coleta de dados

H duas formas bsicas de coletar os dados: por censo ou por


amostragem.
No censo a pesquisa realizada com todos os elementos da
populao, o que permite (teoricamente) preciso absoluta. reco-
mendvel quando estamos reunindo dados para tomar decises de
longo alcance, por exemplo, um grande programa de controle de nata-
lidade, ou incentivo reduo da desigualdade regional, e, portanto,
precisamos ter um quadro muito completo da situao atual. exata-
mente isso que o IBGE faz a cada dez anos no Brasil, com o censo
demogrfico. Mas h tambm os censos: industrial e agropecurio,
entre outros.
Obviamente, o censo exige um grande volume de recursos, bem
como um tempo aprecivel para a sua realizao, consolidao dos
dados, produo dos relatrios e anlise dos resultados.
Nas pesquisas por amostragem apenas uma pequena parte, con-
siderada representativa, da populao pesquisada. Os resultados
podem ser ento generalizados, usualmente atravs de mtodos esta-
tsticos apropriados, para toda a populao. A economia de tempo e
dinheiro evidente ao utilizar amostragem, bem como se torna obri-
gatrio o seu uso em casos em que h a destruio ou exausto dos
elementos pesquisados, como em testes destrutivos: imagine o indiv-

Perodo 3 27
1 duo que quer testar todos os palitos de uma caixa de fsforos para ver
se funcionam.
A partir de uma amostra de 3.000 eleitores podemos obter um

v
UNIDADE

retrato confivel da preferncia do eleitorado brasileiro. Contudo, sem-


pre h risco de que a amostra, por maiores que sejam os cuidados na
Na Uni-
dade 2
sua retirada, no seja representativa da populao.
voc vai Alm da deciso por censo ou amostragem devemos decidir se
estudar utilizaremos dados primrios ou secundrios.
as formas Os dados secundrios so dados existentes, coletados por ou-
de minimizar tal risco. tros pesquisadores e disponveis em relatrios ou publicaes. A sua
utilizao pode reduzir muito os custos de uma pesquisa. Se fosse
necessrio obter informaes demogrficas poderamos utilizar os re-
latrios do IBGE referentes ao ltimo censo, ou pesquisa nacional
por amostragem de domiclios (PNAD), no haveria necessidade de
realizar nova pesquisa.
Quando os dados no existem, ou esto ultrapassados, ou no
correspondem exatamente aos objetivos de nossa pesquisa (foram
coletados com outra finalidade), torna-se necessrio coletar dados pri-
mrios, diretamente dos elementos da populao.

B Vamos recordar o que j fizemos na pesquisa com


os registrados no CRA de Santa Catarina: defini-
mos objetivos (geral e especficos), populao, va-
riveis e o delineamento. Os dados que procura-
mos existem em algum lugar? Provavelmente no,
ou talvez, estejam ultrapassados, o que exige que
levantemos tais caractersticas diretamente dos ele-
mentos da populao: precisamos obter dados pri-
mrios. Como h um nmero muito grande de
registrados, distribudos por todo o Estado, ser
muito mais econmico conduzir a pesquisa por
amostragem. Na Unidade 2 vamos apresentar os
vrios tipos de amostragem.

Quando decidimos coletar dados primrios, diretamente dos


elementos da populao precisamos pensar no instrumento de pes-
quisa: onde as variveis sero efetivamente registradas.

28 Curso de Graduao em Administrao, modalidade a distncia


Instrumento de pesquisa

atravs do instrumento de pesquisa que coletamos os valores


1

UNIDADE
das variveis, os dados da pesquisa. importante ressaltar que ele
est intrinsecamente relacionado s variveis da pesquisa. Portanto,
no seu projeto precisamos deixar claro qual o relacionamento exis-
tente com as variveis, da mesma forma que as variveis devem ser
relacionadas aos objetivos especficos.
O senso comum confunde instrumento de pesquisa com ques-
tionrio, o que no verdade. O questionrio apenas um tipo de
instrumento de pesquisa, e em muitas situaes ele no o mais apro-
Instrumento de pesqui-
priado. sa dispositivo usado para
Imagine a situao: queremos registrar o movimento em lojas coletar os valores das vari-
veis nos elementos da po-
de um Shopping Center com a finalidade de saber quais apresentam
pulao. Fonte: Barbetta,
clientela suficiente para continuarem a merecer a permanncia. No Reis e Bornia (2008).
precisamos aplicar um questionrio aos clientes, que podem recusar-
se a responder, ou aos lojistas, que podem ser criativos demais nas
respostas. Basta registrar em uma planilha quantas pessoas entra-
ram na loja, o horrio, se fizeram compras ou no, entre outros aspec-
tos. Uma outra situao seria uma pesquisa climtica, em que so
registradas medidas de temperatura, umidade relativa do ar, velocidade
do vento: obviamente no precisamos de um questionrio para isso.
O questionrio torna-se quase que indispensvel quando pre-
cisamos mensurar ou avaliar atitudes, preferncias, crenas e com-
portamentos que exigem a manifestao dos pesquisados. Pesquisas
de mercado, acerca da aceitao de um produto ou propaganda, pes-
quisas de comportamento, pesquisas de opinio eleitoral, todas elas
envolvem algum tipo de questionrio.
O questionrio pode ser enviado pelo correio, feito por telefo-
ne, feito com a presena fsica do entrevistador, ou mesmo via Internet.
Todos eles tm suas vantagens e desvantagens.
O aspecto mais importante do questionrio procurar obter as
informaes sem induzir ou confundir o respondente. As perguntas
precisam ser claras, afirmativas ou interrogativas, evitando negaes,
e coerentes com o nvel intelectual dos elementos da populao.

Perodo 3 29
!
1 Em uma cidade de Santa Catarina foi implementado
um sistema integrado de transporte coletivo; foi feita
uma pesquisa de opinio com os usurios, atravs de
UNIDADE

questionrio; uma das questes perguntava se o usu-


rio estava satisfeito com o itinerrio dos nibus; grande
nmero de respostas em branco, ou incoerentes com
as outras perguntas; muitos respondentes no sabiam
o que era itinerrio.

Na nossa pesquisa precisaramos aplicar alguma espcie de


questionrio. O CRA dispe de vrias informaes sobre os registrados,
incluindo endereo postal e talvez at telefone e endereo eletrnico.
Poderamos enviar os questionrios por um desses trs meios.

Saiba mais...
Para saber mais sobre experimentos, consulte: MOORE, David S.; McCABE,
George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A prtica da
estatstica empresarial: como usar dados para tomar decises. Rio de Janeiro:
LTC, 2006.

Para saber mais sobre elaborao de questionrios, consulte: BARBETTA,


Pedro A. Estatstica Aplicada s Cincias Sociais. 7. ed. Florianpolis: Editora
da UFSC, 2007, Captulo 2.

30 Curso de Graduao em Administrao, modalidade a distncia


Resumindo
r 1

UNIDADE
O resumo desta Unidade est esquematizado na Figura
6. Observe:

Figura 6: Resumo da Unidade 1.


Fonte: elaborada pelo autor.

Perodo 3 31
1 Atividades de aprendizagem
aprendizagem
UNIDADE

B Confira se voc teve bom entendimento do que


tratamos nesta Unidade, respondendo s questes
conforme os conceitos estudados, e encaminhe-as
para seu tutor atravs do Ambiente Virtual de En-
sino-Aprendizagem.
Boa sorte! Se precisar de auxlio, no deixe de fa-
zer contato com seu tutor.

1. A direo do CED (Centro de Educao da UFSC) e os departamen-


tos desse Centro tm interesse em avaliar se a biblioteca setorial est
atendendo adequadamente os alunos de graduao, ps-graduao,
pessoal docente e tcnico-administrativo do CED. H uma preocu-
pao com o acervo em si (atualizao, composio, nmero de c-
pias disponveis e adequao s necessidades de cada curso), e com
o atendimento aos usurios (nmero de atendentes, horrio, corte-
sia). Faa o planejamento da pesquisa estabelecendo:
a) Objetivo geral da pesquisa.
b) Objetivos especficos da pesquisa.
c) Tipo de pesquisa (Levantamento ou Experimento).
d) Populao da pesquisa.
e) Quais so as variveis da pesquisa? Por qu? Como sero
medidas? Por qu?
f) Como sero coletados os dados: secundrios ou primrios,
censo ou amostragem? Por qu?
g) Escolha do instrumento de pesquisa. Justificativa.
i) Elaborao do instrumento de pesquisa. Justificativa dos
itens e opes escolhidas.

32 Curso de Graduao em Administrao, modalidade a distncia


1
B

UNIDADE
Caro estudante,
Fazer com que voc entenda o conceito de Estats-
tica, as suas variabilidades e as subdivises na
aplicao de estudos e experimentos foi a propos-
ta desta Unidade. Com esse conhecimento voc
ser capaz de obter, organizar e analisar dados,
determinando as correlaes que se apresentem e
tirando delas suas consequncias para descrio e
explicao do que passou, alm de aprender a pre-
ver e organizar o futuro.
Leia as indicaes de textos complementares, res-
ponda s atividades de aprendizagem e interaja
com a equipe de tutoria. No fique com dvidas,
questione!
Saiba que voc no est sozinho neste processo e
que existe uma equipe que lhe dar base e supor-
te para a construo do seu conhecimento.

Perodo 3 33
2
UNIDADE
Tcnicas de
Amostragem

D
Objetivo
Nesta Unidade voc compreender em detalhes o
que amostragem, quando deve us-la, as suas
principais tcnicas, a definio do plano de
amostragem; e aprender a utilizar uma frmula
simplificada para clculo do tamanho mnimo de
amostra.
2
UNIDADE

36 Curso de Graduao em Administrao, modalidade a distncia


Tcnicas e definies de Amostragem 2

UNIDADE
Caro estudante,
Conforme vimos na Unidade 1, a amostragem
uma das formas de coleta de dados e observamos
tambm que se trata de uma das subdivises da
B
Estatstica, cujo conhecimento indispensvel para
o administrador. Tenha em mente que estamos in-
teressados em obter dados confiveis para a toma-
da de decises e, muitas vezes, precisaremos rea-
lizar pesquisas para coletar tais dados. Convida-
mos voc para conhecer um pouco mais sobre essa
tcnica de pesquisa e seus diferentes mtodos de
aplicao.

H
vrios argumentos para justificar a utilizao da amostragem,
mas h casos em que seu uso pode no ser a melhor opo.
O administrador precisa conhecer tais argumentos, para que,
confrontando com os recursos disponveis e os objetivos da pesquisa,
possa tomar a melhor deciso sobre a forma de coleta dos dados.
Se o administrador decidir por amostragem, preciso delinear
o plano de amostragem, indicando como ela ser implementada, e
qual ser o seu tamanho, item crucial e que ir influenciar muito nos
custos da pesquisa. Vamos ver isso em detalhes, nesta Unidade.

O que amostragem?

Amostragem a subdiviso da Estatstica que rene os m-


todos necessrios para coletar adequadamente amostras representa-
tivas e suficientes para que os resultados obtidos possam ser generali-
zados para a populao de interesse. A pressuposio bsica que
todas as etapas prvias do planejamento da pesquisa (veja na Unida-

Perodo 3 37
2 de 1) j foram cumpridas, e que o administrador agora precisa decidir
se coletar os dados por censo ou por amostragem.
O censo consiste simplesmente em estudar todos os elementos
UNIDADE

da populao e a amostragem pesquisa apenas uma pequena parte


dela, suposta representativa do todo. Para realizar um estudo por
amostragem de maneira que seus resultados sejam vlidos e possam ser
generalizados para a populao, algumas tcnicas precisam ser empre-
gadas. A essncia desse processo mostrada na Figura 7 a seguir:

Censo forma de coleta de


dados em que a pesquisa
realizada com todos os ele-
mentos da populao. Fon-
te: Barbetta, Reis e Bornia
(2008).

Amostragem forma de
coleta de dados em que
apenas uma pequena par-
te, considerada representa- Figura 7: Processo de Amostragem e Generalizao.
tiva, da populao Fonte: elaborada pelo autor.
pesquisada. Os resultados
podem ser ento generali-

B
zados, usualmente atravs
de mtodos estatsticos
apropriados, para toda a
importante saber avaliar os argumentos a favor
populao. Fonte: Barbetta de cada forma de coleta.
(2007).

Quando devemos usar amostragem


Testes destrutivos so Podemos enumerar basicamente trs motivos para usar
ensaios realizados para ava-
amostragem em uma pesquisa: economia, rapidez de processamento
liar a durabilidade, resistn-
cia ou conformidade com as e quando h a necessidade de testes destrutivos.
especificaes de determi-
nados produtos, que causam
z Economia: muito mais barato levantar as caractersti-
a sua inutilizao, impedin-
do a sua comercializao. cas de uma pequena parcela da populao do que de to-
Muitos testes destrutivos so dos os seus integrantes, especialmente para grandes popu-
previstos em legislao es-
laes. O custo do censo demogrfico do IBGE to co-
pecfica das mais diversas
reas. Fonte: elaborado pelo lossal que somente pode ser feito a cada dez anos.
autor.

38 Curso de Graduao em Administrao, modalidade a distncia


z Rapidez de processamento: como a quantidade de da-
dos coletada muito menor do que a produzida em um
censo, especialmente para grandes populaes, o seu
2

UNIDADE
processamento mais rpido. Os resultados ficam dispo-
nveis em pouco tempo, permitindo tomar decises em se-
guida. Tal caracterstica especialmente importante em
pesquisas de opinio eleitoral, cujo resultado precisa ser
conhecido rapidamente, para que candidatos e partidos
possam reavaliar suas estratgias.
z Testes destrutivos: se para realizar a pesquisa precisa-
mos realizar testes destrutivos (de resistncia, tempo de vida
til, entre outros), o censo torna-se impraticvel, exigindo
a utilizao de amostragem. Em muitos casos, como no
caso de produtos alimentcios e farmacuticos, h normas
legais que precisam ser cumpridas rigorosamente quando
da realizao dos ensaios.

A Figura 8 sintetiza os motivos:

Figura 8: Economia, Rapidez de processamento e Testes destrutivos.


Fonte: Microsoft (2003).

Aps reconhecer os motivos de se utilizar a


amostragem, pense em algumas situaes em que
seria recomendvel utilizar essa tcnica. B
Quando NO devemos usar amostragem

Existem situaes em que a utilizao de amostragem pode no


ser a melhor opo. Nesse caso, podemos enumerar basicamente quatro

Perodo 3 39
2 motivos: populao pequena, caracterstica de fcil mensurao, ne-
cessidades polticas e necessidade de alta preciso.
UNIDADE

z Populao pequena: quando utilizada uma amostra


probabilstica (aleatria), e a populao pequena (me-
nos de 100 elementos), pois o tamanho mnimo de amos-

v
tra para obter bons resultados ser quase igual ao prprio
tamanho da populao. Vale a pena ento realizar um censo.

Veremos isso mais adi- z Caracterstica de fcil mensurao: a caracterstica


ante, ainda nesta Uni- pode no precisar de mecanismos sofisticados de
dade mensurao, simplesmente resume-se em uma opinio di-
reta a favor ou contra uma proposta. Nesse caso, a cole-
ta dos dados seria bastante simples, possibilitando avaliar
todos os elementos da populao. Outro caso freqente na
indstria so os sistemas automatizados de medio, por
exemplo, em uma fbrica de cubos de rodas de bicicletas,
situada na zona franca de Manaus, os dimetros de todos os
cubos produzidos so medidos automaticamente por um sis-
tema de telemetria a laser, dispensando a coleta por
amostragem e um inspetor humano para realizar a medio.
z Necessidades polticas: muitas vezes uma proposta ir
afetar dramaticamente todos os elementos da populao,
como a adoo de um regime ou forma de governo, por
exemplo, o que pode ensejar a realizao de um censo, para
que todos manifestem sua opinio.
z Necessidade de alta preciso: por que o IBGE conduz
um censo a cada dez anos? Porque as informaes
demogrficas tm que ser precisas, para orientar polticas
governamentais, e somente dessa maneira esse objetivo
pode ser atingido. A Figura 9 sintetiza os motivos:

Figura 9: Populao pequena, Fcil mensurao, Necessidades polticas e


Alta Preciso.
Fonte: Microsoft (2003).

40 Curso de Graduao em Administrao, modalidade a distncia


Exercite a mente! Pense em algumas situaes em
que seja aconselhvel usar um censo. Voc deve
se lembrar da pesquisa que esboamos na Unida- B 2

UNIDADE
de 1: "o CRA de Santa Catarina est interessado
em conhecer a opinio dos seus registrados sobre
o curso em que se graduaram, desde que tal curso
esteja situado em Santa Catarina". Alm disso, vi-
mos que o nmero de registrados no CRA, com
graduao em Santa Catarina foi suposto igual a
9.000 e h uma listagem com os registrados para
fins de cobrana de anuidade que contm infor-
maes sobre endereo, curso em que se graduou,
entre outras. Para conhecer a opinio das pessoas
precisamos entrevist-las (via correio, Internet, te-
lefone ou pessoalmente). Com base no que foi dito
at agora, voc sabe responder se a pesquisa deve
ser conduzida por censo ou por amostragem? Va-
mos ver juntos ento!

Aspectos necessrios para o sucesso da


amostragem

H trs aspectos necessrios para que uma pesquisa realizada


por amostragem gere resultados confiveis: representatividade, sufici- Representatividade ou
ncia e aleatoriedade da amostra. amostra representativa
aquela que traz na sua
A representatividade o mais bvio. A amostra precisa re- composio todas as sub-
tratar a variabilidade existente na populao: ela precisa ser uma c- divises da populao, pro-
curando retratar da melhor
pia reduzida da populao. Sendo assim, todas as subdivises da
maneira possvel a sua va-
populao precisam ter representantes na amostra. A chave avaliar riabilidade. Fonte: elabora-
se as subdivises da populao (por sexo, classe econmica, cidade, do pelo autor.

atividade profissional) podem influenciar nos resultados da pesquisa.


Imagine uma pesquisa eleitoral para governador: devemos entrevistar
eleitores em todas as regies do Estado (assume-se que haja diferen-
as de opinio de regio para regio), pois se escolhermos apenas

Perodo 3 41
2 uma delas, e ela for base poltica de um candidato, o resultado ser
distorcido.

v
A suficincia tambm um aspecto relativamente bvio.
UNIDADE

necessrio que a amostra tenha um tamanho suficiente para repre-


Na Unidade 9 vere-
sentar a variabilidade existente na populao. Quanto mais homog-
mos o clculo de ta-
nea for a populao (menor variabilidade), menor poder ser o tama-
manho de amostra em
maior detalhe.
nho da amostra, e quanto mais heterognea (maior variabilidade),
maior ter que ser o tamanho da amostra para represent-la.
A aleatoriedade da amostra o aspecto menos intuitivo, mas
extremamente importante. Significa que os elementos da amostra se-
Suficincia ou amostra ro selecionados da populao por meio de sorteio no viciado: todos
suficiente aquela que
tem um tamanho tal que
os elementos da populao tm chance de pertencer amostra. ne-
permite representar adequa- cessria uma listagem com os elementos da populao, permitindo a
damente a variabilidade da atribuio de nmeros a cada um deles, e feito o sorteio. Idealmente,
populao. Fonte: elabora-
do pelo autor.
ns escreveramos os nmeros dos elementos da populao em pe-
quenos papis, depositaramos em uma urna, misturaramos os pa-
Amostra aleatria, ca-
sual ou probabilstica pis, e, de olhos vendados, escolheramos os nmeros, selecionando a
a amostra retirada por amostra. Para grandes populaes esse procedimento invivel e com
meio de um sorteio no vi-
a disponibilidade de recursos computacionais contraproducente.
ciado, que garante que cada
elemento da populao ter O sorteio pode ser realizado atravs de tabelas de nmeros
uma probabilidade maior do aleatrios ou algoritmos de gerao de nmeros pseudo-
que zero de pertencer
amostra. Fonte: Barbetta,
aleatrios.
Reis e Bornia (2008). As tabelas de nmeros aleatrios so instrumentos usados para
Algoritmos de gerao
auxiliar na seleo de amostras aleatrias. So formadas por sucessi-
de nmeros pseudo-
aleatrios so progra- vos sorteios de algarismos do conjunto {0, 1, 2, 3, 4, 5, 6, 7, 8, 9},
mas computacionais que fazendo com que todo nmero com a mesma quantidade de algaris-
geram nmeros aleatrios
mos tenha a mesma probabilidade de ocorrncia. Quando o sorteio
(pseudo-aleatrios, pois
tm uma regra de forma- realizado manualmente, a tabela realmente chamada de tabela de
o), procurando simular os nmeros aleatrios. Muitos estatsticos realizaram tais sorteios, regis-
sorteios manuais de nme-
traram os resultados e os publicaram em livros e peridicos para uso
ros de 0 a 9. Fonte: elabo-
rado pelo autor. geral. Se, porm, os nmeros so obtidos mediante simulao
computacional, passamos a ter uma tabela de nmeros pseudo-alea-
trios, pois os nmeros so provenientes da execuo de um

v
algoritmo matemtico, que tem uma lgica e uma lei de formao
Neste caso h sempre dos resultados. No obstante, tal problema, caso o algoritmo seja bom,
o risco dos nmeros se somente ocorre aps milhes ou bilhes de sorteios, quantidade mui-
repetirem se a srie for tssimo superior quela usada nas nossas pesquisas. Alguns estatsti-
muito longa, cos construram tabelas de nmeros pseudo-aleatrios e as deixaram
descaracterizando a disponveis para o pblico em geral.
aleatoriedade.

42 Curso de Graduao em Administrao, modalidade a distncia


Nos dias de hoje, com todas as facilidades da informtica,
cada vez mais comum bases de dados armazenadas em meio digital,
desde uma simples planilha do Microsoft Excel, ou do Br.Office Calc
2

UNIDADE
at grandes bancos de dados.

Ento perguntamos: por que no realizar tambm o


processo de amostragem, em meio digital, com os
B
algoritmos citados no pargrafo anterior: os algoritmos
de gerao de nmeros pseudo-aleatrios?

Trata-se de programas computacionais que procuram simular


os sorteios reais de nmeros. A grande vantagem do seu uso a pos-
sibilidade de adaptar facilmente o sorteio ao tamanho da populao
envolvida, e, obviamente, a velocidade de processamento. Veja um

v
exemplo de nmeros aleatrios de quatro dgitos (de 0001 a 9000)
gerados pelo Br.Office Calc: Na seo Para saber
mais vamos
3439 907 5369 8092 7962 8626 131 3667 7769 1248 disponibilizar um link
2206 410 292 1478 1977 155 2566 3088 4983 3217 que explica como gerar
3347 3201 8193 4195 3836 2736 8781 7260 8921 2307 nmeros pseudo-aleat-
rios com este aplicativo.

No caso da nossa pesquisa para o CRA de Santa


Catarina, em que temos 9.000 registrados gradu-
ados em Santa Catarina, e h uma listagem da
populao, pense como seria o sorteio? No caso
mais simples de amostragem aleatria, o registra-
do de nmero 3.439 seria sorteado, seguido pelo
B
nmero 907, e pelo nmero 5.369, e assim por
diante, at completar o tamanho da amostra. Usu-
almente, cria-se automaticamente uma nova base
de dados com os elementos sorteados.

v
Toda a teoria de inferncia estatstica pressupe que a amos- Veremos sobre a teoria
tra, a partir da qual ser feita a generalizao (veja a Figura 10), foi da inferncia estatstica
retirada de forma aleatria. nas Unidades 8, 9 e
10.

Perodo 3 43
2 B Agora que j conhecemos os aspectos principais
para o sucesso da amostragem podemos detalhar
UNIDADE

o plano de amostragem.

Plano de Amostragem

Uma vez tendo decidido realizar a pesquisa selecionando uma


amostra da populao preciso elaborar o plano de amostragem,
que consiste em definir as unidades amostrais, o modo como a amostra
ser retirada (o tipo de amostragem), e o prprio tamanho da amostra.
As unidades amostrais so as selecionadas para se chegar
aos elementos da prpria populao. Podem ser os prprios elemen-
tos da populao, quando h acesso direto a eles, ou qualquer outra
unidade que possibilite chegar at eles: selecionar os domiclios como
unidades de amostragem, para chegar at as famlias (que so os ele-
mentos da populao); selecionar as turmas como unidades de
amostragem, para chegar at os alunos (que so os elementos da po-
pulao). No caso da pesquisa do CRA de Santa Catarina as unida-
des amostrais so os prprios elementos da populao, uma vez que
temos a sua listagem. No caso da Pesquisa Nacional por Amostragem
de Domiclios do IBGE, as unidades amostrais so os domiclios, atra-
vs dos quais chegamos s famlias.
O modo como a amostra ser retirada outra deciso impor-
tante, que precisa constar do plano de amostragem. Na Figura 10 a
seguir vemos o resumo dos diversos tipos de amostragem:

44 Curso de Graduao em Administrao, modalidade a distncia


2

UNIDADE
Figura 10: Tipos de Amostragem.
Fonte: elaborada pelo autor.

Amostragem probabilstica (aleatria)

Amostragem probabilstica, aleatria ou casual aquela


que garante que cada elemento da populao tenha probabilidade de
pertencer amostra. Para que isso ocorra necessrio que a amostra
seja selecionada por sorteio no viciado, ou seja, exige-se aleatorie-
dade. A sua importncia decorre do fato de que apenas os resultados
provenientes de uma amostra probabilstica podem ser generalizados
estatisticamente para a populao da pesquisa.

Voc deve estar se perguntando, mas afinal o que

associar aos resultados uma probabilidade de que


estejam corretos, ou seja, uma medida da
B
significa estatisticamente? Significa que podemos

confiabilidade das concluses obtidas. Se a amos-


tra no for probabilstica no h como saber se h
95% ou 0% de probabilidade de que os resulta-
dos sejam corretos, e as tcnicas de inferncia es-
tatstica, porventura utilizadas, tero validade
questionvel.

Perodo 3 45
2 A condio primordial para o uso da amostragem probabilstica
a de que todos os elementos da populao tenham uma probabilida-
de maior do que zero de pertencerem amostra. Tal condio mate-
UNIDADE

rializada se:

1) H acesso a toda a populao. Ou seja, no h teorica-


mente problema em selecionar nenhum dos elementos, to-
dos poderiam ser pesquisados. Concretamente, h uma lista
da populao, como no caso da pesquisa do CRA, que dis-
pe de uma lista com os 9.000 registrados que se gradua-
ram em Santa Catarina.
2) Os elementos da amostra so selecionados atravs de al-
guma forma de sorteio no viciado: tabelas de nmeros
aleatrios, nmeros pseudo-aleatrios gerados por compu-
tador. Com a utilizao de sorteio elimina-se a ingerncia
do pesquisador na obteno da amostra, e garante-se que
todos os integrantes da populao tm probabilidade de
pertencer amostra.

Amostragem aleatria
simples o processo de
amostragem em que todos
os elementos da populao
tm a mesma probabilida-
B Agora vamos lhe apresentar os tipos de amostragem
probabilstica.

de de pertencer amostra,
e cada elemento sorteado.
Fonte: Barbetta, Reis e
Bornia (2008).
Amostragem aleatria (casual) simples
Ta b e l a s d e n m e r o s A amostragem aleatria simples o tipo de amostragem
a l e a t r i o s so instru-
probabilstica recomendvel, somente, se a populao for homognea
mentos usados para auxili-
ar na seleo de amostras em relao aos objetivos da pesquisa, por exemplo, quando admiti-
aleatrias, formadas por su- mos que todos os elementos da populao tm caractersticas seme-
cessivos sorteios de algaris-
lhantes em relao aos objetivos da pesquisa. H uma listagem dos
mos do conjunto {0, 1, 2,
3, 4, 5, 6, 7, 8, 9}, fazen- elementos da populao, atribuem-se nmeros a eles, e atravs de al-
do com que todo nmero guma espcie de sorteio no viciado, por meio de tabelas de nmeros
com a mesma quantidade de
aleatrios ou nmeros pseudo-aleatrios gerados por computador, os
algarismos tenha a mesma
probabilidade de ocorrncia. integrantes da amostra so selecionados. Nesse tipo de amostragem
Fonte: Barbetta (2007). probabilstica todos os elementos da populao tm a mesma proba-
bilidade de pertencer amostra. Foi exatamente o que fizemos no fi-
nal do tema Aspectos necessrios para o sucesso da amostragem
para a nossa pesquisa do CRA.

46 Curso de Graduao em Administrao, modalidade a distncia


Amostragem sistemtica
Quando a lista de respondentes for muito grande a utilizao
2

UNIDADE
de amostragem aleatria simples pode ser um processo moroso, ou se
o tamanho de amostra for substancial, teremos que realizar um gran-
de nmero de sorteios: caso estejamos utilizando nmeros pseudo-
aleatrios aumenta o risco de repetio dos nmeros. Utiliza-se ento
uma variao, a amostragem sistemtica, que tambm supe que a
populao homognea em relao varivel de interesse, mas que
consiste em retirar elementos da populao a intervalos regulares, at
compor o total da amostra. A amostragem sistemtica somente pode
ser retirada se a ordenao da lista no tiver relao com a varivel
Amostragem sistemti-
de interesse. Imagine que queremos obter uma amostra de idades de ca a variao da
uma listagem justamente ordenada desta forma, neste caso a amostragem aleatria sim-
amostragem sistemtica no seria apropriada, a no ser que ples em que os elementos
da populao so retirados
reordenssemos a lista. a intervalos regulares, at
Veja a seguir o procedimento para a amostragem sistemtica: compor o total da amostra,
sendo o sorteio realizado
apenas no ponto de partida.
z obtm-se o tamanho da populao (N); Fonte: Barbetta (2007).

z calcula-se o tamanho da amostra (n) veremos isso mais


adiante; e
z encontra-se o intervalo de retirada k = N/n:
z se k for fracionrio, deve-se aumentar n at tornar o
resultado inteiro;
z se N for um nmero primo, excluem-se por sorteio
alguns elementos da populao para tornar k inteiro;
z sorteia-se o ponto de partida (um dos k nmeros do primei-
ro intervalo), usando uma tabela de nmeros aleatrios,
ou qualquer outro dispositivo (isso precisa ser feito para
garantir que todos os elementos da populao tenham
chance de pertencer amostra); e
z a cada k elementos da populao, retira-se um para fazer
parte da amostra, at completar o valor de n.

O resumo desse processo retratado na Figura 11, veja:

Perodo 3 47
2
UNIDADE

Figura 11: Processo de amostragem sistemtica.


Fonte: elaborada pelo autor.

B O exemplo a seguir ajudar voc a entender me-


lhor sobre o processo de amostragem sistemtica.
Leia com ateno!

Exemplo 1 Uma operadora telefnica pretende saber a opi-


nio de seus assinantes comerciais sobre seus servios na cidade de
Florianpolis. Supondo que h 25.037 assinantes comerciais, e a
amostra precisa ter no mnimo 800 elementos, mostre como seria or-
ganizada uma amostragem sistemtica para selecionar os respondentes.
A operadora dispe de uma lista ordenada alfabeticamente com
todos os seus assinantes, o intervalo de retirada ser: k = N/n =
25037/800 = 31,2965.
Como o valor de k fracionrio algo precisa ser feito. Aumen-
tar o tamanho da amostra no resolver o problema, porque 25.037
um nmero primo. Como no podemos reduzir o tamanho de amos-
tra, devendo permanecer igual a 800, se excluirmos por sorteio 237
elementos da populao, e refizermos a lista teremos: k = N/n =
24800/800 = 31.
A cada 31 assinantes um retirado para fazer parte da amos-
tra. Devemos sortear o ponto de partida: um nmero de 1 a 31 (do 1
ao 31 assinante). Imagine que o sorteio resultasse em 5, ento, a
amostra seria (nmero de assinantes): {5, 36, 67, 98,...., 24.774}.

48 Curso de Graduao em Administrao, modalidade a distncia


Amostragem estratificada
bastante comum que a populao de uma pesquisa seja he-
2

UNIDADE
terognea em relao aos objetivos da pesquisa. No caso de uma pes-
quisa eleitoral para governador, por exemplo, podemos esperar que a
opinio deva ser diferente dependendo da regio onde o eleitor mora,
classe social e mesmo profisso dos entrevistados. Contudo, podemos
supor que haja certa homogeneidade de opinio dentro de cada gru-
po. Ento, supe-se que haja heterogeneidade entre os estratos, mas
homogeneidade dentro dos estratos, e que eles sejam mutuamente
exclusivos (cada elemento da populao pode pertencer a apenas um
estrato). Para garantir que a amostra seja representativa da popula-
o precisamos garantir que os diferentes estratos sejam nela repre- Amostra representativa
aquela que representa na
sentados: deve usar a amostragem estratificada, como representa a
sua composio todas as
Figura 12: subdivises da populao,
procurando retratar da me-
lhor maneira possvel a sua
variabilidade. Fonte: elabo-
rado pelo autor.

A m o s t r a g e m
estratificada a
amostragem probabilstica
usada quando a populao
for heterognea em relao
aos objetivos da pesquisa
(as opinies tendem a vari-
ar muito de subgrupo para
subgrupo), e amostra pre-
cisa conter elementos de
Figura 12: Amostragem estratificada. cada subgrupo da popula-
Fonte: elaborada pelo autor. o para represent-la ade-
quadamente. Fonte:

B
Barbetta (2007).

Veja que a seleo dos elementos de cada estrato


pode ser feita usando amostragem aleatria sim-
ples ou sistemtica.

A amostragem estratificada pode ser:

z proporcional, quando o nmero de elementos selecionados


de cada estrato proporcional ao seu tamanho na popula-
o (por exemplo, se o estrato representa 15% da popula-
o, 15% da amostra dever ser retirada dele); e

Perodo 3 49
2 z uniforme, quando os mesmos nmeros de elementos so
selecionados de cada estrato.
UNIDADE

A amostragem estratificada proporcional possibilita resultados


melhores, mas exige um grande conhecimento da populao (para
saber quantos so e quais so os tamanhos dos estratos). A amostragem
estratificada uniforme mais utilizada em estudos comparativos.

B No caso da pesquisa do CRA voc acredita que a


populao heterognea em relao aos objetivos
da pesquisa? Ser que a regio do Estado, o fato
de ter estudado em faculdade pblica ou particu-
lar pode influenciar as opinies dos registrados so-
bre os cursos onde se graduaram?

Amostragem por conglomerados


Teoricamente, a amostragem estratificada proporcional apre-
senta os melhores resultados possveis. Sua grande dificuldade de uso
deve-se ao grau de conhecimento necessrio sobre a populao, que
geralmente no existe ou impraticvel de obter. Uma alternativa con-
siste no uso de conglomerados.
Amostragem por con- Os conglomerados tambm so grupos mutuamente exclusivos
glomerados a de elementos da populao, mas so definidos de forma mais arbitr-
amostragem probabilstica
ria do que os estratos: bastante comum definir os conglomerados
em que a populao sub-
dividida em grupos defini- geograficamente. Por exemplo, os bairros de uma cidade, que consti-
dos por convenincia (usu- tuiriam conglomerados de domiclios.
almente geogrfica), e al-
O procedimento para a amostragem por conglomerados ocorre
guns destes grupos so se-
lecionados por sorteio, e da seguinte forma:
elementos dos grupos sor-
teados podem tambm ser
z divide-se a populao em conglomerados;
sorteados para compor a
amostra. Fonte: Barbetta z sorteiam-se os conglomerados (usando tabela de nmeros
(2007).
aleatrios ou qualquer outro mtodo no viciado); e
z pesquisam-se todos os elementos dos conglomerados sorte-
ados, ou sorteiam-se elementos deles.

50 Curso de Graduao em Administrao, modalidade a distncia


A utilizao de amostragem por conglomerados permite uma
reduo substancial nos custos de obteno da amostra, sem compro-
meter demasiadamente a preciso, sendo que em alguns casos a
2

UNIDADE
nica alternativa possvel. Veja a Figura 13 e entenda como ocorre
essa amostragem:

Figura 13: Amostragem por conglomerados.


Fonte: elaborada pelo autor.

v
A Pesquisa Nacional por Amostra de Domiclios (PNAD) do
IBGE, coleta informaes demogrficas e socioeconmicas sobre a Mais informaes em
populao brasileira. Utiliza amostragem por conglomerados em trs < h t t p : / /
estgios: www.ibge.gov.br/home/
estatistica/populacao/
z Primeiro estgio: amostras de municpios (conglomera- trabalhoerendimento/
dos) para cada uma das regies geogrficas do Brasil; pnad98/saude/
metodologia.shtm>.
z Segundo estgio: setores censitrios sorteados em cada
municpio (conglomerado sorteado); e
z Terceiro estgio: domiclios sorteados em cada setor
censitrio.

B
Voc deve estar se perguntando, e quando no for
possvel garantir a probabilidade de todo elemento
da populao pertencer amostra? Ento esse o
momento de partirmos para a amostragem no
probabilstica.

Perodo 3 51
2 Amostragem no-probabilstica
A obteno de uma amostra probabilstica exige uma listagem
UNIDADE

com os elementos da populao. Em suma, exige acesso a todos os


elementos da populao. Nem sempre possvel obter tal listagem na
prtica, o que teoricamente inviabilizaria a retirada de uma amostra
probabilstica. Ento, pode-se recorrer amostragem no-probabilstica.
Ao usar a amostragem no-probabilstica o pesquisador no
sabe qual a probabilidade de que um elemento da populao tem de
pertencer amostra. Portanto, os resultados da amostra no podem
ser estatisticamente generalizados para a populao, porque no se
pode estimar o erro amostral.
Alguns dos usos habituais da amostragem no-probabilstica
so os seguintes:
Amostragem no-
probabilstica o pro-
cesso de amostragem em z a etapa preliminar em projetos de pesquisa;
que nem todos os elemen-
tos da populao tm z em projetos de pesquisa qualitativa; e
chance de pertencer amos-
tra, pois a seleo no fei-
z em casos em que a populao de trabalho no pode ser
ta por sorteio no viciado. enumerada.
Fonte: Barbetta (2007).

Erro amostral o valor

B
mximo que o pesquisador
admite errar na estimativa Veja que existem ainda vrios tipos de amostragem no-
de uma caracterstica da
populao a partir de uma
probabilstica e que sero descritos na sequncia.
amostra aleatria desta
mesma populao. Fonte:
Barbetta (2007).

Amostragem a esmo
Na Amostragem a esmo, o pesquisador procura ser o mais ale-
atrio possvel, mas sem fazer um sorteio formal. Imagine um lote de
10.000 parafusos, do qual queremos tirar uma amostra de 100, se
fssemos realizar uma amostragem aleatria simples o processo tal-
vez fosse trabalhoso demais. Ento simplesmente retiramos os elemen-
tos a esmo. Esse tipo de amostragem tambm pode ser utilizado quan-
do a populao for formada por material contnuo (gases, lquidos,
minrios), bastando homogeneizar o material e retirar a amostra.

52 Curso de Graduao em Administrao, modalidade a distncia


Amostragem por julgamento (intencional).
Na amostragem por julgamento, o pesquisador deliberadamente
2

UNIDADE
escolhe alguns elementos para fazer parte da amostra, com base no
julgamento de que aqueles seriam representativos da populao. Esse
tipo de amostragem bastante usado em estudos qualitativos. Obvia-
mente o risco de obter uma amostra viciada grande, pois se baseia
totalmente nas preferncias do pesquisador, que pode se enganar
(involuntria ou voluntariamente).

Amostragem por cotas


A Amostragem por cotas parece semelhante a uma amostragem
estratificada proporcional, da qual se diferencia por no empregar
sorteio na seleo dos elementos. A populao dividida em vrios
subgrupos, na realidade comum dividir em um grande nmero para
compensar a falta de aleatoriedade, e seleciona-se uma cota de cada
subgrupo, proporcional ao seu tamanho.
Em uma pesquisa de opinio eleitoral, por exemplo, podera-
mos dividir a populao de eleitores por sexo, nvel de instruo, fai-
xas de renda entre outros aspectos, e obter cotas proporcionais ao
tamanho dos grupos (que poderia ser obtido atravs das informaes
do IBGE). Na amostragem por cotas os elementos da amostra so
escolhidos pelos entrevistadores (de acordo com os critrios), geral-
mente em pontos de grande movimento, o que sempre acarreta certa
subjetividade (e impede que qualquer um que no esteja passando
pelo local no exato momento da pesquisa possa ser selecionado).

v
Na prtica, muitas pesquisas so realizadas utilizando
amostragem por cotas, incluindo as polmicas pesquisas eleitorais. Leia um texto muito in-
No exemplo apresentado no Quadro 1, imagine que queremos teressante sobre o tema
saber a opinio dos eleitores do bairro Goiaba sobre o governo muni- que est disponvel em:
cipal. Supe-se que as principais variveis que condicionariam as < h t t p : / /
respostas seriam sexo, idade e classe social. O bairro apresenta a se- www.ime.unicamp.br/
~ d i a s /
guinte composio demogrfica para as variveis:
falaciaPesquisaEleitoral.pdf>.

Perodo 3 53
2 SEXO
Masculino
IDADE (FAIXA ETRIA)
18| -- 35
CLASSE SOCIAL
A
% POPULACIONAL
1%
UNIDADE

Masculino 18| -- 35 B 4%
Masculino 18| -- 35 C 10%
Feminino 18| -- 35 A 1%
Feminino 18| -- 35 B 2%
Feminino 18| -- 35 C 9%
Masculino 35| -- 60 A 5%
Masculino 35| -- 60 B 8%
Masculino 35| -- 60 C 12%
Feminino 35| -- 60 A 4%
Feminino 35| -- 60 B 8%
Feminino 35| -- 60 C 10%
Masculino Mais de 60 A 1%
Masculino Mais de 60 B 9%
Masculino Mais de 60 C 3%
Feminino Mais de 60 A 3%
Feminino Mais de 60 B 7%
Feminino Mais de 60 C 3%

Quadro 1: Esquema de amostragem por cotas.


Fonte: adaptado de Marconi e Lakatos (2003).

Se, por exemplo, o tamanho de nossa amostra fosse igual a


200 (200 pessoas sero entrevistadas), o nmero de pessoas deveria
ser dividido de forma proporcional: 1% do sexo masculino, com idade
entre 18 e 25 anos, da classe A, totalizando duas pessoas; 4% do sexo
masculino, com idade entre 18 e 25 anos, da classe B, totalizando oito
pessoas, e assim por diante. Os entrevistadores receberiam suas co-
tas, e deveriam escolher pessoas, em pontos de movimento do referi-
do bairro, que se aproximem dos critrios e entrevist-las, recolhendo
suas opinies sobre o governo municipal. Usualmente os resultados
so generalizados estatisticamente para a populao, empregando as
tcnicas que sero vistas na Unidade 9 deste livro-texto, mas rigoro-
samente os resultados da amostragem por cotas no tm validade
estatstica, visto que no contemplam o princpio de aleatoriedade
na seleo da amostra.

54 Curso de Graduao em Administrao, modalidade a distncia


Amostragem bola de neve
A Amostragem bola de neve particularmente importante
2

UNIDADE
quando difcil identificar respondentes em potencial. A cada novo
respondente que identificado e entrevistado, pede-se que identifique
outros que possam ser qualificados como respondentes. Pode levar a
amostras compostas apenas por amigos dos primeiros entrevista-
dos, o que pode causar viesamentos nos resultados finais.

Agora que voc j conhece sobre o importante e


interessante tema do clculo do tamanho de amos-
tra, passaremos para uma amostra probabilstica.B
Clculo do tamanho de uma amostra probabilstica
(aleatria)

Viesamentos distores
A determinao do tamanho de amostra um dos aspectos na obteno da amostra que
mais controversos da tcnica de amostragem, e envolve uma srie de podem comprometer a
conceitos (probabilidade, inferncia estatstica e a prpria teoria da confiabilidade dos dados.
Fonte: elaborado pelo autor.
amostragem). Nesta seo apresentaremos uma viso simplificada
para obter o tamanho mnimo de uma amostra aleatria simples que
atenda aos seguintes requisitos:

z o interesse na proporo de ocorrncia de um dos valores


de uma varivel qualitativa na populao;
z a confiabilidade dos resultados da amostra deve ser apro-
ximadamente igual a 95% (ou seja, h 95% de probabili-
dade de que a proporo populacional do valor da varivel
qualitativa esteja no intervalo definido pelos resultados da
amostra);
z estamos fazendo uma estimativa exagerada do tamanho de
amostra; e

Perodo 3 55
2 z no vamos nos preocupar com aspectos financeiros relaci-
onados ao tamanho da amostra (embora, obviamente, seja
uma considerao importante).
UNIDADE

O primeiro passo, para calcular o tamanho da amostra, defi-


nir o erro amostral tolervel, que ser chamado de E0. Esse erro o
valor mximo que o pesquisador admite errar na estimativa de uma
caracterstica da populao.

B Lembre-se das pesquisas de opinio eleitoral: o


candidato Fulano est com 18% de inteno de
voto, a margem de erro da pesquisa de 2% para
mais ou para menos. O 2% o valor do erro
amostral tolervel, ento o percentual de pessoas
declarando o voto no candidato Fulano igual a
18% 2%. Alm disso, h uma probabilidade de
que este intervalo no contenha o valor real do
parmetro, ou seja, o percentual de eleitores que
declaram o voto no candidato, pelo fato de que
estamos usando uma amostra, embora isso raramente
seja dito na mdia, especialmente na televiso.

razovel imaginar que quanto menor o erro amostral toler-


vel escolhido maior ser o tamanho da amostra necessrio para obt-
lo. Isso fica mais claro ao ver a frmula para obteno da primeira

estimativa do tamanho de amostra: .

Onde E0 o erro amostral tolervel, e n0 a primeira estimativa


do tamanho de amostra. Se o tamanho da populao, N, for conheci-
do podemos corrigir a primeira estimativa: .

Pense, com esse exemplo, em como obter o tamanho mnimo


de uma amostra aleatria simples, admitindo com alto grau de confi-
ana, um erro amostral mximo de 2%, supondo que a populao
tenha:

a) 200 elementos.
b) 200.000 elementos.

56 Curso de Graduao em Administrao, modalidade a distncia


Observe a diferena entre os tamanhos das duas populaes: a
da letra b mil vezes maior do que a da letra a. Como a primeira esti-
mativa, n0 no depende do tamanho da populao, e o erro amostral
2

UNIDADE
2% para ambas podemos calcul-lo apenas uma vez. Devemos dividir

o 2% por 100 antes de substituir na frmula: .

Ento nossa primeira estimativa, para um erro amostral de 2%,


retirar uma amostra de 2.500 elementos.

z Obviamente precisamos corrigir a primeira estimativa, pois


a populao conta com apenas 200 elementos. Ento:

Precisamos arredondar, sempre para cima, o tamanho m-


nimo da amostra. Ento a amostra dever ter pelo menos
186 elementos para garantir um erro amostral de 2%. Ob-
serve que a amostra representa 93% da populao. Ser
que um censo no seria mais aconselhvel neste caso?
z Corrigindo a primeira estimativa com o tamanho da popu-
lao:

Arredondando, a amostra dever ter no mnimo 2.470 ele-


mentos para garantir um erro amostral de 2%. Observe que
a amostra representa 1,235 % da populao. Clarssimo
caso em que a amostragem a melhor opo de coleta.
Poderamos ter usado diretamente a primeira estimativa,
2.500 elementos, pois a correo no causou grande mu-
dana. Este exemplo prova que no precisamos de gran-
des amostras para obter uma boa preciso nos resultados.
A Figura 14 mostra um grfico relacionando tamanhos de amos-
tra para diferentes tamanhos de populao, considerando um erro
amostral tolervel igual a 2%.

Perodo 3 57
2
UNIDADE

Figura 14: Tamanho de amostra x tamanho da populao (e0 = 2%).


Fonte: elaborado pelo autor a partir de Microsoft.

Observe que a partir de um determinado tamanho de popula-


o, para o mesmo erro amostral, o ritmo de crescimento do tamanho
da amostra vai diminuindo, para 70.000 elementos ou mais pratica-
mente no h mais aumento. Isso mostra que no h necessidade de
retirar, por exemplo, 50% da populao para ter uma boa amostra.
importante alertar que ao calcular o tamanho de amostra para
amostragem estratificada, deve-se faz-lo para cada estrato, e o ta-
manho total ser a soma dos valores. Se isso no for feito, no pode-
mos garantir o erro amostral dentro de cada estrato: se calcularmos
um valor geral e dividirmos o tamanho da amostra por estrato (mes-
mo proporcionalmente), a margem de erro dentro de cada estrato ser
maior do que a prevista.

58 Curso de Graduao em Administrao, modalidade a distncia


Saiba mais.....
Sobre amostragem, consulte: BARBETTA, Pedro A. Estatstica Aplicada s
2

UNIDADE
Cincias Sociais. 7. ed. Florianpolis: Ed. da UFSC, 2008, Captulo 3.

Sobre caractersticas de fcil mensurao consulte em LAGO NETO, Joo C.


O Efeito da Autocorrelao em Grficos de Controle para Varivel Contnua:
um estudo de caso. Florianpolis. 1999. Dissertao (Mestrado em Engenha-
ria de Produo). Programa de Ps-Graduao em Engenharia de Produo,
Universidade Federal de Santa Catarina. 1999.

Sobre pesquisas eleitorais, consulte: SOUZA, Jorge. Pesquisas Eleitorais:


crticas e tcnicas. Braslia: Centro Grfico do Senado Federal, 1990.

Sobre como gerar nmeros pseudo-aleatrios ou obter amostras aleatrias


simples no Br.Office Calc, leia o texto: Como gerar uma amostra aleatria
simples com o Br.Office Calc, no Ambiente Virtual de Ensino-Aprendizagem.

r
Sobre Amostragem a esmo, leia: COSTA NETO, Pedro L. da O. Estatstica.
2. ed, So Paulo: Edgard Blcher, 2002.

Resumindo
O resumo desta Unidade est esquematizado na Figura
15. Observe:

Perodo 3 59
2
UNIDADE

Figura 15: Resumo da Unidade 2.


Fonte: elaborada pelo autor

60 Curso de Graduao em Administrao, modalidade a distncia


Caro estudante,
Chegamos ao final da Unidade 2 em que estuda-
B 2

UNIDADE
mos sobre amostragem e censo e suas formas de
utilizao, habilidades necessrias para um bom
administrador. Essa Unidade foi repleta de Figu-
ras, Quadros, representaes e exemplos de utili-
zao das tcnicas e das diferentes formas de uti-
lizao na ntegra de suas especificidades, e deu
sustentao para as discusses das prximas Uni-
dades. Releia, caso necessrio, todos os exemplos,
leia as indicaes do Saiba mais e discuta com seus
colegas. Na realizao da atividade de aprendiza-
gem voc colocar em prtica os ensinamentos re-
passados. Conte sempre com o acompanhamento
da tutoria e das explicaes do professor. Lembre-
se que voc no est sozinho. Conte com a gente!

Atividades de aprendizagem
aprendizagem

O que voc acha de testar seus conhecimentos


com relao ao estudo da Unidade 2? Para tanto,
faa as atividades propostas a seguir e encami-
B
nhe-as para seu tutor atravs do Ambiente Virtual
de Ensino-Aprendizagem. No hesite em buscar o
auxlio do seu tutor se encontrar dificuldades.

1) Analise os planos de amostragens apresentados abaixo. Voc concorda


com a maneira como foram elaborados? Justifique. Apresente as solu-
es que voc julgar necessrias.
a) Para ser conhecida a opinio dos estudantes da UFSC so-
bre o Jornal Universitrio, foram colhidas as opinies de

Perodo 3 61
2 40 estudantes da ltima fase do curso de Jornalismo da-
quela instituio.
UNIDADE

b) H interesse em medir o ndice de luminosidade das salas


de aula da UFSC. A coleta de dados ser feita em todos os
centros da UFSC, durante os perodos diurno e noturno,
nas salas que estiveram desocupadas no momento da pes-
quisa. Cada centro ser visitado apenas uma vez.
c) As constantes reclamaes dos usurios motivaram a dire-
o da Biblioteca Central da UFSC a realizar uma pesqui-
sa sobre o nvel de rudo em suas dependncias. O rudo
ser medido em todas as sees da Biblioteca, na primeira
e na penltima semanas do semestre, de segunda a sba-
do, durante todo o horrio de funcionamento.
d) No controle de qualidade de uma fbrica de peas, que
trabalha 24 horas por dia, sete dias por semana, um item
produzido retirado de cada mquina, a cada meia hora,
para avaliao. O procedimento feito durante todo o dia,
ao longo da semana.
e) O Comando de um Batalho da Polcia Militar de Santa
Catarina quer conhecer a opinio das pessoas que residem
em sua rea de atuao, no intuito de formular novas esca-
las de policiamento ostensivo. Para tanto sero feitas en-
trevistas com as pessoas que se passarem a p pela frente
do Batalho, de segunda sexta das 8:30 s 12:00 horas
e das 14:00 s 17:30 horas durante duas semanas.
f) Com a finalidade de estudar o perfil dos consumidores de
um supermercado, observaram-se os consumidores que
compareceram ao supermercado no primeiro sbado do
ms.
g) Com a finalidade de estudar o perfil dos consumidores de
um supermercado, fez-se a coleta de dados durante um
ms, tomando a cada dia um consumidor de cada fila de
cada caixa, variando-se sistematicamente o horrio de co-
leta dos dados.

62 Curso de Graduao em Administrao, modalidade a distncia


h) Para avaliar a qualidade dos itens que saem de uma linha
de produo, observaram-se todos os itens das 14h s 14
h30min.
2

UNIDADE
i) Para avaliar a qualidade dos itens que saem de uma linha
de produo, observou-se um item a cada meia hora, du-
rante todo o dia.
j) Para estimar a porcentagem de empresas que investiram
em novas tecnologias no ltimo ano, enviou-se um questi-
onrio a todas as empresas de um estado. A amostra foi
formada pelas empresas que responderam o questionrio.
2) Uma determinada faculdade do interior de Santa Catarina possui seis
cursos, estando os alunos matriculados de acordo com a tabela abaixo:

CURSO DIREITO ADMINISTRAO ECONOMIA AGRONOMIA VETERINRIA COMPUTAO


Alunos 250 200 150 150 150 100

A diretoria pretende selecionar, por amostragem, alguns alunos para


uma atividade extracurricular.
a) Os cursos direito, administrao e economia formam um
estrato (socioeconmicos), agronomia e veterinria formam
outro (agrrios) e computao outro estrato (tecnolgicos),
extraia uma amostra estratificada proporcional de 20 alu-
nos (use o Microsoft Excel ou o Br.Office Calc).
b) Atravs de uma amostragem de conglomerados de dois es-
tgios extraia uma amostra aleatria de 21 alunos. Seleci-
one trs cursos, e depois sete alunos por curso (use o
Microsoft Excel ou o Br.Office Calc).
c) Qual das duas amostras voc acredita que tem resultados
mais confiveis? JUSTIFIQUE.

3) Ser feito um levantamento por amostragem de uma populao de 2.000


famlias, para a realizao de uma pesquisa.
a) Calcule o tamanho mnimo de uma amostra para que se
tenha um erro amostral mximo de 5%.

Perodo 3 63
2 b) Supondo a populao dividida em dois estratos iguais, qual
o tamanho mnimo de amostra para se ter um erro amostral
mximo de 5% em cada estrato?
UNIDADE

c) Qual seria o erro amostral em cada estrato do item b, se o


tamanho da amostra em cada estrato fosse simplesmente o
valor definido no item a dividido por 2?

64 Curso de Graduao em Administrao, modalidade a distncia


3 2

UNIDADE
UNIDADE
Anlise Exploratria
de Dados I

D
Objetivo
Nesta Unidade voc compreender a definio de
Anlise Exploratria de Dados e aprender como
realizar a descrio tabular e grfica de conjuntos
de dados referentes a variveis qualitativas e
quantitativas.

Perodo 3 65
3
UNIDADE

66 Curso de Graduao em Administrao, modalidade a distncia


O que anlise exploratria de dados? 3

UNIDADE
Caro estudante,

de uma pesquisa e as principais tcnicas de


amostragem. Conforme vimos, independente de os
dados terem sido coletados via censo ou
B
Nas Unidades anteriores estudamos o planejamento

amostragem, eles precisam ser interpretados, para


atingir os objetivos propostos da pesquisa. O pas-
so inicial para isso usar os conceitos e as tcni-
cas da Anlise Exploratria de Dados para resumir
e organizar os dados, de maneira que seja possvel
identificar padres e elaborar as primeiras conclu-
ses a respeito da populao, isto , descrever a
sua variabilidade.
O primeiro passo da Anlise Exploratria de Dados
organizar os dados, para que seja possvel resu-
mi-los e, posteriormente, interpret-los. Para en-
tender esse contexto, importante relembrar a de-
finio de varivel e a sua classificao por nvel
de mensurao e nvel de manipulao, estudadas
na Unidade 1.
Ainda nesta Unidade vamos estudar como realizar
a anlise exploratria de dados atravs de tabelas
e grficos para cinco casos, tipos de conjuntos de
dados: uma varivel qualitativa, uma varivel quan-
titativa, duas variveis qualitativas, uma qualitati-
va e uma quantitativa e duas quantitativas.
indispensvel que o administrador seja capaz de
realizar Anlise Exploratria de Dados: sem isso a
sua capacidade de tomada de decises ficar seri-
amente comprometida.

Perodo 3 67
v A
3 No passa-
do a An-
Anlise Exploratria de Dados, antigamente chamada ape-
nas de Estatstica Descritiva, constitui o que a maioria das pes-
soas entende como Estatstica, e inconscientemente usa no dia
UNIDADE

lise Explo- a dia. Consiste em resumir e organizar os dados coletados atravs


ratria de de tabelas, grficos ou medidas numricas, e, a partir dos dados resu-
Dados era midos, procurar alguma regularidade ou padro nas observaes (in-
chamada terpretar os dados).
de Esta- A partir dessa interpretao inicial possvel identificar se os
tstica dados seguem alguns modelos conhecidos, que permitam estudar o
Descritiva, por preo-
fenmeno sob anlise, ou se necessrio sugerir um novo modelo.
cupar-se com a des-
Usualmente a concretizao dos objetivos de uma pesquisa passa pela
crio dos dados to
anlise de uma ou mais variveis estatsticas, ou do seu relaciona-
somente.
mento.
O processo da anlise exploratria de dados consiste em orga-
nizar, resumir e interpretar as medidas das variveis da melhor ma-
neira possvel. Para tanto, necessrio construir um arquivo de da-
dos, que tem algumas caractersticas especiais.
Variveis estatsticas
so caractersticas que po-
dem ser observadas ou me-
didas em cada elemento
pesquisado, sob as mesmas
condies. Para cada vari-
Estrutura de um arquivo de dados
vel, para cada elemento
pesquisado, em um dado
momento, h um e apenas
Uma vez disponveis, os dados precisam ser tabulados, para
um resultado possvel. Fon-
te: Barbetta (2007). possibilitar sua anlise. Atualmente os dados costumam ser armaze-
nados em meio computacional, seja em grandes bases de dados, pro-
gramas estatsticos ou mesmo planilhas eletrnicas, sejam oriundos
de pesquisa de campo, ou apenas registros de operaes financeiras,
arquivos de recursos humanos, entre outros. Possuem uma estrutura
fixa, que possibilita a aplicao de vrias tcnicas para extrair as in-
formaes de interesse.
As variveis so registradas nas colunas, e os casos (os ele-
mentos da populao) nas linhas. As variveis so as caractersticas
pesquisadas ou registradas. Imagine a base de dados do Departamen-
to de Administrao Escolar (DAE) da Universidade Federal de Santa
Catarina (UFSC), que armazena as informaes dos acadmicos, con-
tendo as variveis, o nome do aluno, a data de nascimento, o nmero
de matrcula, o ndice de Aproveitamento Acumulado (IAA), o ndice
de Aproveitamento por Perodo (IAP) e outras informaes, ou uma
operadora de carto de crdito, que armazena as transaes efetuadas,

68 Curso de Graduao em Administrao, modalidade a distncia


contendo o nmero do carto, nome do titular, hora da transao,
valor do crdito, bem ou servio adquirido.
Os casos constituem cada indivduo ou registro, para a base
3

UNIDADE
do DAE, Joo Ningum, nasceu em 20 de fevereiro de 1985, matrcu-
la 02xxxxxxx-01, IAA = 3,5, IAP = 6,0. Para a operadora de carto
de crdito, carto nmero xxxxxxxxx-84, Jos Nenhum, R$200,

v
14h28min 11 de dezembro de 2003, supermercado.
Exemplo 1 A Megamontadora TOYORD regularmente con-
duz pesquisas de mercado com os clientes que compraram carros zero Trata-se de uma empre-
km diretamente de suas concessionrias. O objetivo avaliar a satis- sa e de uma pesquisa
fao dos clientes em relao aos diferentes modelos, seu design e fictcias.
adequao ao perfil do cliente. A ltima pesquisa foi terminada em
julho de 2007: 250 clientes foram entrevistados entre o total de 30.000
que compraram veculos novos entre maio de 2006 e maio de 2007. A
pesquisa foi restringida aos modelos mais vendidos, e aos que j es-
to no mercado h dez anos. As seguintes variveis foram obtidas:

z Modelo comprado: o compacto Chiconaultla, o sed mdio


DeltaForce3, a perua familiar Valentiniana, a van
SpaceShuttle ou o luxuoso LuxuriousCar.
z Opcionais: inexistentes (apenas os itens de srie); ar-con-
dicionado e direo hidrulica; ar-condicionado, direo
hidrulica e trio eltrico; ar-condicionado, direo hidru-
lica, trio eltrico e freios ABS.
z Opinio sobre o design: se os clientes consideram o
design do veculo comprado ultrapassado, atualizado, ou
adiante dos concorrentes.
z Opinio sobre a concessionria onde comprou o
veculo (incluindo atendimento na venda, manu-
teno programada e eventuais problemas impre-
vistos): muito insatisfatria, insatisfatria, no causou
impresso, satisfatria, bastante satisfatria.
z Opinio geral sobre o veculo adquirido: muito insa-
tisfeito, insatisfeito, satisfeito, bastante satisfeito.
z Renda declarada pelo cliente: em salrios mnimos
mensais.
z Nmero de pessoas geralmente transportadas no veculo.

Perodo 3 69
3 z Quilometragem mensal mdia percorrida com o veculo.
z Percepo do cliente de h quantos anos o veculo com-
prado teve a sua ltima remodelao de design: em anos
UNIDADE

completos (se h menos de um ano o entrevistador anotou


zero).
z Idade do cliente em anos completos.

B Imagine que voc trainee da TOYORD. Sua mis-


so analisar os resultados da pesquisa apresen-
tando um relatrio. Dependendo do seu desempe-
nho, voc poder ser contratado definitivamente
ou dispensado (sem carta de recomendao). Como
deve ser estruturada a base de dados para permitir
a anlise?

Digamos que voc dispe dos 250 questionrios que foram


aplicados e ir tabul-los em uma planilha eletrnica, como o Br.Office
Calc. H dez variveis, a base de dados deve ter ento dez colunas e
250 linhas (no Calc, 251, j que a primeira ser usada para pr o
nome das variveis). Veja o resultado com as primeiras linhas (casos)
na Figura 16:

Figura 16: Base de dados da Toyord.


Fonte: adaptada pelo autor de Linux (2008).

Veja que cada uma das variveis registrada em uma coluna


especfica, e que nas linhas encontram-se os registros de cada funcio-

70 Curso de Graduao em Administrao, modalidade a distncia


nrio. Por exemplo, o respondente 1 adquiriu um modelo Deltaforce3,
com os opcionais: ar-condicionado e direo hidrulica e considera o
design do veculo atualizado, diz que o atendimento da concession-
3

UNIDADE
ria onde comprou o veculo no causou impresso, est muito insatis-
feito com seu veculo, tem renda mensal de 24,98 salrios mnimos
(R$ 9.492,00), costuma levar cinco pessoas no veculo, trafega em
mdia 415 km por ms com esse veculo, cr que a ltima remodela-
o foi feita h dois anos e tem 35 anos de idade. Esse raciocnio
pode ser estendido para os outros 249 respondentes. Analisando as
variveis isoladamente ou em conjunto podemos atingir os objetivos
da pesquisa.
O arquivo de dados mostrado na Figura 16 est disponvel no

v
Ambiente Virtual de Ensino-Aprendizagem no formato do Excel e do
Calc. Juntamente com ele est disponibilizado o texto Como realizar Veja a seo Saiba
anlise exploratria de dados no Br.Office Calc, e como realizar an- mais desta Unidade. O
lise exploratria de dados no Microsoft Excel. arquivo de dados e o tex-
A maioria dos programas estatsticos, gerenciadores de bases to serviro para as Uni-
de dados e planilhas eletrnicas com capacidade estatstica exige que dades 3 e 4.
os dados sejam estruturados de acordo com o formato da Figura 16.
Podemos ter tantas colunas e linhas quisermos, respeitando, porm,
as capacidades dos programas, o Microsoft Excel, por exemplo, ad-
mite 65.000 linhas, o que suficiente para muitas aplicaes.
Uma vez os dados no formato apropriado, especialmente se em
meio digital, podemos passar para a etapa de anlise. Uma das ferra-
mentas mais teis para isso a distribuio de frequncias, como
veremos a seguir.

Distribuio de frequncias Distribuies de Fre-


quncias organizaes
O processo de resumo e organizao dos dados busca basi- dos dados de acordo com as
ocorrncias dos diferentes
camente registrar as ocorrncias dos possveis valores das variveis
resultados observados. Fon-
que caracterizam o fenmeno, em suma consiste em elaborar Dis- te: Barbetta, Reis e Bornia
tribuies de Frequncias das variveis para que o conjunto de (2008).

dados possa ser reduzido, possibilitando a sua anlise.


A construo da distribuio de frequncias exige que os pos-
sveis valores da varivel sejam discriminados e seja contado o nme-
ro de vezes em que cada valor ocorreu no conjunto de dados. Para
grandes arquivos de dados tal processo somente vivel utilizando
meios computacionais.

Perodo 3 71
3 Uma distribuio de frequncias pode ser expressa atravs de
tabelas ou de grficos, que tero algumas particularidades dependen-
do do nvel de mensurao da varivel e de quantas variveis sero
UNIDADE

analisadas. Vamos ver cinco casos: quando h apenas uma varivel


qualitativa, quando h apenas uma varivel quantitativa, quando h
duas variveis (sendo ambas qualitativas, ambas quantitativas, ou uma
qualitativa e a outra quantitativa).

Se algum diz que Caso de uma varivel qualitativa


33,33% (percentual)
Usualmente uma varivel qualitativa assume apenas alguns
das mulheres de um
valores: basta ento discrimin-los e contar quantas vezes eles ocor-
curso se casaram com
rem no conjunto. Esta contagem pode ser registrada em nmeros ab-
professores voc pode-
ria ter uma m impres-
solutos, frequncia absoluta, ou em nmeros relativos, frequncia
so dessas moas. Mas relativa ou percentual. Ambos os registros devem ser feitos e apre-
se algum diz que das sentados: a frequncia absoluta permite avaliar se os resultados so
slidos ( temerrio tomar decises com base em pequenas quantida-

v
trs mulheres (dados
brutos) deste curso uma des de dados); j a frequncia relativa possibilita comparar os resulta-
delas casou-se com um dos da distribuio de frequncias com outros conjuntos de tamanhos
professor o efeito j no diferentes. A distribuio de frequncias pode ser apresentada em for-
ser to grande. Fonte: ma de tabela ou grfico.

B
Huff (1992).

Exemplo 2 Imagine que voc est interessado


em descrever a varivel opinio sobre a concessio-
Frequncia absoluta
registro dos valores da vari-
nria (vista no exemplo 1), isoladamente, e repre-
vel por meio de contagem sentar os dados em forma de tabela. Como ficari-
das ocorrncias no conjun- am os resultados? Saiba que o resultado seria se-
to de dados. Fonte:
Barbetta, Reis e Bornia
melhante ao ilustrado no Quadro 2, uma apresen-
(2008). tao tabular da varivel opinio sobre concessio-
Frequncia relativa ou nria.
percentual registro dos
valores da varivel por meio
de proporo (relativa) ou
percentagem (percentual)
do total das ocorrncias do
conjunto de dados. Fonte:
Barbetta, Reis e Bornia
(2008).

72 Curso de Graduao em Administrao, modalidade a distncia


VALORES
Muito insatisfatria
FREQUNCIA
29
PERCENTUAL
11,60%
3

UNIDADE
Insatisfatria 58 23,20%
No causou impresso 75 30,00%
Satisfatria 50 20,00%
Bastante satisfatria 38 15,20%
Total 250 100%

Quadro 2: Opinio dos clientes sobre as concessionrias Toyord.


Fonte: elaborado pelo autor.

Podemos concluir, neste segundo exemplo, que as


concessionrias no so exatamente bem vistas
pelos clientes: apenas 35,20% dos entrevistados B
as consideram satisfatrias ou bastante satisfatrias.
Pense que, neste caso, o administrador ter que
descobrir as causas de tal resultado e atuar para
resolver os problemas.

Podemos aplicar um raciocnio semelhante para as outras va-


riveis qualitativas e apresentar uma descrio grfica da distribui-
o de frequncias. Quando a varivel qualitativa podemos usar
dois tipos de grficos: em barras ou em setores.
No grfico de barras (Figura 17) em um dos eixos so coloca-
das as categorias da varivel e no outro as frequncias ou percentuais
de cada categoria. As barras podem ser horizontais ou verticais (pre-
ferencialmente estas). Para os dados do segundo exemplo, usando as
frequncias:

Perodo 3 73
3
UNIDADE

Figura 17: Grfico em barras para Opinio sobre as concessionrias.


Fonte: adaptada pelo autor a partir de Microsoft.

Trata-se da mesma distribuio de frequncias observada no


Quadro 2. A apreenso da informao, porm, muito mais rpida
atravs de um grfico. Percebe-se claramente que a opo No cau-
sou impresso apresenta maior frequncia.

B Contudo, voc consegue identificar alguma parti-


cularidade neste grfico? Olhe bem!

A escala comea em 20, no em zero. Sendo assim, as diferen-


as relativas entre as frequncias podem ser distorcidas, o que pode
levar a uma interpretao diferente dos resultados: cuidado, portanto,
com as escalas dos grficos. muito comum vermos erros grosseiros
nas escalas de grficos veiculados na mdia em geral, provavelmente
por ignorncia, mas devemos estar atentos. Os administradores to-
mam decises baseadas na interpretao de grficos, ento estes de-
vem retratar fielmente a realidade. Veja a Figura 18, com a escala
correta.

74 Curso de Graduao em Administrao, modalidade a distncia


3

UNIDADE
Figura 18: Grfico em barras para Opinio sobre as concessionrias.
Fonte: adaptada pelo autor de Microsoft.

Outro tipo de grfico bastante utilizado o grfico circular, em


setores ou em pizza. Ele apropriado quando o nmero de valores
da varivel qualitativa no muito grande, mas sua construo um
pouco mais elaborada do que o grfico de barras. Consiste em dividir
um crculo (360) em setores proporcionais s realizaes de cada
categoria atravs de uma regra de trs simples, na qual a freqncia
total (ou o percentual total 100%) corresponderia aos 360 e a
frequncia ou a proporo de cada categoria corresponderia a um
valor desconhecido em graus.

Observe os valores em graus correspondentes aos resultados


do Quadro 3.

Perodo 3 75
3 VALORES
Muito insatisfatria
FREQNCIA
29
PERCENTUAIS
11,60%
GRAUS
41,76
UNIDADE

Insatisfatria 58 23,20% 83,52


No causou impresso 75 30,00% 108
Satisfatria 50 20,00% 72
Bastante satisfatria 38 15,20% 54,72
Total 250 100% 360

Quadro 3: Opinio dos clientes sobre as concessionrias Toyord.


Fonte: elaborado pelo autor.

E o grfico em setores ser conforme apresentado na Figura


19:

Figura 19: Grfico em setores para a Opinio sobre as concessionrias


Fonte: adaptada pelo autor de Microsoft.

Pela observao dos percentuais possvel perceber o predo-


mnio da opo No causou impresso com 30% das respostas. Se
a varivel qualitativa tiver muitos valores (por exemplo, bairros da
regio metropolitana de So Paulo), o grfico dificilmente resumir
alguma coisa, pois ter um nmero excessivo de fatias. Isso tambm
ocorre com variveis quantitativas, especialmente as contnuas.

Caso de duas variveis qualitativas


O administrador frequentemente precisa estudar o relaciona-
mento entre duas ou mais variveis, para tomar decises. Por exem-

76 Curso de Graduao em Administrao, modalidade a distncia


plo, h relao entre o sexo do consumidor e a preferncia por um
modelo de carro, ou entre a escolaridade do eleitor e o candidato a
presidente escolhido, entre outras.
3

UNIDADE
Quando as duas variveis so qualitativas (originalmente ou
quantitativas categorizadas) usualmente construda uma distribui-
o conjunta de frequncias, tambm chamada de tabela de con-
tingncias, ou dupla classificao.
Nela so contadas as frequncias de cada cruzamento possvel
entre os valores das variveis. A expresso pode incluir o clculo de
percentuais em relao ao total das linhas, colunas ou total geral da ta-
bela. A representao grfica tambm possvel. Vamos ver um exemplo.
Para a mesma situao do Exemplo 1. Agora voc est interes-
Ta b e l a d e c o n t i n g n c i -
sado em observar relacionamento entre a varivel modelo adquirido e as tabela que permite
a opinio geral do cliente sobre o veculo, e expressa-lo de forma tabu- analisar o relacionamento
entre duas variveis, nas li-
lar e grfica.
nhas so postos os valores
A varivel modelo apresenta cinco resultados possveis (cinco de uma delas, e nas colu-
modelos foram considerados nesta pesquisa), e a varivel opinio geral nas os da outra, e nas clu-
las contam-se as freqn-
pode assumir quatro resultados (Bastante satisfeito, satisfeito, insatis- cias de todos os cruzamen-
feito e muito insatisfeito). Isso significa que podemos ter at 20 cruza- tos possveis. Fonte:
mentos possveis para os quais precisamos contar as frequncias. Para Barbetta (2007).

grandes bases de dados, mesmo para o nosso exemplo em que h ape-


nas 250 casos, seria um processo tedioso, e sujeito a erros. Portanto, o
mais inteligente utilizar alguma ferramenta computacional, mesmo uma
planilha eletrnica como o Microsoft Excel ou o Br.Office Calc.
Usando uma ferramenta computacional chegaremos ao Qua-
dro 4.

O PINIO GERAL SOBRE O VECULO

MODELO MUITO INSATISFEITO SATISFEITO BASTANTE TOTAL


INSATISFEITO SATISFEITO

1 1
Chiconaultla 69 11 1 0 81
DeltaForce3 29 22 5 0 56
Valentiniana 11 18 9 3 41
SpaceShuttle 1 14 17 10 42
LuxuriousCar 0 1 9 19 29
Total 110 67 41 32 250

Quadro 4: Tabela de contingncias de modelo por opinio geral (apenas


frequncias).
Fonte: elaborado pelo autor.

Perodo 3 77
3 Observe a ltima coluna e a ltima linha do quadro acima: so
os chamados totais marginais, isto , as frequncias dos valores
das variveis Modelo e Opinio geral sobre o veculo, respectivamen-
UNIDADE

te. Percebe-se que os modelos Chiconaultla e DeltaForce3 so os mais


vendidos, e que as opinies negativas (muito insatisfeito e insatisfei-
to) so mais frequentes do que as positivas.
Alm disso, fcil perceber que as opinies negativas so as
predominantes nos modelos Chiconaultla, DeltaForce3 e em menor
grau no Valentiniana. Apenas os modelos SpaceShuttle e LuxuriousCar
tm proprietrios predominantemente satisfeitos.
Totais marginais totais
Voc deve ter percebido tambm uma linha com vrias clulas
das linhas ou das colunas
de uma tabela de contin- vazias (apenas uma observao na opo insatisfeito). Trata-se de
gncia, permitem avaliar um dado perdido: o entrevistado esqueceu de mencionar o modelo
individualmente as vari-
adquirido, ou o entrevistador no o registrou durante a realizao da
veis componentes da tabe-
la. Fonte: Bussab e Morettin pesquisa, ou mesmo houve um erro de digitao. Como a quantidade
(2003). aqui muito pequena (1 em 250, 0,4%), no causar grandes proble-
mas. Apenas quando a quantidade ultrapassa 5% da base de dados

v
h motivo para preocupao, pois ou houve muitos erros de digitao
Conforme vimos na na tabulao dos dados, ou o instrumento de pesquisa foi mal proje-
Unidade 1 tado, pois muitos elementos da populao no forneceram as infor-
maes desejadas.
O Quadro 4 pode ser apresentado de forma grfica, atravs de
um grfico de barras mltiplas (Figura 20).

Figura 20: Grfico de barras mltiplas: Opinio geral por Modelo.


Fonte: adaptado pelo autor de Microsoft.

78 Curso de Graduao em Administrao, modalidade a distncia


As frequncias absolutas podem ser insuficientes para a inter-
pretao dos resultados, especialmente quando comparando os resul-
tados com outros conjuntos de dados de tamanhos diferentes. Assim,
3

UNIDADE
podemos calcular percentuais, em relao aos totais de cada coluna,
ou aos totais de cada linha ou ao total geral da tabela. Vamos apre-
sentar apenas um dos percentuais possveis, em relao aos totais das
linhas (maiores detalhes nos textos Como realizar anlise exploratria
de dados no Microsoft Excel e Como realizar anlise exploratria
de dados com o Br.Office Calc):

O PINIO GERAL SOBRE O VECULO

MODELO MUITO INSATISFEITO SATISFEITO BASTANTE TOTAL


INSATISFEITO SATISFEITO

Chiconaultla 69 11 1 0 81
85,19% 13,58% 1,23% 0,00% 100%
DeltaForce3 29 22 5 0 56
51,79% 39,29% 8,93% 0,00% 100%
Valentiniana 11 18 9 3 41
26,83% 43,90% 21,95% 7,32% 100%
SpaceShuttle 1 14 17 10 42
2,38% 33,33% 40,48% 23,81% 100%
LuxuriousCar 0 1 9 19 29
0,00% 3,45% 31,03% 65,52% 100%
Total 110 66 41 32 249
44,18% 26,51% 16,47% 12,85% 100%

Quadro 5: Tabela de contingncia de Opinio geral por Modelo (com % por


linha).
Fonte: elaborado pelo autor.

Vistos os exemplos o que voc pode concluir acer-


ca da satisfao dos clientes com relao aos mo-
delos? Qual modelo deveria receber ateno
prioritria?
Veja que o cruzamento de duas variveis qualitativas
B
atividade corriqueira para o administrador e cada
vez mais esse profissional precisa avaliar mais de duas
variveis, o que exige mtodos matemticos sofisti-
cados, implementados computacionalmente. Veremos
mais sobre esse tema a seguir.

Perodo 3 79
3 Caso de uma varivel quantitativa
A construo das distribuies de frequncias para variveis
UNIDADE

quantitativas semelhante ao caso das variveis qualitativas: relacio-


nar os valores da varivel com as suas ocorrncias no conjunto de
dados, mas apresenta algumas particularidades dependendo se a va-
rivel discreta ou contnua.
Se a varivel for quantitativa discreta, e puder assumir apenas
alguns valores, a abordagem ser semelhante a das variveis qualita-
tivas. A diferena reside na substituio de atributos por nmeros,
gerando uma distribuio de frequncia para dados no agru-
pados. Vamos ver um exemplo.
Exemplo 4 para a mesma situao do Exemplo 1 , imagine
que voc est interessado em descrever a varivel nmero de pessoas
usualmente transportadas no veculo, isoladamente, e representar os
dados em forma de tabela. Como ficariam os resultados? O resultado
seria semelhante ao mostrado no Quadro 6, uma apresentao tabular
(em forma de tabela) da varivel nmero de pessoas transportadas.

VALORES FREQUNCIA PERCENTUAL


1 19 7,60%
2 29 11,60%
3 43 17,20%
4 42 16,80%
5 57 22,80%
6 60 24,00%
Total 250 100%

Quadro 6: Nmero de pessoas usualmente transportadas no veculo.


Fonte: elaborado pelo autor.

Pela observao do Quadro 6 podemos concluir que os vecu-


los tm uso predominantemente familiar (vrias pessoas transpor-
tadas usualmente). Sabendo disso o administrador pode decidir por
direcionar o marketing ou mesmo a produo de modelos visando o
segmento de famlias maiores. Uma abordagem semelhante poderia
ser aplicada para as outras variveis discretas: anos de remodelao
e mesmo idade dos consumidores.

80 Curso de Graduao em Administrao, modalidade a distncia


E como representar a distribuio de frequncias

B
para variveis quantitativas discretas graficamente?
3

v
O Quadro 6 poderia ser representado atravs de um

UNIDADE
Histograma, um grfico de barras justapostas, em
que as reas das barras so proporcionais s A maioria
frequncias de cada valor. Vamos ver (Figura 21): dos progra-
mas (estats-
ticos ou no)
que constro-
em histogramas para
variveis quantitativas
discretas costuma igno-
rar isso.

Figura 21: Histograma do Nmero de pessoas transportadas por veculo.


Fonte: adaptada pelo autor de Microsoft.

Neste caso poderamos usar o grfico em setores?


A resposta no, pois formalmente o grfico em
setores deve ser usado apenas para variveis qua-
litativas. A interpretao a mesma, mas a apre-
enso da informao mais rpida. Observe que
no h problemas com a escala vertical, pois ela
B
comea em zero.

Se a varivel quantitativa for contnua o procedimento descrito


anteriormente ser invivel como instrumento de resumo do conjunto,
pois praticamente todos os valores tm frequncia baixa, o que resul-
taria em uma tabela enorme.

v
Mais informaes veja a
Se o conjunto de dados for pequeno, at 100 observaes,
seo T a fim de sa-
possvel usar ferramentas grficas como o diagrama de pontos e o ber.
ramo em folhas.

Perodo 3 81
3 Se o conjunto for grande, preciso representar os dados atra-
vs de um conjunto de faixas de valores mutuamente exclusivas (para
que cada valor pertena apenas a uma faixa), que contenha do menor
UNIDADE

ao maior valor do conjunto: registram-se ento quantos valores do


conjunto encontram-se em cada faixa. H duas maneiras de fazer isso:

z atravs da categorizao (recodificao) da varivel, por


exemplo, todos que ganham at quatro salrios mnimos
(R$ 1.680,00) pertencem classe baixa, todos que ganham
entre 4,01 e 20 salrios mnimos (at R$ 8.400,00) perten-
cem classe mdia, e acima disso, pertencem classe alta,
Categorizao pro-
cesso pelo qual se transfor-
essa abordagem largamente utilizada na mdia.
ma uma varivel quantitati-
z atravs de uma distribuio de frequncias para da-
va em qualitativa, associan-
do atributos a intervalos de dos agrupados (ou agrupada em classes), processo mais ela-
valores numricos, por borado, e mais estatstico, veremos o procedimento a seguir.
exemplo, classe A para uma
certa faixa de renda familiar.
O processo para montagem da distribuio de freqncias para
Fonte: elaborado pelo autor.
dados agrupados o seguinte:
Distribuio de
frequncias para dados
agrupados distribuio z Determinar o intervalo do conjunto (diferena entre o mai-
de frequncias na qual os
or e o menor valor do conjunto).
valores da varivel so agru-
pados em faixas de ocorrn- z Dividir o intervalo em um nmero conveniente de classes,
cia, e as frequncias conta-
onde: . Neste ponto h grande con-
das para cada faixa, para fa-
cilitar o resumo do conjun- trovrsia entre os estatsticos, e a frmula apresentada
to de dados, usualmente apenas uma das opes possveis. Admite-se que o nme-
empregado para variveis
ro mnimo de classes seja igual a 5 e o mximo 20, mas se
quantitativas contnuas.
Fonte: Barbetta, Reis e aceita uma definio arbitrria neste intervalo.
Bornia (2008).
z Estabelecer as classes com a seguinte notao:
Li limite inferior Ls limite superior;
Li |-- Ls limite inferior includo, superior excludo; e
Li |--| Ls ambos includos.
Determinar as freqncias de cada classe.
Determinar os pontos mdios de cada classe atravs da m-
dia dos dois limites (sero os representantes das classes).

B Vamos ver exemplos de ambas as abordagens.

82 Curso de Graduao em Administrao, modalidade a distncia


Exemplo 5 para a mesma situao do Exemplo 1 , imagine
que voc est interessado em descrever a varivel renda dos consumi-
dores, isoladamente, e representar os dados em forma de tabela. Como
3

UNIDADE
ficariam os resultados nos seguintes casos:

a) Se optssemos por categorizar a varivel da seguinte for-


ma: todos que ganham at quatro salrios mnimos (R$
1.680,00) pertencem classe baixa, todos que ganham en-
tre 4,01 e 20 salrios mnimos (at R$ 8.400,00) perten-

v
cem classe mdia, e acima disso pertencem classe alta?
b) Se optssemos por uma distribuio de frequncias para A resoluo passo a pas-
dados agrupados? so deste problema est
na seo Saiba mais
No caso do item a, a categorizao levar criao de uma desta Unidade, que ex-
nova varivel, agora qualitativa, permitindo uma abordagem seme- plica como realizar an-
lhante a que vimos anteriormente. No Quadro 7 e na Figura 22 esto lise exploratria de da-
os resultados: tabela de frequncias e grfico em setores. dos no Excel. Aqui apre-
sentaremos apenas os
resultados finais.
VALORES FREQUNCIA PERCENTUAL
Classe baixa (at 2 s.m.) 2 0,8%
Classe mdia (entre 2,01 e 20 s.m.) 104 41,6%
Classe alta (acima de 20 s.m.) 144 57,6%
Total 250 100%

Quadro 7: Renda categorizada em classe social.


Fonte: elaborado pelo autor.

Figura 22: Grfico em setores para a Renda categorizada em classes.


Fonte: adaptada pelo autor de Microsoft.

Perodo 3 83
3 Observe que perdemos informao sobre os dados originais de
renda ao fazer a categorizao. A interpretao relativamente sim-
ples: a maioria absoluta (mais de 50%) dos clientes da montadora
UNIDADE

pode ser considerada de classe alta (renda superior a 20 salrios m-


nimos mensais). A grande discusso que surge neste caso quem de-
fine o que classe baixa, mdia ou alta (ou A, B, C, D e E). Uma
sugesto utilizar a classificao do IBGE.
Passando para o item b, devemos seguir os passos:

v
Esses valores foram
z Intervalo = Maior Menor = 86,015 1,795 = 84,22 (a
obtidos no arquivo de maior renda de 86,015 salrios mnimos e a menor de
dados citado no incio 1,795, as classes devem englobar do menor ao maior valor).
desta Unidade
z . Por esse ex-
pediente deveramos usar 16 classes. Porm, conforme foi
dito anteriormente, o nmero de classes pode ser definido
de forma arbitrria: para simplificar nosso problema va-
mos usar cinco classes.
Amplitude das classes = 86,015/5 = 16,844 (valor exato)
A amplitude das classes pode ser ligeiramente maior do que
a obtida acima, poderamos, novamente procurando a sim-
plificao do problema, usar amplitude igual a 16,85. Se a
amplitude no for um valor exato, deve sempre ser arre-
dondado para cima, garantindo que as classes contero
do menor ao maior valor. As classes podem ento ser defi-
nidas
z Classes:
1,795|-18,645 18,645|- 35,495 35,495|- 52,345
52,345|- 69,195 69,195|- 86,045
(neste caso o ponto inicial foi o prprio menor valor do
conjunto, poderia ser outro valor conveniente abaixo do
menor valor).
z Pontos mdios de cada classe: (limite inferior + limite su-
perior)/2
(os pontos mdios calculados esto no quadro abaixo)
z Frequncias de cada classe (Quadro 8):

84 Curso de Graduao em Administrao, modalidade a distncia


CLASSES
1,795|-18,645
FREQUNCIA
98
PERCENTUAL
39,2%
PONTOS MDIOS
10,22
3

UNIDADE
18,645|- 35,495 102 40,8% 27,07
35,495|- 52,345 38 15,2% 43,92
52,345|- 69,195 9 3,6% 60,77
69,195|- 86,045 3 1,2% 77,62
Total 250 100%

Quadro 8: Renda agrupada em classes.


Fonte: elaborado pelo autor.

Observe que perdemos informao sobre o conjunto original:


sabemos que h 98 pessoas com renda entre 1,795 e 18,645 salrios
mnimos, mas no se mais quais so os seus valores exatos, ou seja,
as frequncias das classes passam a ser as frequncias dos pontos
mdios. Podemos afirmar que quase 80% dos clientes tm renda at
35,495 salrios mnimos.
O Quadro 8 tambm pode ser representado atravs de um
histograma, (Figura 23) uma vez que a varivel permanece sendo for-
malmente quantitativa. Mas o histograma para uma tabela de dados
agrupados um pouco diferente do visto anteriormente. O nmero de
barras igual ao nmero de classes. Cada barra centrada no ponto
mdio de cada classe, e o ponto inicial de cada barra o limite inferi-
or da classe, e o ponto final o limite superior.

Figura 23: Histograma para renda agrupada em classes.


Fonte: adaptada pelo autor de Microsoft.

Perodo 3 85
3 Note que a interpretao mais direta quando observamos o
grfico apresentado na Figura 23.
Mas aqui surge um fato interessante. Parece haver contradio
UNIDADE

com a interpretao do item a, pois conclumos que a maioria absolu-


ta dos clientes de classe alta. Isso ocorre devido definio arbitr-
ria das classes, e a ainda mais arbitrria definio de classes baixa,
mdia e alta. Pense em como voc resolveria essa contradio.
O agrupamento em classes apresenta algumas desvantagens,
alm da j citada perda de informao sobre o conjunto original.
Os pontos mdios nem sempre so os representantes mais fiis
das classes. Para uma grande quantidade de dados existe uma maior

vB
probabilidade de que estas estimativas correspondam exatamente aos
verdadeiros valores. Outro problema so as medidas estatsticas cal-
A tendncia atual culadas com base na distribuio de frequncias para dados agrupa-
NO CALCULAR me- dos: sero apenas estimativas dos valores reais devido perda de
didas estatsticas com informao referida acima.
base em tabelas de
dados grupados.
Agora vamos ver como analisar o relacionamento
entre duas variveis quantitativas.

Caso de duas variveis quantitativas


Muitas vezes tambm estamos interessados em avaliar o relaci-
onamento entre variveis quantitativas, sejam elas discretas ou cont-
nuas.
Basicamente, h interesse em, a partir de dados, verificar se e
como duas variveis quantitativas relacionam-se entre si em uma
populao, ou seja, avaliar se h correlao entre elas, e avaliar a
Correlao medida de fora e a direo (se elas caminham na mesma direo ou em dire-
associao entre duas vari-
es opostas) dessa correlao, caso ela exista.
veis quantitativas. Fonte:
Barbetta, Reis e Bornia Uma das variveis chamada de independente. Essa pode ser
(2008). uma varivel que o pesquisador manipulou para observar o efeito em
outra, ou alguma cuja medio possa ser feita de maneira mais fcil
ou precisa, sendo ento suposta sem erro.

v
H uma outra varivel, chamada de dependente, seus valores
Reveja as definies de so resultado da variao dos valores das variveis independentes.
variveis na Unidade
1.

86 Curso de Graduao em Administrao, modalidade a distncia


3
!
Essa denominao costuma levar a m interpretao
do significado da correlao entre variveis: se h
correlao entre variveis significa que os seus valo-

UNIDADE
res variam em uma mesma direo, ou em direes
opostas, com uma certa fora, ou seja, correlao
no significa causalidade.

Por exemplo, pode haver correlao entre o pluviosidade men-


sal (em mm) em Florianpolis e o nmero de ratos exterminados por
ms na cidade de Sidney, na Austrlia, mas seria um pouco forado
imaginar que uma coisa causou a outra. necessrio usar bom senso.
Observaes empare-
Em outro caso, ao avaliarmos o relacionamento entre renda
lhadas medidas de duas
mensal em reais e rea em m da residncia de uma famlia, espera- ou mais variveis que foram
mos um relacionamento positivo entre ambas: para maior renda (in- realizadas na mesma uni-
dade experimental/
dependente), esperamos maior rea (dependente).
amostral, no mesmo mo-
Para que seja possvel avaliar o relacionamento entre duas va- mento. Fonte: elaborado
riveis (neste caso quaisquer, no apenas quantitativas) os dados de- pelo autor.

vem provir de observaes emparelhadas e em condies seme-


lhantes. Ao avaliar a correlao existente entre a altura e o peso de
um determinado grupo de crianas, por exemplo, o peso de uma de-
terminada criana deve ser medido e registrado no mesmo instante
em que medida e registrada a sua altura. Renda e rea da residncia
da mesma famlia, no mesmo momento.
Se estivermos analisando duas variveis quantitativas, cujas
observaes constituem pares ordenados, chamando estas variveis
de X (independente) e Y (dependente), podemos plotar o conjunto de
pares ordenados (x,y) em um diagrama cartesiano, que chamado de

v
Diagrama de Disperso. Atualmente isso pode ser feito com
aplicativos computacionais, at mesmo uma planilha eletrnica como Saiba mais nos textos
o Br.Office Calc ou Microsoft Excel. Como realizar anlise
Atravs do diagrama de disperso podemos ter uma ideia ini- exploratria de dados no
cial de como as variveis esto relacionadas: a direo da correlao Br.Office Calc e Como
(isto , quando os valores de X aumentam, os valores de Y aumentam realizar anlise
exploratria de dados no
tambm ou diminuem), a fora da correlao (em que taxa os valo-
Microsoft Excel.
res de Y aumentam ou diminuem em funo de X) e a natureza da
correlao (se possvel ajustar uma reta, parbola, exponencial aos
pontos).

Para esclarecer vamos ver um exemplo.


B
Perodo 3 87
3 Neste caso, uma empresa agroindustrial processa soja para
obter leo. A direo quer estudar o relacionamento entre o valor da
soja (em dlares por tonelada) na bolsa de cereais de Chicago e a
UNIDADE

cotao da ao da empresa (em dlares) na bolsa de Nova Iorque.


Para tanto coletou um conjunto de 400 pares de observaes, e plotou
o diagrama de disperso exposto na Figura 24:
Observando o diagrama (Figura 24) possvel afirmar que o
relacionamento entre as variveis fortemente linear?

Figura 24: Diagrama de disperso de Cotao da ao por Preo da soja.


Fonte: adaptada pelo autor de Microsoft (2003).
Srie temporal conjun-
to de observaes de uma
A correlao entre as variveis claramente positiva: maiores
varivel quantitativa, orde-
nado no tempo (dirio, se- valores de preo da soja correspondem a maiores valores de cotao
manal, mensal, anual). da ao, o que parece plausvel. A correlao parece ser muito forte,
Fonte: Moore, McCabe,
pois os pontos esto muito prximos. Quanto natureza, possvel
Duckworth e Sclove
(2006). observar que seria possvel ajustar uma reta entre os pontos. Portanto,
conclumos que o relacionamento entre as variveis fortemente line-
ar. Poderamos ento obter a equao da reta, para, a partir dos valo-
res da soja, prever a cotao da empresa agroindustrial.
Se uma das variveis quantitativas for o tempo (medido em
anos, meses, semanas, dias, trimestres) teremos uma srie temporal.
Em Saiba mais vamos Voc j deve ter visto em algum lugar uma tabela ou grfico
apresentar algumas re- mostrando evoluo do PIB do Brasil ao longo dos anos, ou a evolu-
ferncias sobre o as- o da populao de um pas, ou mesmo os percentuais de inteno

v
sunto, que sero extre- de voto dos candidatos a presidente a cada pesquisa eleitoral. O obje-
mamente teis, caso
tivo da anlise de uma srie temporal identificar a existncia de
voc tenha que lidar
padres que nos auxiliem a tomar decises.
com sries temporais.

88 Curso de Graduao em Administrao, modalidade a distncia


Vamos agora ao ltimo caso desta Unidade muito
importante para o administrador, pois bastante
B 3

UNIDADE
comum ele ter que estudar o relacionamento entre
uma varivel qualitativa e outra quantitativa.

Caso de uma varivel qualitativa e uma quantitativa


Usualmente pressupe-se que analisaremos a varivel quanti-
tativa em funo dos valores da varivel qualitativa, visto que esta
ltima costuma ter menos opes o que simplificaria o processo e per-
mitiria resumir mais os dados.
Na Unidade 1 falamos sobre classificao das variveis por
nvel de manipulao, em independente e dependente. Se estivermos
estudando duas variveis, uma qualitativa e outra quantitativa, a qua-
litativa ser considerada independente (ou de agrupamento) e a quan-
titativa a dependente. Vejamos dois exemplos rpidos.
Imagine que voc est realizando uma pesquisa experimental.
H interesse em avaliar a resposta a um medicamento contra o diabe-
tes, que deveria reduzir o nvel de glicose no sangue dos indivduos
portadores da doena. Para testar a eficincia do medicamento voc
realiza um experimento, sorteando dois grupos de voluntrios, um grupo
receber o medicamento e o outro o placebo durante um perodo de
tempo. Ao final do experimento os nveis de glicose dos indivduos dos
dois grupos so medidos para avaliar se no grupo que recebeu o me-
dicamento eles sofreram reduo significativa. H duas variveis, a
independente, grupo de indivduos, com dois valores (grupo tratado e
grupo placebo), qualitativa, e a dependente, nvel de glicose no san-
gue, quantitativa. Neste caso a definio de varivel independente como
a que manipulada para causar um efeito na dependente aceitvel.
Em outra situao, em uma pesquisa de levantamento, a vari-
vel independente seria meramente uma varivel de agrupamento, para
categorizar a varivel dependente. Vamos ver um exemplo a respeito.
Para a mesma situao do Exemplo 1. Neste caso, gostaramos
de avaliar se existe algum relacionamento entre a renda do consumi-
dor e o modelo adquirido. Espera-se que exista tal relacionamento,
pois os modelos Chiconaultla e DeltaForce3 so os mais baratos, e o
sofisticado LuxuriousCar o mais caro de todos.

Perodo 3 89
3 Neste caso, podemos obter distribuies de frequncias da va-
rivel Renda para cada valor da varivel Modelo. Seria uma situao
semelhante a do item b do Exemplo 4, mas agora com cinco tabelas,
UNIDADE

uma para cada opo de Modelo.


Muito Importante! Se optarmos por agrupamento em classes,
todas as tabelas precisam ter o mesmo nmero de classes, e as mes-
mas amplitudes de classe, para que possamos comparar os grupos.
No nosso caso, vamos usar as classes obtidas no item b do Exemplo 4
para as cinco tabelas:

1,795|-18,645 18,645|-35,495 35,495|-52,345


52,345|-69,195 69,195|-86,045

Basta, ento, ordenar as rendas em funo dos modelos e con-


tar as frequncias em cada modelo, resultando os dados ilustrados no
Quadro 9:

MODELO

RENDA CHICONAUTLA DELTAFORCE3 VALENTINIANA SPACESHUTTLE LUXURIOUSCAR TOTAL

1,795|- 73 20 4 0 0 97
18,645
18,645|- 7 35 32 24 4 102
35,495
35,495|- 1 1 4 18 14 38
52,345
52,345|- 0 0 1 0 8 9
69,195
69,195|- 0 0 0 0 3 3
86,045
Total 81 56 41 42 29 249

Quadro 9: Distribuies de frequncias de Renda agrupadas em classe por


Modelo.
Fonte: elaborado pelo autor.

v
Observe a semelhana da tabela mostrada no Quadro 9 com
aquela do Quadro 8. Da mesma forma que l fizemos, possvel cal-
H 249 dados na ta- cular percentuais em relao aos totais das linhas, colunas ou total
bela porque o dado
geral.
perdido (descoberto no
Podemos perceber que o relacionamento esperado entre as va-
Quadro 5) foi removi-
riveis foi confirmado: para os modelos mais baratos a renda mais
do do conjunto.
alta est na classe de 35,495 a 52,345 salrios mnimos; j os clientes
do modelo mais caro (LuxuriousCar) esto nas classes mais altas.

90 Curso de Graduao em Administrao, modalidade a distncia


A tabela do Quadro 9 poderia ser expressa atravs de um gr-
fico, um histograma categorizado. Infelizmente tal grfico no pode
ser feito em uma planilha eletrnica (como o Br.Office Calc) sem
3

UNIDADE
considerveis manipulaes. Mas, atravs de um software estatstico,
no nosso caso o Statsoft Statistica 6.0, isso possvel (Figura 25):

Figura 25: Histograma categorizado da Renda por Modelo adquirido.


Fonte: adaptada pelo autor de Statsoft (2004).

Observe que o software dividiu a varivel renda em cinco clas-


ses tambm, mas com limites ligeiramente diferentes dos nossos. Alm
disso, optamos por apresentar os resultados em percentuais relativos
ao total dos dados (249). A interpretao semelhante da tabela.
Na prtica, o mais comum quando analisamos uma varivel
quantitativa em funo de uma qualitativa calcular medidas de sn-
tese daquela para cada grupo definido pelos valores desta. A partir
dos resultados possvel verificar se existe relacionamento entre as
variveis. Veremos na Unidade 4 as medidas de sntese.

Saiba mais...
Sobre correlao entre variveis (quantitativas): BARBETTA, Pedro A.
Estatstica Aplicada s Cincias Sociais. 7. ed. Florianpolis: Ed. da UFSC,
2007. Captulo 13.

Perodo 3 91
3 Sobre correlao entre variveis (quantitativas): MOORE, David S.;
McCABE, George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A
prtica da estatstica empresarial: como usar dados para tomar decises. Rio
UNIDADE

de Janeiro: LTC, 2006. Captulo 2.

Sobre anlise de sries temporais: LEVINE, David M.; STEPHAN, David;


KREHBIEL, Timothy C.; BERENSON, Mark L. Estatstica: Teoria e Aplica-
es Usando Microsoft Excel em Portugus. 5. ed. Rio de Janeiro: LTC,
2005. Captulo 13.

Sobre anlise de sries temporais: STEVENSON, Willian J. Estatstica


Aplicada Administrao. So Paulo: Harbra, 2001. Captulo 16.

Sobre como realizar as anlises descritas nesta Unidade e na Unidade 4


atravs do Microsoft Excel consulte Como realizar anlise exploratria de
dados no Microsoft Excel, disponvel no ambiente virtual assim como o
arquivo de dados usado nos exemplos apresentados.

Sobre como realizar as anlises descritas nesta Unidade e na Unidade 4


atravs do Br.Office Calc consulte Como realizar anlise exploratria de

r
dados com o Br.Office Calc disponvel no ambiente virtual assim como o
arquivo de dados usado nos exemplos apresentados.

Resumindo
O resumo desta Unidade est mostrado na Figura 26:

92 Curso de Graduao em Administrao, modalidade a distncia


3

UNIDADE
Figura 26: Resumo da Unidade 3.
Fonte: elaborado pelo autor.

Perodo 3 93
3 B Caro estudante,
Essa Unidade foi importantssima para voc enten-
UNIDADE

der a Anlise Exploratria de Dados. Vimos como


organizar, interpretar e resumir as informaes
coletadas, nveis de mensurao e nmero de vari-
veis. Voc aprendeu a elaborar tabelas, planilhas
e grficos de acordo com as especificidades das
informaes colhidas. Chegamos ao final da Uni-
dade e ao comeo de uma nova aprendizagem.
Esta Unidade lhe deu base para o aprendizado pro-
posto nas Unidades seguintes. Leia e releia quantas
vezes precisar os variados exemplos propostos para
cada categoria estudada. As Figuras, quadros, re-
presentaes e exemplos so grandes aliados nes-
se processo de aprendizagem.
Interaja com sua turma e responda s atividades.
A tutoria est pronta a lhe auxiliar e o professor
ansioso em reconhecer suas habilidades desenvol-
vidas a partir do conhecimento deste contedo.
Vamos em frente!!!

Atividades de aprendizagem
aprendizagem

B Chegamos ao fim da Unidade 3 da disciplina de


Estatstica Aplicada Administrao. Agora, che-
gou o momento de verificar se voc teve bom en-
tendimento. Para saber, responda s atividades pro-
postas e encaminhe-as para seu tutor atravs do
Ambiente Virtual de Ensino-Aprendizagem. As ati-
vidades devem ser feitas usando o Microsoft
Excel, atravs do arquivo AmostraToyord.xls que
est no ambiente virtual, salvo onde indicado.

94 Curso de Graduao em Administrao, modalidade a distncia


1) Construa a distribuio de frequncias para a varivel opinio sobre
o design dos veculos da Toyord. Analisando os resultados, os clien-
tes, de uma forma geral, tm boa impresso sobre o design dos ve-
3

UNIDADE
culos da TOYORD? JUSTIFIQUE.
2) A varivel anos de remodelao dos veculos (na percepo do clien-
te) est representada no histograma a seguir:

Fonte: adaptada pelo autor de Microsoft.

O departamento de marketing alega que precisa de mais oramento


para convencer os clientes que os veculos da TOYORD tm design
avanado, pois eles creem que a maioria dos clientes acha que eles
foram remodelados h vrios anos atrs. Os dados confirmam a
crena do departamento de marketing? JUSTIFIQUE!
3) Construa a distribuio de frequncias agrupada em classes para a
varivel quilometragem mdia mensal percorrida com o veculo. Voc
considera que os clientes da Toyord usam bastante o veculo ou no?
JUSTIFIQUE!
4) Construa a tabela de contingncias para modelo por opinio sobre
concessionrias (concessionria). Com base nela avalie se os clien-
tes de todos os modelos esto satisfeitos com os servios prestados.
JUSTIFIQUE a sua resposta.
5) Os executivos da Toyord creem que seus clientes mais abastados so
mais crticos, tendem a ser mais insatisfeitos com seus veculos. Para

Perodo 3 95
3 verificar se isso verdade construram a tabela a seguir. Com base
nela, a crena dos executivos verificada (calcule os percentuais
que achar necessrios)? JUSTIFIQUE!
UNIDADE

O PINIO GERAL SOBRE O VECULO

RENDA BASTANTE INSATISFEITO MUITO SATISFEITO TOTAL


SATISFEITO INSATISFEITO

1,795|- 0 16 78 4 98
18,645
18,645|- 7 47 26 22 102
35,495
35,495|- 15 4 5 14 38
52,345
52,345|- 7 0 1 1 9
69,195
69,195|- 3 0 0 0 3
86,045
Total geral 32 67 110 41 250

Fonte: adaptado pelo autor de Microsoft.

96 Curso de Graduao em Administrao, modalidade a distncia


4 3

UNIDADE
Anlise Exploratria
UNIDADE
de Dados II

D
Objetivo
Nesta Unidade voc aprender mais uma maneira
de descrever e analisar um conjunto de dados
referente a uma varivel quantitativa (discreta ou
contnua): atravs das medidas de sntese. Sero
apresentadas as medidas de posio e de disperso
que permitem sintetizar o comportamento da varivel
individualmente ou em funo dos valores de outra
varivel.

Perodo 3 97
4
UNIDADE

98 Curso de Graduao em Administrao, modalidade a distncia


Medidas de Posio ou
de Tendncia Central
4

UNIDADE
Caro estudante!
Na Unidade 3 estudamos como fazer a descrio
B
tabular e grfica das variveis, seja isoladamente
ou relacionadas a outras, e interpretar os resulta-
dos obtidos. Alm daquelas tcnicas, nos casos
em que a varivel sob anlise for quantitativa dis-
creta ou quantitativa contnua, h uma terceira
forma de descrio: as medidas de sntese, ou es-
tatsticas. A sua utilizao pode ser feita de forma
a complementar as tcnicas vistas na Unidade 3,
ou como alternativa a elas.
As medidas de sntese subdividem-se em medidas
de posio (ou de tendncia central) e medidas
de disperso. Vamos estudar as medidas de posi-
o: mdia, mediana, moda e quartis; e as medi-
das de disperso: intervalo, varincia, desvio padro
e coeficiente de variao percentual. Cada uma de-
las pode ser muito til para caracterizar um conjunto
de dados referente a uma varivel quantitativa.
Tenha sempre em mente que indispensvel que
o administrador conhea as medidas de sntese
para que possa realizar Anlise Exploratria de
Dados atravs delas. Vamos ver que so ferramen-
tas que geram resultados objetivos, o que torna
mais racional o processo de tomada de deciso.

A
s Medidas de Posio procuram caracterizar a tendncia cen-
tral do conjunto, um valor numrico que represente o con-
junto. Esse valor pode ser calculado levando em conta todos
os valores do conjunto ou apenas alguns valores ordenados. As medi-
das mais importantes so mdia, mediana, moda e quartis.

Perodo 3 99
4 Mdia ( )
UNIDADE

A Mdia aqui citada a mdia aritmtica simples, a soma


dos valores observados dividida pelo nmero desses valores. Seja um
conjunto de n valores de uma varivel quantitativa X, a mdia do
conjunto ser:

v
Onde xi um valor qualquer do conjunto, a soma dos

No Microsoft Excel e no valores do conjunto, e n o tamanho do conjunto.


Br.Office Calc a mdia Vamos ver um exemplo que ir nos acompanhar por algum tempo.
aritmtica simples O Quadro 10 se refere s notas finais de trs turmas de estudantes.
implementada atravs
da funo MDIA( ).
TURMA VALORES
A 4 5 5 6 6 7 7 8
B 1 2 4 6 6 9 10 10
C 0 6 6 7 7 7 7,5 7,5
Mdia aritmtica sim-
ples medida de posio Quadro 10: Notas finais das turmas A, B, e C.
que o resultado da divi- Fonte: elaborado pelo autor.
so da soma de todos os
elementos do conjunto di-
Como o objetivo calcular a mdia de cada turma, ao somar
vididos pela quantidade de
elementos do conjunto. os valores teremos o mesmo resultado: 48. Como cada turma tem 8
Conceitualmente, o cen- alunos, as trs turmas tero a mesma mdia: 6.
tro de massa do conjunto de

B
dados. Fonte: Barbetta
(2007).
No exemplo que acabamos de ver as trs turmas
tm a mesma mdia (6), ento se apenas essa
medida fosse utilizada para caracteriz-las poder-
amos ter a impresso de que as trs turmas tm
desempenhos idnticos. Ser? Observe atentamente
o Quadro 10.

Veja que na primeira turma temos realmente os dados distribu-


dos regularmente em torno da mdia, com a mesma variao tanto

100 Curso de Graduao em Administrao, modalidade a distncia


abaixo quanto acima. J na segunda vemos uma distoro maior,
embora, a maioria das notas seja alta algumas notas baixas puxam
a mdia para um valor menor. E no terceiro grupo h apenas uma
4

UNIDADE
nota baixa, mas seu valor tal que realmente consegue diminuir a
mdia do conjunto.
Um dos problemas da utilizao da mdia que, por levar em
conta todos os valores do conjunto, ela pode ser distorcida por valo-
res discrepantes (outliers) que nele existam. importante ento
interpretar corretamente o valor da mdia.
O valor da mdia pode ser visto como o centro de massa de
Valores discrepantes
cada conjunto de dados, ou seja, o ponto de equilbrio do conjunto: ( outliers) valores de
se os valores do conjunto fossem pesos sobre uma tbua, a mdia a uma varivel quantitativa
que se distanciam muito
posio em que um suporte equilibra essa tbua.
(para cima ou para baixo)
Vamos ver como os valores do exemplo distribuem-se em um da maioria das observa-
diagrama apropriado (Figura 27): es. Por exemplo, a renda
de Bill Gates um valor
discrepante da varivel
renda de pessoas morando
nos EUA. Fonte: adaptado
pelo autor de Bussab e
Morettin (2003).

Assimtrica uma dis-


tribuio dos valores de
uma varivel quantitativa
dita assimtrica caso a m-
dia e a mediana sejam di-
ferentes, indicando que os
valores do conjunto se es-
tendem mais, apresentam
maior variabilidade, em
uma direo do que na ou-
tra. Fonte: Barbetta (2007).

Essa era a grande crti-


ca que era feita nas d-
Figura 27: Interpretao do valor da mdia.
cadas de 60 e 70 sobre
Fonte: adaptada pelo autor de Microsoft (2003) e Statsoft (2004).
as medies de nvel de
A mdia dos trs conjuntos a mesma, mas observe as diferen- desenvolvimento. Era
comum medir o nvel de
tes disposies dos dados. O primeiro grupo apresenta os dados dis-
desenvolvimento de um
tribudos de forma simtrica em torno da mdia. No segundo grupo
pas por sua renda per
a distribuio j mais irregular, com valores mais distantes na

v
capita (PIB/nmero de
parte de baixo, e o terceiro grupo claramente assimtrica em relao
habitantes), uma m-
mdia (que foi distorcida pelo valor discrepante 0). Portanto muito
dia, que no revelava,
cuidado ao caracterizar um conjunto apenas por sua mdia. porm, a concentrao
de renda do pas, levan-
Perodo 3
do a concluses errne-
101
as sobre a qualidade de
vida em muitos pases.
4 Outro aspecto importante a ressaltar que a mdia pode ser
um valor que a varivel no pode assumir. Isso especialmente verda-
de para variveis quantitativas discretas, resultantes de contagem,
UNIDADE

como nmero de filhos, quando a mdia pode assumir um valor que-

!
brado, 4,3 filhos, por exemplo.

Rompemos com o mito de que mdia o valor mais


provvel do conjunto, erro que cometido quase que
diariamente pela mdia, em vrios pases.

extremamente comum calcular mdias de variveis quantita-


tivas a partir de distribuies de frequncias representadas em tabe-
las: simplesmente multiplica-se cada valor (ou o ponto mdio da clas-
se) pela frequncia associada, somam-se os resultados e divide-se o
somatrio pelo nmero de observaes do conjunto. Na realidade tra-
ta-se de uma mdia ponderada pelas frequncias de ocorrncia de
cada valor da varivel.

Onde k o nmero de valores da varivel discreta, ou o nme-


ro de classes da varivel agrupada, xi um valor qualquer da varivel
discreta, ou o ponto mdio de uma classe qualquer, fi a frequncia
de um valor qualquer da varivel discreta ou de uma classe qualquer,
e n o nmero total de elementos do conjunto.
Neste segundo exemplo vamos calcular a mdia do nmero de
pessoas usualmente transportadas no veculo, atravs da distribuio
de frequncias obtida no terceiro exemplo exposto na Unidade 3 (Qua-
dro 10).

102 Curso de Graduao em Administrao, modalidade a distncia


1
VALORES FREQUNCIA
19
PERCENTUAL
7,60%
4

UNIDADE
2 29 11,60%
3 43 17,20%
4 42 16,80%
5 57 22,80%
6 60 24,00%
Total 250 100%

Quadro 11: Nmero de pessoas usualmente transportadas no veculo.


Fonte: elaborado pelo autor.

Precisamos multiplicar a coluna de valores xi pela da frequncia


fi, somar os resultados, e dividi-los por 250, que o nmero de ele-
mentos do conjunto (n). Observe que a varivel discreta pode assumir
seis valores diferentes, logo k = 6. No Quadro 12 podemos observar o
resultado:

VALORES Xi FREQUNCIA fi f i H fi
1 19 19
2 29 58
3 43 129
4 42 168
5 57 285
6 60 360
Total 250 1019

Quadro 12: Nmero de pessoas usualmente transportadas no veculo.


Fonte: elaborado pelo autor.

Agora podemos calcular a mdia:

pessoas usualmente transportadas

no veculo.

Perodo 3 103
4 No Exemplo 2 o resultado da mdia um valor (4,076) que a

v
varivel nmero de pessoas usualmente transportadas no pode assu-
Veja nova- mir. Mas, se trata do centro de massa do conjunto
UNIDADE

mente a Se quisermos calcular mdia aritmtica simples a partir de uma


Figuras distribuio de frequncias para dados agrupados devemos tomar
21 da Uni- cuidado. Os pontos mdios das classes sero usados no lugar dos xi
dade 3, e da expresso da mdia vista acima. Eles podem ou no ser bons re-
observe presentantes das classes (geralmente sero melhores representantes
como o va- quanto maiores forem as frequncias das classes), pois perdemos a
lor da mdia permite informao sobre o conjunto original de dados ao agrup-lo em clas-
equilibrar os pesos, as
ses. Sendo assim, as medidas calculadas a partir de uma distribuio
frequncias, dos vrios
de frequncias para dados agrupados, no apenas a mdia aritmtica
valores da varivel.
simples, mas todas as outras, tornam-se meras estimativas dos valo-
res reais.

B Importante! No calcule nenhuma medida estats-


tica com base em uma distribuio de frequncia
para dados agrupados se voc tiver acesso aos da-
dos originais.

Alm da mdia aritmtica simples, outra medida de posio


bastante usada a mediana, que veremos a seguir.

Mediana (Md)

A mediana o ponto que divide o conjunto em duas partes


iguais: 50% dos dados tm valor menor do que a mediana e os outros
50% tm valor maior do que a mediana.
Pouco afetada por eventuais valores discrepantes existentes
no conjunto (que costumam distorcer substancialmente o valor da m-
dia).
A mediana de um conjunto de valores o valor que ocupa a
posio (n +1)/2, quando os dados esto ordenados crescente ou
decrescentemente. Se (n +1)/2 for fracionrio toma-se como media-
na a mdia dos dois valores que esto nas posies imediatamente

104 Curso de Graduao em Administrao, modalidade a distncia


abaixo e acima de (n +1)/2. Onde n o nmero de elementos do
conjunto.
Neste terceiro exemplo vamos calcular a mediana para as no-
4

UNIDADE
tas das trs turmas do Exemplo 1.

TURMA VALORES
A 4 5 5 6 6 7 7 8
B 1 2 4 6 6 9 10 10
C 0 6 6 7 7 7 7,5 7,5

Quadro 13: Notas finais das turmas A, B, e C.


Fonte: elaborado pelo autor.

Posio mediana = (n + 1)/2 = (8+1)/2 = 4, 5 significa que

v
o valor da mediana ser calculado atravs da mdia entre os valores
que estiverem na 4 e na 5 posio do conjunto. Por esse motivo os da-
dos precisam estar orde-
Turma A: Md = (6 + 6)/ 2 = 6. nados crescentemente.
Turma B: Md = (6 + 6)/ 2 = 6.
Turma C: Md = (7 + 7)/ 2 = 7.

Observe que a mediana da Turma C diferente, mais alta, re-


fletindo melhor o conjunto de dados, uma vez que h apenas uma
nota baixa. Perceba tambm que apenas os dois valores centrais fo-
ram considerados para obter a mediana, deixando o resultado imu-
ne aos valores discrepantes.
No exemplo 4, vamos Calcular a mediana para o grupo a seguir:

10 11 12 13 15 16 16 35 60.

Posio mediana = (n + 1)/2 = (9+1)/2 = 5 como o conjun-


to tem um nmero mpar de valores, o valor da mediana ser igual ao
valor que estiver na quinta posio.

Mediana = 15 Mdia = 20,89 No Microsoft Excel e


no Br.Office Calc a
Observe que neste caso, mdia e mediana so diferentes, pois
mediana imple-
a mdia foi distorcida pelos valores mais altos 35 e 60, que constitu-
mentada atravs da fun-
em uma minoria. Neste caso a medida de posio que melhor repre-

v
o MED( ), tal como
sentaria o conjunto seria a mediana. Se a mdia diferente da medi- explicado no texto
ana a distribuio da varivel quantitativa no conjunto de dados Como realizar anlise
dita assimtrica. exploratria de dados no
Microsoft Excel.

Perodo 3 105
4 Tal como a mdia, a mediana pode ser calculada a partir de
uma tabela de frequncias, com as mesmas ressalvas feitas para aquela
medida. Os programas estatsticos, e muitas planilhas eletrnicas dis-
UNIDADE

pem de funes que calculam a mediana.

Moda (Mo)

A moda o valor da varivel que ocorre com maior frequncia


no conjunto. Pode ento ser considerado o mais provvel.
a medida de posio de obteno mais simples, e tambm
pode ser usada para variveis qualitativas, pois apenas registra qual
o valor mais freqente, podendo este valor ser tanto um nmero quan-
to uma categoria de uma varivel nominal ou ordinal.
Um conjunto pode ter apenas uma Moda, vrias Modas ou ne-
nhuma Moda. Esse ltimo caso geralmente ocorre com variveis quan-
titativas contnuas.
A proposta no exemplo 5 encontrar a moda das notas das
trs turmas do Exemplo 1 (Quadro 14).

TURMA VALORES
A 4 5 5 6 6 7 7 8
B 1 2 4 6 6 9 10 10
C 0 6 6 7 7 7 7,5 7,5

Quadro 14: Notas finais das turmas A, B, e C.


Fonte: elaborado pelo autor.

A turma A tem 3 modas: os valores 5, 6 e 7 ocorrem duas vezes


cada. A turma B tem duas modas: os valores 6 e 10 ocorrem duas
vezes cada. A turma C tem uma moda apenas: o valor 7 ocorre 3
vezes.

106 Curso de Graduao em Administrao, modalidade a distncia


Quartis
4

UNIDADE
Para alguns autores os quartis no so medidas de posio,
so separatrizes. Porm, como sua forma de clculo semelhante a da
mediana, resolvemos inclu-los no tpico de Medidas de Posio. Os
quartis so medidas que dividem o conjunto em quatro partes iguais.
O primeiro quartil ou quartil inferior (Qi) o valor do con-
junto que delimita os 25% menores valores: 25% dos valores so me-
nores do que Qi e 75% so maiores do que Qi.
O segundo quartil ou quartil do meio a prpria mediana
(Md), que separa os 50% menores dos 50% maiores valores.
O terceiro quartil ou quartil superior (Qs) o valor que de-
limita os 25% maiores valores: 75% dos valores so menores do que
Qs e 25% so maiores do que Qs.
Como so medidas baseadas na ordenao dos dados neces-
srio, primeiramente, calcular as posies dos quartis.

Posio do quartil inferior = (n + 1)/4.


Posio do quartil superior = [3(n+1)]/4.

v
Onde n o nmero total de elementos do conjunto.
Aps calcular a posio, encontrar o elemento do conjunto que No Microsoft Excel e
nela est localizado. O conjunto de dados precisa estar ordenado! Se no Br.Office Calc os
o valor da posio for fracionrio deve-se fazer a mdia entre os dois quartis so imple-
valores que esto nas posies imediatamente anterior, e imediata- mentados atravs da
mente posterior posio calculada. Se os dados estiverem dispostos funo QUARTIL( ;1)
em uma distribuio de frequncias, utilizar o mesmo procedimento para quartil inferior, e
observando as frequncias associadas a cada valor (varivel discreta) QUARTIL( ;3) para
ou ponto mdio de classe. quartil superior.

No exemplo 6 iremos encontrar os quartis para a renda no con-


junto de dados apresentados no Quadro 15:

Perodo 3 107
4 V ALORES
4,695 5,750 7,575 12,960 13,805 14,000 15,820 18,275 18,985 18,985
UNIDADE

19,595 19,720 20,600 22,855 22,990 23,685 24,400 24,400 24,685 24,980
24,980 26,775 27,085 27,240 28,340 31,480 40,050 43,150 47,075

Quadro 15: Renda em salrios mnimos.


Fonte: elaborado pelo autor.

H 29 elementos no conjunto, que j esto ordenados


crescentemente. Podemos calcular as posies dos quartis.

Posio do quartil inferior = (n + 1)/4 = (29 + 1)/4 = 7,5.


Posio do quartil superior = [3(n+1)]/4 = [3 (29 + 1)]/
4 = 22,5.

Para encontrar o quartil inferior precisamos calcular a mdia


dos valores que esto na 7 e 8 posio do conjunto: no caso, 15,820
e 18,275, resultando:

Qi = (15,820 + 18,275)/2 = 17,0475.

Imagine que fosse um grande conjunto de dados, referente a


salrios de uma populao: apenas 25% dos pesquisados teriam ren-
da abaixo de 17,0475 salrios mnimos (ou R$ 6478,05 pelo salrio
mnimo de maio de 2007). Com base nisso poderamos ter uma ideia
do nvel de renda daquela populao.
Para encontrar o quartil superior precisamos calcular a mdia
dos valores que esto na 22 e 23 posio do conjunto: no caso,
15,820 e 18,275, resultando:

Qs = (26,775 + 27,085)/2 = 26,93.

Novamente, imagine que fosse um grande conjunto de dados,


referente a salrios de uma populao: apenas 25% dos pesquisados
teriam renda acima de 26,93 salrios mnimos (ou R$ 10.233,40 pelo
salrio mnimo de maio de 2007).
Com todas as medidas de posio citadas, j possvel obter
um retrato razovel do comportamento da varivel. Mas as medidas
de posio so insuficientes para caracterizar adequadamente um
conjunto de dados. preciso calcular tambm medidas de disperso.

108 Curso de Graduao em Administrao, modalidade a distncia


Medidas de disperso ou de variabilidade
4

UNIDADE
O objetivo das medidas de disperso medir quo prximos
uns dos outros esto os valores de um grupo (e algumas mensuram a
disperso dos dados em torno de uma medida de posio). Com isso
obtido um valor numrico que sintetiza a variabilidade.

Vamos estudar o intervalo, a varincia, o desvio


padro e o coeficiente de variao percentual. B
Intervalo

O intervalo a medida mais simples de disperso. Consiste em


identificar os valores extremos do conjunto (mnimo e mximo), po-
dendo ser expresso:

z pela diferena entre o valor mximo e o mnimo; e


Medidas de disperso
z pela simples identificao dos valores. medidas numricas que vi-
sam avaliar a variabilidade
do conjunto de dados, sin-
O intervalo muito til para nos dar uma ideia da variabilida- tetizando-a em um nme-
de geral do conjunto de dados. Algum que calculasse o intervalo da ro. Fonte: elaborado pelo
autor.
varivel renda mensal familiar no Brasil provavelmente ficaria abis-
mado pela gigantesca diferena entre o valor mais baixo e o mais alto.
Se essa mesma pessoa fizesse o mesmo clculo na Noruega a diferen-
a no seria to grande.
No exemplo 7 vamos obter o Intervalo para os conjuntos de
notas das duas turmas apresentadas no Quadro 16:

TURMA VALORES
A 4 5 5 6 6 7 7 8
B 4 4 4,2 4,3 4,5 5 5 8

Quadro 16: Notas das turmas A e B.


Fonte: elaborado pelo autor.

Perodo 3 109
4 O intervalo ser o mesmo para ambas as turmas: [4,8] ou 4.
Observe que no Exemplo 7 as duas turmas apresentam o mes-
mo intervalo (4). Mas observando os dados percebemos facilmente
UNIDADE

que a disperso dos dados tem comportamento diferente nas duas


turmas, e essa principal desvantagem do uso do intervalo como
medida de disperso.
Se colocarmos os dados do Exemplo 7 em um diagrama apro-
priado (Figura 28):

Figura 28: Desvantagem do uso do intervalo como medida de disperso.


Fonte: adaptada pelo autor de Statsoft e Microsoft.

v
Observamos claramente que os dados da turma A apresentam
No Microsoft Excel e uma disperso bem mais uniforme do que os da turma B, embora am-
no Br.Office Calc po- bos os conjuntos tenham o mesmo intervalo. O intervalo no permite ter
demos obter o Interva- ideia de como os dados esto distribudos entre os extremos (no per-
lo atravs das funes mite identificar que o valor 8 na turma B um valor discrepante).
MXIMO ( ) e MNI- Torna-se necessrio obter outras medidas de disperso, capa-
MO ( ) . zes de levar em conta a variabilidade entre os extremos do conjunto, o
que nos leva a estudar varincia e desvio padro.

Varincia (s2)

A varincia uma das medidas de disperso mais importan-


tes. a mdia aritmtica dos quadrados dos desvios de cada valor em
relao mdia: proporciona uma mensurao da disperso dos da-
dos em torno da mdia.

110 Curso de Graduao em Administrao, modalidade a distncia


v 4
Onde xi um valor qualquer do conjunto, a mdia do con-
junto e n o nmero de elementos do conjunto. Se os dados referem-
se a uma POPULAO usa-se n no denominador da expresso. A razo des-

UNIDADE
B
sa distino
ser expli-
cada mais
Voc sabe por que preciso elevar os desvios ao
adiante na
quadrado para avaliar a disperso? No podemos
Unidade 7.
apenas somar os desvios dos valores em relao
Po d e m o s
mdia do conjunto? Deixamos como exerccio para
adiantar que
voc os clculos dos desvios (diferena entre cada a utilizao de n 1
valor e a mdia) para as notas das trs turmas des- no denominador indis-
critas no quadro 10, do Exemplo 1. Aps calcular pensvel para que a
os desvios, some-os e veja os resultados. Lembre-se varincia da varivel na
de que a mdia o centro de massa do conjunto. amostra possa ser um
bom estimador da
varincia da varivel na
A unidade da varincia o quadrado da unidade dos dados e, populao.
portanto, o quadrado da unidade da mdia, causando dificuldades
para avaliar a disperso: se por exemplo temos a varivel peso com
mdia de 75 kg em um conjunto e ao calcular a varincia obtemos 12
kg a avaliao da disperso torna-se difcil. No obstante, a varincia
e a mdia so as medidas geralmente usadas para caracterizar as dis-

v
tribuies probabilsticas (que sero vistas adiante, na Unidade 6).
O que podemos afirmar, porm, que quanto maior a varincia, No Microsoft Excel e
mais dispersos os dados esto em torno da mdia (maior a disperso no Br.Office Calc a
do conjunto). varincia populacional

B
obtida atravs da funo
VARP( ), e a varincia
Para fins de Anlise Exploratria de Dados, carac- amostral atravs da fun-
terizar a disperso atravs da varincia no mui- o VAR( ).
to adequado. Costumamos usar a raiz quadrada
positiva da varincia, o desvio padro. Vamos ver
mais sobre isso? Continuemos, ento, a estudar!

Desvio Padro (s)

a raiz quadrada positiva da varincia, apresentando a mes-


ma unidade dos dados e da mdia, permitindo avaliar melhor a dis-
perso.

Perodo 3 111
4 .
UNIDADE

As mesmas observaes sobre populao e amostra feitas para


a varincia so vlidas para o desvio padro. prtica comum ao
resumir atravs de vrias medidas de sntese um conjunto de dados
referente a uma varivel quantitativa, apresentar apenas a mdia e o
desvio padro desse conjunto, para que seja possvel ter uma ideia do
valor tpico e da distribuio dos dados em torno dele.

B Deixamos como exerccio para voc elevar os des-


vios obtidos com os dados das turmas, expressos
no Quadro 10, Exemplo 1, ao quadrado, som-los
e dividi-los por 7 (suponha que se trata de uma
amostra). Assim, voc obter os desvios padres
das notas das turmas.

O desvio padro pode assumir valores menores do que a m-


dia, da mesma ordem de grandeza da mdia, ou at mesmo maiores
do que a mdia. Obviamente se todos os valores forem iguais, no
haver variabilidade e o desvio padro ser igual a zero.
A frmula acima costuma levar a considerveis erros de
arredondamento, basicamente porque exige o clculo prvio da m-
dia. Se o valor desta for uma dzima um arredondamento ter que ser
feito, causando um pequeno erro, e esse erro ser propagado pelas
vrias operaes de subtrao (de cada valor em relao mdia) e
potenciao (elevao ao quadrado da diferena entre cada valor e a
mdia). Assim a frmula modificada para reduzir o erro de
arredondamento apenas ao resultado final:

Primeiramente cada valor (x i) do conjunto elevado ao qua-

drado e somam-se todos os resultados obtendo . Somam-se tam-

112 Curso de Graduao em Administrao, modalidade a distncia


4
v
bm todos os valores do conjunto para obter , somatrio este que
ser elevado ao quadrado. Os somatrios e o valor de n (nmero de desta for-

UNIDADE
elementos no conjunto) so substitudos na frmula para obter os re- ma que os
sultados. programas
Tal como no caso da mdia pode haver interesse em calcular o computa-
desvio padro de variveis quantitativas a partir de distribuies de cionais cal-
frequncias representadas em tabelas. Tal como no caso da mdia os culam o des-
valores da varivel (ou os pontos mdios das classes), e os quadrados vio padro.
desses valores, sero multiplicados por suas respectivas frequncias:

v
Onde xi o valor da varivel ou ponto mdio da classe, fi a
frequncia associada, k o nmero de valores da varivel discreta No Microsoft Excel e
(ou o nmero de classes da varivel agrupada), e n o nmero de no Br.Office Calc po-
elementos do conjunto. demos obter o desvio
Veremos neste oitavo exemplo como calcular o desvio padro padro populacional
da renda para os dados do Exemplo 6. atravs da funo
DESVPADP( ) e amostral
atravs da funo
V ALORES DESVPAD( ).
4,695 5,750 7,575 12,960 13,805 14,000 15,820 18,275 18,985 18,985
19,595 19,720 20,600 22,855 22,990 23,685 24,400 24,400 24,685 24,980
24,980 26,775 27,085 27,240 28,340 31,480 40,050 43,150 47,075

Quadro 17: Renda em salrios mnimos.


Fonte: elaborado pelo autor.

H 29 elementos no conjunto, n = 29.

Somando os valores vamos obter:

Elevando cada valor ao quadrado e somando-os vamos obter:

Agora basta substituir os somatrios na expresso e calcular o


desvio padro, supondo que se trata de uma amostra:

Perodo 3 113
4
UNIDADE

s 9,83 salrios mnimos.


Se calcularmos a mdia, obteremos 22,584 salrios mnimos.
Observe que o desvio padro menor do que a mdia, no chega
metade. Com base nisso poderamos avaliar a variabilidade do conjunto.
Quanto menor o desvio padro, mais os dados esto concen-
trados em torno da mdia. Pensando nisso, algum teve a ideia de
criar uma medida de disperso que relacionasse mdia e desvio pa-
dro, o coeficiente de variao percentual, que veremos a seguir.

C
Coefi
oefi cien
c ien te de va ria o
Coeficiente de Variao Percentual (c.v.%)
percentual resultado da
diviso do desvio padro O coeficiente de variao percentual uma medida de disper-
pela mdia do conjunto,
so relativa, pois permite comparar a disperso de diferentes distri-
multiplicado por 100, per-
mite avaliar o quanto o des- buies (com diferentes mdias e desvios padres).
vio padro representa da
mdia. Fonte: Barbetta,
Reis e Bornia (2008);
Anderson, Sweeney e Onde s o desvio padro da varivel no conjunto de dados, e
Williams (2007).
a mdia da varivel no mesmo conjunto.
Quanto menor o coeficiente de variao percentual, mais os
dados esto concentrados em torno da mdia, pois o desvio padro
pequeno em relao mdia.
Neste exemplo, vamos calcular o coeficiente de variao
percentual para as notas das turmas do Exemplo 1, e indicar qual das
trs apresenta as notas mais homogneas.

TURMA VALORES
A 4 5 5 6 6 7 7 8
B 1 2 4 6 6 9 10 10
C 0 6 6 7 7 7 7,5 7,5

Quadro 18: Notas finais das turmas A, B, e C.


Fonte: elaborado pelo autor.

114 Curso de Graduao em Administrao, modalidade a distncia


Para a turma A: = 6 s = 1,31 c.v.% = (1,31/6) x 100 = 21,82%.
Para a turma B: = 6 s = 3,51 c.v.% = (3,51/6) x 100 = 58,42%.
4

UNIDADE
Para a turma C: = 6 s = 2,49 c.v.% = (2,49/6) x 100 = 41,55%.

A turma mais homognea a A, pois apresenta o menor coe-


ficiente de variao das trs. Isso era esperado, uma vez que as notas
da turma A esto distribudas mais regularmente do que as das outras.
No caso apresentado anteriormente a comparao ficou ainda
mais simples, pois as mdias dos grupos eram iguais, bastaria avaliar
apenas os desvios padres dos grupos, mas para comparar a disper-
so de distribuies com mdias diferentes imprescindvel a utiliza-
o do coeficiente de variao percentual.

Voc deve se perguntar, mas porque to impor-

B
tante calcular a mdia e o desvio padro dos valo-
res de uma varivel registrados em um conjunto de
dados? Argumentam que talvez a mediana seja uma
melhor medida de posio, e que os quartis permi-
tem ter uma boa ideia da disperso. Contudo h
um teorema que permite, a partir da mdia e do
desvio padro, obter estimativas dos extremos do
conjunto, especialmente quando se trata de uma

v
amostra: o teorema de Chebyshev, tambm cha-
mado de Desigualdade de Chebyshev. h um pequeno texto
sobre o Teorema de
Chebyshev no ambien-
te virtual.

Clculo de medidas de sntese de uma varivel em


funo dos valores de outra

Na Unidade 3, estudamos como analisar em con-

Naquela ocasio mostramos como os dados da va- B


junto uma varivel quantitativa e outra qualitativa.

rivel quantitativa poderiam ser avaliados em fun-


o dos valores da varivel qualitativa, uma vez
que esta costuma ter menos opes, possibilitan-
do resumir mais o conjunto.

Perodo 3 115
4
B Recomendamos que voc olhe novamente o oitavo
exemplo da Unidade 3 ver que construmos dis-
tribuies de frequncias agrupadas em classes,
UNIDADE

para a varivel renda (quantitativa), em funo dos


valores da varivel modelo (qualitativa). Podera-
mos fazer o mesmo com as medidas de sntese!
Vamos ver o exemplo a seguir.

Para a mesma situao dos Exemplos 1 e 7 da Unidade 3.


Gostaramos de avaliar, neste exemplo, se existe algum relacionamen-
to entre a renda do consumidor e o modelo adquirido. Esperamos que
exista tal relacionamento, pois os modelos Chiconaultla e DeltaForce3
so os mais baratos, e o sofisticado LuxuriousCar o mais caro de todos.

Atravs do Microsoft Excel e do Br.Office Calc, podemos


calcular vrias medidas de sntese da varivel renda, em funo dos
modelos de veculos. O Excel permite obter as seguintes medidas em
funo dos valores de outra varivel: mdia, desvio padro (amostral
e populacional), varincia (amostral e populacional), mnimo e mxi-
mo (infelizmente no permite clculo de mediana ou quartis). O Calc
permite obter as mesmas medidas, mas para cada uma delas neces-
srio acionar o assistente de dados, enquanto no Excel possvel
agrup-las em uma nica tabela. Ao realizar este procedimento, usan-
do os dados do arquivo AmostraToyord.xls vamos obter (Quadro 19):

MODELO MEDIDA VALOR


Chiconaultla Frequncia 81
Mnimo 1,795
Mximo 40,160
Mdia 12,704
Desvio padro (amostral) 6,038
DeltaForce3 Frequncia 56
Mnimo 10,820
Mximo 48,220
Mdia 22,063
Desvio padro (amostral) 6,956

Quadro 19: Medidas de sntese de Renda por Modelo.


Fonte: elaborado pelo autor.

116 Curso de Graduao em Administrao, modalidade a distncia


MODELO
LuxuriousCar
MEDIDA
Frequncia
VALOR
29
4

UNIDADE
Mnimo 29,800
Mximo 86,015
Mdia 50,932
Desvio padro (amostral) 14,922
SpaceShuttle Frequncia 42
Mnimo 18,865
Mximo 47,300
Mdia 33,050
Desvio padro (amostral) 7,620
Valentiniana Frequncia 41
Mnimo 13,055
Mximo 65,390
Mdia 27,353
Desvio padro (amostral) 8,383
Frequncia Total 249
Mnimo Total 1,795
Mximo Total 86,015
Mdia Total 25,105
Desvio padro (amostral) Total 14,505

Quadro 19: Medidas de sntese de Renda por Modelo.


Fonte: elaborado pelo autor.

Se analisarmos as medidas de renda para os cinco modelos


vamos identificar alguns aspectos interessantes:

z os mnimos de Chiconaultla e DeltaForce3 so efetivamen-


te menores do que os dos outros modelos (o mnimo de
Chiconaultla o menor do conjunto todo);
z o mnimo de LuxuriousCar o maior de todos, e seu mxi-
mo tambm (sendo o valor mximo do conjunto todo);
z quanto s mdias podemos observar um comportamento
na seguinte ordem crescente: Chiconaultla, DeltaForce3,
Valentiniana, SpaceShuttle e LuxuriousCar; e
z a mdia de renda dos clientes do LuxuriousCar quase
quatro vezes maior do que as dos compradores do
Chiconaultla.

Perodo 3 117
4 Portanto, o relacionamento entre renda e modelo parece real-
mente existir.
Agora devemos avaliar a disperso da renda em funo dos
UNIDADE

modelos. Como as mdias so diferentes recomendvel calcular os


coeficientes de variao percentual, mostrados no Quadro 20.

MODELO MEDIDA VALOR


Chiconaultla Coeficiente de Variao Percentual 47,526%
DeltaForce3 Coeficiente de Variao Percentual 31,528%
LuxuriousCar Coeficiente de Variao Percentual 29,298%
SpaceShuttle Coeficiente de Variao Percentual 23,054%
Valentiniana Coeficiente de Variao Percentual 30,646%
Coeficiente de Variao Percentual Total 57,777%

Quadro 20: Coeficientes de Variao Percentual de Renda por Modelo.


Fonte: elaborado pelo autor.

Aparentemente, a relao existente entre renda mdia e os


modelos no se reproduz completamente no que tange disperso.
Embora o Chiconaultla (modelo mais barato e cujos compradores tem
a mdia mais baixa de renda) tenha o maior coeficiente de variao
percentual (47,526%), o modelo mais sofisticado, LuxuriousCar, cujos
compradores tm a mdia mais alta, no apresenta o menor coefici-
ente de variao percentual. O modelo cujos compradores possuem a
renda mais concentrada em torno da mdia o SpaceShuttle, cujo
coeficiente de variao percentual vale 23,054%. Podemos concluir
que, embora o Chiconaultla seja um modelo mais simples, teorica-
mente visando um pblico de menor renda, ele tambm adquirido
por compradores mais abastados. J o SpaceShuttle tem comprado-
res de nvel mais elevado (segunda maior mdia de renda), com pou-
ca variao entre eles.
Utilizando um software estatstico podemos calcular outras
medidas alm das mostradas nos Quadros anteriores. No nosso caso,
usando o Statsoft Statistica 6.0, podemos obter:

118 Curso de Graduao em Administrao, modalidade a distncia


MODELO FREQ. S
MEDIDAS
MIN. MAX. QI MD QS
4

UNIDADE
Deltaforce3 22,064 56 6,956 10,82 48,22 16,575 21,378 26,392
SpaceShuttle 33,05 42 7,62 18,865 47,3 26,62 33,85 39,65
Valentiniana 27,353 41 8,383 13,055 65,39 23,685 25,715 30,13
Chiconaultla 12,705 81 6,038 1,795 40,16 8,88 12,245 15,4
LuxuriousCar 50,932 29 14,922 29,800 86,015 41,89 47,525 58,92
Total 25,105 249 14,505 1,795 86,015 14,095 23,545 32,17

Quadro 21: Medidas de sntese de Renda por Modelo.


Fonte: adaptado pelo autor de Statsoft.

Observe que as medianas, quartis inferiores e superiores com-


portam-se de forma semelhante s mdias. A propsito, mdias e me-
dianas so prximas, o que indicaria simetria das distribuies das
rendas para todos os modelos.

Saiba mais...
Sobre medidas de sntese, assimetria, diagramas em caixa e outros aspectos,
procure em: BARBETTA, Pedro A. Estatstica Aplicada s Cincias Sociais.
7. ed. Florianpolis: Ed. da UFSC, 2007, Captulo 7.

Sobre outros tipos de mdias (harmnica, geomtrica), SPIEGEL, Murray R.


Estatstica. 3. ed. So Paulo: Makron Books, 1993, Captulo 3.

Sobre outros aspectos de Anlise Exploratria de Dados com medidas de


sntese, teorema de Chebyshev e assimetria, ANDERSON, David R.;
SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatstica Aplicada Adminis-
trao e Economia. 2. ed. So Paulo: Thomson Learning, 2007, Captulo 3.

Sobre Anlise Exploratria de Dados utilizando o Excel, LEVINE, David M.;


STEPHAN, David; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatsti-
ca: Teoria e Aplicaes - Usando Microsoft Excel em Portugus. 5. ed. Rio de
Janeiro: LTC, 2005.

Para saber como realizar as anlises descritas nesta Unidade e na Unidade 4


atravs do Microsoft Excel consulte Como realizar anlise exploratria de
dados no Microsoft Excel, disponvel no Ambiente Virtual de Ensino-Aprendi-
zagem , assim como o arquivo de dados usado nos exemplos apresentados.

Sobre como realizar as anlises descritas nesta Unidade e na Unidade 4


atravs do Br.Office Calc consulte Como realizar anlise exploratria de
dados com o Br.Office Calc, disponvel no Ambiente Virtual assim como o
arquivo de dados usado nos exemplos apresentados.

Perodo 3 119
4 Resumindo
r
UNIDADE

O resumo desta Unidade est demonstrado na Figura 29:

Figura 29: Resumo da Unidade 4.


Fonte: elaborado pelo autor.

120 Curso de Graduao em Administrao, modalidade a distncia


Com este tpico finalizamos Anlise Exploratria
de Dados. extremamente importante que voc
faa todos os exerccios, entre em contato com a B 4

UNIDADE
tutoria para tirar dvidas, pois no h outra forma
de aprender a no ser praticando. Na Unidade 5,
veremos os conceitos de Probabilidade, que so
indispensveis para compreender o processo de
inferncia (generalizao) estatstica. Vamos em
frente e timos estudos!!!

Atividades de aprendizagem
aprendizagem
As atividades devem ser feitas usando o Microsoft Excel ou o
Br.Office Calc, atravs do arquivo AmostraToyord.xls que est no
Ambiente Virtual de Ensino-Aprendizagem.

1) A varivel anos de remodelao dos veculos (na percepo do clien-


te) est representada na distribuio de freqncias expressa no qua-
dro a seguir:

ANOS DE REMODELAO FREQUNCIAS


0 2
1 57
2 123
3 59
4 9
Total 250

Fonte: elaborado pelo autor.

a) Calcule a mdia, mediana, moda e quartis da varivel anos


de remodelao.
b) A direo da Toyord acredita que se uma parcela conside-
rvel dos clientes perceber que seus modelos so
atualizados (foram remodelados h no mximo 2 anos) o

Perodo 3 121
4 design e o marketing dos veculos esto coerentes. Com
base nos resultados da letra a, os dados mostram isso? Jus-
tifique.
UNIDADE

c) Calcule o intervalo, desvio padro e coeficiente de varia-


o percentual da varivel anos de remodelao.
d) Com base nos resultados dos itens a e c, voc considera
que os dados esto fortemente concentrados em torno da
mdia? Justifique.
2) Na questo 5 das atividades de aprendizagem da Unidade 3 foi dito:
os executivos da Toyord creem que seus clientes mais abastados so
mais crticos, tendem a ser mais insatisfeitos com seus veculos.
Naquela questo foi construda uma distribuio de frequncias con-
junta, relacionando a renda agrupada em classes com a opinio ge-
ral dos clientes sobre seus veculos, para verificar se os executivos
estavam certos. Agora, analise a renda dos clientes (varivel quanti-
tativa) em funo da opinio geral dos clientes (atravs do Microsoft
Excel ou do Br.Office Calc), calculando medidas de sntese de
renda em funo das opinies.
a) Com base nos resultados os executivos esto certos? Justi-
fique.
b) Compare com as concluses que voc obteve na questo 9
da Unidade 3.

122 Curso de Graduao em Administrao, modalidade a distncia


5 4

UNIDADE
Conceitos bsicos
UNIDADE
da Probabilidade

D
Objetivo
Nesta Unidade voc compreender os conceitos de
Probabilidade e a importncia do uso do raciocnio
probabilstico para auxiliar o administrador na tomada
de decises em ambiente de incerteza.

Perodo 3 123
5
UNIDADE

124 Curso de Graduao em Administrao, modalidade a distncia


Probabilidade: conceitos gerais 5

UNIDADE
Caro estudante,

B
Nesta Unidade vamos estudar os conceitos bsi-
cos de Probabilidade, tais como Experimento Alea-
trio, Espao Amostral e Eventos, Axiomas e Pro-
priedades, Probabilidade Condicional e Indepen-
dncia Estatstica. Nos EUA h uma anedota que
diz: as nicas coisas que so certas so a morte e
os impostos. Em outras palavras, estamos imersos
na incerteza, e os administradores diariamente pre-
cisam tomar decises, muitas delas, extremamen-
te srias, em um cenrio de grande incerteza:
z lanamos ou no um novo modelo de autom-
vel?
z convertemos nossos fornos de leo combustvel
para gs natural?
z qual ser a reao do nosso pblico s mudan-
as na grade de programao?
Por que h incerteza? Porque a variabilidade ine-
rente natureza impede a compreenso completa
dos fenmenos naturais e humanos. Mas, os seres
humanos precisam tomar decises, assim neces-
srio levar a incerteza em conta no processo: al-
guns apelam para a sabedoria popular, outros para
o mstico. Os administradores precisam tomar de-
cises de forma objetiva, e surge ento a Probabili-
dade como uma das abordagens de tratamento da
incerteza.
A utilizao de mtodos probabilsticos proporcio-
na um grande auxlio na tomada de decises, pois
permite avaliar riscos, e otimizar recursos (sempre
escassos) para as situaes mais provveis. Voc
est convidado a conhecer mais sobre esse tema
nesta Unidade.

Perodo 3 125
5 N
as Unidades 3 e 4 foi utilizado um raciocnio predominante-
mente indutivo. Os dados foram coletados, e atravs da sua
organizao em distribuies de frequncias e medidas de sn-
UNIDADE

tese foi possvel caracterizar a variabilidade do fenmeno observado,


e elaborar hipteses ou conjecturas a respeito.
Suponha que estamos estudando o percentual de meninos e
meninas nascidos em um estado brasileiro. Consultando dados do
IBGE, provenientes de censos e levantamentos anteriores (portanto
distribuies de frequncias da varivel qualitativa sexo dos recm-
nascidos) h interesse em prever qual ser o percentual de nascimen-
tos no ano de 2009: em suma ser usado um raciocnio dedutivo, a
Variabilidade diferen- partir de algumas suposies sobre o problema (a definio dos resul-
as encontradas por suces-
sivas medies realizadas
tados possveis, os percentuais registrados em anos anteriores) tenta-
em pessoas, animais ou se obter novos valores.
objetos, em tempos ou si-
Se o percentual de meninos no passado foi de 49% a pergunta
tuaes diferentes. Fonte:
Montgomery (2004). : qual ser o percentual de meninos nascidos no ano de 2009?
P r o b a b i l i d a d e descri-
possvel que seja um valor prximo de 49%, talvez um pouco acima
o quantitativa da certeza ou um pouco abaixo, mas no h como responder com certeza abso-
de ocorrncia de um even- luta, pela simples razo que o fenmeno ainda no ocorreu, e que sua
to, geralmente representada
por um nmero real entre 0
natureza aleatria, ou seja, possvel identificar quais sero os resul-
e 1 (0% e 100%). Fonte: tados possveis (menino ou menina), e h uma certa regularidade nos
elaborado pelo autor. percentuais de nascimentos (verificados anteriormente), mas no pos-
Modelo Probabilstico svel responder qual ser o resultado exato antes do fenmeno ocorrer.
modelo matemtico para
descrever a certeza de ocor-
A regularidade citada (que foi observada para um grande n-
rncia de eventos, onde so mero de nascimentos) permite que seja calculado o grau de certeza,
definidos os eventos poss- ou confiabilidade, da previso feita, que recebe o nome de Probabi-
veis e uma regra de ocor-
rncia para calcular quo
lidade. Haver uma grande probabilidade de que realmente o
provvel cada evento ou percentual de meninos nascidos em 2009 seja de 49%, mas nada im-
conjunto de eventos. Fon- pede que um valor diferente venha a ocorrer.
te: Barbetta (2007).
Sem saber montamos um Modelo Probabilstico para o proble-
ma em questo:

z foram definidos todos os resultados possveis para o fen-


meno (experimento); e
z definiu-se uma regra que permite dizer quo provvel ser
cada resultado ou grupo de resultados.

O Modelo Probabilstico permite expressar o grau de incertezas


atravs de probabilidades.

126 Curso de Graduao em Administrao, modalidade a distncia


A regra citada foi definida a partir de observaes anteriores
do fenmeno, mas tambm poderia ser formulada com base em consi-
deraes tericas. Por exemplo, se h interesse em estudar as propor-
5

UNIDADE
es de ocorrncias das faces de um dado, e se este dado no viciado
espera-se que cada face ocorra em 1/6 do total de lanamentos: se o

v
dado for lanado um grande nmero de vezes isso provavelmente ocor-
rer, mas um resultado diferente poderia ser obtido sem significar que o Para cons-
dado est viciado, principalmente se forem feitos poucos lanamentos. truir ou utili-
Neste ponto, impor tante ressaltar que os modelos zar modelos
probabilsticos no tm razo de ser para fenmenos (experimentos) probabilsticos neces-
no aleatrios (determinsticos): aqueles em que usando teorias e srio que haja um gran-
de nmero de realiza-
frmulas apropriadas pode-se prever exatamente qual ser o seu re-
es do fenmeno (ex-
sultado antes do fenmeno ocorrer, por exemplo, o lanamento de uma
perimento) para que
pedra de 5 kg de uma altura de 10 metros, havendo interesse em
uma regularidade possa
cronometrar o tempo para que ela atinja o cho. Conhecendo o peso
ser verificada: a Lei
da pedra, a altura do lanamento, a acelerao da gravidade e as leis dos Grandes Nmeros.
da fsica, perfeitamente possvel calcular o tempo de queda, no h No incio do Sculo XX o
necessidade sequer de realizar o experimento. estatstico ingls Karl

B
Pearson lanou uma
moeda no viciada
Para prosseguirmos precisamos de algumas defini- 24.000 vezes (!) para
es importantes para estudar os modelos verificar a validade des-
probabilsticos. Precisamos definir exatamente as sa lei: obteve 12.012
condies em que devemos usar modelos caras, praticamente o
probabilsticos, e isso exige saber o que experi- valor esperado (12.000,
mento aleatrio, espao amostral e eventos. Va- 50%).
mos ver?

Definies Prvias

Experimento Aleatrio

Experimento Aleatrio um processo de obteno de um


resultado ou medida que apresenta as seguintes caractersticas:

z no podemos afirmar, antes de realizar o experimento, qual


ser o resultado de uma realizao, mas possvel deter-
minar o conjunto de resultados possveis.

Perodo 3 127
5 z quando realizado um grande nmero de vezes (replicado)
apresentar uma regularidade que permitir construir um
modelo probabilstico para analisar o experimento.
UNIDADE

So experimentos aleatrios:

a) O lanamento de um dado e a observao da face voltada


para cima; no sabemos exatamente qual face vai ocorrer,
apenas que ser uma das seis, e que se o dado for no
viciado e o lanamento imparcial, todas as faces tm a
mesma chance de ocorrer.
b) A observao dos dimetros, em mm, de eixos produzidos
em uma metalrgica; sabemos que as medidas devem es-
tar prximas de um valor nominal, mas no sabemos exa-
tamente qual o dimetro de cada eixo antes de efetuar as
mensuraes.
c) O nmero de mensagens que so transmitidas corretamen-
te por dia em uma rede de computadores; sabemos que o
mnimo possvel zero, mas no sabemos nem sequer o
nmero mximo de mensagens que sero transmitidas.

Todo experimento aleatrio ter alguns resultados possveis, que


constituiro o Espao Amostral.

Espao Amostral (S ou )

Espao Amostral o conjunto de todos os resultados poss-


veis de um experimento aleatrio. Para cada experimento aleatrio
haver um espao amostral nico associado a ele. Neste primeiro
exemplo veremos alguns experimentos aleatrios com os respectivos
espaos amostrais:

a) Lanamento de um dado e observao da face voltada para


cima: = {1, 2, 3, 4, 5, 6}.
b) Retirada de uma carta de um baralho comum (52 cartas) e
Note que no h um observao do naipe: = {copas, espadas, ouros, paus}.

v
limite superior conhe-
c) O nmero de mensagens que so transmitidas corretamente
cido, mas somente
por dia em uma rede de computadores: = {0, 1, 2, 3, ...}.
possvel a ocorrncia de
valores inteiros.

128 Curso de Graduao em Administrao, modalidade a distncia


d) A observao do dimetro, em mm, de um eixo produzido
5
v
em uma metalrgica: = {D, tal que D > 0}.
e) As vendas mensais, em unidades, de determinado modelo

UNIDADE
No h um
de veculo: = {0, 1, ...} limite supe-
rior e, teori-
O espao amostral pode ser: camente,
pode haver
z finito, formado por um nmero limitado de resultados pos- uma infinida-
sveis, como nos casos a e b; de de valores.

z infinito numervel, formado por um nmero infinito de


resultados, mas que podem ser listados, como nos casos c
ou e; ou
z infinito, formado por intervalos de nmeros reais, como
no caso d.

Um espao amostral dito discreto quando ele for finito ou


infinito enumervel; dito contnuo quando for infinito, formado por
intervalos de nmeros reais.
A construo do modelo probabilstico depender do tipo de
espao amostral como ser visto mais adiante.

Eventos

Eventos so quaisquer subconjuntos do espao amostral. Um


evento pode conter um ou mais resultados, se pelo menos um dos re-
sultados ocorrer o evento acontece! Geralmente h interesse em cal-

v
cular a probabilidade de que um determinado evento venha a ocorrer,
e esse evento pode ser definido de forma verbal, precisando ser tradu- Embora nem todos os
zido para as definies da Teoria de Conjuntos, que veremos a seguir. autores concordem com
Seja o Experimento Aleatrio lanamento de um dado no vi- essa abordagem, ela au-
ciado e observao da face voltada para cima: o seu espao amostral xilia bastante na com-
ser = {1, 2, 3, 4, 5, 6}. preenso dos conceitos.

Definindo trs eventos:

E1 = {2, 4, 6};
E2 = {3, 4, 5, 6}; e
E3 = {1, 3}.

Perodo 3 129
5 sero apresentadas as definies de Evento Unio, Evento
Interseco, Eventos Mutuamente Exclusivos e Evento Com-
plementar.
UNIDADE

Evento Unio de E1 com E2 (E1 E2): evento que ocorre se E 1


ou E 2 ou ambos ocorrem.

Figura 30: Evento Unio.


Fonte: elaborada pelo autor.

E1 E2 = {2, 3, 4, 5, 6}.

Composto por todos os resultados que pertencem a um ou ao


outro, ou a ambos.
Evento Interseco de E1 com E2 (E1 E 2): evento que ocor-
re se E1 E E2 ocorrem simultaneamente.

Figura 31: Evento interseco.


Fonte: elaborada pelo autor.

130 Curso de Graduao em Administrao, modalidade a distncia


Composto por todos os resultados que pertencem a ambos:
E1 E 2 = {4, 6}.
Eventos Mutuamente Exclusivos (M.E.): so eventos que no
5

UNIDADE
podem ocorrer simultaneamente, no apresentando elementos em co-
mum (sua interseco o conjunto vazio).
Dentre os trs eventos definidos acima, observamos que os even-
tos E1 e E3 no tm elementos em comum:
E3 = {1, 3} E1 = {2, 4, 6} E1 E3 = E1 e E 3 so
mutuamente exclusivos.
Evento Complementar de um evento qualquer formado por
todos os resultados do espao amostral que no pertencem ao evento.
A unio de um evento e seu complementar formar o prprio Espao
Amostral, e a interseco de um evento e seu complementar o con-
junto vazio.

Figura 32: Evento Complementar.


Fonte: elaborada pelo autor.

Ei Ei = Ei E i =
E1 = {2, 4, 6} E1 = {1, 3, 5}
E2 = {3, 4, 5, 6} E2 = {1, 2}

pois as expresses podero ser deduzidas ou B


A compreenso das definies anteriores ser extre-
mamente til quando calcularmos probabilidades,

simplificadas se identificarmos que se trata de evento


unio, interseco, ou se os eventos de interesse
so mutuamente exclusivos ou complementares.
Conhecido isso podemos agora passar definio
de probabilidade, ou mais especificamente s defi-
nies de probabilidade, que so complementares.

Perodo 3 131
5 Definies de Probabilidade
UNIDADE

Por que usamos plural, definies, ao invs de definio? Por-


que ao longo dos sculos vrias definies de probabilidade foram
apresentadas, sendo que elas se complementam.
A repetio de um experimento aleatrio, mesmo sob condi-
es semelhantes, poder levar a resultados (eventos) diferentes. Mas
se o experimento for repetido um nmero suficientemente grande de
vezes haver uma regularidade nestes resultados que permitir calcu-
lar a sua probabilidade de ocorrncia. Essa a base para as defini-
es que veremos a seguir.

Definio clssica de probabilidade

Intuitivamente as pessoas sabem como calcular algumas pro-


babilidades para tomar decises. Observe os seguintes exemplos.
Exemplo 1 Vamos supor que voc fez uma aposta com um

v
amigo. O vencedor ser aquele que acertar a face que ficar para cima
Usaremos o termo aps o lanamento de uma moeda honesta. Qual a chance de
moeda honesta para voc ganhar?
referenciar uma moeda Intuitivamente voc responderia que h 50% (1/2) de chances
perfeitamente equili- de ganhar, uma vez que h apenas duas faces (resultados) possveis.
brada e lanamentos Mesmo sem saber o que probabilidade voc pode calcular a chance
imparciais. De forma de ocorrncia de um evento de interesse, a face na qual voc apostou.
anloga, usaremos o
Voc continua apostando com o mesmo amigo. O vencedor
adjetivo honesto para
agora ser aquele que acertar o naipe de uma carta que ser retirada
dado, baralho, entre
ao acaso de um baralho comum de 52 cartas. Veremos neste segundo
outros.
exemplo qual a chance de voc ganhar?
Novamente, de forma intuitiva voc responderia que h 25%
(1/4) de chance, uma vez que h apenas quatro naipes (resultados)
possveis.
O que h em comum entre as situaes dos exemplos 1 e 2?
Refletindo um pouco voc observar que em ambos temos experimen-
tos aleatrios. A cada realizao do experimento apenas um dos re-
sultados possveis pode ocorrer. Alm disso, como se supe que a
moeda e o baralho so honestos, cada um dos resultados possveis
tem a mesma probabilidade de ocorrer: tanto cara quanto coroa pos-
suem 50% de chance de ocorrer, todos os quatro naipes (copas, espa-

132 Curso de Graduao em Administrao, modalidade a distncia


das, ouros e paus) tm 25% de chance de ocorrer. Sem que voc sou-
besse voc aplicou a definio clssica de probabilidade para
obter as chances de ganhar.
5

UNIDADE
Se um experimento aleatrio puder resultar em n diferentes e
igualmente provveis resultados, e nEi destes resultados referem-se ao
evento E i, ento a probabilidade do evento Ei ocorrer ser:

O problema reside em calcular o nmero total de resultados


possveis e o nmero de resultados associados ao evento de interesse.
Isso pode ser feito usando tcnicas de anlise combinatria (que sero
vistas posteriormente) ou por consideraes tericas (bom senso).
Seja o seguinte Experimento Aleatrio: lanamento de um dado
no viciado e observao da face voltada para cima. Neste Exemplo 3
vamos calcular as probabilidades de ocorrncia dos seguintes eventos:

a) Face 1.
b) Face par.
c) Face menor ou igual a 2.

O Espao Amostral deste experimento ser: = {1, 2, 3, 4, 5, 6}.


Sendo assim h um total de 6 resultados possveis, resultando em n = 6.
Basta ento definir quantos resultados esto associados a cada even-
to para que seja possvel calcular suas probabilidades pela definio
clssica.
O evento face 1 tem apenas um resultado associado: {1}.
Ento nEi = 1, e a probabilidade de ocorrer a face 1 ser: .
O evento face par tem trs resultados associados: {2, 4, 6}.
Ento n Ei = 3, e a probabilidade de ocorrer face par ser:
.

O evento face menor ou igual a 2 tem dois resultados associ-


ados: {1, 2}. Ento nEi = 2, e a probabilidade de ocorrncia de face
menor ou igual a 2 ser: .

Como visto nos exemplos, a definio clssica, que foi desenvol-


vida a partir do Sculo XVII, foi inicialmente aplicada para orientar
apostas em jogos de azar. Surgiram dois problemas dessa aplicao.
O primeiro relativamente bvio: muitos jogos de azar no
eram honestos, os donos das casas inescrupulosamente viciavam

Perodo 3 133
5 dados e roletas, marcavam baralhos, de maneira a fazer com que os
clientes perdessem sistematicamente, ou seja, o lanamento dos da-
dos ou a retirada da carta do baralho no eram mais experimentos
UNIDADE

aleatrios.
O segundo problema decorre da pergunta: ser que em todos
os experimentos aleatrios todos os eventos tero a mesma probabili-
dade de ocorrer? Ser que a probabilidade de chover no ms de no-
vembro na cidade de Brest (na Frana, que tem, em mdia, 225 dias
nublados por ano), a mesma na cidade de Sevilha (na Espanha, que
tem, em mdia, 240 dias de sol por ano)? Precisamos partir para a
definio experimental de probabilidade.

Definio experimental de probabilidade

Seja um experimento aleatrio que repetido n vezes, e Ei um


evento associado.
A frequncia relativa do evento Ei:

Quando o nmero de repeties tende ao infinito (ou a um


nmero suficientemente grande) fREi tende a um limite: a probabilida-
de de ocorrncia do evento Ei. A probabilidade do evento pode ser esti-
mada atravs da frequncia relativa. Lembre-se da Unidade 3, a des-
crio de um fenmeno pode ser feita por distribuio de frequncias.
Quando no h outra maneira de obter as probabilidades dos
eventos necessrio realizar o experimento (veja novamente a Unida-
de 1) vrias vezes para que seja possvel obter um nmero tal de ten-
tativas que permita que as frequncias relativas estimem as probabili-
dades, para que seja possvel construir um modelo probabilstico para
o experimento. Isso pode ser feito em laboratrio, em condies contro-
ladas, por exemplo, a vida til das lmpadas vendidas no comrcio
definida atravs de testes de sobrevivncia realizados pelos fabricantes.
Mas, em alguns casos no possvel realizar experimentos, a
maioria dos fenmenos socioeconmicos e climticos, por exemplo.
Neste caso precisamos estimar as probabilidades atravs das
frequncias relativas histricas.
Independente de como obtemos as probabilidades, elas obede-
cem a alguns axiomas e propriedades que veremos a seguir.

134 Curso de Graduao em Administrao, modalidade a distncia


Axiomas e Propriedades de Probabilidade

Alguns autores chamam esses axiomas e propriedades de defi-


5

UNIDADE
nio axiomtica da Probabilidade.
Seja um experimento aleatrio e um espao amostral associa-
do a ele. A cada evento Ei associaremos um nmero real denominado
P(Ei) que deve satisfazer os seguintes axiomas:

a) 0 P(Ei) 1,0:
A probabilidade de ocorrncia de um evento sempre um
nmero real entre 0 e 1 (0% e 100%);
b) P () = 1,0:
A probabilidade de ocorrncia do Espao Amostral igual
a 1 (100%) pois pelo menos um dos resultados do Espao
Amostral ocorrer. Por isso o Espao Amostral chamado
de Evento Certo; e
c) Se E1, E2, ..., E n so eventos mutuamente exclusivos, ento
P(E1 E2 ... En) = P(E1) + P(E2) + ... + P(En):
Esse axioma afirma que ao unir resultados diferentes, de-
vemos somar as probabilidades.

Alm dos axiomas, h algumas propriedades bsicas da Pro-


Evento Impossvel
babilidade:
evento com probabilidade
a) P () = 0: de ocorrer igual a 0%, o
conjunto vazio. Fonte:
A probabilidade de ocorrncia do conjunto vazio nula (igual Barbetta, Reis e Bornia
a zero), uma vez que no h resultados no conjunto vazio. (2008).

Por isso o conjunto vazio chamado de Evento Impossvel.


b) P(Ei) = 1,0:
Se a probabilidade de ocorrncia do Espao Amostral
igual a 1 (100%) ao somar as probabilidades de todos os
eventos que compem o Espao Amostral o resultado de-
ver ser igual a 1 (100%);
c) P(Ei) = 1 P(Ei):
A probabilidade de ocorrncia de um evento qualquer ser
igual a probabilidade do Espao Amostral (1 ou 100%)
menos a probabilidade de seu evento complementar (a soma

Perodo 3 135
5 das probabilidades de todos os outros eventos do Espao
Amostral); e
d) Sejam Ei e Ej dois eventos quaisquer: P (Ei E j ) = P(Ei)
UNIDADE

+ P(E j) P(Ei Ej):


A probabilidade de ocorrncia do evento Unio de dois
outros eventos ser igual a soma das probabilidades de
cada evento menos a probabilidade de ocorrncia do evento
Interseco dos mesmos dois eventos. Essa propriedade
tambm chamada de regra da adio.

Veja, neste quarto exemplo, o que seja o Experimento Aleatrio


lanamento de um dado no viciado e observao da face voltada
para cima, definido no Exemplo 3: o seu espao amostral ser
= {1, 2, 3, 4, 5, 6}.
Definindo trs eventos: E1 = face 1 = {1}, E2 = face par =
{2, 4, 6} e E3 = face 2 {1, 2}, cujas probabilidades j foram calculadas.
Calcular a probabilidade de ocorrncia dos seguintes eventos:

a) Complementar de E1;
b) Complementar de E2;
c) Unio de E2 e E3; e
d) Unio de E1 e E2.

No Exemplo 2 obteve-se P(E1) = 1/6, P(E2) = 3/6 e P(E3) = 2/6.


Usando as propriedades:
P(E1) = 1 P(E1) ento P(E1) = 1 P(E1) = 1 1/6 = 5/6
E1= {2, 3, 4, 5, 6}.
P(E2) = 1 P(E2) ento P(E2) = 1 P(E2) = 1 3/6 = 3/6
E2= {1, 3, 5}.
P(E2 E3) = P(E2) + P(E3) P(E2 E3). Observe que h
apenas um elemento em comum entre os eventos E2 e E3: apenas um
resultado associado P(E2 E3) = 1/6.
P(E2 E3) = 3/6 + 2/6 - 1/6 = 4/6.
P(E1 E2) = P(E1) + P(E2) P(E1 E 2). No h elementos
em comum entre os eventos E1 e E 2: eles so mutuamente exclusivos,
sua interseco o conjunto vazio, e a probabilidade de ocorrncia
do conjunto vazio nula. P(E1 E2) = 1/6 + 3/6 0 = 4/6.

136 Curso de Graduao em Administrao, modalidade a distncia


Agora vamos exercitar a mente! Imagine que voc

B
trabalha em uma corretora de aes e precisa acon-
selhar um cliente sobre investir ou no em aes
5

UNIDADE
da PETROBRS. Supe-se que o preo do barril
do petrleo subir cerca de 10% nos prximos dias,
h uma probabilidade estimada de acontecer. E,
sabendo disso, voc gostaria de saber qual a
probabilidade de que as aes da empresa subam
tambm 10% na BOVESPA. Este caso, em que
queremos calcular a probabilidade de ocorrncia
de um evento condicionada ocorrncia de outro,
somente poder ser resolvido por Probabilidade
Condicional, que veremos a seguir.

Probabilidade Condicional

Muitas vezes h interesse de calcular a probabilidade de ocor-


rncia de um evento A qualquer, dada a ocorrncia de outro evento B.
Por exemplo, qual a probabilidade de chover amanh em
Florianpolis, sabendo que hoje choveu? Ou qual a probabilidade
de um dispositivo eletrnico funcionar sem problemas por 200 horas
consecutivas, sabendo que ele j funcionou por 100 horas? Ou ainda,
a situao levantada anteriormente: qual a probabilidade de que as
aes da PETROBRS aumentem 10% se o preo do barril de petr-
leo subir 10% previamente?
Veja, queremos calcular a probabilidade de ocorrncia de A
condicionada ocorrncia prvia de B, simbolizada por P(A | B)
l-se probabilidade de A dado B e a sua expresso ser:

A probabilidade de ocorrncia de A condicionada ocorrn-

v
cia de B ser igual probabilidade da interseco entre A e B, dividi-
da pela probabilidade de ocorrncia de B (o evento que j ocorreu). No denominador da ex-
Se houvesse interesse no oposto, probabilidade de ocorrncia presso colocada
de B condicionada ocorrncia prvia de A: sempre a probabilida-
de do evento que j
ocorreu.
.

Perodo 3 137
5 Neste caso o valor no denominador seria a probabilidade de A
uma vez que esse evento ocorreu previamente, tal como B na outra
expresso. importante ressaltar que a operao de interseco
UNIDADE

comutativa, implicando em:

P(A B) = P(B A).

Seja o lanamento de dois dados no viciados, um aps o ou-


tro, e a observao das faces voltadas para cima. Neste quinto exem-
plo iremos calcular as probabilidades:

a) de que as faces sejam iguais supondo-se que sua soma


Operao comutativa menor ou igual a 5.
operao em que a
sequncia de realizao b) de que a soma das faces seja menor ou igual a 5, supondo-
no modifica o resultado, a
se que as faces so iguais.
ordem dos fatores no alte-
ra o produto. Fonte: elabo-
rado pelo autor. Observe que h interesse em calcular a probabilidade de even-
tos, supondo que outro evento ocorreu previamente.
Como todo problema de probabilidade preciso montar o Es-
pao Amostral. Neste caso sero os pares de faces dos dados, e como os
dados so lanados um aps o outro a ordem das faces importante:

Figura 33: Espao amostral do Exemplo 5.


Fonte: elaborada pelo autor.

H um total de 36 resultados possveis: n = 36. Agora preci-


so definir os eventos de interesse:
a) Faces iguais, sabendo que sua soma menor ou igual a 5
significa dizer probabilidade de ocorrncia de faces iguais supondo
que j ocorreram faces cuja soma menor ou igual a 5; chamando o
evento faces iguais de E1 e o evento soma das faces menor ou igual a
5 de E2 estamos procurando P(E1 | E2), probabilidade de ocorrncia
de E1 condicionada ocorrncia PRVIA de E2.
Usando a frmula:

138 Curso de Graduao em Administrao, modalidade a distncia


babilidades.
preciso encontrar os valores das pro-
5

UNIDADE
Primeiramente definir o nmero de resultados do Espao
Amostral que pertencem aos eventos de interesse, para que seja pos-
svel calcular a sua probabilidade usando a definio clssica de pro-
babilidade:
E1 = {(1,1) (2,2) (3,3) (4,4) (5,5) (6,6)} faces iguais, 6 resultados, nE1 = 6.
E2 = {(1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (3,1) (3,2) (4,1)} soma
das faces 5, 10 resultados, nE2 = 10.
Os elementos em comum formaro o evento interseco:
E1 E 2 = {(1,1) (2,2)} faces iguais e soma das faces 5, 2 resulta-
dos, nE1 E2 = 2.
P(E2) = nE2 / n = 10/36 P(E1 E2) = nE1 E2/ n = 2/36
Tendo as probabilidades acima possvel calcular a probabili-
dade condicional:

Ento, a probabilidade de que as faces so iguais sabendo-se


que sua soma menor ou igual a 5 de 20%.
Esse resultado poderia ser obtido de outra forma. Se a soma
das faces menor ou igual a 5, o evento E2 j ocorreu previamente,
ento o Espao Amostral modificou-se, passando a ser o conjunto de
resultados do evento E2:

novo = {(1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (3,1) (3,2) (4,1)}

O novo Espao Amostral tem 10 resultados, novo n = 10.


O nmero de resultados do evento faces iguais (E 1) no novo
Espao Amostral igual a 2, novo nE1 = 2 (h apenas dois pares no
novo Espao Amostral, de soma das faces menor ou igual a 5, em que
as faces so iguais).
Ento, a probabilidade de ocorrer o evento E 1 no novo Espao
Amostral, ou seja a probabilidade de ocorrncia do evento E1 condi-
cionada ocorrncia prvia do evento E2, P(E 1|E 2), ser:
P(E1|E2) = novo nE1/ novo n = 2/10 = 0,2 (20%) o mesmo
resultado obtido anteriormente.
b) Soma das faces menor ou igual a 5, sabendo que as faces
so iguais, significa dizer probabilidade de ocorrncia de faces cuja

Perodo 3 139
v
5 Houve
uma mu-
soma menor ou igual a 5, supondo que j ocorreram faces que so
iguais; chamando o evento faces iguais de E1 e o evento soma das
faces menor ou igual a 5 de E2 estamos procurando P(E2|E1), proba-
UNIDADE

dana no bilidade de ocorrncia de E2 condicionada ocorrncia PRVIA de


evento E1.
que ocor-
Usando a frmula: todos os valores j fo-
reu previ-
amente. ram obtidos no item a.

Ento, a probabilidade de que as faces tenham soma menor ou


igual a 5, sabendo que so iguais de 33%.
Da mesma forma que no item a o resultado poderia ser obtido
se outra forma. Se as faces so iguais, o evento E1 j ocorreu previa-
mente, ento o Espao Amostral modificou-se, passando a ser o con-
junto de resultados do evento E1: novo = {(1,1) (2,2) (3,3) (4,4)
(5,5) (6,6)}.
O novo Espao Amostral tem 6 resultados, novo n = 6.
O nmero de resultados do evento soma das faces menor ou
igual a 5 (E2) no novo Espao Amostral igual a 2, novo nE2= 2 (h
apenas dois pares no novo Espao Amostral, de faces iguais, em que
a soma das faces menor ou igual a 5).
Ento, a probabilidade de ocorrer o evento E 2 no novo Espao
Amostral, ou seja a probabilidade de ocorrncia do evento E2 condi-
cionada ocorrncia prvia do evento E1, P(E2|E1), ser: P(E2|E1)
= novo nE2/ novo n = 2/6 = 0,33 (33%) o mesmo resultado obtido

!
anteriormente.

extremamente impor tante lembrar que,


conceitualmente P(A|B) P(B|A), pois os eventos que
ocorreram previamente so diferentes.

No quinto exemplo utilizamos a definio clssica para obter


as probabilidades necessrias, mas poderamos usar distribuies de
frequncias de dados histricos ou experimentais para obt-las.

140 Curso de Graduao em Administrao, modalidade a distncia


Regra do Produto
5

UNIDADE
Uma das consequncias da expresso da probabilidade condi-
cional a regra do produto, isolando a probabilidade da interseco:

Neste caso o evento B ocorreu previamente, e o segundo valor


a probabilidade de ocorrncia de A dado que B ocorreu.

v
.

Neste caso o evento A ocorreu previamente, e o segundo valor No se esquea que a


a probabilidade de ocorrncia de B dado que A ocorreu. interseco comutativa.

importante que seja observada com cuidado a


sequncia dos eventos para montar as expresses
acima: analisar corretamente que evento j ocorreu.
B
No exemplo 6, digamos que uma urna contm duas bolas bran-
cas e trs vermelhas. Retiramos duas bolas ao acaso, uma aps a ou-
tra. Veremos nos itens abaixo se a retirada foi feita sem reposio.

a) Qual a probabilidade de que as duas bolas retiradas se-


jam da mesma cor?
b) Qual a probabilidade de que as duas bolas retiradas se-
jam vermelhas, supondo que so da mesma cor?

Como em todos os problemas de probabilidade primeiramente


preciso definir o Espao Amostral. H duas cores e duas retiradas,
ento podemos ter:

z a 1 e a 2 bolas brancas (duas bolas da mesma cor)


evento E 1 = B 1 B2;
z a 1 bola branca e a 2 bola vermelha evento E2 = B1 V2;
z a 1 bola vermelha e a 2 bola branca evento E3 = V1 V2; e

Perodo 3 141
5 z a 1 bola vermelha e a 2 bola vermelha (duas bolas da
mesma cor) evento E4 = V1 V2.
UNIDADE

Ento, o Espao Amostral ser:


= { B1 B2, B1 V2, V1 B2, V1 V2}
Todos os quatro eventos acima so mutuamente exclusivos:
quando as bolas forem retiradas apenas um, e somente um, dos even-
tos acima pode ocorrer.
As retiradas so feitas sem reposio: a segunda retirada de-
pende do resultado da primeira. Se as retirada forem feitas sem repo-
sio elas sero dependentes, pois o Espao Amostral ser modifica-
do: a cada retirada, as probabilidades de ocorrncia so modificadas
porque as bolas no so repostas.

z A probabilidade de retirar bola branca na 1 retirada de


2/5(2 bolas brancas no total de 5), P(B 1) = 2/5; e
z a probabilidade de retirar bola vermelha na 1 retirada de
3/5 (3 bolas vermelhas em 5), P(V 1) = 3/5.

Se a primeira bola retirada foi branca (o evento B 1 ocorreu


previamente), restaram 4 bolas, 1 branca e 3 vermelhas:

v
z a probabilidade de retirar uma bola branca na 2 retirada
Repare que o nmero se na 1 foi extrada uma branca de 1/4 (1 bola branca
de bolas, nmero de em 4), P(B 2| B1) = 1/4.
resultados, diminuiu
z a probabilidade de retirar uma bola vermelha na 2 retira-
de 5 para 4 porque as
da se na 1 foi extrada uma branca de 3/4 (3 bolas ver-
retiradas so feitas sem
melhas em 4), P(V 2| B 1) = 3/4.
reposio.

Se a primeira bola retirada foi vermelha (o evento V1 ocorreu


previamente), restaram 4 bolas, 2 brancas e 2 vermelhas:

z a probabilidade de retirar uma bola branca na 2 retirada


se na 1 foi extrada uma vermelha de 2/4 (2 bolas bran-
cas em 4), P(B 2| V1) = 2/4.
z a probabilidade de retirar uma bola vermelha na 2 retira-
da se na 1 foi extrada uma vermelha de 2/4 (2 bolas
vermelhas em 4), P(V 2| V1) = 2/4.

142 Curso de Graduao em Administrao, modalidade a distncia


a) O evento que nos interessa: bolas da mesma cor: brancas
ou vermelhas, evento unio brancas-vermelhas.
Chamando bolas da mesma cor de evento F: F = [(B 1 B2)
5

UNIDADE
(V1 V2)].
Usando as propriedades de probabilidade:
P(F) = P [(B1 B2) (V1 V2)]= P(B1 B2) + P(V1 V2) P (B1 B2)
(V 1 V2).
Os eventos (B1 B2) e (V1 V2) so mutuamente exclusivos, se
as bolas so da mesma cor ou so brancas ou so vermelhas, ento a
interseco entre eles o conjunto vazio, e a probabilidade do conjun-
to vazio ocorrer igual a zero, ento simplesmente: P(F) = P [(B1 B2)
(V 1 V2)]= P(B1 B2) + P(V 1 V2).
Usando a regra do produto:

P(B1 B2) = P(B1) x P(B2| B1) = (2/5) x (1/4) = 2/20 = 1/10.


P(V1 V2) = P(V1) x P(V2| V1) = (3/5) x (2/4) = 6/20 = 3/10.

Substituindo na expresso:

P(F) = P [(B1 B2) (V1 V2)]= P(B1 B2) + P(V1 V2) = 1/10 +
3/10 = 4/10 = 0,4 (40%).

Ento, se as retiradas forem feitas sem reposio, a probabili-


dade de que as duas bolas sejam da mesma cor ser igual a 0,4 (40%).

b) Neste caso sabemos que as duas bolas so da mesma cor (o


evento F acima J OCORREU) e h interesse em saber a probabili-
dade de que as duas bolas sejam vermelhas:

P[(V1 V2)| F] = P{(V1 V2) | [(B1 B2) (V1 V2)]}.

Usando a expresso de probabilidade condicional:

A probabilidade do denominador j conhecida do item a. E a


do numerador pode ser obtida facilmente.
Repare: o que h em comum entre o evento (V1 V2) e o even-
to [(B1 B2) (V1 V2)], em suma qual ser o evento interseco?
O que h em comum entre duas bolas vermelhas e duas bolas da mes-
ma cor? O prprio evento duas bolas vermelhas (V1 V2), ento:

Perodo 3 143
5 (V 1 V2) [(B1 B2) (V1 V2)] = (V1 V2);
P{(V1 V2) [(B1 B2) (V1 V2)]} = P (V1 V2) = 3/10.
UNIDADE

Sabendo que P{(V1 V2) | [(B1 B2) (V1 V2)]}= 4/10


(do item a.1) e substituindo os valores na frmula:

P{(V1 V2) | [(B1 B2) (V1 V2)]}=

P{(V1 V2) | [(B1 B2) (V1 V2)]}= 0,75 (75%)

Ento, se as retiradas forem feitas sem reposio e as duas bolas


forem da mesma cor, a probabilidade de que sejam vermelhas ser
igual a 0,75 (75%).
As retiradas e as probabilidades podem ser representadas atra-
vs de um diagrama chamado de rvore de Probabilidades:

Figura 34: rvore de Probabilidades Retiradas sem reposio.


Fonte: elaborada pelo autor.

Observe que atravs da rvore de Probabilidades podemos


chegar aos mesmos resultados obtidos anteriormente. Partindo do Es-
pao Amostral original um dos ramos significa 1 bola branca (B1) e o
outro 1 bola vermelha (V1). Dependendo do resultado da primeira
retirada haver um Espao Amostral diferente: 1 bola branca e 3 ver-

144 Curso de Graduao em Administrao, modalidade a distncia


melhas se na 1 retirada obteve-se uma bola branca, ou 2 bolas bran-
cas e 2 vermelhas se na 1 retirada obteve-se uma bola vermelha.
A partir dos novos Espaos Amostrais possvel calcular as
5

UNIDADE
probabilidades condicionais para cada caso, e depois substitu-las nas
frmulas adequadas. Contudo, a rvore ser intil se o evento para o
qual se deseja calcular a probabilidade no for definido adequadamen-
te: neste caso, no item a, bolas da mesma cor [(B1 B2) (V1 V2)], e
no item b, bolas vermelhas sabendo que so da mesma cor {(V1 V2)
| [(B1 B2) (V1 V2)]}.
A rvore ser igualmente intil se no forem usadas as defini-
es de eventos dependentes (porque no h reposio) e de eventos
mutuamente exclusivos (porque os eventos no podem ocorrer simul-
taneamente), e as expresses de probabilidade condicional e os axio-
mas de probabilidade.
O grande inconveniente da rvore de Probabilidades surge
quando o nmero de retiradas aumenta e/ou o nmero de resulta-
dos possveis para cada retirada considervel: torna-se impraticvel
desenhar a rvore, enumerando todos os resultados. Nesses casos
usamos Anlise Combinatria, que veremos adiante.

E se a ocorrncia do evento A no modificasse a


probabilidade de ocorrncia de B? Os eventos A e
B seriam chamados de independentes. Voc pode
imaginar situaes prticas em que dois eventos
sejam independentes?
B
Eventos Independentes

Dois ou mais eventos so independentes quando a ocorrncia


de um dos eventos no influencia a probabilidade de ocorrncia dos
outros. Se dois eventos A e B so independentes ento a probabilida-
de de A ocorrer dado que B ocorreu igual prpria probabilidade de
ocorrncia de A, e a probabilidade de B ocorrer dado que B ocorreu
igual prpria probabilidade de ocorrncia de B.

Perodo 3 145
5 Se A e B so independentes ento:

P (A|B) = P(A) e P(B|A) = P(B)


UNIDADE

P (A B) = P(A) H P(B|A) = P(A) H P(B)

!
P (A B) = P(B) H P(A|B) = P(B) H P(A)

As expresses acima so vlidas se os eventos A e B


forem independentes.

Em situaes prticas dois eventos so independentes quando


a ocorrncia de um deles no modifica, ou modifica muito pouco, o
Espao Amostral do Experimento Aleatrio. o que ocorria na Uni-
dade 2 quando fazamos amostragem aleatria simples: naquele mo-
mento no foi dito que a amostragem era com reposio, que dificil-
mente feita na prtica, mas admite-se que sendo o tamanho da po-
pulao muito grande, a retirada de uma pequena amostra no modi-
ficar muito as propores dos eventos.
Exemplo 7: resolva o Exemplo 6, mas agora supondo que as
retiradas foram feitas com reposio.

a) Qual a probabilidade de que as duas bolas retiradas se-


jam da mesma cor? R.: 0,52(52%)
b) Qual a probabilidade de que as duas bolas retiradas se-
jam vermelhas, supondo-se que so da mesma cor? R.: 0,69
(69%).

Saiba mais...
Sobre conceitos bsicos de Probabilidade, BARBETTA, Pedro A. Estatstica
Aplicada s Cincias Sociais. 7. ed. Florianpolis: Editora da UFSC, 2007,
Captulo 7.

Tambm sobre conceitos bsico de Probabilidade: STEVENSON, Willian J.


Estatstica Aplicada Administrao. So Paulo: Editora Harbra, 2001,
Captulo 3.

LOPES, Paulo A. Probabilidades e Estatstica. Rio de Janeiro: Reichmann e


Affonso Editores, 1999, Captulo 3.

146 Curso de Graduao em Administrao, modalidade a distncia


Resumindo
r 5

UNIDADE
O resumo desta Unidade est mostrado na Figuras 35:

Figura 35: Resumo da Unidade 5.


Fonte: elaborado pelo autor.

Perodo 3 147
5
B Chegamos ao final de Unidade 5. Esperamos que
voc tenha aprendido todos os conceitos trabalha-
dos e com os exemplo propostos, tenha colocado
UNIDADE

em pratica as informaes adquiridas. Neles pro-


pomos que voc reconhecesse os modelos
probabilsticos, modelos determinsticos, principais
tipos de eventos, e os diferentes tipos de clculos.
Na Unidade 6 vamos prosseguir, aprendendo o con-
ceito de varivel aleatria, que ser indispensvel
para as Unidades 7, 8 e 9. Veremos ainda nas
Unidade seguintes a expanso do estudo para o
conceito de Varivel Aleatria, e alguns dos mode-
los probabilsticos mais empregados. Tudo isso para
chegarmos s Unidades 8 e 9, onde aplicaremos
os conceitos de probabilidade no processo de
inferncia estatstica, conforme j foi dito na Uni-
dade 1.

Atividades de aprendizagem
aprendizagem
1) Numa eleio para a prefeitura de uma cidade, 30% dos eleitores
pretendem votar no candidato A, 50% no candidato B e 20% em
branco ou nulo. Sorteia-se um eleitor na cidade e verifica-se o can-
didato de sua preferncia.
a) Construa um modelo probabilstico para o problema.
b) Qual a probabilidade de o eleitor sorteado votar em um
dos dois candidatos? (R.: 0,8)
Adaptado de BARBETTA, Pedro A. Estatstica Aplicada s Cincias
Sociais. 7. ed. Florianpolis: Ed. da UFSC, 2007.

148 Curso de Graduao em Administrao, modalidade a distncia


2) Extraem-se ao acaso duas cartas de um baralho de 52 cartas, uma
aps a outra SEM reposio. Calcule as seguintes probabilidades:
a) Ambas as cartas so vermelhas. (R.: 0,245)
5

UNIDADE
b) Ambas as cartas so de paus. (R.: 0,058)
c) Ambas as cartas so de Figuras (s, rei, dama ou valete).
(R.: 0,0905)
d) Uma carta de paus e outra de copas. (R.: 0,1274)
Adaptado de STEVENSON, W.J. Estatstica Aplicada Administra-
o, So Paulo: Harper do Brasil, 1981, pgina 76.
3) Repita o exerccio 2 supondo que as retiradas fossem feitas COM
reposio.
Adaptado de STEVENSON, W.J. Estatstica Aplicada Administra-
o, So Paulo: Harper do Brasil, 1981, pgina 75.
a) R.: 0,25 b) R.: 0,0625
c) R.: 0,0947 d) 0,125
4) Para um determinado telefone a probabilidade de se conseguir linha
de 0,75 em dias normais e 0,25 em dias de chuva. A probabilida-
de de chover em um dia 0,1. Alm disso tendo-se conseguido li-
nha, a probabilidade de que um nmero esteja ocupado 11/21.
a) Qual a probabilidade de que um telefone tenha sua liga-
o completada? (R.: 0,333)
b) Dado que um telefonema foi completado, qual a probabi-
lidade de estar chovendo? (R.: 0,0357)

Perodo 3 149
Variveis aleatrias
6
UNIDADE

D
Objetivo
Nesta Unidade voc compreender o conceito de
varivel aleatria e seu relacionamento com os
modelos probabilsticos. Aprender tambm que os
modelos probabilsticos podem ser construdos para
as variveis aleatrias.
6
UNIDADE

152 Curso de Graduao em Administrao, modalidade a distncia


Conceito de Varivel Aleatria 6

UNIDADE
Caro estudante!
Uma pergunta que normalmente feita a todos
que trabalham com cincias exatas: por que a
obsesso em reduzir tudo a nmeros? Vimos em
Anlise Exploratria de Dados que uma varivel
B
quantitativa, geralmente, porque nem tudo pode
ser reduzido a nmeros, como a inteligncia e a
criatividade, apresenta mais informao que uma
varivel qualitativa, pode ser resumida no somen-
te atravs de tabelas e grficos, mas tambm atra-
vs de medidas de sntese.
Nos exemplos sobre probabilidade apresentados na
Unidade 5 os eventos foram geralmente definidos
de forma verbal: bolas da mesma cor, 2 bolas ver-
melhas, soma das faces menor ou igual a 5, etc.
No haveria problema em definir os eventos atravs
de nmeros. Bastaria associar aos resultados do Es-
pao Amostral nmeros, atravs de uma funo.
Essa funo chamada de Varivel Aleatria. Os
modelos probabilsticos podem ento ser
construdos para as variveis aleatrias. O admi-
nistrador precisa conhecer esses conceitos porque
eles proporcionam maior objetividade na obteno
das probabilidades, o que torna o processo de to-
mada de decises mais seguro. Vamos conhecer
esses conceitos nesta Unidade?

Espao Amostral o

U
ma definio inicial de Varivel Aleatria poderia ser: trata-se conjunto de todos os re-
sultados possveis de um
de uma varivel quantitativa, cujo resultado (valor) depende experimento aleatrio.
de fatores aleatrios. Fonte: Barbetta, Reis e
Bornia (2008).
Formalmente, Varivel Aleatria uma funo matemtica
que associa nmeros reais (contradomnio da funo) aos resultados
de um Espao Amostral (domnio da funo), por sua vez vinculado a
um Experimento Aleatrio. Se o Espao Amostral for finito ou infinito

Perodo 3 153
6 numervel a varivel aleatria dita discreta. Se o Espao Amostral
for infinito a varivel aleatria dita contnua.
UNIDADE

Figura 36: Varivel aleatria.


Fonte: elaborada pelo autor.
Experimento Aleatrio
um processo de obteno
de um resultado ou medida
Por exemplo, imaginemos o Experimento Aleatrio jogar uma
que apresenta as seguintes moeda honesta duas vezes e observar a face voltada para cima. O
caractersticas: no se pode Espao Amostral seria finito:
afirmar, antes de realizar o
experimento, qual ser o
= {CaraCara; CaraCoroa; CoroaCara; CoroaCoroa}
resultado de uma realiza-
o, mas possvel deter-
Se houvesse interesse no nmero de caras obtidas, poderia ser
minar o conjunto de resul-
tados possveis; quando definida uma varivel aleatria discreta X, onde X = Nmero de caras
realizado um grande nme- em dois lanamentos. Os valores possveis de X seriam: X = {0, 1, 2}
ro de vezes (replicado) apre-
sentar uma regularidade
O valor 0 associado ao evento CoroaCoroa, o valor 1 asso-
que permitir construir um ciado aos eventos CaraCoroa e CoroaCara, e o valor 2 associado
modelo probabilstico para ao evento CaraCara.
analisar o experimento.
Fonte: adaptado pelo autor Quando o Espao Amostral infinito muitas vezes j est defi-
de Lopes (1999). nido de forma numrica, pela prpria natureza quantitativa do fen-
Distribuio de proba- meno analisado, facilitando a definio da varivel aleatria.
bilidades funo que Os Modelos Probabilsticos podem ser construdos para as va-
relaciona os valores poss-
veis que uma varivel alea-
riveis aleatrias: assim haver Modelos Probabilsticos Discretos e
tria pode assumir com as Modelos Probabilsticos Contnuos. Para construir um modelo
respectivas probabilidades, probabilstico para uma varivel aleatria necessrio definir os seus
em suma o prprio mode-
lo probabilstico da varivel
possveis valores (contradomnio), e como a probabilidade total (do
aleatria. Fonte: Barbetta, Espao Amostral, que vale 1) distribui-se entre eles: preciso ento
Reis e Bornia (2008). definir a distribuio de probabilidades.

B Veja que dependendo do tipo de varivel aleatria


haver diferenas na construo da distribuio.

154 Curso de Graduao em Administrao, modalidade a distncia


Distribuies de probabilidades para variveis
aleatrias discretas
6

UNIDADE
Podemos ver alguns exemplos de variveis aleatrias discretas:

a) nmero de coroas obtido no lanamento de 2 moedas;


b) nmero de itens defeituosos em uma amostra retirada ale-
atoriamente de um lote;
c) nmero de defeitos em um azulejo numa fbrica de revesti-
mentos cermicos; e
d) nmero de pessoas que visitam um determinado site num
certo perodo de tempo.

Quando uma varivel aleatria X discreta, a obteno da


distribuio de probabilidades consiste em definir o conjunto de pa-
res [xi, p(xi)], onde xi o i-simo valor da varivel X, e p(xi) a proba-
bilidade de ocorrncia de xi, como na Tabela 1:

Tabela 1: Distribuio de Probabilidades para uma Varivel Aleatria Discreta.

X= XI P (X = X I)
x1 p(x1)
x2 p(x2)
... ...
xn p(xn )

Fonte: elaborado pelo autor.

Onde p(xi) 0, n o nmero de valores que X pode assumir, e

Ao obter a distribuio de probabilidades para uma varivel


aleatria discreta, se voc quiser conferir os resultados, some as pro-
babilidades, se elas no somarem 1, h algo errado. Vamos ao primei-
ro exemplo.
Imagine que o jogador Ruinzinho est treinando cobranas de
pnaltis. Dados histricos mostram que: a probabilidade de ele acer-
tar uma cobrana, supondo que ele acertou a anterior de 60%. Mas,

Perodo 3 155
6 se ele tiver errado a anterior a probabilidade de ele acertar uma co-
brana cai para 30%. Construa a distribuio de probabilidades do
nmero de acertos em 3 tentativas de cobrana.
UNIDADE

A varivel aleatria X, nmero de acertos em trs tentativas,


uma varivel aleatria discreta: o seu contradomnio finito, o joga-
dor pode acertar 0, 1, 2 ou 3 vezes. Mas, para calcular as probabilida-
des associadas a esses valores preciso estabelecer todos os eventos
possveis, pois mais de um evento contribui para as probabilidades de
1 e 2 acertos. Observando a rvore de eventos abaixo (onde A acer-
tar a cobrana e E significa errar).

Figura 37: rvore de eventos.


Fonte: elaborada pelo autor.

Observe que todos os eventos so mutuamente exclusivos, o


jogador no pode, na mesma sequncia de 3 cobranas, errar e acer-
tar a primeira. preciso explicitar os valores da varivel, e os eventos
em termos de teoria dos conjuntos.
Valores possveis = {0, 1, 2, 3} acertos. A equivalncia entre
os valores da varivel e os eventos estabelecida abaixo:

X = 0 [E1 E2 E3]
X = 1 [(A1 E2 E3) (E1 A2 E3) (E1 E2 A3)]
X = 2 [(A1 A2 E3) (E1 A2 A3) (A 1 E2 A3)]
X = 3 [A 1 A2 A3]

Ento:

P(X=0) = P[E1 E2 E3]

156 Curso de Graduao em Administrao, modalidade a distncia


P(X=1) = P[(A1 E2 E3) (E1 A2 E3) (E1 E2 A3)]
P(X=2) = P[(A1 A2 E3) (E1 A2 A3) (A 1 E2 A3)]
6

UNIDADE
P(X=3) = P[A 1 A2 A3]

v
Assume-se que na primeira tentativa o jogador tem 50% de E 1 , errar a
chance de acertar, ento: P(A1) = 0,5 e P(E1) = 0,5. primeira co-
Alm disso, estabeleceu-se que quando o jogador acertou a brana, o
cobrana na tentativa anterior a probabilidade de acertar a prxima evento com-
de 0,6, e caso tenha errado na anterior a probabilidade de acertar na plementar de
A 1, acertar a primeira
prxima de apenas 0,3. Tratam-se de duas probabilidades condicio-
cobrana.
nais, estabelecidas em funo de eventos j ocorridos.
Se o jogador acertou na tentativa i (qualquer uma), as probabi-
lidades de acertar e errar na prxima tentativa sero: P(Ai+1|Ai) = 0,6.
Pelo complementar obtm-se P(Ei+1|Ai) = 0,4.
Se o jogador errou na tentativa i, as probabilidades de acertar
e errar na prxima tentativa sero: P(Ai+1|Ei) = 0,3
Pelo complementar obtm-se P(Ei+1|Ei) = 0,7.
Com essas probabilidades estabelecidas, lembrando da regra
do produto, e considerando o fato de que os eventos so mutuamente
exclusivos possvel calcular as probabilidades de ocorrncia de cada
valor da varivel aleatria X.

P(X=0) = P[E 1 E2 E3] = P(E1) P(E2|E1) P(E3| E1 E2).

Como os resultados em uma tentativa s dependem daqueles


obtidos na imediatamente anterior, o terceiro termo da expresso aci-
ma pode ser simplificado para P(E3|E2), e a probabilidade ser:

P(X=0) = P(E 1) x P(E2|E1) x P(E3|E2) = 0,5 0,7 0,7 = 0,245


(24,5%)

Estendendo o procedimento acima para os outros valores:

P(X=1) = P[(A1 E2 E3) (E1 A2 E3) (E1 E2 A3)]


P(X=2) = P[(A1 A2 E3) (E1 A2 A3) (A 1 E2 A3)]
P(X=3) = P[A1 A2 A3]
Como os eventos so mutuamente exclusivos:

P(X=1) = P(A1 E2 E3) + P(E1 A2 E3) + P(E1 E2 A3)


P(X=1) =
P(A1)P(E2|A1)P(E3|E2)+P(E1)P(A2|E1)P(E3|A2)+P(E1)P(E2|E1)P(A3|E2)

Perodo 3 157
6 P(X=1) = 0,50,4 0,7 + 0,5 0,3 0,4+ 0,5 0,7 0,3 = 0,305
P(X=2) = P(A1 A2 E3)+ P(E1 A2 A3) + P(A1 E2 A3)
P(X=2)
UNIDADE

=P(A1)P(A2|A1)P(E3|A2)+P(E1)P(A2|E1)P(A3|A2)+P(A1)P(E2|A1)P(A3|E2)
P(X = 2) = 0,5 0,6 0,4 +0,5 0,3 0,6 + 0,5 0,4 0,3 = 0,27
(27%)
P(X=3) = P[A1 A2 A3] = P(A1) P(A2|A1) P(A 3|A 2) = 0,5
0,6 0,6 = 0,18 (18%)

Com os valores calculados acima possvel construir a Tabela


2 com os pares valores-probabilidades.

Tabela 2: Distribuio de probabilidades: nmero de acertos em 3 cobranas.

X P (X = X I)
0 0,245
1 0,305
2 0,270
3 0,180
Total 1,0

Fonte: elaborado pelo autor.

Ao longo dos sculos matemticos e estatsticos deduziram


modelos matemticos para tornar mais simples a obteno de distri-
buio de probabilidades para uma varivel aleatria discreta. Al-
guns desses modelos sero vistos na Unidade 7.

B Vamos agora passar para a anlise das variveis


aleatrias discretas.

158 Curso de Graduao em Administrao, modalidade a distncia


Distribuies de probabilidades para variveis
aleatrias contnuas
6

UNIDADE
Podemos ver alguns exemplos de variveis aleatrias contnu-
as:

z volume de gua perdido em um sistema de abastecimento;


z renda familiar em salrios mnimos de pessoas selecionadas
por amostragem aleatria para responder uma pesquisa;
z a demanda por um produto em um ms; e
z tempo de vida de uma lmpada incandescente.

Uma varivel aleatria contnua est associada a um Espao


Amostral infinito. Assim, a probabilidade de que a varivel assuma
exatamente um valor xi zero, no havendo mais sentido em repre-
sentar a distribuio pelos pares xi p(xi). Igualmente sem sentido fica
a distino entre > e existente nas variveis aleatrias discretas. Uti-
liza-se ento uma funo no negativa, a funo densidade de probabi-
lidades, definida para todos os valores possveis da varivel aleatria.
Uma funo densidade de probabilidades poderia ser apresen-
tada graficamente da seguinte forma:

Figura 38: Funo densidade de probabilidades.


Fonte: elaborada pelo autor.

Para calcular a probabilidade de uma varivel aleatria cont-


nua assumir valores entre a e b (dois valores quaisquer), basta calcu-
lar a rea abaixo da curva entre a e b. Se a rea for calculada entre l
e m (limites da funo) tem que dar 1, que a probabilidade total.
Usualmente isso feito calculando a integral da funo no intervalo

Perodo 3 159
6 de interesse. Em muitas situaes de nosso interesse tais probabilida-
des podem ser calculadas atravs de frmulas matemticas relativa-
mente simples, ou foram dispostas em tabelas, que so encontradas
UNIDADE

em praticamente todos os livros de estatstica, e que sero vistas na


Unidade 7.

B Agora vamos ver alguns conceitos muito importan-


tes como valor esperado e varincia de uma vari-
vel aleatria.

Valor Esperado e Varincia

Todos os modelos probabilsticos apresentam duas medidas


(dois momentos) que permitem caracterizar a varivel aleatria para
a qual eles foram construdos: o Valor Esperado e a Varincia da va-
rivel aleatria. O Valor Esperado (simbolizado por E(X)) nada mais
do que a mdia aritmtica simples vista em Anlise Exploratria de
Dados (Unidade 4), utilizando probabilidades ao invs de frequncias
no clculo. Analogamente, a Varincia (simbolizada por V(X)) a
varincia vista anteriormente, utilizando probabilidades. Da mesma
forma que em Anlise Exploratria de Dados tambm comum traba-
lhar com o Desvio Padro, raiz quadrada positiva da Varincia (que
aqui ser simbolizado por (X), sigma de X). A interpretao dos
resultados obtidos pode ser feita de forma semelhante Anlise
Exploratria de Dados, apenas recordando que se trata de uma vari-
vel aleatria, e esto sendo usadas probabilidades e no frequncias.
Para uma varivel aleatria discreta o valor esperado e a
varincia podem ser calculados da seguinte forma:

Para uma varivel aleatria contnua a obteno do valor es-


perado e da varincia exige o clculo de integrais das funes de den-
sidade de probabilidades. Para as distribuies mais importantes as

160 Curso de Graduao em Administrao, modalidade a distncia


equaes encontram-se disponveis nos livros de estatstica, em funo
dos parmetros da distribuio, e algumas sero vistas na Unidade 7.
Uma das principais utilidades do valor esperado na compa-
6

UNIDADE
rao de propostas. Suponha que os valores de uma varivel aleat-
ria sejam lucros, ou prejuzos, advindos de decises tomadas, por exem-
plo, decidir por uma proposta de compra do cliente A, ou do cliente B.
Associados aos valores h probabilidades, como decidir qual a mais
vantajosa? O clculo do valor esperado possibilita uma comparao
objetiva: decidiramos pela que apresentasse o lucro esperado mais
elevado. H um campo de conhecimento que se ocupa especificamente
de fornecer as ferramentas necessrias para tais tomadas de deciso: a
teoria estatstica da deciso ou anlise estatstica da deciso.
O valor esperado (mdia) e a varincia apresentam algumas
propriedades, tanto para variveis aleatrias discretas quanto cont-
nuas. O seu conhecimento facilitar muito a obteno das medidas
em problemas mais sofisticados.
Para o valor esperado E(X), sendo k uma constante:

a) E(k) = k A mdia de uma constante a prpria constante.


b) E(k X) = k E(X) A mdia de uma constante somada a
uma varivel aleatria a prpria constante somada
mdia da varivel aleatria.
c) E(k H X) = k H E(X) A mdia de uma constante multiplica-
da por uma varivel aleatria a prpria constante multi-
plicada pela mdia da varivel aleatria.
d) E(X Y) = E(X) E(Y) A mdia da soma de duas vari-
veis aleatrias igual soma das mdias das duas vari-
veis aleatrias.
e) Sejam X e Y duas variveis aleatrias independentes
E(X H Y) = E(X) H E(Y) A mdia do produto de duas
variveis aleatrias independentes igual ao produto das
mdias das duas variveis aleatrias.

Para a varincia V(X), sendo k uma constante:

a) V(k) = 0 Uma constante no varia, portanto sua varincia


igual a zero.

Perodo 3 161
6 b) V(k X) = V(X) A varincia de uma constante somada a
uma varivel aleatria igual apenas varincia da vari-
vel aleatria.
UNIDADE

c) V(k H X) = k2 H V(X) A varincia de uma constante mul-


tiplicada a uma varivel aleatria igual ao quadrado da
constante multiplicada pela varincia da varivel aleatria.
d) Sejam X e Y duas variveis aleatrias independentes
V(X Y) = V(X) + V(Y) A varincia da soma ou subtra-
o de duas variveis aleatrias independentes ser igual
soma das varincias das duas variveis aleatrias.

Agora vamos ver um exemplo.


Exemplo 2 Calcular o valor esperado e a varincia da distri-
buio do Exemplo 1.
Para uma varivel aleatria discreta aconselhvel acrescen-
tar mais uma coluna Tabela 3 com os valores e probabilidades, para
poder calcular o valor de E(X2):

Tabela 3: Distribuio de probabilidades do Exemplo 1


(com coluna xi2 p(X = xi)).

X P (X = X I) XI H P (X = XI) XI2 P (X = X I)
0 0,245 0 0
1 0,305 0,305 0,305
2 0,270 0,540 1,08
3 0,180 0,540 1,62
Total 1,0 1,385 3,005

Fonte: elaborado pelo autor.

Substituindo nas expresses de valor esperado e varincia:

Observe que o valor esperado (1,385 acertos) um valor que a


varivel aleatria no pode assumir! No o valor mais provvel,

162 Curso de Graduao em Administrao, modalidade a distncia


o ponto de equilbrio do conjunto. Repare que a unidade da varincia
dificulta sua comparao com o valor esperado, mas ao se utilizar o
desvio padro possvel verificar que a disperso dos resultados
6

UNIDADE
quase do valor da mdia (valor esperado).

Saiba mais...
Sobre Variveis Aleatrias, BARBETTA, Pedro A.; REIS, Marcelo M.;
BORNIA, Antonio C. Estatstica para Cursos de Engenharia e Informtica.
2. ed. So Paulo: Atlas, 2008, Captulos 5 e 6.

Sobre as propriedades de valor esperado e varincia, BARBETTA, P. A.;


REIS, Marcelo M.; BORNIA, Aantonio C. Estatstica para Cursos de Enge-
nharia e Informtica. 2. ed. So Paulo: Atlas, 2008, Captulos 5 e 6.

Tambm sobre variveis aleatrias, STEVENSON, Willian J. Estatstica


Aplicada Administrao. So Paulo: Ed. Harbra, 2001, Captulos 5 e 6.

Sobre teoria estatstica da deciso: BEKMAN, Oto R.; COSTA NETO, Pedro
O. Anlise Estatstica da Deciso. So Paulo: Edgard Blcher, 1980, 4.

r
reimpresso, 2006.

Resumindo
O resumo desta Unidade est demonstrado na Figura 39:

Perodo 3 163
6
UNIDADE

Figura 39: Resumo da Unidade 6.


Fonte: elaborado pelo autor.

164 Curso de Graduao em Administrao, modalidade a distncia


Chegamos ao final de mais uma Unidade. Veremos
mais sobre os temas abordados na Unidade 7 quan-
B 6

UNIDADE
do estudarmos vrias distribuies de probabilida-
de (modelos probabilsticos) que so extremamente
teis para modelar muitas situaes prticas, auxi-
liando na tomada de decises. Esses conhecimen-
tos sero depois aplicados nas Unidades 8 e 9.

Atividades de aprendizagem
aprendizagem
1) Trs alunos esto tentando independentemente resolver um proble-
ma. A probabilidade de que o aluno A resolva o problema de 4/5,
de B resolver de 2/3 e de C resolver de 3/7. Seja X o nmero de
solues corretas apresentadas para este problema.
a) Construa a distribuio de probabilidades de X. (R.: 0,038;
0,257; 0,476; 0,228); e
b) Calcule E(X) e V(X). (R.: 1,893; 0,630).
2) Um prdio possui 3 vigias dispostos em vrios pontos de onde tm
viso do porto de entrada. Se algum no autorizado entrar, o vigia
que o v faz soar um alarme. Suponha que os vigias trabalham inde-
pendentemente entre si, e que a probabilidade de que cada um de-
les veja uma pessoa entrar 0,8. Seja X o nmero de alarmes que
soam ao entrar uma pessoa no autorizada. Encontre a distribuio
de probabilidades de X. (R.: 0,008; 0,096; 0,384; 0,512)

Perodo 3 165
6
UNIDADE

166 Curso de Graduao em Administrao, modalidade a distncia


7 6

UNIDADE
Modelos probabilsticos
UNIDADE
mais comuns

D
Objetivo
Nesta Unidade voc conhecer os modelos
probabilsticos mais importantes para variveis
aleatrias discretas e contnuas e aprender a
identificar as situaes reais em que eles podem ser
usados para o clculo de probabilidades e a
importncia disso para o administrador.

Perodo 3 167
7
UNIDADE

168 Curso de Graduao em Administrao, modalidade a distncia


Modelos Probabilsticos para Variveis
Aleatrias Discretas
7

UNIDADE
Nas Unidades 5 e 6 vimos os conceitos gerais de

B
Probabilidade e Variveis Aleatrias: podemos cons-
truir um modelo probabilstico do zero para um pro-
blema de administrao, a partir de dados histri-
cos ou experimentais.
Embora plenamente possvel, o processo de cons-
truo de um modelo probabilstico do zero pode
ser bastante longo: preciso coletar os dados (ver
Unidades 1 e 2), fazer a anlise exploratria deles
(ver Unidades 3 e 4), obter as probabilidades e
validar o modelo. Mesmo tomando todos os cuida-
dos, muitas vezes iremos reinventar a roda, e cor-
rendo o risco de ela sair quadrada...
Por que no usar os conhecimentos prvios desen-
volvidos ao longo de centenas de anos de pesqui-
sa e experimentao? Vamos procurar, dentre os
vrios modelos probabilsticos existentes aquele
mais apropriado para o fenmeno que estamos es-
tudando, que materializado atravs de variveis
aleatrias.
Atravs da anlise exploratria de dados podemos
avaliar qual modelo mais apropriado para os nos-
sos dados. Contudo, para fazer isso precisamos
conhecer tais modelos.
Nesta Unidade vamos estudar os modelos mais
usados para variveis aleatrias discretas (binomial Varivel aleatria
e Poisson), e para variveis aleatrias contnuas uma funo matemtica que
associa nmeros reais aos
(uniforme, normal, t e quiquadrado). resultados de um Espao
Amostral, por sua vez vin-
culado a um Experimento
Aqui importante avaliar com cuidado a varivel aleatria dis- Aleatrio. Fonte: Barbetta,
Reis e Bornia (2008).
creta.

Perodo 3 169
7 preciso identificar se o Espao Amostral finito ou
infinito numervel alguns modelos so apropriados para um caso
e no para o outro.
UNIDADE

B Vamos ver os dois modelos mais importantes:


binomial e Poisson

Espao Amostral finito


aquele formado por um
Modelo binomial
nmero limitado de resul-
tados possveis. Fonte:
Barbetta, Reis e Bornia Seja um Experimento Aleatrio qualquer que apresenta as se-
(2008).
guintes caractersticas:
Espao Amostral infini-
to numervel aquele
formado por um nmero in- z consiste na realizao de um nmero finito e conhecido n
finito de resultados, mas de ensaios (ou repeties);
que podem ser listados.
Fonte: Barbetta, Reis e z cada um dos ensaios tem apenas dois resultados possveis:
Bornia (2008). sucesso ou fracasso (esto entre aspas porque a defi-
nio de sucesso no quer necessariamente algo positi-
vo, e tambm porque poder incluir significar um grupo
Experimento Aleatrio de resultados); e
um processo de obteno
de um resultado ou medida z os ensaios so independentes entre si, apresentando pro-
que apresenta as seguintes babilidades de sucesso (p) e de fracasso (1-p) cons-
caractersticas: no se pode
tantes.
afirmar, antes de realizar o
experimento, qual ser o
resultado de uma realiza- Neste caso estamos interessados no nmero de sucessos ob-
o, mas possvel deter- tidos nos n ensaios: como o Espao Amostral finito (vai de 0 a n)
minar o conjunto de resul-
tados possveis; quando
uma varivel aleatria associada seria discreta. Este tipo de experi-
realizado um grande nme- mento chamado de Binomial.
ro de vezes (replicado) apre-
Ento, a varivel aleatria discreta X, nmero de sucessos
sentar uma regularidade
que permitir construir um nos n ensaios, apresenta uma distribuio (modelo) binomial com os
modelo probabilstico para seguintes parmetros:
analisar o experimento.
Fonte: adaptado pelo autor n = nmero de ensaios; e
de Lopes (1999).
p = probabilidade de sucesso.
Varivel aleatria dis-
creta o Espao Amostral
ao qual ela est associada
Com esses dois parmetros possvel calcular as probabilida-
finito ou infinito numervel. des de um determinado nmero de sucessos, bem como obter o Valor
Fonte: Barbetta, Reis e Esperado e a Varincia da varivel X:
Bornia (2008).

170 Curso de Graduao em Administrao, modalidade a distncia


E(X) = n H p V(X) = n H p H (1p)

Exemplo 1 Experimentos binomiais:


7

UNIDADE
a) Observar o nmero de caras em 3 lanamentos imparciais
de uma moeda honesta: n=3; p=0,5.
b) Observar o nmero de meninos nascidos em 3 partos de
uma famlia: n=3; p = x.
c) Observar o nmero de componentes defeituosos em uma
amostra de 10 componentes de um grande nmero de pe-
as que apresentaram anteriormente 10% de defeituosos:
n = 10; p= 0,1.

Vamos ver com maiores detalhes o caso do nmero de meni-


nos (e meninas) nascidos em uma famlia. Chamando menino de even-
to H, ser o sucesso, e menina de evento M, e sabendo pela histria
da famlia que P(H) = 0,52 e P(M) = 0,48 (ento p = 0,52 e
1p = 0,48), quais sero as probabilidades obtidas para a varivel
aleatria nmero de meninos em 3 nascimentos? Vamos obter a dis-
tribuio de probabilidades.
Resolvendo usando os conceitos gerais de probabilidade pre-
ciso primeiramente determinar o Espao Amostral, como podero ser
os sexos das 3 crianas:

= {H
H
H, H
H
M, H
M
H, M
H
H, H
M
M,
M H
M, M
M
H, M
M
M}.

Supondo que os nascimentos sejam independentes, podemos


calcular as probabilidades de cada interseco simplesmente multipli-
cando as probabilidades individuais de seus componentes:

P{HHH} = P(H) H P(H) H P(H) = p H p H p = p 3


P{HHM} = P(H) H P(H) H P(M) = p H p H (1 p) = p2 H (1 p)
P{HMH} = P(H) H P(M) H P(H) = p H (1 p) H p = p2 H (1 p)
P{MHH} = P(M) H P(H) H P(H) = (1 p) H p H p = p2 H (1 p)
P{HMM} = P(H) H P(M) H P(M) = p H (1 p) H (1 p) = p H (1 p)2
P{MHM} = P(M) H P(H) H P(M) = (1 p) H p H (1 p) = p H (1 p)2
P{MMH} = P(M) H P(M) H P(H) = (1 p) H (1 p) H p = p H (1 p)2
P{MMM} = P(M) H P(M) H P(M) = (1 p) H (1 p) H (1 p) = (1 p)3

Perodo 3 171
7 Observe que:

P{HHM} = P{HMH} = P{MHH} = p2 H(1 p) = Probabi-


UNIDADE

lidade de 2 sucessos.
P{HMM} = P{MHM} = P{MMH} = p H(1 p)2 = Proba-
bilidade de 1 sucesso.

v
Importa apenas a natureza dos sucessos, no a ordem em
que ocorrem: com a utilizao de combinaes. possvel obter o
Em qualquer livro de nmero de resultados iguais para cada nmero de sucessos. Supondo
matemtica do ensino que o nmero de ensaios n o nmero de objetos disponveis, e que
mdio possvel en- o nmero de sucessos em que estamos interessados (doravante cha-
contrar a definio e os mado k) o nmero de espaos onde colocar os objetos (um objeto
exemplos de combina- por espao), o nmero de resultados iguais ser:
es.
.

Para o caso acima, em que h 3 ensaios (n =3):

z para 2 sucessos (k =2) (o mesmo resul-

tado obtido por enumerao); e

z para 1 sucesso (k =1) (o mesmo resulta-

do obtido por enumerao).

O procedimento acima poderia ser feito para quaisquer valo-


res de n e k (desde que n k), permitindo obter uma expresso geral
para calcular a probabilidade associada a um resultado qualquer.
A probabilidade de uma varivel aleatria discreta X, nmero
de sucessos em n ensaios, com distribuio binomial de parmetros n
e p, assumir um certo valor k (0 k n) ser:

P(X = k) = Cn,k H pk H (1 p)nk onde .

importante lembrar que a probabilidade de ocorrer k suces-


sos igual probabilidade de ocorrer n k fracassos, e que todos os
axiomas e propriedades de probabilidade continuam vlidos.
Neste segundo exemplo, admitamos que a probabilidade de que
companhia no entregue seus produtos no prazo igual a 18%. Quais

172 Curso de Graduao em Administrao, modalidade a distncia


so as probabilidades de que em 3 entregas 1, 2 ou todas as 3 entre-
gas sejam feitas no prazo. Calcular tambm valor esperado, varincia
e desvio padro do nmero de entregas no prazo.
7

UNIDADE
Para cada entrega (ensaio) h apenas dois resultados: no prazo
ou no. H um nmero limitado de realizaes, n = 3. Definindo su-
cesso como no prazo, e supondo as operaes independentes, a vari-
vel aleatria X, nmero de entregas no prazo em 3 ter distribuio
binomial com parmetros

n = 3 e p = 0,82 (e 1p = 0,18).

Ento:

v
Somando todas as probabilidades o resultado igual a 1, Lembre-se que a soma
como teria que ser. O Valor Esperado, Varincia e o Desvio Padro das probabilidades de
sero: todos os eventos que
compem o Espao
E(X) = n H p = 3 H 0,82 = 2,46 entregas. Amostral igual a 1. E
V(X) n H p H (1p) = 3 H 0,82 H 0,18 = 0,4428 entregas. que 0! = 1, e que um
nmero diferente de 0
(X) = V(X) = 0,4428 = 0,665 entregas.
elevado a zero igual a
A mdia quase igual ao nmero de operaes devido alta 1.
probabilidade de sucesso.

Mas, e se o Espao Amostral fosse infinito


numervel? Teramos que usar o modelo de Poisson.
Voc conhece este modelo? Sabe como tirar pro-
veito de suas facilidades? Vamos estudar juntos
para aprender ou para relembrar!
B
Perodo 3 173
7 Modelo de Poisson
UNIDADE

Vamos supor um experimento binomial, com apenas dois re-


sultados possveis, mas com a seguinte caracterstica: apesar da pro-
babilidade p ser constante o valor de n teoricamente infinito.
Na situao acima o modelo binomial no poder ser utiliza-
do. Nestes casos deve ser utilizado o modelo de Poisson.
Como seria a soluo para o caso acima?
Como n infinito deve-se fazer a anlise das ocorrncias em
um perodo contnuo (de tempo, de espao, entre outros) subdividido
em um certo nmero de subintervalos (nmero tal que a probabilida-
de de existir mais de uma ocorrncia em uma subdiviso desprez-
vel, e supondo ainda que as ocorrncias em subdivises diferentes
so independentes); novamente preciso trabalhar com uma quanti-
dade constante que ser chamada de m tambm:

m = H t,

v
onde uma taxa de ocorrncia do evento em um perodo contnuo
Apesar do smbolo t, o (igual ou diferente do perodo sob anlise), e t justamente o perodo
perodo contnuo no contnuo sob anlise.
necessariamente um Como obter a taxa ? H duas opes: realizar um nmero
intervalo de tempo. suficiente de testes de laboratrio para obter a taxa de ocorrncia do
evento a partir dos resultados, ou observar dados histricos e calcular
a taxa.
Se uma varivel aleatria discreta X, nmero de ocorrncias
de um evento, segue a distribuio de Poisson, a probabilidade de X
assumir um valor k ser:

Onde e uma constante: e 2,71. E m =n H p ou H t.


Uma particularidade interessante da distribuio de Poisson
que o Valor Esperado e a Varincia de uma varivel aleatria que siga
tal distribuio sero iguais:

E(X) = m = H t
V(X) = m = H t

174 Curso de Graduao em Administrao, modalidade a distncia


O Modelo de Poisson muito utilizado para modelar fenme-
nos envolvendo filas: filas de banco, filas de mensagens em um servi-
dor, filas de automveis em um cruzamento.
7

UNIDADE
Vejamos neste exemplo os experimentos e fenmenos que se-
guem a distribuio de Poisson:

a) Nmero mensal de acidentes de trfego em um cruzamento.


Observe que uma varivel aleatria discreta, pode assu-
mir apenas valores inteiros (0, 1, 2, 3,...). Cada realizao
do experimento (acidente) pode ter apenas dois resulta-
dos: ocorre o acidente ou no ocorre o acidente. Mas, o
nmero mximo de realizaes desconhecido! Assim, a
distribuio binomial no pode ser usada, e a anlise do
nmero de acidentes precisa ser feita em um perodo con-
tnuo (no caso, perodo de tempo: 1 ms), exigindo o uso
da distribuio de Poisson.
b) Nmero de itens defeituosos produzidos por hora em uma
indstria.
Novamente, uma varivel aleatria discreta (valores intei-
ros: 0,1, 2, 3, ...), cada realizao s pode ter dois resulta-
dos possveis (pea sem defeito ou pea defeituosa). Se o
nmero mximo de realizaes for conhecido, provavelmen-
te a probabilidade de uma pea ser defeituosa ser reduzi-
da e apesar de ser possvel a utilizao da distribuio
binomial o uso da distribuio de Poisson obter resulta-
dos muitos prximos. Se o nmero mximo de realizaes
for desconhecido a distribuio binomial no pode ser usa-
da, e a anlise do nmero de acidentes precisa ser feita em
um perodo contnuo (no caso, perodo de tempo: 1 hora),
exigindo o uso da distribuio de Poisson.
c) Desintegrao dos ncleos de substncias radioativas: con-
tagem do nmero de pulsaes radioativas a intervalos de
tempo fixos.
Situao semelhante a dos acidentes em um cruzamento,
s que o grau de aleatoriedade deste experimento mui-
to maior. O nmero mximo de pulsaes tambm des-
conhecido, obrigando a realizar a anlise em um perodo
contnuo, utilizando a distribuio de Poisson.

Perodo 3 175
7 Neste exemplo uma telefonista recebe cerca de 0,20 chamadas
por minuto (valor obtido de medies anteriores).
UNIDADE

a) Qual a probabilidade de receber exatamente 5 chama-


das nos primeiros 10 minutos?
b) Qual a probabilidade de receber at 2 chamadas nos
primeiros 12 minutos?
c) Qual o desvio padro do nmero de chamadas em meia
hora?

H interesse no nmero de chamadas ocorridas em um pero-


do contnuo (de tempo no caso). Para cada ensaio h apenas dois
resultados possveis: a chamada ocorre ou no. Observe que no h
um limite para o nmero de chamadas no perodo (sabe-se apenas
que o nmero mnimo pode ser 0): por esse motivo a utilizao da
binomial invivel... Contudo h uma taxa de ocorrncia ( = 0,20
chamadas/minuto) e isso permite utilizar a distribuio de Poisson.

a) Neste caso o perodo t ser igual a 10 minutos (t = 10 min.),


P(X = 5)?
m = H t = 0,20 H 10 = 2 chamadas

Ento a probabilidade de que a telefonista receba exata-


mente 5 chamadas em 10 minutos igual a 0,0361 (3,61%).
b) Neste caso o perodo t ser igual a 12 minutos (t = 12 min.). O
evento de interesse at 2 chamadas em 12 minutos (X 2).
m = H t = 0,20 H 12 = 2,4 chamadas
P(X 2) = P(X = 0) + P(X = 1) + P(X = 2)

P(X 2) = P(X = 0) + P(X = 1) + P(X = 2) =


0,0907 + 0,2177 + 0,2613 = 0,5697

176 Curso de Graduao em Administrao, modalidade a distncia


Ento a probabilidade de que a telefonista receba at 2
chamadas em 12 minutos igual a 0,5697 (56,97%).
c) Neste caso o perodo t ser igual a 30 minutos (t = 30
7

UNIDADE
minutos). Primeiro calcula-se a varincia:
V(X) = m = H t = 0,2 H 30 = 6 chamadas
O Desvio Padro a raiz quadrada positiva da varincia:
(X) = V(X) = 6 2,45 entregas.

H vrios outros modelos para variveis aleatrias discretas:


hipergeomtrico, geomtrico, binomial negativo.

Na prxima seo vamos ver os principais modelos


variveis aleatrias contnuas. B
Modelos para Variveis Aleatrias Contnuas

Nesta seo estudaremos os modelos uniforme,


normal, t e qui-quadrado. B
Modelo uniforme

Quando o Espao Amostral associado a um Experimento Alea-


trio infinito torna-se necessrio o uso de uma Varivel Aleatria
Contnua para associar nmeros reais aos resultados. Os modelos
probabilsticos vistos anteriormente no podem ser empregados: a
probabilidade de que uma varivel aleatria contnua assuma exata-
mente um determinado valor zero.

Para entender melhor a declarao acima, vamos

B
relembrar a definio clssica de probabilidade: a
probabilidade de ocorrncia de um evento ser
igual ao quociente entre o nmero de resultados

Perodo 3 177
7
B associados ao evento pelo nmero total de resulta-
dos possveis. Ora, se o nmero total de resultados
UNIDADE

infinito, ou tende ao infinito para ser mais exato,


a probabilidade de ocorrncia de um valor espec-
fico igual a zero. Por esse motivo, quando se lida
com Variveis Aleatrias Contnuas calcula-se a
probabilidade de ocorrncia de eventos formados
por intervalos de valores, atravs de uma funo
densidade de probabilidades (ver Unidade 6). Uma
outra consequncia disso que os smbolos > e
(< e tambm) so equivalentes para variveis
aleatrias contnuas.

O modelo mais simples para variveis aleatrias contnuas o


modelo uniforme.
Seja uma varivel aleatria contnua qualquer X que possa
assumir valores entre A e B. Todos os valores entre A e B tm a mesma
probabilidade de ocorrer, resultando no grfico apresentado na Figu-
ra 40:

Figura 40: Modelo uniforme.


Fonte: elaborada pelo autor.

Para que a rea entre a e b seja igual a 1 o valor da ordenada


precisa ser igual a 1/(b a), constante, portanto, para todo o interva-
lo. A rea escura representa a probabilidade da varivel X assumir
valores no intervalo c d. Trata-se do modelo uniforme.
Dois intervalos de valores da varivel aleatria contnua, que
tenham o mesmo tamanho, tm a mesma probabilidade de ocorrer
(desde que dentro da faixa de valores para os quais a funo de den-

178 Curso de Graduao em Administrao, modalidade a distncia


sidade de probabilidades no nula). Formalmente, uma varivel ale-
atria contnua X tem distribuio uniforme, com parmetros a e b
reais (sendo a menor do que b), se sua funo densidade de probabi-
7

UNIDADE
lidades for tal como a da Figuras 49.
A probabilidade de que a varivel assuma valores entre c e d
(sendo a < c < d < b), a rea compreendida entre c e d:

Seu valor esperado e varincia so:

Intuitivamente podemos supor que muitas variveis aleatrias


contnuas tero um comportamento diferente do caso acima: em algu-
mas delas haver maior probabilidade de ocorrncias de valores pr-
ximos ao limite inferior ou superior: para cada caso dever ser ajusta-

v
do um modelo probabilstico contnuo adequado.
O modelo uniforme bastante usado para gerar nmeros No ambiente virtual te-
pseudo-aleatrios em processos de amostragem probabilstica. mos um exemplo resol-
vido de modelo unifor-

B
me, adaptado de
Agora vamos passar ao modelo mais importante BUSSAB, Wilton O.;
para variveis aleatrias contnuas. MORETTIN, Pedro A.
Estatstica Bsica.
5. ed. So Paulo: Sarai-
va, 2003.
Modelo normal

H casos em que h maior probabilidade de ocorrncia de


valores situados em intervalos centrais da funo densidade de pro-
babilidades da varivel aleatria contnua, e essa probabilidade dimi-
nui, medida que os valores se afastam deste centro (para valores

v
menores ou maiores) o modelo probabilstico contnuo mais adequa-
do seja o modelo Normal ou gaussiano. O matemtico alemo
Isso especialmente encontrado em variveis biomtricas, re- Gauss utilizou ampla-
sultantes de medidas corpreas em seres vivos. mente este modelo no
tratamento de erros ex-
O Modelo Normal extremamente adequado para medidas
perimentais, embora
numricas em geral, descrevendo vrios fenmenos, e permitindo fa-
no tenha sido o seu
zer aproximaes de modelos discretos. extremamente importante
descobridor.

Perodo 3 179
7 tambm para a Estatstica Indutiva (mais detalhes na prxima Unida-
de). O grfico da distribuio de probabilidades de uma varivel ale-
atria contnua que siga o modelo Normal (distribuio Normal) ser
UNIDADE

como a Figura 41:

Figura 41: Distribuio normal.


Fonte: elaborada pelo autor.

Caractersticas:
A curva apresenta forma de sino, h maior probabilidade da
varivel assumir valores prximos do centro.
Os valores de mdia () e de mediana (Md) so iguais, signifi-
cando que a curva simtrica em relao mdia.
Teoricamente a curva prolonga-se de 4 a +4 (menos infinito
a mais infinito), ento a rea total sob a curva igual a 1 (100%).

v
Qualquer distribuio normal perfeitamente especificada por
comum a utilizao seus parmetros mdia ( ) e varincia (
) X: N (
, ) significa
de letras do alfabeto que a varivel X tem distribuio normal com mdia e varincia .
grego para representar A rea escura na Figura 41 a probabilidade de uma varivel
algumas medidas. No que siga a distribuio normal assumir valores entre a e b: esta rea
se esquea que o des- calculada atravs da integral da funo normal de a a b.
vio padro () a raiz Cada combinao ( , ) resulta em uma distribuio Normal
quadrada positiva da diferente, portanto h uma famlia infinita de distribuies.
varincia.
A funo normal citada acima tem a seguinte (e aterradora...)
frmula para sua funo densidade de probabilidade:

180 Curso de Graduao em Administrao, modalidade a distncia


Saiba que no existe soluo analtica para uma integral da
expresso acima: qualquer integral precisa ser resolvida usando m-
todos numricos de integrao, que so extremamente trabalhosos
7

UNIDADE
quando implementados manualmente (somente viveis se usarem
meios computacionais). De Moivre, Laplace e Gauss desenvolveram Gauss, e to-
seus trabalhos entre a metade do Sculo XVIII e incio do Sculo XIX, das as outras
e os computadores comearam a se popularizar a partir da dcada de pessoas que
60, do Sculo XX. usavam a dis-
Porm todas as distribuies normais apresentam algumas ca- tribuio Nor-
mal para calcular proba-
ractersticas em comum, independentemente de seus valores de mdia
bilidades at recente-
e de varincia:
mente, resolviam as in-
z 68% dos dados esto situados entre a mdia menos um tegrais usando mtodos
) e a mdia mais um desvio padro
desvio padro ( numricos manualmente.
+ );
(
z 95,5% dos dados esto situados entre a mdia menos dois
2
desvios padres ( ) e a mdia mais dois desvios pa-
+ 2
dres ( );
z 99,7% dos dados esto situados entre a mdia menos trs
3
desvios padres ( ) e a mdia mais trs desvios pa-
+ 3
dres ( ).

Figura 42: Percentuais de dados e nmero de desvios padres.


Fonte: elaborada pelo autor.

Por causa dessas caractersticas algum teve a ideia de criar


um modelo normal padro: uma varivel Z com distribuio normal
de mdia igual a zero e desvio padro igual a 1 [Z: N(0, 1)]. As proba-
bilidades foram calculadas para essa distribuio padro e registradas

Perodo 3 181
7 em uma tabela. Atravs de uma transformao de variveis chamada
padronizao possvel converter os valores de qualquer distribuio
Normal em valores da distribuio Normal padro e assim obter suas
UNIDADE

probabilidades calcular o nmero de desvios padres, a contar da


mdia a que est um valor da varivel, atravs da seguinte expresso:

Z nmero de desvios padres a partir da mdia;


x valor de interesse;
mdia da distribuio normal de interesse; e
desvio padro da distribuio normal.

Z um valor relativo: ser negativo para valores de x menores


do que a mdia e positivo para valores de x maiores do que a mdia.
Pela transformao uma distribuio Normal qualquer X: N ( , )
passa a ser equivalente distribuio Normal padro Z: N(0,1), um
valor de interesse x pode ser convertido em um valor z.
As probabilidades de uma varivel com distribuio normal
podem ser representadas por reas sob a curva da distribuio nor-
mal padro. No ambiente virtual, apresentamos a Tabela, que relacio-
na valores positivos de z, com reas sob a cauda superior da curva.
Os valores de z so apresentados com duas decimais. A primeira de-
cimal fica na coluna da esquerda e a segunda decimal na linha do
topo da tabela. A Figura 43 mostra como podemos usar essa Tabela
para encontrar, por exemplo, a rea sob a cauda superior da curva,
alm de z = 0,21.

Figura 43: Ilustrao do uso da tabela da distribuio normal padro (Tabela


III do apndice) para encontrar a rea na cauda superior relativa ao valor de
z = 0,21.
Fonte: Barbetta, Reis, Bornia (2008).

182 Curso de Graduao em Administrao, modalidade a distncia


No exemplo a seguir, suponha uma varivel aleatria X com
mdia 50 e desvio padro 10. H interesse em calcular a probabilida-
de do evento X > 55.
7

UNIDADE
Primeiro, calculamos o valor de Z correspondente a 55. Z = (55
50)/ 10 = + 0,5.
Pelas Figuras 44 e 45 podemos ver a correspondncia entre as
duas distribuies:

Figura 44: Distribuio Normal N(50,102).


Fonte: elaborada pelo autor.

Figura 45: Distribuio normal padro.


Fonte: elaboradas pelo autor.

O evento P (X>55) equivalente ao evento P (Z> 0,5). Este


valor pode ser obtido na tabela da distribuio normal padro (ver
ambiente virtual). Os valores de Z so apresentados com dois deci-
mais: o primeiro na coluna da extrema esquerda e o segundo na linha
do topo da tabela. Observe pelas Figuras que esto no alto da tabela
que as probabilidades so para eventos do tipo do da Figuras acima
[P(Z> z1)]. Assim, poderamos procurar a probabilidade do evento (Z
> 0,5): fazendo o cruzamento do valor 0,5 (na coluna) com o valor

Perodo 3 183
7 0,00 (na linha do topo) encontramos o valor 0,3085 (30,85%). Por-
tanto, P(X>55) igual a 0,3085. Observe a coerncia entre o valor
encontrado e as reas na Figuras: a rea menor do que a metade da
UNIDADE

Figuras (metade da Figuras significaria 50%), e a probabilidade en-


contrada vale 30,85%.
Neste exemplo, supondo a mesma varivel aleatria X com
mdia 50 e desvio padro 10. Agora h interesse em calcular a proba-
bilidade de que X seja menor do que 40.
Primeiro precisamos calcular o valor de Z correspondente a 40.
Z = (40 50)/ 10 = 1,00.
Pelas Figuras 46 e 47 podemos ver a correspondncia entre as
duas distribuies:

Figura 46: Distribuio Normal N(50,102).


Fonte: elaborada pelo autor.

Figura 47: Distribuio normal padro.


Fonte: elaborada pelo autor.

O evento P (X<40) equivalente ao evento P (Z < 1,00).


Repare, porm, que queremos encontrar P (Z < 1,00), e a tabela nos

184 Curso de Graduao em Administrao, modalidade a distncia


apresenta valores apenas para P (Z > 1,00). Contudo, se rebatermos
a Figura da distribuio normal para a direita teremos o seguinte re-
sultado (Figura 48):
7

UNIDADE
Figura 48: Distribuio normal padro.
Fonte: elaborada pelo autor.

Ou seja, a rea P(Z < 1) = P(Z > 1). Essa probabilidade ns


podemos encontrar diretamente pela tabela, fazendo o cruzamento do
valor 1,0 (na coluna) com o valor 0,00 (na linha do topo) encontra-
mos o valor 0,1587 (15,87%). Portanto,

P(X<40) = P(Z<1) = P(Z>1), que igual a 0,1587.

No exemplo anterior, supondo a mesma varivel aleatria X


com mdia 50 e desvio padro 10. Agora h interesse em calcular a
probabilidade de que X seja maior do que 35.
Primeiro precisamos calcular o valor de Z correspondente a 35.
Z = (35 - 50)/ 10 = 1,50.
Pelas Figuras 49 e 50 podemos ver a correspondncia entre as
duas distribuies:

Figura 49: Distribuio Normal N(50,102).


Fonte: elaborada pelo autor.

Perodo 3 185
7
UNIDADE

Figura 50: Distribuio normal padro.


Fonte: elaborada pelo autor.

No podemos obter a probabilidade P(Z>1,50) diretamente,


pois a tabela do Ambiente Virtual apresenta apenas resultados para
valores positivos de Z. Sabemos que a probabilidade total vale 1,0,
podemos ento considerar que P(Z > 1,50) = 1 P(Z < 1,50).
Usando o raciocnio descrito no Exemplo 8 (rebatendo as Figurass
para a direita), vamos obter: P(Z<1,50) = P(Z>1,50). Esta ltima
probabilidade pode ser facilmente encontrada na tabela da distribui-
o normal padro: P(Z>1,50) = P(Z<1,50) = 0,0668. Basta subs-
tituir na expresso: P(Z > 1,50) = 1 P(Z < 1,50) = 1 0,0668 =
0,9332 (93,32%). Observe novamente a coerncia entre as reas da
Figuras acima e o valor da probabilidade: a rea na Figuras compre-
ende mais do que 50% da probabilidade total, aproximando-se do
extremo inferior da distribuio, perto de 100%, e a probabilidade
encontrada realmente prxima de 100%.
No exemplo a seguir, supondo a mesma varivel aleatria X
com mdia 50 e desvio padro 10. Agora h interesse em calcular a
probabilidade de que X assuma valores entre 48 e 56.
Calcular P (48 < X < 56), veja a Figura 51:

Figura 51: Distribuio normal N(50, 102).


Fonte: elaborada pelo autor.

186 Curso de Graduao em Administrao, modalidade a distncia


Novamente precisamos calcular os valores de Z corresponden-
tes a 48 e a 56. 7

UNIDADE
Z1 = (48 50)/ 10 = 0,20 Z2 = (56 50)/ 10 = 0,60

Ento: P (48 < X < 56) = P (0,20<Z<0,60)


Repare que a rea entre 48 e 56 igual rea de 48 at +
MENOS a rea de 56 at +4:

P(48 < X < 56) = P(X > 48) P(X > 56)= P(-0,20< Z <0,60) =
P(Z > 0,20) P(Z > 0,60)

E os valores acima podem ser obtidos na tabela da distribuio


normal padro:

P(Z > 0,60) = 0,2743


P(Z > 0,20) = 1 P(Z > 0,20) = 1 0,4207 = 0,5793
P(48 < X < 56)= P(-0,20< Z <0,60) = P(Z > 0,20) P(Z > 0,60)
= 0,5793 0,2743 = 0,3050

Ento a probabilidade da varivel X assumir valores entre 48 e


56 igual a 0,305 (30,5%).
A distribuio Normal tambm pode ser utilizada para encon-
trar valores da varivel de interesse correspondentes a uma probabili-
dade fixada.
No exemplo a seguir, supondo a mesma varivel aleatria X
com mdia 50 e desvio padro 10. Encontre os valores de X, situados
mesma distncia abaixo e acima da mdia, que contm 95% dos
valores da varivel.
Como a distribuio Normal simtrica em relao mdia, e
como neste problema os valores de interesse esto situados mesma
distncia da mdia sobram 5% dos valores, 2,5% na cauda inferior
e 2,5% na superior, como na Figura 52:

Figura 52: Distribuio normal N(50, 102).


Fonte: elaborada pelo autor.

Perodo 3 187
7 preciso encontrar os valores de Z (na tabela da distribuio
Normal padro) correspondentes s probabilidades da Figuras aci-
ma, e a partir da obter os valores de x1 e x2. Passando para a distri-
UNIDADE

buio Normal padro x1 corresponder a um valor z1, e x 2 a um


valor z1, como na Figura 53:

Figura 53: Distribuio normal padro.


Fonte: elaborada pelo autor.

Repare que a mdia da distribuio Normal padro igual a


zero, fazendo com que z1 e z2 sejam iguais em mdulo. Podemos en-
contrar z2, j que P(Z > z 2) = 0,025.
necessrio encontrar o valor da probabilidade na tabela da
distribuio Normal padro (ou o valor mais prximo) e obter o valor
de Z associado.
Para o caso de z2, ao procurar pela probabilidade 0,025 en-
contramos o valor exato 0,025, e por conseguinte o valor de z2 que
igual a 1,96: P (Z > 1,96) = 0,025.
Como z1 = z2, encontramos facilmente o valor de z1: z1 = 1,96.
P (Z < 1,96) = 0,025.
Obser ve que os valores so iguais em mdulo, mas
correspondero a valores diferentes da varivel X. A expresso usada
para obter o valor de Z, em funo do valor da varivel X, pode ser
usada para o inverso:

v
.

muito importante E assim obteremos os valores de x1 e x2, Observe se o resultado


que se preste ateno obtido faz sentido que correspondem a z1 e z2, respectivamente:
no sinal do valor de z
ao obter o valor de x . x1 = + (z1x = 50 + [(1,96) x 10] = 30,4

188 Curso de Graduao em Administrao, modalidade a distncia


x2 = + (z2x = 50 + (1,96 x 10) = 69,6

Observe que os resultados obtidos so coerentes: 30,4 est


7

UNIDADE
abaixo da mdia (1,96 desvios padres) e 69,6 acima (tambm 1,96
desvios padres). O intervalo definido por esses dois valores compre-
ende 95% dos resultados da varivel X.
Todo esse trabalho poderia ter sido poupado se houvesse um
programa computacional que fizesse esses clculos. H vrios softwares
disponveis no mercado, alguns deles de domnio pblico, que calcu-
lam as probabilidades associadas a determinados eventos, como tam-
bm os valores associados a determinadas probabilidades. Modelo binomial mo-
Uma das caractersticas mais importantes do modelo normal delo probabilstico para va-
riveis aleatrias discretas
a sua capacidade de aproximar outros modelos, permitindo muitas
que descreve o nmero de
vezes simplificar os clculos de probabilidade. Na prxima seo va- sucessos em n experimen-
mos ver como o modelo normal pode ser usado para aproximar o tos independentes (sendo n
finito e conhecido), sendo
binomial.
que os experimentos podem
ter apenas dois resultados
possveis, e a probabilida-
Modelo normal como aproximao do de de sucesso permanece

binomial constante durante os n ex-


perimentos. Fonte:
Barbetta, Reis e Bornia
O modelo Binomial (discreto) pode ser aproximado pelo mo- (2008); Lopes (1999).
delo Normal (contnuo) se certas condies forem satisfeitas:

v
z quando o valor de n (nmero de ensaios) for tal que os
clculos binomiais trabalhosos demais.
Para os que pensam que
z quando o produto n p (o valor esperado do modelo o advento dos computa-
Binomial) e o produto n (1 p) forem ambos maiores dores eliminou este pro-
ou iguais a 5. blema um alerta: em al-
guns casos os nmeros
Se isso ocorrer, uma binomial, de parmetros n e p, pode ser envolvidos so to gran-
aproximada por uma normal com: des que sobrepujam
suas capacidades.
z mdia = = n p (valor esperado do modelo
Binomial); e
z varincia = 2 = n p (1 p) (varincia do mo-
delo Binomial).

Usando o modelo Normal (contnuo) para aproximar o Binomial


(discreto) necessrio fazer uma correo de continuidade: associar
um intervalo ao valor discreto, para que o valor da probabilidade cal-
culada pelo modelo contnuo seja mensurvel. Esse intervalo deve ser

Perodo 3 189
7 centrado no valor discreto, e deve ter uma amplitude igual diferena
entre dois valores consecutivos da varivel discreta: se por exemplo a
diferena for igual a 1 (a varivel somente pode assumir valores intei-
UNIDADE

ros) o intervalo deve ter amplitude igual a 1, 0,5 abaixo do valor e 0,5
acima. Esta correo de continuidade precisa ser feita para
garantir a coerncia da aproximao.
Seja uma varivel aleatria X com distribuio Binomial.

1) H interesse em calcular a probabilidade de X assumir um


valor k genrico, P(X = k), ao fazer a aproximao pela
Normal ser: P(k 0,5 < X < k + 0,5).

Figura 54: Correo de continuidade da aproximao do modelo Binomial


pelo Normal 1 caso.
Fonte: elaborada pelo autor.

2) H interesse em calcular a probabilidade de X assumir va-


lores menores ou iguais a um valor k genrico, P(X k), ao
fazer a aproximao pela Normal ser: P(X < k + 0,5),
todo o intervalo referente a k ser includo.

Figura 55: Correo de continuidade da aproximao do modelo Binomial


pelo Normal 2 caso.
Fonte: elaborada pelo autor.

3) H interesse em calcular a probabilidade de X assumir va-


lores maiores ou iguais a um valor k genrico, P(X k), ao
fazer a aproximao pela Normal ser: P(X > k 0,5),
todo o intervalo referente a k ser includo.

190 Curso de Graduao em Administrao, modalidade a distncia


7

UNIDADE
Figura 56: Correo de continuidade da aproximao do modelo Binomial
pelo Normal 3 caso.
Fonte: elaborada pelo autor.

4) H interesse em calcular a probabilidade de X assumir va-


lores menores do que um valor k genrico, P(X < k), ao
fazer a aproximao pela Normal ser: P(X < k 0,5),
todo o intervalo referente a k ser excludo.

Figura 57: Correo de continuidade da aproximao do modelo Binomial


pelo Normal 4 caso.
Fonte: elaborada pelo autor.

5) H interesse em calcular a probabilidade de X assumir va-


lores maiores do que um valor k genrico, P(X > k), ao
fazer a aproximao pela Normal ser: P(X > k + 0,5),
todo o intervalo referente a k ser excludo.

Figura 58: Correo de continuidade da aproximao do modelo Binomial


pelo Normal 5 caso.
Fonte: elaborada pelo autor.

Um municpio tem 40.000 eleitores. Para uma pesquisa de opi-


nio eleitoral uma amostra aleatria de 1.500 pessoas foi seleciona-
da. Vamos ver nesse dcimo segundo exemplo, qual a probabilidade
de que pelo menos 500 dos eleitores sejam menores de 25 anos se
35% dos 40.000 so menores do que 25 anos?

Perodo 3 191
7 Esse problema poderia ser resolvido usando o modelo Binomial.
H apenas dois resultados possveis para cada eleitor: menor de 25
anos (sucesso) e maior ou igual a 25 anos (fracasso). Existe um
UNIDADE

limite superior de realizaes, no caso os 1500 eleitores da amostra, e


h independncia entre as retiradas, pois a amostra foi retirada de
forma aleatria (e a amostra representa menos de 5% dos 40000 elei-
tores).
Ento: sucesso = menor de 25 anos
p = 0,35 1 p = 0,65 n = 1500
A varivel aleatria discreta X, nmero de eleitores menores de
25 anos em 1500, ter distribuio binomial com parmetros n = 1500
e p = 0,35.
O evento pelo menos 500 menores de 25 anos seria definido
como 500 ou mais eleitores:

P (X 500) = P(X = 500) + P(X = 501) + .....+ P(X = 1500)

H cerca de 1000 expresses binomiais.


Vamos ver se possvel aproximar pelo modelo Normal.
O valor de n grande: n p = 1500 0,35 = 525 > 5 e
n (1 p) = 1500 0,65 = 975 > 5.
Como as condies foram satisfeitas possvel aproximar por
um modelo Normal:
mdia = = n p = 1500 x 0,35 = 525.
desvio padro = =
Pelo modelo Binomial: P (X 500). Pelo modelo Normal ser:
P (X 499,5).
P(X 499,5) = P(Z > z1) z1 = (499,5 525)/18,47 = 1,38
P(Z > 1,38) = 1 P(Z >1,38)
Procurando na tabela da distribuio Normal padro: P (Z > 1,38)
= 0,0838.
Ento: P (X 500) P(X 499,5) = P (Z > 1,38) = 1
P(Z >1,38) = 1 0,0838 = 0,9162.
A probabilidade de que pelo menos 500 dos eleitores da amos-
tra sejam menores de 25 anos igual a 0,9162 (91,62%).

192 Curso de Graduao em Administrao, modalidade a distncia


Nas prximas duas sees vamos ver modelos

B
probabilsticos derivados do modelo normal, usados
predominantemente em processos de inferncia es-
7

UNIDADE
tatstica. Vamos introduzi-los agora para facilitar nos-
so trabalho quando chegarmos s Unidades 9 e 10.

Modelo (distribuio) t de Student

Havia um matemtico ingls, William Gosset, que trabalhava


para a cervejaria Guiness, em Dublin, Irlanda, no incio do Sculo
XX. Ele atuava no controle da qualidade do cultivo de ingredientes
para a fabricao de cerveja.
Nesta poca alguns estatsticos usavam a distribuio normal
no estabelecimento de intervalos de confiana para a mdia a partir
de pequenas amostras (veremos isso na Unidade 8). Eles calculavam
mdia aritmtica simples e varincia da amostra e generalizavam os
resultados atravs do modelo normal, como fizemos no Exemplo 11.
Gosset descobriu que o modelo normal no funcionava direito
para pequenas amostras, e desenvolveu um novo modelo probabilstico,
derivado do normal, introduzindo uma correo para levar em conta
justamente o tamanho de amostra. Ele aplicou suas descobertas em
seu trabalho, e quis public-las, mas a Guiness apenas permitiu aps
ele adotar o pseudnimo Student. Por isso, o seu modelo conheci-
do como t de Student para n 1 graus de liberdade.
O valor n 1 (tamanho da amostra menos 1) chamado de Esta a correo propri-
nmero de graus de liberdade da estatstica. Quando a varincia amente dita, pois ao
amostral calculada supe-se que a mdia j seja conhecida, assim usar pequenas amostras
apenas um determinado nmero de elementos da amostra poder ter o risco de que a
varincia amostral da
seus valores variando livremente, este nmero ser igual a n 1, por-
varivel seja diferente da
que um dos valores no poder variar livremente, pois ter que ter um
varincia populacional
valor tal que a mdia permanea a mesma calculada anteriormente.

v
maior, podendo levar a
Assim, a estatstica ter n 1 graus de liberdade.
intervalos de confiana
Trata-se de uma distribuio de probabilidades que apresenta que no correspondem
mdia igual a zero (como a normal padro), simtrica em relao realidade. A no utiliza-
mdia, mas apresenta uma varincia igual a n/(n 2), ou seja, seus o desta correo foi a
valores dependem do tamanho da amostra, apresentando maior fonte de muitos erros no
varincia para menores valores de amostra. Quanto maior o tamanho passado, e, infelizmen-
te, de ainda alguns er-
ros no presente.

Perodo 3 193
v
7 Para tama-
nhos de
da amostra mais a varincia de t aproxima-se de 1,00 (varincia da
normal padro). A distribuio t de Student est na Figura 59 para
vrios graus de liberdade:
UNIDADE

amostra
maiores do
que 30,
supe-se
que a
varincia
de t igual a 1: por
isso a aproximao do
item b.1.

Figura 59: Distribuio t de Student para vrios graus de liberdade.


Fonte: Barbeta, Reis, Bornia (2008).

Observe que tal como a distribuio normal padro a distribui-


o t de Student simtrica em relao mdia (que igual a zero).
A tabela da distribuio t de Student encontra-se no ambiente
virtual, para vrios graus de liberdade e valores de probabilidade.
Vamos ver um exemplo.
Neste dcimo terceiro exemplo imagine a situao do Exemplo
12, obter os valores de t simtricos em relao mdia que contm
95% dos dados, supondo uma amostra de 10 elementos.
Temos que encontrar os valores t1 e t2, simtricos em relao
mdia que definem o intervalo que contm 95% dos dados. Como
supomos uma amostra de 10 elementos a distribuio t de Student
ter 10 1 = 9 graus de liberdade. Repare que a mdia da distribui-
o t de Student igual a zero, fazendo com que t1 e t2 sejam iguais
em mdulo. Podemos encontrar t2, j que P(t > t2) = 0,025. Veja a
Figura 60:

Figura 60: Uso da tabela da distribuio t de Student. Ilustrao com gl = 9


e rea na cauda superior de 2,5%.
Fonte: Barbeta, Reis, Bornia (2008).

194 Curso de Graduao em Administrao, modalidade a distncia


Vamos utilizar bastante a distribuio t de Student nas Unida-
des 9 e 10. 7

UNIDADE
Modelo quiquadrado

Trata-se de mais um modelo derivado da distribuio normal,


embora no vamos discutir como se d essa derivao aqui.
Na Unidade 3 estudamos como descrever os relacionamentos
entre duas variveis qualitativas, geralmente expresso atravs de uma
tabela de contingncias. No Exemplo 5 da Unidade 3 analisamos o
relacionamento entre modelo e opinio geral sobre os veculos da
Toyord. Havamos concludo que havia relacionamento, pois os mo-
delos mais baratos apresentavam maiores percentuais de insatisfeitos
do que os mais caros.

Na Unidade 10 vamos aprender a calcular uma

das de cada cruzamento entre os valores de duas B


estatstica que relacionar as frequncias observa-

variveis qualitativas, expressas em uma tabela de


contingncias, com as freqncias esperadas des-
ses mesmos cruzamentos, se as duas variveis no
tivessem qualquer relacionamento entre si. Essa
estatstica chamada de quiquadrado, 2, e caso
a hiptese de que as variveis no se relacionem
ela seguir o modelo quiquadrado com um certo
nmero de graus de liberdade.

O nmero de graus de liberdade depender das condies da


tabela: para o caso que ser visto na Unidade 10 ser o produto do
nmero de linhas da tabela 1 pelo nmero de colunas da tabela 1.
uma distribuio assimtrica, sempre positiva, que tem valores dife-
rentes dependendo do seu nmero de graus de liberdade. Sua mdia
igual ao nmero de graus de liberdade, e a varincia igual a duas
vezes o nmero de graus de liberdade.

Perodo 3 195
7
UNIDADE

Figura 61: Modelo quiquadrado com 2, 5, 10, 20 e 30 graus de liberdade.


Fonte: adaptada pelo autor de Stagraphics.

A Figura 61 mostra as curvas do modelo (distribuio)


quiquadrado para 2, 5, 10, 20 e 30 graus de liberdade. Observe como
variam de forma dependendo do nmero de graus de liberdade da
estatstica.
A tabela da distribuio quiquadrado encontra-se no Ambien-
te Virtual de Ensino-Aprendizagem, para vrios graus de liberdade e
valores de probabilidade. Vamos ver um exemplo.
Neste dcimo quarto exemplo imagine que queremos encon-
trar o valor da estatstica quiquadrado, para 3 graus de liberdade,
deixando uma rea na cauda superior de 5%.
O valor da estatstica quiquadrado que define uma rea na
cauda superior de 5% pode ser encontrado atravs da Tabela, cruzan-
do a linha de 3 graus de liberdade com a coluna de rea na cauda
superior igual a 0,05. Veja a Figura a seguir:

196 Curso de Graduao em Administrao, modalidade a distncia


7

UNIDADE
Figura 62: Uso da tabela da distribuio quiquadrado. Ilustrao com gl = 3
e rea na cauda superior de 5%.
Fonte: adaptado pelo autor de Barbeta, Reis, Bornia (2008).

Com este tpico terminamos a Unidade 7. Na Uni-


dade 8 voc ver o importante conceito de distri-
buio amostral, que indispensvel para o pro-
cesso de generalizao (inferncia) estatstica que
ser estudado nas Unidades 9 e 10.
B
Saiba mais...
Sobre modelos probabilsticos para variveis aleatrias discretas:
BARBETTA, Pedro A. Estatstica Aplicada s Cincias Sociais. 7. ed.
Florianpolis: Ed. da UFSC, 2007, Captulo 7; BARBETTA, Pedro A. REIS,
Marcelo M., BORNIA, Antonio C. Estatstica para Cursos de Engenharia e
Informtica. 2 ed. So Paulo: Atlas, 2008, captulo 5; STEVENSON,
Willian J. Estatstica Aplicada Administrao. So Paulo: Harbra, 2001,
Captulo 4.

Sobre modelos probabilsticos para variveis aleatrias contnuas:


BARBETTA, Pedro A. Estatstica Aplicada s Cincias Sociais. 7. ed.
Florianpolis: Ed. da UFSC, 2007, Captulo 8; BARBETTA, Pedro A.; REIS,
Marcelo M.; BORNIA, Antonio C. Estatstica para Cursos de Engenharia e
Informtica. 2. Ed. So Paulo: Atlas, 2008, Captulo 6; STEVENSON,
Willian J. Estatstica Aplicada Administrao. So Paulo: Harbra, 2001,
Captulo 5.

Sobre a utilizao do Microsoft Excel para clculo de probabilidades para


os principais modelos probabilsticos veja: LEVINE, David M.; STEPHAN,
David; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatstica: Teoria e
Aplicaes - Usando Microsoft Excel em Portugus. 5. ed. Rio de Janeiro:
LTC, 200, Captulos 4 e 5.

Perodo 3 197
7 Resumindo
r
UNIDADE

O resumo desta Unidade est mostrado na Figura 63:

Figura 63: Resumo da Unidade 7.


Fonte: elaborado pelo autor.

198 Curso de Graduao em Administrao, modalidade a distncia


Caro estudante,
Chegamos ao final da Unidade 7 do nosso livro.
B 7

UNIDADE
Nela estudamos os modelos probabilsticos mais
comuns. Essa Unidade foi repleta de Figuras, Qua-
dros, representaes e exemplos de utilizao das
tcnicas e das diferentes formas de utilizao des-
tes modelos. Releia, caso necessrio, todos os
exemplos, leia as indicaes do Saiba mais e dis-
cuta com seus colegas. Responda atividade de
aprendizagem e visite o Ambiente Virtual de Ensi-
no-Aprendizagem. Conte sempre com o acompa-
nhamento da tutoria e das explicaes do profes-
sor. timos estudos!

Atividades de aprendizagem
aprendizagem
1) Em um determinado processo de fabricao 10% das peas so de-
feituosas. As peas so acondicionadas em caixas com 5 unidades
cada uma. As caixas s sero aceitas se apresentarem no mximo
uma pea defeituosa. Pergunta-se:
a) Qual o modelo terico mais adequado para este caso? Por qu?
b) Qual a probabilidade de haver exatamente 3 peas defei-
tuosas em uma caixa?
c) Qual a probabilidade de uma caixa ser aceita?
d) Qual a probabilidade de que em um lote de 10 caixas
pelo menos 8 sejam aceitas?
2) Uma comisso responsvel pelo recebimento de equipamentos em
uma empresa faz testes em equipamentos selecionados aleatoriamente
dentre os que chegam. Para avaliar uma determinada marca de trans-
formadores de pequeno porte, a comisso selecionou aleatoriamente
18 dentre os que chegaram e classificar a marca como satisfatria
se no existir nenhum defeituoso nesta amostra. Sabe-se que a pro-

Perodo 3 199
7 duo destes equipamentos apresenta um percentual de 6% de de-
feituosos.
UNIDADE

a) Qual a probabilidade de que a marca venha a ser consi-


derada satisfatria?
b) Qual a probabilidade de que no mximo uma amostra, de
um grupo de 8 amostras destes transformadores (cada
amostra com 18 transformadores) seja considerada
satisfatria?
3) Uma operadora de pedgios est preocupada com o dimensionamento
de uma de suas praas. Muitos motoristas esto reclamando das fi-
las, pois h apenas duas gndolas operando todo o tempo. Estudos
mostraram que em mdia 4 carros chegam na praa de pedgio a
cada 15 minutos.
a) Qual a probabilidade de que mais de 2 carros cheguem
praa em 30 minutos?
b) Qual a probabilidade de que cheguem at 2 carros em
um perodo de uma hora?
c) Voc recomenda que a empresa aumente o nmero de
gndolas? Por qu?
4) Sabe-se que a precipitao anual de chuva em certa localidade, cuja
altura medida em cm, uma varivel aleatria normalmente distri-
buda com altura mdia igual a 29,5 cm e desvio padro de 2,5 cm
de chuva.
a) Qual altura de chuva ultrapassada em cerca de 5% das
medies?
b) Se em mais de 45% das vezes a altura de chuva ultrapas-
sar 32 cm torna-se vivel a instalao de um sistema para
coleta e armazenamento de gua da chuva (como comple-
mento atual malha de abastecimento). vivel instalar o
sistema na localidade?

200 Curso de Graduao em Administrao, modalidade a distncia


5) O tempo de vida de um determinado componente eletrnico distri-
bui-se normalmente com mdia de 250 horas e varincia de 49 ho-
ras. Voc adquire um destes componentes.
7

UNIDADE
a) Qual a probabilidade de que seu tempo de vida ultrapas-
se as 260 horas?
b) Qual deveria ser o prazo de garantia para estes componen-
tes para que o servio de reposio atendesse a somente
5% dos componentes adquiridos?
6) Imagine que a UFSC tivesse antecipado os resultados abaixo, refe-
rentes aos candidatos no eliminados, antes de divulgar a relao
com as notas de todos os candidatos.

P ONTUAO F INAL V ESTIBULAR UFSC 2002


Economia Administrao
Mdia 50,92 55,11
Desvio padro 9,09 8,22
vagas/Candidatos 0,370 0,412

Admitindo que as notas so normalmente distribudas:


a) O que voc responderia para um candidato Economia
que estimasse ter conseguido 50 pontos? Na sua opinio
ele conseguiria se classificar? E se ele estimasse ter conse-
guido 60 pontos?
b) O que voc responderia para candidatos aos cursos de Eco-
nomia e Administrao que estimassem ter conseguido,
respectivamente, 55 e 58 pontos?
c) Imagine que voc tenha que responder a dezenas de
vestibulandos; para poupar trabalho, estime a nota mni-
ma para classificao em cada curso.

Perodo 3 201
7
UNIDADE

202 Curso de Graduao em Administrao, modalidade a distncia


8 7

UNIDADE
Inferncia estatstica e
UNIDADE
distribuio amostral

D
Objetivo
Nesta Unidade voc conhecer os conceitos de
inferncia estatstica e de distribuio amostral, que
so a base para o processo de generalizao usado
pelos administradores em vrias tomadas de deciso.

Perodo 3 203
8
UNIDADE

204 Curso de Graduao em Administrao, modalidade a distncia


Conceito de Inferncia Estatstica 8

UNIDADE
B
Caro estudante, vamos relembrar um pouco nossa
trajetria ao longo da disciplina de estatstica:
Na Unidade 1 vimos que atravs da Inferncia Es-
tatstica, usando os conceitos de Probabilidade (e
variveis aleatrias, Unidades 5, 6 e 7) podemos
generalizar os resultados de uma pesquisa por
amostragem (Unidade 2) para a populao da qual
a amostra foi retirada.
Lembre-se, estamos supondo que a amostra foi re-
tirada por meio de amostragem probabilstica ou
aleatria, temos ento um experimento aleatrio:
no sabemos quem far parte da amostra antes do
sorteio (Unidade 5).
Uma vez retirada a amostra, fazemos anlise
exploratria dos dados (Unidades 3 e 4): por exem-
plo, calculamos mdia de uma varivel quantitati-
va. Essa mdia e todas as demais estatsticas se-
ro variveis aleatrias (pois esto associadas ao
Espao Amostral de um experimento aleatrio), e
poderemos tentar identificar o modelo probabilstico
mais apropriado para elas (Unidades 6 e 7). Mas,
neste caso o modelo probabilstico de uma estats-
tica da amostra chamado de Distribuio
Amostral.
Conhecer a Distribuio Amostral das principais
estatsticas vai nos ser muito til quando estudar-
mos os tipos particulares de Inferncia Estatstica:
Estimao de Parmetros (Unidade 9) e Testes de
Hipteses (Unidade 10).
Vamos continuar aprendendo? muito bom ter voc
conosco!

Perodo 3 205
8 E
statstica a cincia que se ocupa de organizar, descrever, ana-
lisar e interpretar dados para que seja possvel a tomada de de-
cises e/ou a validao cientfica de uma concluso. Os dados
UNIDADE

so coletados para estudar uma ou mais caractersticas de uma Popu-


lao: conjunto das medidas da(s) caracterstica(s) de interesse em
todos os elementos que a(s) apresenta(m).
Uma populao pode ser representada atravs de um modelo:
este apresenta condies para uso, forma para a distribuio, e
parmetros.
Os dados necessrios para a obteno do modelo podem ser

v
obtidos atravs de um censo (pesquisa de toda a populao), ou atra-
Na Unidade 2 enume- vs de uma amostra (subconjunto finito) da populao.
ramos as principais ra- A amostra deve ser: representativa da populao, suficiente
zes para usar (para que o resultado tenha confiabilidade), e aleatria (retirada por
amostragem. sorteio no viciado).

!
A Inferncia Estatstica consiste em fazer afirma-
Amostra aleatria, ca- es probabilsticas sobre as caractersticas do mode-
sual ou probabilstica
amostra retirada por meio
lo probabilstico, que se supe representar uma popu-
de um sorteio no viciado, lao, a partir dos dados de uma amostra aleatria
que garante que cada ele- (probabilstica) desta mesma populao.
mento da populao ter
uma probabilidade maior do
que zero de pertencer
amostra. Fonte: elaborado Fazer uma afirmao probabilstica sobre uma caracterstica
pelo autor. qualquer associar declarao feita uma probabilidade de que tal
Parmetros alguma me- declarao esteja correta (e, portanto, a probabilidade complementar
dida descritiva (mdia,
de que esteja errada). Quando se usa uma amostra da populao sem-
varincia, proporo) dos
valores x1, x2, x3, ..., as- pre haver uma probabilidade de estar cometendo um erro (justamen-
sociados populao. Fon- te por ser usada uma amostra): a diferena entre os mtodos estatsti-
te: Barbetta, Reis e Bornia
cos e os outros reside no fato de que os mtodos estatsticos permitem
(2008).
calcular essa probabilidade de erro. E para que isso seja possvel a
Estimao de
P a r m e t r o s forma de
amostra da populao precisa ser aleatria.
inferncia estatstica que As afirmaes probabilsticas sobre o modelo da populao
busca estimar os parmetros
podem ser basicamente:
do modelo probabilstico da
varivel de interesse na po-
pulao, a partir de dados z estimar quais so os possveis valores dos parmetros
de uma amostra
Estimao de Parmetros:
probabilstica desta mesma
populao. Fonte: Barbetta, z qual o valor da mdia de uma varivel que segue
Reis e Bornia (2008).
uma distribuio normal?

206 Curso de Graduao em Administrao, modalidade a distncia


z qual o valor da proporo de um dos dois resulta-
dos possveis de uma varivel que segue uma distri-
buio binomial.
8

UNIDADE
z testar hipteses sobre as caractersticas do modelo:
parmetros, forma da distribuio de probabilidades, en-
tre outros Testes de Hipteses.
z o valor da mdia de uma varivel que segue uma
distribuio maior do que um determinado valor?
z o modelo probabilstico da populao uma distri-
buio normal?
z o valor da mdia de uma varivel que segue uma
distribuio normal em uma populao diferente
da mesma mdia em outra populao?

Estudaremos Estimao de Parmetros na Unida-


de 9 e Testes de Hipteses na Unidade 10. B
Te s t e s d e h i p t e s e s
forma de inferncia estats-
Parmetros e Estatsticas tica que busca testar hip-
teses sobre caractersticas
(parmetros, forma do mo-
delo) do modelo
Vamos imaginar uma pesquisa como a da Unidade 1, opinio probabilstico da varivel de
dos registrados no CRA-SC sobre os cursos em que se graduaram, interesse na populao, a
partir de dados de uma
desde que tenham se graduado em Santa Catarina. Naquela Unida- amostra probabilstica des-
de, e depois na Unidade 2, declaramos que era possvel realizar uma ta mesma populao. Fon-
amostragem probabilstica, e vimos um exemplo de como fazer isso. te: Barbetta, Reis e Bornia
(2008).
Independente da pesquisa, uma vez sido realizada por
amostragem probabilstica, os dados podem ser estatisticamente ge-
neralizados para a populao.
Uma vez tendo coletado os dados, preciso resumi-los e
organiz-los de maneira a permitir uma primeira anlise, e posterior
uso das informaes. As tcnicas estatsticas que se ocupam desses
aspectos constituem a Anlise Exploratria de Dados, que estudamos
detalhadamente nas Unidades 3 e 4.
O conjunto de dados pode ser resumido (e apresentado) atra-
vs das distribuies de frequncias, que relacionam os valores que a

Perodo 3 207
8 varivel pode assumir com a frequncia (contagem) com que foram
encontrados naquele conjunto. Essa distribuio pode ser apresenta-
da na forma de uma tabela, ou atravs de um grfico (esses dois m-
UNIDADE

todos podem ser usados tanto para variveis qualitativas quanto para
variveis qualitativas).
H uma terceira forma de resumir o conjunto de dados, quan-
do a varivel sob anlise quantitativa: as medidas de sntese ou

v
estatsticas. As principais estatsticas so a mdia, o desvio padro, a
A proporo est rela- varincia e a proporo.
cionada aos
percentuais de ocor-
rncia dos valores em Ateno! Vamos relembrar o que cada uma significa:
uma distribuio de Mdia
Mdia: mdia aritmtica simples (ver Unidade 4) tra-
frequncias de uma va- ta-se de uma estatstica que caracteriza o centro de
rivel qualitativa. massa do conjunto de dados (Valor Esperado ver
Unidade 6). Quando a mdia populacional recebe o
smbolo , quando a mdia amostral recebe o sm-
bolo 0 ;
Estatsticas medidas de
Varincia
arincia: trata-se de uma estatstica (ver Unidade 4)
sntese da varivel calcula-
das com base nos resulta- que mede a disperso em torno da mdia do conjunto,
dos de uma amostra da po- (em torno do valor esperado possuindo uma unida-
pulao. Se a amostra for
de que o quadrado da unidade da mdia (e dos valo-
probabilstica (aleatria) as
estatsticas podem ser con- res do conjunto). Quando a varincia populacional
sideradas variveis aleat- recebe o smbolo , quando a varincia amostral
rias. Fonte: Barbetta, Reis e
recebe o smbolo ss;
Bornia (2008).
Desvio padro a raiz quadrada positiva da varincia,
tendo, portanto, uma unidade que igual unidade
da mdia, sendo muitas vezes preferida para efeito de

!
mensurao da disperso. Quando o valor
populacional recebe o smbolo , e quando o amostral
recebe o smbolo s .
Proporo
roporo: consiste em calcular a razo entre o n-
mero de ocorrncias do valor de interesse de uma va-
rivel qualitativa e o nmero total de ocorrncias
registradas no conjunto (de todos os valores que a
varivel pode assumir); quando uma proporo
populacional recebe o smbolo ; quando uma pro-
poro amostral recebe o smbolo p .

208 Curso de Graduao em Administrao, modalidade a distncia


Os valores das medidas de sntese, alm de resumirem o con-
junto de dados, constituem uma indicao dos provveis valores dos
parmetros. Assim, em estudos baseados em amostras, comum uti-
8

UNIDADE
lizar tais medidas de sntese como estatsticas que sero utilizadas
para estimar os parmetros do modelo probabilstico que descreve a
populao.
A Tabela 4 resume os parmetros e as estatsticas:

Tabela 4: Parmetros e Estatsticas mais comuns.

MEDIDAS DE SNTESE PARMETROS (POPULAO) ESTATSTICAS (AMOSTRA)

Mdia

Varincia

Proporo

Fonte: elaborado pelo autor;

Onde N o nmero de elementos da populao, n o nmero


de elementos da amostra, e fa a frequncia de ocorrncia de um dos
valores de uma varivel qualitativa na populao ou na amostra.
As Estatsticas so variveis aleatrias, pois seus valores po-
dem variar dependendo do resultado da amostra. Se forem variveis
aleatrias, podem ser caracterizadas atravs de algum modelo
probabilstico. Esse modelo recebe o nome de distribuio amostral.

Distribuio Amostral

Seja uma populao qualquer com um parmetro de interes-


se, correspondendo a uma estatstica T em uma amostra. Amostras
aleatrias so retiradas da populao e para cada amostra calcula-se
o valor t da estatstica T.

Perodo 3 209
v
8 NO con-
fundir com
Os valores de t formam uma nova populao que segue uma
distribuio de probabilidades que chamada de distribuio
amostral de T.
UNIDADE

o t da dis- Vamos ver um exemplo.


tribuio o Exemplo 1 Seja a populao abaixo, constituda pelos pesos
t de em kg de oito pessoas adultas:
Student
(Unidade
7).

Figura 64: Distribuio Amostral Exemplo 1.


Fonte: elaborada pelo autor.

Observe que foram retiradas trs amostras. Para cada amostra


foi calculada a mdia, visando estimar a mdia populacional, que vale
65,62 kg. Observe que h uma variao na estatstica mdia, pois o
processo de amostragem aleatrio: um experimento aleatrio. Essa
variao precisa ser considerada quando so realizadas as inferncias
sobre os parmetros.
Assim sendo, o conhecimento das distribuies amostrais das
principais estatsticas necessrio para fazer inferncias sobre os
parmetros do modelo probabilstico da populao. Por hora, basta
conhecer as distribuies amostrais das estatsticas mdia de uma
varivel quantitativa qualquer e a proporo de um dos dois nicos
resultados de uma varivel qualitativa.

Distribuio amostral da mdia

Vamos observar as particularidades da distribuio amostral


da mdia.
Neste segundo exemplo, suponha uma varivel quantitativa
cujos valores constituem uma populao com os seguintes valores:
(2, 3, 4, 5).

210 Curso de Graduao em Administrao, modalidade a distncia


Para esta populao, que tem uma distribuio uniforme, po-
demos observar que os parmetros so: = 3,5 = 1,25 (usou-se
n no denominador por ser uma populao)
8

UNIDADE
Se retirarmos todas as amostras aleatrias de dois elementos
(com reposio) possveis desta populao (n = 2), teremos os se- H 16 amos-
guintes resultados: tras poss-
veis.
(2, 2) (2, 3) (2, 4) (2, 5)
(3, 2) (3, 3) (3, 4) (3, 5)
(4, 2) (4, 3) (4, 4) (4, 5)
(5, 2) (5, 3) (5, 4) (5, 5)

O clculo das mdias de todas as amostras acima resultar na


matriz abaixo:

Se estas mdias forem plotadas em um histograma (Figura 65):

Figura 65: Histograma de mdias amostrais.


Fonte: adaptada de Statsoft.

Perodo 3 211
8 Se forem calculados mdia e varincia das mdias de todas as
amostras o resultado ser:
UNIDADE

Observe como a distribuio das mdias amostrais da varivel


pode ser aproximada por um modelo normal (no obstante a distri-
buio da varivel na populao no ser normal), e que o valor espe-
rado das mdias amostrais (mdia das mdias) igual ao valor da
mdia populacional da varivel e a varincia das mdias amostrais
igual ao valor da varincia populacional da varivel dividida pelo ta-
manho da amostra. Quanto maior o tamanho da amostra (quanto
maior n) mais o histograma anterior vai se aproximar de um modelo
normal, independentemente do formato da distribuio da varivel na
populao.

B Podemos ento enunciar os teoremas:

Teorema das Combinaes Lineares


Este suficientemente Se a varivel de interesse segue uma distribuio normal na
grande varia de distri- populao a distribuio amostral das mdias de amostras aleatrias
buio para distribui- retiradas desta populao tambm ser normal, independentemente
o, como foi visto uma
do tamanho destas amostras.
distribuio uniforme
precisa de uma amos-
tra pequena (n =2 no
Teorema Central do Limite
caso) para que a apro- Se a varivel de interesse no segue uma distribuio normal
ximao seja possvel,
na populao (ou no se sabe qual a sua distribuio) a distribui-
outras distribuies
o amostral das mdias de amostras aleatrias retiradas desta popu-

v
precisam de amostras
lao ser normal se o tamanho destas amostras for suficientemente
maiores. Alguns auto-
grande, com uma mdia igual mdia populacional e uma varincia
res costumam chamar
igual varincia populacional dividida pelo tamanho da amostra.
de grandes amostras
aquelas que possuem Para o caso da Proporo podemos chegar a uma concluso
mais de 30 elemen- semelhante.
tos, a partir deste ta-
manho a aproximao
poderia ser feita sem
maiores preocupaes.

212 Curso de Graduao em Administrao, modalidade a distncia


Distribuio amostral da proporo

Vamos estudar as particularidades da distribuio amostral da


8

UNIDADE
proporo atravs de um exemplo.
Neste exemplo 4, pense agora em uma varivel qualitativa que
pode assumir apenas dois valores, e que constitui a seguinte popula-
o: (, , , , )
Vamos supor que h interesse no valor (este valor seria o
nosso sucesso). A proporo deste valor na populao (o valor do
parmetro) ser = 1/5.

v
Se retirarmos todas as amostras aleatrias de dois elementos
(com reposio) possveis desta populao (n = 2) teremos os se- H 25 amostras poss-
guintes resultados: veis.

Figura 66: Amostras de tamanho 2 para proporo.


Fonte: elaborada pelo autor.

Observe que se definirmos a varivel como o nmero de su-


cessos (nmero de ) esta seguir um modelo binomial: h apenas
dois resultados possveis para cada realizao, h um nmero limita-
do de realizaes (n = 2 no caso), e cada realizao independe da
outra (porque a amostra aleatria com reposio).
Calculando a proporo de em cada uma das amostras, e
chamando essa proporo amostral de p, teremos os seguintes resul-
tados:

Perodo 3 213
8
UNIDADE

Calculando a mdia (valor esperado) e a varincia das propor-


es acima teremos:

Observe que o valor esperado (mdia) das propores amostrais


igual ao valor da proporo populacional de , e que a varincia

v
das propores amostrais igual ao produto da proporo populacional
Voltaremos a analisar o de por seu complementar, dividido pelo tamanho da amostra.
significado deste resul- Lembre-se de que um modelo binomial pode ser aproximado
tado quando estudar- por um modelo normal se algumas condies forem satisfeitas: se o
mos Estimao por produto do nmero de realizaes pela probabilidade de sucesso

v
Ponto. (n p) E o produto do nmero de realizaes pela probabilidade de
Isto tambm decor-
fracasso (n [1 p]) forem ambos maiores ou iguais a 5. E essa
rncia do Teorema Cen- distribuio normal teria mdia igual a n p e varincia igual a
tral do Limite. n p (1 p). Se estivermos interessados apenas na proporo
(probabilidade de sucesso) e no no nmero de sucessos as ex-
presses anteriores podem ser divididas por n (o tamanho da amos-
tra): mdia = p e varincia = [p (1 p) / n].
Por causa do Teorema Central do Limite que o modelo nor-
mal to importante. claro que ele representa muito bem uma gran-
de variedade de fenmenos, mas devido sua utilizao em
Inferncia Estatstica que o seu estudo imprescindvel. Ressalte-se,
porm, que a sua aplicao costuma resumir-se ao que se chama de
Inferncia Paramtrica, inferncias sobre os parmetros dos modelos
probabilsticos que descrevem as variveis na populao. Para fazer
inferncias sobre outros aspectos que no os parmetros, ou quando
as amostras utilizadas no forem suficientemente grandes para se assu-
mir a validade do Teorema Central do Limite, preciso usar tcnicas de
Inferncia No Paramtrica (que ns no veremos nesta disciplina).

214 Curso de Graduao em Administrao, modalidade a distncia


Saiba mais
Sobre distribuio amostral veja: BARBETTA, Pedro A.; REIS, Marcelo M.;
8

UNIDADE
BORNIA, Antonio C. Estatstica para Cursos de Engenharia e Informtica. 2.
ed. So Paulo: Atlas, 2008, Captulo 7.

STEVENSON, Willian J. Estatstica Aplicada Administrao. So Paulo:


Ed. Harbra, 2001, Captulo 7.

ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatstica Apli-


cada Administrao e Economia. 2. ed. So Paulo: Thomson Learning,
2007, Captulo 7.

Sobre a utilizao do Microsoft Excel para estudar distribuies amostrais


veja LEVINE, David M.; STEPHAN, David; KREHBIEL, Timothy C.;

r
BERENSON, Mark L. Estatstica: Teoria e Aplicaes Usando Microsoft
Excel em Portugus. 5. ed. Rio de Janeiro: LTC, 200, Captulo 5.

Resumindo
O resumo desta Unidade est mostrado na Figura 67:

Perodo 3 215
8
UNIDADE

Figura 67: Resumo da Unidade 8.


Fonte: elaborado pelo autor.

216 Curso de Graduao em Administrao, modalidade a distncia


Caro estudante,

B
Esta Unidade foi muito importante para o seu apren-
8

UNIDADE
dizado, pois lhe dar base para chegar Inferncia
Estatstica propriamente dita, assunto que ser tema
de discusso nas Unidades 9 e 10. Vimos at ago-
ra sobre a inferncia estatstica e distribuio
amostral, seu modelo probabilstico e testes de hi-
pteses. Chegamos ao final desta Unidade e a con-
tinuidade da aprendizagem proposta desde o in-
cio deste material. Interaja com seus colegas, res-
ponda atividade de aprendizagem e visite o Am-
biente Virtual de Ensino-Aprendizagem, espao este
que contemplar suas possveis dvidas. Procure
seu tutor e solicite todas as informaes necessri-
as para o seu aprendizado. Bons estudos!!!

Atividades de aprendizagem
aprendizagem
1) Uma fundio produz blocos para motor de caminhes. Os furos para
as camisas devem ter dimetro de 100 mm, com tolerncia de 5
mm. Para verificar qual o dimetro mdio no processo, a empresa
vai retirar uma amostra com 36 blocos e medir os dimetros de 36
furos (1 a cada bloco). Suponha que o desvio padro (populacional)
dos dimetros seja conhecido e igual a 3 mm.
a) Qual o desvio padro da distribuio da mdia amostral?
b) Qual a probabilidade da mdia amostral diferir da mdia
populacional (desconhecida) em mais do que 0,5 mm
(para mais ou para menos)?
c) Qual a probabilidade da mdia amostral diferir da mdia
populacional (desconhecida) em mais do que 1 mm (para
mais ou para menos)?

Perodo 3 217
8 d) Se algum afirmar que a mdia amostral no se distanciar
da mdia populacional em mais do que 0,98 mm, qual a
probabilidade dessa pessoa acertar?
UNIDADE

e) Se algum afirmar que a mdia amostral no se distanciar


da mdia populacional em mais do que 1,085 mm, qual
a probabilidade dessa pessoa errar?

218 Curso de Graduao em Administrao, modalidade a distncia


9 8

UNIDADE
Estimao de
UNIDADE
parmetros

D
Objetivo
Nesta Unidade voc conhecer e aplicar os
conceitos de Estimao de Parmetros por Ponto e
por Intervalo de Mdia e Proporo, e aprender
como calcular o tamanho mnimo de amostra
necessrio para a Estimao por Intervalo.

Perodo 3 219
9
UNIDADE

220 Curso de Graduao em Administrao, modalidade a distncia


Estimao por Ponto de Parmetros 9

UNIDADE
Prezado estudante!

B
Na Unidade 8 voc viu o conceito de Distribuio
Amostral e observou a importncia do modelo nor-
mal. Nesta Unidade voc vai aprender como apli-
car esses conceitos no primeiro tipo particular de
Inferncia Estatstica, a Estimao de Parmetros:
por ponto e por intervalo.
Parmetros so medidas de sntese de variveis
quantitativas na Populao que estamos
pesquisando. Por ser invivel ou inconveniente
pesquisar toda a Populao coletamos uma amos-
tra para estud-la. Os resultados da amostra po-
dem ser ento usados para fazer afirmaes
probabilsticas sobre o parmetro de interesse: de-
finir um intervalo possvel para os valores do
parmetro e calcular a probabilidade de que o va-
lor real do parmetro esteja dentro dele (esta a
Estimao por Intervalo).
Vamos aprender como estimar os parmetros m-
dia de uma varivel quantitativa e proporo de
um dos valores de uma varivel qualitativa. Alm
disso, voc vai ver como possvel definir de forma
mais acurada o tamanho mnimo de uma amostra
aleatria para estimar mdia e proporo (para esta
ltima apresentamos uma primeira expresso de
clculo Unidade 2).

U
ma vez tendo decidido que modelo probabilstico mais ade-
quado para representar a varivel de interesse na Populao
resta obter os seus parmetros. Nos estudos feitos com base em
amostras preciso escolher qual das estatsticas da amostra ser o
melhor estimador para cada parmetro do modelo.

Perodo 3 221
9 A Estimao por Ponto consiste em determinar qual ser o
melhor estimador para o parmetro de interesse.
Como os parmetros sero estimados atravs das estatsticas,
UNIDADE

estimadores, de uma amostra aleatria, e como para cada amostra


aleatria as estatsticas apresentaro diferentes valores, os estimadores
tambm tero valores aleatrios. Em outras palavras um Estimador
uma varivel aleatria que pode ter um modelo probabilstico para
descrev-la.
Naturalmente haver vrias estatsticas T que podero ser usa-
das como estimadores de um parmetro qualquer. Como escolher
qual das estatsticas ser o melhor estimador para o parmetro?
Estimao por ponto H basicamente trs critrios para a escolha de um estimador:
tipo de estimao de
o estimador precisa ser justo, consistente e eficiente.
parmetros que procura
identificar qual o melhor
estimador para um 1) Um Estimador T um estimador justo (no tendencioso)
parmetro populacional a
de um parmetro quando o valor esperado de T igual
partir das vrias estatstica
amostrais disponveis, se- ao valor do parmetro a ser estimado: E(T) =
guindo alguns critrios.
Fonte: Barbetta, Reis e
2) Um Estimador T um estimador consistente de um
Bornia (2008). parmetro quando alm ser um estimador justo a sua
varincia tende a zero medida que o tamanho da amos-
tra aleatria aumenta: lim n4 V(T) = 0.
3) Se h dois Estimadores justos de um parmetro o mais
eficiente aquele que apresentar a menor varincia.

B Conforme foi dito na introduo desta Unidade,


estamos interessados em estimar dois parmetros:
mdia e proporo populacional. Vamos ento bus-
car os estimadores mais apropriados para ambos.

Estimao por ponto dos principais parmetros

Os principais parmetros que vamos avaliar aqui so: mdia


de uma varivel que segue um modelo normal (ou qualquer modelo se
a amostra for suficientemente grande) em uma populao (mdia
populacional ) e proporo de ocorrncia de um dos valores de

222 Curso de Graduao em Administrao, modalidade a distncia


uma varivel que segue um modelo Binomial em uma populao (pro-
poro populacional ). Em suma escolher quais estatsticas
amostrais so mais adequadas para estimar esses parmetros, usan-
9

UNIDADE
do os critrios definidos acima.
Lembrando dos Exemplos 2, e 3 da Unidade 8, algumas
constataes que l foram feitas passaro a fazer sentido agora.
Vamos supor que houvesse a inteno de estimar a mdia
populacional da varivel do Exemplo 2. Qual das estatsticas dispon-
veis seria o melhor estimador?
Lembrem-se de que aps retirar todas as amostras aleatrias
possveis daquela populao, calculamos a mdia de cada amostra, e
posteriormente a mdia dessas mdias. Constatou-se que o valor es-
perado das mdias amostrais (mdia das mdias) igual ao valor da
mdia populacional da varivel e a varincia das mdias amostrais
igual ao valor da varincia populacional da varivel dividida pelo ta-
manho da amostra:

O melhor estimador da mdia populacional a mdia amostral


0 , pois se trata de um estimador justo e consistente:

z Justo porque o valor esperado da mdia amostral ser a


mdia populacional;
z Consistente porque se o tamanho da amostra n tender ao
infinito a varincia da mdia amostral (do Estimador) ten-
der a zero.

Agora vamos supor que houvesse a inteno de estimar a pro-


poro populacional do valor da varivel do Exemplo 3. Qual das
estatsticas disponveis seria o melhor estimador?
Lembrem-se de que aps retirar todas as amostras aleatrias
possveis daquela populao, calculamos a proporo de em cada
amostra, e posteriormente a mdia dessas propores. Constatou-se
que o valor esperado das propores amostrais (mdia das propor-
es) igual ao valor da proporo populacional do valor da vari-
vel e a varincia das propores amostrais igual ao valor do produto
da proporo populacional do valor da varivel pela sua comple-
mentar dividida pelo tamanho da amostra:

Perodo 3 223
9 O melhor estimador da proporo populacional a propor-
UNIDADE

o amostral p, pois se trata de um estimador justo e consistente:

z Justo porque o valor esperado da proporo amostral ser


a proporo populacional; e
z Consistente porque se o tamanho da amostra n tender ao
infinito a varincia da proporo amostral (do Estimador)
tender a zero.

Poderamos fazer um procedimento semelhante para estimar


outros parmetros, como, por exemplo, a varincia populacional de
uma varivel. Este procedimento no ser demonstrado, mas o me-
lhor estimador da varincia populacional ser a varincia amostral se
for usado n 1 no denominador da expresso de clculo. Somente
assim a varincia amostral ser um estimador justo (no viciado) da
varincia populacional.
Como o desvio padro a raiz quadrada da varincia co-
mum estimar o desvio padro populacional extraindo a raiz quadrada
da varincia amostral.

B O problema da Estimao por Ponto que geral-


mente s dispomos de uma amostra aleatria. In-
tuitivamente, qual ser a probabilidade de que a
mdia ou proporo amostral, de uma amostra ale-
atria, coincida exatamente com o valor do
parmetro? como pescar usando uma lana de bam-
bu... preciso muita habilidade para pegar o pei-
xe... Mas, se voc puder usar uma rede, ficar bem
mais fcil. Essa rede a Estimao por Intervalo.

Estimao por Intervalo de Parmetros

Geralmente uma inferncia estatstica feita com base em uma


nica amostra: na maior parte dos casos totalmente invivel retirar
todas as amostras possveis de uma determinada populao.

224 Curso de Graduao em Administrao, modalidade a distncia


Intuitivamente percebemos que as estatsticas calculadas nes-
sa nica amostra, mesmo sendo os melhores estimadores para os
parmetros de interesse, tero uma probabilidade infinitesimal de coinci-
9

UNIDADE
dir exatamente com os valores reais dos parmetros. Ento a Estimao
por Ponto dos parmetros insuficiente, e as estimativas assim obtidas
serviro apenas como referncia para a Estimao por Intervalo.
A Estimao por Intervalo consiste em colocar um Intervalo de
Confiana (I.C.) em torno da estimativa obtida atravs da Estimao
por Ponto.
fazer uma Estimao por
O Intervalo de Confiana ter uma certa probabilidade chama-

v
Intervalo de um
da de Nvel de confiana (que costuma ser simbolizado como 1 ) parmetro efetuar uma
de conter o valor real do parmetro e a probabilidade de que esta afirmao probabilstica
faixa realmente contenha o valor real do parmetro. A probabilidade sobre este parmetro,
de que o Intervalo de Confiana no contenha o valor real do parmetro indicando uma faixa de
chamada de Nvel de Significncia ( ), e o valor desta probabilida- possveis valores.
de ser o complementar do Nvel de Confiana. comum definir o
Nvel de Significncia como uma probabilidade mxima de erro, um
Intervalo de confiana
risco mximo admissvel. faixa de valores da esta-
A determinao do Intervalo de Confiana para um determina- tstica usada como
estimador, dentro da qual h
do parmetro resume-se basicamente a definir o Limite Inferior e o
uma probabilidade conhe-
Limite Superior do intervalo, supondo um determinado Nvel de Con- cida de que o verdadeiro
fiana ou Significncia. valor do parmetro esteja.
Sinnimo de estimao por
A definio dos limites depender tambm da distribuio
intervalo. Fonte: Barbetta,
amostral da estatstica usada como referncia para o intervalo e do Reis e Bornia (2008).
tamanho da amostra utilizada. Nvel de Significncia
Para os dois parmetros em que temos maior interesse (mdia complementar do nvel de
confiana, a probabilidade
populacional e proporo populacional ) a distribuio amostral
de que o intervalo de confi-
dos estimadores (mdia amostral 0 e proporo amostral p, respecti- ana no contenha o valor
vamente) pode ser aproximada por uma distribuio normal: o Inter- real do parmetro. Probabi-
lidade de erro espera-se que
valo de Confiana ser ento simtrico em relao ao valor calculado
seja um valor baixo, de no
da estimativa (mdia ou proporo amostral), com base na amostra mximo 10%. Fonte:
aleatria coletada (Figura 68): Barbetta, Reis e Bornia
(2008).

Nvel de confiana
probabilidade de que o in-
tervalo de confiana conte-
nha o valor real do
parmetro a estimar, espe-
ra-se que seja um valor alto,
de no mnimo 90%. Fonte:
Moore, McCabe, Duckworth
e Sclove (2006).

Perodo 3 225
9
UNIDADE

Figura 68: Intervalo de Confiana para um modelo normal.


Fonte: elaborada pelo autor.

Onde: Li o limite inferior e Ls o limite superior do Intervalo


de Confiana; 1 o Nvel de Confiana estabelecido, observando
que o valor do Nvel de Significncia dividido igualmente entre os
valores abaixo de Li e acima de Ls.
Para obter os limites em funo do Nvel de Confiana deve-
mos utilizar a distribuio normal padro (varivel Z com mdia zero
e varincia um): fixar um certo valor de probabilidade, obter o valor

v
de Z correspondente, e substituir o valor em Z = (x mdia) des-
Foram colocados entre vio padro, para obter o valor x (valor correspondente ao valor de Z
aspas porque os valo- para a probabilidade fixada). Observe a Figura 69:
res dependero dos
parmetros sob anli-
se e de outros fatores.

Figura 69: Intervalo de Confiana para a distribuio normal padro.


Fonte: elaborada pelo autor.

O limite Li (inferior) corresponde a Z1 e o limite Ls (superior)


corresponde a Z 2. O ponto central 0 (zero) corresponde ao valor cal-
culado da Estimativa. Como a varivel Z tem distribuio normal com
mdia igual a zero (lembrando que a distribuio normal simtrica
em relao mdia) os valores de Z1 e Z2 sero iguais em mdulo (Z 1
ser negativo e Z2 positivo):

Z 1 ser um valor de Z tal que , e Z 2 ser um

valor tal que .

Ento, obteremos os valores dos limites atravs das expresses:

226 Curso de Graduao em Administrao, modalidade a distncia


Z1 = (L i mdia)/ desvio padro Li = mdia +
Z1 Hdesvio padro.
Z2 = (L s mdia)/ desvio padro Ls = mdia +
9

UNIDADE
Z2 Hdesvio padro.

Como Z1 = Z2, podemos substituir:

Li = mdia Z2 Hdesvio padro.


Ls = mdia + Z2 H desvio padro.

E este valor Z 2 costuma ser chamado de Z crtico , porque


corresponde aos limites do intervalo:

Li = mdia Zcrtico Hdesvio padro.


Ls = mdia + Zcrtico H desvio padro.

Reparem que o mesmo valor somado, e subtrado da m-


dia. Esse valor chamado de semi-intervalo ou preciso do interva-
lo, ou margem de erro, e0:

e 0 = Zcrtico Hdesvio padro.

Resta agora definir corretamente o valor da mdia e do des-


vio padro para cada um dos parmetros em que estamos interessa-
dos (mdia e proporo populacional). Com base nas concluses ob-
tidas na Estimao por Ponto isso ser simples. Contudo, h alguns
outros aspectos que precisaro ser esmiuados.

Estimao por Intervalo da Mdia


Populacional

Lembrando das expresses anteriores:

Li = mdia Zcrtico Hdesvio padro = mdia e0.


Ls = mdia + Zcrtico H desvio padro = mdia + e0.

Neste caso a mdia ser a mdia amostral 0 (ou mais preci-


samente o seu valor):

0 e0 0 + e 0 ) = 1
P(0

O valor de e0 depender de outros aspectos.

Perodo 3 227
9 a) Se a varincia populacional da varivel (cuja mdia
populacional queremos estimar) for conhecida.
Neste caso a varincia amostral da mdia poder ser calcula-
UNIDADE

da atravs da expresso:

, e, por conseguinte, o desvio padro ser =

E e0 ser:

Bastar ento fixar o Nvel de Confiana (ou de Significncia)


para obter Zcrtico atravs da Tabela disponvel no Ambiente Virtual e
calcular e0.
b) Se a varincia populacional da varivel for desconhecida.
Naturalmente este o caso mais encontrado na prtica. Como
se deve proceder? Depender do tamanho da amostra.
b.1 Grandes amostras (mais de 30 elementos).
Nestes casos procede-se como no item anterior, apenas fazen-
do com que = s, ou seja, considerando que o desvio padro da
varivel na populao igual ao desvio padro da varivel na amos-
tra (suposio razovel para grandes amostras).
b.2 Pequenas amostras (at 30 elementos).
Nestes casos a aproximao do item b.1 no ser vivel. Ter
que ser feita uma correo na distribuio normal padro (Z) atravs
da distribuio t de Student que estudamos na Unidade 6.
Quando a varincia populacional da varivel desconhecida
e a amostra tem at 30 elementos substitui-se por s e Z por tn-1 em
todas as expresses para determinao dos limites do intervalo de
confiana, obtendo:

Li = mdia tn1, crtico Hdesvio padro = mdia e0


Ls = mdia + tn1, crtico H desvio padro = mdia + e0

E e0 ser:

Os valores de tn1,crtico podem ser obtidos de forma semelhante


aos de Zcrtico, definindo o Nvel de Confiana (ou de Significncia),
mas precisam tambm da definio do nmero de graus de liberdade
(n 1): tendo estes valores basta procurar o valor da Tabela 2 do
Ambiente Virtual ou em um programa computacional.

228 Curso de Graduao em Administrao, modalidade a distncia


Se o tamanho da amostra (n) for superior a 5% do tamanho da
populao (N) os valores de e0 precisam ser corrigidos. Caso contr-
rio os limites dos intervalos no sero acusados. A correo mostra-
9

UNIDADE
da na equao a seguir:

Vamos ver um exemplo.


Neste primeiro exemplo retirou-se uma amostra aleatria de
quatro elementos de uma produo de cortes bovinos no intuito de
estimar a mdia do peso do corte. Obteve-se mdia de 8,2 kg e desvio
padro de 0,4 kg. Supondo populao normal.
Determinar um intervalo de confiana para a mdia
populacional com 1% de significncia.
O parmetro de interesse a mdia populacional do peso do

v
corte.
Adotou-se um nvel de significncia de 1%, ento = 0,01 e Este valor pode ser ar-
1 = 0,99. bitrado pelo usurio ou
As estatsticas disponveis so: mdia amostral = 8,2 kg pode ser uma exigncia
s = 0,4 kg n = 4 elementos. do problema sob anli-
se, ou at mesmo uma
Definio da varivel de teste: como a varincia populacional
exigncia legal. Os n-
DESCONHECIDA, e o tamanho da amostra menor do que 30 ele-
veis de significncia
mentos, no obstante a populao ter distribuio normal, a distribui-
mais comuns so de
o amostral da mdia ser t de Student, e a varivel de teste ser tn-1. 1%, 5% ou mesmo
Encontrar o valor de tn-1,crtico: como o Intervalo de Confiana para 10%.
a mdia bilateral, teremos uma situao semelhante da Figura 70:

Figura 70: Distribuio t de Student para 99% de confiana.


Fonte: elaborada pelo autor.

Perodo 3 229
9 Para encontrar o valor crtico devemos procurar na tabela da
distribuio de Student, na linha correspondente a n1 graus de liber-
dade, ou seja, em 4 1 = 3 graus de liberdade. O valor da probabili-
UNIDADE

dade pode ser visto na Figura acima: os valores crticos sero t3;0,005
e t3;0,995 os quais sero iguais em mdulo. E o valor de tn1,crtico ser
igual a 5,84 (em mdulo).
Determinam-se os limites do intervalo, atravs da expresso
abaixo (cujo resultado ser somado e subtrado da mdia amostral)
para determinar os limites do intervalo:

LI = 0 e 0 = 8,2 1,168 = 7,032 kg.


LS = 0 + e 0 = 8,2 + 1,168 = 9,368 kg.

Ento o intervalo de 99% de confiana para a mdia


populacional da dimenso [7,032;9,368] kg. Interpretao: h 99%
de probabilidade de que a verdadeira mdia populacional do peso de
corte esteja entre 7,032 e 9,368 kg.

Estimao por Intervalo da Proporo


Populacional

Anteriormente declaramos que o melhor estimador para a pro-


poro populacional a proporo amostral p. E que esta propor-
o amostral teria mdia igual a e varincia igual a [
H (1 )]/n
onde n o tamanho da amostra aleatria. A distribuio da propor-
o amostral p binomial, e sabemos que a distribuio binomial pode
ser aproximada por uma normal se algumas condies forem satisfeitas:

Se n H 5 E n H (1 ) 5.

Ora, se fosse conhecido no estaramos aqui nos preocupan-


do com a sua Estimao por Intervalo, assim vamos verificar se pos-
svel aproximar a distribuio binomial de p por uma normal se:
n H p 5 E n H (1 p) 5, ou seja usando o prprio valor da propor-
o amostral observada (trata-se de uma aproximao razovel).
Se e somente se estas duas condies forem satisfeitas podere-
mos usar as expresses abaixo (lembrando das expresses anteriores):

230 Curso de Graduao em Administrao, modalidade a distncia


Li = mdia Zcrtico Hdesvio padro = mdia e0.
Ls = mdia + Zcrtico H desvio padro = mdia + e0.
9

UNIDADE
Neste caso a mdia ser a proporo amostral (ou mais pre-
cisamente o seu valor):

P(p e0 p + e0) = 1

E o valor do desvio padro ser igual a . Nova-

mente, como desconhecido, usaremos a proporo amostral p


como aproximao.

Ento e0 ser: .

Bastar ento fixar o Nvel de Confiana (ou de Significncia),


Zcrtico e calcular e0.
Novamente, precisamos corrigir o valor de e0 para o caso de
populao finita:

Em suma a Estimao por Intervalo da mdia e da proporo


populacional consiste basicamente em calcular a amplitude do semi-
intervalo (o e0), de acordo com as condies do problema sob anlise.

z Para a mdia, observar se vivel considerar que a distri-


buio da varivel na populao normal, ou que a amos-
tra seja suficientemente grande para que a distribuio das
mdias amostrais possa ser considerada normal;
z Se isso for verificado, identificar se a varincia populacional
da varivel conhecida: caso seja dever ser usada a vari-
vel Z da distribuio normal padro, para qualquer tama-
nho de amostra;
z Se varincia populacional da varivel desconhecida h
duas possibilidades: para amostras com mais de 30 ele-
mentos usar a varivel Z, e fazer a varincia populacional
igual varincia amostral da varivel; se a amostra tem
at 30 elementos usar a varivel tn-1 da distribuio de
Student; e

Perodo 3 231
9 z Para a proporo, observar se possvel fazer a aproxima-
o pela distribuio normal.
UNIDADE

Vamos ver um exemplo.


No exemplo 2, retirou-se uma amostra aleatria de 1000 peas
de um lote. Verificou-se que 35 eram defeituosas.
Determinar um intervalo de confiana de 95% para a propor-
o peas defeituosas no lote.
O parmetro de interesse a proporo populacional de
peas defeituosas.
Adotou-se um nvel de significncia de 5%, ento = 0,05 e
1 = 0,95
As estatsticas so: proporo amostral de peas defeituosas
p = 35/1000 n = 1000 elementos.
Definio da varivel de teste: precisamos verificar se possvel
fazer a aproximao pela normal, ento n H p = 1000 x 0,035 = 35 > 5
e n H (1 p) = 1000 x 0,965 = 965 > 5. Como ambos os produtos
satisfazem as condies para a aproximao podemos usar a varivel
Z da distribuio normal padro.
Encontrar o valor de Zcrtico: como o Intervalo de Confiana para a
mdia bilateral, teremos uma situao semelhante da figura abaixo:

Figura 71: Distribuio normal padro para 95% de confiana.


Fonte: elaborada pelo autor.

Para encontrar o valor crtico devemos procurar na tabela da


distribuio normal padro pela probabilidade 0,975 (0,95+0,025).
O valor da probabilidade pode ser visto na Figura 71 acima: os valo-
res crticos sero Z0,025 e Z0,975 os quais sero iguais em mdulo. E o
valor de Zcrtico ser igual a 1,96 (em mdulo).

232 Curso de Graduao em Administrao, modalidade a distncia


Passamos agora determinao dos limites do intervalo, atra-
vs da expresso abaixo, cujo resultado ser somado e subtrado da
proporo amostral de peas defeituosas, para determinar os limites
9

UNIDADE
do intervalo:

LI = p e 0 = 0,035 0,0114 = 0,0236


LS = p + e0 = 0,035 + 0,0114 = 0,0464

Ento, o intervalo de 95% de confiana para a proporo


populacional de peas defeituosas [2,36%;4,64%]. Interpretao:
h 95% de probabilidade de que a verdadeira proporo populacional
de plantas atacadas pelo fungo esteja entre 2,36% e 4,64%.

Tamanho mnimo de amostra para


Estimao por Intervalo

Como observado nos itens anteriores, a determinao dos li-


mites de um Intervalo de Confiana (determinao do e0) depende do
tamanho da amostra aleatria coletada, alm do Nvel de Confiana e
da distribuio amostral do estimador utilizado. Nada podemos fazer
quanto distribuio amostral do estimador, o Nvel de Confiana
ns podemos controlar, seria interessante definir ento uma preciso
(um valor para e0) para o Intervalo de Confiana: muito comum
querermos estabelecer previamente qual ser a faixa de variao de
um determinado parmetro, com uma certa confiabilidade.
Contudo, para um mesmo tamanho de amostra:

z Se aumentarmos o Nvel de Confiana (reduzirmos o Nvel


de Significncia) teremos um valor crtico maior, o que au-
mentar o valor de e0, resultando em um Intervalo de Con-
fiana mais largo, com menor preciso.
z Se resolvermos aumentar a preciso (menor valor de e0),
obter um Intervalo de Confiana mais estreito, teremos
uma queda no Nvel de Confiana.

Perodo 3 233
9 A soluo para o dilema acima obter um tamanho mnimo
de amostra capaz de atender simultaneamente ao Nvel de Confian-
a (ou de Significncia) e preciso (e0) especificados. Como as ex-
UNIDADE

presses de e0 so em funo do tamanho de amostra (n), seria razo-


vel pensar em reorden-las de forma a fazer com que o tamanho de
amostra seja funo do Nvel de Confiana e da preciso (e0).

Tamanho mnimo de amostra para Estimao


por Intervalo da Mdia Populacional

a) Varincia populacional conhecida:

isolando n: .

Neste caso basta especificar o valor de e0 (na mesma unida-


de do desvio padro populacional ), e o Nvel de Confiana (que
ser usado para encontrar o Zcrtico) e calcular o tamanho mnimo de
amostra.
Amostra piloto amos- b) Varincia populacional desconhecida
tra teste, de tamanho arbi-
trado pelo pesquisador, a
partir da qual so calcula-
isolando n: .
das estatsticas necessri-
as para a determinao do O procedimento neste caso seria semelhante exceto por um
tamanho mnimo de amos-
pequeno problema: se estamos calculando o tamanho da amostra
tra. Fonte: Costa Neto
(2002). como podemos conhecer n 1 e o desvio padro amostral s?
Quando a varincia populacional da varivel desconhecida
o usual retirar uma amostra piloto com um tamanho n* arbitrrio. A
partir dos resultados desta amostra so calculadas as estatsticas (en-
tre elas o desvio padro amostral s) que so substitudas na expresso
acima.
Se n n* ento a amostra piloto suficiente para o Nvel de
Confiana e a preciso exigidos.
Se n > n* ento a amostra piloto insuficiente para o Nvel de
Confiana e a preciso exigidas, sendo ento necessrio retornar
populao e retirar os elementos necessrios para completar o tama-
nho mnimo de amostra. O processo continua at que a amostra seja
considerada suficiente.
Conforme visto na Unidade 2, se o tamanho da populao for
conhecido recomendvel corrigir o tamanho da amostra obtida, seja

234 Curso de Graduao em Administrao, modalidade a distncia


para o intervalo de confiana de mdia ou proporo, atravs da se-
guinte frmula: 9

UNIDADE
onde N o tamanho da populao

Assim procedendo, evitamos o inconveniente de obter um ta-


manho de amostra superior ao tamanho da populao, o que pode
ocorrer se N no for muito grande.
Considerem, neste exemplo 3, os dados do Exemplo 1. Para
estimar a mdia, com 1% de significncia e preciso de 0,2 kg, esta
amostra suficiente
Como a varincia populacional desconhecida, e o tamanho
da amostra menor do que 30 elementos, no obstante a populao
ter distribuio normal, a distribuio amostral da mdia ser t de
Student, e a varivel de teste ser tn-1. Assim ser usada a seguinte
expresso para calcular o tamanho mnimo de amostra para a estima-
o por intervalo da mdia populacional.

O nvel de significncia o mesmo do item a. Sendo assim, o


valor crtico continuar sendo o mesmo: tn-1,crtico = 5,84. O desvio
padro amostral vale 0,4 kg, e o valor de e0, a preciso foi fixado em
0,2 kg. Basta ento substituir os valores na expresso:

Conclui-se que a amostra retirada insuficiente, pois menor


do que o valor calculado acima.

Tamanho mnimo de amostra para Estimao


por Intervalo da Proporo Populacional

Para a proporo populacional teremos:

isolando n:

Perodo 3 235
9 necessrio especificar o Nvel de Confiana (ou de
Significncia) que ser usado para encontrar o Zcrtico, e o valor de e 0
(tomando o cuidado de que tanto e0 quanto p e 1 p estejam todos
UNIDADE

como propores adimensionais ou como percentuais) para que seja


possvel calcular o valor do tamanho mnimo de amostra.
Da mesma forma que no caso da Estimao da mdia quando
a varincia populacional desconhecida teremos que recorrer uma
amostra piloto. No clculo do tamanho mnimo de amostra para a

v
Estimao por Intervalo da proporo populacional h, porm, uma
Esta soluo somente soluo alternativa: utiliza-se uma estimativa exagerada da amostra,
usada quando a na- supondo o mximo valor possvel para o produto p H (1 p), que
tureza da pesquisa tal ocorrer quando ambas as propores forem iguais a 0,5 (50%).
que no possvel re- Conforme visto na Unidade 2, se o tamanho da populao for
tirar uma amostra pi- conhecido recomendvel corrigir o tamanho da amostra obtida, seja
loto: a retirada de uma para o intervalo de confiana de mdia ou proporo, atravs da se-
amostra piloto e a guinte frmula:
eventual retirada de
novos elementos da , onde N o tamanho da populao.
populao poderiam
prejudicar muito o re- Assim procedendo, evitamos o inconveniente de obter um ta-
sultado da pesquisa. manho de amostra superior ao tamanho da populao, o que pode
Paga-se, ento, o pre-
ocorrer se N no for muito grande.
o de ter uma amostra
Neste quarto exemplo considere o caso do Exemplo 2. Supon-
substancialmente mai-
do 99% de confiana e preciso de 1%, esta amostra suficiente para
or do que talvez fosse
necessrio. estimar a proporo populacional
De acordo com o Exemplo 2 possvel utilizar a aproximao
pela distribuio normal. A expresso para o clculo do tamanho m-
nimo de amostra para a proporo populacional ser:

Os valores de p e 1 p j so conhecidos:
p = 0,035 1 p = 0,965
O nvel de confiana exigido de 99%: para encontrar o valor
crtico devemos procurar na tabela da distribuio normal padro pela
probabilidade 0,995 (0,99+0,005); os valores crticos sero Z0,005 e
Z0,995 os quais sero iguais em mdulo. E o valor de Zcrtico ser igual a
2,58 (em mdulo).
A preciso foi fixada em 1% (0,01). Substituindo os valores na
expresso acima:

236 Curso de Graduao em Administrao, modalidade a distncia


9

UNIDADE
Observe que o tamanho mnimo de amostra necessrio para
atender a 99% de confiana e preciso de 1% deveria ser de 2.249
elementos. Como a amostra coletada possui apenas 1.000 elementos
ela insuficiente para a confiana e preciso exigidas. Recomenda-se
o retorno populao para a retirada aleatria de mais 1.249 peas.

Depois de tudo que estudamos voc j pode acom-


panhar atentamente os resultados das pesquisas
de opinio veiculadas na mdia. Apenas mais um
pequeno adendo.
B
Empate tcnico

Estamos acostumados a ouvir declaraes do tipo os candi-


datos A e B esto tecnicamente empatados na preferncia eleitoral.
O que significa isso? Geralmente as pesquisas de opinio eleitoral
consistem em obter as propores de entrevistados que declara votar
neste ou naquele candidato, naquele momento. Posteriormente as pro-
pores so generalizadas estatisticamente para a populao, atravs
do clculo de intervalos de confiana para as propores de cada can-
didato. Se os intervalos de confiana das propores de dois ou mais
candidatos apresentam grandes superposies declara-se que h um
empate tcnico: as diferenas entre eles devem-se provavelmente ao
acaso, e para todos os fins esto em condies virtualmente iguais,
naquele momento.
Neste exemplo 5, imagine que uma pesquisa de opinio eleito-
ral apresentasse os seguintes resultados (intervalos de confiana para
a proporo que declara votar no candidato) sobre a prefeitura do
municpio de Tapioca. Quais candidatos esto tecnicamente empata-
dos (Quadro 22)?

Perodo 3 237
9 OPINIO
Godofredo Astrogildo
LIMITE INFERIOR %
31%
LIMITE SUPERIOR %
37%
UNIDADE

Filismino Arquibaldo 14% 20%


Urraca Hermengarda 13% 19%
Salustiano Quintanilha 22% 28%
Indecisos 11% 17%

Quadro 22: Resultados de uma pesquisa eleitoral municipal (fictcia).


Fonte: elaborado pelo autor.

Filismino e Urraca esto tecnicamente empatados, pois seus


intervalos de confiana apresentam grande sobreposio. Godofredo
est muito na frente, pois o limite inferior de seu intervalo maior do
que o limite superior de Salustiano, que est em segundo lugar. im-
portante ressaltar que o nmero de indecisos razovel, variando de
11 a 17%, quando eles se decidirem podero mudar completamente o
quadro da eleio, ou garantir a vitria folgada de Godofredo.

Saiba mais
Sobre propriedades e caractersticas desejveis de um estimador,
BARBETTA, Pedro A.; REIS, Marcelo M.; BORNIA, Antonio C. Estatstica
para Cursos de Engenharia e Informtica. 2. ed. So Paulo: Atlas, 2008,
Captulo 7.

Sobre estimadores e intervalos de confiana para varincia, TRIOLA, Mario.


Introduo Estatstica. Rio de Janeiro: LTC, 1999, Captulo 6.

Para entender melhor o conceito de distribuio amostral e sua relao com


estimao de parmetros, veja o arquivo Estima.xls, e suas instrues, no
ambiente virtual;

Sobre a utilizao do Microsoft Excel para realizar estimao por intervalo,


LEVINE, David M.; STEPHAN, David; KREHBIEL, Timothy C.;
BERENSON, Mark L. Estatstica: Teoria e Aplicaes Usando Microsoft
Excel em Portugus. 5. ed. Rio de Janeiro: LTC, 200, Captulo 6.

238 Curso de Graduao em Administrao, modalidade a distncia


Resumindo
r 9

UNIDADE
O resumo desta Unidade est mostrado na Figura 72:

Figura 72: Resumo da Unidade 9.


Fonte: elaborado pelo autor.

Perodo 3 239
9 B Vimos nesta Unidade sobre os conceitos de Esti-
mao de Parmetros. Aprendemos a estimar os
parmetros mdia de uma varivel quantitativa e
UNIDADE

proporo de um dos valores de uma varivel qua-


litativa. Alm de definir o tamanho mnimo de uma
amostra aleatria para estimar mdia e proporo.
Veremos mais sobre esse assunto na ltima Unida-
de deste livro. Estamos prximos do final do nosso
material e de suma importncia a continuidade
da interao com seus colegas e professor. No
deixe de ver as tabelas indicadas no livro e dispo-
nveis no Ambiente Virtual de Ensino-Aprendiza-
gem e de realizar a atividade de aprendizagem.

Atividades de aprendizagem
aprendizagem
1) Buscando melhorar a qualidade do servio, uma empresa estuda o
tempo de atraso na entrega dos pedidos recebidos. Supondo que o
tempo de atraso se encontra normalmente distribudo, e conhecendo
o tempo de atraso dos ltimos 20 pedidos, descritos abaixo (em dias),
determine:

5 1 0 3 6 10 2 3 4 1 5 3 1 6 6 9 0 0 1 0

a) Estime o atraso mdio na entrega dos pedidos com confian-


a de 90%.
b) Se fosse conhecido que a populao possui desvio padro
igual a 2 dias, como ficaria a resposta do item a)?
c) Para a situao do item a (varincia populacional desco-
nhecida), o tamanho da amostra suficiente, se necess-
ria uma preciso de 0,5 dias, para o mesmo nvel de con-
fiana?

240 Curso de Graduao em Administrao, modalidade a distncia


2) A satisfao da populao em relao a determinado governo foi
pesquisada atravs de uma amostra com a opinio de 1.000 habi-
tantes do estado. Destes, 585 se declararam insatisfeitas com a ad-
9

UNIDADE
ministrao estadual. Admitindo-se um nvel de significncia de 5%,
solucione os itens abaixo.
a) Estime o percentual da populao que est insatisfeita com
a administrao estadual.
b) Qual o tamanho da amostra necessria para a estimao se
a empresa responsvel pela pesquisa estipulou uma folga
mxima de 2,5%?
3) Os ndices apresentados pelos alunos do curso de Economia e de
Administrao esto sendo questionados pelos alunos, no sentido de
definirem se h diferena entre os cursos. Para tanto foram analisa-
dos os ndices de 10 alunos de cada curso, escolhidos aleatoriamen-
te dentre os regularmente matriculados e anotados seus valores, onde
se obteve:
Economia mdia 7,3 desvio padro 2,6
Administrao mdia 7,1 desvio padro 3,1
a) Estime os valores mdios dos ndices de cada curso com
95% de confiana.
b) Para o mesmo nvel de confiana de a. Ser que 10 alunos
uma amostra suficiente, em ambos os cursos, para esti-
mar seus ndices mdios, com uma preciso igual a 1?
4) O CRA de SC est conduzindo uma pesquisa sobre a opinio dos
acadmicos de administrao sobre seus respectivos cursos. Suspei-
ta-se que haja diferena entre as propores de satisfeitos de insti-
tuies pblicas e privadas: os acadmicos das pblicas seriam mais
satisfeitos. Para avaliar esta suposio foi conduzida uma pesquisa
por amostragem, entrevistando alunos de duas instituies pblicas,
SHUFSC e GASE, e de trs privadas, PATPIO de S, UNIMALI e
UNILUS. Os resultados esto na tabela a seguir:

Perodo 3 241
9 MEDIDAS SHUFSC GASE
UNIVERSIDADES
PATPIO UNIMALI UNILUS
UNIDADE

n 120 165 185 194 189


p 0,55 0,48 0,32 0,49 0,25
N (populao) 890 900 1500 1200 1800

Usando 1% de significncia responda os itens a seguir:


a) Estime a proporo populacional de satisfeitos com o seu
curso, em cada universidade*.
b) Para uma margem de erro de 2% qual deveria ser o tama-
nho de amostra para estimar a proporo de satisfeitos em
cada universidade?*

242 Curso de Graduao em Administrao, modalidade a distncia


10 9

UNIDADE
Testes de Hipteses
UNIDADE

D
Objetivo
Nesta Unidade voc conhecer e aplicar os
conceitos de Testes de Hipteses, especialmente para
mdia de uma varivel quantitativa, proporo de
um dos valores de uma varivel quantitativa, e
associao entre duas variveis qualitativas. Voc
aprender tambm qual a importncia de tais
conceitos para o dia-a-dia do administrador.

Perodo 3 243
10
UNIDADE

244 Curso de Graduao em Administrao, modalidade a distncia


Lgica dos Testes de Hipteses 10

UNIDADE
Caro estudante, voc viu anteriormente que uma
determinada populao pode ser descrita atravs
de um modelo, que apresenta caractersticas e
parmetros. Muitas vezes esses parmetros so
desconhecidos e h interesse em estim-los para
obter um melhor conhecimento sobre a popula-
B
o: retira-se ento uma amostra aleatria da po- Te s t e s p a r a m t r i c o s
pulao e atravs das tcnicas de Estimao de testes de hipteses sobre
parmetros do modelo da
Parmetros (Unidade 9) procura-se obter uma esti- varivel sob anlise Fonte:
mativa de algum parmetro de interesse, e associ- elaborado pelo autor.
amos uma probabilidade de que a estimativa este- Te s t e s n o p a r a m t r i -
ja correta. Nesta ltima e importantssima Unida- cos testes de hipteses
sobre outros aspectos do
de veremos que a Estimao de Parmetros uma
modelo da varivel sob an-
subdiviso da Inferncia Estatstica (que consiste lise ou alternativas aos tes-
em fazer afirmaes probabilsticas sobre o mode- tes paramtricos quando as
condies para uso destes
lo da populao a partir de uma amostra aleatria
no forem satisfeitas. Fon-
desta populao), a outra grande subdiviso cons- te: elaborado pelo autor.
titui os Testes de Hipteses. Vamos saber mais!

C
ontrariamente Estimao de Parmetros os Testes de Hipte-
ses permitem fazer inferncias sobre outras caractersticas do
modelo da populao alm dos
parmetros, como, por exemplo, a forma do mo- T a fim de saber
delo da populao. Quando os Testes so feitos
Na realidade a denominao correta deveria ser
sobre os parmetros da populao so chama-
Testes dependentes de distribuio de refern-
dos de Testes Paramtricos, e quando so feitos
cia (porque para fazer inferncias sobre os
sobre outras caractersticas so chamados de
parmetros devemos supor que o modelo
Testes No Paramtricos. No obstante vamos
probabilstico populacional normal, por exem-
nos restringir aos Testes Paramtricos: de uma
plo, ou que a distribuio amostral do parmetro
mdia de uma varivel quantitativa e de uma
pode ser aproximada por uma normal). J os no
proporo de um dos valores de uma varivel
paramtricos deveriam ser Testes livres de distri-
qualitativa.
buio (porque os Testes No Paramtricos no
Vimos que uma determinada populao exigem que os dados tenham uma aderncia a
pode ser descrita atravs de um modelo certo modelo).

Perodo 3 245
10 probabilstico, que apresenta caractersticas e parmetros. Muitas ve-
zes estes parmetros so desconhecidos e h interesse em estim-los
para obter um melhor conhecimento sobre a populao: retira-se en-
UNIDADE

to uma amostra aleatria da populao e atravs das tcnicas de


Estimao de Parmetros (Unidade 9) procura-se obter uma esti-
mativa de algum parmetro de interesse, e associamos uma probabi-
lidade de que a estimativa esteja correta. A Estimao de Parmetros
uma subdiviso da Inferncia Estatstica (que consiste em fazer afir-
maes probabilsticas sobre o modelo probabilstico da populao a
partir de uma amostra aleatria desta populao), a outra grande sub-
diviso constitui os Testes de Hipteses.
Contrariamente Estimao de Parmetros os Testes de Hip-
teses permitem fazer inferncias sobre outras caractersticas do mode-
lo probabilstico da populao alm dos parmetros (como por exem-
plo a forma do modelo probabilstico da populao). Quando os Tes-
tes so feitos sobre os parmetros da populao so chamados de

v
Testes Paramtricos, e quando so feitos sobre outras caractersticas
A voc estudante inte- so chamados de Testes No Paramtricos No obstante vamos nos
ressado em Testes No restringir aos Testes Paramtricos.
Paramtricos recomen- Imagine-se que um determinado pesquisador est interessado
do a seguinte refern- em alguma caracterstica de uma populao. Devido a estudos prvi-
cia: SIEGEL, Sidney. os, ou simplesmente por bom senso (melhor ponto de partida para o
Estatstica No estudo) ele estabelece que a caracterstica ter um determinado com-
Paramtrica (para portamento. Formula ento uma hiptese estatstica sobre a caracte-
as Cincias do rstica da populao, e essa hiptese aceita como vlida at prova
Comportamento).
estatstica em contrrio.
McGraw-Hill: So Pau-
Para testar a hiptese coletada uma amostra aleatria repre-
lo, 1975. uma boa
sentativa da populao, sendo calculadas as estatsticas necessrias
referncia no assunto,
em portugus. para o teste. Naturalmente, devido ao fato de ser utilizada uma amos-
tra aleatria, haver diferenas entre o que se esperava, sob a condi-
o da hiptese verdadeira, e o que realmente foi obtido na amostra.
A questo a ser respondida : as diferenas so significativas o bas-
tante para que a hiptese estatstica estabelecida seja rejeitada? Esta
no uma pergunta simples de responder: depender do que est sob
teste (que parmetro, por exemplo), da confiabilidade desejada para
o resultado, entre outros. Basicamente, porm, ser necessrio com-
parar as diferenas com uma referncia, a distribuio amostral de
um parmetro, por exemplo, que supe que a hiptese sob teste ver-
dadeira: a comparao costuma ser feita atravs de uma estatstica
de teste que envolve os valores da amostra e os valores sob teste.

246 Curso de Graduao em Administrao, modalidade a distncia


A tomada de deciso feita da seguinte forma:

z se a diferena entre o que foi observado na amostra e o que


10

UNIDADE
era esperado (sob a condio da hiptese verdadeira) no
for significativa a hiptese ser aceita; e
z se a diferena entre o que foi observado na amostra e o que
era esperado (sob a condio da hiptese verdadeira) for
significativa a hiptese ser rejeitada.

O valor a partir do qual a diferena ser considerada significa-


tiva ser determinado pelo Nvel de Significncia do teste. O Nvel de
Significncia geralmente fixado pelo pesquisador, muitas vezes de
forma arbitrria, e tambm ser a probabilidade de erro do Teste de
Hipteses: a probabilidade de cometer um erro no teste, rejeitando
uma hiptese vlida. Como a deciso do teste tomada a partir dos

v
Usando outros mtodos
dados de uma amostra aleatria da populao h sempre a probabili- (empricos) no h como
dade de estar cometendo um erro, mas com a utilizao de mtodos ter ideia da chance de
estatsticos possvel calcular o valor desta probabilidade. erro (pode ser um erro
O Nvel de Significncia uma probabilidade, portanto , um de 0% ou de
5.000%...).
nmero real que varia de 0 a 1 (0 a 100%), e como a probabilidade
de se cometer um erro no teste interessante que seja o mais prximo
possvel de zero: valores tpicos so 5%, 10%, 1% e at menores de-
pendendo do problema sob anlise. Contudo, no possvel usar um
Nvel de Significncia igual a zero porque devido ao uso de uma amos- Nvel de Significncia
tra aleatria sempre haver chance de erro, a no ser que a amostra probabilidade arbitrada
pelo pesquisador, valor m-
fosse do tamanho da populao. O complementar do Nvel de
ximo de erro admissvel
Significncia chamado de Nvel de Confiana, pois ele indica a para rejeitar a hiptese nula
confiabilidade do resultado obtido, a probabilidade de que a deciso sendo ela verdadeira, espe-
ra-se que seja um valor bai-
tomada esteja correta

B
xo, de no mximo 10%.
Fonte: Barbetta, Reis e
Bornia (2008); Moore,
Voc deve estar lembrado desses dois conceitos McCabe, Duckworth e
Sclove (2006).
de Estimao de Parmetros: Nvel de Confiana
era a probabilidade de que o Intervalo de Confian-
a contivesse o valor real do parmetro, e Nvel de
Significncia, complementar daquele, era a proba-
bilidade de que o Inter valo no contivesse o
parmetro, em suma a probabilidade da Estima-
o estar correta ou no, respectivamente.

Perodo 3 247
10 Tipos de Hipteses
UNIDADE

Para realizar um Teste de Hipteses necessrio definir (enun-


ciar) duas Hipteses Estatsticas complementares (que abrangem to-
dos os resultados possveis): a chamada Hiptese Nula (denotada
por H0) e a Hiptese Alternativa (denotada por H1 ou Ha). Enunci-
ar as hipteses o primeiro e possivelmente mais importante passo de
um Teste de Hipteses, pois todo o procedimento depender dele.
A Hiptese Nula (H0) a hiptese estatstica aceita como ver-
dadeira at prova estatstica em contrrio: pode ser o ponto de parti-
da mais adequado para o estudo, ou exatamente o contrrio do que o
pesquisador quer provar (ou o contrrio daquilo que o preocupa).
A Hiptese Alternativa (H1), que ser uma hiptese comple-
mentar de H0, fornecer uma alternativa hiptese nula: muitas vezes
justamente o que o pesquisador quer provar (ou o que o preocupa).
Quando as hipteses so formuladas sobre os parmetros do
modelo probabilstico da populao o Teste de Hipteses chamado
de Paramtrico. Quando as hipteses so formuladas sobre outras
caractersticas do modelo o Teste chamado de No Paramtrico.
A deciso do teste consiste em aceitar ou rejeitar a Hiptese
Nula (H0): aceitar-se ou no a hiptese at ento considerada verda-
deira.
importante ter a noo exata do que significa aceitar ou re-
jeitar a Hiptese Nula (H0). A deciso tomada sobre esta hiptese e
no sobre a Hiptese Alternativa porque a Hiptese Nula que con-
siderada verdadeira (at prova em contrrio). Quando se aceita a
Hiptese Nula significa que no h provas suficientes para rejeit-la.
J quando a deciso por rejeitar a Hiptese Nula h evidncias
suficientes de que as diferenas obtidas (entre o que era esperado e o
que foi observado na amostra) no ocorreram por acaso. Usando uma
analogia com o direito dos EUA, aceitar H0 seria comparvel a um
veredito de no culpado not guilty, ou seja, no h provas suficien-
tes para condenar o ru. Por outro lado rejeitar H0 seria comparvel a
um veredito de culpado guilty, ou seja, as provas reunidas so sufi-
cientes para condenar o ru. O Nvel de Significncia ser a proba-
bilidade assumida de Rejeitar H0 sendo H0 verdadeira.

248 Curso de Graduao em Administrao, modalidade a distncia


Tipos de Testes Paramtricos
10

UNIDADE
A formulao das hipteses o ponto inicial do problema, e
deve depender nica e exclusivamente das concluses que se preten-
de obter com o teste. A formulao da hiptese alternativa determina-
r o tipo de teste: se Unilateral ou Bilateral.
Se a formulao da hiptese alternativa indicar que o parmetro
maior ou menor do que o valor de teste (valor considerado verdadei-
ro at prova em contrrio) o teste ser Unilateral: somente h inte-
resse se as diferenas entre os dados da amostra e o valor de teste
forem em uma determinada direo. Se a formulao da hiptese al-
ternativa indicar que o parmetro diferente do valor de teste o teste
ser Bilateral: h interesse nas diferenas em qualquer direo. As
hipteses ento seriam:

Testes Unilaterais
H0: parmetro = valor de teste.
Te s t e u n i l a t e r a l teste
H1: parmetro < valor de teste. no qual a regio de rejeio
da hiptese nula est con-
H0: parmetro = valor de teste. centrada em apenas um dos
lados da distribuio
H1: parmetro > valor de teste. amostral da varivel de tes-
te. Fonte: Barbetta, Reis e
Testes Bilaterais
Bornia (2008).
H0: parmetro = valor de teste. Teste bilateral teste no
qual a regio de rejeio da
H1: parmetro valor de teste.
hiptese nula est dividida
em duas partes, em cada
A escolha do tipo de teste depender das condies do proble- um dos lados da distribui-
o amostral da varivel de
ma sob estudo, sejam as trs situaes abaixo:
teste. Fonte: Barbetta, Reis
e Bornia (2008).
a) Um novo protocolo de atendimento foi implementado no
Banco RMG, visando reduzir o tempo que as pessoas pas-
sam na fila do caixa. O protocolo ser considerado
satisfatrio se a mdia do tempo de fila for menor do que
30 minutos. Um teste Unilateral seria o adequado.
b) Cerca de 2.000 formulrios de pedidos de compra esto
sendo analisados. Os clientes podem ficar insatisfeitos se
houver erros nos formulrios. Neste caso, admite-se que a
proporo mxima de formulrios com erros seja de 5%.

Perodo 3 249
10 Ou seja, um valor maior do que 5% causaria problemas.
Um teste Unilateral seria o adequado.
c) Uma pea automotiva precisa ter 100 mm de dimetro,
UNIDADE

exatamente. Neste caso, a dimenso no pode ser maior


ou menor do que 100 mm (em outras palavras no pode
ser diferente de 100 mm), pois isso indicar que a pea
no est de acordo com as especificaes. Um teste Bila-
teral seria o adequado.

Aps definir as hipteses coletada uma amostra aleatria da


populao para test-las.

!
importante ressaltar que a montagem das hipteses
deve depender apenas das concluses que se preten-
de obter e jamais de uma eventual evidncia amostral
disponvel.

A deciso de aceitar ou rejeitar H0 depender das regies de


aceitao e rejeio de H0, que por sua vez dependem dos seguin-
tes fatores:

z do parmetro sob teste (e da estatstica ou varivel de teste


usada para test-lo).
z do tipo de teste, se Unilateral ou Bilateral.
z do valor de teste (valor do parmetro considerado verda-
deiro at prova em contrrio).
) ou Nvel de Confiana (1 )
z do Nvel de Significncia (
adotado.
z de um valor crtico da estatstica ou varivel de teste a par-
tir do qual a hiptese ser rejeitada, e esse valor depende-
r por sua vez do Nvel de Significncia, do tipo de teste e
da Distribuio Amostral do parmetro.

A Regio de Aceitao de H0 ser a faixa de valores da


estatstica (ou da varivel de teste) associada ao parmetro em que as
diferenas entre o que foi observado na amostra e o que era esperado
no so significativas.

250 Curso de Graduao em Administrao, modalidade a distncia


A Regio de Rejeio de H0 ser a faixa de valores da esta-
tstica (ou da varivel de teste) associada ao parmetro em que as
diferenas entre o que foi observado na amostra e o que era esperado
10

UNIDADE
so significativas.
Essa abordagem chamada de abordagem clssica dos testes
de hipteses. H tambm a do valor-p, muito usada por programas
computacionais. Mas, neste texto, vamos usar apenas a clssica por
consider-la mais clara.
Para entender melhor os conceitos acima, observe a situao a
seguir:
H interesse em realizar um teste de hipteses sobre o compri-
mento mdio de uma das dimenses de uma pea mecnica. O valor
nominal da mdia (aceito como verdadeiro at prova em contrrio)
igual a b (valor genrico), H0: = b. Supondo que a distribuio
amostral do parmetro (distribuio de 0 ) seja normal, e ser centrada
em b: possvel fazer a converso para a distribuio normal padro
(mdia zero e desvio padro 1, varivel Z) (Figuras 73 e 74).

H0: = b
Figura 73: Hiptese nula: mdia populacional = b.
Fonte: elaborada pelo autor.

H0: = 0
Figura 74: Hiptese nula normal padro.
Fonte: elaborada pelo autor.

Perodo 3 251
10 O valor de b (mdia da dimenso e mdia de 0 ) corresponde a
zero, mdia da varivel Z. Dependendo da formulao da Hiptese
Alternativa haveria diferentes Regies de Rejeio de H0.
UNIDADE

Se a Hiptese Alternativa fosse H1: < b (H1: < 0), ou seja,


se o teste fosse Unilateral esquerda a Regio de Rejeio de H 0
seria (Figuras 75 e 76):

Figura 75 H1: < b.


Fonte: elaborada pelo autor.

Figura 76 H1: < 0.


Fonte: elaborada pelo autor.

Observe que h um valor crtico de 0: abaixo dele a Hiptese


Nula ser rejeitada, acima ser aceita. A determinao do valor
feita com base no Nvel de Significncia, a rea abaixo da curva nor-
mal at o valor crtico de 0. Geralmente obtm-se o valor crtico da
varivel de teste (Z neste caso, na segunda figura) atravs de uma
tabela, que corresponde ao valor crtico de 0, faz-se a transformao
de variveis e obtm-se o valor crtico de 0. 0 o valor

252 Curso de Graduao em Administrao, modalidade a distncia


sob teste (b no exemplo) e um desvio padro (cujo valor ser
explicitado posteriormente).
A deciso ser tomada comparando valor da mdia amostral 0
10

UNIDADE
com o valor crtico desta mesma mdia: se for menor do que o valor
crtico 0crtivo, ou seja, est na regio de Rejeio de H0) ento rejei-
ta-se a Hiptese Nula. muito comum tambm tomar a deciso com-
parando o valor da varivel de teste (Z neste caso), obtido com base
nos dados da amostra, com o valor crtico Zcrtico desta mesma varivel
(obtido de uma tabela ou programa computacional): se for menor do
que o valor crtico rejeita-se a Hiptese Nula. Observe que o valor do
Nvel de Significncia colocado na curva referente Hiptese
Nula, porque esta que aceita como vlida at prova em contrrio.

v
Observe tambm que a faixa de valores da regio de Rejeio perten-
ce curva da Hiptese Nula, assim o valor a probabilidade de
Rejeitar H0 sendo H0 verdadeira. Probabilidade de tomar
uma deciso errada fixa-
Neste ponto importante ressaltar um ponto que costuma pas-
da pelo pesquisador.
sar despercebido. Se a deciso for tomada com base na varivel de
teste (Z, por exemplo) interessante notar que, como o teste Unilate-
ral esquerda o valor Zcrtico ser NEGATIVO, uma vez que a regio de
Rejeio de H0 est ESQUERDA de 0 (menor do que zero). No teste
Unilateral direita, que veremos a seguir, o valor de Z crtico ser positi-
vo, pois a regio de Rejeio de H0 estar DIREITA de 0 (maior do
que zero). Se por exemplo o Nvel de Significncia fosse de 5% (0,05)

v
o valor de Zcrtico para o teste Unilateral esquerda seria 1,645. Se
houvesse interesse em obter o valor de 0 crtivo correspondente bastaria
usar a expresso Z = (0 0)/ substituindo Z por 1,645. O sinal correto impor-
tante para que o valor de
Se a Hiptese Alternativa fosse H1: > b (H1: > 0), ou seja,
coerente com a posio
se o teste fosse Unilateral direita a Regio de Rejeio de H0 seria
da regio de Rejeio de
(Figuras 77 e 78):
H 0.

Figura 77 H1: > b.


Fonte: Elaborada pelo autor.

Perodo 3 253
10
UNIDADE

Figura 78 H1: > 0.


Fonte: elaborada pelo autor.

Neste caso o valor crtico est direita: se a mdia amostral 0


ou a varivel de teste Z tiverem valores superiores aos respectivos va-
lores crticos, a Hiptese Nula ser rejeitada, pois os valores caram
na regio de Rejeio de H0. Como foi notado anteriormente o valor
de Zcrtico ser positivo, pois maior do que zero: usando o mesmo Nvel
de Significncia de 5% o valor de Zcrtico seria 1,645, igual em mdulo
ao anterior, uma vez que a distribuio normal padro simtrica em
relao sua mdia que igual a zero.
Se a Hiptese Alternativa fosse H1: b (H1: 0), ou seja,
o teste fosse Unilateral direita a Regio de Rejeio de H0 seria
(Figuras 79 e 80):

Figura 79 H1: b.
Fonte: elaborada pelo autor.

254 Curso de Graduao em Administrao, modalidade a distncia


10

UNIDADE
Figura 80 H1: 0.
Fonte: elaborada pelo autor.

Neste caso a regio de Rejeio se divide em duas iguais (pro-


babilidades iguais metade do Nvel de Significncia ), semelhante
ao que acontece na Estimao por Intervalo. Existiro dois valores
crticos, um abaixo do valor de teste e outro acima: se a mdia amostral
0 ou a varivel de teste Z tiverem valores acima do valor crtico su-
perior ou abaixo do valor crtico inferior a Hiptese Nula ser re-
jeitada, pois os valores caram em uma das duas regies de Rejei-
o. Se for usada a varivel de teste Z os valores crticos sero iguais
em mdulo, pois esto mesma distncia do valor sob teste (zero).
Recordando as trs situaes que foram abordadas anterior-
mente, seria interessante definir completamente as Hipteses Estats-
ticas. Nos dois primeiros casos optou-se por um Teste Unilateral e no
terceiro por um Teste Bilateral.

a) Um novo protocolo de atendimento foi implementado no


Banco RMG, visando reduzir o tempo que as pessoas pas-
sam na fila do caixa. O protocolo ser considerado
satisfatrio, se a mdia do tempo de fila for menor do que
30 minutos. Um teste Unilateral seria o adequado. Mas
Unilateral Esquerda ou Direita? Como est grifado na
frase anterior haver problema se a mdia do tempo fosse
menor do que 30, resultando:
Teste unilateral esquerda:
H0: = 30 onde 0 = 30 (valor de teste); e
H1: < 30 Teste Unilateral Esquerda.

Perodo 3 255
10 b) Cerca de 2.000 formulrios de pedidos de compra esto
sendo analisados. Os clientes podem ficar insatisfeitos se
houver erros nos formulrios. Nesse caso, admite-se que a
UNIDADE

proporo mxima de formulrios com erros seja de 5%.


Ou seja, um valor maior do que 5% causaria problemas.
Um teste Unilateral seria o adequado. Nesse caso, um
teste de proporo, o problema ser um valor maior do que
5%, resultando:
Teste unilateral direita:
H0: = 5%, onde 0 = 5% (valor de teste); e
H1: > 5%.
c) Uma pea automotiva precisa ter 100 mm de dimetro,
exatamente. Nesse caso, a dimenso no pode ser maior
ou menor do que 100 mm (em outras palavras no pode
ser diferente de 100 mm), pois isso indicar que a pea
no est de acordo com as especificaes. Um teste Bila-
teral seria o adequado, resultando:
Teste Bilateral:
H0: = 100 mm, onde 0 = 100 mm (valor de teste); e
H1: 100 mm.

Para a definio correta das hipteses imprescindvel a cor-


reta identificao do valor de teste, pois se trata de um dos aspectos
mais importantes do teste: o resultado da amostra ser comparado ao
valor de teste.
Lembrando novamente que a tomada de deciso depende da
correta determinao da regio de Rejeio (e, por conseguinte, de
Aceitao) da Hiptese Nula, e isso, por sua vez, depende diretamen-
te da formulao das Hipteses Estatsticas.

256 Curso de Graduao em Administrao, modalidade a distncia


Testes de Hipteses sobre a Mdia de uma Varivel
em uma Populao
10

UNIDADE
Nesse caso, h interesse em testar a hiptese de que o parmetro
mdia populacional () de uma certa varivel quantitativa seja maior,
menor ou diferente de um certo valor. Para a realizao desse teste
necessrio que uma das duas condies seja satisfeita:

z sabe-se, ou razovel supor, que a varivel de interesse


segue um modelo normal na populao: isso significa que
a distribuio amostral da mdia tambm ser normal, per-
mitindo realizar a inferncia estatstica paramtrica; H muita controvrsia a
z a distribuio da varivel na populao desconhecida, respeito do que seria

v
mas a amostra retirada desta populao considerada su- uma amostra suficien-
temente grande, mas
ficientemente grande o que, de acordo com o Teorema
geralmente uma amos-
Central do Limite, permite concluir que a distribuio
tra com pelo menos 30
amostral da mdia normal; e
elementos costuma ser
z supe-se tambm que a amostra representativa da popu- considerada grande o
lao e foi retirada de forma aleatria. bastante para que a dis-
tribuio amostral da
Tal como na Estimao de Parmetros por Intervalo existiro mdia possa ser aproxi-
diferenas nos testes, dependendo do conhecimento ou no da mada por uma normal.
varincia populacional da varivel.
a) Se a varincia populacional ( ) da varivel (cuja mdia
populacional se quer testar) for conhecida.
Nesse caso, a varincia amostral da mdia poder ser calcula-

v
da atravs da expresso:

, e, por conseguinte, o desvio padro ser . O desvio padro a raiz


quadrada positiva da
A varivel de teste ser a varivel Z da distribuio normal pa- varincia.
dro, lembrando que:

A mdia ser o valor de teste (suposto verdadeiro at prova


em contrrio), denotado por 0. O valor (obtido pela amostra) ser a
mdia amostral (que o melhor estimador da mdia populacional)

Perodo 3 257
10 denotada por 0, e o desvio padro ser o valor obtido anteriormen-
te. Sendo assim, a expresso da varivel de teste Z:
UNIDADE

Compara-se o valor da varivel de teste com o valor crtico


(Zcrtico que depende do Nvel de Significncia adotado) de acordo com
o tipo de teste (as expresses abaixo tambm esto no apndice):

v
Se H1 : > 0 Rejeitar H0 se Z > Z crtico (0 > 0crtico);
Neste caso Zcrtico Se H1 : < 0 Rejeitar H0 se Z < Z crtico (0 < 0crtico); e
ser negativo, j que a
Se H1 : 0 Rejeitar H0 se |Z||Zcrtico|.
regio de Rejeio de
H0 est esquerda de b) Se a varincia populacional da varivel for desconhecida.
zero. Naturalmente esse o caso mais encontrado na prtica. Como
se deve proceder? Depender do tamanho da amostra.

b.1 Grandes amostras (mais de 30 elementos):


Nestes casos procede-se como no item anterior, apenas fa-
zendo com que =s, ou seja, considerando que o desvio
padro da varivel na populao igual ao desvio padro
da varivel na amostra (suposio razovel para grandes
amostras);
b.2 Pequenas amostras (at 30 elementos):
Nestes casos a aproximao do item b.1 no ser vivel.
Ter que ser feita uma correo na distribuio normal
padro (Z) atravs da distribuio t de Student. Essa
distribuio j conhecida (ver Unidades 6 e 9). Trata-se
de uma distribuio de probabilidades que possui mdia
zero (como a distribuio normal padro, varivel Z), mas
sua varincia igual a n/(n-2), ou seja, a varincia depen-
de do tamanho da amostra. Quanto maior for o tamanho
da amostra mais o quociente acima se aproxima de 1 (a
varincia da distribuio normal padro), e mais a distri-
E talvez este seja o buio t de Student aproxima-se da distribuio normal
motivo de se conside- padro. A partir de n = 30, j possvel considerar a

v
rar mais de 30 elemen- varincia da distribuio t de Student aproximadamente
tos como sendo uma igual a 1.
amostra suficiente-
mente grande.

258 Curso de Graduao em Administrao, modalidade a distncia


dade):
A varivel de teste ser ento tn-1 (t com n 1 graus de liber-
10

UNIDADE
onde s o desvio padro amostral e os outros valores tm o mesmo
significado da expresso anterior.
Compara-se o valor da varivel de teste com o valor crtico
(tn-1,crtico que depende do Nvel de Significncia adotado) de acordo
com o tipo de teste (as expresses abaixo tambm esto no Apndice):

Se H1: > 0 Rejeitar H0 se tn-1 > tn-1,crtico (0 > 0crtico);

v
Se H1: < 0 Rejeitar H0 se tn-1 > tn-1,crtico (0 < 0crtico); e
Se H1: : 0 Rejeitar H0 se |tn-1| |tn-1,crtico|. neste caso tn-1,crtico ser
negativo, j que a regio
A correta identificao dos valores crticos, decorrente da cor-
de Rejeio de H 0 est
reta identificao da regio de rejeio de H0, por sua vez decorrente
esquerda de zero.
da adequada formulao das hipteses estatsticas, indispensvel
para que o resultado obtido seja coerente.
Uma pea automotiva precisa ter 100 mm de dimetro, exata-
mente. Foram medidas 15 peas, aleatoriamente escolhidas. Obteve-
se mdia de 100,7 mm e varincia de 0,01 mm. Supe-se que a di-
menso segue distribuio normal na populao. A pea est dentro
das especificaes? Usar 1% de significncia? Vejamos neste primei-
ro exemplo:
Enunciar as hipteses.
Conforme visto anteriormente o teste mais adequado para este
caso um Teste Bilateral:

H0: = 100 mm, onde 0 = 100 mm (valor de teste); e


H1: 100 mm.

Nvel de significncia.
O problema declara que necessrio usar 1% de significncia
(se no fosse especificado, outro valor poderia ser usado).
Varivel de teste.
Uma vez que a varincia populacional da varivel DESCO-
NHECIDA (o valor fornecido a varincia amostral), e a amostra
retirada apresenta apenas 15 elementos (portanto menos de 30) a va-
rivel de teste ser tn-1 da distribuio t de Student.

Perodo 3 259
10 Definir a regio de aceitao de H0 (Figura 81).
UNIDADE

Figura 81: Regies de rejeio e aceitao da hiptese nula Teste bilateral


de mdia.
Fonte: elaborada pelo autor.

Observe que por ser um teste Bilateral o Nvel de Significncia


foi dividido em dois, metade para cada regio de rejeio de H0.
Para encontrar o valor crtico devemos procurar na tabela da distri-
buio de Student, na linha correspondente a n1 graus de liberdade,
ou seja, em 15 1 = 14 graus de liberdade. O valor da probabilidade
pode ser visto na figura ao lado: os valores crticos sero t14;0,005 e
t14;0,995 os quais sero iguais em mdulo. E o valor de tn-1,crtico ser
igual a 2,977 (em mdulo).
Atravs dos valores da amostra, avaliar o valor da varivel.
Neste ponto preciso encontrar o valor da varivel de teste:

O valor de teste 0 igual a 100 mm, a mdia amostral 0 vale


100,7 mm, o tamanho de amostra n igual a 15 e o desvio padro
amostral s a raiz quadrada de 0,01 mm. Substituindo na equao
acima:

ento |t14|= 27,11.

Decidir pela aceitao ou rejeio de H0.


Como se trata de um teste bilateral:

Rejeitar H0 se |tn-1| |tn-1,crtico|; e


Como |t14| = 27,11 > |tn-1,crtico| = |t14,0,995|= 2,977.

260 Curso de Graduao em Administrao, modalidade a distncia


Rejeitar H0 a 1% de Significncia (h 1% de chance de erro).
10
v
Interpretar a deciso no contexto do problema. H provas es-

UNIDADE
tatsticas suficientes de que a dimenso da pea no est dentro das Cuidado
especificaes. com os ca-
Um novo protocolo de atendimento foi implementado no Ban- sos de
co RMG, visando reduzir o tempo que as pessoas passam na fila do FRONTEI-
caixa. O protocolo ser considerado satisfatrio se a mdia do tempo RA, em que
de fila for menor do que 30 minutos. Suponha que o tempo que 35 o valor da
clientes (selecionados aleatoriamente) passaram na fila foi monitorado, varivel de
resultando em uma mdia de 29 minutos e desvio padro de 5 minu- teste muito prximo do
valor crtico. Nesses ca-
tos. O protocolo pode ser considerado satisfatrio a 5% de
sos a rejeio ou aceita-
significncia? Vejamos neste segundo exemplo:
o de H 0 pode ocorrer
Esse problema j foi estudado anteriormente.
por acaso. Sempre que
Enunciar as hipteses. Conforme visto anteriormente o teste apresentar o resultado
mais adequado para este caso um Teste Unilateral Esquerda: recomende que uma
nova amostra seja reti-
H0: = 30, onde 0 = 30 (valor de teste); e
rada para avaliar nova-
H1: < 30. mente o problema. Mas
neste caso rejeita-se H0
Nvel de significncia. O problema declara que necessrio com folga.
usar 5%.
Varivel de teste. Uma vez que a varincia populacional da
varivel DESCONHECIDA (o valor fornecido o desvio padro
AMOSTRAL), mas a amostra retirada apresenta 35 elementos (por-
tanto mais de 30) a varivel de teste ser Z da distribuio normal.
Definir a regio de aceitao de H0 (Figura 82).

Figura 82: Regies de aceitao e de rejeio Teste unilateral esquerda.


Fonte: elaborada pelo autor.

Perodo 3 261
10 Observe que por ser um teste Unilateral Esquerda o Nvel de
Significncia est todo concentrado em um dos lados da distribui-
o, definindo a regio de rejeio de H0. Para encontrar o valor cr-
UNIDADE

tico devemos procurar na tabela da distribuio normal, pela proba-


bilidade acumulada 0,95. Ou procurar a probabilidade complementar
0,05 e mudar o sinal do valor encontrado, pois o Zcrtico aqui menor
do que zero. O valor crtico ser igual a 1,645.
Atravs dos valores da amostra avaliar o valor da varivel.
Neste ponto preciso encontrar o valor da varivel de teste:

O valor de teste 0 igual a 30, a mdia amostral 0 vale 29, o


tamanho de amostra n igual a 35 e o desvio padro amostral s 5.
Substituindo na equao acima:

Decidir pela aceitao ou rejeio de H0. Como se trata de um


teste Unilateral Direita:
Rejeitar H0 se Z < Zcrtico. Como Z = 1,185 > Zcrtico = 1,645.
Aceitar H0 a 5% de Significncia (h 5% de chance de erro).
Interpretar a deciso no contexto do problema. No h provas
estatsticas suficientes para concluir que o protocolo tem um desem-
penho satisfatrio.

Testes de Hipteses sobre a Proporo de


uma Varivel em uma Populao

Nesse caso h interesse em testar a hiptese de que o parmetro


proporo populacional ( ) de um dos valores de uma certa varivel
seja maior, menor ou diferente de um certo valor. Para a realizao
desse teste, tal como ser descrito necessrio que duas condies
sejam satisfeitas:

z que o produto n H 0 seja maior ou igual a 5; e

262 Curso de Graduao em Administrao, modalidade a distncia


z que o produto n H (1 0) seja maior ou igual a 5.

Onde n o tamanho da amostra e 0 a proporo sob teste


10

UNIDADE
(de um dos valores da varivel). Se ambas as condies forem satis-
feitas, a distribuio amostral da proporo que binomial (uma
Bernoulli repetida n vezes) pode ser aproximada por uma normal.
Obviamente supe-se que a amostra representativa da populao e
foi retirada de forma aleatria, e que a varivel pode assumir apenas
dois valores, aquele no qual h interesse e o seu complementar.
Se as condies acima forem satisfeitas, a distribuio amostral
da proporo poder ser aproximada por uma normal com:

Mdia = 0 Desvio Padro = .

Lembrando da expresso da varivel Z:

O valor ser a proporo amostral (que o melhor estimador


da proporo populacional) do valor da varivel denotada por p. A
mdia e o desvio padro so os valores definidos acima, ento a
expresso de Z ser:

Compara-se o valor da varivel de teste com o valor crtico


(Zcrtico que depende do Nvel de Significncia adotado) de acordo com
o tipo de teste:

v
Se H1 : > 0 Rejeitar H0 se Z > Zcrtico (p > pcrtico);
Se H1 : : < 0 Rejeitar H0 se Z < Zcrtico (p < pcrtico); e Neste caso Z crtico ser
Se H1: : 0 Rejeitar H0 se |Z| |Zcrtico|. negativo, j que a regio
de Rejeio de H 0 est
Cerca de 2.000 formulrios de pedidos de compra esto sendo esquerda de zero.
analisados. Os clientes podem ficar insatisfeitos se houver erros nos
formulrios. Neste caso admite-se que a proporo mxima de formu-
lrios com erros seja de 5%. Suponha que dentre os 2.000 formulrios
7% apresentavam erros. A proporo mxima foi ultrapassada a 1%
de significncia? Vejamos neste terceiro exemplo:

Perodo 3 263
10 Enunciar as hipteses. Conforme visto anteriormente, o teste
mais adequado para esse caso um Teste Unilateral Direita:
UNIDADE

H0: = 5%, onde 0 = 5% (valor de teste); e


H1: > 5%.

Nvel de significncia. O problema declara que necessrio


usar 1% de significncia (se no fosse especificado, outro valor pode-
ria ser usado).
Varivel de teste. Como se trata de um teste de proporo
necessrio verificar o valor dos produtos:

n H 0 = 2000 x 0,05 = 100 e n H (1 0) = 2000 x 0,95


= 1900. Como ambos so maiores do que 5 possvel fazer
uma aproximao pela normal, e a varivel de teste ser Z.

Definir a regio de aceitao de H0 (Figura 83).

Figura 83: Regies de aceitao e de rejeio Teste unilateral direita.


Fonte: elaborada pelo autor.

Observe que por ser um teste Unilateral Direita, o Nvel de


Significncia est todo concentrado em um dos lados da distribui-
o, definindo a regio de rejeio de H0. Para encontrar o valor cr-
tico devemos procurar na tabela da distribuio normal, pela proba-
bilidade acumulada 0,01 (o Zcrtico aqui maior do que zero). O valor
crtico ser igual a 2,326.
Atravs dos valores da amostra avaliar o valor da varivel. Nesse
ponto preciso encontrar o valor da varivel de teste:

264 Curso de Graduao em Administrao, modalidade a distncia


.
10

UNIDADE
O valor de teste 0 igual a 0,05 (5%), a proporo amostral p
vale 0,07 (7%), e o tamanho de amostra n igual a 2.000. Substituin-
do na equao acima:

Decidir pela aceitao ou rejeio de H0. Como se trata de um


teste Unilateral Direita:

Rejeitar H0 se Z > Zcrtico Como Z = 4,104 > Zcrtico = 2,326.


Rejeitar H0 a 1% de Significncia (h 1% de chance de erro).

v
Interpretar a deciso no contexto do problema. H provas es-
tatsticas suficientes de que a proporo est acima do mximo admi- Este no um caso de
tido. Provavelmente os vendedores/compradores precisaro passar por fronteira
novo treinamento.

B
Agora vamos ver um tipo de teste estatstico muito
utilizado pelos administradores, para avaliar o re-
lacionamento entre duas variveis qualitativas: o
teste de associao (independncia de
quiquadrado).

Te s t e d e a s s o c i a o
(independncia) de
quiquadrado teste que
permite avaliar se duas va-
Teste de associao de quiquadrado riveis qualitativas, cujas
frequncias esto dispostas
em uma tabela de contin-
gncias, apresentam asso-
O teste do quiquadrado, tambm chamado de teste de inde- ciao significativa ou no.
Fonte: Barbetta, Reis e
pendncia de quiquadrado, est vinculado anlise de duas variveis
Bornia (2008).
qualitativas. Vamos ver alguns conceitos antes de apresentar o teste
de associao de quiquadrado.

Perodo 3 265
10 Variveis qualitativas e tabelas de contingncia

comum haver interesse em saber se duas variveis quaisquer


UNIDADE

esto relacionadas, e o quanto esto relacionadas, seja na vida prti-


ca, seja em trabalhos de pesquisa, por exemplo:

z se a satisfao com um produto est relacionada faixa


etria do consumidor; e
z se a funo exercida por uma pessoa em uma organizao
est associada a seu gnero.

B Na Unidade 3 apresentamos tcnicas para tentar


responder s perguntas do pargrafo anterior.

Variveis Qualitativas so as variveis cujas realizaes so


atributos, categorias (Unidades 1 e 3). Como exemplo de variveis
qualitativas temos: sexo de uma pessoa (duas categorias, masculino e
feminino), grau de instruo (analfabeto, primeiro grau incompleto,
etc.), opinio sobre um assunto (favorvel, desfavorvel, indiferente).
Em estudos sobre variveis qualitativas extremamente comum
registrar as frequncias de ocorrncia de cada valor que as variveis
podem assumir, e quando h duas variveis envolvidas comum re-
gistrar-se a frequncia de ocorrncia dos cruzamentos entre valores:
por exemplo, quantas pessoas do sexo masculino so favorveis a uma
certa proposta de lei, quantas so desfavorveis, quantas pessoas do
sexo feminino so favorveis. E, para facilitar a anlise dos resulta-
dos, eles costumam ser dispostos em uma Tabela de Contingncias. A
Tabela de Contingncias relaciona os possveis valores de uma vari-
vel qualitativa com os possveis valores da outra, registrando quantas
ocorrncias foram verificadas de cada cruzamento.
Exemplo 4 O Quadro 23 mostra uma tabela de contingncias
relacionando as funes exercidas e o sexo de 474 funcionrios de
uma organizao.

266 Curso de Graduao em Administrao, modalidade a distncia


SEXO ESCRITRIO
FUNO
SERVIOS GERAIS GERNCIA TOTAL
10

UNIDADE
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474

Quadro 23: Tabela de contingncias de Funo por Sexo.


Fonte: elaborado pelo autor

Podemos apresentar os percentuais calculados em relao aos


totais das colunas no Quadro 24:

FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA TOTAL
Masculino 43,25% 100% 88,10% 54%
Feminino 56,75% 0% 11,90% 46%
Total 100% 100% 100% 100%

Quadro 24: Tabela de contingncias de Funo por Sexo:


percentuais por colunas.
Fonte: elaborado pelo autor.

Seria interessante saber se as duas variveis so estatistica-


mente dependentes, e o quo forte essa associao. Repare que os
percentuais de homens e mulheres em cada funo so diferentes dos
percentuais marginais (de homens e mulheres no total de funcionri-
os), sendo que em duas funes as diferenas so bem grandes.
O teste de associao de quiquadrado uma das ferramentas
estatsticas mais utilizadas quando se deseja estudar o relacionamen-
to entre duas variveis qualitativas. Permite verificar se duas vari-
veis qualitativas so independentes, se as propores de ocorrncia
dos valores das variveis observadas esto de acordo com o que era
esperado, etc. Neste texto haver interesse em usar o teste para avali-
ar se duas variveis qualitativas so independentes.
Como todo teste de hipteses o teste de associao de
quiquadrado consiste em comparar os valores observados em uma
amostra com os valores de uma referncia (referncia esta que supe
que a hiptese nula seja vlida).
As frequncias observadas da varivel so representadas em
uma tabela de contingncias, e a Hiptese Nula (H0) do teste ser a

Perodo 3 267
10 de que as duas variveis no se diferem em relao s frequncias
com que ocorre uma caracterstica particular, ou seja, as variveis
so independentes, que ser testada contra a Hiptese Alternativa (H1)
UNIDADE

de que as variveis no so independentes.


O teste pode ser realizado porque o grau de dependncia pode
ser quantificado descritivamente atravs de uma estatstica, que se
chama justamente quiquadrado ( ) na populao, mas na amostra
chamada de q, cuja expresso :

Sendo .

Onde:

v
z Eij a frequncia esperada, sob a condio de independn-
Se isso no ocorrer re-
cia entre as variveis, em uma clula qualquer da tabela de
comenda-se agrupar as
contingncias. Todas as freqncias esperadas precisam ser
categorias (de uma ou
maiores ou iguais a 5 para que o resultado do teste seja
outra varivel, ou de
vlido.
ambas) at obter todas
as frequncias pelo z Oij a frequncia observada em uma clula qualquer da
menos iguais a 5. tabela de contingncias.
z L o nmero total de linhas da tabela de contingncias
(nmero de valores que uma das variveis pode assumir).
z C o nmero total de colunas da tabela (nmero de valores
que a outra varivel pode assumir).

Ento, para cada clula da tabela de contingncias calcula-se


a diferena entre a frequncia observada e a esperada. Para evitar
que as diferenas positivas anulem as negativas, as diferenas so
elevadas ao quadrado. E para evitar que uma diferena grande em
termos absolutos, mas pequena em termos relativos, inflacione a
estatstica, ou que uma diferena pequena em termos absolutos, mas
grande em termos relativos, tenha sua influncia reduzida, divide-se o
quadrado da diferena pela frequncia esperada. Somam-se os valores
de todas as clulas e obtm-se o valor da estatstica: quanto maior q,
mais o Observado se afasta do Esperado, portanto maior a dependncia.

268 Curso de Graduao em Administrao, modalidade a distncia


Sob a hiptese de independncia a estatstica q seguir o
modelo quiquadrado, que estudamos na Unidade 7, prometendo us-
la aqui na Unidade 10.
10

UNIDADE
O Teste do quiquadrado para avaliar se duas variveis so in-
dependentes ser unilateral: ou seja a Hiptese Nula ser rejeitada se
q > qcrtico, para um certo nmero de graus de liberdade. Por exemplo,
para o caso em que h trs graus de liberdade, e o Nvel de Significncia
fosse de 5% (a regio de Rejeio de H0 ficar DIREITA), o valor
crtico seria (lembre-se da Unidade 7) (Figura 84):

Figura 84: Uso da tabela da distribuio quiquadrado. Ilustrao com gl = 3


e rea na cauda superior de 5%.
Fonte: adaptada de Barbeta, Reis e Bornia (2008).

O nmero de graus de liberdade da estatstica calculado da


seguinte forma:

graus de liberdade = (L 1) H (C 1).

Sendo o nmero de linhas e o nmero de colunas referentes


tabela de contingncias (so os nmeros de valores que cada varivel
pode assumir).
O nmero de graus de liberdade assume esse valor porque para
calcular as frequncias esperadas no necessrio calcular os valores
de todas as clulas, as ltimas podem ser calculadas por diferena j
que os totais so fixos. Por exemplo, para duas variveis que somente
podem assumir dois valores cada, o nmero de graus de liberdade
seria igual a 1 [(21)H(21)]: bastaria calcular a frequncia esperada
de uma clula e obter as outras por diferena em relao ao total.
Para o conjunto do Exemplo 4, supondo que os resultados so
provenientes de uma amostra aleatria, vamos verificar neste quinto
exemplo se as variveis so independentes a 1% de significncia.

Perodo 3 269
10 Enunciar as Hipteses:

H0: as variveis sexo e funo so independentes; e


UNIDADE

H1: as variveis sexo e funo no so independentes.

Nvel de significncia: determinado pelo problema, ? = 0,01;


?1 = 0,99.
Retirar as amostras aleatrias e montar a tabela de contingn-
cias (isso j foi feito) (Quadro 25):

FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA TOTAL
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474

Quadro 25: Tabela de contingncias de Funo por Sexo.


Fonte: elaborado pelo autor.

No Quadro 25 encontramos os totais marginais e o total geral:

L1 = total Masculino = 258 L2 = total Feminino = 216


C1 = total Escritrio = 157.
C2 = total S.Gerais = 27 C3 = total gerncia = 84
N = total geral =474.

Repare que somando os totais das linhas o resultado o total


geral, e que somando os totais das colunas o resultado o total geral
tambm.
Calcular as frequncias esperadas:
Calculando as frequncias esperadas de acordo com a frmula
vista anteriormente:

Masculino Escritrio E = (258 H 363)/ 474 = 197,58.


Masculino Servios Gerais E = (258 H 27)/ 474 = 14,70.
Masculino Gerncia E = (258 H 84)/ 474 = 45,72.
Feminino Escritrio E = (216 H 363)/ 474 = 165,42.
Feminino Servios Gerais E = (216 H 27)/ 474 = 12,30.
Feminino Gerncia E = (216 H 84)/ 474 = 38,28.

270 Curso de Graduao em Administrao, modalidade a distncia


Observe que os resultados so os mesmos obtidos no Exemplo 3.2.
Calculando a estatstica q para cada clula:
Agora podemos calcular as diferenas entre as frequncias e as
10

UNIDADE
demais operaes, que sero mostradas nos Quadros 26 , 27 e 28).

OE FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA
Masculino 157 197,58 27 14,70 74 45,72
Feminino 206 165,42 0 12,30 10 38,28

Quadro 26: Diferena entre frequncias observadas e


esperadas de Funo por Sexo.
Fonte: elaborado pelo autor.

(O E) FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA
Masculino 1646,921 151,383 799,672
Feminino 1646,921 151,383 799,672

Quadro 27: Diferena entre frequncias observadas e esperadas


de Funo por Sexo elevadas ao quadrado.
Fonte: elaborado pelo autor.

Finalmente:

(O E)/E FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA
Masculino 8,336 10,301 17,490
Feminino 9,956 12,304 20,891

Quadro 28: Estatsticas q de Funo por Sexo.


Fonte: elaborado pelo autor.

Agora podemos somar os valores:

q = 8,336 + 10,301 + 17,490 + 9,956 + 12,304 + 20,891 = 79,227.


Os graus de liberdade: (nmero de linhas 1)H(nmero de
colunas 1) = (2 1)H(31)= 2.
Ento q2 = 79,227.

Perodo 3 271
10 O q crtico ser: procurando na Tabela 3 do ambiente, ou em
um programa, para 2 graus de liberdade e 99% de confiana (1% de
significncia): q 2,crtico = 6,63.
UNIDADE

Ver Figura 85:

Figura 85: Valor crtico de q para 2 graus de liberdade e 1% de significncia.


Fonte: adaptada pelo autor de PQRS.

Como q 2 maior do que q 2,crtico rejeitamos H0 a 1% de


significncia. H evidncia estatstica suficiente que indica que as
variveis: funo e sexo no so independentes. Isso confirma nossas
suspeitas iniciais, devido s grandes diferenas nas frequncias da
tabela.

B No tpico T a fim de saber... voc ter indicaes


de vrios outros tipos de hipteses que no foram
mencionados nesta Unidade. As referncias l cita-
das sero extremamente valiosas se voc tiver que:
- aplicar testes para avaliar se h diferenas entre
mdias de duas ou mais populaes;
- aplicar testes para avaliar se h diferenas entre
propores de duas populaes; e
- aplicar testes no paramtricos, por exemplo, tes-
tes de aderncia dos dados a um determinado
modelo probabilstico.
Com este tpico terminamos nossa jornada... Ago-
ra com vocs. Boa sorte!

272 Curso de Graduao em Administrao, modalidade a distncia


Saiba Mais
Sobre tipos de erro, poder, em testes de hipteses: BARBETTA, Pedro A.;
10

UNIDADE
REIS, Marcelo M.; BORNIA, Antonio C. Estatstica para Cursos de Engenha-
ria e Informtica. 2. ed. So Paulo: Atlas, 2008, Captulo 8; STEVENSON,
Willian J. Estatstica Aplicada Administrao. So Paulo: Harbra, 2001,
Captulo 10.

Sobre testes de uma varincia: BARBETTA, Pedro A.; REIS, Marcelo M.;
BORNIA, Antonio C. Estatstica para Cursos de Engenharia e Informtica.
2. ed. So Paulo: Atlas, 2008, Captulo 8; TRIOLA, Mrio. Introduo
Estatstica. Rio de Janeiro: LTC, 1999, Captulo 7.

Sobre testes de comparao de duas mdias: BARBETTA, Pedro A.; REIS,


Marcelo M.; BORNIA, Antonio C. Estatstica para Cursos de Engenharia e
Informtica. 2. ed. So Paulo: Atlas, 2008, Captulo 9.

Sobre testes de comparao de duas propores: MOORE, David S.;


McCABE, George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A
prtica da estatstica empresarial: como usar dados para tomar decises. Rio
de Janeiro: LTC, 2006, Captulo 8.

Sobre Anlise de Varincia, comparao de vrias mdias: BARBETTA,


Pedro A.; REIS, Marcelo M.; BORNIA, Antonio C. Estatstica para Cursos de
Engenharia e Informtica. 2. ed. So Paulo: Atlas, 2008, Captulo 9;
STEVENSON, Willian J. Estatstica Aplicada Administrao. So Paulo:
Harbra, 2001, Captulo 11; MOORE, David S.; McCABE, George P.;
DUCKWORTH, William M.; SCLOVE, Stanley L. A prtica da estatstica
empresarial: como usar dados para tomar decises. Rio de Janeiro: LTC,
2006, Captulos 14 e 15; TRIOLA, Mrio. Introduo Estatstica. Rio de
Janeiro: LTC, 1999, Captulo 11.

Sobre testes no paramtricos: BARBETTA, Pedro A.; REIS, Marcelo M.;


BORNIA, Antonio C. Estatstica para Cursos de Engenharia e Informtica. 2.
ed. So Paulo: Atlas, 2008, Captulo 10; STEVENSON, Willian J. Estatstica
Aplicada Administrao. So Paulo: Harbra, 2001, Captulo 13; SIEGEL,
Stanley. Estatstica No Paramtrica (para as Cincias do Comportamento).
So Paulo: McGraw-Hill, 1975.

Sobre a utilizao do Microsoft Excel para realizar testes de hipteses:


LEVINE, David M.; STEPHAN, David; KREHBIEL, Timothy C.;
BERENSON, Mark L. Estatstica: Teoria e Aplicaes Usando Microsoft
Excel em Portugus. 5. ed. Rio de Janeiro: LTC, 2000, Captulo 6.

Perodo 3 273
10 Resumindo
r
UNIDADE

O resumo desta Unidade est demonstrado na Figura 86:

Figura 86: Resumo da Unidade 10.


Fonte: elaborado pelo autor.

274 Curso de Graduao em Administrao, modalidade a distncia


B
Chegamos ao final da disciplina de Estatstica Apli-
cada Administrao. Estudamos nesta ltima
10

UNIDADE
Unidade os testes de hipteses, tipos de hipteses
e suas variveis. A Unidade foi explorada com Fi-
guras, exemplos e Quadros para melhor represen-
tar o contedo oferecido. Alm do material produ-
zido pelo professor, voc tem em mos uma
riqussima fonte de referncias para saber mais
sobre o assunto. Explore os conhecimentos pro-
postos. No tenha esta Unidade como fim, mas
sim como o comeo de uma nova trajetria em sua
vida acadmica. Bons estudos e boa sorte!

Atividades de aprendizagem
aprendizagem
1) O tempo mdio de atendimento em uma agncia lotrica est sendo
analisado por tcnicos. Uma amostra de 40 clientes foi sistematica-
mente monitorada em relao ao tempo que levavam para serem aten-
didos, obtendo-se as seguintes estatsticas: tempo mdio de atendi-
mento de 195 segundos e desvio padro de 15 segundos.
Considerando que o tempo de utilizao segue uma distribuio normal:
O dono da agncia garante que o tempo mdio de atendimento de
3 minutos (se for maior ele se compromete a contratar mais um
atendente). Com base nos dados da amostra a afirmao do dono
verdadeira, ou ele deve contratar um novo atendente? Use um nvel
de significncia de 1%?
2) Buscando melhorar a qualidade do servio, uma empresa estuda o
tempo de atraso na entrega dos pedidos recebidos. Supondo que o
tempo de atraso se encontra normalmente distribudo, e conhecendo
o tempo de atraso dos ltimos 20 pedidos, descritos abaixo (em dias),
determine:
5 1 0 3 6 10 2 3 4 1 5 3 1 6 6 9 0 0 1 0

Perodo 3 275
10 Um cliente enfurecido quer testar estatisticamente a hiptese (de-
clarada pela empresa) de que o atraso mdio ser de no mximo 1
dia. Ele argumenta que deve ser maior, e quer uma confiana de
UNIDADE

99%. O cliente tem razo na sua reclamao?


3) Uma mquina produz peas classificadas como boas ou defeituosas.
Retirou-se uma amostra de 1000 peas da produo, verificando-se
que 35 eram defeituosas. O controle de qualidade pra a linha de
produo para rearranjo dos equipamentos envolvidos quando o
percentual de defeituosos superior a 3%.
Baseado nos dados amostrais, a linha de produo deve ser parada?
4) Queremos saber se h diferenas significativas entre trs meios de
comunicao, em termos de lembrana do consumidor da propagan-
da veiculada. O resultado de um estudo sobre propaganda mostrou:

MEIO DE COMUNICAO
CAPACIDADE DE LEMBRANA REVISTA TV RDIO TOTAL
Lembram da propaganda 25 93 7 125
No lembram da propaganda 73 10 108 191
Total 98 103 115 316

a) Usando 1% de significncia possvel concluir que h


associao entre a capacidade de lembrana e o meio de
comunicao usado?
b) Observando os resultados acima, qual meio de comunica-
o voc recomendaria para veicular uma propaganda, para
maximizar a capacidade de lembrana do pblico alvo?
Por qu?
Adaptado de LEVINE, David M.; STEPHAN, David; KREHBIEL,
Timothy C.; BERENSON, Mark L. Estatstica: Teoria e Aplicaes
usando Microsoft Excel em Portugus. Rio de Janeiro: LTC, 2000.

276 Curso de Graduao em Administrao, modalidade a distncia


Refer^encias

REFERNCIAS
ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas
A. Estatstica Aplicada Administrao e Economia. 2. ed. So
Paulo: Thomson Learning, 2007.

ANDRADE, Dalton F.; OGLIARI, Paulo J. Estatstica para as


Cincias Agrrias e Biolgicas com noes de experimentao.
Florianpolis: Ed. da UFSC, 2007.

BARBETTA, Pedro A.; REIS, Marcelo M.; BORNIA, Antonio C.


Estatstica para Cursos de Engenharia e Informtica. 2. ed. So
Paulo: Atlas, 2008.

BARBETTA, Pedro A. Estatstica Aplicada s Cincias Sociais. 7. ed.


Florianpolis: Ed. da UFSC, 2007.

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatstica Bsica. 5. ed.


So Paulo: Saraiva, 2003.

COSTA NETO, Paulo L. da O. Estatstica. 2. ed. So Paulo: Edgard


Blcher, 2002.

HUFF, Daniel. Como mentir com Estatstica. Rio de Janeiro:


Ediouro, 1992.

LINUZ. BrOffice, 2008.

LOPES, Paulo A. Probabilidades e Estatstica. Rio de Janeiro:


Reichmann e Affonso Editores, 1999.

MARCONI, Marina de Andrade, LAKATOS, Eva Maria. Tcnicas de


Pesquisa. 5. ed. So Paulo: Atlas, 2003.

MONTGOMERY, Douglas C. Introduo ao Controle Estatstico da


Qualidade. 4. ed. Rio de Janeiro: LTC, 2004.

MOORE, David S.; McCABE, George P.; DUCKWORTH, William


M.; SCLOVE, Stanley L. A prtica da estatstica empresarial: como
usar dados para tomar decises. Rio de Janeiro: LTC, 2006.

StatSoft. Inc. STATISTICA (data analysis software system), version 7,


2004. Disponvel em: <www.statsoft.com>. Acesso em: 19 fev. 2009.

Perodo 3 277
REFERNCIAS
STEVENSON, Willian J. Estatstica Aplicada Administrao.
So Paulo: Harbra, 2001.

TRIOLA, Mrio. Introduo Estatstica. Rio de Janeiro: LTC, 1999.

VIRGILITTO, Salvatore B. Estatstica Aplicada: tcnicas bsicas e


avanadas para todas as reas do conhecimento. So Paulo:
Alfa-Omega, 2003.

278 Curso de Graduao em Administrao, modalidade a distncia


REFERNCIAS

Perodo 3 279
MINICURRCULO
Marcelo Menez
Marcelo es R
Menezes eis
Reis
Formado em Engenharia Eltrica pela Uni-
versidade Federal de Santa Catarina UFSC,
Bacharel em Administrao de Empresas pela
Universidade para o Desenvolvimento de Santa
Catarina UDESC, registro no CRA-SC 4049,
Especializao em Seis Sigma (Beyond Six Sigma
Certification Program) na University of South Florida USF
(EUA), Mestre em Engenharia Eltrica pela Universidade Fede-
ral de Santa Catarina, e Doutor em Engenharia de Produo pela
Universidade Federal de Santa Catarina. Professor Adjunto, lotado
no Departamento de Informtica e Estatstica da Universidade
Federal de Santa Catarina, desde 1995. Ministra disciplinas de
estatstica em vrios cursos de graduao e ps-graduao da
Universidade, incluindo os de Administrao.

280 Curso de Graduao em Administrao, modalidade a distncia